Analysis I

Analysis
I
Wintersemester 2001/2002
Prof. Dr. E. Kuwert
Mathematisches Institut
Universität Freiburg
Inhaltsverzeichnis
1 Reelle Zahlen, Folgen und Grenzwerte
1
Die natürlichen Zahlen N = {1, 2, 3, . . .}
2
Körperaxiome und Anordnung von R . .
3
Grenzwerte von Folgen . . . . . . . . . .
4
Vollständigkeit der reellen Zahlen . . . .
5
Teilmengen von R und von Rn . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
4
8
14
22
2 Funktionen und Stetigkeit
1
Polynome und komplexe Zahlen . . . . . .
2
Stetige Funktionen . . . . . . . . . . . . .
3
Zwischenwertsatz und Umkehrfunktionen
4
Existenz von Extremwerten . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
42
48
54
3 Differentialrechnung für Funktionen einer
1
Die Ableitung: Definition und Regeln . .
2
Mittelwertsatz und Anwendungen . . . . .
3
Die Winkelfunktionen . . . . . . . . . . .
Variablen
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
57
57
63
69
4 Integralrechnung
1
Das Riemannsche Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Ableitung und Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
77
86
5 Approximation von Funktionen durch Reihen
95
1
Reihen von reellen und komplexen Zahlen . . . . . . . . . . . . . . . . . . . . 96
2
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
i
Kapitel 1
Reelle Zahlen, Folgen und
Grenzwerte
Die reellen Zahlen R bilden das Fundament, aber nicht den eigentlichen Gegenstand der
Analysis. Ihre Konstruktion aus den rationalen Zahlen
Q={
p
: p, q ∈ Z, q 6= 0}
q
ist zuerst von R. Dedekind (1872) und G. Cantor (1883) durchgeführt worden. Die
Differential- und Integralrechnung geht aber natürlich auf I. Newton und G. Leibniz (ca.
1680) zurück. Es ist also 200 Jahre lang mit großem Erfolg Analysis betrieben worden, ohne
dass eine Definition der reellen Zahlen vorlag! Tatsächlich kommt es nur auf einige Grundeigenschaften der reellen Zahlen an, die wir hier als Axiome formulieren werden. Sie zerfallen
in drei Gruppen:
1. Die Körperaxiome (K)
2. Die Anordnungsaxiome (A)
3. Das Vollständigkeitsaxiom (V)
Es ist die Vollständigkeit, die die reellen Zahlen von den rationalen Zahlen unterscheidet. Sie
wird es erlauben, Zahlen und später Funktionen durch Bildung von Grenzwerten zu erklären.
Der Grenzwertbegriff ist die zentrale Idee der Analysis. Im folgenden nehmen wir an, dass
die reellen Zahlen und die Folge der Zahlbereichserweiterungen
N⊂Z⊂Q⊂R
schon zur Verfügung stehen. Das Konstruktionsverfahren von Cantor werden wir bei Gelegenheit mal besprechen.
1
Die natürlichen Zahlen N = {1, 2, 3, . . .}
Diese und nur diese sind nach L. Kronecker von Gott gemacht und sind uns allen seit der
frühen Kindheit vertraut. Sie fangen bei 1 ∈ N an und jedes n ∈ N hat eine Nachfolgerin n +
1
1 ∈ N. Tatsächlich sind die natürlichen Zahlen durch diese beiden Tatsachen charakterisiert,
und zwar gilt das Induktionsprinzip: Hat eine Menge M ⊂ N die beiden Eigenschaften
(i)
1∈M
(ii) n ∈ M ⇒ n + 1 ∈ M,
und
so ist schon M = N. Konsequenz dieses Prinzips ist das sehr wichtige
Beweisverfahren der vollständigen Induktion: Gegeben sei eine Folge A1 , A2 , A3 , . . .
von Aussagen. Es möge gelten:
(i)
A1 ist wahr.
(ii)
An ist wahr ⇒ An+1 ist wahr.
Dann sind alle Aussagen An wahr.
Beispiel 1.1 1 + 2 + . . . + n =
Pn
k=1 k
=
n(n+1)
.
2
Beweis:
1(1 + 1)
⇒ A1 ist wahr
2
n+1
n
X
X
k =
k + (n + 1)
1 =
k=1
k=1
=
=
n(n + 1)
+ (n + 1) wegen An
2
(n + 1)((n + 1) + 1)
.
2
Also gilt An ⇒ An+1 und die Aussage ist bewiesen.
Satz 1.1 Die Anzahl der möglichen Anordnungen von n ≥ 1 verschiedenen Dingen ist
1 · 2 · . . . · (n − 1) · n =: n!
(1.1)
Beweis: Wegen 1! = 1 ist A1 wahr. Seien nun n + 1 Dinge gegeben. Indem wir durchnumerieren, können wir annehmen, dass dies die Zahlen 1, 2, . . . , n + 1 sind. Für festes
k ∈ {1, 2, . . . , n + 1} betrachte die Menge Mk der Anordnungen, bei denen n + 1 an der Stelle
k steht. Etwa für n = 3 und k = 2:
M2 = {(1, 4, 2, 3), (1, 4, 3, 2), (2, 4, 1, 3), (2, 4, 3, 1), (3, 4, 1, 2), (3, 4, 2, 1)}
Nach Induktion hat Mk genau k! Elemente. Aber jede der Anordnungen liegt in einer und
nur in einer der Mengen Mk , folglich ergeben sich (n + 1)n! = (n + 1)! Anordnungen.
Definition 1.1 (Binomialkoeffizienten) Für α ∈ R und k ∈ N0 setzen wir
k
α
α · (α − 1) · . . . · (α − k + 1) Y α − j + 1
=
=
,
k
1 · 2 · ... · k
j
j=1
wobei per Definition
Q0
j=1 . . .
= 1 (leeres Produkt), und folglich
2
α
0
= 1.
Die Binomialkoeffizienten treten sehr oft bei Abzählungsfragen auf, besonders beim Binomischen Lehrsatz, siehe unten.
Satz 1.2 Die Anzahl der k-elementigen Teilmengen einer Menge mit n Elementen, wobei
n ∈ N und k ∈ {1, 2, . . . , n}, ist gleich nk .
Beweis: Durch vollständige Induktion über n, wobei die Behauptung jeweils für alle k gezeigt
wird. Für n = 1 ist alles klar. Sei nun die Menge {1, 2, . . . , n + 1} gegeben. Für k = 1 und
k = n + 1 ist die Sache offensichtlich, also sei 2 ≤ k ≤ n. Die k-elementigen Teilmengen
zerfallen in zwei disjunkte Teilmengen:
Typ A: enthält die Nummer n + 1
Typ B: enthält die Nummer n + 1 nicht.
Bei Typ A können wir noch k − 1 Zahlen aus {1, 2, . . . , n} wählen, während wir für Typ B
alle k Elemente aus {1, 2, . . . , n} aussuchen müssen. Damit erhalten wir für die Gesamtzahl
n
n
n(n − 1) · . . . · (n − k + 2) n(n − 1) · . . . · (n − k + 1)
+
+
=
1 · 2 · . . . · (k − 1)
1 · 2 · ... · k
k−1
k
(k + n − k + 1)n(n − 1) · . . . · (n − k + 2)
=
1 · 2 · ... · k
n+1
=
,
k
was zu zeigen war.
Die im Induktionsschluss auftretende Formel gilt allgemein:
α
α
α+1
+
=
für α ∈ R, k ∈ N.
k−1
k
k
(1.2)
Die Formel erlaubt die rekursive Berechnung der Binomialkoeffizienten
ecksschema von B. Pascal (1623-1662)1 :
n=0
n=1
n=2
n=3
n=4
n=5
n=6
n
k
nach dem Drei-
1
1
1
1
1
1
1
2
3
4
5
6
1
1
3
6
10
15
1
4
10
20
1
5
15
1
6
1
Am Diagramm offensichtlich ist die Symmetrieeigenschaft
n
n
=
für n ∈ N0 , k ∈ {0, 1, . . . , n}.
k
n−k
1
Das Schema findet sich schon bei Chu Shih-Chieh: Der Spiegel der vier Elemente, 1303
3
(1.3)
Sie ergibt sich aus der kombinatorischen Interpretation nach Beispiel 3: es ist äquivalent, k
Elemente auszuwählen oder n − k Elemente (nicht) auszuwählen. Alternativ folgt das auch
aus der Darstellung
n
n!
für n ∈ N0 , k ∈ {0, 1, . . . , n}.
=
k
k! (n − k)!
(1.4)
Eine zum Induktionsprinzip äquivalente Eigenschaft der natürlichen Zahlen lautet
Satz 1.3 (Prinzip der kleinsten natürlichen Zahl) Jede nichtleere Menge M ⊂ N besitzt ein kleinstes Element.
Beweis: (durch Widerspruch) Angenommen, es gibt kein kleinstes Element in M ⊂ N. Wie
zeigen induktiv {1, 2, . . . , n} ∩ M = ∅. Für n = 1 ist das richtig, denn sonst wäre 1 ∈ M das
kleinste Element. Ist die Behauptung für n ∈ N gezeigt, so gilt sie auch für n + 1, denn sonst
wäre n + 1 kleinstes Element. Also gilt die Behauptung für alle n ∈ N, und M ist die leere
Menge.
Umgekehrt ergibt sich das Induktionsprinzip aus dem Prinzip der kleinsten natürlichen Zahl:
Sei nämlich M ⊂ N mit 1 ∈ M und der Nachfolgereigenschaft n ∈ M ⇒ n + 1 ∈ M . Wir
zeigen, dass M̂ := N\M leer ist. Andernfalls gibt es eine kleinste Zahl m ∈ M̂ . Nach
Voraussetzung ist nicht m = 1. Dann ist aber m − 1 ∈ M und nach Voraussetzung auch
(m − 1) + 1 = m ∈ M , ein Widerspruch.
2
Körperaxiome und Anordnung von R
Die Körperaxiome (K) betreffen die algebraische Struktur von R mit den Rechenoperationen
Addition “+” und Multiplikation “·”. Sie lauten wie folgt:
+
•
Assoziativgesetz:
Kommutativgesetz:
Neutrales Element:
(a + b) + c = a + (b + c)
(a · b) · c = a · (b · c)
a+b=b+a
a·b=b·a
Es gibt Zahlen 0 ∈ R und 1 ∈ R mit 1 6= 0, so dass
für alle a ∈ R gilt:
a·1=a
a+0=a
Inverses Element:
Zu jedem a ∈ R gibt es Lösungen x, y ∈ R der Gleichungen
a · y = 0 falls a 6= 0
a+x=0
Distributivgesetz:
a · (b + c) = a · b + a · c.
Es gibt tatsächlich viele verschiedene Zahlbereiche, in denen diese Gesetze gelten (Körper),
zum Beispiel sind die Regeln auch für die rationalen Zahlen erfüllt. Selbst die Menge {0, 1} ist
mit der Regel 1 + 1 = 0 (und sonst den üblichen Verknüpfungen) ein Körper. Die folgenden
beiden Sätze benutzen nur die obigen Axiome – sie gelten also in jedem Körper.
4
Satz 2.1 (Binomische Formel) Für a, b ∈ R und n ∈ N gilt
(a + b)n =
n X
n
k=0
k
an−k bk .
(2.1)
Beweis:
(a + b)n = (a + b) · (a + b) · . . . · (a + b) .
|
{z
}
n Faktoren
Beim Ausmultiplizieren (Distributivgesetz) erhalten wir Terme vom Typ
a · b · b · . . . · a,
die jeweils aus n Faktoren bestehen. Mit dem Kommutativgesetz können wir umordnen
zu Termen der Form an−k bk mit 0 ≤ k ≤ n; es bleibt zu bestimmen, wie oft ein solcher
Term vorkommt. Ich erhalte bk dann und nur dann, wenn ich aus den n Klammern k Stück
auswähle, wo ich b als Faktor nehme. In den andern Klammern muss ich dann a nehmen.
Nach Satz 1.2 kommt der Term an−k bk also genau nk mal vor, was zu zeigen war.
Alternativ folgt der Satz auch durch vollständige Induktion über n, und zwar gilt der Induktionsanfang n = 1 wegen
1 1 0
1 0 1
(a + b) =
a b +
a b .
0
1
1
n=1:
Der Induktionsschluss ergibt sich wie folgt:
(a + b)n+1 = (a + b)
n X
n
k
k=0
=
n X
n
k=0
k
an−k bk (Induktionsannahme)
n−k+1 k
a
b +
n X
n
k=0
an−k bk+1
n X
n
= a
+
a
b +
an−(k−1) bk + bn+1
k
k−1
k=1
k=1
n X
n
n
= an+1 +
+
an+1−k bk + bn+1
k
k−1
k=1
n+1
X n + 1
=
an+1−k bk nach Gleichung (1.2).
k
n+1
n X
n
k
n+1−k k
k=0
Ebenso wichtig ist die Formel für die
Satz 2.2 (Geometrische Summe) Für q ∈ R, q 6= 1 gilt
n
X
1 − q n+1
.
1−q
qk =
k=0
5
(2.2)
Beweis: . Wir berechnen mit dem ,,Teleskopsummen–Trick”
1−q
n+1
=
n
X
k
(q − q
k+1
)=
k=0
n
X
k
(1 − q) q = (1 − q)
k=0
n
X
qk .
k=0
Die Behauptung folgt nach Division durch 1 − q.
Wir stellen uns die reellen Zahlen als Punkte auf einer Geraden vor, die mit einer Richtung
versehen ist. Es ist dann ein Größenvergleich für je zwei Zahlen a, b ∈ R möglich: b ist größer
als a, wenn b rechts von a liegt. Der Größenvergleich beruht auf folgenden Gesetzen, den
Anordnungsaxiomen (A):
A1 Für jedes a ∈ R gilt genau eine der Relationen a > 0, a = 0, −a > 0.
A2 Aus a > 0, b > 0 folgt a + b > 0 und a · b > 0.
A3 Archimedisches Axiom: zu jeder Zahl ε ∈ R, ε > 0, existiert eine natürliche Zahl n ∈ N
mit 1/n < ε.
Überlegen Sie, dass alle diese Regeln auch für die rationalen Zahlen Q gelten. Für −a > 0
schreiben wir auch a < 0 und setzen a > b ⇔ a − b > 0. Aus A1 und A2 folgen eine Reihe
von Regeln, die in den Anwesenheitsübungen gezeigt werden sollen:
1. Für a, b ∈ R gilt genau eine der Relationen a > b, a = b oder a < b.
2. Aus a > b, b > c folgt a > c (Transitivität).
3. Aus a > b folgt




1/a
a+c
a·c



a·c
<
>
>
<
1/b, falls b > 0
b + c immer
b · c, wenn c > 0
b · c, wenn c < 0
4. Für a 6= 0 ist a2 > 0.
5. Aus a > b und c > d folgt
a + c > b + d, immer
a · c > b · d, falls b, d > 0
6. Für b ∈ N gilt n > 0.
Definition 2.1 (Betrag einer reellen Zahl) Der Betrag von a ∈ R ist
a falls a ≥ 0
|a| =
−a falls a < 0.
(2.3)
Der Betrag von a ist der Abstand von a zu Null. Es gelten folgende Regeln, die durch
Fallunterscheideung bewiesen werden:
|a + b| ≤ |a| + |b| (Dreiecksungleichung)
||a| − |b|| ≤ |a − b|
|a · b| = |a| · |b|
a ≤ |a|.
In der Analysis spielen Ungleichungen bzw. Abschätzungen eine sehr große Rolle.
6
Satz 2.3 (Bernoullische Ungleichung) Für x ∈ R, x ≥ −1 und n ∈ N gilt
(1 + x)n ≥ 1 + nx.
(2.4)
Beweis: Durch Induktion über n ∈ N. Für n = 1 gilt Gleichheit, und wegen 1 + x ≥ 0
erhalten wir
(1 + x)n+1 = (1 + x)(1 + x)n
≥ (1 + x)(1 + nx) nach Induktionsannahme
= 1 + (n + 1)x + nx2
≥ 1 + (n + 1)x.
Bis jetzt haben wir vom Archimedischen Axiom, das oft auch nach Eudoxos benannt wird,
keinen Gebrauch gemacht. Wenn wir die rationalen Zahlen Q = {m/n : m ∈ Z, n ∈ N} als
Wegmarken auf der Zahlengeraden auffassen, so werden wir jetzt als Folge des Axioms A3
sehen, dass es in jedem noch so kleinen Abschnitt rationale Zahlen gibt.
Satz 2.4 (Q ist dicht in R) Zu je zwei reellen Zahlen a, b ∈ R mit a 0 annehmen, denn sonst gehen wir zu a0 = −b, b0 = −a über.
Ausserdem ist o.B.d.A. a ≥ 0, da wir andernfalls einfach q = 0 setzen. Nach A3 existiert ein
n ∈ N mit 1/n a} ⊂ N.
M ist nichtleer: falls a = 0 so ist zum Beispiel 1 ∈ M , andernfalls gibt es nach A3 ein k ∈ N
mit 1/k < 1/na bzw. k/n > a. Sei m ∈ M das kleinste Element nach Satz 1.3. Dann ist
einerseits m/n > a und andererseits (m − 1)/n ≤ a, also
m
m−1 1
=
+ < a + (b − a) = b.
n
n
n
Die Zahl q = m/n leistet somit das Verlangte.
Satz 2.5 (Irrationalität von
√
2) Die Gleichung x2 = 2 ist in Q nicht lösbar.
Beweis: (durch Widerspruch) Angenommen, es sei x2 = 2 mit x = p/q und p, q ∈ N. Nach
Kürzen des Bruchs können wir annehmen, dass p und q keine gemeinsamen Teiler haben, das
heißt ihr größter gemeinsamer Teiler ist (p, q) = 1. Nun ist aber
p2 = 2q 2 ⇒ p2 gerade ⇒ p gerade ⇒ p = 2p1 mit p1 ∈ N.
Daraus folgt weiter
2q 2 = 4p21 ⇒ q 2 gerade ⇒ q gerade .
Also ist (p, q) ≥ 2, ein wunderbarer Widerspruch.
7
3
Grenzwerte von Folgen
Wir kommen nun zu dem für die Analysis zentralen Begriff des Grenzwerts. Die Möglichkeit
der Bildung von Grenzwerten ist eine Idealisierung, die uns die Konstruktion neuer Größen
erlauben wird, zum Beipiel: Tangente, Länge einer Kurve, Volumen der Kugel, Momentangeschwindigkeit, Arbeit längs eines Wegs etc.
Definition 3.1 Eine Folge reeller Zahlen ist eine Abbildung
N −→ R,
n 7−→ an .
Die Zahl an heißt das n-te Glied der Folge, die Folge insgesamt wird mit (an )n∈N bzw. kurz
mit (an ) bezeichnet. Oft wird die Folge durch das Bildungsgesetz angegeben oder durch
Aufzählen der ersten Folgenglieder definiert. Zum Beispiel ist die Folge der Quadratzahlen
gegeben durch an = n2 , bzw. alternativ aufzählend an = 1, 4, 9, 16, . . ..
Definition 3.2 (Konvergenz von Folgen) Die Folge (an )n∈N konvergiert mit n → ∞ gegen a ∈ R, falls gilt:
Zu jedem ε > 0 gibt es ein N ∈ R, so dass |an − a| < ε für alle n > N.
Die Zahl a heißt dann Grenzwert der Folge (an )n∈N für n → ∞, und wir schreiben kurz
limn→∞ an = a oder an → a für n → ∞. Eine Folge (an )n∈N heißt konvergent, wenn es ein
a ∈ R gibt, das Grenzwert der Folge ist; andernfalls heißt die Folge divergent.
Mit den Symbolen ∀ ( = für alle) und ∃ ( = es gibt) lässt sich die Definition auch wie folgt
fassen (Quantorenschreibweise):
∀ε > 0 ∃N ∈ R ∀n > N : |an − a| < ε.
Je kleiner die geforderte Maximalabweichung vom Grenzwert ε > 0, desto größer muss im
allgemeinen die Zahl N in der Definition des Grenzwerts gewählt werden, sie hängt also von ε
ab. Tut es die Zahl N für ein gegebenes ε > 0, so tut es natürlich auch jedes größere N 0 ≥ N ,
d.h. N darf stets vergrößert werden. Dies ist nützlich, zum Beispiel wenn wir gleichzeitig
zwei Folgen betrachten.
Beispiel 3.1 (Konstante Folge) Sei an = a für alle n ∈ N. Dann ist limn→∞ an = a.
Beweis: Für jedes ε > 0 gilt
|an − a| = 0 < ε für alle n > 0,
also können wir stets N = 0 wählen.
Beispiel 3.2 (Harmonische Folge) Die Folge an =
Beweis: Zu ε > 0 wählen wir N =
1
ε
1
n
konvergiert gegen a = 0.
∈ R. Es folgt für n > N
|an − 0| =
1
1
<
= ε.
n
N
8
Beispiel 3.3 (Geometrische Folge)
Es gilt
lim q n = 0 für alle q ∈ R mit − 1 < q < 1.
n→∞
1
Beweis: Wir können q 6= 0 annehmen. Nach Voraussetzung ist |q|
> 1, also gilt
für ein x > 0. Wir erhalten dann
1
|q n − 0| = |q|n =
(1 + x)n
1
≤
(Bernoulli-Ungleichung)
1 + nx
1
≤
nx
< ε, falls n > 1/εx.
1
|q|
=1+x
Wir können also N = 1/εx wählen.
Beispiel 3.4 Die Folge an = (−1)n , also an = −1, 1, −1, . . . ist nicht konvergent.
Beweis: (durch Widerspruch) Angenommen, es wäre limn→∞ an = a für ein a ∈ R. Dann
gibt es zu ε = 1 ein N ∈ R mit |an − a| < 1 für n > N . Es folgt dann für n > N
2 = |an − an+1 | = |an − a + a − an+1 |
≤ |an − a| + |a − an+1 | (Dreiecksungleichung)
< 1 + 1,
ein Widerspruch.
Definition 3.3 (ε-Umgebung) Die ε-Umgebung von a ∈ R ist die Menge
Uε (a) = {b ∈ R : |b − a| < ε} = {b ∈ R : a − ε 0 gewählt ist.
Satz 3.1 (Eindeutigkeit des Grenzwerts) Falls die Folge (an )n∈N konvergent ist, so ist
ihr Grenzwert eindeutig bestimmt.
Beweis: Wir beginnen mit einer Vorüberlegung, und zwar behaupten wir
1
0 < ε ≤ |a − a0 | ⇒ Uε (a) ∩ Uε (a0 ) = ∅.
2
0
Denn ist x ∈ Uε (a) ∩ Uε (a ), so folgt mit der Dreiecksungleichung
(3.1)
|a − a0 | = |a − x + x − a0 | ≤ |x − a| + |x − a0 | < 2ε.
Seien nun a, a0 ∈ R Grenzwerte der Folge (an )n∈N . Zu jedem ε > 0 gibt es dann N, N 0 ∈ R
mit an ∈ Uε (a) für n > N , sowie an ∈ Uε (a0 ) für n > N 0 . Wäre a 6= a0 , so wählen wir
ε = 21 |a − a0 | > 0 und erhalten für n > max(N, N 0 )
an ∈ Uε (a) ∩ Uε (a0 ) = ∅,
ein Widerspruch.
Unser nächstes Ziel ist es, einige Rechenregeln für Grenzwerte zu erarbeiten. Wir beginnen
mit der
9
Definition 3.4 (Beschränktheit von Folgen) Eine Folge (an )n∈N heißt
a)
nach oben (bzw. nach unten) beschränkt, wenn es ein K ∈ R gibt mit an ≤ K
(bzw. an ≥ K) für alle n ∈ N.
b)
beschränkt, wenn sie nach oben und nach unten beschränkt ist.
Beispiel 3.5 Die Folge an = n ist nach unten beschränkt, denn es ist zum Beispiel an ≥ 0
für alle n. Sie ist aber nicht nach oben beschränkt: angenommen, es gibt ein K ∈ R mit
an ≤ K für alle n. Dann ist K ≥ a1 = 1 und K1 ≤ a1n = n1 für alle n, also nach Archimedes
1
K = 0, ein Widerspruch.
Satz 3.2 (konvergent ⇒ beschränkt) Jede konvergente Folge ist beschänkt.
Beweis: Sei limn→∞ an = a. Wähle zu ε = 1 ein N , o.B.d.A. N ∈ N, mit |an − a| < 1 für
n > N . Es gilt dann
n>N
⇒ |an | = |an − a + a| ≤ |an − a| + |a| < 1 + |a|
n≤N
⇒ |an | ≤ max(|a1 |, . . . , |aN |).
Wir haben also |an | ≤ K für alle n, wobei K = max(|a1 |, . . . , |aN |, 1 + |a|).
Satz 3.3 (Rechenregeln für Grenzwerte) Es gelte an → a, bn → b mit n → ∞.
a)
Für alle λ, µ ∈ R ist (λan + µbn )n∈N konvergent mit Grenzwert
limn→∞ (λan + µbn ) = λa + µb.
b)
Die Folge (an · bn )n∈N ist konvergent mit Grenzwert limn→∞ (an · bn ) = a · b.
c)
Falls b 6= 0, so gibt es ein N0 ∈ R mit bn 6= 0 für n > N0 und die Folge (an /bn )n>N0
ist konvergent mit Grenzwert limn→∞ an /bn = a/b.
Beweis: Wir beginnen mit dem Beweis von b). Nach Satz 3.2 gibt es ein K > 0 mit |an | ≤ K
für alle n ∈ N, und außerdem mit |b| ≤ K. Dann gilt
|an bn − ab| = |an bn − an b + an b − ab|
≤ |an | · |bn − b| + |an − a| · |b|
≤ K(|an − a| + |bn − b|).
ε
Zu ε > 0 gibt es nun ein N ∈ N mit |an − a| < 2K
sowie |bn − a| <
für n > N
ε
ε
|an bn − ab| <
+
= ε.
2K
2K
ε
2K
für n > N . Also folgt
Für a) reicht es wegen b), den Fall λ = µ = 1 zu betrachten. Zu ε > 0 gibt es ein N ∈ R mit
|an − a| < 2ε und |bn − b| < 2ε für n > N . Es folgt für diese n
|(an + bn ) − (a + b)| = |(an − a) + (bn − b)|
≤ |an − a| + |bn − b|
ε ε
<
+ = ε.
2 2
10
Für c) können wir uns auf den Fall an = b = 1 beschränken, denn sonst schreiben wir
an
an 1
bn
=
· 0 mit b0n = .
bn
b bn
b
Es gibt nun ein N0 ∈ R mit |bn − 1| ≤
1
2
für n > N0 , also
|bn | = |1 − (1 − bn )| ≥ 1 − |1 − bn | ≥
1
> 0.
2
Damit ist die erste Aussage gezeigt. Zu ε > 0 wähle weiter N ≥ N0 mit |1 − bn | < ε/2 für
n > N , und somit
1
|1 − bn |
ε
< 2 · = ε.
| − 1| =
bn
bn
2
Bemerkung: Die Menge der reellen Zahlenfolgen ist ein R-Vektorrraum mit den Verknüpfungen λ(an )n∈N + µ(bn )n∈N = (λan + µbn )n∈N . Wir haben dann die Untervektorräume
Nullfolgen: limn→∞ an = 0;
⊂ Konvergente Folgen: limn→∞ an existiert;
⊂ Beschränkte Folgen: es gibt ein K > 0 mit |an | ≤ K für alle n;
⊂ Allgemeine Folgen (an )n∈N
Beispiel 3.6
3 − n4 + n73
3n3 − 4n2 + 7
3
=
lim
= .
5
n→∞
n→∞
2n3 + 5n
2
2 + n2
lim
Beispiel 3.7 (Geometrische Reihe) Für −1 < q < 1 gilt
∞
X
k
q := lim
n→∞
k=0
Beweis: Die betrachtete Folge ist an =
trische Summe gilt
n
X
qk =
k=0
Pn
k=0 q
k.
1
.
1−q
(3.2)
Laut Formel (2.2) für die endliche geome-
1 − q n+1
1
=
,
n→∞ 1 − q
1−q
lim an = lim
n→∞
wobei Beispiel 3.3) und Regel a) aus Satz 3.3 benutzt wurden.
Beispiel 3.8 (Potenzsummen) Seien n ∈ N, , p ∈ N0 . Für die Summen S(n, p) =
gilt:
1
lim n−(p+1) S(n, p) =
.
n→∞
p+1
11
Pn
p
i=1 i
(3.3)
Beweis: Wir berechnen zunächst mit dem Teleskop-Summen-Trick eine Rekursionsformel
für die S(n, p):
p+1
(n + 1)
−1 =
n
X
[(i + 1)p+1 − ip+1 ]
i=1
=
=
=
p n X
X
p+1
ik
(Binomische Formel)
p+1
k
ik
(Vertauschung der Summen)
i=1 k=0
p X
k=0
p X
k=0
Wegen
p+1
p
k
X
n
i=1
p+1
S(n, k).
k
= p + 1 folgt für p ≥ 1 die Rekursionsformel
1
S(n, p) =
p+1
(n + 1)p+1 − 1 −
p−1 X
p+1
k=0
k
!
S(n, k) .
(3.4)
Jetzt zeigen wir (3.3) durch Induktion über p ∈ N0 . Der Fall p = 0 ist offensichtlich. Sei
(3.3) schon für 1, 2, . . . , p − 1 gezeigt, wobei p ≥ 1. Dann folgt für k ≤ p − 1
lim n−(p+1) S(n, k) = lim nk−p n−(k+1) S(n, k) = 0.
n→∞
n→∞
Aus (3.4) folgt dann
lim n−(p+1) S(n, p) =
n→∞
1
1
1
lim (1 + )p+1 =
.
p + 1 n→∞
n
p+1
Satz 3.4 (Grenzwerte und Ungleichungen) Sei limn→∞ an = a und limn→∞ bn = b.
Dann gelten folgende Aussagen:
a) an ≤ bn für alle n
⇒
b) c ≤ an ≤ d für alle n
a ≤ b.
⇒
c ≤ a ≤ d.
c) Falls an ≤ cn ≤ bn und a = b, so konvergiert auch die Folge (cn ) gegen a = b.
Beweis: Zu jedem ε > 0 gibt es ein N ∈ R mit
a − ε < an und bn N.
Aus der Voraussetzung in a) folgt dann a − ε 0, also a ≤ b. Die erste
Voraussetzung in c) impliziert a − ε < cn N . Wegen a = b bedeutet dies
limn→∞ cn = a.
Achtung: aus an < bn folgt nicht a < b, sondern nur a ≤ b. Die Striktheit von Ungleichungen
geht beim Übergang zu Grenzwerten im allgemeinen verloren. Zum Beispiel gilt
0<
1
1
für alle n, aber lim
= 0.
n→∞ n
n
12
Beispiel 3.9 (n-te Wurzel) Sei a > 0 und xn > 0 Lösung der Gleichung xn = a. Dann
gilt limn→∞ xn = 1.
Beweis: Die Gleichung xn = a besitzt höchstens eine positive Lösung, denn nach den
Anordnungsaxiomen gilt für x, y > 0
x>y
↔
xn > y n .
(3.5)
Wir unterscheiden nun drei Fälle:
a = 1 : Dann ist xn = 1 für alle n, und die Behauptung ist richtig.
a > 1 : Aus (3.5) folgt dann xn > 1. Wir zeigen limn→∞ an = 0 für an = xn − 1 > 0. Die
Bernoulli-Ungleichung liefert 1 + nan ≤ (1 + an )n = a, also 0 < an ≤ (a − 1)/n → 0 mit
n → ∞. Die Behauptung folgt nun aus Satz 3.4c).
a < 1 : Es ist dann xn = 1/yn , wobei ynn = 1/a mit 1/a > 1. Die Behauptung folgt aus dem
vorigen Fall und Satz 3.3c).
Bemerkung: Die Existenz der Lösungen der Gleichung xn = a, also der n-ten Wurzeln
√
x = n a > 0, haben wir hier einfach vorausgesetzt. Im nächsten Abschnitt werden wir aus
dem Vollständigkeitsaxiom schließen, dass die Gleichung xn = a für alle a > 0 lösbar ist.
Definition 3.5 (Uneigentliche Konvergenz) Die Folge (an )n∈N konvergiert uneigentlich
gegen +∞, falls gilt:
Zu jedem K > 0 gibt es ein N ∈ R, so dass an > K für alle n > N.
Wir schreiben limn→∞ an = +∞ oder an → +∞ mit n → ∞. Man spricht auch von
bestimmter Divergenz gegen +∞. Uneigentliche Konvergenz gegen −∞ ist analog definiert.
Beispiel 3.10 Ist q > 1, so gilt limn→∞ q n = +∞.
Beweis: Sei K > 0 gegeben. Nach Beispiel 3.3 gibt es ein N ∈ R mit
1
1
( )n <
für n > N,
q
K
also q n > K für n > N .
An dieser Stelle führen wir folgende Bezeichnungen ein:
(a, b) = {x ∈ R : a < x < b}
offenes Intervall
[a, b] = {x ∈ R : a ≤ x ≤ b}
abgeschlossenes Intervall
[a, b) = {x ∈ R : a ≤ x < b}
rechtsseitig offen, linksseitig abgeschlossen
(a, b] = {x ∈ R : a < x ≤ b}
linksseitig offen, rechtsseitig abgeschlossen
|I| = b − a für ein Intervall I
Intervalllänge
Hierbei sind +∞ und −∞ als offene Intervallgrenzen zugelassen, zum Beispiel (−∞, 1] =
{x ∈ R : −∞ < x ≤ 1}. Den ε-Umgebungen in der Definition der Konvergenz entsprechen
bei uneigentlicher Konvergenz die Intervalle (K, +∞): ab einem gewissen Index müssen alle
Folgenglieder in (K, +∞) liegen, egal wie groß K gewählt ist.
13
4
Vollständigkeit der reellen Zahlen
Der Nachweis der Konvergenz einer Zahlenfolge anhand der Definition setzt die Kenntnis des
Grenzwerts voraus. Das Ziel der Analysis ist es aber, neue Objekte – Zahlen, Funktionen,
Operationen – durch Grenzprozesse zu definieren. Wir stehen damit vor dem Problem, Folgen
als konvergent zu erkennen, ohne ihren Grenzwert a priori zu kennen. Wir beginnen mit zwei
Beispielen dazu.
Beispiel 4.1 (Zinseszinsrechnung)
Wird ein Kapital K0 für ein Jahr mit einem Zinssatz p% angelegt, so beträgt die Ausszahlung
K1 = K (1 + x), wobei x = p/100. Die Idee des Zinseszinses ist es, den Zeitraum in kürzere
Abschnitte zu unterteilen und den Zins anteilig pro Abschnitt anzurechenen mit dem Effekt,
dass der schon angerechnete Teil des Zinses seinerseits Zinsen produziert. Bei halbjähriger
Verzinsung sieht das zum Beispiel so aus:
nach 1/2 Jahr:
K (1 + x2 )
nach 1 Jahr:
K2 = [K (1 + x2 )] (1 + x2 ) = K (1 + x2 )2 .
x 12
Entsprechend ergibt sich nach einem Jahr bei monatlicher Verzinsung K12 = K (1+ 12
) , bei
x 365
täglicher Verzinsung K365 = K (1 + 365 )
und allgemein bei Unterteilung in n Zeiteinheiten
En := En (x) = (1 +
x n
) für x ∈ R, n ∈ N.
n
(4.1)
Es stellt sich ganz natürlich die Frage nach einer kontinuierlichen Verzinsung, also nach dem
Grenzwert limn→∞ En (x).
Beispiel 4.2 (Dezimalbruchdarstellung)
Für jedes x ∈ R existieren k0 ∈ Z und kj ∈ {0, 1, . . . , 9} für j ∈ N, so dass folgende Darstellung
von x als Grenzwert gilt (die sogenannte Darstellung als unendlicher Dezimalbruch):
x = lim
n→∞
n
X
j=0
kj · 10
−j
=:
∞
X
kj · 10−j =: k0 , k1 k2 . . .
j=0
Um dies zu beweisen, definieren wir k0 , k1 , . . . induktiv mit der Eigenschaft
(∗) x ∈ [an , bn ) für alle n ∈ N0 , wobei an = k0 , k1 k2 . . . kn und bn = an + 10−n .
Für n = 0 setzen wir k0 = max{k ∈ Z : k ≤ x} und haben wie gewünscht k0 ≤ x < k0 + 1.
Seien k0 , k1 , . . . , kn−1 schon gefunden, so dass jeweils (∗) erfüllt ist. Dann setzen wir kn =
max{n ∈ N0 : an−1 + k · 10−n ≤ x}. Nach Induktionsannahme ist bn−1 = an−1 + 10 · 10−n > x,
also ist kn ∈ {0, 1, . . . , 9}. Es gilt x ∈ [an , bn ) nach Wahl von kn . Insbesondere folgt
|x − an | ≤ |an − bn | = 10−n → 0 mit n → ∞.
Damit ist die Existenz der Darstellung als unendlicher Dezimalbruch für jedes x ∈ R gezeigt.
Umgekehrt stellt sich aber die Frage, ob jede Dezimalbruchfolge an = k0 , k1 k2 . . . gegen eine
reelle Zahl konvergiert.
14
In beiden Beispielen brauchen wir eine Charakterisierung konvergenter Folgen, die ohne die
Kenntnis des Grenzwerts auskommt. Statt die Glieder der Folge mit dem unbekannten Grenzwert zu vergleichen, besteht die Idee darin, die Glieder der Folge untereinander zu zu vergleichen.
Definition 4.1 (Cauchyfolge) Eine Folge (an )n∈N heißt Cauchyfolge, wenn gilt:
Zu jedem ε > 0 gibt es ein N ∈ R, so dass |an − am | < ε für alle n, m > N.
Bemerkung: Beim Nachweis dieser Eigenschaft reicht es aus, die Zahlen n, m > 0 mit n < m
zu betrachten, denn die Definition ist symmetrisch in n und m und für n = m ist nichts zu
tun.
Vollständigkeitsaxiom: Jede Cauchyfolge ist konvergent.
Damit sind die Axiome KAV der reellen Zahlen komplett: R ist ein vollständig angeordneter Körper. Im wesentlichen ist R auch der einzige solche Körper, siehe H.-D. Ebbinghaus
(Hrsgb.): Zahlen, Springer-Verlag 3. Auflage (1988).
Satz 4.1 Eine Folge ist genau dann konvergent, wenn sie eine Cauchyfolge ist.
Beweis: Eine Cauchyfolge ist konvergent nach Axiom. Sei umgekehrt limn→∞ an = a. Zu
ε > 0 gibt es dann ein N ∈ N mit |an − a| < ε/2 für n > N , und für n, m > N folgt
|an − am | = |an − a + a − am | ≤ |an − a| + |am − a| <
ε ε
+ = ε.
2 2
Als erste Anwendung des Axioms betrachten wir die Dezimaldarstellung und zeigen
Satz
von Dezimalbrüchen) Jeder unendliche Dezimalbruch an = k0 +
Pn 4.2 (Konvergenz
−j mit k ∈ Z mit k ∈ {0, 1, . . . , 9} für j ∈ N konvergiert gegen eine reelle Zahl.
k
10
j
0
j
j=1
Beweis: Für n < m schätzen wir wie folgt ab:
|am − an | = |
m
X
kj 10−j |
j=n+1
m−(n+1)
−(n+1)
≤ 10
X
9 · 10−j
j=0
≤ 10−(n+1) 9 ·
1
1 (Geometrische Reihe)
1 − 10
≤ 10−n
≤ ε
für n > N (Geometrische Folge).
Das nun folgende Konvergenzkriterium ist überaus nützlich. Mit ihm werden wir das Beispiel
der kontinuierlichen Verzinsung leicht behandeln können. Es ist ein hinreichendes Kriterium
für Konvergenz, ist aber nicht notwendig für die Konvergenz einer Folge (an )n∈N .
15
Definition 4.2 (Monotone Folge) Eine Folge (an )n∈N heißt monoton wachsend, wenn
gilt: an+1 ≥ an für alle n ∈ N.
Satz 4.3 (Konvergenzkriterium der Monotonie und Beschränktheit) Jede monoton wachsende, nach oben beschränkte Folge ist eine Cauchyfolge und damit konvergent.
Beweis: Sei (an )n∈N monoton wachsend und an ≤ K < ∞ für alle n ∈ N. Sei ε > 0 gegeben.
1
Wähle p ∈ N so dass d := K−a
< ε, und setze Ij = [a1 + (j − 1)d, a1 + jd] für j = 1, 2, . . . , p
p
(Bild). Setze
k = max{j : es gibt ein n ∈ N mit an ∈ Ij }.
Es gilt 1 ∈ M , denn a1 ∈ I1 . Sei k = max{j : j ∈ M }. Dann gibt es ein N ∈ N mit aN ∈ Ik
und es folgt tatsächlich
an ∈ Ik für alle n > N.
Denn wäre an ∈
/ Ik für ein n > N , so folgt x ∈ Ij mit j < k wegen der Maximalität
von k. Aber dann is an < aN , Widerspruch zur Monotonie. Für n, m > N gilt somit
|an − am | ≤ |Ik | = d < ε.
Satz 4.4 (Definition der Exponentialfunktion) Die Folge En (x) = (1+ nx )n ist für jedes
x ∈ R konvergent. Wir bezeichnen den Grenzwert mit
exp(x) = lim (1 +
n→∞
x n
) .
n
Die Funktion exp : R → R, x 7−→ exp(x) heißt Exponentialfunktion. Der Funktionswert
e = exp(1) = lim (1 +
n→∞
1 n
) ≈ 2, 71828
n
heißt Eulersche Zahl.
Beweis: Aus der Zinseszins-Interpretation ist plausibel, dass die Folge monoton wachsend
in n ist (Verstärkung des Zinseszins-Effekts), und andererseits beschränkt bleiben sollte (der
Zinseszinseffekt kann nicht beliebig groß sein).
Für n > x betrachten wir die Folge Fn = Fn (x) = (1 − nx )−n . Es gilt
x
x
x2
En (x)
= (1 + )n (1 − )n = (1 − 2 )n ≤ 1,
Fn (x)
n
n
n
und folglich
n>x
⇒
En (x) ≤ Fn (x).
(4.2)
n > −x
⇒
En+1 (x) ≥ En (x).
(4.3)
Zweitens behaupten wir
16
Denn wir berechnen
En+1 (x)
En (x)
=
=
=
=
≥
=
x n+1
)
(1 + n+1
x n
(1 + n )
x
1 + n+1
x
(
)n+1 · (1 + )
1 + nx
n
x
− x n+1
x
(1 − n n+1
)
· (1 + )
1 + nx
n
x
x
(1 −
)n+1 · (1 + )
(n + 1)(n + x)
n
x
x
(1 −
) · (1 + ) (Bernoulli–Ungleichung)
n+x
n
1.
x
Beachte (n+1)(n+x)
≤ 1 für x > −n, so dass die Bernoulli-Ungleichung (Satz 2.3) anwendbar
ist. Für n > −x ist En also monoton wachsend. Aber es gilt Fn (x) = 1/En (−x), also ist
Fn (x) für n > x monoton fallend. Für n > |x| haben wir nun folgende Situation:
En (x) ≤ En+1 (x) ≤ . . . . . . ≤ Fn+1 (x) ≤ Fn (x).
Insbesondere ist die Folge En (x) nach oben bechränkt, und zwar durch jedes der Fm (x), und
somit nach Satz 4.3 konvergent. Damit ist die Behauptung des Satzes gezeigt. Aus (4.2) und
der Bernoulli-Ungleichung ergibt sich außerdem
n > |x|
⇒
1 ≥ En (x) · En (−x) = (1 −
x2 n
x2
x2
)
≥
1
−
n
·
=
1
−
.
n2
n2
n
Mit n → ∞ erhalten wir
exp(x) · exp(−x) = 1 für allex ∈ R.
(4.4)
Bemerkung: Die genannte Näherung für e ergibt sich durch Wahl von n = 106 in der
Ungleichung En (1) ≤ e ≤ Fn (1) unter Zuhilfenahme eines Taschenrechners. Insbesondere
sieht man, dass die approximierenden Folgen En (x), Fn (x) nur sehr langsam konvergieren
und aus numerischer Sicht ungeeignet sind.
Definition 4.3 (Intervallschachtelung) Eine Intervallschachtelung ist eine Folge von abgeschlossenen Intervallen In = [an , bn ] ⊂ R mit In+1 ⊂ In für alle n und |In | = bn − an → 0
mit n → ∞.
Satz 4.5 (Intervallschachtelungsprinzip)
Zu jeder Intervallschachtelung (In )n∈N gibt es
T
genau ein x ∈ R mit x ∈ n∈N In . Es gilt x = limn→∞ an = limn→∞ bn .
Beweis: Nach Voraussetzung haben wir
a1 ≤ a2 ≤ . . . ≤ an ≤ . . . . . . ≤ bn ≤ . . . ≤ b2 ≤ b1 .
Aus Satz 4.3 folgt die Existenz der Grenzwerte a = limn→∞ an bzw. b = limn→∞ bn . Dann
gilt nach den Satz 3.3 und Satz 3.4
0 ≤ b − a = lim bn − lim an = lim (bn − an ) = 0.
n→∞
n→∞
17
n→∞
Setze x := a = b. Dann ist an ≤ a = x = b ≤ bn , also x ∈ In für alle n. Sei y ∈ R mit y ∈ In
für alle n, das heißt an ≤ y ≤ bn . Durch Grenzübergang ergibt sich nach Satz 3.4 a ≤ y ≤ b,
also y = x.
Satz 4.6 (Existenz der n-ten Wurzel) Zu jedem a > 0 und n ∈ N gibt es genau ein
√
x > 0 mit xn = a. Bezeichnung: x = n a = a1/n .
Beweis: Die Eindeutigkeit wurde schon in Beispiel 3.9 aus den Anordnungsaxiomen gefolgert. Wir konstruieren die Lösung mit dem Verfahren der fortgesetzten Intervallhalbierung:
k
Bestimme Ik = [ak , bk ] für k = 1, 2, . . ., so dass mit mk = ak +b
gilt:
2
I1 = [a1 , b1 ] mit an1 ≤ a ≤ bn1 ;
[ak , mk ] falls mnk ≥ a
Ik+1 =
[mk , bk ] falls mnk < a.
Es folgt Ik+1 ⊂ Ik für alle k und |Ik | = 21−k |I1 | → 0 mit k → ∞. Sei x ∈ R wie in Satz 4.5
gegeben. Per Induktion ergibt sich aus der Definition von Ik+1 die Ungleichung ank ≤ a ≤ bnk
für alle k ∈ N, und hieraus mit den Sätzen 3.3 und 3.4
xn = lim ank ≤ a ≤ lim bnk = xn .
n→∞
n→∞
Beispiel 4.3 (Verfahren von Heron) Hier wollen wir kurz das Verfahren von Heron besprechen, das die Quadratwurzel von a > 0 effizienter berechnet als das Intervallhalbierungsverfahren.
√
Zur Motivation der Iterationsformel: die gesuchte Zahl a ist die Nullstelle x∗ der Parabel
√
y = x2 −a. Nehmen wir an, es ist schon eine n-te Näherung xn für a berechnet, wobei x0 der
Startwert sei. Dann betrachten wir die Tangente an die Parabel im Punkt (xn , x2n − a), und
wählen als nächste Näherung deren Nullstelle xn+1 . Wie lautet der zugehörige Algorithmus?
Beschreiben wir die gesuchte Tangente mit der Gleichung y = p · x + q, (p ist die Steigung, q
der y-Achsenabschnitt), so muss die quadratische Funktion (x2 − a) − (px + q) genau in xn
ihre einzige Nullstelle haben (heuristische Begündung am Bild), also
(x2 − a) − (px + q) = (x − xn )2
⇒
p = 2xn und q = −(a + x2n ).
Die Iterationsvorschrift, gegeben durch die Nullstelle der Tangente in (xn , x2n − a), lautet
demzufolge
1
a
xn+1 = f (xn ) := (xn +
), mit Startwert x0 > 0.
(4.5)
2
xn
Die Frage ist nun, ob dieses Verfahren konvergiert und, wenn ja, wie gut. Zunächst gilt für
alle x > 0
√ √ √
a
x
a
√ +
f (x) =
≥ a,
2
x
a
√
√
mit Gleichheit genau für x = a. Also gilt xn ≥ a für n ≥ 1, und es folgt weiter
1
xn+1 − xn = (a/xn − xn ) ≤ 0 für n ≥ 1.
2 | {z } |{z}
√
√
≤ a
≥ a
18
√
Ab n = 1 ist die Folge somit monoton fallend und durch a nach unten beschränkt, also
konvergiert sie wegen Satz 4.3 gegen eine Zahl ξ > 0. Um zu sehen, dass ξ die gesuchte
Wurzel ist, lassen wir in (4.5) n → ∞ gehen und erhalten ξ 2 = a wie gewünscht. Wie schnell
√
verkleinert sich nun der Näherungsfehler εn = |xn − a| ≥ 0? Für n ≥ 1 ist
εn+1 = xn+1 −
√
√
√
1
a
1
ε2
ε2
a = (xn +
)− a=
(x2n − 2 axn + a) = n ≤ √n .
2
xn
2xn
2xn
2 a
Sei zum Beispiel a ≥ 41 und die Näherung xn schon auf k ≥ 1 Dezimalstellen hinter dem
Komma genau, also εn ≤ 10−k , so ist der Fehler der nächsten Näherung nur mehr
1
εn+1 ≤ √ (10−k )2 ≤ 10−2k .
2 a
| {z }
≤1
Die Anzahl der gültigen Stellen hat sich also in einem Schritt verdoppelt. Man spricht hier
von quadratischer Konvergenz. Beim Intervallhalbierungsverfahren wird die Zahl der gültigen
Stellen jeweils höchstens um Eins verbessert, was als lineare Konvergenz bezeichnet wird.
Definition 4.4 (Teilfolge) Sei (an )n∈N eine Folge und (nk )k∈N eine Folge natürlicher Zahlen mit n1 < n2 < n3 . . . Dann heißt die Folge (ank )k∈N Teilfolge von (an )n∈N .
Durch Induktion ergibt sich sofort nk ≥ k: es ist n1 ≥ 1 und nk+1 ≥ nk + 1 ≥ k + 1. Die
Teilfolge entsteht aus der ursprünglichen Folge durch Auswahl der Nummern nk . Da Folgen
Abbildungen von N nach R sind, ist eine Teilfolge formal als Verkettung von zwei Abbildungen
definiert: der Ausgangsfolge a : N → R, n 7−→ a(n) und der Folge N → N, k 7−→ n(k), die
n
die Indizes auswählt. Am Beispiel an = (−1)
, nk = 2k − 1 sieht das wie folgt aus:
n3
a(n)=
n(k)=2k−1
(−1)n
n3
N
−→
N
−→
R
k
7−→
n(k) = 2k − 1
7−→
1
a(n(k)) = − (2k−1)
3
Definition 4.5 (Häufungspunkt von Folgen) a ∈ R heißt Häufungspunkt der Folge
(an )n∈N , wenn eine Teilfolge (ank )k∈N gibt, die mit k → ∞ gegen a konvergiert.
Beispielsweise hat die Folge an = (−1)n + n12 den Häufungspunkt +1, denn mit nk = 2k gilt
ank = a2k = 1 + 4k12 → 1 mit k → ∞. Auch −1 ist ein Häufungspunkt der Folge, denn für
1
nk = 2k − 1 ist ank = a2k−1 = −1 + (2k−1)
2 → −1 mit k → ∞.
Lemma 4.1 Die Zahl a ∈ R ist genau dann Häufungspunkt der Folge (an )n∈N , wenn die
Menge {n ∈ N : an ∈ Uε (a)} für jedes ε > 0 unendlich viele Elemente hat.
Beweis: Wenn a ∈ R Häufungspunkt von (an )n∈N ist, so gilt nach Definition ank → a mit
k → ∞ für eine Teilfolge nk . Zu jedem ε > 0 gibt es dann ein K ∈ R mit ank ∈ Uε (a) für alle
k > K. Wegen nk → ∞ mit k → ∞ für alle k ist die Menge {nk : k > K} unendlich. Dies
beweist die eine Richtung der Äquivalenz.
Umgekehrt wählen wir induktiv nk für k = 1, 2, . . . mit ank ∈ U1/k (a). Die Induktion bricht
nicht ab, da an ∈ U1/k (a) für unendlich viele n gilt. Es folgt dann |ank − a| < k1 → 0 mit
k → ∞.
19
Satz 4.7 (Bolzano-Weierstraß) Jede beschränkte Folge reeller Zahlen hat eine konvergente Teilfolge, also mindestens einen Häufungspunkt.
Beweis: Konstruktion durch fortgesetzte Intervallhalbierung: wähle eine obere Schranke b1
und eine untere Schranke a1 für (xn )n∈N , also xn ∈ [a1 , b1 ] für alle n ∈ N. Wir nehmen nun
induktiv an, dass Ik = [ak , bk ] schon gefunden ist mit der Eigenschaft
(∗) xn ∈ Ik
für unendlich viele n.
Setze mk = 21 (ak + bk ) und definiere
Ik+1 = [ak+1 , bk+1 ] =
[mk , bk ] ,
[ak , mk ]
falls xn ∈ [mk , bk ] für unendlich viele n,
sonst.
Es ist offensichtlich, dass (∗) auch für das Intervall Ik+1 gilt. Nach dem Intervallschachtelungsprinzip (Satz 4.5) gibt es ein x ∈ R mit x ∈ Ik für alle k ∈ N. Zu ε > 0 gibt es nun
ein K ∈ R mit |Ik | < ε für k > K, also Ik ⊂ Uε (x) für k > K. Damit gilt auch xn ∈ Uε (x)
für unendlich viele n. Aus Lemma 4.1 schließen wir, dass x ein Häufungspunkt der Folge
(xn )n∈N ist.
Definition 4.6 (Limes superior/inferior) Für eine Folge (xn )n∈N gilt lim supn→∞ xn =
x∗ mit x∗ ∈ R ∪ {±∞} (beziehungsweise lim inf n→∞ xn = x∗ mit x∗ ∈ R ∪ {±∞}), falls
folgende zwei Bedingungen erfüllt sind:
(i)
es gibt eine Teilfolge xnk → x∗ mit k → ∞;
(ii)
für alle x > x∗ ist die Menge {n ∈ N : xn > x} endlich (bzw. für alle x < x∗ )
ist {n ∈ N : xn > x} endlich).
Der Limes superior ist nicht notwendig obere Schranke der Folge, zum Beispiel gilt
lim supn→∞ n1 = 0. Er kann auch −∞ sein, zum Beispiel für xn = −n. Während wir
limn→∞ xn nur dann bilden können, wenn die Folge konvergiert, ist der größte Häufungspunkt
x∗ = lim supn→∞ xn und der kleinste Häufungspunkt x∗ = lim inf n→∞ xn = x∗ immer definiert, wenn wir jeweils die Möglichkeit x∗ = ±∞ bzw. x∗ = {±∞} zulassen. Dies soll nun
bewiesen werden, wobei wir uns o.B.d.A. auf den Limes superior beschränken.
Lemma 4.2 Sei lim supn→∞ xn = x∗ < ∞. Dann gilt
y > x∗ ⇒ y ist kein Häufungspunkt von (xn ).
Beweis: Für 0 < ε < 21 (y − x∗ ) gilt
|x − y| < ε ⇒ x − x∗ = y − x∗ − (y − x) > ε
| {z } | {z }
>2ε
<ε
⇒ Uε (y) ⊂ {x ∈ R : x > x∗ + ε}
Mit Lemma 4.1 folgt die Behauptung aus (ii).
Satz 4.8 (Existenz des Limes superior) Für jede Folge (xn )n∈R gibt es genau ein x∗ ∈
R ∪ {±∞} mit lim supn→∞ xn = x∗ .
20
Beweis:
Fall 1: (xn ) ist nicht nach oben beschränkt.
Dann ist {n : xn ≥ b} unendlich für alle b ∈ R. Bestimme induktiv n1 < n2 < . . . mit
xnk ≥ k. Es folgt lim supn→∞ xn = +∞.
Fall 2: Es gibt ein b1 ∈ R mit xn ≤ b1 für alle n ∈ N.
Fall 2.1: {n : xn ≥ a} ist endlich für alle a ∈ R.
Dann gilt xn → −∞ und es folgt lim supn→∞ xn = −∞.
Fall 2.2: Es gibt ein a1 ∈ R, so dass {n : xn ∈ [a1 , b1 ]} unendlich ist.
In diesem Fall wenden wir das Intervallhalbierungsverfahren aus dem Beweis von Satz 4.7 an
und behaupten
{n : xn > bk } ist endlich für alle k.
Für k = 1 ist das richtig, da b1 obere Schranke. Sei die Behauptung schon für k ∈ N gezeigt.
bk+1 = bk
⇒
Die Behauptung gilt nach Induktionsannahme.
bk+1 = mk
⇒
Die Menge {n : xn > bk+1 } = {n : xn ∈ (mk , bk ]} ∪ {n : xn > bk }
ist endlich nach Fallunterscheidung sowie Induktionsannahme.
Sei nun x∗ := limk→∞ bk . Für x > x∗ ist (x, +∞) ⊂ (bk , +∞) für k hinreichend groß, also ist
{n : xn > x} endlich und es folgt lim supn→∞ = x∗ . Damit ist die Existenz bewiesen.
Angenommen es gibt x∗1 < x∗2 mit den Eigenschaften (i) und (ii). Wähle x ∈ (x∗1 , x∗2 ). Wegen
(ii) für x∗1 ist dann {n : xn > x} endlich. Dann kann aber (i) für x∗2 nicht gelten, ein
Widerspruch.
Die Begriffe Häufungspunkt, Limes superior und Limes inferior sind gewöhnungsbedürftig,
und wir werden bei Gelegenheit mehr Beispiele betrachten. Die logische Abfolge der
zentralen theoretischen Aussagen in diesem Abschnitt war folgende:
Vollständigkeitsaxiom:
Cauchyfolgen sind konvergent
⇓
Konvergenzkriterium der
Monotonie und Beschränktheit
⇓
Intervallschachtelungsprinzip
⇓
Bolzano-Weierstraß: Auswahlsatz
⇓
Cauchyfolgen sind konvergent
Die Implikationen sind so zu verstehen, dass jeweils nur die jeweils vorangehende Eigenschaft
von R im Beweis des darauf folgenden Resultats benutzt wurde. Die letzte Implikation
werden wir dabei gleich noch zeigen. Es folgt, dass jede der vier Eigenschaften als Axiom für
R benutzt werden könnte - die anderen Eigenschaften würden als Sätze folgen. Im nächsten
21
Abschnitt werden wir eine weitere, äquivalente Eigenschaft kennenlernen, nämlich den Satz
vom Supremum (Satz 5.1). In dieser Vorlesung wird die Konvergenz der Cauchyfolgen als
grundlegendes Axiom gewählt.
Beweis: Auswahlsatz von Bolzano-Weierstraß ⇒ Cauchyfolgen sind konvergent
Wir zeigen zunächst, dass eine Cauchyfolge (an )n∈N beschränkt ist. Sei n0 ∈ N mit |an −am | ≤
1 für n, m ≥ n0 . Dann folgt
n ≥ n0 ⇒ |an | ≤ |an − an0 | +|an0 |.
| {z }
≤1
Also gilt |an | ≤ max(|a1 |, |a2 |, . . . , |an0 −1 |, |an0 |+1) = K. Sei nun N ∈ R mit |an −am | < 2ε für
n, m > N . Wir wenden den Auswahlsatz von Bolzano-Weierstraß an: es gibt eine Teilfolge
(ank )k∈N mit ank → a mit k → ∞. Wähle k0 ∈ N mit |ank0 − a| < 2ε und nk0 > N . Für
n > N folgt
|an − a| ≤ |an − ank0 | + |ank0 − a| < ε.
| {z } | {z }
< 2ε
< 2ε
Somit konvergiert die ganze Folge gegen a.
Ebenso wichtig wie die Theorie sind die behandelten Anwendungen:
• Konvergenz von unendlichen Dezimalbrüchen;
• Definition der Exponentialfunktion exp(x) = limn→∞ (1 + nx )n ;
√
• Definition der n-ten Wurzel n a.
5
Teilmengen von R und von Rn
Definition 5.1 Die Menge M ⊂ R heißt
nach oben beschränkt:
⇔
∃ K ∈ R mit x ≤ K für alle x ∈ M ;
nach unten beschränkt: ⇔ ∃ K ∈ R mit x ≥ K für alle x ∈ M .
Die Zahl K heißt dann obere bzw. untere Schranke. M heißt beschränkt, wenn M sowohl
nach oben und nach unten beschränkt ist. Dies ist äquivalent zu
∃ K ≥ 0 mit |x| ≤ K für alle x ∈ M.
Beispiel. Die Menge I = [0, 1) ist nach oben beschränkt, eine obere Schranke ist zum
Beispiel K = 106 . Es gibt aber kein größtes Element, das heißt kein Maximum in I:
x∈I⇒x<
x+1
∈ I.
2
Es gibt aber eine kleinste obere Schranke, nämlich die Zahl 1.
Definition 5.2 (Supremum/Infimum) Eine Zahl S ∈ R heißt kleinste obere Schranke
oder Supremum der Menge M ⊂ R (bzw. größte untere Schranke oder Infimum von M ),
wenn gilt:
22
(i)
S ist obere Schranke (bzw. untere Schranke): x ≤ S für alle x ∈ M
(bzw. x ≥ S für alle x ∈ M ).
(ii)
Falls S 0 auch obere (bzw. untere) Schranke ist, so folgt S 0 ≥ S (bzw. S 0 ≤ S).
Notation: S = sup M (bzw. S = inf M ). Ist M nicht nach oben (bzw. unten) beschränkt, so
setzen wir sup M = +∞ (bzw. inf M = −∞). Schließlich ist per Definition sup ∅ = −∞ und
inf ∅ = +∞.
Satz 5.1 (Existenz des Supremums) Jede nichtleere, nach oben beschränkte Menge M ⊂
R hat eine kleinste obere Schranke sup M ∈ R.
Beweis: Sei b1 obere Schranke und a1 ∈ M . Konstruiere dann induktiv In = [an , bn ] für
n ≥ 1 mit In ∩ M 6= ∅:
(
[an , mn ], falls [mn , bn ] ∩ M = ∅
In+1 = [an+1 , bn+1 ] =
[mn , bn ], sonst.
T
Sei S = n≥1 In = limn→∞ bn nach dem Intervallschachtelungsprinzip (Satz 4.5). S ist obere
Schranke: für x ∈ M gilt induktiv x ≤ bn für alle n, also x ≤ limn→∞ bn = S. Sei S 0
eine obere Schranke von M . Nach Konstruktion gibt es xn ∈ M ∩ In für alle n, also gilt
S 0 ≥ limn→∞ xn = S.
Folgerung 5.1 Sei M ⊂ R nichtleer. Dann gibt es eine Folge xn ∈ M bzw. x0n ∈ M mit
xn → sup M bzw. x0n → inf M .
Beweis: Wir zeigen die Aussage für das Supremum. Ist M nach oben beschränkt, so wurde
eine solche Folge im Beweis des vorangehenden Satzes konstruiert. Ist M nicht nach oben
beschränkt, so gibt es zu n ∈ N ein xn ∈ M mit xn ≥ n, also xn → +∞ = sup M .
Bemerkung. Es gilt (ggf. Diskussion in Anwesenheitsübungen)
lim sup an = lim (sup ak ),
n→∞
n→∞ k≥n
bzw.
lim inf an = lim ( inf ak ).
n→∞
n→∞ k≥n
Jetzt wollen wir uns einer neuen Frage zuwenden: wie kann man die unendlichen Mengen
N ⊂ Z ⊂ Q ⊂ R der Größe nach vergleichen? Gibt es wirklich mehr rationale Zahlen als
natürliche? Mehr reelle als rationale? Die Antwort lautet witzigerweise, dass es gleich viele
natürliche, ganze und rationale Zahlen gibt, aber mehr reelle Zahlen. Alle genannten Mengen
enthalten unendlich viele Elemente. Die Präzisierung der Begriffe gleichviele und mehr geht
auf Georg Cantor (1872) zurück.
Definition 5.3 Eine Menge A heißt gleichmächtig zur Menge B (Notation: A ∼ B), wenn
es eine bijektive Abbildung (Bijektion) ϕ : A → B gibt.
Lemma 5.1 Die Relation A ∼ B (A ist gleichmächtig zu B) ist eine Äquivalenzrelation, das
heißt für alle Mengen A, B, C gilt:
(i)
A∼A
(ii)
A∼B
(iii)
A ∼ B und B ∼ C
⇒B∼A
⇒ A ∼ C.
23
Beweis:
(i)
Wähle als Bijektion die Identität idA : A → A, a 7−→ a.
(ii)
Sei ϕ : A → B Bijektion. Wähle dann ϕ−1 : B → A.
(iii)
Seien ϕ : A → B und ψ : B → C bijektiv. Wähle dann ψ ◦ ϕ : A → C.
Definition 5.4 Eine Menge A heißt
-
endlich, wenn sie gleichmächtig zu einer Menge {1, 2, . . . , k} mit k ∈ N ist;
abzählbar unendlich, wenn sie gleichmächtig zu N ist;
abzählbar, wenn sie endlich oder abzählbar unendlich ist;
überabzählbar, wenn sie nicht abzählbar ist.
Lemma 5.2 Es gelten folgende Aussagen:
(i)
Die Zahl k ∈ N der Elemente einer endlichen Menge (siehe Definition 5.4) ist
wohldefiniert.
(ii)
Die Menge N der natürlichen Zahlen ist nicht endlich.
Beweis: Um (i) zu beweisen, reicht es nach Lemma 5.1 aus, für k, l ∈ N folgendes zu zeigen:
(∗) {1, . . . , k} ∼ {1, . . . , l} und k ≤ l ⇒ k = l.
Wir führen Induktion über k. Für k = 1 gibt es nach Voraussetzung eine bijektive, also
surjektive Abbildung ϕ : {1} → {1, . . . , l} und es folgt sofort l = ϕ(1) = 1. Sei (∗) schon
für ein k ∈ N gezeigt, und sei ϕ : {1, . . . , k + 1} → {1, . . . , l} bijektiv sowie l ≥ k + 1. Mit
ϕ(k + 1) =: j haben wir dann Bijektionen
ϕ : {1, . . . , k} → {1, . . . , l}\{j},
ψ : {1, . . . , l − 1} → {1, . . . , l}\{j}, ψ(i) =
i für i < j,
i + 1 für i ≥ j.
Mit Lemma 5.1 (iii) folgt {1, . . . , k} ∼ {1, . . . , l − 1} und somit k = l − 1 nach Induktionsannahme, das heißt (∗) ist für k + 1 bewiesen.
Für eine Abbildung ϕ : {1, . . . , k} → N ist z.B. die Zahl (max1≤j≤k ϕ(j)) + 1 ∈ N nicht
im Bild von ϕ, woraus die Aussage (ii) folgt.
Lemma 5.3 Falls eine surjektive Abbildung ϕ : N → A existiert, so ist A abzählbar.
Beweis: Setze n1 = 1 und definiere n1 < n2 < . . . durch
nk = min{n ∈ N : ϕ(n) 6= ϕ(nj ) für alle j < k}.
Fall 1. Die Rekursion bricht nach einem nk ab.
Dann ist die Abbildung ψ : {1, . . . , k} → A, j 7−→ ϕ(nj ) bijektiv und A ist endlich.
Fall 2. Die Rekursion bricht nicht ab.
Dann ist ψ : N → A, j 7−→ ϕ(nj ) bijektiv und A ist abzählbar.
24
Satz 5.2 Die Mengen Z und Q sind abzählbar.
Beweis: Für Z wähle
ϕ : N −→ Z,
ϕ(n) =
ϕ : Z −→ N, ϕ−1 (k) =
(
n
2
n−1
(− 2
n gerade
n ungerade
2k
1 − 2k
k>0
k≤0
Wie das Argument für Z zeigt, können wir uns bei Q auf die Menge Q+ = { pq : p, q ∈ N}
beschränken. Wir zählen die rationalen Zahlen diagonal ab:
k=
i=
1
2
3
4
5
1
2
3
4
5
6
1/1 2/1 3/1 4/1 5/1 6/1
. . . . .
1/2 2/2 3/2 4/2
·
. . . ·
1/3 2/3 3/3
·
. . ·
1/4 2/4
·
. ·
1/5
Die Diagonale mit der Nummer k enthält k Elemente. Deshalb wird N in Abschnitte
{
k(k − 1)
k(k − 1)
k(k + 1)
k(k − 1)
+ 1,
+ 2, . . . , ,
+k =
} mit k ∈ N
2
2
2
2
zerlegt. Die gesuchte Abbildung ϕ : N → Q lautet dann
ϕ(n) =
k−i+1
k(k − 1)
für n =
+ i (k ∈ N, 1 ≤ i ≤ k).
i
2
Ich empfehle, die Wohldefiniertheit von ϕ zu prüfen und eine Formel herzuleiten. Da ϕ
surjektiv ist, folgt mit Lemma 5.3 die Behauptung für Q.
Bemerkung: Durch Anordnung in einem quadratischen Schema und analoge Abzählung läßt
sich ganz analog zeigen, daß eine abzählbare Vereinigung von jeweils abzählbaren Mengen
abermals abzählbar ist.
Satz 5.3 (R ist nicht abzählbar) Es gibt keine surjektive Abbildung ϕ : N → R.
Beweis: Sei ϕ : N → R eine Abbildung, ϕ(n) = xn . Wir konstruieren eine Intervallschachtelung (In )n∈N mit xn ∈
/ In für alle n. Wähle I1 = [x1 + 1, x1 + 2]. Ist In schon
bestimmt, so zerlege In in drei abgeschlossene Teilintervalle gleicher Länge. Wähle für In+1
ein Teilintervall,
das xn+1 nicht enthält (im Zweifelsfall das rechte). Nach Satz 4.5 gibt es
T
ein x ∈ n∈N In ∈ R, also x 6= xn für alle n ∈ N.
In Zukunft brauchen wir den Begriff der Konvergenz auch für Punkte im Rn , zum Beispiel
für Punkte in der Ebene und im drei-dimensionalen Raum. Dazu brauchen wir als erstes
einen Abstandsbegriff.
25
Definition 5.5 (Euklidische Norm) Das Euklidische Skalarprodukt von Vektoren x =
(x1 , . . . , xn ), y = (y 1 , . . . , y n ) ∈ Rn ist
1 1
n n
hx, yi = x y + . . . + x y =
n
X
xi y i .
(5.1)
i=1
Die Euklidische Norm oder Länge von x = (x1 , . . . , xn ) ∈ Rn ist
|x| =
p
+
1 2
n 2
hx, xi = (x ) + . . . + (x )
1
2
=
n
X
i 2
(x )
!1/2
.
(5.2)
i=1
Lemma 5.4 (Eigenschaften des Skalarprodukts) Für α, β ∈ R und x, y, z ∈ Rn gilt:
Symmetrie:
hx, yi = hy, xi
(5.3)
Bilinearität:
hαx + βy, zi = αhx, zi + βhy, zi
(5.4)
Positivität: hx, xi ≥ 0,
Gleichheit ⇔ x = 0.
(5.5)
Beweis: Die Eigenschaften ergeben sich aus der Definition.
Lemma 5.5 (Eigenschaften der Norm) Für α ∈ R und x, y ∈ Rn gilt:
|x| ≥ 0,
Gleichheit ⇔ x = 0;
|αx| = |α| · |x|
(5.6)
(5.7)
|x + y| ≤ |x| + |y| (Dreiecksungleichung)
(5.8)
Gleichheit in der Dreiecksungleichung gilt genau dann, wenn x und y dieselbe Richtung haben.
Der Euklidische Abstand zwischen zwei Punkten x und y ist |x − y| ≥ 0. Für drei Punkte
x, y, z ergibt sich aus (5.8)
|x − z| = |x − y + y − z| ≤ |x − y| + |y − z|,
das heißt im Dreeick x, y, z ist jede Seite kürzer als die Summe der beiden anderen Seiten
(Gleichheitsdiskussion!).
Die Eigenschaften (5.6) und (5.7) sind evident, vgl. Lemma 5.4. Für den Beweis der Dreiecksungleichung benötigen wir erst das folgende Resultat.
Satz 5.4 (Ungleichung von Cauchy-Schwarz) Für x, y ∈ Rn gilt
hx, yi ≤ |x| |y|.
(5.9)
Gleichheit gilt genau dann, wenn x und y dieselbe Richtung haben.
Beweis: Im Fall x = 0 oder y = 0 ist hx, yi = |x| |y| = 0. Andernfalls betrachten wir die
y
x
Vektoren ξ = |x|
sowie η = |y|
mit Länge |ξ| = |η| = 1 (wegen (5.7)). Es gilt
x y
1 − h |x|
, |y| i = 1 − hξ, ηi
=
=
1
2
1
2
(|ξ|2 + |η|2 − 2hξ, ηi)
|ξ − η|2
≥ 0.
26
Hieraus folgt (5.9). Gilt in (5.9) Gleichheit für x, y 6= 0, so folgt aus der Abschätzung ξ = η,
das heißt x und y haben dieselbe Richtung.
Beweis: der Dreiecksungleichung (5.8):
|x + y|2 = |x|2 + 2hx, yi + |y|2
≤ |x|2 + 2|x| + |y|2 (Satz 5.4)
= (|x| + |y|)2 .
Die Behauptung folgt aus der Monotonie der Wurzel.
Im Gegensatz zu R haben wir im Rn keine Anordnung zur Verfügung. Deshalb verwenden
wir die Ungleichungszeichen <, >, ≤, ≥, Formulierungen wie ”nach oben bzw. unten beschränkt” und den Begriff der Monotonie ausschließlich für reelle Zahlen und niemals für
Punkte im Rn . Eine Ungleichung a < b ist nur für reelle Zahlen sinnvoll (später auch mal
für gewisse Matrizen, aber das tut jetzt nichts zur Sache). Ein Check zeigt jedoch, dass
die Begriffe Konvergenz, ε-Umgebung, Beschränktheit, Cauchyfolge und Vollständigkeit mit
der Betragsfunktion formuliert werden können. Sie lassen sich dann auf Rn verallgemeinern,
indem wir statt der Betragsfunktion die Euklidische Norm einsetzen.
Definition 5.6 (Konvergenz in Rn ) Die Folge xk ∈ Rn konvergiert gegen a ∈ Rn , falls
gilt:
∀ε > 0 ∃N ∈ R mit |ak − a| < ε ∀k > N.
Definition 5.7 (ε-Umgebung in Rn ) Die ε-Umgebung von a ∈ Rn ist die Menge
Uε (a) = {x ∈ Rn : |x − a| < ε}.
Sie wird auch als offene Kugel (für n ≥ 3) bzw. offene Kreisscheibe (für n = 2) um a mit
Radius ε > 0 bezeichnet. Die abgeschlossene Kugel ist
Kε (a) = {x ∈ Rn : |x − a| ≤ ε}.
Definition 5.8 (Beschränkte Teilmengen von Rn ) Eine Menge M ⊂ Rn heißt beschränkt, wenn gilt:
Es gibt ein K ≥ 0 mit |x| ≤ K für alle x ∈ M.
Zum Glück müssen wir nun nicht die ganze Theorie von vorne beginnen. Die genannten
Eigenschaften für Punkte im Rn lassen sich nämlich in Eigenschaften der Koordinaten dieser
Punkte übersetzen, und umgekehrt.
Satz 5.5 (Eigenschaften bzgl. Norm ' Eigenschaften bzgl. der Koordinaten)
Für eine Folge (ak )k∈N von Punkten ak ∈ Rn mit Koordinaten aik , i ∈ {1, . . . , n}, gelten
folgende Aussagen:
(ak )k∈N ist beschränkt
⇔
(aik )k∈N ist beschränkt für alle i ∈ {1, . . . , n};
(ak )k∈N konvergiert gegen a ∈ Rn
⇔
(aik )k∈N konvergiert gegen ai für alle i ∈ {1, . . . , n};
(ak )k∈N ist Cauchyfolge
⇔
(aik )k∈N ist Cauchyfolge für alle i ∈ {1, . . . , n}.
27
Beweis: Wir haben für x ∈ Rn die Ungleichungen
max |xi | ≤ |x| = (x1 )2 + . . . + (xn )2
1≤i≤n
1
2
≤
√
n max |xi |.
(5.10)
1≤i≤n
Geometrisch bedeutet (5.10), dass für die abgeschlossene Kugel Kr (a) mit Radius r um a
und für den abgeschlossenen Würfel Wr (a) mit Mittelpunkt a und Kantenlänge 2r > 0, also
Wr (a) = {x ∈ Rn : |xi − ai | ≤ r} = [a1 − %, a1 + %] × . . . × [an − %, an + %], folgende Inklusionen
gelten:
Kr (a) ⊂ Wr (a) ⊂ K√n r (a).
Die erste Behauptung ergibt sich nun aus der Implikation
|ak | ≤ K für alle k
⇒
|aik | ≤ K für alle i ∈ {1, . . . , n} und alle k ∈ N,
und aus dem umgekehrten Schluss
|aik | ≤ Ki
max |aik | ≤ K := max Ki
1≤i≤n
√
⇒ |ak | ≤ n K ∀ k ∈ N.
∀ i ∈ {1, . . . , n}, k ∈ N ⇒
1≤i≤n
∀k ∈ N
Das Argument für die zweite Behauptung geht wie folgt:
lim ak = a ⇔
k→∞
⇔
⇔
⇔
lim |ak − a| = 0
k→∞
max |aik − ai | = 0
1≤i≤n
(wegen Ungleichung (5.10))
lim |aik − ai | = 0 für alle i ∈ {1, . . . , n}
k→∞
lim aik = ai für alle i ∈ {1, . . . , n}.
k→∞
Schließlich gilt
(aik )k∈N Cauchyfolge
⇒
Zu ε > 0 gibt es Ni ∈ R mit
∀ i ∈ {1, . . . , n}
|aik
−
ail |
<
max1≤i≤n |aik − ail | < √εn
√
(5.10)
⇒
|ak − al | < n · √εn = ε
Die umgekehrte Richtung ist einfacher.
⇒
√ε
n
∀k, l > Ni
∀k, l > N := max1≤i≤n Ni
∀ k, l > N.
Folgerung 5.2 (Vollständigkeit von Rn ) Sei (xk )k∈N mit xk ∈ Rn eine Cauchyfolge, das
heißt
∀ ε > 0 ∃ N ∈ R mit |xk − xl | < ε ∀ k, l > N.
Dann existiert ein a ∈ Rn , so dass xk → a mit k → ∞.
Beweis: Nach Satz 5.5 sind die Folgen (xik )k∈N Cauchyfolgen in R.
Nach dem
i
i
i
Vollständigkeitsaxiom gibt es a ∈ R mit limk→∞ xk = a für alle i ∈ {1, . . . , n}. Wieder
nach Satz 5.5 folgt limk→∞ xk = a.
Folgerung 5.3 (Bolzano-Weierstraß im Rn ) Jede beschränkte Folge (xk )k∈N in Rn besitzt eine konvergente Teilfolge.
28
Beweis: Nach Satz 5.5 sind die reellen Folgen (xik )k∈N beschränkt für jedes i ∈ {1, . . . , n}.
Wir konstruieren induktiv sukzessive Teilfolgen, so dass schliesslich alle Koordinatenfolgen
konvergieren. Mit Satz 5.5 folgt dann die Behauptung. Im ersten Schritt wählen wir nach
Satz 4.7 eine Teilfolge k10 < k20 < . . ., so dass
lim x1k0 =: a1 ∈ R
j→∞
j
existiert. Im zweiten Schritt wählen wir, wieder nach Satz 4.7, aus der ersten Teilfolge eine
weitere Teilfolge k100 < k200 < . . ., so dass zusätzlich der Grenzwert
lim x2k00 =: a2 ∈ R
j→∞
j
(n)
(n)
existiert. So fahren wir fort, bis nach n Schritten eine Teilfolge k1 < k2
ist, für die alle Grenzwerte limj→∞ xi (n) =: ai mit 1 ≤ i ≤ n existieren.
< . . . gefunden
kj
Beispiel Um den Sachverhalt zu verdeutlichen, betrachte die Folge xk = (x1k , x2k ) von Punkten in R2 mit

 0 für k = 0 mod 3,
1 für k gerade,
1 für k = 1 mod 3,
x1k =
x2k =
−1 für k ungerade,

2 für k = 2 mod 3.
Die Koordinatenfolge (x1k )k∈N hat zum Beispiel die konvergente Teilfolge (x12j )j∈N , denn x12j =
1 für alle j. Ebenso ist (x23j )j∈N konvergente Teilfolge von (x2k )k∈N , denn x23j = 0 für alle
j ∈ N. Damit haben wir aber noch keine konvergente Teilfolge für die Punkte xk ∈ R2
gefunden, denn weder x22j noch x13j ist konvergent. Stattdessen wählen wir aus der Folge
(x2j )j∈N die weitere Teilfolge (x2·3l )l∈N , also j = 3l, aus. Diese konvergiert in R2 , denn es ist
x6l = (1, 0) für alle l ∈ N.
Definition 5.9 (Häufungspunkt von Mengen) Ein Punkt a ∈ Rn heißt Häufungspunkt
der Menge M ⊂ Rn , falls für jedes ε > 0 die Menge Uε (a) ∩ M unendlich viele Elemente hat.
Lemma 5.6 Der Punkt a ∈ M ist genau dann Häufungspunkt von M , wenn es eine Folge
von Punkten ak ∈ M \{a} gibt mit limk→∞ ak = a.
Beweis: Sei a Häufungspunkt gemäß Definition 5.9. Zu εk =
U 1 (a) ∩ M \{a}. Die Folge (ak )k∈N ist wie verlangt.
1
k
gibt es dann ein ak ∈
k
Sei umgekehrt eine Folge ak ∈ M \{a} gegeben mit limk→∞ ak = a. Angenommen, für ein
ε > 0 ist die Menge Uε (a) ∩ M endlich, also Uε (a) ∩ M \{a} = {x1 , . . . , xm } für ein m ∈ N0 .
Dann ist % := min1≤i≤m |xi − a| > 0. Wegen limk→∞ |ak − a| = 0 folgt für k hinreichend groß
ak ∈ U% (a) ∩ M \{a} = ∅,
ein Widerspruch.
Beispiele:
• M = { n1 : n ∈ N}
⇒
0 ∈ R ist Häufungspunkt von M .
• Jedes a ∈ R ist Häufungspunkt von Q.
29
• Eine endliche Menge M = {x1 , . . . , xm } ⊂ Rn hat keinen Häufungspunkt. Dagegen hat
die konstante Folge (ak )k∈N mit ak = 1 für alle k den Häufungspunkt 1 ∈ R. Überlegen
Sie, dass für eine beliebige Folge (ak )k∈N im Rn die Häufungspunkte des Wertebereichs
M = {ak : k ∈ N} eine Teilmenge der Häufungspunkte der Folge bilden, die aber eine
echte Teilmenge sein kann, wie das Beispiel der konstanten Folge zeigt.
Definition 5.10 (Offene und abgeschlossene Mengen)
(i) Ω ⊂ Rn heißt offen, falls zu jedem x ∈ Ω ein ε > 0 existiert mit Uε (x) ⊂ Ω.
(ii) A ⊂ Rn heißt abgeschlossen, wenn folgende Implikation stets gilt:
xn ∈ A,
lim xn = x ∈ Rn
n→∞
⇒
x ∈ A.
Nach Lemma 5.6 ist eine Menge A genau dann abgeschlossen, wenn jeder Häufungspunkt von
A schon Element von A ist.
Beispiel 5.1 Die Kugel U% (a) = {x ∈ Rn : |x − a| < %} ist offen.
Beweis: Sei x ∈ U% (a) und 0 < ε ≤ % − |x − a| > 0. Für y ∈ Uε (x) folgt
|y − a| ≤ |y − x| + |x − a| < ε + |x − a| = %.
Also gilt Uε (x) ⊂ U% (a).
Satz 5.6 Für M ⊂ Rn gilt: M offen
⇔
Rn \M abgeschlossen.
Beweis:
⇒“: Sei xk ∈ Rn \M Folge, limk→∞ xk = x ∈ Rn . Wäre x ∈ M , so folgt Uε (x) ⊂ M für ein
”
ε > 0, und somit xk ∈ M für k hinreichend groß, Widerspruch. Also ist x ∈ Rn \M .
⇐“: Angenommen, M ist nicht offen. Dann gibt es ein x ∈ M mit Uε (x)\M 6= ∅
”
für alle ε > 0. Finde induktiv xk ∈ U 1 (x) mit xk ∈ Rn \M . Es folgt x = limk→∞ xk ∈
k
Rn \M , ein Widerspruch.
Eine Menge M ⊂ Rn kann weder offen noch abgeschlossen sein; dies trifft zum Beispiel auf
ein halboffenes Intervall [a, b) zu. Die Mengen R und ∅ sind die einzigen Teilmengen von
R, die sowohl offen als auch abgeschlossen sind. Dies soll in den Übungen gezeigt werden.
Die Vereinigung beliebig vieler offener Mengen ist offen, aber nur endliche Durchschnitte von
offenen Mengen sind offen. Auch dies soll in den Übungsaufgaben behandelt werden.
Zum Abschluss dieses Abschnitts untersuchen wir als Beispiel eine spezielle Menge, und zwar
die sogenannte Cantormenge C ⊂ [0, 1]. Analog zur Dezimaldarstellung gibt es zu jedem
x ∈ [0, 1] Ziffern kj ∈ {0, 1, 2}, j ∈ N, mit
x = 0, k1 k2 . . . :=
∞
X
kj 3−j .
j=1
Auf diese Weise ist x als triadischer Bruch (b-adischer Bruch zur Basis b = 3) dargestellt.
30
Lemma 5.7 Seien x = 0, k1 k2 . . . und y = 0, m1 m2 . . . mit kj = mj für j = 1, . . . , N − 1,
aber |kN − mN | = 2. Dann gilt |x − y| ≥ 3−N > 0.
Beweis:
|x − y| = |
∞
X
(kj − mj )3−j |
j=1
≥ 2 · 3−N −
∞
X
j=N +1
|kj − mj | 3−j
| {z }
≤2
≥ 2 · 3−N − 2 · 3−(N +1) ·
1
1−
1
3
= 3−N .
Definition 5.11 (Cantormenge) Die Cantormenge ist die Menge aller reellen Zahlen in
[0, 1], die eine triadische Entwicklung nur mit den Ziffern 0 und 2 erlauben:
C = {0, k1 k2 . . . :
kj ∈ {0, 2} für alle j}.
Um diese Menge zu verstehen, betrachten wir die Mengen
Cn = {0, k1 k2 . . . :
kj ∈ {0, 2} für 1 ≤ j ≤ n}.
Wir haben dann [0, 1] = C0 ⊃ C1 ⊃ . . . ⊃ Cn ⊃ . . . ⊃ C.
Lemma 5.8 Es gilt
2 1
1
(1) Cn+1 = { x : x ∈ Cn } ∪ { + x : x ∈ Cn }
|3
{z
} | 3 3 {z
}
=: 13 Cn
(2) C =
(disjunkte Vereinigung),
=: 23 + 13 Cn
T∞
n=0 Cn .
Beweis: Aussage (1) ergibt sich direkt aus
Cn+1 = {0, k1 k2 . . . : kj ∈ {0, 2} für j ≤ n + 1},
1
Cn = {0, 0m1 m2 . . . : mj ∈ {0, 2} für j ≤ n},
3
2 1
+ Cn = {0, 2m1 m2 . . . : mj ∈ {0, 2} für j ≤ n}.
3 3
C0
0
1
C1
0
1/3
2/3
1
C2
31
0
1/9
2/9
1/3
2/3
7/9
8/9
1
C3
0
1
27
2 1
27 9
2 7
9 27
8 1
27 3
2 19
3 27
20 7
27 9
8 25
9 27
26
27
1
T
Bei der zweiten Aussage ist C ⊂ ∞
n=1 Cn klar. Sei umgekehrt x ∈ Cn für alle n ∈ N. Die
ersten n Ziffern in {0, 2} von x sind eindeutig bestimmt nach Lemma 5.7. Es folgt
x ∈ C1 ⇒ x = 0, k1 . . .
x ∈ C2 ⇒ x = 0, k1 k2 . . .
..
.
mit k1 ∈ {0, 2},
mit k2 ∈ {0, 2}und gleichem k1 ,
x ∈ Cn ⇒ x = 0, k1 k2 . . . kn . . . mit kn ∈ {0, 2}und gleichen k1 , . . . , kn−1 .
Auf diese Weise erhalten wir eine Darstellung x = 0, k1 k2 . . . mit kj ∈ {0, 2} für alle j ∈ N.
Aus der ersten Aussage des Lemmas folgt mit Induktion, dass Cn disjunkte Vereinigung von
2n abgeschlossenen Intervallen der Länge 3−n ist.
Satz 5.7 (Eigenschaften der Cantormenge) Die Cantormenge hat folgende Eigenschaften:
(1) C ist abgeschlossen.
(2) Jedes x ∈ C ist Häufungspunkt von C.
(3) [0, 1]\C ist dicht in (0, 1).
(4) C ist überabzählbar.
(5) C ist selbstähnlich: C = 31 C ∪ ( 23 + 13 C).
(6) C hat die Dimension log3 2.
Beweis: Wir werden die Aussagen (1) bis (5) beweisen, und bei (6) ein Indiz für die Richtigkeit der Behauptung angeben, aber keinen Beweis.
(1): Da C0 = [0, 1] abgeschlossen ist, ist nach Rekursionsformel (1) in Lemma 5.8 auch
Cn abgeschlossen
für alle n ∈ N. Als Durchschnitt abgeschlossener Mengen ist dann
T∞
C = n=1 Cn ebenfalls abgeschlossen.
(2): Falls die Entwicklung x = 0, k1 . . . kn von x abbricht, so wählen wir als approximierende
Folge xn = x + 2 · 3−n ∈ C. Andernfalls können wir die Zahlen xn = 0, k1 . . . kn als
Approximation wählen.
(3): Wir nehmen indirekt an, dass I = (a, b) ⊂ C ist. Dann folgt I ⊂ Cn für alle n, und
I muss schon in einem der 2n disjunkten Teilintervalle von Cn enthalten sein. Dies
bedeutet |I| ≤ 3−n → 0, ein Widerspruch.
32
(4) Wir benutzen das Diagonalverfahren von Cantor:
x1 = 0, k11 k12 k13 . . .
x2 = 0, k21 k22 k23 . . .
x3 = 0, k31 k32 k33 . . .
Setze kn := 0, falls knn = 2, und kn := 2, falls knn = 0. Aufgrund der Vollständigkeit ist
durch x := 0, k1 k2 . . . eine reelle Zahl definiert, die in der Aufzählung nicht vorkommt
(beachte die Eindeutigkeit der Zifferndarstellung mit 0 und 2).
(5) Sei x ∈ C, also x ∈ Cn für alle n ∈ N. Nach Lemma 5.8 (1) folgt 31 x ∈ Cn+1 sowie
1
2
1
2
1
3 + 3 x ∈ Cn+1 für alle n ∈ N. Aus Lemma 5.8 (ii) folgt weiter 3 x ∈ C sowie 3 + 3 x ∈ C.
2
1
1
Damit ist 3 C ∪ ( 3 + 3 C) ⊂ C bewiesen. Umgekehrt ist zu zeigen, dass jedes x ∈ C so
dargestellt werden kann:
x ∈ C ⇒ x ∈ Cn+1
(
x ≤ 13 :
Lemma 5.8 (i) ⇒
x ≥ 23
Lemma 5.8 (ii) ⇒ y ∈ C
∀n ∈ N
y := 3x ∈ Cn ∀n ∈ N
y := 3(x − 23 ) ∈ Cn ∀n ∈ N
und x = 31 y bzw. x =
2
3
+ 13 y.
(6) Wir können hier nur versuchen, einen Anhaltspunkt für die Behauptung zu geben. Bei
Streckungen des R3 mit Faktor α > 0 geht die Länge eine Objekts mit Faktor α1 ,
der Flächeninhalt mit α2 und der Rauminhalt mit α3 . Bei Verschiebungen bleiben
Länge, Fläche und Rauminhalt natürlich gleich. Angenommen, C ist d-dimensional
für ein d ∈ [0, ∞), und angenommen, wir könnten den d-dimensionalen Inhalt von C
definieren. Dann sollte für diesen d-dimensionalen Inhalt µd (C) unter Streckungen mit
Faktor α > 0 sowie unter Verschiebungen um x0 ∈ R gelten:
µd (α C) = αd µd (C),
µd (x0 + C) = µd (C).
Aus (5) würde dann folgen
1
2 1 C ∪ ( + C)
3
3 3
1
2 1
= µd ( C) + µd ( + C) (da Vereinigung disjunkt)
3
3 3
1 d
= 2 ( ) µd (C) (Streckung um 13 , Verschiebung um 23 ),
3
µd (C) = µd
bzw. nach Kürzen d = log3 2.
33
34
Kapitel 2
Funktionen und Stetigkeit
1
Polynome und komplexe Zahlen
Eine reellwertige Funktion auf einer Menge D ist eine Abbildung f : D → R. Die Menge D
heißt Definitionsbereich von f , die Menge f (D) Wertebereich oder Bild von f . Der Graph
von f ist die Menge
Graph (f ) = {(x, f (x)) : x ∈ D} ⊂ D × R.
Besonders für D ⊂ R ist der Graph sehr nützlich, um sich die Funktion f qualitativ vorzustellen. Es folgen jetzt einige Beispiele, mehr oder minder mathematischer Natur, von
reellwertigen Funktionen (zunächst auch alle mit D ⊂ R):
(1)
D = [0, ∞), t ∈ [0, ∞) Zeit
f (t) = Körpertemperatur einer Leiche zur Zeit t, nach Mord zur Zeit t = 0
f (0) = 37◦ C, f (t) = 10◦ C (Umgebungstemperatur) für t ≥ T.
t1 < t2 ≤ T ⇒ f (t1 ) > f (t2 ) (f |[0,T ] streng monoton fallend)
⇒ f |[0,T ] injektiv, also der Todeszeitpunkt eindeutig ermittelbar
Bild (f ) = [10, 37] (in Grad ◦ C).
(2)
DAX: D = [9, 18], t ∈ D Tageszeit
35
(3)
Massenformel von Einstein:
m(v) = √
(4)
(5)
(6)
(7)
(8)
m0
1−( vc )2
m0 Ruhemasse, c = 3 · 108 m/s (Lichtgeschwindigkeit)
D = [0, c) Definitionsbereich der Relativitätstheorie
Gaußklammerfunktion (Größte-Ganze-Funktion):
f : R → R, f (x) = [x] = max {n ∈ N : n ≤ x}.
Charakteristische
Funktion von M ⊂ R:
(
1 x∈M
f (x) =
0 sonst
Dirichletfunktion
(Spezialfall von (6) mit M = Q):
(
1 x∈Q
f (x) =
0 sonst
Affin-lineare Funktionen:
f : R → R, f (x) = ax + b
(a, b ∈ R)
Spezialfall: a = 0 ⇒ f (x) = b (konstante Funktion).
Quadratische Funktionen:
f : R → R, f (x) = ax2 + bx + c
quadratische Ergänzung
(i)
b2 − 4ac > 0
⇒
⇒
(a 6= 0)
f (x) = a x +
b 2
2a
−
b2 −4ac
4a2
b
zwei Nullstellen x± = − 2a
±
.
√
+
b2 −4ac
2a
f (x) = a(x − x+ )(x − x− ).
(ii)
b2 − 4ac = 0
⇒
b
.
eine Nullstelle x0 = − 2a
f (x) = a(x − x0 )2 .
(iii)
b2 − 4ac < 0
⇒
keine Nullstelle in R.
Allgemeiner sind Polynome eine grundlegende Klasse von Funktionen. Sie werden oft zur
Approximation anderer Funktionen eingesetzt, worauf wir später ausführlich eingehen werden.
Definition 1.1 Eine Funktion p : R → R heißt Polynom vom Grad n ∈ N0 , wenn es
a0 , a1 , . . . , an ∈ R mit an 6= 0 gibt, so dass gilt:
p(x) = a0 + a1 x + . . . + an xn
für alle x ∈ R.
(1.1)
Im untenstehenden Satz 1.1 wird gezeigt, dass der Grad n ∈ N0 und die Koeffizienten
a0 , a1 , . . . , an mit an 6= 0 durch (1.1) eindeutig bestimmt sind.
Lemma 1.1 (Abspaltung von Linearfaktoren) Sei p : R → R ein reelles Polynom vom
Grad n ∈ N mit Koeffizienten a0 , a1 , . . . , an , an 6= 0. Falls p(x0 ) = 0 für ein x0 ∈ R, so gibt
es ein Polynom q vom Grad n − 1 mit (n − 1)-tem Koeffizient gleich an , so dass gilt:
p(x) = (x − x0 ) q(x)
36
für alle x ∈ R.
(1.2)
Beweis: Mit dem Teleskopsummentrick folgt für x ∈ R
xk − xk0 = xk − xk−1 x0 + xk−1 x0 − . . . − xxk−1
+ xxk−1
− xk0
0
0
= (x − x0 )(xk−1 + xk−2 x0 + . . . + xk−1
0 ).
Daraus folgt weiter
p(x) = p(x) − p(x0 )
(da p(x0 ) = 0)
n
X
=
ak (xk − xk0 )
k=1
= (x − x0 )
n
X
ak (xk−1 + xk−2 x0 + . . . + x0k−1 ) .
|k=1
{z
}
=:q(x)
Der Koeffizient von xn−1 ist an nach Definition von q.
Lemma 1.2 (Nullstellenlemma) Sei p ein Polynom vom Grad n ∈ N0 . Dann hat p
höchstens n verschiedene Nullstellen.
Beweis: Induktion über n ∈ N0 .
n=0
⇒
p(x) ≡ a0 ist konstant, wobei a0 6= 0. Also hat p keine Nullstelle.
Sei nun p Polynom vom Grad n ≥ 1.
⇒
Fall 1:
p hat keine Nullstelle
Fall 2:
p(x0 ) = 0 für ein x0 ∈ R
⇒
Behauptung.
p(x) = (x − x0 ) q(x) ∀x ∈ R, grad q = n − 1 (Lemma 1.1)
q hat höchstens n − 1 Nullstellen (Induktionsannahme) ⇒
Behauptung.
Satz 1.1 (Koeffizientenvergleich) Seien p, q Polynome vom Grad n bzw. m, also
p(x) = a0 + a1 x + . . . + an xn , für alle x ∈ R, an 6= 0,
q(x) =
b0 + b1 x + . . . bm xm für alle x ∈ R,
bm 6= 0.
Es gelte p(xj ) = q(xj ) für paarweise verschiedene x1 , . . . , xk ∈ R, wobei k > max(n, m).
Dann folgt n = m und ai = bi für i = 0, . . . , n.
Beweis: Wäre n 6= m oder ai 6= bi für ein i, so wäre p − q Polynom vom Grad höchstens
max(n, m), hat aber k Nullstellen. Widerspruch zu Lemma 1.2.
Folgerung 1.1 Sei p reelles Polynom vom Grad n. Dann besitzt p eine eindeutig bestimmte
Darstellung
p(x) = (x − x1 )ν1 · . . . · (x − xr )νr q(x) ∀x ∈ R.
(1.3)
Dabei sind {x1 , . . . , xr } ⊂ R die Nullstellen von p (evtl. r = 0) und q ist Polynom vom Grad
n − (ν1 + . . . + νr ) ∈ {0, . . . , n} mit q(x) 6= 0 für alle x ∈ R. Die Zahlen νi ≥ 1 heißen
Vielfachheiten der Nullstellen.
37
Beweis: Die Existenz folgt induktiv aus Lemma 1.1. Sei p(x) = (x−x1 )µ1 ·. . .·(x−xr )µr h(x)
eine zweite solche Darstellung, o.B.d.A. ν1 ≥ µ1 . Indem wir durch (x − x1 )µ1 teilen, folgt für
x 6= x1
r
(x − x1 )ν1 −µ1 · (x − x2 )ν2 · . . . · (x − xr )ν · q(x) = (x − x2 )µ2 · . . . · (x − xr )µr · h(x).
Beide Seiten dieser Gleichung sind Polynome, haben nach Satz 1.1 also dieselben Koeffizienten. Deshalb stimmen sie auch in x = x1 überein, und es folgt ν1 = µ1 und analog νi = µi für
alle i ∈ {1, . . . , r}. Nach Division haben wir schließlich q(x) = h(x) für x ∈ R\{x1 , . . . , xr },
und Satz 1.1 liefert q = h.
Was machen wir mit Polynomen, die keine reellen Nullstellen haben, wie z. B. p(x) = x2 + 1?
Wir werden jetzt den Zahlbereich R erweitern, so dass die Gleichung x2 = −1 eine Lösung
hat:
N ⊂ Z ⊂ Q ⊂ R ⊂ C = komplexe Zahlen.
C := (R2 , +, · ) ist ein Körper. Dabei sind die Verknüpfungen wie folgt definiert:
(1) Die Addition ist die Vektoraddition in R2 :
R2 ist zweidimensionaler R-Vektorraum.
Fasse R als Teilmenge von R2 auf: R =
b R × {0} ⊂ R2 ,
Erhalte die Standardbasis {(1, 0) =: 1, (0, 1) =: i}.
⇒
x=
b (x, 0).
z = (x, y) = (1, 0)x + (0, 1)y = 1 · x + i · y = x + iy (Basisdarstellung von z)
Die Addition lautet also wie folgt:
(x1 + iy1 ) + (x2 + iy2 ) = (x1 , y1 ) + (x2 , y2 )
= (x1 + x2 , y1 + y2 )
= (x1 + x2 ) + i(y1 + y2 ).
(2) Die Multiplikation:
Forderung: i ist Lösung der Gleichung x2 = −1.
Seien z1 = x1 + iy1 , z2 = x2 + iy2 ∈ C. Aus den Körpergesetzen folgt dann
z1 z2 = (x1 + iy1 )(x2 + iy2 )
= x1 x2 + i2 y1 y2 + i(x1 y2 + y1 x2 )
z1 z2 = x1 x2 − y1 y2 + i(x1 y2 + y1 x2 )
z = x + iy ⇒ iz = −y + ix
Multiplikation mit i ist Drehung um 90◦ im entgegengesetzten Uhrzeigersinn.
Multiplikation mit α ∈ R ist Skalarmultiplikation im Vektorraum R:
αz = α(x + iy) = αx + iαy = (αx, αy) = α(x, y).
Eine weitere Struktur auf C ist die
38
(3) Konjugation: z 7→ z
Für z = x + iy setzen wir z = x − iy.
Die Konjugation ist die Spiegelung an der x-Achse.
z heißt die zu z konjugierte komplexe Zahl.
Lemma 1.3 Für die komplexe Konjugation gilt:
(i) z1 + z2 = z1 + z2 , z1 z2 = z1 z2 ,
(ii) z = z
⇔
z ∈ R,
(iii) Für z = x + iy haben wir
1
(Realteil),
x = (z + z) =: Re z ∈ R
2
1
y = (z − z) =: Im z ∈ R (Imaginärteil).
2i
Beweis:
(i) Wir zeigen die zweite Gleichung:
z1 z2 = (x1 − iy1 )(x2 − iy2 )
= x1 x2 − y1 y2 − i(x1 y2 + y1 x2 )
= z1 z2 .
(ii) x − iy = x + iy
⇔
y = 0.
(iii)
1
(z + z) =
2
1
(z − z) =
2i
1
(x + iy + x − iy) = x,
2
1
x + iy − (x − iy) = y.
2i
Als vierte Struktur der komplexen Zahlen besprechen wir nun den
(4) Zusammenhang mit der Euklidischen Struktur auf R2 :
Die Euklidische Norm und das Skalarprodukt auf R2 sind wie folgt definiert:
p
z = x + iy
⇒
|z| = + x2 + y 2 ,
z1 = x1 + iy1 , z2 = x2 + iy2
⇒
hz1 , z2 i = x1 x2 + y1 y2 .
Lemma 1.4 Für den Betrag einer komplexen Zahl gelten folgende Regeln:
(i) |z|2 = z z,
hz1 , z2 i = Re (z1 z2 ).
39
(ii) |z1 z2 | = |z1 ||z2 |.
(iii) |Re z| ≤ |z|, |Im (z)| ≤ |z|.
Beweis: Aussage (i) ergibt sich aus der Rechnung
Re (z1 z2 ) = Re (x1 + iy1 )(x2 − iy2 )
= Re x1 x2 + y1 y2 − i(x1 y2 − y1 x2 )
= x1 x2 + y1 y2
= hz1 , z2 i,
bzw.
z z = (x + iy)(x − iy) = x2 + y 2 = |z|2 .
Die Identität (ii) folgt aus (i) wegen
|z1 z2 |2 = (z1 z2 )(z1 z2 ) = z1 z1 z2 z2 = |z1 |2 |z2 |2 .
Die Ungleichungen (iii) sind klar.
Bemerkung. Aus Lemma 1.4(i) folgt für z = x + iy 6= 0
1
z
x − iy
=
= 2
.
z
zz
x + y2
(1.4)
Wir kehren jetzt zu den Polynomen zurück, und zwar betrachten wir jetzt komplexe Polynome. Analog zu Definition 1.1 sind dies Funktionen p : C −→ C, für die es Koeffizienten
a0 , a1 , . . . , an ∈ C gibt, so dass gilt:
p(z) = a0 + a1 z + . . . + an z n
für alle z ∈ C.
Die Abspaltung von Linearfaktoren (Lemma 1.1), das Nullstellenlemma (Lemma 1.2) und der
Koeffizientenvergleich (Satz 1.1) mitsamt der Folgerung 1.1 gelten für komplexe Polynome
ganz analog, denn zu ihrem Beweis wurden ausschließlich die Körperaxiome (und nicht zum
Beispiel die Anordnung) benutzt. Der Grad eines komplexen Polynoms, seine Koeffizienten
und die Vielfachheit der Nullstellen sind also wohldefiniert.
Es ist nicht schwer zu sehen, dass jedes quadratische Polynom in C eine Nullstelle hat
(Übungsaufgabe). Tatsächlich ist viel mehr wahr:
Satz 1.2 (Fundamentalsatz der Algebra, Gauß 1799) Jedes komplexe Polynom vom
Grad n ≥ 1 hat mindestens eine Nullstelle z0 ∈ C.
Diesen Satz werden wir in Analysis II beweisen. Als Konsequenz ergibt sich
Folgerung 1.2 Sei p ein komplexes Polynom vom Grad n mit Koeffizienten a0 , a1 , . . . , an ∈
C. Dann besitzt p eine eindeutige Darstellung
p(z) = an (z − z1 )ν1 · . . . · (z − zk )νk
∀z ∈ C.
(1.5)
Dabei sind z1 , . . . , zk ∈ C die Nullstellen von p, und die νi ≥ 1 sind die Vielfachheiten dieser
Nullstellen mit ν1 + . . . + νk = n.
40
Beweis: Wie oben festgestellt, gilt die Darstellung (1.3) auch über C, und das Restpolynom
q in (1.3) hat dann keine Nullstelle in C. Nach Satz 1.2 muss q den Grad Null haben, das
heißt q(z) = an für alle z ∈ C.
Was bedeuten diese Überlegungen für reelle Polynome? Da R ⊂ C, können wir jedes reelle
Polynom p : R → R auch als komplexes Polynom auffassen: wir setzen statt x ∈ R komplexe
Zahlen z ∈ C ein. Auf diese Weise wird die reelle Funktion p : R → R zu einer komplexen
Funktion p : C → C fortgesetzt.
Lemma 1.5 Sei p(x) = a0 + a1 x + . . . + an xn mit a0 , a1 , . . . , an ∈ R ein reelles Polynom vom
Grad n. Dann besitzt p, aufgefasst als komplexes Polynom, eine Faktorisierung der Form
p(z) = an
r
k
Y
Y
(z − xi )νi
(z − zj )µj (z − zj )µj
i=1
für alle z ∈ C.
j=1
Dabei sind {x1 , . . . , xr } ⊂ R die reellen Nullstellen von p mit Vielfachheit νi ≥ 1, und
{z1 , z1 , . . . , zk , zk } ⊂ C\R die nichtreellen Nullstellen von p. Diese treten also in Paaren
von konjugiert komplexen Zahlen zj , zj gleicher Vielfachheit µj auf. Es gilt ν1 + . . . + νr +
2 (µ1 + . . . + µk ) = n.
Beweis: Es gilt für z ∈ C, da ai ∈ R, wegen Lemma 1.3 (i)
p(z) = a0 + a1 z + . . . + an z n = a0 + a1 z + . . . + an z n = p(z).
Insbesondere folgt p(z) = 0 ⇒ p(z) = 0. Ist daher z1 ∈ C\R eine nichtreelle Nullstelle,
so erhalten wir nach Lemma 1.1 die Darstellung
p(z) = (z − z1 )(z − z1 ) q(z) = (z 2 − 2(Re z1 )z + |z1 |2 ) q(z),
(1.6)
mit einem Polynom q vom Grad n − 2. Beachten Sie, dass wir Lemma 1.1 hier über
C anwenden, das heißt die Koeffizienten des Polynoms q sind zunächst komplexe Zahlen
b0 , b1 , . . . , bn−2 ∈ C. Um zu sehen, dass die bi doch reell sind, setzen wir z := x ∈ R in (1.6)
ein und bilden die Imaginärteile beider Seiten:
0 = Im p(x)

(da p reelle Koeffizienten hat)

= Im (x2 − 2(Re z1 )x + |z1 |2 ) q(x)
|
{z
}
∈R
= (x2 − 2(Re z1 )x + |z1 |2 ) Im q(x)
n−2
X
= (x2 − 2(Re z1 )x + |z1 |2 )
(Im bi )xi .
i=0
Da der linke Faktor in der letzten Zeile für x ∈ R niemals Null ist, folgt
n−2
X
(Im bi )xi = 0
für alle x ∈ R.
i=0
Nach Satz 1.1 muss Im bi = 0 für alle i = 0, 1, . . . , n−2 gelten, das heißt bi ∈ R. Das Polynom
q ist also wieder ein reelles Polynom, und durch Induktion erhalten wir die gewünschte
Darstellung.
41
Folgerung 1.3 Jedes Polynom p(x) = a0 + a1 x + . . . + an xn mit a0 , a1 , . . . , an ∈ R zerfällt
über R in lineare und quadratische Faktoren. Genauer gilt
p(x) = an
r
k
Y
Y
(x − xi )νi
(x2 − 2(Re zj )x + |zj |2 )µj
i=1
für alle x ∈ R,
(1.7)
j=1
wobei die xi ∈ R die reellen und die zj , zj ⊂ C\R die nichtreellen Nullstellen von p sind.
2
Stetige Funktionen
Definition 2.1 (Stetigkeit) Sei x0 ∈ D ⊂ R (bzw. x0 ∈ D ⊂ Rm ). Die Funktion f : D →
R (bzw. f : D → Rn ) heißt stetig im Punkt x0 , falls es zu jedem ε > 0 ein δ > 0 gibt, so dass
für x ∈ D gilt:
|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε.
(2.1)
Wir wollen einige Beispiele betrachten.
Beispiel 2.1 Konstante Funktionen: f (x) = c für alle x ∈ D.
Es gilt |f (x) − f (x0 )| = 0 für alle x ∈ D. Zu ε > 0 können wir also jedes δ > 0 wählen.
Beispiel 2.2 Identische Funktion: f (x) = x für alle x ∈ D ⊂ Rn .
Zu ε > 0 wähle δ := ε > 0 und erhalte
|x − x0 | < δ
⇒
|f (x) − f (x0 )| = |x − x0 | < δ = ε.
Beispiel 2.3 Betragsfunktion: f (x) = |x| für x ∈ R.
Zu ε > 0 wähle δ := ε > 0 und schließe mit der Dreiecksungleichung
|x − x0 | < δ
⇒
|f (x) − f (x0 )| = ||x| − |x0 || ≤ |x − x0 | < δ = ε.
Analog : Die Euklidische Norm | · | : Rm → R ist eine stetige Funktion auf Rm .
Beispiel 2.4 Gaußklammerfunktion: f (x) = [x] = max{k ∈ Z : k ≤ x}.
Wir betrachten zwei verschiedene Definitionsbereiche:
• D = [1, ∞)
⇒
f ist stetig in x0 = 1.
Zu ε > 0 wähle zum Beispiel δ =
|x − 1| < δ, x ∈ D
• D = [0, 1]
⇒
⇒
1
2
und schließe
3
x ∈ [1, )
2
⇒
|f (x) − f (1)| = |[x] − [1]| = 0.
f ist nicht stetig in x0 = 1.
Angenommen es gibt zu ε = 1 ein δ > 0 wie gefordert. Wähle dann x ∈ (1 − δ, 1) mit
x ≥ 0, und erhalte den Widerspruch
1 = ε > |f (x) − f (1)| = |[x] − [1]| = 1.
42
Fazit: Bei der Stetigkeit kommt es auch darauf an, welcher Definitionsbereich gewählt wird.
Beispiel 2.5 Die n-te Wurzel f : [0, ∞) → R, f (x) =
√
n
x ≥ 0, ist stetig in allen x0 ∈ [0, ∞).
Sei ε > 0 gegeben. Wir unterscheiden zwei Fälle:
Fall 1 x0 = 0.
Wähle δ = εn > 0. Für |x − x0 | = x < δ folgt |f (x) − f (x0 )| =
√
n
x < ε.
Fall 2 x0 > 0.
√
√
Setze n x0 = y0 ≥ 0 und n x = y ≥ 0. Dann gilt
x − x0 = y n − y0n
= (y n−1 + y n−2 y0 + . . . + y y0n−2 + y0n−1 )(y − y0 ).
⇒ |x − x0 | ≥ y0n−1 |y − y0 |.
Wähle nun δ = y0n−1 ε > 0. Für |x − x0 | < δ folgt
|f (x) − f (x0 )| = |y − y0 | ≤ y01−n |x − x0 | < y01−n δ = ε.
Definition 2.2 Sei D ⊂ Rm . Die Abbildung f : D → Rn heißt Lipschitzstetig mit Konstante
L ≥ 0, falls gilt:
|f (x) − f (y)| ≤ L|x − y| für alle x, y ∈ D.
Beispiel 2.6 Lipschitzstetig
⇒
stetig:
Die Lipschitzkonstante von f : D → Rn sei L ≥ 0, o.B.d.A. L > 0. Zu ε > 0 wähle
δ = ε/L > 0 und erhalte
|f (x) − f (x0 )| ≤ L|x − x0 | < L δ = ε
für |x − x0 | < δ.
Beispiel 2.7 Lineare Abbildungen A : Rm → Rn .
Sei A : Rm → Rn linear. Bezüglich der Standardbasen {e1 , . . . , em } des Rm und {e1 , . . . , en }
des Rn besitzt A eine Matrixdarstellung A = (Aij )1≤i≤n,1≤j≤m , das heißt die Bilder A(ej )
der Basisvektoren ej des Rm besitzen bzgl. der Vektoren ei im Rn die Koordinaten Aij :
A(ej ) =
n
X
Aij ei
für j = 1, . . . , m.
i=1
Definition 2.3 Die Euklidische Norm der linearen Abbildung A : Rm → Rn ist

|A| = 
m
X
j=1
1/2
|Aej |2 

=
43
n X
m
X
i=1 j=1
1/2
A2ij 
.
Es gilt nun für jedes x ∈ Rm
|A(x)| = |A(x1 e1 + . . . + xm em )|
= |x1 A(e1 ) + . . . + xm A(em )|
≤
=
≤
(da A linear)
|x1 | |A(e1 )| + . . . + |xm | |A(em )|
1
(|x |, . . . , |xm |), (|A(e1 )|, . . . , |A(em )|)
(|A(e1 )|2 + . . . + |A(em )|2 )1/2 (|x1 |2 + . . .
(Normeigenschaften)
(Definition von h·, ·i auf Rm )
+ |xm |2 )1/2
(Cauchy-Schwarz).
Damit haben wir gezeigt:
|A(x)| ≤ |A| |x| für alle A ∈ Hom(Rm , Rn ), x ∈ Rm .
(2.2)
Insbesondere folgt für x, y ∈ Rm
|A(x) − A(y)| = |A(x − y)| ≤ |A| |x − y|,
d. h. A ist Lipschitzstetig mit Konstante |A|.
Um nicht den Überblick zu verlieren, konzentrieren wir uns im folgenden auf relle Funktionen
einer Variablen, also m = n = 1. Die meisten Aussagen haben aber offensichtliche Verallgemeinerungen für Funktionen mehrerer Variabler (m ≥ 2) und/oder vektorwertige Funktionen
(n > 1).
Satz 2.1 (Definition der Stetigkeit mittels Folgen) Sei f : D ⊂ R und x0 ∈ D. Dann
sind folgende Aussagen äquivalent:
(1) f ist stetig in x0 ∈ D.
(2) Für jede Folge (xn )n∈N mit xn ∈ D und limn→∞ xn = x0 gilt: limn→∞ f (xn ) = f (x0 ).
Beweis:
(1)⇒(2): Sei xn ∈ D mit limn→∞ = x0 , sowie ε > 0.
f stetig in x0
⇒
∃δ > 0 :
|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε
limn→∞ xn = x0
⇒
∃N ∈ R :
n > N ⇒ |xn − x0 | < δ
⇒
n > N ⇒ |f (xn ) − f (x0 )| < ε.
(2)⇒(1): Angenommen, f ist nicht stetig in x0 :
∃ ε > 0: für alle n ∈ N gibt es xn ∈ D mit |xn − x0 | < n1 , aber |f (xn ) − f (x0 )| ≥ ε. Daraus
folgt limn→∞ xn = x0 , aber f (xn ) konvergiert nicht gegen f (x0 ), ein Widerspruch.
Satz 2.2 (Stetigkeitsregeln) Sei x0 ∈ D ⊂ R und f, g : D → R seien stetig in x0 . Dann
gelten folgende Aussagen:
(1) αf + βg ist stetig in x0 , für beliebige α, β ∈ R.
(2) f g ist stetig in x0 .
44
(3)
f
g
: D0 = D\{x : g(x) = 0} → R ist stetig in x0 , falls g(x0 ) 6= 0.
Beweis: Die Funktionen sind punktweise definiert, das heißt für alle x ∈ D gilt
f
f (x)
(αf + βg)(x) := αf (x) + βg(x), (f g)(x) = f (x)g(x) und ( )(x) =
.
g
g(x)
Wir führen die Aussagen auf die entsprechenden Aussagen für Folgen zurück: Sei (xn )n∈N
eine beliebige Folge mit xn ∈ D und limn→∞ xn = x0 . Nach Satz 2.1 folgt f (xn ) → f (x0 )
und g(xn ) → g(x0 ) mit n → ∞. Aus Kapitel I, Satz 3.3 folgt
αf (xn ) + βg(xn ) → αf (x0 ) + βg(x0 ), f (xn )g(xn ) → f (x0 )g(x0 ),
sowie im Fall g(x0 ) 6= 0
f (xn )
f (x0 )
→
.
g(xn )
g(x0 )
Aus Satz 2.1 folgt nun die Behauptung.
Die Aussage in Satz 2.2 (iii) ist nur dann wirklich sinnvoll, wenn x0 ein Häufungspunkt von
D0 = D\{x : g(x) = 0} ist. Dazu tragen wir folgendes nach:
Lemma 2.1 Sei g : D → R mit g(x0 ) 6= 0. Ist g stetig in x0 , so gibt es ein ε > 0 und ein
δ > 0 mit |g(x)| ≥ ε für alle x ∈ D ∩ Uδ (x0 ).
Beweis: Wähle ε := |g(x0 )|/2 > 0. Aufgrund der Stetigkeit gibt es dann ein δ > 0 mit
|g(x) − g(x0 )| < ε für alle x ∈ D ∩ Uδ (x0 ). Es folgt für diese x
|g(x)| = |g(x0 ) − (g(x0 ) − g(x))| ≥ |g(x0 )| − |g(x) − g(x0 )| ≥ 2ε − ε = ε.
Definition 2.4 Die Funktion f : D → R heißt stetig auf D, wenn sie in allen Punkten
x0 ∈ D stetig ist. Wir setzen
C 0 (D) = {f : D → R : f ist stetig auf D}.
(2.3)
Nach Satz 2.2 (1) ist C 0 (D) ein R-Vektorraum.
Satz 2.3 (Verkettung stetiger Funktionen) Für D, E ⊂ R betrachten wir die Verketf
g
tung g ◦ f : D −→ E −→ R, wobei f (D) ⊂ E. Ist f stetig in x0 ⊂ D, g stetig in
y0 = f (x0 ) ∈ E, so ist g ◦ f : D → R stetig in x0 .
Beweis: Sei xn ∈ D eine beliebige Folge mit limn→∞ xn = x0 . Dann schließen wir
Satz2.2 ⇒ f (xn ) → f (x0 )mit n → ∞,
Satz2.2 ⇒ g f (xn ) → g f (x0 ) mit n → ∞,
Satz2.2 ⇒ Behauptung.
45
Beispiel 2.8 Seien f, g : D → R stetig. Dann ist auch |f | : D → R stetig, und ebenso die
Funktionen max(f, g) = 21 (f + g + |f − g|) : D → R sowie min(f, g) = 12 (f + g − |f − g|) :
D → R.
Definition 2.5 (Grenzwert für Funktionen) Sei x0 ∈ D Häufungspunkt von D. Die
Funktion f : D → R konvergiert für x → x0 gegen a ∈ R, falls gilt:
∀ε > 0 ∃ δ > 0 : |x − x0 | < δ, x ∈ D\{x0 }
⇒
|f (x) − a| < ε.
Notation: limx→x0 f (x) = a oder f (x) → a für x → x0 .
Beispiel 2.9 f : R\{1} → R, f (x) =
x2 −1
x−1 .
Dann gilt limx→1 f (x) = limx→1 (x + 1) = 2.
Für die Existenz und den Wert von limx→x0 f (x) ist es egal, ob die Funktion in x0 definiert ist
bzw. welchen Funktionswert sie dort hat. Die Beziehung zwischen Grenzwert und Stetigkeit
ist wie folgt:
Lemma 2.2 (Stetigkeit und Grenzwert) Sei x0 ∈ R ein Häufungspunkt von D. Für die
Funktion f : D ∪ {x0 } → R sind folgende Aussagen äquivalent:
(1) limx→x0 f (x) = f (x0 ).
(2) f ist stetig in x0 .
Beweis: Die Voraussetzung (1) bedeutet
∀ ε > 0 ∃ δ > 0 : |x − x0 | < δ, x ∈ D\{x0 }
⇒
|f (x) − f (x0 )| < ε.
⇒
|f (x) − f (x0 )| < ε.
Dagegen besagt (2)
∀ ε > 0 ∃ δ > 0 : |x − x0 | < δ, x ∈ D ∪ {x0 }
Die Aussagen sind offensichlich äquivalent.
Wie bei der Stetigkeit spielt auch beim Grenzwert der zugrundeliegende Definitionsbereich
eine Rolle. Wir schreiben limx→x0 ,x∈D f (x), wenn wir den gewählten Definitionsbereich hervorheben möchten. Zum Beispiel werden oft einseitige Grenzwerte gebraucht:
lim f (x) =
x&x0
So ist etwa limx&0
x
|x|
= 1,
lim
x→x0 ,x>x0
aber
f (x) und
limx%0
x
|x|
lim f (x) =
x%x0
lim
x→x0 ,x<x0
f (x).
= −1.
Definition 2.6 (Grenzwert bei ±∞) Sei f : (r, ∞) → R für ein r ∈ R. Dann setzen wir
lim f (x) = a ∈ R
x→+∞
⇔
∀ε > 0 ∃ R ∈ R mit |f (x) − a| < ε für alle x > R.
Analog für f : (−∞, a) → R und limx→−∞ f (x) = a.
Definition 2.7 (Uneigentlicher Grenzwert) Sei f : D → R und x0 ∈ R Dann setzen wir
lim f (x) = +∞
x→x0
⇔
∀K > 0 ∃ δ > 0 mit f (x) > K für alle x ∈ D\{x0 } mit |x − x0 | < δ.
Entsprechend wird limx→x0 f (x) = −∞ erklärt.
46
Beispiel 2.10 (Rationale Funktionen)
Seien p, q Polynome vom Grad m bzw. n:
p(x) = a0 + a1 x + . . . + am xm (ai ∈ R, am 6= 0)
q(x) = b0 + b1 x + . . . + bn xn
(bj ∈ R, bn 6= 0)
Setze N = {x ∈ R : q(x) = 0} und definiere
f : R\N −→ R,
f (x) =
p(x)
.
q(x)
Wann hat f eine stetige Fortsetzung bei x0 ∈ N ? Dazu sei x0 eine µ-fache Nullstelle von p,
evtl. µ = 0 falls p(x0 ) 6= 0, und eine ν-fache Nullstelle von q mit ν ≥ 1. Also gilt
p(x) = (x − x0 )µ pe(x) mit
q(x) = (x − x0 )ν qe(x) mit
Es folgt
und wir erhalten
pe(x0 ) 6= 0,
qe(x0 ) 6= 0.
p(x)
pe(x)
= (x − x0 )µ−ν
für x ∈ R\N,
q(x)
qe(x)
µ > ν ⇒ limx→x0 f (x) = 0,
(x0 )
µ = ν ⇒ limx→x0 f (x) = pqee(x
6= 0
0)
sowie
Im Fall µ < ν hat f in x0 eine Polstelle. Sei zum Beispiel pe(x0 )/e
q (x0 ) > 0. Dann ergibt sich
für limx→x0 f (x)
ν − µ gerade
ν − µ ungerade
x & x0
+∞
+∞
x % x0
+∞
−∞
Um das Verhalten des Polynoms für x → +∞ zu untersuchen, ist es günstig, x = 1/y zu
substituieren und den Grenzwert für y & 0 zu bestimmen, und zwar gilt
lim f (x) = a
x→+∞
⇔
1
lim f ( ) = a.
y
y&0
Wir berechnen
1
a0 + a1 y −1 + . . . + am y −m
a0 y m + a1 y m−1 + . . . + am
f( ) =
= y n−m
.
−n
−1
y
b0 + b1 y + . . . + bn y
b0 y n + b1 y n−1 + . . . + bn
Es folgt
m < n ⇒ limx→+∞ f (x) = 0,
m
m = n ⇒ limx→+∞ f (x) = abm
6= 0,
= ±1.
m > n ⇒ limx→+∞ f (x) = ±∞
falls sign abm
n
Satz 2.4 (Rechenregeln für Grenzwerte) Für den Grenzwert von Funktionen gelten folgende Regeln (auf einen Beweis wird verzichtet).
47
(1) Es gelte f (x) → a und g(x) → b für x → x0 ∈ R ∪ {±∞}. Dann folgt für λ, µ ∈ R
λf (x) + µg(x) → λa + µb für x → x0 ,
f (x) g(x) → ab
für x → x0 ,
f (x)/g(x) → a/b
für x → x0 , falls b 6= 0.
f
g
(2) Betrachte g ◦ f : D −→ E −→ R, wobei f (D) ⊂ E. Gilt f (x) → a mit x → x0 und ist
g stetig in a, so folgt (g ◦ f )(x) → g(f (a)) mit x → x0 .
(3) Falls f (x) → a, g(x) → b für x → x0 und f ≤ g auf Uδ (x0 )\{x0 }, so folgt a ≤ b.
(4) Ist f > 0 auf D, so gilt: limx→x0 f (x) = 0 ⇔ limx→x0
3
1
f (x)
= +∞.
Zwischenwertsatz und Umkehrfunktionen
Satz 3.1 (Zwischenwertsatz) Sei f : [a, b] → R stetig. Dann nimmt f jeden Wert zwischen f (a) und f (b) an.
Beweis: Sei oBdA f (a) < f (b). Zu y ∈ f (a), f (b) konstruieren wir die gesuchte Lösung
x ∈ [a, b] der Gleichung f (x) = y mittels Intervallhalbierung. Wir setzen dazu I0 = [a, b] und
bestimmen induktiv Ik = [ak , bk ] mit |Ik | = 21−k |I0 | und f (ak ) ≤ y ≤ f (bk ) für alle k. Ist Ik
schon gefunden für ein k ≥ 0 und mk = 12 (ak + bk ), so setzen wir
Es gibt genau ein x ∈
4.5) folgt, da f stetig,
T∞
f (mk ) ≥ y
⇒
Ik+1 := [ak , mk ]
f (mk ) < y
⇒
Ik+1 := [mk , bk ].
k=0 Ik ,
und wegen x = limk→∞ ak = limk→∞ bk (vgl. Kap. I, Satz
f (x) = lim f (ak ) ≤ y ≤ lim f (bk ) = f (x).
k→∞
k→∞
Folgerung 3.1 Sei I ⊂ R ein Intervall und f : I → R stetig. Dann ist f (I) ein Intervall
mit Endpunkten α = inf x∈I f (x) und β = supx∈I f (x).
Bemerkung. Unendliche Intervallgrenzen sind hier zulässig.
Beweis: Zu y ∈ (α, β) gibt es x1 , x2 ∈ I mit f (x1 ) < y < f (x2 ). Dann gibt es nach Satz 3.1
ein x ∈ [x1 , x2 ] (bzw. x ∈ [x2 , x1 ]) mit f (x) = y. Es folgt (α, β) ⊂ f (I) ⊂ [α, β].
Jede streng monotone Funktion f : I → R ist injektiv und hat damit eine Umkehrfunktion
g : f (I) → R. Ein Beispiel ist die Potenzfunktion; wir sehen, dass der Graph von f und der
Graph der Umkehrfunktion f −1 = g durch Spiegelung an der Winkelhalbierenden des ersten
Quadranten auseinander hervorgehen.
48
Zum nächsten Lemma vgl. das entsprechende Resultat für Folgen, Satz 4.3 in Kapitel 1.
Lemma 3.1 (Einseitige Grenzwerte monotoner Funktionen) Sei D ⊂ R und f :
D → R sei monoton wachsend. Für x0 ∈ R gebe es eine Folge xn ∈ D mit xn & x0 (bzw.
xn % x0 ). Dann existiert der Grenzwert limx&x0 f (x) (bzw. limx% f (x)) im eigentlichen
oder uneigentlichen Sinn.
Beweis: Es gilt für jede Folge xn & x0 , xn ∈ D,
inf{f (x) : x > x0 } ≤ lim inf f (xn )
n→∞
(da xn > x0 )
≤ lim sup f (xn )
n→∞
≤ f (x0 ),
falls x0 > x0
(da xn < x0 für n hinreichend groß).
Wir bilden das Infimum über alle x0 > x0 und erhalten Gleichheit in der obigen Abschätzung,
also gilt (siehe Übungsaufgabe 3, Serie 6)
lim f (x) = inf{f (x) : x > x0 } und analog lim f (x) = sup{f (x) : x < x0 }.
x&x0
x%x0
(3.1)
Satz 3.2 (Monotonie und Umkehrfunktion) Sei I ⊂ R ein Intervall mit Endpunkten
a < b, und sei f : I → R streng monoton wachsend und stetig. Dann gilt:
(1) Die Umkehrfunktion g : f (I) → R ist ebenfalls streng monoton wachsend und stetig.
(2) I ∗ := f (I) ist ein Intervall mit Endpunkten α := limx&a f (x) < limx%b f (x) =: β.
(3) limy&α g(y) = a und limy%β g(y) = b.
Beweis: Seien y1 , y2 ∈ f (I) mit y1 < y2 . Wäre g(y1 ) ≥ g(y2 ), so folgt aus der Monotonie
von f
y1 = f g(y1 ) ≥ f g(y2 ) = y2 ,
im Widerspruch zur Annahme. Also ist g streng monoton wachsend.
Für y0 = f (x0 ) gilt somit {y : y ∈ f (I), y > y0 } = {f (x) : x ∈ I, x > x0 } und wir erhalten
x0 = g(y0 )
≤
lim g(y)
y&y0
(da g monoton wachsend)
= inf{g(y) : y ∈ f (I), y > y0 } (nach (3.1))
= inf{g f (x) : x ∈ I, x > x0 } = x0 .
| {z }
=x
Entsprechend wird die linksseitige Stetigkeit und damit die Stetigkeit von g in y0 gezeigt.
Nach Folgerung 3.1 ist I ∗ = f (I) ein Intervall mit linkem Randpunkt
inf f (x) =
x≥a
=
inf f (x)
x>a
lim f (x)
x&a
(da f stetig in a, falls a ∈ I)
(nach (3.1)).
49
Genauso ergibt sich, dass β = limx%b f (x) der rechte Endpunkt von I ∗ ist. Die Aussage (3)
folgt aus (1) und (2), angewandt auf die Umkehrfunktion g statt f .
Ergänzung: In der Situation des Satzes gilt genauer
a ∈ I ⇔ α ∈ I∗
b ∈ I ⇔ β ∈ I ∗.
und
(3.2)
Denn aus a ∈ I folgt α = limx&a f (x) = f (a) ∈ f (I), da f stetig in a. Andererseits gilt
f (x) > α für x > a, denn wäre f (x) = α für ein x > a, so wäre f (ξ) < α für ξ ∈ (a, x), ein
Widerspruch. Aus α ∈ I ∗ = f (I) folgt deshalb schon α = f (a), insbesondere a ∈ I.
Wir wollen den Satz nun auf die Exponentialfunktion anwenden. Zur Erinnerung:
exp : R → R, exp(x) = lim (1 +
n→∞
x n
) .
n
In Kapitel 1, Satz 4.4 hatten wir die Existenz des Grenzwerts bewiesen. Von dort ist außerdem
Folgendes schon bekannt:
n > −x
⇒
(1 +
x n+1
x
)
≥ (1 + )n
n+1
n
exp(x) exp(−x) = 1
(Kapitel 1, (4.3)),
(Kapitel 1, (4.4)).
Lemma 3.2 Es gelten folgende Aussagen:
(1) exp(x) > 0, exp(0) = 1.
(2) exp(x) ≥ 1 + x für alle x ∈ R, exp(x) ≤
(3) limn→∞ xn = x
⇒
limn→∞ (1 +
xn n
n )
1
1−x
für x < 1.
= exp(x).
Beweis: exp(x) ≥ 1 für x ≥ 0 und exp(0) = 1 gelten nach Definition. Mit Kap. 1, (4.4) folgt
für x < 0 dann exp(x) = 1/ exp(−x) ∈ (0, 1], und (1) ist gezeigt. Die Bernoulli-Ungleichung
(Kap. I, Satz 2.3) liefert
(1 +
x
x n
) ≥1+n =1+x
n
n
(für n > −x),
also exp(x) = limn→∞ (1 + nx )n ≥ 1 + x. Wieder mit Kap. 1, (4.4) erhalten wir weiter
exp(x) =
1
1
≤
exp(−x)
1−x
für x < 1.
Wir zeigen (3) zuerst im Fall limn→∞ xn = 0, und zwar gilt, wobei oBdA −1 < xn < 1,
xn n
)
(Bernoulli)
n
xn k
≤ lim (1 +
) (nach Kap. I, (4.3))
k→∞
k
= exp(xn ) (Definition von exp)
1
≤
(nach (2)).
1 − xn
1 + xn ≤ (1 +
50
Mit n → ∞ folgt limn→∞ (1 + xnn )n = 1 = exp(0). Für limn→∞ xn = x ∈ R berechnen wir
schließlich, indem wir den schon bewiesenen Fall x = 0 anwenden,
(1 + xnn )n
=
(1 + nx )n
1+
+ xnn −
1 + nx
x
n
also
lim (1 +
n→∞
x n
n
=
xn − x
1+
n(1 + nx )
n
−→ 1,
xn n
x
) = lim (1 + )n = exp(x).
n→∞
n
n
Satz 3.3 (Eigenschaften der Exponentialfunktion) Sei exp die in Kapitel 1, Satz 4.4
definierte Exponentialfunktion.
(1) Es gilt die Funktionalgleichung
exp(x + y) = exp(x) exp(y)
für alle x, y ∈ R.
(2) exp : (−∞, ∞) → (0, ∞) ist streng monoton wachsend, stetig und bijektiv. Es gilt
exp(x) → +∞ mit x → +∞ und exp(x) → 0 mit x → −∞.
Bemerkung. In der Sprache der Algebra bedeutet der Satz insbesondere:
exp : (R, +) → (R+ , · )
ist ein Gruppenisomorphismus.
Beweis: Die Funktionalgleichung folgt aus Lemma 3.2 (3):
y
x
lim (1 + )n lim (1 + )n
n→∞
n→∞
n
n
x + y + xy/n n
= lim 1 +
n→∞
n
= exp(x + y).
exp(y) exp(y) =
Fr x1 < x2 ist nach Lemma 3.2 (1) und (2)
exp(x2 ) = exp(x2 − x1 ) exp(x1 ) > exp(x1 ).
|
{z
} | {z }
≥1+x2 −x1 >1
>0
Die Stetigkeit von exp in x0 = 0 folgt direkt aus Lemma 3.2 (2), und für beliebiges x0 ∈ R
verwenden wir wieder die Funktionalgleichung
exp(x) = exp(x − x0 ) exp(x0 ) → exp(x0 )
|
{z
}
mit x → x0 .
→1
Der Grenzwert limx→+∞ exp(x) = +∞ folgt direkt aus Lemma 3.2 (2), und
limx→−∞ exp(x) = 0 ergibt sich dann aus Kapitel 1, (4.4). Die behauptete Surjektivität
folgt somit aus dem Zwischenwertsatz bzw. aus Folgerung 3.1.
51
Folgerung 3.2 (Definition des Logarithmus) Die Funktion exp : (−∞, ∞) → (0, ∞)
hat eine streng monoton wachsende, stetige und bijektive Umkehrfunktion log : (0, ∞) →
(−∞, ∞), y 7→ log(y), den (natürlichen) Logarithmus. Nach Definition haben wir also
log(exp(x)) = x
∀ x ∈ (−∞, ∞),
exp(log(y)) = y
∀ y ∈ (0, ∞).
Es gilt log(1) = 0, und log erfüllt die Funktionalgleichung
log(y1 y2 ) = log(y1 ) + log(y2 )
∀ y1 , y2 > 0.
Außerdem ist limy&0 log(y) = −∞ und limy→∞ log(y) = +∞.
Beweis: Die Existenz, Monotonie und Stetigkeit der Umkehrfunktion folgen aus Satz 3.2
und Satz 3.3, ebenso die behaupteten Grenzwerte. Die Funktionalgleichung für log ergibt
sich aus der Funktionalgleichung für exp durch Einsetzen von x1 = log(y1 ) und x2 = log(y2 ):
log(y1 y2 ) = log (exp(x1 ) exp(x2 )) = log (exp(x1 + x2 )) = log(y1 ) + log(y2 ).
Lemma 3.3 Für a > 0 und r ∈ Q gilt
ar = exp (r log(a)) .
(3.3)
Beweis: Wir behaupten zunächst
exp(p x) = exp(x)p
für p ∈ Z, x ∈ R.
Für p = 0 gilt das per Definition. Für p ∈ N folgt aus der Funktionalgleichung per Induktion
exp(px) = exp ((p − 1)x) exp(x) = exp(x)p−1 exp(x) = exp(x)p .
Schließlich erhalten wir mit Kap. 1, Gleichung (4.4)
exp(px) =
1
1
=
= exp(x)p .
exp(−px)
exp(x)−p
Sei nun r = p/q mit p ∈ Z, q ∈ N. Wir wählen oben x = log(a) und erhalten
exp (r log(a))q = exp (q · r log(a))
= exp (p log(a))
= exp (log(a))p
= ap .
Nun ist nach Definition ap/q die eindeutig bestimmte Lösung y > 0 der Gleichung y q = ap ,
vgl. Übungsaufgabe 1, Serie 4. Die Behauptung folgt.
Definition 3.1 (Potenz mit rellen Exponenten) Für a > 0, x ∈ R definieren wir ax =
exp (x log(a)) .
52
Diese Definition ist nach Lemma 3.3 konsistent mit der auf Q bereits in Übungsaufgabe 1,
Serie 4 definierten Funktion r 7→ ar , r ∈ Q. Umgekehrt besitzt nach Übungsaufgabe 1, Serie
9 die auf der dichten Menge Q in Übungsaufgabe 1, Serie 4 erklärte Funktion höchstens eine
Fortsetzung, die auf ganz R definiert und stetig ist. Genau dies leistet die Funktion
expa : R → R, expa (x) = ax .
Die Regeln der Potenzrechnung (mit a, b > 0)
ax ay = ax+y (ax )y = ax y
x
1
= a−x ax bx = (ab)x
a
ergeben sich leicht aus den Definitionen und den Funktionalgleichungen von exp bzw. log.
Weiter lassen sich nun auch die Potenzfunktionen für beliebige reelle Exponenten erklären:
f : (0, ∞) → R, f (x) = xα = exp (α log(x)) .
Folgerung 3.3 (Charakterisierung von exp durch die Funktionalgleichung) Die
Funktion f : R → R habe folgenden beiden Eigenschaften:
(1) f (x + y) = f (x) f (y)
(2) limx→0 f (x) = f (0)
für alle x, y ∈ R,
(Stetigkeit bei x0 = 0).
Dann ist entweder a := f (1) > 0 und f (x) = ax für alle x, oder f ist identisch Null.
2
Beweis: Es ist f (1) = f 12 ≥ 0. Falls f (1) = 0, so folgt für alle x ∈ R
f (x) = f (x − 1) + 1 = f (x − 1) f (1) = 0.
Im Fall a > 0 kann wie oben argumentiert werden (Übungsaufgabe).
Zum Abschluss dieses Abschnitts wollen wir die Funktionalgleichung der Exponentialfunktion
im Zusammenhang mit der Zinseszinsrechnung interpretieren. Zur Erinnerung: Anlegen des
Startkapitals K0 mit jährlichem Zinssatz x ∈ R ergibt im linearen Modell nach einem Jahr
(1 + x)K0 , im Zinseszinsmodell dagegen
K(1) = K0 lim (1 +
n→∞
x n
) = K0 exp(x).
n
Allgemeiner muss nach t Jahren dann gelten
K(t) = K0 lim (1 +
n→∞
xt n
) = K0 exp(xt).
n
Bei gleichem Zinssatz x sollte es nun egal sein, ob das Geld zunächst für einen Zeitraum t1
angelegt wird und dann die ersparte Summe für einen weiteren Zeitraum t2 , oder eben gleich
für die Gesamtdauer t1 + t2 . Genau das besagt die Funktionalgleichung:
K(t1 + t2 ) = K0 exp(x(t1 + t2 )) = K0 exp(xt1 ) exp(xt2 ).
53
4
Existenz von Extremwerten
Extremwertaufgaben spielen sowohl in der Theorie wie in den Anwendungen der Analysis
eine zentrale Rolle. In diesem kurzen Abschnitt soll die Existenz von Minimalstellen bzw.
Maximalstellen unter geeigneten Voraussetzungen gezeigt werden.
Beispiel 4.1
Ein Triathlet muss von einem Punkt a1 = (x1 , y1 ), y1 > 0, im Wasser zu einem Punkt
a2 = (x2 , y2 ), y2 < 0 auf dem Land. Für y > 0 schwimmt er geradlinig mit Geschwindigkeit
v − 1, für y < 0 rennt er geradlinig mit Geschwindigkeit v2 . An welchem Punkt (x, 0) muss
er das Ufer ansteuern, um seine Zeit zu minimieren? Ist s1 bzw. s2 die im Wasser bzw. zu
Land zurückgelegte Strecke, so ist hier also folgende Funktion zu minimieren:
f (x) =
s1
s2
1
+
=
v1 v2
v1
q
(x − x1 )2 + y12 +
1
v2
q
(x − x2 )2 + y22 .
Beispiel 4.2
Gegeben sind drei Punkte a1 , a2 , a3 ∈ R2 (z.B. die Städte Freiburg, Tübingen und Zürich).
Gesucht ist ein Punkt x0 ∈ R2 , dessen Abstandssumme von den drei Punkten minimal ist
(optimaler Treffpunkt). Zu minimieren ist hier die Funktion
f : R2 → R2 , f (x) = |x − a1 | + |x − a2 | + |x − a3 |.
Nicht jede Optimierungsaufgabe hat eine Lösung. Betrachte etwa für x ∈ R2 die Summe der
Abstände von zwei gegebenen Punkten a und b:
f (x) = |x − a| + |x − b| (a, b ∈ R2 ).
In der Menge der Punkte x, die nicht auf der Strecke von a nach b liegen, können wir die
Funktion nicht minimieren, weil das Infimum inf{f (x) : x ∈ R2 , x ∈
/ [a, b]} = |a − b| durch
2
keinen Punkt aus R \[a, b] realisiert wird. Dieses Beispiel sieht etwas künstlich aus, aber
bei komplexen Extremwertaufgaben ist die Frage der Existenz einer Lösung oft schwer zu
entscheiden und von großer Wichtigkeit.
Definition 4.1 (Kompakte Menge) Eine Menge D ⊂ Rm heißt kompakt (genauer: folgenkompakt), wenn gilt: zu jeder Folge (xn )n∈N von Punkten xn ∈ D gibt es eine Teilfolge
(xnk )k∈N , die konvergiert und deren Grenzwert in D liegt:
lim xnk = x0 ∈ D.
k→∞
Satz 4.1 (Heine-Borel) Für D ⊂ Rm sind äquivalent:
(1) D ist kompakt.
(2) D ist abgeschlossen und beschränkt.
54
Beweis: Wir zeigen zuerst die Implikation (1) ⇒ (2). Für die Abgeschlossenheit von D ist
eine beliebige Folge xn ∈ D mit limn→∞ xn = x0 ∈ Rm zu betrachten. Zu zeigen ist: x0 ∈ D
(vgl. Definition 5.10). Da nach Voraussetzung d kompakt, gibt es eine Teilfolge xnk , die
gegen ein x00 ∈ D konvergiert. Da der Grenzwert der Teilfolge eindeutig bestimmt ist, folgt
x0 = x00 ∈ D, q.e.d.
Wäre D nicht beschränkt, so gibt es zu n ∈ N ein xn ∈ D mit |xn | ≥ n. Da D kompakt, gibt
es eine konvergente Teilfolge xnk , und diese ist nach Kapitel 1, Satz 3.2 beschränkt. Aber
|xnk | ≥ nk → ∞, ein Widerspruch.
Jetzt beweisen wir umgekehrt (2) ⇒ (1). Sei (xn )n∈N eine Folge in D. Da D beschränkt,
gibt es nach Bolzano-Weierstraß (Satz 4.7 bzw. Satz 5.3) eine Teilfolge (xnk )k∈N , die gegen
ein x0 ∈ Rm konvergiert. Es ist x0 ∈ D, weil D nach Voraussetzung abgeschlossen ist.
Definition 4.2 Eine Funktion f : D → Rm heißt beschränkt, wenn es eine K > 0 gibt mit
|f (x)| ≤ K für alle x ∈ D ( mit andern Worten: wenn die Menge f (d) ⊂ R beschränkt ist).
Satz 4.2 (Existenz von Extremalstellen) Sei D ⊂ Rm kompakt, D 6= ∅, und f : D → R
sei stetig. Dann ist f beschränkt und f nimmt sein Infimum und Supremum auf D an: es
gibt x0 ∈ D und x1 ∈ D mit
f (x0 ) = inf f (x)
x∈D
bzw.
f (x0 ) = sup f (x).
x∈D
Beweis: Wir zeigen die Aussage für das Infimum. Nach Kapitel 1, Folgerung 5.1 gibt es eine
Folge (xn )n∈N mit xn ∈ D und f (xn ) → inf x∈D f (x). Da D kompakt, gibt es eine konvergente
Teilfolge xnk → x0 ∈ D. Es folgt, da f stetig,
−∞ < f (x0 ) = lim f (xnk ) = inf f (x).
k→∞
x∈D
Die Bezeichnungen Minimum und Maximum sind nur dann zulässig, wenn die Existenz der
Lösung der Extremwertaufgabe bakannt ist. Die folgenden Fälle illustrieren, was im Fall D
nicht kompakt schiefgehen kann:
Beispiel 4.3
D = (−1, 1),
D = (−1, 1),
D = (1, ∞),
1
f (x) = 1−x
f ist nicht beschränkt, kein Maximum.
2 :
f (x) = x :
Extremwerte für x → ±1 ∈
/ D.
1
f (x) = 1+x
:
Infimum
für
x
→
∞.
2
Wir zeigen jetzt am Beispiel der Abstandssumme von drei Punkten a1 , a2 , a3 ∈ R2 , wie der
Existenzsatz eingesetzt wird. Als erstes zeigen wir, dass die Funktion
f : R2 → R2 , f (x) = |x − a1 | + |x − a2 | + |x − a3 |
55
Lipschitzstetig mit Konstante L = 3 ist.
3
3
X
X
|f (x) − f (y)| = |x − ai | −
|y − ai |
≤
≤
i=1
3
X
i=1
||x − ai | − |y − ai ||
i=1
3
X
|(x − ai ) − (y − ai )|
i=1
= 3 |x − y|.
Wir wollen die Funktion auf ganz R2 minimieren und haben das Problem, dass R2 unbeschränkt und damit nicht kompakt ist. Aber für große |x| ist f (x) ebenfalls groß, so dass
weit entfernte Punkte keine Rolle spielen sollten. Wir behaupten: es gibt ein R > 0, so dass
mit D := {x ∈ R2 : |x| ≤ R} gilt:
inf f (x) = inf f (x).
x∈R2
x∈D
(4.1)
Denn es gilt einerseits
inf f (x) ≤ f (0) = |a1 | + |a2 | + |a3 |,
x∈D
und andererseits haben wir für |x| ≥ R
f (x) =
≥
3
X
i=1
3
X
|x − ai |
(|x| − |ai |)
i=1
≥ 3 R − (|a1 | + |a2 | + |a3 |).
Wählen wir also R := |a1 | + |a2 | + |a3 | > 0, so folgt
inf f (x) ≤ R < 2 R ≤ inf f (x),
x∈D
|x|≥R
und Behauptung (4.1) ist gezeigt. Es bleibt nun die Funktion f auf D zu minimieren. Die
Menge D ist aber nach Definition beschränkt, nämlich durch R. Ist xn ∈ D und xn → x ∈ R2 ,
so folgt aus der Stetigkeit der Normfunktion |x| = limn→∞ |xn | ≤ R, also x ∈ D. Damit ist
D auch abgeschlossen, und nach Satz 4.2 gibt es ein x0 ∈ D mit
f (x0 ) = inf f (x) = inf f (x).
x∈R2
x∈D
Dieses x0 ist die gesuchte Minimalstelle.
56
Kapitel 3
Differentialrechnung für Funktionen
einer Variablen
1
Die Ableitung: Definition und Regeln
Definition 1.1 (Ableitung) Sei D ⊂ R offen. Die Funktion f : D → R hat in x0 ∈ D die
Ableitung a ∈ R (Notation: f 0 (x0 ) = a), falls gilt:
lim
x→x0
f (x) − f (x0 )
= a.
x − x0
(1.1)
Wir nennen f differenzierbar in x0 , falls es ein a ∈ R mit (1.1) gibt, falls also der in (1.1)
betrachtete Grenzwert existiert.
Bemerkung. f 0 (x0 ) = a
⇔
f (x0 + h) − f (x0 )
= a.
h→0
h
lim
Leibniz interessierte sich für die Definition der Ableitung im Zusammenhang mit dem Problem, die Tangente an eine ebene Kurve in einem gegebenen Punkt zu definieren. Sei die
Kurve als Graph von f : D → R gegeben und die Tangente im Punkt (x0 , f (x0 )) gesucht.
(x0 )
Der Differenzenquotient f (x)−f
ist geometrisch die Steigung der Sekante. Die Tangente
x−x0
wird nun definiert als diejenige Gerade y = g(x) = a(x − x0 ) + b, so dass gilt:
1. Die Gerade geht durch (x0 , f (x0 )), das heißt b = f (x0 ).
2. Die Gerade hat die Steigung a = limx→x0
f (x)−f (x0 )
x−x0
= f 0 (x0 ).
Aus den Bedingungen ergibt sich die Gleichung
g(x) = f (x0 ) + f 0 (x0 )(x − x0 )
(x ∈ R).
Die gegebene Definition der Ableitung ist auch für vektorwertige Funktionen f : D → Rn
sinnvoll. Die Ableitung ist dann ein Vektor a ∈ Rn und es gilt:
lim
x→x0
f (x) − f (x0 )
=a
x − x0
⇔
57
|
f (x) − f (x0 )
− a| → 0.
x − x0
Hierbei bezeichnet | · | die Euklidische Norm, siehe Kap. I, Definition 5.5. Der dort bewiesene
Satz 5.5 über die Äquivalenz von Normkonvergenz und Konvergenz der Koordinaten besagt
hier Folgendes:
Lemma 1.1 Sei D ⊂ R offen. Die Funktion f : D → Rn ist genau dann in x0 ∈ D differenzierbar, wenn alle Koordinatenfunktionen f i : D → R, i = 1, . . . , n, in x0 differenzierbar
sind. Die Ableitung kann dann koordinatenweise berechnet werden, das heißt es gilt:
f 0 (x0 ) = ((f 1 )0 (x0 ), . . . , (f n )0 (x0 )) ∈ Rn .
Newton entwickelte den Differentialkalkül, um zum Beispiel die Dynamik der Planetenbewegung zu erklären. Kepler hatte vorher aufgrund von Beobachtungen des Astronoms Tycho
Brahe drei Gesetze für die Bewegung der Planeten geraten – Newton konnte diese Gesetze nun
mithilfe des Differentialkalküls (Englisch: Calculus) allein aus der Formel für die Anziehungskraft (dem Gravitationsgesetz) herleiten. Die Bewegung eines Massenpunkts (Planeten) wird
dabei durch eine Abbildung
f : D −→ R3 , f (t) = x(t), y(t), z(t)
beschrieben, d. h. die Koordinaten des Massenpunkts zur Zeit t ∈ D bzgl. eines Euklidischen
Koordinatensystems sind durch f (t) gegeben. Erstes Ziel ist dann die Definition der
Momentangeschwindigkeit als Vektor in R3 . Die vektorielle Durchschnittsgeschwindigkeit
(t0 )
auf dem Zeitintervall [t0 , t] ist der Quotient f (t)−f
, nämlich Weg:Zeit.
t−t0
Die Momentangeschwindigkeit v(t0 ) zum Zeitpunkt t = t0 ist deshalb als vektorielle Ableitung
zu definieren (wobei Newton einen Punkt statt eines Strichs benutzt hat):
v(t0 ) = f 0 (t0 ) = (x0 (t0 ), y 0 (t0 ), z 0 (t0 )) ∈ R3 .
Definition 1.2 (Ableitungsfunktion) Sei D ⊂ R offen. Die Funktion f : D → R heißt
differenzierbar auf D (oder einfach differenzierbar), falls f in jedem Punkt x0 ∈ D differenzierbar ist. Die hierdurch gegebene Funktion
f 0 : D → R,
x0 7→ f 0 (x0 ) = lim
x→x0
f (x) − f (x0 )
∈R
x − x0
heißt Ableitung von f .
Beispiel 1.1 Für eine konstante Funktion, also f (x) = c ∈ R für alle x ∈ D, gilt für x 6= x0 :
f (x) − f (x0 )
c−c
=
=0
x − x0
x − x0
⇒ f 0 (x0 ) = 0 bzw. f 0 = 0.
Beispiel 1.2 Für die Potenzfunktionen f : R → R, (x) = xn mit n ∈ N gilt für x 6= x0
f (x) − f (x0 )
= xn−1 + xn−2 x0 + . . . + xn−2
x + xn−1
,
0
0
x − x0
also folgt mit x → x0
f 0 (x0 ) = nxn−1
0
58
für x0 ∈ R.
Beispiel 1.3 Die Exponentialfunktion exp : R −→ R ist an allen Punkten x0 ∈ R differenzierbar und hat die Ableitung exp0 = exp:
Fall 1: x0 = 0
Nach Kapitel 2, Lemma 3.2 gelten die Abschätzungen
exp(x) − exp(0)
1
≤
,
x
1−x
exp(x) − exp(0)
1
x<0 ⇒ 1≥
≥
.
x
1−x
0<x<1 ⇒ 1≤
Also folgt exp0 (0) = 1 = exp(0).
Fall 2: x0 ∈ R beliebig
Aus der Funktionalgleichung (Satz 3.3 (1)) und Fall 1 folgt für h 6= 0
exp(x0 + h) − exp(x0 )
exp(h) − 1
= exp(x0 )
→ exp(x0 ).
h
h
Also gilt insgesamt exp0 = exp.
Beispiel 1.4 f (x) = |x| ist nicht differenzierbar in x0 = 0:
f (x) − f (0)
x
= lim = 1
x&0
x&0 x
x−0
f (x) − f (0)
−x
f−0 (0) := lim
= lim
= −1.
x%0
x%0 x
x−0
f+0 (0) :=
lim
Die rechts- und linksseitige Ableitung existieren in x0 = 0, sie sind aber verschieden.
Lemma 1.2 (differenzierbar = linear approximierbar) Sei f : D → R, D ⊂ R offen,
und x0 ∈ D. Genau dann hat f in x0 die Ableitung a ∈ R, wenn gilt:
lim
h→0
r(h)
= 0,
h
wobei
r(h) = f (x0 + h) − (f (x0 ) + a h).
(1.2)
Beweis: Für h 6= 0 gilt
f (x0 + h) − f (x0 )
f (x0 + h) − (f (x0 ) + a h)
r(h)
−a=
=
.
h
h
h
Hieraus ergibt sich die Behauptung.
Satz 1.1 (differenzierbar ⇒ stetig) Ist f : D → R differenzierbar in x0 ∈ D, so ist f
auch stetig in x0 .
Beweis: Nach Satz 2.2 in Kapitel 2 reicht es zu zeigen, dass limh→0 f (x0 + h) = f (x0 ). Aber
für h 6= 0 gilt nach Lemma 1.2
f (x0 + h) = f (x0 ) + a h + h
59
r(h)
→ f (x0 ) mit h → 0.
h
Satz 1.2 (Differenzierbarkeitsregeln) Seien f, g : D → R differenzierbar in x0 ∈ D.
Dann sind auch die Funktionen αf + βg (α, β ∈ R), f g und f /g (im Fall g(x0 ) 6= 0) in x0
differenzierbar mit folgenden Ableitungen:
(1)
(2)
(3)
(αf + βg)0 (x0 ) = αf 0 (x0 ) + βg 0 (x0 )
(f g)0 (x0 )
0
f
g
= f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 )
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) =
g(x0 )2
(Ableitung ist linear)
(1.3)
(Produktregel)
(1.4)
(Quotientenregel)
(1.5)
Beweis: Wir müssen jeweils für x 6= x0 die Differenzenquotienten bilden und zeigen, dass
diese mit x → x0 gegen das gewünschte konvergieren. Für (1.3) haben wir
(αf (x) + βg(x)) − (αf (x0 ) + βg(x0 ))
x − x0
f (x) − f (x0 )
g(x) − g(x0 )
+β
x − x0
x − x0
0
0
→ αf (x0 ) + βg (x0 ).
=
α
Die Produktregel (1.4) folgt durch Mischen der Terme“:
”
f (x) − f (x0 )
g(x) − g(x0 )
f (x)g(x) − f (x0 )g(x0 )
=
g(x) + f (x0 )
x − x0
x − x0
x − x0
→ f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ),
wobei die Stetigkeit von g in x0 benutzt wurde (Satz 1.1). Wir zeigen die Quotientenregel
(1.5) zunächst für die Funktion 1/g, also f ≡ 1. Es gibt ein δ > 0 mit g(x) 6= 0 für |x−x0 | < δ
nach Kapitel 2, Lemma 2.1. Für diese x gilt
1
1
1
1
g(x) − g(x0 )
−
= −
x − x0 g(x) g(x0 )
g(x)g(x0 )
x − x0
1
g 0 (x0 ) mit x → x0 .
→ −
g(x0 )2
Für beliebiges f schreiben wir f /g = f ·
1
und verwenden die Produktregel.
g
Beispiel 1.5 Für fn (x) = xn mit n ∈ N gilt fn0 (x) = (n − 1) xn−1 . Dies wurde schon in
Beispiel 1.2 gezeigt. Hier verwenden f10 (x) = 1 für alle x ∈ R und erhalten per Induktion für
n≥2
0
fn0 (x) = (f1 fn−1 )0 (x) = f10 (x)fn−1 (x) + f1 (x)fn−1
(x) = 1 xn−1 + x (n − 1)xn−2 = n xn−1 .
Beispiel 1.6 Für f (x) = x−n = 1/xn mit n ∈ N gilt f 0 (x) = −n x−n−1 :
f 0 (x) = −
n xn−1
= −n x−n−1 .
(xn )2
Beispiel 1.7 Die hyperbolischen Funktionen cosh : R → R und sinh : R → R sind definiert
durch
ex + e−x
ex − e−x
cosh x =
, sinh x =
.
2
2
0
(ex )0
−x folgt cosh0 = sinh und sinh0 = cosh.
Wegen (e−x )0 = e1x = − (e
x )2 = −e
60
Satz 1.3 (Kettenregel) Betrachte die Verkettung
f
g
g ◦ f : D −→ E −→ R, (g ◦ f )(x) = g(f (x)).
Es sei f in x0 ∈ D ⊂ R differenzierbar, und g sei in y0 = f (x0 ) ∈ E differenzierbar. Dann
ist g ◦ f in x0 differenzierbar und hat die Ableitung
(g ◦ f )0 (x0 ) = g 0 f (x0 f 0 (x0 ).
Beweis: Wir betrachten wieder für x 6= x0 den Differenzenquotienten:

g(f (x)) − g(f (x0 )) f (x) − f (x0 )
falls f (x) 6= f (x0 )
g(f (x)) − g(f (x0 )) 
f (x) − f (x0 )
x − x0
=

x − x0
0
falls f (x) = f (x0 ).
Wir definieren

 g(y) − g(f (x0 ))
y − f (x0 )
a : E → R, a(y) =
 0
g (f (x0 ))
für y 6= f (x0 )
für y = f (x0 ).
Die Funktion a ist stetig in y0 nach Satz 2.2. Mit x → x0 folgt, da f (x) → f (x0 ),
f (x) − f (x0
g(f (x)) − g(f (x0 ))
= a(f (x))
→ a(f (x0 )f 0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ).
x − x0
x − x0
Satz 1.4 (Differenzierbarkeit der Umkehrfunktion) Sei I = (a, b) offenes Intervall,
f : I → f (I) = I ∗ stetig und streng monoton. Ist dann f in x0 ∈ I differenzierbar und
f 0 (x0 ) 6= 0, so ist die Umkehrfunktion g : I ∗ → I in y0 = f (x0 ) ∈ I ∗ gleichfalls differenzierbar
und es gilt
1
.
g 0 (y0 ) = 0
f g(y0 )
Beweis: Nach Satz 3.2 in Kapitel 2 (inklusive der Ergänzung (3.2)) ist I ∗ = (α, β) ein offenes
Intervall und g : I ∗ → R ist stetig, insbesondere g(y) → g(y0 ) mit y → y0 . Für y 6= y0 folgt
g(y) − g(y0 )
g(y) − g(y0 )
1
1
=
=
→ 0
.
f (g(y)) − f (g(y0 ))
y − y0
f (g(y)) − f (g(y0 ))
f (x0 )
g(y) − g(y0 )
Bemerkung: Sei f : (a, b) → (α, β) in x0 differenzierbar und bijektiv mit Umkehrabbildung
g : (α, β) → (a, b). Wenn die Funktion g in y0 = f (x0 ) differenzierbar ist, so folgt schon aus
der Kettenregel
g(f (x)) = x ⇒ g 0 (f (x0 ))f 0 (x0 ) = 1,
also die Formel für die Ableitung der Umkehrfunktion. Insbesondere muss dann f 0 (x0 ) 6= 0
sein. Die Funktion f : R → R, f (x) = x3 ist streng monoton wachsend; ihre Umkehrfunktion
lautet
(√
3 y
für y ≥ 0
g : R → R, g(y) =
√
− 3 −y für y ≤ 0.
61
Die Umkehrfunktion ist nicht differenzierbar in y = 0, denn
g(y) − g(0)
= y −2/3 → +∞ mit y & 0.
y−0
Die Bedingung des Satzes ist hier verletzt, f 0 (0) = 0.
Die beiden vorangegangengen Regeln sind in der von Leibniz eingeführten Notation besonders
suggestiv. Leibniz schreibt Funktionen in der Form y = y(x) und bezeichnet die Ableitung
dy
mit dx
( Differentialquotient “). Dann lauten die Kettenregel und die Regel für die Ableitung
”
der Umkehrfunktion wie folgt:
y = y(x), z = z(y) ⇒
y = y(x), x = x(y) ⇒
dz
dz dy
=
,
dx
dy dx
dx
1
= dy .
dy
dx
Bei der Anwendung dieser saloppen Notation ist jedoch darauf zu achten, wo die jeweiligen
Funktionen definiert sind.
Beispiel 1.8 Die Exponentialfunktion exp : R → (0, ∞) hat die Ableitung exp0 (x) =
exp(x) 6= 0 für alle x ∈ R. Nach Satz 1.4 ist die Logarithmusfunktion log : (0, ∞) → R
differenzierbar und es gilt
log0 (y) =
1
1
1
=
= .
exp0 (log y)
exp(log y)
y
Beispiel 1.9 Die Funktion f : (0, ∞) → R, f (x) = xα mit α ∈ R ist Verkettung der
Funktionen exp : R → R und h : R → R, h(x) = α log(x). Mit der Kettenregel berechnen wir
f 0 (x) = exp0 (h(x))h0 (x) = exp(α log(x))
α
= α xα−1 .
x
Beispiel 1.10 Die Funktion f (x) = ax ist Verkettung von exp und h(x) = log(a) x. Deshalb
gilt
f 0 (x) = exp0 (h(x))h0 (x) = exp(log(a) x) log(a) = log(a)ax .
Beispiel 1.11 Wir berechnen die Ableitung der Wurzelfunktion g(y) =
tion von f (x) = x2 :
1
1
1
=
g 0 (y) = 0
= √ .
2 g(y)
2 y
f g(y)
√
y als Umkehrfunk-
Beispiel 1.12 Nach Übungsaufgabe 2, Serie 10 besitzt die Funktion sinh : R → R eine streng
monoton wachsende Umkehrfunktion Arsinh : R → R. Da sinh0 x = cosh x > 0 für alle x ∈ R,
ist die Funktion Arsinh differenzierbar und hat die Umkehrfunktion
Arsinh0 (y) =
1
1
=
.
cosh(Arsinh(y))
sinh (Arsinh(y))
0
62
Um dies umzuformen, beachte
2
2
cosh x − sinh x =
Also gilt cosh x =
p
ex + e−x
2
2
−
2
= 1.
1 + sinh2 x und es folgt
1
Arsinh0 (y) = p
1 + y2
2
ex − e−x
2
.
Mittelwertsatz und Anwendungen
Definition 2.1 Die Funktion f : (a, b) → R hat in x0 ∈ (a, b) ein lokales Minimum, falls es
ein δ > 0 gibt, so dass gilt:
f (x0 ) ≤ f (x)
für alle x ∈ Uδ (x0 ) = (x0 − δ, x0 + δ).
Ist sogar f (x0 ) < f (x) für x ∈ Uδ (x0 )\{x0 }, so heißt das lokale Minimum isoliert. Ein
(isoliertes) lokales Maximum ist entsprechend definiert.
Satz 2.1 (notwendige Bedingung für Extrema) Die Funktion f : (a, b) → R habe in
x0 ∈ (a, b) ein lokales Extremum (d. h. Minimum oder Maximum). Ist f in x0 differenzierbar,
so gilt f 0 (x0 ) = 0.
Beweis: Wir nehmen an, dass f ein lokales Minimum hat. Es gibt also ein δ > 0 mit
f (x) ≥ f (x0 ) für x ∈ (x0 − δ, x0 + δ). Daraus folgt
x ∈ (x0 , x0 + δ) ⇒
x ∈ (x0 − δ, , x0 ) ⇒
f (x) − f (x0 )
≥0
x − x0
f (x) − f (x0 )
≤ 0.
x − x0
Mit x & x0 folgt f 0 (x0 ) ≥ 0, mit x % x0 folgt f 0 (x0 ) ≤ 0.
Die Funktion f (x) = x3 erfüllt f 0 (0) = 0, aber in x = 0 liegt kein lokales Extremum vor.
Die Bedingung f 0 (x0 ) = 0 ist notwendig für eine lokale Extremalstelle einer differenzierbaren
Funktion, aber sie ist nicht hinreichend.
Das Argument des Beweises von Satz 2.1 liefert auch dann etwas, wenn eine Funktion
f : [a, b] → R ein lokales Extremum in einem Randpunkt von [a, b] hat und dort einseitig differenzierbar ist. Ist zum Beispiel a eine Extremalstelle von f , so folgt
(
f (x) − f (a) ≥ 0 (Minimum)
0
f+ (a) = lim
x&a
x−a
≤ 0 (Maximum).
Es ist eine zentrales Problem der Analysis, aus Eigenschaften der Ableitung auf Eigenschaften
der Funktion selbst zu schließen:
63
Informationen über f 0
−→
Verhalten von f .
Der Mittelwertsatz ist ein einfaches und gleichzeitig effektives Hilfsmittel, um solche Schlüsse
zu ziehen.
Satz 2.2 (Mittelwertsatz der Differentialrechnung) Sei f : [a, b] → R stetig, differenzierbar auf (a, b). Dann gibt es ein ξ ∈ (a, b) mit
f 0 (ξ) =
f (b) − f (a)
.
b−a
Beweis:
Schritt 1 Beweis im Fall f (a) = f (b) = 0 (Satz von Rolle)
Wir brauchen ein ξ ∈ (a, b) mit f 0 (ξ) = 0. Es ist deshalb naheliegend, nach Extremalstellen
zu suchen. Nach Kapitel 3, Satz 4.2 gibt es ξ1 , ξ2 ∈ [a, b] mit
f (ξ1 ) = inf f (x)
und
x∈[a,b]
f (ξ2 ) = sup f (x).
x∈[a,b]
Ist ξ1 ∈ (a, b), so folgt f 0 (ξ1 ) = 0 nach Satz 2.1 und wir können ξ := ξ1 wählen. Analog,
wenn ξ2 ∈ (a, b). Im verbleibenden Fall ξ1 , ξ2 ∈ {a, b} folgt inf f = sup f = 0 bzw. f (x) = 0
für alle x ∈ [a, b], und damit auch f 0 (x) = 0 für alle x.
Schritt 2 Beweis für f (a), f (b) ∈ R beliebig
Definiere h : [a, b] −→ R durch Abziehen der Sekante “
”
h(x) = f (x) − g(x), g(x) = f (a) +
f (b) − f (a)
(x − a).
b−a
Dann erfüllt h die Voraussetzungen von Schritt 1, insbesondere gilt h(a) = h(b) = 0. Also
existiert ein ξ ∈ (a, b) mit
0 = h0 (ξ) = f 0 (ξ) −
Satz von Rolle: ∃ horizontale Tangente
f (b) − f (a)
.
b−a
Mittelwertsatz: ∃ sehnenparallele Tangente
64
Folgerung 2.1 (Monotoniekriterium) Sei f differenzierbar auf (a, b), stetig auf [a, b].
Dann gelten folgende Aussagen:
f 0 (x) ≥ 0 für alle x ∈ (a, b) ⇒ f ist wachsend auf [a, b]
f 0 (x) ≤ 0 für alle x ∈ (a, b) ⇒ f ist fallend auf [a, b]
f 0 (x) = 0 für alle x ∈ (a, b) ⇒ f ist konstant.
Bei strikter Ungleichung folgt strenge Monotonie auf [a, b].
Beweis: Sei a ≤ x1 < x2 ≤ b. Nach dem Mittelwertsatz


≥0





> 0
0
f (x2 ) − f (x1 ) = f (ξ) (x2 − x1 ) ≤ 0
| {z } 


<0

>0



=0
gibt es ein ξ ∈ (x1 , x2 ), so dass gilt:
wenn
wenn
wenn
wenn
wenn
f 0 (ξ) ≥ 0
f 0 (ξ) > 0
f 0 (ξ) ≤ 0 .
f 0 (ξ) < 0
f 0 (ξ) = 0
Definition 2.2 Sei f : (a, b) → R. Eine differenzierbare Funktion F : (a, b) → R heißt
Stammfunktion von f , wenn gilt:
F0 = f
⇔ F 0 (x) = f (x)
für alle x ∈ (a, b).
Folgerung 2.2 Ist F eine Stammfunktion von f auf (a, b), so ist jede Stammfunktion von f
auf (a, b) von der Form F + c für eine Konstante c ∈ R.
Beweis: Sei G auch Stammfunktion auf (a, b). Es folgt
(G − F )0 = G0 − F 0 = f − f = 0.
Nach Folgerung 2.1 gibt es eine Konstante c ∈ R mit G − F = c, also G = F + c.
Die Gleichung F 0 = f ist ein elementares Beispiel für eine Differentialgleichung. Folgerung
2.2 sagt aus, dass eine Lösung der Gleichung bis auf eine additive Konstante
c ∈ R eindeutig bestimmt ist. Es schließt sich hier unmittelbar die Frage nach der Existenz
an:
Für welche f ist die Differentialgleichung F 0 = f auf dem Intervall (a, b) lösbar?
Wie gesagt, ist dies eine zentrale Frage der Analysis. Wir werden eine Antwort geben, sobald
uns die Integralrechnung zur Verfügung steht, und zwar mit dem Hauptsatz der Differentialund Integralrechnung.
Folgerung 2.3 (Schrankensatz) Ist f : [a, b] → R stetig und differenzierbar auf (a, b), so
gilt für a ≤ x1 < x2 ≤ b:
f 0 (x) ≥ m für alle x ∈ (a, b) ⇒
f 0 (x) ≤ M für alle x ∈ (a, b) ⇒
65
f (x2 ) − f (x1 )
≥m
x2 − x1
f (x2 ) − f (x1 )
≤ M.
x2 − x1
Beweis: Wir zeigen die erste Aussage. Mit g(x) = mx gilt (f − g)0 = f 0 − g 0 ≥ m − m = 0.
Nach Folgerung 2.1 ist f − g wachsend, d. h.
f (x2 ) − m x2 ≥ f (x1 ) − m x1 .
Die Behauptung folgt.
Für vektorwertige Funktionen f : [a, b] → Rn , n ≥ 2, gilt der Mittelwertsatz der Differentialrechnung nicht. Es gibt Abbildungen f : [a, b] → R2 mit f (a) = f (b), aber f 0 (ξ) 6= 0 für alle
ξ ∈ (a, b); die Gleichung f (b)−f (a) = f 0 (ξ) (b−a) kann dann nicht erfüllt sein. Ein konkretes
Beispiel ist die Bewegung auf einer Kreislinie mit konstanter Absolutgeschwindigkeit. Nach
einer gewissen Zeit kommt man wieder am Ausgangspunkt an, ohne dass die Geschwindigkeit
jemals Null war (im nächsten Abschnitt werden wir die gleichförmige Kreisbewegung noch
ausführlich behandeln). Gewisse Konsequenzen des Mittelwertsatzes lassen sich dennoch auf
den verktorwertigen Fall übertragen. Dies gilt für Folgerung 2.2 (F 0 = 0 ⇒ F = const.)
sowie für die folgende Aussage.
Folgerung 2.4 (f 0 beschränkt ⇒ f Lipschitz) Sei f : [a, b] → Rn stetig und auf (a, b)
differenzierbar. Falls |f 0 (x)| ≤ L für alle x ∈ (a, b), so folgt
|f (x1 ) − f (x2 )| ≤ L|x1 − x2 |
für alle x1 , x2 ∈ [a, b].
Beweis: Um die Aussage auf den R-wertigen Fall zu reduzieren, betrachten wir für einen
beliebigen Vektor v ∈ Rn mit |v| = 1 die Funktion
ϕ : [a, b] → R, ϕ(x) = hv, f (x)i =
n
X
v i f i (x).
i=1
Aus der Cauchy-Schwarz-Ungleichung (Kapitel 1, Satz 5.4) folgt
0
ϕ (x) =
n
X
v i (f i )0 (x) = hv, f 0 (x)i ≤ |v| |f 0 (x)| ≤ L.
i=1
Für x1 , x2 ∈ [a, b], oBdA x1 > x2 , erhalten wir aus Folgerung 2.3
hv, f (x1 ) − f (x2 )i = ϕ(x1 ) − ϕ(x2 ) ≤ L(x1 − x2 ) = L|x1 − x2 |.
Wir können f (x1 ) 6= f (x2 ) annehmen, denn sonst ist nichts zu zeigen. Nun wählen wir
v :=
f (x1 ) − f (x2 )
|f (x1 ) − f (x2 )|
⇒
|v| = 1,
und wir erhalten
|f (x1 ) − f (x2 )| = hf (x1 ) − f (x2 ), vi ≤ L|x1 − x2 |.
Wir wollen als Anwendung des Mittelwertsatzes Aussagen über das Wachstum der Exponentialfunktion machen. Die Exponentialfunktion beschreibt Wachstums- bzw. Zerfallprozesse,
bei denen die Geschwindigkeit der Zunahme bzw. Abnahme proprotional zur vorhandenen
Menge ist. Zum Beispiel ist bei Anlegen eines Kapitals zum Zinssatz α ∈ R der Kontostand
nach t Jahren gegeben durch f (t) = f (0) exp(αt), es gilt also die Gleichung
f0 = α f
(Differentialgleichung von f (x) = eαx )
Wir benötigen nun folgende multiplikative“ Variante des Schrankensatzes.
”
66
(2.1)
Folgerung 2.5 Sei f : [a, b] → R stetig, auf (a, b) differenzierbar, und sei a ≤ x1 < x2 ≤ b
sowie α ∈ R. Dann gilt:
f 0 ≥ αf auf (a, b) ⇒ e−αx2 f (x2 ) ≥ e−αx1 f (x1 )
f 0 ≤ αf auf (a, b) ⇒ e−αx2 f (x2 ) ≤ e−αx1 f (x1 ).
Beweis: Wir berechnen mit der Produktregel, wobei
d
die Ableitung bezeichnet,
dx
d −αx
(e
f (x)) = −αe−αx f (x) + e−αt f 0 (x) = e−αx (f 0 (x) − αf (x)).
dx
Die Behauptung ergibt sich aus Folgerung 2.1.
Satz 2.3 (Wachstum von exp und log) Es gelten folgende Grenzwertaussagen:
lim x−s ex = +∞
und
lim y −s log y = 0
und
x→+∞
y→+∞
lim xs e−x = 0
x→+∞
lim y s log y = 0
y&0
für jedes s > 0,
für jedes s > 0.
(2.2)
(2.3)
Beweis: Wir setzen f (x) = x−s ex mit s > 0 und berechnen für x > 0
f 0 (x) = −s x−s−1 ex + x−s ex = (1 −
⇒ f 0 (x) ≥
1
f (x)
2
s
)f (x)
x
für x ≥ 2s.
Aus Folgerung 2.5 mit x1 = 2s, x2 = x > 2s folgt
1
f (x) ≥ e 2 (x−2s) f (2s) → +∞
mit x → +∞.
Damit ist (2.2) gezeigt, wobei sich die zweite Aussage durch Bildung des Kehrwerts ergibt.
Für (2.3) substituieren wir y = ex/s ⇔ log y = x und schließen, da y → +∞ ⇔ x → +∞
sowie y & 0 ⇔ x → −∞,
y −s log y = e−x x/s → 0
s
x
y log y = e x/s → 0
mit y → +∞,
mit y & 0.
Definition 2.3 Sei D ⊂ R offen und f : D → R. Wir setzen f (0) = f und definieren
induktiv die k-te Ableitung f (k) : D → R für k ≥ 1 durch f (k) := (f (k−1) )0 . Damit f (k)
existiert, muss also f (k−1) noch differenzierbar sein.
Definition 2.4 Für D ⊂ R offen und k ∈ N0 bezeichnen wir mit C k (D) den R-Vektorraum
der k mal stetig differenzierbaren Funktionen f : D → R, das heißt
C k (D) = {f : D → R : f (i) : D → R sind definiert und stetig für i = 0, 1, . . . , k}.
Weiter definieren wir C ∞ (D) als den R-Vektorraum der unendlich oft differenzierbaren Funktionen, also ist
\
C ∞ (D) =
C k (D).
k≥0
67
Der Umgang mit C ∞ -Funktionen ist besonders angenehm, weil die Klasse im Gegensatz zu
den Räumen C k (D) unter der Bildung von Ableitungen abgeschlossen ist. Es ist klar, dass
Polynome unendlich oft differenzierbar sind, ebenso die Exponentialfunktion. Das folgende
Beispiel einer zusammengestückelten C ∞ -Funktion wird sich später als sehr nützlich erweisen
Folgerung 2.6 Die Funktion
(
e−1/x
f (x) =
0
für x > 0
für x ≤ 0
ist unendlich oft differenzierbar.
Beweis: Wir zeigen durch Induktion, dass es Polynome pn gibt, so dass gilt:
(
pn ( x1 ) e−1/x für x > 0
(n)
f (x) =
0
für x ≤ 0.
Für n = 0 ist das richtig mit p0 (s) ≡ 1. Ist die Aussage für ein n ∈ N0 gezeigt, so folgt:
1 0 1
1
1
(n+1)
x>0 ⇒ f
(x) = − 2 pn ( ) + 2 pn ( ) e−1/x
x
x
x
x
x < 0 ⇒ f (n+1) (x) = 0.
Wir setzen also pn+1 (s) = s2 (pn (s) − p0n (s)). Zu zeigen bleibt f (n+1) (0) = 0. Für den
linksseitigen Differenzenquotienten ist das klar, für x > 0 berechnen wir mit (2.2)
1
1
f (n) (x) − f (n) (0)
= pn ( ) e−1/x → 0
x
x
x
mit x & 0,
Wir kommen jetzt zurück zu der Bestimmung von Extremwerten.
Folgerung 2.7 Sei f : (a, b) → R zweimal differenzierbar und f 0 (x0 ) = 0 für x0 ∈ (a, b). Ist
dann f 00 (x0 ) > 0, so hat f in x0 ein isoliertes, lokales Minimum.
Beweis: Nach Voraussetzung gilt, da f 0 (x0 ) = 0,
0 < f 00 (x0 ) = lim
x→x0
f 0 (x)
.
x − x0
Also gibt es ein δ > 0 mit f 0 (x) > 0 auf (x0 , x0 + δ) und f 0 (x) < 0 auf (x0 − δ, x0 ). Nach
Folgerung 2.1 ist f streng monoton fallend auf (x0 − δ, x0 ] und streng monoton wachsend auf
[x0 , x0 + δ), woraus die Behauptung folgt.
Bei Extremwertaufgaben ist in der Regel nicht die lokale, sondern die globale Minimalität von
Interesse. In diesem Zusammenhang ist der Begriff der Konvexität von erheblicher Bedeutung.
Definition 2.5 Sei I ⊂ R ein Intervall. f : I → R heißt konvex, falls gilt:
f (1 − t)x0 + t x1 ≤ (1 − t) f (x0 ) + tf (x1 ) ∀x0 , x1 ∈ I, t ∈ [0, 1].
Gilt dies mit ≥ statt mit ≤, so heißt f konkav.
68
(2.4)
Geometrische Interpretation:
Die Sekante durch x0 , f (x0 ) und x1 , f (x1 ) ist Graph der linearen Funktion
g(x) = f (x0 ) +
f (x1 ) − f (x0 )
(x − x0 ).
x1 − x0
An der Stelle x(t) = (1 − t)x0 + t x1 gilt
f (x1 ) − f (x0 )
t(x1 − x0 ) = (1 − t)f (x0 ) + tf (x1 ).
g x(t) = f (x0 ) +
x1 − x0
Die Konvexitätsbedingung besagt also anschaulich, dass der Graph von f unterhalb jeder
Sekanten liegt.
Satz 2.4 (Konvexitätskriterien) Sei f : (a, b) → R differenzierbar. Dann sind folgende
Aussagen äquivalent:
(1) f 0 ist monoton wachsend auf (a, b).
(2) f ist konvex.
(3) f (y) ≥ f (x) + f 0 (x)(y − x) für alle x, y ∈ (a, b).
Ist f zweimal differenzierbar auf (a, b), so ist außerdem äquivalent:
(4) f 00 ≥ 0.
3
Die Winkelfunktionen
In der Schule werden die Funktionen Sinus, Kosinus und Tangens durch die Längenverhältnisse im rechtwinkligen Dreieck eingeführt:
Um dies jedoch zu einer exakten Definition auszubauen, wird das Konzept der Winkelmessung, also der Bestimmung der Länge des zugehörigen Einheitskreisbogens, gebraucht.
Anstatt die Bogenlänge hier ad hoc zu definieren (dies wird in Analysis II für allgemeine
Kurvenstücke als Anwendung der Integralrechnung behandelt), wählen wir einen anderen
Zugang. Bei diesem stehen die Differentialgleichung der harmonischen Schwingung bzw.
die Differentialgleichung der gleichförmigen Kreisbewegung im Mittelpunkt. Im folgenden
betrachten wir Funktionen, die vom Parameter t ( Zeit“) abhängen.
”
Die Differentialgleichung der harmonischen Schwingung lautet bei geeigneter Normierung
x00 + x = 0.
Physikalisch beschreibt x : I → R, I = (t1 , t2 ) ⊂ R, die Auslenkung eines schwingungsfähigen
Systems (Oszillators) aus der Ruhelage x = 0; ein Beispiel ist die Schwingung einer elastischen
Feder. Die Differentialgleichung kann aus der Annahme hergeleitet werden, dass auf das
System eine Rückstellkraft wirkt, die proportional zur Auslenkung, aber entgegengesetzt
gerichtet ist. Um die Schwingung zu bestimmen, sollten die Position und Geschwindigkeit zu
einer Anfangszeit vorgegeben sein; wir wählen stets die Anfangszeit t = 0.
69
Definition 3.1 (Anfangswertproblem für die harmonische Schwingung) Sei 0 ∈
I = (t1 , t2 ). Eine Funktion x ∈ C 2 (I) heißt Lösung des Anfangswertproblems für die harmonische Schwingung zu den Anfangsdaten a, b ∈ R, falls gilt:
x00 + x = 0
auf I,
x(0) = a,
x0 (0) = b.
(3.1)
Sei x ∈ C 2 (I) eine Lösung von (3.1). Wir definieren die Funktion y = −x0 und erhalten
y 0 = −x00 = x, das heißt es gilt das System von Gleichungen
x0 = −y
0
y =
x(0) = a,
y(0) = −b.
x
Mit komplexen Zahlen können wir das noch kürzer schreiben: wir definieren die Funktion
c : I → C,
c(t) = x(t) + iy(t).
Wir erhalten c0 = x0 + i y 0 = −y + ix = i(x + iy), beziehungsweise
c0 = ic auf I,
c(0) = z0 ∈ C,
(3.2)
wobei hier z0 = a − ib. Im folgenden brauchen wir uns um die Differenzierbarkeit der
beteiligten Funktionen keine Gedanken zu machen, denn es gilt
Lemma 3.1 (Regularität) Ist c : I → C differenzierbar und c0 = ic, so folgt c ∈ C ∞ (I, C).
Insbesondere ist jede Lösung x : I → R der Gleichung x00 + x = 0 in C ∞ (I).
Beweis: Aus Satz 1.1 folgt c ∈ C 0 (I, C). Sei nun induktiv c ∈ C k (I, C) schon gezeigt für
ein k ∈ N0 . Dann folgt c0 = ic ∈ C k (I, C), also c ∈ C k+1 (I, C).
Lemma 3.2 (Reduktion der Ordnung) Für Funktionen x, y : I → R sind folgende Aussagen äquivalent:
(1) x ist Lösung von (3.1), und y = −x0 ,
(2) c = x + iy ist Lösung von (3.2) mit z0 = a − ib.
Beweis: (1)⇒(2) wurde oben gezeigt. Umgekehrt folgt aus (2)
x0 + iy 0 = c0 = ic = i(x + iy) = −y + ix,
also x00 = −y 0 = −x sowie x(0) = a und x0 (0) = −y(0) = −(−b) = b.
Das Anfangswertproblem (3.1) zweiter Ordnung für eine gesuchte reellwertige Funktion ist
also gleichwertig mit dem Anfangswertproblem (3.2) erster Ordnung für zwei gesuchte reellwertige Funktionen, bzw. eine C-wertige Funktion. Diesem wenden wir uns jetzt zu.
Lemma 3.3 (Erhaltungssatz) Für jede Lösung c = x + iy : I → C, I = (t1 , t2 ) der
Gleichung c0 = ic ist die Funktion |c(t)|2 = x(t)2 + y(t)2 konstant.
70
Beweis: Es gilt, indem wir z und iz als Punkte in R2 auffassen,
hz, izi = h(
x
−y
), (
)i = 0
y
x
für alle z ∈ C.
Daraus folgt
d 2
|c| = 2 hc, c0 i = 2 hc, ici = 0.
dt
Mit Folgerung 2.1 ergibt sich die Behauptung.
Wir bezeichnen die Gleichung c0 = ic als Differentialgleichung der gleichförmigen Kreisbewegung, denn nach Lemma 3.3 verläuft jede Lösung c(t) auf einem Kreis um den Nullpunkt
und hat konstante Absolutgeschwindigkeit |c0 (t)| = |c(t)| = const.
Satz 3.1 (Eindeutigkeitssatz für die gleichförmige Kreisbewegung) Das
wertproblem (3.2) hat höchstens eine Lösung c : I → C.
Anfangs-
Beweis: Seien c1 , c2 Lösungen von (3.2). Für c := c1 − c2 folgt
c0 = c01 − c02 = ic1 − ic2 = ic,
c(0) = 0.
Nach Lemma 3.3 ist |c(t)| = |c(0)| = 0 für alle t, also c1 = c2 .
Satz 3.2 (Existenzsatz für die gleichförmige Kreisbewegung) Das Anfangswertproblem (3.2) besitzt eine (eindeutig bestimmte) Lösung c ∈ C ∞ (R, C).
Wir stellen den Beweis dieses Satzes zurück, denn er erfordert Hilfsmittel, die an dieser Stelle
noch nicht zur Verfügung stehen. Wir verweisen auf die Diskussion nach Folgerung 3.4 am
Ende des Abschnitts. Wir wollen hier zeigen, dass sich Definition und Eigenschaften der
trigonometrischen Funktionen unabhängig vom gewählten Lösungsverfahren allein aus der
Differentialgleichung herleiten lassen. Aus Lemma 3.2 ergibt sich zunächst direkt
Folgerung 3.1 (Eindeutigkeits- und Existenzsatz für die harmonische Schwingung)
Das Anfangswertproblem (3.1) besitzt eine eindeutig bestimmte Lösung x ∈ C ∞ (R).
Definition 3.2 (Kosinus und Sinus) Die Funktion cos : R → R (bzw. sin : R → R) ist
die eindeutig bestimmte Lösung der Gleichung x00 + x = 0 zu den Anfangsdaten x(0) = 1,
x0 (0) = 0 (bzw. x(0) = 0, x0 (0) = 1).
Lemma 3.4 Die Funktion c : R → C, c(t) = cos t + i sin t ist Lösung des Anfangswertproblems
c0 = ic, c(0) = 1 ∈ C.
Insbesondere gilt cos0 = − sin, sin0 = cos und
cos2 t + sin2 t = 1.
Beweis: Die Funktion y = − cos0 erfüllt
y 00 + y = −(cos000 + cos0 ) = −(cos00 + cos)0 = 0,
y(0) = − cos0 (0) = 0
sowie
y 0 (0) = − cos00 (0) = cos(0) = 1.
71
(3.3)
Aus der Eindeutigkeitaussage von Folgerung 3.1 folgt − cos0 = sin, und durch Differentiation
sin0 = − cos00 = cos. Also gilt (3.2) mit z0 = cos(0) + i sin(0) = 1. Die Identität (3.3) gilt
nach Lemma 3.3.
Es ist jetzt nicht schwer zu überprüfen, dass die Lösung des allgemeinen Anfangswertproblems
(3.1) durch
x(t) = a cos t + b sin t
gegeben ist. Unser Ziel ist es, im Folgenden anhand der Definition die Eigenschaften der
Funktionen Kosinus und Sinus herzuleiten. Wir beginnen mit dem Nachweis, dass cos und
sin periodische Funktionen sind. Dazu zeigen wir wiederum, dass die Funktion c(t) den
Punkt i ∈ C in endlicher Zeit τ > 0 zum ersten Mal erreicht und dabei den rechten oberen
Viertelkreis durchläuft.
Lemma 3.5 Sei τ := sup{t > 0 : cos s > 0
für alle s ∈ (0, t)}. Dann gilt:
(1) cos t > 0 und sin t > 0 für alle t ∈ (0, τ ).
(2) τ ∈ (0, ∞) und c(τ ) = cos τ + i sin τ = i.
Beweis: Da cos 0 = 1 und cos stetig, ist cos s > 0 für hinreichend kleine s ≥ 0 und folglich
τ > 0. Für t ∈ (0, τ ) folgt sin0 t = cos t > 0, also ist sin streng monoton wachsend auf [0, τ ]
nach Folgerung 2.1. Da sin 0 = 0, ist (1) gezeigt. Wähle nun ein beliebiges t0 ∈ (0, τ ). Dann
gilt
t ∈ (t0 , τ ) ⇒ cos0 t = − sin t ≤ − sin t0 .
Aus (1) und dem Schrankensatz (Folgerung 2.3) folgt für jedes t ∈ (t0 , τ )
0 < cos t ≤ cos t0 − (t − t0 ) sin t0
⇒
t < t0 +
cos t0
.
sin t0
Also ist τ < ∞. Nun ist cos τ = limt%τ cos t ≥ 0. Nach Definition von τ gibt es auf der
anderen Seite ti & τ√mit cos ti ≤ 0. Es folgt cos τ = 0 sowie, wieder wegen (1), sin τ =
limt%τ sin t = limt%τ 1 − cos2 t = 1. Damit ist auch (2) bewiesen.
Auf dem Intervall [0, τ ] durchläuft c(t) mit Geschwindigkeit |c0 (t)| = 1 den Viertelkreis von
1 nach i. Dies motiviert die
Definition 3.3 (Die Zahl π) Wir setzen π = 2τ mit τ aus Lemma 3.5.
Für ω ∈ R ist die Exponentialfunktion f (t) = eωt Lösung des Anfangswertproblems
f 0 = ωf,
f (0) = 1.
Die komplexwertige Funktion c(t) = cos t + i sin t ist Lösung des analogen Anfangswertproblems, nur mit ω = i ∈ C:
c0 = ic, c(0) = 1.
Diese Analogie und das nachfolgende Lemma rechtfertigen es, die Exponentialfunktion für
imaginäre Argumente wie folgt zu erklären:
Definition 3.4 (Eulersche Formel) Wir definieren
eit := exp(it) := cos t + i sin t
72
für t ∈ R.
(3.4)
Lemma 3.6 (Funktionalgleichung) Es gilt
ei(α+β) = eiα eiβ
für alle α, β ∈ R.
(3.5)
Beweis: Betrachte mit c(t) = eit die Funktionen
c1 (t) = c(α + t)
und
c2 (t) = c(α) c(t).
Aus Lemma 3.4 folgt c1 (0) = c(α) = c2 (0) sowie
c01 (t) = c0 (α + t) = ic(α + t) = ic1 (t),
c02 (t) = c(α)c0 (t) = i c(α) c(t) = i c2 (t).
Aus Satz 3.1 (Eindeutigkeitssatz) folgt c1 (t) = c2 (t) für alle t, also mit t = β
c(α + β) = c1 (β) = c2 (β) = c(α) c(β).
Wegen eit e−it = ei(t−t) = 1 gilt e−it = eit . Dies ist äquivalent zu cos(−t) = cos t und
sin(−t) = − sin t, das heißt cos ist eine gerade und sin eine ungerade Funktion. Ferner gelten
die Relationen:
c(t + π/2) = ic(t)
cos(t + π/2) = − sin t
sin(t + π/2) = cos t
c(t + π) = −c(t)
cos(t + π) = − cos t
sin(t + π) = − sin t
c(t + 2π) = c(t)
cos(t + 2π) = cos t
sin(t + 2π) = sin t.
Insbesondere folgt
eit = 1
⇔
t = k · 2π mit k ∈ Z,
(3.6)
und die Nullstellen von cos (bzw. sin) sind von der Form π/2 + k · π (bzw. k · π) mit k ∈ Z.
Folgerung 3.2 (Additionstheoreme)
cos(α + β) = cos α cos β − sin α sin β,
sin(α + β) = sin α cos β + cos α sin β.
Beweis: Aus (3.5) folgt
cos(α + β) + i sin(α + β) = ei(α+β) = eiα eiβ = (cos α + i sin α) (cos β + i sin β).
Die Behauptung folgt durch Vergleich der Real- und Imaginärteile.
Zur Definition der Umkehrfunktionen müssen cos und sin auf geeignete Intervalle eingeschränkt werden. Die Funktionen
π π
cos : [0, π] → [−1, 1] und sin : [− , ] → [−1, 1]
2 2
sind streng monoton fallend bzw. wachsend. Ihre Umkehrfunktionen sind die Arcusfunktionen
π π
arccos : [−1, 1] → [0, π] und arcsin : [−1, 1] → [− , ].
2 2
73
Für x ∈ [−1, 1] gilt, da cos2 t + sin2 t = 1,
arccos0 (x) =
arcsin0 (x) =
1
1
,
1 − x2
1
1
=√
.
0
sin (arcsin x)
1 − x2
cos0 (arccos x)
= −√
Folgerung 3.3 (Polardarstellung auf C) Zu z = x + iy ∈ C\{0} gibt es eindeutig bestimmte r > 0, ϑ ∈ [0, 2π) mit z = r eiϑ .
Beweis: Um die Eindeutigkeit zu zeigen, seien r1 , r2 > 0 und ϑ1 , ϑ2 ∈ [0, 2π) mit z =
r1 eiϑ1 = r2 eiϑ2 . Dann folgt |z| = r1 = r2 , und weiter
eiϑ1 = eiϑ2
bzw.
ei(ϑ1 −ϑ2 ) = 1.
Nach (3.6) ist ϑ1 − ϑ2 = 2k · π für ein k ∈ Z. Aber 2 |k|π = |ϑ1 − ϑ2 | < 2π, also gilt k = 0
und ϑ1 = ϑ2 .
Für die Existenz der Polardarstellung von z = x + iy ∈ C\{0} definieren wir
(
p
arccos xr
für y ≥ 0
r = x2 + y 2 > 0, ϑ =
x
2π − arccos r für y < 0.
√
Wir rechnen die geforderte Eigenschaft nach: wegen sin ϑ = 1 − cos2 ϑ für ϑ ∈ [0, π] gilt im
Fall y ≥ 0
r
x
x
x
x
x
y
iϑ
e = cos(arccos ) + i sin(arccos ) = + i 1 − ( )2 = + i ,
r
r
r
r
r
| {z r}
∈[0,π]
also z = r eiϑ . Für y < 0 haben wir, da cos, sin 2π-periodisch sind und außerdem cos gerade,
sin ungerade,
r
x
x
y
x
x
x
iϑ
e = cos(arccos ) − i sin(arccos ) = − i 1 − ( )2 = + i .
r
r
r
r
r
r
| {z }
∈[0,π]
In der Polardarstellung wird die Multiplikation sowie das Potenzieren von komplexen Zahlen
besonders einfach:
z1 = r1 eiα , z2 = r2 eiβ
⇒
z1 z2 = r1 r2 ei(α+β) .
Zum Beipiel sind die Lösungen der Gleichung z n = 1, die n-ten Einheitswurzeln, gegeben
durch ζk = ei 2πk/n für k = 0, 1, . . . , n − 1.
Spalten wir die Polardarstellung in Real- und Imaginärteil auf, so erhalten wir die reellen
Formeln für Polarkoordinaten auf R2 :
x = r cos ϑ,
y = r sin ϑ
mit r > 0, ϑ ∈ [0, 2π).
Zum Schluss wollen wir unsere Definition der Exponentialfunktion nochmals erweitern:
74
Definition 3.5 (Komplexe Exponentialfunktion) Die komplexe Exponentialfunktion ist
definiert durch
exp : C → C, z = x + iy 7→ exp(z) = ex eiy = ex (cos y + i sin y).
Mit dieser Definition gilt die Funktionalgleichung nun auf ganz C, denn für z1 = x1 + iy1 ,
z2 = x2 + iy2 gilt
exp(z1 + z2 ) = exp((x1 + x2 ) + i(y1 + y2 ))
= ex1 +x2 ei(y1 +y2 )
= ex1 eiy1 ex2 eiy2
= exp(z1 ) exp(z2 ).
Aus diesem Grund können wir auch exp(z) = ez schreiben; die Regeln der Potenzrechnung
gelten. Mit der komplexen Exponentialfunktion können wir nun allgemeinere Anfangswertprobleme lösen.
Folgerung 3.4 (Differentialgleichung der e-Funktion) Sei ω = α + iβ ∈ C und 0 ∈
I = (t1 , t2 ). Dann ist die Funktion c(t) = eωt die eindeutig bestimmte Lösung f : I → C des
Anfangswertproblems
f 0 = ωf auf I, f (0) = 1.
(3.7)
Beweis: Aus der Differentialgleichung der reellen e-Funktion und der Differentialgleichung
der gleichförmigen Kreisbewegung, siehe Lemma 3.4, folgt mit der Produktregel und der
Kettenregel
d αt iβt
(e e )
dt
d
d
= ( eαt ) eiβt + eαt ( eiβt )
dt
dt
αt iβt
αt
iβt
= αe e + e iβe
d ωt
=
e
dt
= ωeωt .
Also gilt c0 = ωc auf ganz R und c(0) = 1. Sei f : I → C eine weitere Lösung von (3.7).
Dann berechnen wir
d −ωt
d
d
(e f (t)) = ( e−ωt ) f + e−ωt ( f )
dt
dt
dt
= −ωe−ωt f + e−ωt ωf
= 0.
Es folgt e−ωt f (t) = e−ωt f (t)|t=0 = 1, und die Funktionalgleichung liefert f (t) = eωt für alle
t ∈ I.
In diesem Abschnitt haben wir gesehen, dass sich die charakteristischen Eigenschaften der trigonometrischen Funktionen, insbesondere ihre Periodizität und ihre Additionstheoreme, sehr
einfach aus der Differentialgleichung der harmonischen Schwingung herleiten lassen. Grundlegend war dabei die Umformulierung mittels des Systems der gleichförmigen Kreisbewegung.
Während sich die eindeutige Lösbarkeit leicht aus dem Erhaltungssatz Lemma 3.3 ergab,
bleibt die Konstruktion einer Lösung zunächst offen. Es gibt hier mehrere Zugänge, von
denen zwei in diesem Skript vorgestellt werden:
75
• In Kapitel 4, Satz 2.4 wird das Existenzproblem auf das Auffinden einer Stammfunktion
reduziert, deren Existenz durch den Hauptsatz der Differential- und Integralrechnung
gesichert ist.
• In Kapitel 5.2 wird für die gesuchte Lösung eine Darstellung als Potenzreihe hergeleitet. Es wird dann nachgewiesen, dass die gewonnene Potenzreihe (unendlich oft)
differenzierbar ist und in der Tat das Anfangswertproblem 3.2 löst.
Im zweiten Semester werden wir als weitere Methode zur Konstruktion einer Lösung ein
Iterationsverfahren (Picard-Lindelöf) behandeln.
76
Kapitel 4
Integralrechnung
1
Das Riemannsche Integral
Als Motivation für die Definition des Integrals betrachten wir das Problem, den Flächeninhalt
auszurechnen, den der Graph einer Funktion f : [a, b] = I → R mit der x-Achse einschließt:
Anschaulich soll also gelten
Z
b
f = Flächeninhalt von {(x, y) : x ∈ I, 0 ≤ y ≤ f (x)}.
a
Allerdings wollen wir Flächen unterhalb der x-Achse negativ zählen.
Definition 1.1 (Riemannsche Summe) Sei I = [a, b] ein kompaktes Intervall. Eine Diskretisierung D auf I ist durch folgende Daten gegeben: 1
• eine Unterteilung a = x0 ≤ x1 ≤ . . . ≤ xN = b von I in aufeinanderfolgende Intervalle
Ik = [xk−1 , xk ],
• zugehörige Stützstellen ξk ∈ Ik für k = 1, . . . , N .
Wir setzen ∆xk := xk − xk−1 und nennen ∆(D) = max1≤k≤N ∆xk die Feinheit der Diskretisierung D. Für f : I → R heißt dann die Zahl
SD (f ) =
N
X
f (ξk )∆xk ∈ R
(1.1)
k=1
die Riemannsche Summe von f zur Diskretisierung D.
Die Riemannsche Summe ergibt einen Näherungswert für das Integral, der auf endlich vielen
Daten, nämlich den Unterteilungspunkten sowie den Werten der Funktion an den Stützstellen,
beruht. Im Prinzip könnte diese Näherung von einem Computer berechnet werden. Sinnvoll
ist das aber natürlich nur, wenn bei Verfeinerung der Diskretisierung der Approximationsfehler kleiner wird. Dies führt auf den folgenden Begriff von Integrierbarkeit.
1
In der Literatur wird meist von einer Unterteilung mit Stützstellen gesprochen; der Begriff Diskretisierung
ist nicht Standard.
77
Definition 1.2 (Riemann-Integral) Die Funktion f : I = [a, b] → R heißt integrierbar
mit Integral S ∈ R, falls es für alle ε > 0 ein δ > 0 gibt, so dass gilt:
D Diskretisierung von I mit ∆(D) < δ
⇒
|SD (f ) − S| < ε.
Bezeichnung. Die Zahl S nennen wir das (bestimmte) Integral von f auf [a, b] und schreiben
Rb
S = S(f ) = a f ∈ R.
Beispiel 1.1 Sei f (x) = c ∈ R für alle x ∈ I. Dann gilt für jede Diskretisierung D
SD (f ) =
N
X
N
X
c ∆xk = c
k=1
also ist f integrierbar mit
Rb
a
(xk − xk−1 ) = c (b − a),
k=1
f = c(b − a).
Es ist praktisch, neben der ε − δ−Formulierung der Integrierbarkeit auch eine Version mit
Folgen zur Verfügung zu haben, ganz analog zur Definition der Stetigkeit.
Lemma 1.1 Für f : I = [a, b] → R und S ∈ R sind folgende Aussagen äquivalent:
(1) f ist Riemann-integrierbar mit Integral S ∈ R.
(2) SDj (f ) → S für jede Folge Dj mit ∆(Dj ) → 0.
Beweis: Die Implikation (1) ⇒ (2) folgt unmittelbar aus den Definitionen. Sei umgekehrt
(2) erfüllt. Wäre (1) falsch, so gibt es ein ε > 0 mit folgender Eigenschaft: zu jedem
δ = 1/j, j ∈ N, gibt es eine Diskretisierung Dj mit Feinheit ∆(Dj ) < 1/j, aber dennoch
|SDj (f ) − S| ≥ ε. Dies ist ein Widerspruch zu (2).
Satz 1.1 (Linearität des Integrals) Die Menge R(I) der Riemann-integrierbaren FunkRb
tionen f : I → R ist ein R-Vektorraum und das Integral S : R(I) → R, f 7→ S(f ) = a f ist
ein lineares Funktional. Es gilt also
Z b
Z b
Z b
(λ f + µ g) = λ
f +µ
g.
a
a
a
Beweis: Für eine beliebige Diskretisierung D gilt
SD (λf + µg) =
N
X
λf (ξk ) + µg(ξk ) ∆xk
k=1
N
X
= λ
f (ξk ) ∆xk + µ
k=1
N
X
g(ξk )∆xk
k=1
= λSD (f ) + µSD (g).
Für jede Folge von Diskretisierungen Dj mit ∆(Dj ) → 0 folgt
SDj (λf + µg) = λSDj (f ) + µSDj (g) → λS(f ) + µS(g).
Natürlich hoffen wir, dass möglichst viele Funktionen Riemann-integrierbar sind. Im Gegensatz zur Differentiation können wir aber hier nicht direkt Regeln zum Beispiel für Produkt,
Quotient, Verkettung und Umkehrfunktion herleiten. Stattdessen müssen wir einen konzeptuellen Weg beschreiten, der auf folgenden drei Schritten beruht:
78
a) Stückweise konstante Funktionen (sogenannte Treppenfunktionen) sind integrierbar.
b) Läßt sich eine Funktion f gut“ durch integrierbare Funktionen approximieren, so ist
”
auch f integrierbar.
c) Stetige Funktionen lassen sich gut“ durch Treppenfunktionen approximieren, und sind
”
damit integrierbar.
Natürlich wird dabei unter anderem noch zu klären sein, was die gute Approximation“
”
eigentlich sein soll. Wir beginnen unser Programm, indem wir zunächst einige Eigenschaften
des Integrals zeigen.
Lemma 1.2 Sei f ∈ R(I) und fe : I → R. Es gebe endlich viele Punkte A = {a1 , . . . , ar } ⊂ I
Rb
Rb
mit fe(x) = f (x) für alle x ∈ I\A. Dann ist fe ∈ R(I) und es gilt a fe = a f .
Beweis: Wir zeigen die Aussage im Fall eines Ausnahmepunkts a1 ∈ I; der allgemeine Fall
folgt daraus per Induktion. Es gilt für jede Diskretisierung D
SD (fe) − SD (f ) =
N
X
k=1
(fe(ξk ) − f (ξk )) ∆xk =
N
X
k: ξk =a1
(fe(a1 ) − f (a1 )) ∆xk .
Es ist ξk = a1 höchstens für zwei k mit ∆xk > 0. Für eine Folge Dj mit ∆(Dj ) → 0 erhalten
wir
|SDj (fe) − S(f )| ≤ |SDj (fe) − SDj (f )| + |SDj (f ) − S(f )|
≤ 2|fe(a1 ) − f (a1 )|∆(Dj ) + |SD (f ) − S(f )|,
j
und die rechte Seite geht gegen Null mit ∆(Dj ) → 0.
Beispiel 1.2 In Lemma 1.2 lässt sich endlich“ nicht zu abzählbar unendlich“ verbessern.
”
”
Betrachte die Funktion
(
1 x∈Q
f : [0, 1] → R, f (x) =
0 sonst,
und die Unterteilung von [0, 1] in N Intervalle Ik gleicher Länge 1/N . Wählen wir irrationale
Stützstellen, so ist SD (f ) = 0; bei rationalen Stützstellen gilt aber SD (f ) = 1. Da wir dabei
die Feinheit beliebig klein machen können, ist f nicht Riemann-integrierbar.
Satz 1.2 Jede Riemann-integrierbare Funktion ist beschränkt.
Beweis: Es gibt ein δ > 0, so dass mit S = S(f ) gilt:
∆(D) < δ
⇒
1
|SD (f ) − S| < .
2
Wähle N ∈ N so dass ∆ := (b − a)/N < δ und betrachte die äquidistante Unterteilung
xk = a + k∆ fürk = 0, 1, . . . , N . Wir behaupten
|f (ξ)| ≤ max |f (xk )| +
1≤k≤N
79
1
∆
für alle ξ ∈ [a, b].
Für die gegebene Unterteilung sei D die Diskretisierung mit den Stützstellen xk für k =
1, . . . , N . Ist ξ ∈ I gegeben und ξ ∈ Ik , so betrachte außerdem die Diskretisierung D0 , bei der
die Stützstelle xk durch ξ ersetzt wird (ebenfalls zur äquidistanten Unterteilung). Es folgt
f (ξ) − f (xk ) ∆
1
⇒ |f (ξ)| ≤ |f (xk )| + |SD0 (f ) − SD (f )| .
{z
}
∆|
SD0 (f ) − SD (f ) =
<1
Die behauptete Abschätzung folgt.
Definition 1.3 (Supremumsnorm) Für eine beschränkte Funktion f : D → R setzen wir
kf kI = sup |f (x)|.
x∈I
Lemma 1.3 Sei D ⊂ R. Die Menge der beschränkten Funktionen
B(D) = {f : D → R : f ist beschränkt }
ist ein Vektorraum mit Norm k · kD , d. h. für f, g ∈ B(D) und α ∈ R gilt:
(1) kf kD ≥ 0, Gleichheit nur für f = 0.
(2) kαf kD = |α| kf kD .
(3) kf + gkD ≤ kf kD + kgkD (Dreiecksungleichung).
Beweis: Die Regel (2) folgt aus
sup |αf (x)| = sup (|α||f (x)|) = |α| sup |f (x)|.
x∈D
x∈D
x∈D
Weiter gilt für x ∈ D
|f (x) + g(x)| ≤ |f (x)| + |g(x)| ≤ sup |f (y)| + sup |g(y)| = kf kD + kgkD .
y∈D
y∈D
Daraus folgt
kf + gkD = sup |f (x) + g(x)| ≤ kf kD + kgkD .
x∈D
Die Vektorraumeigenschaft von B(D) ergibt sich aus (2) und (3).
Sei wieder I = [a, b] ein kompaktes Intervall. Nach Satz 1.1 und Satz 1.2 ist R(I) ⊂ B(I) ein
Untervektorraum; die Norm k · kI ist auf R(I) definiert.
Lemma 1.4 Sei I = I1 ∪. . .∪In eine Unterteilung von I = [a, b] in Intervalle Ik = [ak−1 , ak ].
Falls f auf jedem der Teilintervalle Ik integrierbar ist, so folgt f ∈ R(I) und
Z
a
b
f=
n Z
X
k=1
80
ak
ak−1
f.
Beweis: Der allgemeine Fall ergibt sich aus dem Fall n = 2 leicht durch Induktion über n
mit der Klammerung I = (I1 ∪ . . . ∪ In−1 ) ∪ In . Für n = 2 müssen wir zeigen, dass für jede
Folge SDj mit ∆(Dj ) → 0 gilt:
Z a1
Z a2
lim SDj (f ) =
f+
f =: S1 + S2 .
j→∞
a0
a1
Sei D eine beliebige Diskretisierung mit den Unterteilungspunkten bzw. Stützstellen
a0 = x0 ≤ x1 ≤ . . . ≤ xr−1 ≤ a1 < xr ≤ . . . ≤ xN = a2 , ξ1 , . . . , ξN .
Definiere dann die Diskretisierungen D1 von I1 und D2 von I2 wie folgt:
D1 :
Unterteilungspunkte a0 = x0 ≤ . . . ≤ xr−1 ≤ a1 ,
D2 :
Unterteilungspunkte a1 < xr ≤ . . . ≤ xN = a2 ,
Stützstellen ξ1 , . . . , ξr−1 , a1
Stützstellen a1 , ξr+1 , . . . , ξN .
Die Bilanz der Riemannschen Summen ergibt
|SD (f ) − (SD1 (f ) + SD2 (f ))| = |(f (ξr ) − f (a1 ))∆xr | ≤ 2 kf kI ∆(D).
Daraus folgt
|SD (f ) − (S1 + S2 )| ≤ |SD (f ) − (SD1 (f ) + SD2 (f ))| +|SD1 (f ) − S1 | + |SD2 (f ) − S2 |,
{z
}
|
≤2 kf kI ∆(D)
und die rechte Seite geht mit ∆(D) → 0 gegen Null.
Folgerung 1.1 Sei f : I → R eine Treppenfunktion, d. h. es gibt eine Unterteilung a = a0 <
a1 < . . . < an = b und ci ∈ R (i = 1, . . . , n) mit f (x) = ci für alle x ∈ (ai−1 , ai ). Dann ist f
integrierbar und es gilt
Z b
n
X
f=
(ai − ai−1 )ci .
a
i=1
Beweis: Nach Lemma 1.2 ist f : [ai−1 , ai ] → R integrierbar für alle i = 1, . . . , n. Aus Lemma
1.4 folgt die Behauptung.
Damit ist Schritt a) unseres Programms erledigt, wobei wir auch einige zusätzliche Informationen gewonnen haben. Jetzt wollen untersuchen, wie sich Integrierbarkeit und Integral
unter der Approximation von Funktionen verhalten. Ziel ist es, für einen geeigneten Begriff
von Konvergenz fk → f“ folgende Aussage zu zeigen:
”
Z b
Z b
fk → f mit fk integrierbar ⇒ f integrierbar und
f = lim
fk .
a
k→∞ a
Welcher Konvergenzbegriff ist dabei zu wählen? Betrachte zunächst die punktweise Konvergenz:
fk → f punktweise
⇔ fk (x) → f (x) für alle x ∈ I.
In der Vorlesung haben wir sehr oft Operationen zwischen Funktionen punktweise definiert,
zum Beispiel (f + g)(x) := f (x) + g(x). Aber hier ist die punktweise Definition nicht gut,
wie das folgende Beispiel zeigt:
81
Beispiel 1.3 Betrachte die Treppenfunktionen
fk : [0, 1] → R,
(
k
fk (x) =
0
für 0 < x <
sonst.
1
k
Dann gilt limk→∞ fk (x) = 0 für alle x ∈ [0, 1], denn
(
für alle k, falls x = 0
fk (x) = 0
für k ≥ x1 , falls x > 0.
Also konvergiert fk punktweise gegen die Nullfunktion f = 0. Aber es ist
Z 1
Z 1
1
0=
f 6= lim
fk = lim
· k = 1.
k→∞ 0
k→∞ k
0
Fazit: Der Begriff der punktweisen Konvergenz ist ungeeignet, weil das Integral i. a. nicht
approximiert wird. Es wird ein stärkerer Konvergenbegriff benötigt.
Definition 1.4 (Gleichmäßige Konvergenz) Sei D ⊂ R. Die Folge fk : D → R, k ∈ N,
konvergiert gleichmäßig gegen f : I → R, falls gilt:
kfk − f kI → 0
mit k → ∞.
Bei gleichmäßiger Konvergenz liegt der gesamte Graph der fk in einem ε-Streifen um den
Graph von f , wenn k groß genug ist. In Quantorensprache sieht der Unterschied von punktweiser Konvergenz und gleichmäßiger Konvergenz wie folgt aus:
∀ε > 0
∀ε > 0
∀x ∈ D
∃N
∃N
∀x ∈ D
∀k > N :
∀k > N :
|fk (x) − f (x)| < ε
|fk (x) − f (x)| < ε
(Punktweise Konvergenz),
(Gleichmäßige Konvergenz).
Der Unterschied ist, dass die Schranke N bei gleichmäßiger Konvergenz für alle x ∈ D gleich
gewählt werden kann, während sie bei nur punktweiser Konvergenz von x abhängen darf, das
heißt N = N (ε, x). Im Beispiel 1.3 gilt etwa, falls ε ≤ 1 und x > 0,
|fk (x) − f (x)| < ε
⇒
k≥
1
,
x
so dass N (x, ε) ≥ 1/x sein muss, also nicht unabhängig von x gewählt werden kann.
Es ist klar, dass aus gleichmäßiger Konvergenz die punktweise Konvergenz folgt, denn es gilt
ja
|fk (x) − f (x)| ≤ sup |fk (y) − f (y)| = kfk − f kD → 0 mit k → ∞.
y∈D
Wenn Sie deshalb prüfen wollen, ob eine gegebene Folge fk gleichmäßig konvergiert, so können
Sie wie folgt vorgehen:
• Sie untersuchen zuerst, ob die Folge punktweise konvergiert, das heißt ob für jedes feste
x der Grenzwert limk→∞ fk (x) existiert. Wenn nicht, so ist die Folge nicht gleichmäßig
konvergent.
82
• Wenn doch, so setzen Sie f (x) := limk→∞ fk (x) und berechnen die Norm kfk − f kD =
supx∈D |fk (x) − f (x)|, bzw. schätzen diese Norm ab. Gilt kfk − f kD → 0 mit k → ∞,
so ist die Folge gleichmäßig konvergent gegen f . Wenn nicht, so ist fk zwar punktweise,
aber nicht gleichmäßig konvergent.
Im Beispiel 1.3 gilt fk → f mit f = 0 punktweise auf [0, 1], aber nicht gleichmäßig. Es ist
nämlich
sup |fk (x) − f (x)| = k → ∞ mit k → ∞.
x∈[0,1]
Wir wollen nun untersuchen, wie sich das Integral mit diesem Konvergenzbegriff verträgt.
Satz 1.3 (Abschätzung des Integrals durch Supremumsnorm) Für f ∈ R(I) gilt die
Ungleichung
Z b
|
f | ≤ |b − a| kf kI .
a
Beweis: Für jede Diskretisierung gilt mit der Dreiecksungleichung
|
N
X
k=1
f (ξk )∆xk | ≤
N
X
|f (ξk )| ∆xk ≤ kf kI
k=1
N
X
∆xk = kf kI |b − a|,
k=1
das heißt
|SD (f )| ≤ kf kI |b − a|.
(1.2)
Rb
Wähle eine Folge Dj mit ∆(Dj ) → 0 und erhalte | a f | = limj→∞ |SDj (f )| ≤ kf kI |b − a|.
Satz 1.3 besagt, dass die lineare Abbildung
S : (R(I), k · kI ) → R, S(f ) =
Z
b
f
a
Lipschitzstetig bezüglich der Norm k · kI ist, denn es gilt
Z b
|S(f ) − S(g)| = |
(f − g)| ≤ kf − gkI |b − a|.
a
Die Lipschitzkonstante ist die Intervalllänge |b − a|. Insbesondere erhalten wir die Stetigkeit
der Abbildung bzgl. k · kI :
Z b
Z b
fk , f ∈ R(I), kfk − f kI → 0 mit k → ∞ ⇒
fk →
f,
a
a
Rb
Rb
denn | a fk − a f | ≤ kfk − f kI |b − a| → 0. Der nachfolgende Satz macht insofern eine
stärkere Aussage, als die Integrierbarkeit der Grenzfunktion nicht vorausgesetzt, sondern
bewiesen wird.
Satz 1.4 (Integral und gleichmäßige Konvergenz) Die Funktionenfolge fk ∈ R(I)
konvergiere gleichmäßig gegen f : I → R, also kfk − f kI → 0. Dann ist f ∈ R(I) und
es gilt
Z b
Z b
f = lim
fk .
a
k→∞ a
83
Beweis: Wir setzen Sk =
Rb
a
fk ∈ R.
Schritt 1 Der Grenzwert S := limk→∞ Sk existiert.
Die Folge Sk ist eine Cauchyfolge, denn wir haben
Z b
|Sk − Sl | = |
(fk − fl )| (Satz 1.1)
a
≤ |b − a| kfk − fl kI
(Satz 1.3)
< |b − a| (kfk − f kI + kf − fl kI )
(Dreiecksungleichung)
< ε
für k, l hinreichend groß.
Rb
Schritt 2 f ist integrierbar mit a f = S.
Sei ε > 0 gegeben. Wähle ein k ∈ N, so dass folgende beiden Aussagen gelten:
(i) |Sk − S| < ε/3 (nach Schritt 1),
(ii) |SD (f ) − SD (fk )| ≤ |b − a| kf − fk kI < ε/3 (nach Ungleichung (1.2)).
Für festes k mit (i) und (ii) gibt es nun ein δ > 0 mit |SD (fk ) − Sk | < ε/3 für jede Diskretisierung mit Feinheit ∆(D) < δ. Damit folgt
|SD (f ) − S| ≤ |SD (f ) − SD (fk )| + |SD (fk ) − Sk | + |Sk − S| < ε.
|
{z
} |
{z
} | {z }
<ε/3
<ε/3
<ε/3
Damit ist auch Schritt b) unseres Programms abgeschlossen. Um zu zeigen, dass stetige Funktionen auf I = [a, b] integrierbar sind, müsses wir jetzt noch nachweisen, dass sie gleichmäßig
durch Treppenfunktionen approximiert werden können.
Lemma 1.5 Sei I = [a, b] kompaktes Intervall und f : I → R stetig. Dann ist f gleichmäßig
stetig, d. h. zu ε > 0 gibt es ein δ > 0, so dass gilt:
x, x0 ∈ I,
|x − x0 | < δ
⇒
|f (x) − f (x0 )| < ε.
(1.3)
Beweis.
Angenommen, die Behauptung ist falsch. Für ein ε > 0 gibt es dann Punkte
0
xn , xn ∈ I, so dass gilt:
|xn − x0n | → 0, aber |f (xn ) − f (x0n )| ≥ ε.
Da I kompakt, können wir nach Übergang zu einer Teilfolge und Umnumerierung annehmen,
dass die Folge (xn ) gegen ein x0 ∈ I konvergiert. Es folgt limn→∞ x0n = x0 , denn
|x0n − x0 | ≤ |x0n − xn | + |xn − x0 | → 0
mit n → ∞.
Da f stetig, folgt weiter
ε ≤ lim |f (xn ) − f (x0n )| = |f (x0 ) − f (x0 )| = 0,
n→∞
ein Widerspruch.
84
Beispiel 1.4 Ist f : D → R stetig, aber D nicht kompakt, so muss f nicht gleichmäßig stetig
sein. Betrachte zum Beispiel
1
f : (0, ] → R,
π
Dann gilt für xn =
1
f (x) = sin .
x
1
1
, x0n =
mit n ∈ N
2nπ
π/2 + 2nπ
|xn − x0n | =
π/2
1
≤ 2 → 0,
2nπ(π/2 + 2nπ)
8n π
aber |f (xn ) − f (x0n )| = 1 für alle n.
Satz 1.5 (C 0 (I) ⊂ R(I)) Sei I = [a, b] ein kompaktes Intervall. Dann ist jede stetige Funktion f : I → R Riemann-integrierbar.
Beweis: Zu ε > 0 konstruieren wir eine Treppenfunktion g : I → R mit kf − gkI ≤ ε. Die
Behauptung ergibt sich dann aus Folgerung 1.1 und Satz 1.4. Nach Lemma 1.5 gibt es ein
δ > 0, so dass gilt:
x, x0 ∈ I,
|x − x0 | < δ
⇒
|f (x) − f (x0 )| < ε.
Sei D eine beliebige Diskretisierung mit Feinheit ∆(D) < δ. Definiere die Treppenfunktion
(
f (ξk ) für x ∈ [xk−1 , xk )
g(x) =
f (ξN ) für x = xN .
Für x ∈ I gilt x ∈ [xk−1 , xk ) für ein k ∈ {1, . . . , N } (bzw. evtl. x = xN ). Dann folgt
|x − ξk | ≤ ∆xk < δ, und somit |f (x) − g(x)| = |f (x) − f (ξk )| < ε nach Wahl von δ > 0. Also
folgt kf − gkI ≤ ε, ws zu zeigen war.
Definition 1.5 (Stückweise Stetigkeit) Eine Funktion f : [a, b] → R heißt stückweise
stetig, wenn es eine Unterteilung a = a0 < . . . < aN = b gibt, so dass gilt:
• f |(aj−1 ,aj ) ist stetig für alle j = 1, . . . , N ;
• in den aj existieren die links- bzw.
limx&aj f (x).
rechtsseitigen Grenzwerte limx%aj f (x) bzw.
Aus Satz 1.5 und Lemma 1.4 ergibt sich die folgende, nützliche Verschärfung von Satz 1.5.
Folgerung 1.2 Stückweise stetige Funktionen sind Riemann-integrierbar.
Satz 1.6 (Monotonie des Integrals) Sind f, g ∈ R(I), so gilt:
Z b
Z b
f ≤g ⇒
f≤
g.
a
(1.4)
a
Insbesondere gilt, falls f , |f | ∈ R(I)
Z
b
f≤
Z
a
a
85
b
|f |.
(1.5)
Beweis: Für jede Diskretisierung D gilt
SD (f ) =
N
X
f (ξk )∆xk ≤
k=1
N
X
g(ξk )∆xk = SD (g).
k=1
Durch Wahl einer Folge Dj mit ∆(Dj ) → 0 folgt die Behauptung durch Grenzübergang.
Folgerung 1.3 (Mittelwertsatz der Integralrechnung) Seien f, ϕ : [a, b] → R stetig
und ϕ ≥ 0. Dann gibt es ein ξ ∈ [a, b] mit
Z b
Z b
f ϕ = f (ξ)
ϕ.
a
⇒
Spezialfall: ϕ = 1
Rb
a
a
f = f (ξ)(b − a).
Beweis: Setze m = inf x∈I f (x), M = supx∈I f (x). Dann gilt
mϕ ≤ f ϕ ≤ M ϕ
Z b
Z b
b
⇒m
ϕ ≤
fϕ ≤ M
ϕ
a
a
a
Z b
Z b
⇒
fϕ = µ
ϕ für ein µ ∈ [m, M ].
Z
a
a
Nach dem Zwischenwertsatz gibt es ein ξ ∈ [a, b] mit f (ξ) = µ.
2
Ableitung und Integral
Wir kommen nun zu dem zentralen, von Newton und Leibniz studierten Zusammenhang zwischen Differentiation und Integration. Vorher erweitern wir noch die Definition des Integrals,
indem wir für f ∈ R([a, b]) setzen:
Z a
Z b
Z a
f := −
f und
f = 0.
b
a
a
Mit Lemma 1.4 folgt daraus
b
Z
f+
a
c
Z
f=
b
Z
c
f,
(2.1)
a
falls f auf allen beteiligten Intervallen Riemann-integrierbar ist.
Bemerkung. Im Folgenden verwenden wir die Notation
Z b
Z b
f=
f (x) dx.
a
a
Dies ist vor allem dann nützlich, wenn die Funktion f außer von x noch von weiteren Größen
(Variablen) y, z, . . . abhängt: durch das Anhängsel dx“ wird definiert, bzgl. welcher Varia”
blen integriert werden soll. Zum Beispiel gilt
Z b
Z b
f (x) − y dx =
f (x) dx − y(b − a), aber
a
a
Z b
Z b
y dy.
f (x) − y) dy = f (x)(b − a) −
a
a
86
Der nachfolgende Satz löst das in Kapitel 3, Abschnitt 2 formulierte Problem, eine Stammfunktion zu finden, also ein Lösung der Differentialgleichung F 0 = f .
Satz 2.1 (Hauptsatz der Differential- und Integralrechnung) Sei f : I = [a, b] → R
stetig. Für jedes x0 ∈ I ist die Funktion
Z x
F : I → R, F (x) =
f (ξ) dξ
x0
eine Stammfunktion von f : F 0 (x) = f (x)
∀x ∈ I.
Bemerkung. In den Endpunkten des Intervalls ist dies im Sinne der einseitigen Ableitungen
F+0 (a) = f (a) bzw. F−0 (b) = f (b) zu verstehen.
Beweis: Die Funktion F ist wohldefiniert nach Satz 1.5. Wir berechnen
Z
Z x
F (x + h) − F (x)
1 x+h
− f (x) =
f (ξ) dξ −
f (ξ) dξ − hf (x)
h
|h| x0
x0
Z
1 x+h
=
f (ξ) − f (x) dξ |h| x
≤
1
|h|
|h|
sup
|f (ξ) − f (x)| (Satz 1.3).
|ξ−x|≤|h|
Da f im Punkt x stetig ist, geht die rechte Seite mit h → 0 gegen Null.
Folgerung 2.1 Sei f ∈ C 0 (I) mit I = [a, b], und F : [a, b] → R sei eine Stammfunktion von
f auf I, das heißt F 0 (x) = f (x) für alle x ∈ [a, b] 1 . Dann gilt für jedes x0 ∈ I
Z x
F (x) = F (x0 ) +
f (ξ) dξ.
(2.2)
x0
Beweis: Nach Folgerung 2.2 in Kapitel 3 und Satz 2.1 gibt es ein c ∈ R mit
Z x
F (x) = c +
f (ξ) dξ für alle x ∈ (a, b).
x0
Weiter ist jede Stammfunktion F von f auf [a, b] stetig in a und b nach Kapitel 3, Satz 1.1.
Durch Grenzübergang x & a bzw. x % b folgt
Z a
Z b
F (a) = c +
f (ξ)dξ, F (b) = c +
f (ξ) dξ.
x0
x0
Setze nun x = x0 und erhalte F (x0 ) = c.
Folgerung 2.2 (Berechnung von bestimmten Integralen mit einer Stammfunktion)
Die Funktion F : I = [a, b] → R sei Stammfunktion von f ∈ C 0 (I) auf I. Dann gilt
Z b
x=b
f (x) dx = F (b) − F (a) =: F (x) x=a
a
1
In den Intervallgrenzen bedeutet das F+0 (a) = f (a) bzw. F−0 (b) = f (b).
87
Beweis: Folgt aus (2.2) mit x0 = a, x = b.
Über den Hauptsatz bzw. Folgerung 2.2 lassen sich Differentiationsregeln aus Kapitel 3.1 in
Integrationsregeln übersetzen“. Dies wird im Folgenden durchgeführt.
”
Satz 2.2 (Partielle Integration) Seien f, g ∈ C 1 (I) mit I = [a, b]. Dann gilt
Z b
Z b
x=b
0
f 0 g.
f g = f (x) g(x) x=a −
a
a
Beweis: Es gilt nach der Produktregel
(f g)0 = f 0 g + f g 0
auf I = [a, b].
Folgerung 2.2 liefert die Behauptung.
Satz 2.3 (Substitutions- oder Transformationsregel) Sei I = [a, b], I ∗ = [α, β] und
ϕ ∈ C 1 (I ∗ ) mit ϕ(I ∗ ) ⊂ I. Dann gilt für f ∈ C 0 (I)
Z ϕ(β)
Z β
f (x) dx =
f ϕ(s) ϕ0 (s) ds.
ϕ(α)
α
Beweis: Wähle nach Satz 2.1 eine Stammfunktion F ∈ C 1 (I) von f . Dann gilt
Z ϕ(β)
x=ϕ(β)
f (x) dx = F (x) x=ϕ(α) (Folgerung 2.2)
ϕ(α)
s=β
F ϕ(s) s=α
Z β
=
(F ◦ ϕ)0 (s) ds (Folgerung 2.2)
α
Z β
=
F 0 ϕ(s) ϕ0 (s) ds (Kettenregel)
α
Z β
=
f ϕ(s) ϕ0 (s) ds.
=
α
Für die Anwendung
R b der Substitutionsregel ist folgendes Kochrezept nützlich: bei einem gegebenen Integral a f (y) dy möchten wir y = y(x) substituieren. Dazu berechnen wir
y = y(x)
dy = y 0 (x) dx.
⇒
Zur Umrechnung der Intervallgrenzen bestimmen wir die Umkehrfunktion ( Auflösen nach
”
x“)
x = x(y) ⇒ α = x(a), β = x(b).
Damit gilt
Z
a
b
f (x) dx =
b
Z
a
f y(x) y 0 (x) dx.
Im folgenden zeigen wir an einigen Beispielen, wie die Integrationsregeln angewandt werden.
Zunächst erhalten wir direkte Integrationsformeln immer dann, wenn die Stammfunktion
bekannt ist:
88
Beispiel 2.1 (Bekannte Ableitungsregeln und zugehörige Integrationsregeln)
α+1 x=b
Z b
x
α
x dx =
(α ∈ R\{−1}, a, b > 0)
α
+ 1 x=a
a
Z b
x=b
dx
= log x x=a , (a, b > 0)
a x
Z b
x=b
dx
= arctan x x=a , (a, b ∈ R).
2
a 1+x
Ein Beispiel für die Anwendung der partiellen Integration ist
Beispiel 2.2
x
Z
log u du =
1
Z
x
1 · log u du
1
=
u=x
u log u u=1 −
x
Z
1
u du
u
1
= x log x − (x − 1).
Eine schöne Anwendung von Satz 2.2 ist
Beispiel 2.3 (Wallis-Produkt) Wir berechnen hier An =
A0 = π/2
R π/2
0
sinn x dx. Offenbar gilt
x=π/2
und A1 = − cos x x=0 = 1.
Für n ≥ 1 leiten wir durch partielle Integration eine Rekursionsformel her:
Z π/2
An+1 =
sin x sinn x dx
0
=
n
−
| cos x
{zsin x}
= n
Z
=0
π/2
x=π/2
x=0
+n
sinn−1 x dx − n
Z
π/2
cos2 x sinn−1 x dx
0
Z
0
π/2
sinn+1 x dx,
0
wobei wir cos2 x = 1 − sin2 x benutzt haben. Es folgt
An+1 =
n
An−1
n+1
(n ≥ 1).
Durch Induktion erhalten wir
A2n =
A2n+1 =
Es folgt weiter
2n − 1 2n − 3
1
·
· . . . · · A0 =
2n
2n − 2
2
2n
2n − 2
2
·
· . . . · · A1 =
2n + 1 2n − 1
3
n
A2n
π Y 4k 2 − 1
= ·
.
A2n+1
2
4k 2
k=1
89
n
Y
2k − 1
2k
k=1
n
Y
k=1
2k
2k + 1
!
!
π
,
2
1.
Nun gilt An+1 =
R π/2
0
sinn+1 x dx ≤
1≤
R π/2
0
sinn x dx = An , und es folgt
An
An−1
n+1
≤
=
−→ 1.
An+1
An+1
n
Daraus ergibt sich die Produktdarstellung von Wallis
∞
Y
π
4k 2
2·2 4·4
=
=
·
· ...
2
2
4k − 1
1·3 3·5
k=1
Als nächstes behandeln wir Beispiele zur Substitutionsregel.
0
Beispiel 2.4 (Lineare Parameterwechsel) Mit der Substitution y = x−x
m haben wir dy =
1
m dx und x = x0 + my, also als neue Grenzen α = x0 + ma und β = x0 + mb. Es folgt die
Regel
Z x0 +mb
Z b
1
x − x0
f (y) dy =
f(
) dx.
m
m
a
x0 +ma
Beispiel 2.5 (Integration von
Z b 0
f (x)
dx
(x)
Za b fp
u 1 + u2 du
Za b
F 0 f (x) f 0 (x) dx
a
Ableitungen)
Z b
x=b
=
(log f )0 (x) dx = log f (x) x=a (f > 0),
aZ
u=b
1
3 0
3
1 b
=
(1 + u2 ) 2 du = (1 + u2 ) 2
.
3 a
3
u=a
x=b
= F f (x) x=a .
Beispiel
2.6 (Flächeninhalt unter Hyperbel) Zu berechnen ist das Integral A(x) =
Rx√
2
u − 1 du. Wir substituieren u = cosh t und erhalten du = sinh t dt, t = Arcosh u,
1
also
Z Arcosh x
A(x) =
sinh2 t dt
0
Z
1 Arcosh x 2t
=
(e + e−2t − 2) dt
4 0
t=Arcosh x
1
1 2t
−2t
− Arcosh x
=
(e − e )
8
2
t=0
(
)
t=Arcosh x
1
et + e−t et − e−t
=
− Arcosh x
2
2
2
t=0
1 p 2
=
x x − 1 − Arcosh x .
2
Für rationale Funktionen, also Quotienten von Polynomen, hat man ein spezielles Integrationsverfahren, die Partialbruchzerlegung, die wir hier nur an einem Beispiel vorführen:
Beispiel 2.7 (Partialbruchzerlegung) Um das Integral
wir den Ansatz
R 1/2
dx
−1/2 1−x2
zu berechnen, machen
1
1
A
B
(A − B)x + (A + B)
!
=
=
+
=
.
2
1−x
(1 + x)(1 − x)
1−x 1+x
1 − x2
90
Der Koeffizientenvergleich ergibt A = B = 1/2, also folgt
Z 1/2
Z 1/2 1
1/2
1/2
=
+
dx
2
1+x
−1/2 1 − x
−1/2 1 − x
1 + x x=1/2
= 1/2 · log
1 − x x=−1/2
= 1/2 · (log 3 − log 1/3)
= log 3.
Als wichtige Anwendung des Hauptsatzes wollen wir nun den Existenzbeweis für die
gleichförmige Kreisbewegung führen.
Satz 2.4 (Kapitel 3, Satz 3.2) Für gegebenes z0 ∈ C hat das Anfangswertproblem
c0 = ic auf R,
c(0) = z0
(2.3)
eine Lösung c : R → C.
Beweis: In den ersten beiden Schritten wird der Beweis auf das wesentliche Problem reduziert, das dann in Schritt 3 gelöst wird.
Schritt 1: Es reicht, den Fall z0 = 1 zu betrachten.
Ist nämlich c(t) die Lösung für z0 = 1, so ist c̃(t) = z0 c(t) die Lösung zu gegebenem z0 ∈ C.
Schritt 2: Es reicht, eine Lösung c : (−α, α) → C von (2.3) für z0 = 1 zu finden mit
limt%α c(t) = i und limt&−α c(t) = −i.
Wir setzen diese Lösung dann in drei Schritten (a),(b) und (c) auf ganz R fort:
(a) c(α) = i, c(−α) = −i.
Nach Voraussetzung ist c dann stetig auf [−α, α].
(b) c(t) = −c(t − 2α) für t ∈ [α, 3α].
Dann ist c stetig in α, da −c(−α) = −(−i) = i. Weiter gilt für t ∈ (α, 3α) die
Differentialgleichung, denn
c0 (t) = −c0 (t − 2α) = −i c(t − 2α) = i c(t).
Ferner haben wir limt→α c0 (t) = limt→α ic(t) = −1 ∈ C. Nach Übungsaufgabe 1, Serie
12, folgt c0 (α) = −1 = i c(α), das heißt die Differentialgleichung gilt auf (−α, 3α).
Außerdem ist c stetig auf [α, 3α] mit c(3α) = −c(α) = −i = c(−α).
(c) c(t + 4kα) = c(t) für t ∈ [−α, 3α] und k ∈ Z (4α-periodische Fortsetzung).
Dann folgt die Lösungseigenschaft auf ganz R analog zu (b).
Schritt 3: Konstruktion der Lösung c : (−α, α) → C für z0 = 1.
Definiere mit Satz 1.5 die Funktion
Z y
ds
√
ψ : (−1, 1) → R, ψ(y) =
.
1 − s2
0
91
Ry
Ry
Für y ≥ 0 gilt 0 (1 − s2 )−1/2 ds ≤ 0 (1 − s)−1/2 ds = [−2(1 − s)1/2 ]s=y
s=0 ≤ 2. Also existiert
der Grenzwert α := limy%1 ψ(y) ∈ (0, 2]. Da ψ(−y) = −ψ(y), folgt limy&1 ψ(y) = −α.
Betrachte nun mit Satz 3.2 in Kapitel 2 die Umkehrfunktion ϕ : (−α, α) → (−1, 1). Aus dem
Hauptsatz der Differential- und Integralrechnung sowie aus dem Satz über die Ableitung der
Umkehrfunktion, Satz 1.4 in Kapitel 3, ergibt sich
p
1
= 1 − ϕ2 (t).
ϕ0 (t) = 0
ψ (ϕ(t))
Weiter gilt, wieder nach Satz 3.2 in Kapitel 2, limt%α ϕ(t) = 1 und limt&−α ϕ(t) = −1. Sei
nun c̃ : (−1, 1) → C die Parametrisierung des Halbkreises {x + iy : x2 + y 2 = 1, x > 0} als
Graph über der y-Achse, das heißt
p
c̃(y) = 1 − y 2 + iy, y ∈ (−1, 1).
Wir behaupten, dass die Umparametrisierung
c = c̃ ◦ ϕ : (−α, α) → C, c(t) =
p
1 − ϕ(t)2 + iϕ(t)
die gesuchte Lösung von (2.3) ist. Denn es gilt
ϕϕ0
c0 = − p
1 − ϕ2
p
p
+ iϕ0 = −ϕ + i 1 − ϕ2 = i( 1 − ϕ2 + iϕ) = ic.
Da ϕ(0) = 0, ist außerdem c(0) = 1. Schließlich haben wir limt%α c(t) = limy%1 c̃(y) = i und
limt&−α c(t) = limy&−1 c̃(y) = −i. Also ist c die gesuchte Lösung.
Als Ansatz für den obigen Beweis sucht man eine Umparametrisierung
c = c̃ ◦ ϕ, so dass
p
0 =
2 lösen muss. Für
c0 = ic gilt. Als Bedingung ergibt sich, dass ϕ die Gleichung
ϕ
1
−
ϕ
p
0
2
die Umkehrfunktion ψ von ϕ ergibt sich daraus ψ (y) = 1/ 1 − y . Nun kann man wie oben
mit dem Beweis loslegen.
Bei der Definition des Riemannschen Integrals ist das Definitionsintervall I = [a, b] nach
Voraussetzung kompakt. Wir wollen nun kurz erläutern, wie auch unendliche Integrationsintervalle −∞ ≤ a < b ≤ ∞ und in den Intervallgrenzen unbeschränkte Funktionen im Rahmen
des Riemann-Integrals behandelt werden können.
Definition 2.1 Sei I = (a, b) mit −∞ ≤ a < b ≤ ∞. Die Funktion f : I → R sei Riemannintegrierbar
R c auf jedem kompakten
R b Teilintervall J ⊂ I. Falls für ein cR∈b I die Grenzwerte
limα&a α f (ξ) dξ und limβ%b c f (ξ) dξ existieren, so heißt das Integral a f (ξ) dξ konvergent
Rb
(bzw. a f (ξ) dξ existiert) und wir setzen
Z b
Z c
Z β
f (ξ) dξ = lim
f (ξ) dξ + lim
f (ξ) dξ.
α&a α
a
β%b c
Diese Definition ist unabhängig von der Wahl von c ∈ R, denn es gilt
Z ec
Z c
Z ec
f (ξ) dξ =
f (ξ) dξ +
f (ξ) dξ,
Z
α
β
e
c
α
β
f (ξ) dξ =
Z
c
f (ξ) dξ −
c
Z
c
92
e
c
f (ξ) dξ.
Beispiel 2.8

α+1 x=R

1
x

∞
=−
limR→∞
α
x dx =
α + 1 x=1
α+1

1
divergent


Z 1
für
divergent
α+1 x=1
α
x dx =
x
1

=
für
0
limε→0
α + 1 x=ε
α+1
Z ∞
xα dx = divergent für alle α ∈ R.
Z
für α < −1,
für α ≥ −1.
α ≤ −1,
α > −1.
0
Z
∞
−∞
dx
1 + x2
=
lim
Z
R→∞ 0
R
dx
+ lim
1 + x2 R→∞
Z
0
dx
1 + x2
−R
lim (arctan R) − lim arctan(−R)
R→∞
R→∞
π π
− −
= π.
=
2
2
=
93
Kapitel 5
Approximation von Funktionen
durch Reihen
Zur Motivation betrachten wir für eine gesuchte Funktion f : R → C das Anfangswertproblem
f 0 = λf,
für λ ∈ C.
f (0) = 1
Die Lösung ist uns bereits bekannt: nach Folgerung 3.4 in Kapitel 3 ist die eindeutig bestimmte Lösung dieses Anfangswertproblems die Funktion f (x) = eλx . Wir wollen aber
hier einen anderen, von Satz 2.4 in Kapitel 4 unabhängigen Lösungszugang entwickeln. Und
zwar wollen wir zunächst versuchen, die Gleichung näherungsweise zu lösen, indem wir einen
Ansatz der Form
n
X
fn (x) = a0 + a1 x + . . . + an xn =
ak xk
k=0
mit einem Polynom n-ten Grades fn machen. Wir berechnen
fn0 (x) = a1 + 2a2 x + . . . + n an xn−1 =
n
X
k ak xk−1 =
k=1
sowie
λ fn (x) =
n
X
n−1
X
(k + 1) ak+1 xk
k=0
λ ak xk .
k=0
Es gilt also
fn0
− λfn =
n−1
X
((k + 1) ak+1 − λak )xk − λan xn ,
fn (0) = a0 .
k=0
Wie vorhergesehen, ist das Anfangswertproblem auf diese Weise nicht exakt lösbar. Aber die
ak können so gewählt werden, dass fn die Gleichung bis auf einen Term der Ordnung xn löst.
Und zwar setzen wir
a0 = 1
(Anfangsbedingung), ak+1 =
95
λ
ak
k+1
für k = 0, 1, . . . , n − 1.
Dies ergibt ak =
λk
für k = 0, 1, . . . , n. Die Näherungslösung ist also die Summe
k!
fn (x) =
n
X
(λx)k
k=0
k!
,
und sie erfüllt fn0 − λfn = −λn+1 xn /n!. Es stellt sich die Frage, ob diese Näherungslösungen
fn mit n → ∞ gegen die tatsächliche Lösung f des Anfangswertproblems konvergieren. Wenn
ja, so folgt die Reihendarstellung
∞
X
(λx)k
eλx =
.
k!
k=0
Im Folgenden soll die Konvergenz von solchen unendlichen Reihen untersucht werden.
1
Reihen von reellen und komplexen Zahlen
Definition 1.1 Eine Folge (Sn )n∈N0 heißt (unendliche) Reihe mit Gliedern an ∈ C, falls
gilt:
n
X
Sn =
ak für alle n ∈ N0 .
k=0
Die Reihe heißt konvergent mit Wert S ∈ R, wenn die Folge (Sn )n∈N0 gegen S konvergiert:
∞
X
ak := lim
k=0
n→∞
n
X
an = lim Sn = S.
k=0
n→∞
Die Zahl Sn wird auch als n-te Partialsumme der Reihe bezeichnet. Oft wird die Reihe in der
Form a0 + a1 + a2 + . . . durch ihre ersten Glieder angegeben. Leider ist es auch üblich,
P die
Reihe selbst - unabhängig von der Frage der Konvergenz - ebenfalls mit dem Symbol ∞
k=0 ak
zu bezeichnen.
1
1
1
Beispiel 1.1 Die Reihe 1·2
+ 2·3
+ 3·4
+ . . . wird auch mit
ist jeweils die Folge (Sn )n∈N mit den Gliedern
S1 =
1
,
1·2
S2 =
1
1
2
+
= ,
1·2 2·3
3
S3 =
P∞
1
k=1 k(k+1)
bezeichnet. Gemeint
1
1
1
3
+
+
= ,...
1·2 2·3 3·4
4
Allgemein gilt
n X
1
X
n
n+1
1
1
1 X1
Sn =
−
=
−
=1−
.
k k+1
k
k
n+1
k=1
k=1
k=2
P∞
1
Also ist die Reihe konvergent mit Wert k=1 k(k+1) = 1.
P
Jede beliebige Folge (Sn )n∈N0 läßt sich als Reihe ∞
n=0 an schreiben. Wir müssen nur a0 = S0
und an = Sn − Sn−1 für n ≥ 1 setzen. Die oben benutzte, mit dem Index Null statt mit Eins
beginnende Numerierung tritt öfter auf. Es stellen sich nun zwei Fragen:
• Wie kann ich den Gliedern an der Reihe ansehen, ob die Reihe konvergiert bzw. divergiert?
96
• Im Fall der Konvergenz: welchen Wert hat die Reihe?
√
Bei der zweiten Frage ist zum Beispiel gemeint, ob eine bereits definierte Zahl wie 2, e,
π, . . . als Grenzwert einer Reihe dargestellt werden kann. Im Folgenden steht aber die erste
Frage im Zentrum des Interesses. Dabei ist das nächste Beispiel fundamental.
Beispiel 1.2 (Geometrische Reihe) Für die geometrische Reihe
mit z ∈ C gilt:
|z| < 1 ⇒ konvergent mit Wert
P∞
k=0 z
k
= 1+z+z 2 +. . .
1
,
1−z
|z| ≥ 1 ⇒ divergent.
Denn für |z| < 1 folgt aus der Formel für die geometrische Summe (Kapitel 1, Satz 2.2)
n
X
zk =
k=0
Dagegen gilt für |z| ≥ 1 mit Sn =
Pn
1 − z n+1
1
−→
.
1−z
1−z
k=0 z
k
|Sn+1 − Sn | = |z n+1 | = |z|n+1 ≥ 1,
so dass (Sn )n∈N keine Cauchyfolge sein kann.
P
1
1
1
Beispiel 1.3 (Harmonische Reihe) Die harmonische Reihe ∞
k=1 k = 1 + 2 + 3 + . . . ist
bestimmt divergent gegen +∞. Dies zeigen wir durch Vergleich mit einem Integral:
Betrachte die Treppenfunktion f : [1, ∞) → R mit
f (x) =
Es gilt f (x) ≥
1
x
1
k
für k ≤ x < k + 1
(k ∈ N).
für alle x ∈ [1, ∞), also
Z n+1
Z n+1
n
X
dx
1
=
f (x) dx ≥
= log(n + 1) → ∞
k
x
1
1
k=1
mit n → ∞, was zu zeigen war. Alternativ folgt die Divergenz der harmonischen Reihe,
indem wir in den Partialsummen wie folgt Klammern setzen:
1
1 1
1 1 1 1
1 1
1
+
+
+
+...
+
+ + +
+ + ... +
1
2 3
4 5 6 7
8 9
15
| {z } | {z } |
{z
} |
{z
}
≥1/2
≥1/2
≥1/2
≥1/2
In den Klammern werden jeweils die Zahlen k1 für 2m−1 ≤ k < 2m summiert für m ∈ N;
damit ist jede Klammer größer als 2m−1 · 2−m = 21 .
Beispiel 1.4 (Unendliche Dezimalbr
üche) Ist (nk )k∈N eine Folge von Ziffern nk ∈
P∞
{0, 1, . . . , q}, so ist die Reihe k=1 nk 10−k konvergent, vgl. Kapitel 1, Satz 4.2.
Wir beginnen die allgemeine Diskussion der Konvergenzfrage damit, dass wir die bekannten
Aussagen für Folgen in der Situation von Reihen reformulieren.
97
P∞
Lemma 1.1 (Konvergenzkriterium von Cauchy) Eine Reihe
k=0 ak
dann und nur dann, wenn es zu jedem ε > 0 ein N ∈ R gibt, so dass gilt:
m≥n>N
⇒
|
m
X
konvergiert
ak | < ε.
k=n
Beweis: Kapitel 1, Satz 4.1.
Satz 1.1 (Nullfolgentest) Wenn die Glieder ak einer Reihe
gegen Null gehen, so ist die Reihe divergent.
P∞
k=0 ak
mit k → ∞ nicht
Beweis:
Ist die Reihe konvergent, mit anderen Worten die Folge der Partialsummen Sn =
Pn
k=0 ak konvergent, so folgt an = Sn − Sn−1 → 0 mit n → ∞.
P∞
Lemma 1.2 (Reihen mit Gliedern ak ≥ 0) Eine reelle Reihe
k mit ak ≥ 0 für
k=0 a
P
alle k konvergiert genau dann, wenn die Folge der Partialsummen Sn = nk=0 ak nach oben
beschränkt ist.
Beweis: Da ak ≥ 0, ist die Folge (Sn ) monoton wachsend. Die Behauptung folgt aus Kapitel
1, Satz 4.3 und Satz 3.2.
Beispiel 1.5 Für s > 1 ist die Reihe
tion f : [1, ∞) → R mit
f (x) =
Da f (x) ≤
P∞
1
k=1 ks
1
(k + 1)s
konvergent. Betrachte dazu die Treppenfunk-
für k ≤ x < k + 1
(k ∈ N).
1
für alle x ∈ [1, ∞), folgt
xs
n
X
1
ks
= 1+
Z
n
f (x) dx
1
k=1
Z
n
dx
xs
1
x=n
1
1−s
= 1+
x
1−s
x=1
s
≤
.
s−1
≤ 1+
Also ist die Folge der Partialsummen beschränkt.
P∞
Definition
1.2
Die
Reihe
ak mit ak ∈ C heißt absolut konvergent, wenn die Reihe
k=0P
P∞
∞
k=0 |ak | konvergiert, das heißt
k=0 |ak | < ∞.
Lemma 1.3 (absolut konvergent ⇒ konvergent) Wenn die Reihe
vergiert, so ist sie konvergent.
98
P∞
k=0 ak
absolut kon-
Beweis: Sei ε > 0 gegeben. Nach Voraussetzung und dem Cauchykriterium, Lemma 1.1,
gibt es ein N ∈ R mit
m≥n>N
⇒
m
X
|ak | < ε
k=n
⇒
m
X
ak < ε.
k=n
Aus Lemma 1.1 folgt die Behauptung.
P
(−1)k−1
Beispiel 1.6 Die Reihe ∞
= 1 − 12 + 13 − . . . ist konvergent, aber nicht absolut
k=1
k
konvergent. Um die Konvergenz zu zeigen, betrachten wir getrennt die Folge der geraden bzw.
der ungeraden Partialsummen. Es gilt
1
1
+
> 0,
2n 2n − 1
1
1
−
< 0.
2n + 1 2n
S2n − S2n−2 = −
S2n+1 − S2n−1 =
Die Folge (S2n )n∈N ist also monoton wachsend, die Folge (S2n−1 )n∈N monoton fallend. Weiter
gilt für alle n ∈ N
1
S2n−1 − S2n =
> 0,
2n
und es folgt S2n ≤ S2n−1 ≤ S1 sowie S2n−1 ≥ S2n ≥ S2 . Nach Satz 4.3 in Kapitel 1 sind
somit beide Folgen (S2n ) und (S2n−1 ) konvergent. Wegen S2n−1 − S2n → 0 mit n → ∞ sind
die beiden Grenzwerte gleich und die gesamte Reihe (SP
k )k∈N konvergiert. Andererseits ist die
1
Reihe der Absolutbeträge aber die harmonische Reihe ∞
k=0 k , und diese ist nicht konvergent
nach Beispiel 1.3.
Der folgende Satz fasst die wesentlichen Kriterien für die absolute Konvergenz von Reihen
zusammen.
P
Satz 1.2 (Tests für absolute Konvergenz)PSei ∞
k=0 ak eine Reihe mit ak ∈ C. Ist eine
der drei folgenden Bedingungen erfüllt, so ist ∞
a
k=0 k absolut konvergent:
(a) Majorantenkriterium (Weierstraß M-Test)
P
Es gilt |ak | ≤ ck ∈ [0, ∞) mit ∞
k=0 ck < ∞.
(b) Quotientenkriterium
Es gibt ein θ ∈ [0, 1) und ein k0 ∈ N mit
|ak+1 |
|ak |
≤ θ für k ≥ k0 (ak 6= 0 für k ≥ k0 ).
(c) Wurzelkriterium
Es gibt ein θ ∈ [0, 1) und ein k0 ∈ N mit
p
k
|ak | ≤ θ für alle k ≥ k0 .
Umgekehrt ist die Reihe divergent, wenn gilt:
p
|ak+1 |
≥ 1 oder k |ak | ≥ 1 für k ≥ k0 .
|ak |
99
Bemerkung. In (b) oder (c) reicht es nicht, nur die Abschätzung
zu haben. Zum Beispiel gilt für
|ak+1 |
<1
|ak |
P∞ 1
bzw.
p
k
|ak | < 1
k=1 k
|ak+1 |
k
< 1,
=
|ak |
k+1
p
k
1
|ak | = √
<1
k
k
für alle k,
trotzdem ist die Reihe nicht konvergent (Beispiel 1.3).
Beweis des Satzes: Aussage (a) folgt aus Lemma 1.2, angewandt auf
Lemma 1.3. Voraussetzung (b) liefert per Induktion
|ak | ≤ θk−k0 |ak0 |
P∞
k=0 |ak |,
und aus
für k ≥ k0 .
Da die geometrische Reihe auf der rechten Seite konvergiert (Beispiel 1.2), folgt die Behauptung aus (a) und wir erhalten außerdem die Abschätzung
∞
X
|ak | ≤
k=k0
|ak0 |
.
1−θ
(1.1)
Unter der Voraussetzung (c) folgt
|ak | ≤ θk
für k ≥ k0 .
Wieder folgt die Behauptung durch M-Test mit der geometrischen Reihe. Die Abschätzung
lautet hier
∞
X
θ k0
|ak | ≤
.
(1.2)
1−θ
k=k0
Die Divergenzaussagen folgen unmittelbar aus dem Nullfolgentest Satz 1.1.
Beispiel 1.7 Für α ∈ C, z ∈ C betrachten wir die Binomialreihe
Bα (z) =
∞ X
α
k=0
k
z k = 1 + αz +
α(α − 1) 2
z + ...
2
Für α ∈ N0 bricht die Reihe nach k = α ab, denn es gilt
α(α − 1) · . . . · α − (k − 1)
α
=
.
k
k!
Nach Binomischem Lehhrsatz (Kapitel 1, Satz 2.1) gilt dann Bα (z) = (1 + z)α . Im Folgenden
sei oBdA α ∈
/ N0 . Außerdem setzen wir z 6= 0 voraus, denn für z = 0 ist Bα (z) = α0 = 1.
Unter diesen Annahmen folgt
α k
ak =
z 6= 0 für alle k ∈ N0 ,
k
100
und wir erhalten
ak+1 |α − k|
ak = k + 1 |z| −→ |z|
mit k → ∞.
Falls nun |z| < 1, so gilt |ak+1 /ak | ≤ θ < 1 für k ≥ k0 , wenn wir zum Beispiel θ :=
(1 + |z|)/2 < 1 und k0 ∈ N hinreichend groß wählen. Also ist die Binomialreihe für |z| < 1
absolut konvergent. Umgekehrt gilt im Fall |z| > 1 für hinreichend große k ≥ k0
|ak+1 /ak | ≥ 1
(falls |z| > 1).
Für |z| > 1 ist die Reihe also divergent. Für z ∈ C mit |z| = 1 können wir ohne weiteres
keine Aussage treffen.
Die Rechenregeln für Addition von konvergenten Reihen sowie Multiplikation mit komplexen
Zahlen ergeben sich direkt aus der entsprechenden P
Regel für konvergente
Folgen, siehe Satz
P∞
∞
3.3 a) in Kapitel
1.
So
ist
für
konvergente
Reihen
a
und
b
und
λ, µ ∈ R auch
k=0 k
k=0 k
P∞
die Reihe k=0 (λak + µbk ) konvergent und es gilt
∞
X
(λak + µbk ) = λ
k=0
∞
X
∞
X
+µ
k=0
bk .
k=0
Durch
P∞ Abänderung, Hinzufügen oder Weglassen von endlich vielen Gliedern in einer Reihe
k=0 ak wird die Konvergenz oder Divergenz nicht beeinflusst. Überlegen Sie, wie die Folge
der Partialsummen durch diese Operationen beeinflusst wird. Natürlich ändert sich im Fall
der Konvergenz in der Regel der Wert der Reihe, zum Beispiel haben wir
∞
X
k=n
ak = lim
m→∞
m
X
m
X
ak = lim
m→∞
k=n
ak −
k=0
n−1
X
ak
!
=
k=0
∞
X
ak −
k=0
n−1
X
ak .
k=0
P∞
P
Bei der Multiplikation von zwei Reihen ∞
k=0 ak und
k=0 bk treten die doppelt indizierten Produkte ak bl (k, l ∈ N0 ) auf. Es ist zunächst nicht klar, in welcher Reihenfolge diese
summiert werden sollen. Eine naheliegende Möglichkeit, das sogenannte Cauchyprodukt, ist
folgende: erst werden die n + 1 Produkte ak bl in jeder Diagonale k + l = n addiert, dann wird
die Konvergenz der resultierenden Reihe untersucht. Der folgende Satz besagt, dass dieses
Verfahren bei absolut konvergenten Reihen funktioniert.
Satz 1.3 (Cauchyprodukt) Die Reihen
Dann ist auch die Reihe
∞
X
cn
mit
P∞
cn =
k=0
k=0 ak
X
und
ak bl =
k+l=n
P∞
k=0 bk
n
X
seien absolut konvergent.
ak bn−k
k=0
absolut konvergent und es gilt
∞
X
k=0
ak ·
∞
X
k=0
bk =
∞
X
cn =
n=0
∞
X
n=0
101
X
k+l=n
ak bl
!
.
Beweis: Wir setzen für N ∈ N0
AN :=
N
X
|ak | →
k=0
∞
X
|ak | =: A
und
BN :=
k=0
N
X
|bk | →
k=0
∞
X
|bk | =: B.
k=0
Dann gilt
N
X
|cn | ≤
n=0
Also ist
P∞
n=0 cn
N X
X
|ak | |bl | ≤
n=0 k+l=n
X
|ak | |bl | = AN BN → A B < ∞.
0≤k,l≤N
absolut konvergent. Ferner haben wir
|A2N B2N −
2N
X
cn |
=
n=0
X
|
ak bl −
0≤k,l≤2N
X
X
≤
ak bl |
k+l≤2N
|ak | |bl |
0≤k,l≤2N, max(k,l)>N
=
A2N B2N − AN BN
→ 0
Somit konvergiert die Reihe
P∞
n=0 cn
Beispiel 1.8 Die Reihe f (z) =
ist
gegen A B.
∞
X
zk
k=0
mit N → ∞.
k!
ist absolut konvergent für alle z ∈ C. Denn für z 6= 0
k+1
z
/(k
+
1)!
= |z| ≤ 1
k+1
k
2
z /k
für k ≥ k0 ,
also ist das Quotientenkriterium anwendbar. Es folgt für z, w ∈ C aus dem Cauchyprodukt
und der Binomischen Formel
f (z) f (w) =
∞
∞
X
z k X wk
k!
k
k=0
k=0
∞ X
X
1 k l
z w
k!l!
k=0 k+l=n
∞
n X
1 X n k n−k
=
z w
n!
k
=
=
n=0
∞
X
n=0
k=0
(z + w)n
n!
= f (z + w).
Die Reihe f (z) erfüllt also die Funktionalgleichung der e-Funktion, siehe Kapitel 2, Satz 3.3.
Beim Cauchyprodukt trat das Problem der Summationsreihenfolge auf. Allgemein kann eine
Änderung der Summationsreihenfolge, eine sogenannte Umordnung, die Konvergenz bzw.
102
Divergenz einer Reihe beeinflussen. Betrachte z. B. für die Reihe 1 − 21 +
nachstehende Umordnung
1
1 1 1
1 1
1
1
1
1−
+
+ −
+
+ +
+
−
+ ....
2
3 5 4
7 9 11 13 6
1
3
− + . . . die
Während die Ausgangsreihe konvergiert (Beispiel 1.6), ist die so umgeordnete Reihe sogar
bestimmt divergent gegen +∞, denn die Summe der positiven Zahlen in jeder der Klammern ist mindestens 1/4. Zum Glück gibt es derart merkwürdige Phänomene bei absolut
konvergenten Reihen nicht.
P
Satz 1.4 (Umordnungsatz) SeiP
τ : N0 → N0 bijektiv. Falls ∞
k=0 ak absolut konvergent
∞
ist, so konvergiert auch die Reihe k=0 aτ (k) absolut und hat denselben Grenzwert.
P
Beweis: Sei S = ∞
n=0 an . Zu ε > 0 existiert ein n0 ∈ N mit
∞
X
|an | < ε/2.
n=n0
Sei m ≥ max{k ∈ N0 : τ (k) < n0 }. Aus τ (k) < n0 folgt dann k ≤ m, und wir können
folgendermaßen abschätzen:
m
X
S −
aτ (k) = S −
k=0
≤ S −
m
X
aτ (k) +
k=0, τ (k)<n0
m
X
k=0, τ (k)<n0
aτ (k) +
m
X
k=0, τ (k)≥n0
m
X
aτ (k) |aτ (k) |
k=0, τ (k)≥n0
X
nX
∞
0 −1
≤ S −
an +
|an |
n=n0
n=0
≤
2
ε ε
+ .
2 2
Potenzreihen
P
k
Eine Reihe des Typs P (z) = ∞
∈ C heißt Potenzreihe. Die
k=0 ak z mit Koeffizienten akP
n
k
Partialsummen der Potenzreihe sind die Polynome Pn (z) =
k=0 ak z . Folgende Fragen
interessieren uns:
• Für welche z ∈ C konvergiert die Potenzreihe P (z)?
• Lassen sich Eigenschaften der approximierenden Polynome wie Stetigkeit und Differenzierbarkeit auf die Potenzreihen Übertragen? Wenn ja, wie?
Die erste Frage hat eine überraschend klare und einfache Antwort. Wir brauchen dazu
folgenden Hilfssatz.
103
P
k
Lemma 2.1 (Abelsches Lemma) Sei ∞
k=0 ak z eine gegebene Potenzreihe mit Koeffizienten ak ∈ C. Für r ∈ (0, ∞) gebe es ein M ∈ [0, ∞), so dass gilt
|ak | rk ≤ M
für alle k ∈ N0 .
(2.1)
Auf jeder kleineren Kreisscheibe K% (0) = {z ∈ C : |z| ≤ %} mit Radius % ∈ [0, r) konvergiert
die Reihe dann absolut und gleichmäßig.
Beweis: Für z ∈ K% (0) gilt
k
|ak z | = |ak | r
k
|z|
r
k
≤M
% k
r
.
Die absolute Konvergenz
folgt aus dem Majorantenkriterium, durch Vergleich mit der geoP
metrischen Reihe ∞
M
(%/r)k ; diese konvergiert wegen %/r < 1. Weiter gilt
k=0
z ∈ K% (0)
⇒
|Pn (z) − P (z)| ≤
∞
X
∞ X
% k
(%/r)n+1
|ak z | ≤ M
≤M
.
r
1 − %/r
k
k=n+1
(2.2)
k=n+1
Also gilt für die Supremumsnorm auf der Kreisscheibe K% (0) die Abschätzung
kPn − P kK% (0) ≤ M
(%/r)n+1
→0
1 − %/r
mit n → ∞.
Im Bezug auf die beiden Konvergenzaussagen des Lemmas ist Folgendes zu beachten: der
Begriff absolute
Konvergenz bezieht sich auf eine Reihe von komplexen Zahlen, das heißt
P
k wird an einer festen Stelle z betrachtet. Dagegen bezieht sich der Begriff
P (z) = ∞
a
z
k=0 k
gleichmäßige Konvergenz auf die Folge von Funktionen Pn : K% (0) → C.
P
k
Satz 2.1 (Konvergenzradius) Zu jeder Potenzreihe P (z) = ∞
k=0 ak z gibt es genau ein
R ∈ [0, ∞], den Konvergenzradius, mit folgender Eigenschaft:
|z| < R ⇒ P (z)
absolut konvergent,
|z| > R ⇒ P (z)
divergent.
Beweis: Die Eindeutigkeit von R ist klar. Zur Existenz definieren wir
R = sup{|z| : P (z)
konvergiert} ∈ [0, ∞].
Ist |z| < R, so gibt es nach Definition ein z0 ∈ C mit |z| < |z0 | ≤ R, so dass P (z0 ) konvergiert.
Aus dem Nullfolgentest, Satz 1.1, folgt |ak z0k | → 0 mit k → ∞, also gilt die Voraussetzung
(2.1) in Lemma 2.1 mit r = |z0 | und geeignetem M < ∞. Da |z| < r, ist P (z) absolut
konvergent nach Lemma 2.1. Ist andererseits |z| > R, so ist P (z) divergent nach Definition
von R.
BeispielP
2.1 Der Konvergenzradius einer Potenzreihe kann R = 0 sein, wie das Beispiel
∞
k k
P (z) =
k=0 k z zeigt. Aus dem Nullfolgentest ergibt sich nämlich, dass die Reihe für
kein z ∈ C mit |z| > 0 konvergieren kann. Dass auch R = +∞ möglich ist, sieht man am
P
zk
Beispiel der Exponentialreihe P (z) = ∞
k=0 k! , vgl. Beispiel 1.8. Eine Potenzreihe mit endlichem, positiven
Konvergenzradius
ist schließlich die in Beispiel 1.7 betrachtete Binomialreihe
k
P
α
Bα (z) = ∞
z
;
für
α
∈
/
N
hat
diese Reihe den Konvergenzradius R = 1.
0
k=0 k
104
Wir kommen jetzt zu der zweiten Frage, die am Anfang des Abschnitts formuliert wurde.
Unser Ziel ist es,Pdie Stetigkeit – anschließend die Differenzierbarkeit
– der PolynomfunkP
k zu übertragen. Hierzu
tionen Pn (z) = nk=0 ak z k auf die Potenzreihe P (z) = ∞
a
z
k=0 k
ist allgemein zu untersuchen, unter welchen Voraussetzungen an die Konvergenz fn → f einer Funktionenfolge die Eigenschaft der Stetigkeit – sowie im Anschluss die Eigenschaft der
Differenzierbarkeit – erhalten bleiben.
Satz 2.2 (Gleichmäßige Konvergenz und Stetigkeit) Die Funktionen fn : D → Rp
mit D ⊂ Rm seien stetig. Falls die Folge (fn )n∈N gleichmäßig gegen f : D → Rp konvergiert,
das heißt
kfn − f kD = sup |fn (x) − f (x)| → 0 mit n → ∞,
x∈D
so ist auch f stetig auf D.
Beweis: Sei x0 ∈ D und ε > 0 gegeben. Wähle N ∈ N mit kf − fN kD < 3ε . Dann wähle
δ > 0 mit der Eigenschaft
|x − x0 | < δ
⇒
ε
|fN (x) − fN (x0 )| < .
3
Es folgt für |x − x0 | < δ mit der Dreiecksungleichung
|f (x) − f (x0 )| ≤ |f (x) − fN (x)| + |fN (x) − fN (x0 )| + |fN (x0 ) − f (x0 )| .
|
{z
} |
{z
} |
{z
}
< 3ε
< 3ε
< 3ε
P
k
Folgerung 2.1 Sei P (z) = ∞
mit Konvergenzradius R > 0. Dann
k=0 ak z eine Potenzreihe
Pn
k
konvergiert die Folge der Polynome Pn (z) =
k=0 ak z gleichmäßig gegen P (z) auf jeder
Kreisscheibe K% (0) = {z ∈ C : |z| ≤ %} mit % < R, und P ist stetig auf der offenen
Kreisscheibe UR (0).
P
k
k
Beweis: Wähle r ∈ (%, R). Dann ist ∞
k=0 ak r konvergent nach Satz 2.1, und |ak |r ist
beschränkt nach dem Nullfolgentest (Satz 1.1). Die gleichmäßige Konvergenz auf K% (0) folgt
aus Lemma 2.1. Die Stetigkeit von P auf UR (0) folgt nun aus Satz 2.2.
Wie bei Polynomen, siehe Satz 1.1 in Kapitel 2, stellt sich auch bei Potenzreihen die Frage,
ob durch eine hinreichend große Menge von Funktionswerten die Koeffizienten ak eindeutig
festgelegt sind. Dies können wir nun beantworten.
P∞
k und
Satz 2.3 P
(Koeffizientenvergleich für Potenzreihen) Seien P (z) =
k=0 ak z
∞
k
Q(z) =
Potenzreihen mit positivem Konvergenzradius. Falls es eine Folge
k=0 bk z
zi → 0, zi 6= 0 gibt mit P (zi ) = Q(zi ) für alle i ∈ N, so folgt ak = bk für alle k ∈ N0
und die Potenzreihen sind gleich.
Beweis: Indem wir von P zu P − Q übergehen, können wir bk = 0 für alle k ∈ N0 annehmen.
Wäre die Behauptung falsch, so gilt für ein n ∈ N0
a0 = a1 = . . . = an−1 = 0,
105
aber an 6= 0.
Ist R > 0 der Konvergenzradius von P , so folgt für 0 < |z| < R und jedes m ∈ N0 , da
a0 = . . . = an−1 = 0,
m
X
k=0
an+k z k = z −n
m
X
an+k z n+k = z −n
n+m
X
aj z j → z −n P (z)
mit m → ∞.
j=0
k=0
P∞
Die Potenzreihe F (z) = k=0 an+k z k konvergiert also für |z| < R, und aus Folgerung 2.1
schließen wir
an = F (0) = lim F (zi ) = lim (zi−n P (zi )) = 0,
i→∞
i→∞
ein Widerspruch zur Annahme.
Wir kommen nun schließlich zur Differenzierbarkeit von Potenzreihen. Auch hierzu brauchen
wir erst ein allgemeines Resultat:
Satz 2.4 (Vertauschung von Konvergenz und Ableitung) Sei fn ∈ C 1 (I) eine Folge
stetig differenzierbarer Funktionen, wobei I = (a, b) ⊂ R. Es möge gelten:
(i) Die Folge fn konvergiert punktweise gegen f : I −→ R.
(ii) Die Folge fn0 konvergiert gleichmäßig gegen g : I −→ R.
Dann ist f ∈ C 1 (I) und es gilt f 0 = g.
Beweis: Für x0 ∈ I gilt nach dem Hauptsatz der Differential- und Integralrechnung (Kapitel
4, Satz 2.1)
Z
x
fn (x) = fn (x0 ) +
fn0 (ξ) dξ
∀x ∈ I.
x0
Mit n → ∞ folgt aus der Vertauschbarkeit von Integral und gleichmäßiger Konvergenz (Kapitel 4, Satz 1.4)
Z x
f (x) = f (x0 ) +
g(ξ) dξ ∀x ∈ I.
x0
Die Funktion g ist stetig nach Satz 2.2, also folgt aus dem Hauptsatz f ∈ C 1 (I) und f 0 = g.
Für Funktionen f : I → Rp oder f : I → C gilt der Satz entsprechend. Dies ergibt sich sofort
durch Anwendung auf die einzelnen Koordinatenfunktionen, vgl. Lemma 1.1 in Kapitel 3.
Bei der Anwendung auf Potenzreihen ist zunächst zu beachten, dass wir den Begriff der
Ableitung nur für für Funktionen f = f (x) einer reellen Variablen erklärt haben. Deshalb
schränken wir die Potenzreihen im Folgenden auf das reelle Intervall I = (−R, R) ⊂ R ein,
wobei R > 0 der Konvergenzradius ist.
P∞
k
Satz 2.5 (Differenzierbarkeit von Potenzreihen) Die Potenzreihe P (z) =
k=0 ak z
mit ak ∈ C habe den Konvergenzradius R > 0. Dann ist die Funktion
P : (−R, R) → C, P (x) =
∞
X
ak xk
k=0
unendlich oft differenzierbar und die Ableitung kann durch gliedweises Differenzieren der
Reihe berechnet werden:
∞
X
0
P (x) =
(k + 1)ak+1 xk füf alle x ∈ (−R, R).
(2.3)
k=0
106
Beweis: Für Pn (x) =
Pn
k
k=0 ak x
Pn0 (x) =
gilt
n
X
n−1
X
kak xk−1 =
k=1
(k + 1)ak+1 xk .
k=0
Die Folge der Funktionen Pn : (−R, R) → R konvergiert punktweise gegen P nach Satz
2.1.
dass die durch gliedweises Differenzieren erhaltene Potenzreihe Q(z) =
P∞ Wir zeigen nun,
k
k=0 (k + 1)ak+1 z ebenfalls den Konvergenzradius R > 0 hat. Das bedeutet nach Folgerung
2.1, dass die Folge Pn0 auf jedem kleineren Teilintervall [−%, %] ⊂ (−R, R) gleichmäßig gegen
die Funktion Q : [−%, %] → C konvergiert. Nach Satz 2.4 ist dann P : (R, R) → C stetig
differenzierbar und hat die Ableitung Q : (R, R) → C, was zu zeigen war.
Für 0 < |z| < R wähle ein r ∈ (|z|, R), zum Beispiel r = (|z| + R)/2. Es gibt dann ein
M < ∞ mit |ak | rk ≤ M für alle k ∈ N0 wegen des Nullfolgentests (Satz 1.1), und es folgt
|(k + 1)ak+1 z k | = |ak+1 |rk+1
k+1
r
|z|
r
k
≤
M (k + 1)
r
|z|
r
k
.
Die rechte Reihe konvergiert aber absolut nach dem Quotientenkriterium, denn
k + 2 |z|
|z|
→
<1
k+1 r
r
mit k → ∞.
Damit ist der Satz gezeigt.
Jetzt stehen alle Hilfsmittel zur Verfügung, um die Potenzreihenentwicklungen der klassischen
analytischen Funktionen herzuleiten.
Satz 2.6 (Potenzreihenentwicklung der Exponentialfunktion) Es gilt
ez =
∞
X
zk
k=0
für alle z ∈ C.
k!
(2.4)
Beweis: Für λ ∈ C betrachten wir die Potenzreihe
P (z) =
∞
X
λk
k=0
k!
zk .
Nach dem Quotientenkriterium, vgl. Beispiel 1.8, hat P den Konvergenzradius R = +∞.
Aus Satz 2.5 folgt für alle x ∈ R
P 0 (x) =
∞
X
(k + 1)
k=0
λk+1 k
x = λ P (x).
(k + 1)!
Also ist P : R → C Lösung des Anfangswertproblems
f 0 = λf
auf R,
f (0) = 1.
Aus Folgerung 3.4 ergibt sich P (x) = eλx für alle x ∈ R, und mit x = 1 folgt die Behauptung,
indem wir λ durch z ersetzen.
107
Durch die Potenzreihe ergibt sich ein zweiter, von Satz 2.4 in Kapitel 4 unabhängiger Zugang
zur Lösung des Anfangswertproblems für die gleichförmige Kreisbewegung. Und zwar ergibt
sich wie oben gezeigt, dass die Funktion
c(t) =
∞ k
X
i
k=0
k!
tk
die Differentialgleichung c0 = ic auf ganz R löst und den Anfangswert c(0) = 1 hat.
Folgerung 2.2 (Potenzreihenentwicklung von cos und sin) Für alle x ∈ R gilt
cos x =
sin x =
∞
X
k=0
∞
X
(−1)k
x2k
x2 x4
=1−
+
− +...
(2k)!
2!
4!
(2.5)
(−1)k
x2k+1
x3 x5
=x−
+
− +...
(2k + 1)!
3!
5!
(2.6)
k=0
Beweis: Nach Satz 2.6 gilt
ix
e
=
∞
X
(ix)n
n=0
=
n!
∞
X
k=0
∞
X
x2k
x2k+1
(−1)
+i
(−1)k
.
(2k)!
(2k + 1)!
k
k=0
Die Behauptung folgt aus der Definition 3.4 von eix , nämlich aus der Eulerschen Formel.
Satz 2.7 (Potenzreihenentwicklung von log) Für x ∈ (−1, 1) ⊂ R gilt
log(1 + x) =
∞
X
(−1)k−1
k=1
k
xk = x −
x2 x3
+
− +....
2
3
(2.7)
Beweis: Wir berechnen für f (x) = log(1 + x) mit x ∈ (−1, 1)
∞
X
1
f (x) =
=
(−1)k xk ,
1+x
0
k=0
wobei im letzten Schnitt die Formel für die geometrische Reihe benutzt wurde. Die Reihe
P
(−1)k−1 k
P (x) = ∞
x konvergiert für x ∈ (−1, 1) nach dem Quotientenkriterium. Aus Satz
k=1
k
2.5 folgt nun
∞
X
(−1)k
0
P (x) =
(k + 1) xk = f 0 (x) (x ∈ (−1, 1).
k+1
k=0
Da P (0) = 0 = f (0), folgt f (x) = P (x).
108