Analysis I

Werbung
Analysis
I
Wintersemester 2001/2002
Prof. Dr. E. Kuwert
Mathematisches Institut
Universität Freiburg
Inhaltsverzeichnis
1 Reelle Zahlen, Folgen und Grenzwerte
1
Die natürlichen Zahlen N = {1, 2, 3, . . .}
2
Körperaxiome und Anordnung von R . .
3
Grenzwerte von Folgen . . . . . . . . . .
4
Vollständigkeit der reellen Zahlen . . . .
5
Teilmengen von R und von Rn . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
4
8
14
22
2 Funktionen und Stetigkeit
1
Polynome und komplexe Zahlen . . . . . .
2
Stetige Funktionen . . . . . . . . . . . . .
3
Zwischenwertsatz und Umkehrfunktionen
4
Existenz von Extremwerten . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
42
48
54
3 Differentialrechnung für Funktionen einer
1
Die Ableitung: Definition und Regeln . .
2
Mittelwertsatz und Anwendungen . . . . .
3
Die Winkelfunktionen . . . . . . . . . . .
Variablen
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
57
57
63
69
4 Integralrechnung
1
Das Riemannsche Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Ableitung und Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
77
86
5 Approximation von Funktionen durch Reihen
95
1
Reihen von reellen und komplexen Zahlen . . . . . . . . . . . . . . . . . . . . 96
2
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
i
Kapitel 1
Reelle Zahlen, Folgen und
Grenzwerte
Die reellen Zahlen R bilden das Fundament, aber nicht den eigentlichen Gegenstand der
Analysis. Ihre Konstruktion aus den rationalen Zahlen
Q={
p
: p, q ∈ Z, q 6= 0}
q
ist zuerst von R. Dedekind (1872) und G. Cantor (1883) durchgeführt worden. Die
Differential- und Integralrechnung geht aber natürlich auf I. Newton und G. Leibniz (ca.
1680) zurück. Es ist also 200 Jahre lang mit großem Erfolg Analysis betrieben worden, ohne
dass eine Definition der reellen Zahlen vorlag! Tatsächlich kommt es nur auf einige Grundeigenschaften der reellen Zahlen an, die wir hier als Axiome formulieren werden. Sie zerfallen
in drei Gruppen:
1. Die Körperaxiome (K)
2. Die Anordnungsaxiome (A)
3. Das Vollständigkeitsaxiom (V)
Es ist die Vollständigkeit, die die reellen Zahlen von den rationalen Zahlen unterscheidet. Sie
wird es erlauben, Zahlen und später Funktionen durch Bildung von Grenzwerten zu erklären.
Der Grenzwertbegriff ist die zentrale Idee der Analysis. Im folgenden nehmen wir an, dass
die reellen Zahlen und die Folge der Zahlbereichserweiterungen
N⊂Z⊂Q⊂R
schon zur Verfügung stehen. Das Konstruktionsverfahren von Cantor werden wir bei Gelegenheit mal besprechen.
1
Die natürlichen Zahlen N = {1, 2, 3, . . .}
Diese und nur diese sind nach L. Kronecker von Gott gemacht und sind uns allen seit der
frühen Kindheit vertraut. Sie fangen bei 1 ∈ N an und jedes n ∈ N hat eine Nachfolgerin n +
1
1 ∈ N. Tatsächlich sind die natürlichen Zahlen durch diese beiden Tatsachen charakterisiert,
und zwar gilt das Induktionsprinzip: Hat eine Menge M ⊂ N die beiden Eigenschaften
(i)
1∈M
(ii) n ∈ M ⇒ n + 1 ∈ M,
und
so ist schon M = N. Konsequenz dieses Prinzips ist das sehr wichtige
Beweisverfahren der vollständigen Induktion: Gegeben sei eine Folge A1 , A2 , A3 , . . .
von Aussagen. Es möge gelten:
(i)
A1 ist wahr.
(ii)
An ist wahr ⇒ An+1 ist wahr.
Dann sind alle Aussagen An wahr.
Beispiel 1.1 1 + 2 + . . . + n =
Pn
k=1 k
=
n(n+1)
.
2
Beweis:
1(1 + 1)
⇒ A1 ist wahr
2
n+1
n
X
X
k =
k + (n + 1)
1 =
k=1
k=1
=
=
n(n + 1)
+ (n + 1) wegen An
2
(n + 1)((n + 1) + 1)
.
2
Also gilt An ⇒ An+1 und die Aussage ist bewiesen.
Satz 1.1 Die Anzahl der möglichen Anordnungen von n ≥ 1 verschiedenen Dingen ist
1 · 2 · . . . · (n − 1) · n =: n!
(1.1)
Beweis: Wegen 1! = 1 ist A1 wahr. Seien nun n + 1 Dinge gegeben. Indem wir durchnumerieren, können wir annehmen, dass dies die Zahlen 1, 2, . . . , n + 1 sind. Für festes
k ∈ {1, 2, . . . , n + 1} betrachte die Menge Mk der Anordnungen, bei denen n + 1 an der Stelle
k steht. Etwa für n = 3 und k = 2:
M2 = {(1, 4, 2, 3), (1, 4, 3, 2), (2, 4, 1, 3), (2, 4, 3, 1), (3, 4, 1, 2), (3, 4, 2, 1)}
Nach Induktion hat Mk genau k! Elemente. Aber jede der Anordnungen liegt in einer und
nur in einer der Mengen Mk , folglich ergeben sich (n + 1)n! = (n + 1)! Anordnungen.
Definition 1.1 (Binomialkoeffizienten) Für α ∈ R und k ∈ N0 setzen wir
k
α
α · (α − 1) · . . . · (α − k + 1) Y α − j + 1
=
=
,
k
1 · 2 · ... · k
j
j=1
wobei per Definition
Q0
j=1 . . .
= 1 (leeres Produkt), und folglich
2
α
0
= 1.
Die Binomialkoeffizienten treten sehr oft bei Abzählungsfragen auf, besonders beim Binomischen Lehrsatz, siehe unten.
Satz 1.2 Die Anzahl der k-elementigen Teilmengen einer Menge mit n Elementen, wobei
n ∈ N und k ∈ {1, 2, . . . , n}, ist gleich nk .
Beweis: Durch vollständige Induktion über n, wobei die Behauptung jeweils für alle k gezeigt
wird. Für n = 1 ist alles klar. Sei nun die Menge {1, 2, . . . , n + 1} gegeben. Für k = 1 und
k = n + 1 ist die Sache offensichtlich, also sei 2 ≤ k ≤ n. Die k-elementigen Teilmengen
zerfallen in zwei disjunkte Teilmengen:
Typ A: enthält die Nummer n + 1
Typ B: enthält die Nummer n + 1 nicht.
Bei Typ A können wir noch k − 1 Zahlen aus {1, 2, . . . , n} wählen, während wir für Typ B
alle k Elemente aus {1, 2, . . . , n} aussuchen müssen. Damit erhalten wir für die Gesamtzahl
n
n
n(n − 1) · . . . · (n − k + 2) n(n − 1) · . . . · (n − k + 1)
+
+
=
1 · 2 · . . . · (k − 1)
1 · 2 · ... · k
k−1
k
(k + n − k + 1)n(n − 1) · . . . · (n − k + 2)
=
1 · 2 · ... · k
n+1
=
,
k
was zu zeigen war.
Die im Induktionsschluss auftretende Formel gilt allgemein:
α
α
α+1
+
=
für α ∈ R, k ∈ N.
k−1
k
k
(1.2)
Die Formel erlaubt die rekursive Berechnung der Binomialkoeffizienten
ecksschema von B. Pascal (1623-1662)1 :
n=0
n=1
n=2
n=3
n=4
n=5
n=6
n
k
nach dem Drei-
1
1
1
1
1
1
1
2
3
4
5
6
1
1
3
6
10
15
1
4
10
20
1
5
15
1
6
1
Am Diagramm offensichtlich ist die Symmetrieeigenschaft
n
n
=
für n ∈ N0 , k ∈ {0, 1, . . . , n}.
k
n−k
1
Das Schema findet sich schon bei Chu Shih-Chieh: Der Spiegel der vier Elemente, 1303
3
(1.3)
Sie ergibt sich aus der kombinatorischen Interpretation nach Beispiel 3: es ist äquivalent, k
Elemente auszuwählen oder n − k Elemente (nicht) auszuwählen. Alternativ folgt das auch
aus der Darstellung
n
n!
für n ∈ N0 , k ∈ {0, 1, . . . , n}.
=
k
k! (n − k)!
(1.4)
Eine zum Induktionsprinzip äquivalente Eigenschaft der natürlichen Zahlen lautet
Satz 1.3 (Prinzip der kleinsten natürlichen Zahl) Jede nichtleere Menge M ⊂ N besitzt ein kleinstes Element.
Beweis: (durch Widerspruch) Angenommen, es gibt kein kleinstes Element in M ⊂ N. Wie
zeigen induktiv {1, 2, . . . , n} ∩ M = ∅. Für n = 1 ist das richtig, denn sonst wäre 1 ∈ M das
kleinste Element. Ist die Behauptung für n ∈ N gezeigt, so gilt sie auch für n + 1, denn sonst
wäre n + 1 kleinstes Element. Also gilt die Behauptung für alle n ∈ N, und M ist die leere
Menge.
Umgekehrt ergibt sich das Induktionsprinzip aus dem Prinzip der kleinsten natürlichen Zahl:
Sei nämlich M ⊂ N mit 1 ∈ M und der Nachfolgereigenschaft n ∈ M ⇒ n + 1 ∈ M . Wir
zeigen, dass M̂ := N\M leer ist. Andernfalls gibt es eine kleinste Zahl m ∈ M̂ . Nach
Voraussetzung ist nicht m = 1. Dann ist aber m − 1 ∈ M und nach Voraussetzung auch
(m − 1) + 1 = m ∈ M , ein Widerspruch.
2
Körperaxiome und Anordnung von R
Die Körperaxiome (K) betreffen die algebraische Struktur von R mit den Rechenoperationen
Addition “+” und Multiplikation “·”. Sie lauten wie folgt:
+
•
Assoziativgesetz:
Kommutativgesetz:
Neutrales Element:
(a + b) + c = a + (b + c)
(a · b) · c = a · (b · c)
a+b=b+a
a·b=b·a
Es gibt Zahlen 0 ∈ R und 1 ∈ R mit 1 6= 0, so dass
für alle a ∈ R gilt:
a·1=a
a+0=a
Inverses Element:
Zu jedem a ∈ R gibt es Lösungen x, y ∈ R der Gleichungen
a · y = 0 falls a 6= 0
a+x=0
Distributivgesetz:
a · (b + c) = a · b + a · c.
Es gibt tatsächlich viele verschiedene Zahlbereiche, in denen diese Gesetze gelten (Körper),
zum Beispiel sind die Regeln auch für die rationalen Zahlen erfüllt. Selbst die Menge {0, 1} ist
mit der Regel 1 + 1 = 0 (und sonst den üblichen Verknüpfungen) ein Körper. Die folgenden
beiden Sätze benutzen nur die obigen Axiome – sie gelten also in jedem Körper.
4
Satz 2.1 (Binomische Formel) Für a, b ∈ R und n ∈ N gilt
(a + b)n =
n X
n
k=0
k
an−k bk .
(2.1)
Beweis:
(a + b)n = (a + b) · (a + b) · . . . · (a + b) .
|
{z
}
n Faktoren
Beim Ausmultiplizieren (Distributivgesetz) erhalten wir Terme vom Typ
a · b · b · . . . · a,
die jeweils aus n Faktoren bestehen. Mit dem Kommutativgesetz können wir umordnen
zu Termen der Form an−k bk mit 0 ≤ k ≤ n; es bleibt zu bestimmen, wie oft ein solcher
Term vorkommt. Ich erhalte bk dann und nur dann, wenn ich aus den n Klammern k Stück
auswähle, wo ich b als Faktor nehme. In den andern Klammern muss ich dann a nehmen.
Nach Satz 1.2 kommt der Term an−k bk also genau nk mal vor, was zu zeigen war.
Alternativ folgt der Satz auch durch vollständige Induktion über n, und zwar gilt der Induktionsanfang n = 1 wegen
1 1 0
1 0 1
(a + b) =
a b +
a b .
0
1
1
n=1:
Der Induktionsschluss ergibt sich wie folgt:
(a + b)n+1 = (a + b)
n X
n
k
k=0
=
n X
n
k=0
k
an−k bk (Induktionsannahme)
n−k+1 k
a
b +
n X
n
k=0
an−k bk+1
n X
n
= a
+
a
b +
an−(k−1) bk + bn+1
k
k−1
k=1
k=1
n X
n
n
= an+1 +
+
an+1−k bk + bn+1
k
k−1
k=1
n+1
X n + 1
=
an+1−k bk nach Gleichung (1.2).
k
n+1
n X
n
k
n+1−k k
k=0
Ebenso wichtig ist die Formel für die
Satz 2.2 (Geometrische Summe) Für q ∈ R, q 6= 1 gilt
n
X
1 − q n+1
.
1−q
qk =
k=0
5
(2.2)
Beweis: . Wir berechnen mit dem ,,Teleskopsummen–Trick”
1−q
n+1
=
n
X
k
(q − q
k+1
)=
k=0
n
X
k
(1 − q) q = (1 − q)
k=0
n
X
qk .
k=0
Die Behauptung folgt nach Division durch 1 − q.
Wir stellen uns die reellen Zahlen als Punkte auf einer Geraden vor, die mit einer Richtung
versehen ist. Es ist dann ein Größenvergleich für je zwei Zahlen a, b ∈ R möglich: b ist größer
als a, wenn b rechts von a liegt. Der Größenvergleich beruht auf folgenden Gesetzen, den
Anordnungsaxiomen (A):
A1 Für jedes a ∈ R gilt genau eine der Relationen a > 0, a = 0, −a > 0.
A2 Aus a > 0, b > 0 folgt a + b > 0 und a · b > 0.
A3 Archimedisches Axiom: zu jeder Zahl ε ∈ R, ε > 0, existiert eine natürliche Zahl n ∈ N
mit 1/n < ε.
Überlegen Sie, dass alle diese Regeln auch für die rationalen Zahlen Q gelten. Für −a > 0
schreiben wir auch a < 0 und setzen a > b ⇔ a − b > 0. Aus A1 und A2 folgen eine Reihe
von Regeln, die in den Anwesenheitsübungen gezeigt werden sollen:
1. Für a, b ∈ R gilt genau eine der Relationen a > b, a = b oder a < b.
2. Aus a > b, b > c folgt a > c (Transitivität).
3. Aus a > b folgt




1/a
a+c
a·c



a·c
<
>
>
<
1/b, falls b > 0
b + c immer
b · c, wenn c > 0
b · c, wenn c < 0
4. Für a 6= 0 ist a2 > 0.
5. Aus a > b und c > d folgt
a + c > b + d, immer
a · c > b · d, falls b, d > 0
6. Für b ∈ N gilt n > 0.
Definition 2.1 (Betrag einer reellen Zahl) Der Betrag von a ∈ R ist
a falls a ≥ 0
|a| =
−a falls a < 0.
(2.3)
Der Betrag von a ist der Abstand von a zu Null. Es gelten folgende Regeln, die durch
Fallunterscheideung bewiesen werden:
|a + b| ≤ |a| + |b| (Dreiecksungleichung)
||a| − |b|| ≤ |a − b|
|a · b| = |a| · |b|
a ≤ |a|.
In der Analysis spielen Ungleichungen bzw. Abschätzungen eine sehr große Rolle.
6
Satz 2.3 (Bernoullische Ungleichung) Für x ∈ R, x ≥ −1 und n ∈ N gilt
(1 + x)n ≥ 1 + nx.
(2.4)
Beweis: Durch Induktion über n ∈ N. Für n = 1 gilt Gleichheit, und wegen 1 + x ≥ 0
erhalten wir
(1 + x)n+1 = (1 + x)(1 + x)n
≥ (1 + x)(1 + nx) nach Induktionsannahme
= 1 + (n + 1)x + nx2
≥ 1 + (n + 1)x.
Bis jetzt haben wir vom Archimedischen Axiom, das oft auch nach Eudoxos benannt wird,
keinen Gebrauch gemacht. Wenn wir die rationalen Zahlen Q = {m/n : m ∈ Z, n ∈ N} als
Wegmarken auf der Zahlengeraden auffassen, so werden wir jetzt als Folge des Axioms A3
sehen, dass es in jedem noch so kleinen Abschnitt rationale Zahlen gibt.
Satz 2.4 (Q ist dicht in R) Zu je zwei reellen Zahlen a, b ∈ R mit a < b gibt es eine
rationale Zahl q ∈ Q mit a < q < b.
Beweis: Wir können b > 0 annehmen, denn sonst gehen wir zu a0 = −b, b0 = −a über.
Ausserdem ist o.B.d.A. a ≥ 0, da wir andernfalls einfach q = 0 setzen. Nach A3 existiert ein
n ∈ N mit 1/n < b − a. Betrachte nun die Menge
M = {k ∈ N : k/n > a} ⊂ N.
M ist nichtleer: falls a = 0 so ist zum Beispiel 1 ∈ M , andernfalls gibt es nach A3 ein k ∈ N
mit 1/k < 1/na bzw. k/n > a. Sei m ∈ M das kleinste Element nach Satz 1.3. Dann ist
einerseits m/n > a und andererseits (m − 1)/n ≤ a, also
m
m−1 1
=
+ < a + (b − a) = b.
n
n
n
Die Zahl q = m/n leistet somit das Verlangte.
Satz 2.5 (Irrationalität von
√
2) Die Gleichung x2 = 2 ist in Q nicht lösbar.
Beweis: (durch Widerspruch) Angenommen, es sei x2 = 2 mit x = p/q und p, q ∈ N. Nach
Kürzen des Bruchs können wir annehmen, dass p und q keine gemeinsamen Teiler haben, das
heißt ihr größter gemeinsamer Teiler ist (p, q) = 1. Nun ist aber
p2 = 2q 2 ⇒ p2 gerade ⇒ p gerade ⇒ p = 2p1 mit p1 ∈ N.
Daraus folgt weiter
2q 2 = 4p21 ⇒ q 2 gerade ⇒ q gerade .
Also ist (p, q) ≥ 2, ein wunderbarer Widerspruch.
7
3
Grenzwerte von Folgen
Wir kommen nun zu dem für die Analysis zentralen Begriff des Grenzwerts. Die Möglichkeit
der Bildung von Grenzwerten ist eine Idealisierung, die uns die Konstruktion neuer Größen
erlauben wird, zum Beipiel: Tangente, Länge einer Kurve, Volumen der Kugel, Momentangeschwindigkeit, Arbeit längs eines Wegs etc.
Definition 3.1 Eine Folge reeller Zahlen ist eine Abbildung
N −→ R,
n 7−→ an .
Die Zahl an heißt das n-te Glied der Folge, die Folge insgesamt wird mit (an )n∈N bzw. kurz
mit (an ) bezeichnet. Oft wird die Folge durch das Bildungsgesetz angegeben oder durch
Aufzählen der ersten Folgenglieder definiert. Zum Beispiel ist die Folge der Quadratzahlen
gegeben durch an = n2 , bzw. alternativ aufzählend an = 1, 4, 9, 16, . . ..
Definition 3.2 (Konvergenz von Folgen) Die Folge (an )n∈N konvergiert mit n → ∞ gegen a ∈ R, falls gilt:
Zu jedem ε > 0 gibt es ein N ∈ R, so dass |an − a| < ε für alle n > N.
Die Zahl a heißt dann Grenzwert der Folge (an )n∈N für n → ∞, und wir schreiben kurz
limn→∞ an = a oder an → a für n → ∞. Eine Folge (an )n∈N heißt konvergent, wenn es ein
a ∈ R gibt, das Grenzwert der Folge ist; andernfalls heißt die Folge divergent.
Mit den Symbolen ∀ ( = für alle) und ∃ ( = es gibt) lässt sich die Definition auch wie folgt
fassen (Quantorenschreibweise):
∀ε > 0 ∃N ∈ R ∀n > N : |an − a| < ε.
Je kleiner die geforderte Maximalabweichung vom Grenzwert ε > 0, desto größer muss im
allgemeinen die Zahl N in der Definition des Grenzwerts gewählt werden, sie hängt also von ε
ab. Tut es die Zahl N für ein gegebenes ε > 0, so tut es natürlich auch jedes größere N 0 ≥ N ,
d.h. N darf stets vergrößert werden. Dies ist nützlich, zum Beispiel wenn wir gleichzeitig
zwei Folgen betrachten.
Beispiel 3.1 (Konstante Folge) Sei an = a für alle n ∈ N. Dann ist limn→∞ an = a.
Beweis: Für jedes ε > 0 gilt
|an − a| = 0 < ε für alle n > 0,
also können wir stets N = 0 wählen.
Beispiel 3.2 (Harmonische Folge) Die Folge an =
Beweis: Zu ε > 0 wählen wir N =
1
ε
1
n
konvergiert gegen a = 0.
∈ R. Es folgt für n > N
|an − 0| =
1
1
<
= ε.
n
N
8
Beispiel 3.3 (Geometrische Folge)
Es gilt
lim q n = 0 für alle q ∈ R mit − 1 < q < 1.
n→∞
1
Beweis: Wir können q 6= 0 annehmen. Nach Voraussetzung ist |q|
> 1, also gilt
für ein x > 0. Wir erhalten dann
1
|q n − 0| = |q|n =
(1 + x)n
1
≤
(Bernoulli-Ungleichung)
1 + nx
1
≤
nx
< ε, falls n > 1/εx.
1
|q|
=1+x
Wir können also N = 1/εx wählen.
Beispiel 3.4 Die Folge an = (−1)n , also an = −1, 1, −1, . . . ist nicht konvergent.
Beweis: (durch Widerspruch) Angenommen, es wäre limn→∞ an = a für ein a ∈ R. Dann
gibt es zu ε = 1 ein N ∈ R mit |an − a| < 1 für n > N . Es folgt dann für n > N
2 = |an − an+1 | = |an − a + a − an+1 |
≤ |an − a| + |a − an+1 | (Dreiecksungleichung)
< 1 + 1,
ein Widerspruch.
Definition 3.3 (ε-Umgebung) Die ε-Umgebung von a ∈ R ist die Menge
Uε (a) = {b ∈ R : |b − a| < ε} = {b ∈ R : a − ε < b < a + ε} ⊂ R.
Eine Folge (an )n∈N konvergiert genau dann gegen a ∈ R, wenn die Folgenglieder ab einer
gewissen Nummer in der ε-Umgebung von a liegen, egal wie klein ε > 0 gewählt ist.
Satz 3.1 (Eindeutigkeit des Grenzwerts) Falls die Folge (an )n∈N konvergent ist, so ist
ihr Grenzwert eindeutig bestimmt.
Beweis: Wir beginnen mit einer Vorüberlegung, und zwar behaupten wir
1
0 < ε ≤ |a − a0 | ⇒ Uε (a) ∩ Uε (a0 ) = ∅.
2
0
Denn ist x ∈ Uε (a) ∩ Uε (a ), so folgt mit der Dreiecksungleichung
(3.1)
|a − a0 | = |a − x + x − a0 | ≤ |x − a| + |x − a0 | < 2ε.
Seien nun a, a0 ∈ R Grenzwerte der Folge (an )n∈N . Zu jedem ε > 0 gibt es dann N, N 0 ∈ R
mit an ∈ Uε (a) für n > N , sowie an ∈ Uε (a0 ) für n > N 0 . Wäre a 6= a0 , so wählen wir
ε = 21 |a − a0 | > 0 und erhalten für n > max(N, N 0 )
an ∈ Uε (a) ∩ Uε (a0 ) = ∅,
ein Widerspruch.
Unser nächstes Ziel ist es, einige Rechenregeln für Grenzwerte zu erarbeiten. Wir beginnen
mit der
9
Definition 3.4 (Beschränktheit von Folgen) Eine Folge (an )n∈N heißt
a)
nach oben (bzw. nach unten) beschränkt, wenn es ein K ∈ R gibt mit an ≤ K
(bzw. an ≥ K) für alle n ∈ N.
b)
beschränkt, wenn sie nach oben und nach unten beschränkt ist.
Beispiel 3.5 Die Folge an = n ist nach unten beschränkt, denn es ist zum Beispiel an ≥ 0
für alle n. Sie ist aber nicht nach oben beschränkt: angenommen, es gibt ein K ∈ R mit
an ≤ K für alle n. Dann ist K ≥ a1 = 1 und K1 ≤ a1n = n1 für alle n, also nach Archimedes
1
K = 0, ein Widerspruch.
Satz 3.2 (konvergent ⇒ beschränkt) Jede konvergente Folge ist beschänkt.
Beweis: Sei limn→∞ an = a. Wähle zu ε = 1 ein N , o.B.d.A. N ∈ N, mit |an − a| < 1 für
n > N . Es gilt dann
n>N
⇒ |an | = |an − a + a| ≤ |an − a| + |a| < 1 + |a|
n≤N
⇒ |an | ≤ max(|a1 |, . . . , |aN |).
Wir haben also |an | ≤ K für alle n, wobei K = max(|a1 |, . . . , |aN |, 1 + |a|).
Satz 3.3 (Rechenregeln für Grenzwerte) Es gelte an → a, bn → b mit n → ∞.
a)
Für alle λ, µ ∈ R ist (λan + µbn )n∈N konvergent mit Grenzwert
limn→∞ (λan + µbn ) = λa + µb.
b)
Die Folge (an · bn )n∈N ist konvergent mit Grenzwert limn→∞ (an · bn ) = a · b.
c)
Falls b 6= 0, so gibt es ein N0 ∈ R mit bn 6= 0 für n > N0 und die Folge (an /bn )n>N0
ist konvergent mit Grenzwert limn→∞ an /bn = a/b.
Beweis: Wir beginnen mit dem Beweis von b). Nach Satz 3.2 gibt es ein K > 0 mit |an | ≤ K
für alle n ∈ N, und außerdem mit |b| ≤ K. Dann gilt
|an bn − ab| = |an bn − an b + an b − ab|
≤ |an | · |bn − b| + |an − a| · |b|
≤ K(|an − a| + |bn − b|).
ε
Zu ε > 0 gibt es nun ein N ∈ N mit |an − a| < 2K
sowie |bn − a| <
für n > N
ε
ε
|an bn − ab| <
+
= ε.
2K
2K
ε
2K
für n > N . Also folgt
Für a) reicht es wegen b), den Fall λ = µ = 1 zu betrachten. Zu ε > 0 gibt es ein N ∈ R mit
|an − a| < 2ε und |bn − b| < 2ε für n > N . Es folgt für diese n
|(an + bn ) − (a + b)| = |(an − a) + (bn − b)|
≤ |an − a| + |bn − b|
ε ε
<
+ = ε.
2 2
10
Für c) können wir uns auf den Fall an = b = 1 beschränken, denn sonst schreiben wir
an
an 1
bn
=
· 0 mit b0n = .
bn
b bn
b
Es gibt nun ein N0 ∈ R mit |bn − 1| ≤
1
2
für n > N0 , also
|bn | = |1 − (1 − bn )| ≥ 1 − |1 − bn | ≥
1
> 0.
2
Damit ist die erste Aussage gezeigt. Zu ε > 0 wähle weiter N ≥ N0 mit |1 − bn | < ε/2 für
n > N , und somit
1
|1 − bn |
ε
< 2 · = ε.
| − 1| =
bn
bn
2
Bemerkung: Die Menge der reellen Zahlenfolgen ist ein R-Vektorrraum mit den Verknüpfungen λ(an )n∈N + µ(bn )n∈N = (λan + µbn )n∈N . Wir haben dann die Untervektorräume
Nullfolgen: limn→∞ an = 0;
⊂ Konvergente Folgen: limn→∞ an existiert;
⊂ Beschränkte Folgen: es gibt ein K > 0 mit |an | ≤ K für alle n;
⊂ Allgemeine Folgen (an )n∈N
Beispiel 3.6
3 − n4 + n73
3n3 − 4n2 + 7
3
=
lim
= .
5
n→∞
n→∞
2n3 + 5n
2
2 + n2
lim
Beispiel 3.7 (Geometrische Reihe) Für −1 < q < 1 gilt
∞
X
k
q := lim
n→∞
k=0
Beweis: Die betrachtete Folge ist an =
trische Summe gilt
n
X
qk =
k=0
Pn
k=0 q
k.
1
.
1−q
(3.2)
Laut Formel (2.2) für die endliche geome-
1 − q n+1
1
=
,
n→∞ 1 − q
1−q
lim an = lim
n→∞
wobei Beispiel 3.3) und Regel a) aus Satz 3.3 benutzt wurden.
Beispiel 3.8 (Potenzsummen) Seien n ∈ N, , p ∈ N0 . Für die Summen S(n, p) =
gilt:
1
lim n−(p+1) S(n, p) =
.
n→∞
p+1
11
Pn
p
i=1 i
(3.3)
Beweis: Wir berechnen zunächst mit dem Teleskop-Summen-Trick eine Rekursionsformel
für die S(n, p):
p+1
(n + 1)
−1 =
n
X
[(i + 1)p+1 − ip+1 ]
i=1
=
=
=
p n X
X
p+1
ik
(Binomische Formel)
p+1
k
ik
(Vertauschung der Summen)
i=1 k=0
p X
k=0
p X
k=0
Wegen
p+1
p
k
X
n
i=1
p+1
S(n, k).
k
= p + 1 folgt für p ≥ 1 die Rekursionsformel
1
S(n, p) =
p+1
(n + 1)p+1 − 1 −
p−1 X
p+1
k=0
k
!
S(n, k) .
(3.4)
Jetzt zeigen wir (3.3) durch Induktion über p ∈ N0 . Der Fall p = 0 ist offensichtlich. Sei
(3.3) schon für 1, 2, . . . , p − 1 gezeigt, wobei p ≥ 1. Dann folgt für k ≤ p − 1
lim n−(p+1) S(n, k) = lim nk−p n−(k+1) S(n, k) = 0.
n→∞
n→∞
Aus (3.4) folgt dann
lim n−(p+1) S(n, p) =
n→∞
1
1
1
lim (1 + )p+1 =
.
p + 1 n→∞
n
p+1
Satz 3.4 (Grenzwerte und Ungleichungen) Sei limn→∞ an = a und limn→∞ bn = b.
Dann gelten folgende Aussagen:
a) an ≤ bn für alle n
⇒
b) c ≤ an ≤ d für alle n
a ≤ b.
⇒
c ≤ a ≤ d.
c) Falls an ≤ cn ≤ bn und a = b, so konvergiert auch die Folge (cn ) gegen a = b.
Beweis: Zu jedem ε > 0 gibt es ein N ∈ R mit
a − ε < an und bn < b + ε für n > N.
Aus der Voraussetzung in a) folgt dann a − ε < b + ε für jedes ε > 0, also a ≤ b. Die erste
Voraussetzung in c) impliziert a − ε < cn < b + ε für n > N . Wegen a = b bedeutet dies
limn→∞ cn = a.
Achtung: aus an < bn folgt nicht a < b, sondern nur a ≤ b. Die Striktheit von Ungleichungen
geht beim Übergang zu Grenzwerten im allgemeinen verloren. Zum Beispiel gilt
0<
1
1
für alle n, aber lim
= 0.
n→∞ n
n
12
Beispiel 3.9 (n-te Wurzel) Sei a > 0 und xn > 0 Lösung der Gleichung xn = a. Dann
gilt limn→∞ xn = 1.
Beweis: Die Gleichung xn = a besitzt höchstens eine positive Lösung, denn nach den
Anordnungsaxiomen gilt für x, y > 0
x>y
↔
xn > y n .
(3.5)
Wir unterscheiden nun drei Fälle:
a = 1 : Dann ist xn = 1 für alle n, und die Behauptung ist richtig.
a > 1 : Aus (3.5) folgt dann xn > 1. Wir zeigen limn→∞ an = 0 für an = xn − 1 > 0. Die
Bernoulli-Ungleichung liefert 1 + nan ≤ (1 + an )n = a, also 0 < an ≤ (a − 1)/n → 0 mit
n → ∞. Die Behauptung folgt nun aus Satz 3.4c).
a < 1 : Es ist dann xn = 1/yn , wobei ynn = 1/a mit 1/a > 1. Die Behauptung folgt aus dem
vorigen Fall und Satz 3.3c).
Bemerkung: Die Existenz der Lösungen der Gleichung xn = a, also der n-ten Wurzeln
√
x = n a > 0, haben wir hier einfach vorausgesetzt. Im nächsten Abschnitt werden wir aus
dem Vollständigkeitsaxiom schließen, dass die Gleichung xn = a für alle a > 0 lösbar ist.
Definition 3.5 (Uneigentliche Konvergenz) Die Folge (an )n∈N konvergiert uneigentlich
gegen +∞, falls gilt:
Zu jedem K > 0 gibt es ein N ∈ R, so dass an > K für alle n > N.
Wir schreiben limn→∞ an = +∞ oder an → +∞ mit n → ∞. Man spricht auch von
bestimmter Divergenz gegen +∞. Uneigentliche Konvergenz gegen −∞ ist analog definiert.
Beispiel 3.10 Ist q > 1, so gilt limn→∞ q n = +∞.
Beweis: Sei K > 0 gegeben. Nach Beispiel 3.3 gibt es ein N ∈ R mit
1
1
( )n <
für n > N,
q
K
also q n > K für n > N .
An dieser Stelle führen wir folgende Bezeichnungen ein:
(a, b) = {x ∈ R : a < x < b}
offenes Intervall
[a, b] = {x ∈ R : a ≤ x ≤ b}
abgeschlossenes Intervall
[a, b) = {x ∈ R : a ≤ x < b}
rechtsseitig offen, linksseitig abgeschlossen
(a, b] = {x ∈ R : a < x ≤ b}
linksseitig offen, rechtsseitig abgeschlossen
|I| = b − a für ein Intervall I
Intervalllänge
Hierbei sind +∞ und −∞ als offene Intervallgrenzen zugelassen, zum Beispiel (−∞, 1] =
{x ∈ R : −∞ < x ≤ 1}. Den ε-Umgebungen in der Definition der Konvergenz entsprechen
bei uneigentlicher Konvergenz die Intervalle (K, +∞): ab einem gewissen Index müssen alle
Folgenglieder in (K, +∞) liegen, egal wie groß K gewählt ist.
13
4
Vollständigkeit der reellen Zahlen
Der Nachweis der Konvergenz einer Zahlenfolge anhand der Definition setzt die Kenntnis des
Grenzwerts voraus. Das Ziel der Analysis ist es aber, neue Objekte – Zahlen, Funktionen,
Operationen – durch Grenzprozesse zu definieren. Wir stehen damit vor dem Problem, Folgen
als konvergent zu erkennen, ohne ihren Grenzwert a priori zu kennen. Wir beginnen mit zwei
Beispielen dazu.
Beispiel 4.1 (Zinseszinsrechnung)
Wird ein Kapital K0 für ein Jahr mit einem Zinssatz p% angelegt, so beträgt die Ausszahlung
K1 = K (1 + x), wobei x = p/100. Die Idee des Zinseszinses ist es, den Zeitraum in kürzere
Abschnitte zu unterteilen und den Zins anteilig pro Abschnitt anzurechenen mit dem Effekt,
dass der schon angerechnete Teil des Zinses seinerseits Zinsen produziert. Bei halbjähriger
Verzinsung sieht das zum Beispiel so aus:
nach 1/2 Jahr:
K (1 + x2 )
nach 1 Jahr:
K2 = [K (1 + x2 )] (1 + x2 ) = K (1 + x2 )2 .
x 12
Entsprechend ergibt sich nach einem Jahr bei monatlicher Verzinsung K12 = K (1+ 12
) , bei
x 365
täglicher Verzinsung K365 = K (1 + 365 )
und allgemein bei Unterteilung in n Zeiteinheiten
En := En (x) = (1 +
x n
) für x ∈ R, n ∈ N.
n
(4.1)
Es stellt sich ganz natürlich die Frage nach einer kontinuierlichen Verzinsung, also nach dem
Grenzwert limn→∞ En (x).
Beispiel 4.2 (Dezimalbruchdarstellung)
Für jedes x ∈ R existieren k0 ∈ Z und kj ∈ {0, 1, . . . , 9} für j ∈ N, so dass folgende Darstellung
von x als Grenzwert gilt (die sogenannte Darstellung als unendlicher Dezimalbruch):
x = lim
n→∞
n
X
j=0
kj · 10
−j
=:
∞
X
kj · 10−j =: k0 , k1 k2 . . .
j=0
Um dies zu beweisen, definieren wir k0 , k1 , . . . induktiv mit der Eigenschaft
(∗) x ∈ [an , bn ) für alle n ∈ N0 , wobei an = k0 , k1 k2 . . . kn und bn = an + 10−n .
Für n = 0 setzen wir k0 = max{k ∈ Z : k ≤ x} und haben wie gewünscht k0 ≤ x < k0 + 1.
Seien k0 , k1 , . . . , kn−1 schon gefunden, so dass jeweils (∗) erfüllt ist. Dann setzen wir kn =
max{n ∈ N0 : an−1 + k · 10−n ≤ x}. Nach Induktionsannahme ist bn−1 = an−1 + 10 · 10−n > x,
also ist kn ∈ {0, 1, . . . , 9}. Es gilt x ∈ [an , bn ) nach Wahl von kn . Insbesondere folgt
|x − an | ≤ |an − bn | = 10−n → 0 mit n → ∞.
Damit ist die Existenz der Darstellung als unendlicher Dezimalbruch für jedes x ∈ R gezeigt.
Umgekehrt stellt sich aber die Frage, ob jede Dezimalbruchfolge an = k0 , k1 k2 . . . gegen eine
reelle Zahl konvergiert.
14
In beiden Beispielen brauchen wir eine Charakterisierung konvergenter Folgen, die ohne die
Kenntnis des Grenzwerts auskommt. Statt die Glieder der Folge mit dem unbekannten Grenzwert zu vergleichen, besteht die Idee darin, die Glieder der Folge untereinander zu zu vergleichen.
Definition 4.1 (Cauchyfolge) Eine Folge (an )n∈N heißt Cauchyfolge, wenn gilt:
Zu jedem ε > 0 gibt es ein N ∈ R, so dass |an − am | < ε für alle n, m > N.
Bemerkung: Beim Nachweis dieser Eigenschaft reicht es aus, die Zahlen n, m > 0 mit n < m
zu betrachten, denn die Definition ist symmetrisch in n und m und für n = m ist nichts zu
tun.
Vollständigkeitsaxiom: Jede Cauchyfolge ist konvergent.
Damit sind die Axiome KAV der reellen Zahlen komplett: R ist ein vollständig angeordneter Körper. Im wesentlichen ist R auch der einzige solche Körper, siehe H.-D. Ebbinghaus
(Hrsgb.): Zahlen, Springer-Verlag 3. Auflage (1988).
Satz 4.1 Eine Folge ist genau dann konvergent, wenn sie eine Cauchyfolge ist.
Beweis: Eine Cauchyfolge ist konvergent nach Axiom. Sei umgekehrt limn→∞ an = a. Zu
ε > 0 gibt es dann ein N ∈ N mit |an − a| < ε/2 für n > N , und für n, m > N folgt
|an − am | = |an − a + a − am | ≤ |an − a| + |am − a| <
ε ε
+ = ε.
2 2
Als erste Anwendung des Axioms betrachten wir die Dezimaldarstellung und zeigen
Satz
von Dezimalbrüchen) Jeder unendliche Dezimalbruch an = k0 +
Pn 4.2 (Konvergenz
−j mit k ∈ Z mit k ∈ {0, 1, . . . , 9} für j ∈ N konvergiert gegen eine reelle Zahl.
k
10
j
0
j
j=1
Beweis: Für n < m schätzen wir wie folgt ab:
|am − an | = |
m
X
kj 10−j |
j=n+1
m−(n+1)
−(n+1)
≤ 10
X
9 · 10−j
j=0
≤ 10−(n+1) 9 ·
1
1 (Geometrische Reihe)
1 − 10
≤ 10−n
≤ ε
für n > N (Geometrische Folge).
Das nun folgende Konvergenzkriterium ist überaus nützlich. Mit ihm werden wir das Beispiel
der kontinuierlichen Verzinsung leicht behandeln können. Es ist ein hinreichendes Kriterium
für Konvergenz, ist aber nicht notwendig für die Konvergenz einer Folge (an )n∈N .
15
Definition 4.2 (Monotone Folge) Eine Folge (an )n∈N heißt monoton wachsend, wenn
gilt: an+1 ≥ an für alle n ∈ N.
Satz 4.3 (Konvergenzkriterium der Monotonie und Beschränktheit) Jede monoton wachsende, nach oben beschränkte Folge ist eine Cauchyfolge und damit konvergent.
Beweis: Sei (an )n∈N monoton wachsend und an ≤ K < ∞ für alle n ∈ N. Sei ε > 0 gegeben.
1
Wähle p ∈ N so dass d := K−a
< ε, und setze Ij = [a1 + (j − 1)d, a1 + jd] für j = 1, 2, . . . , p
p
(Bild). Setze
k = max{j : es gibt ein n ∈ N mit an ∈ Ij }.
Es gilt 1 ∈ M , denn a1 ∈ I1 . Sei k = max{j : j ∈ M }. Dann gibt es ein N ∈ N mit aN ∈ Ik
und es folgt tatsächlich
an ∈ Ik für alle n > N.
Denn wäre an ∈
/ Ik für ein n > N , so folgt x ∈ Ij mit j < k wegen der Maximalität
von k. Aber dann is an < aN , Widerspruch zur Monotonie. Für n, m > N gilt somit
|an − am | ≤ |Ik | = d < ε.
Satz 4.4 (Definition der Exponentialfunktion) Die Folge En (x) = (1+ nx )n ist für jedes
x ∈ R konvergent. Wir bezeichnen den Grenzwert mit
exp(x) = lim (1 +
n→∞
x n
) .
n
Die Funktion exp : R → R, x 7−→ exp(x) heißt Exponentialfunktion. Der Funktionswert
e = exp(1) = lim (1 +
n→∞
1 n
) ≈ 2, 71828
n
heißt Eulersche Zahl.
Beweis: Aus der Zinseszins-Interpretation ist plausibel, dass die Folge monoton wachsend
in n ist (Verstärkung des Zinseszins-Effekts), und andererseits beschränkt bleiben sollte (der
Zinseszinseffekt kann nicht beliebig groß sein).
Für n > x betrachten wir die Folge Fn = Fn (x) = (1 − nx )−n . Es gilt
x
x
x2
En (x)
= (1 + )n (1 − )n = (1 − 2 )n ≤ 1,
Fn (x)
n
n
n
und folglich
n>x
⇒
En (x) ≤ Fn (x).
(4.2)
n > −x
⇒
En+1 (x) ≥ En (x).
(4.3)
Zweitens behaupten wir
16
Denn wir berechnen
En+1 (x)
En (x)
=
=
=
=
≥
=
x n+1
)
(1 + n+1
x n
(1 + n )
x
1 + n+1
x
(
)n+1 · (1 + )
1 + nx
n
x
− x n+1
x
(1 − n n+1
)
· (1 + )
1 + nx
n
x
x
(1 −
)n+1 · (1 + )
(n + 1)(n + x)
n
x
x
(1 −
) · (1 + ) (Bernoulli–Ungleichung)
n+x
n
1.
x
Beachte (n+1)(n+x)
≤ 1 für x > −n, so dass die Bernoulli-Ungleichung (Satz 2.3) anwendbar
ist. Für n > −x ist En also monoton wachsend. Aber es gilt Fn (x) = 1/En (−x), also ist
Fn (x) für n > x monoton fallend. Für n > |x| haben wir nun folgende Situation:
En (x) ≤ En+1 (x) ≤ . . . . . . ≤ Fn+1 (x) ≤ Fn (x).
Insbesondere ist die Folge En (x) nach oben bechränkt, und zwar durch jedes der Fm (x), und
somit nach Satz 4.3 konvergent. Damit ist die Behauptung des Satzes gezeigt. Aus (4.2) und
der Bernoulli-Ungleichung ergibt sich außerdem
n > |x|
⇒
1 ≥ En (x) · En (−x) = (1 −
x2 n
x2
x2
)
≥
1
−
n
·
=
1
−
.
n2
n2
n
Mit n → ∞ erhalten wir
exp(x) · exp(−x) = 1 für allex ∈ R.
(4.4)
Bemerkung: Die genannte Näherung für e ergibt sich durch Wahl von n = 106 in der
Ungleichung En (1) ≤ e ≤ Fn (1) unter Zuhilfenahme eines Taschenrechners. Insbesondere
sieht man, dass die approximierenden Folgen En (x), Fn (x) nur sehr langsam konvergieren
und aus numerischer Sicht ungeeignet sind.
Definition 4.3 (Intervallschachtelung) Eine Intervallschachtelung ist eine Folge von abgeschlossenen Intervallen In = [an , bn ] ⊂ R mit In+1 ⊂ In für alle n und |In | = bn − an → 0
mit n → ∞.
Satz 4.5 (Intervallschachtelungsprinzip)
Zu jeder Intervallschachtelung (In )n∈N gibt es
T
genau ein x ∈ R mit x ∈ n∈N In . Es gilt x = limn→∞ an = limn→∞ bn .
Beweis: Nach Voraussetzung haben wir
a1 ≤ a2 ≤ . . . ≤ an ≤ . . . . . . ≤ bn ≤ . . . ≤ b2 ≤ b1 .
Aus Satz 4.3 folgt die Existenz der Grenzwerte a = limn→∞ an bzw. b = limn→∞ bn . Dann
gilt nach den Satz 3.3 und Satz 3.4
0 ≤ b − a = lim bn − lim an = lim (bn − an ) = 0.
n→∞
n→∞
17
n→∞
Setze x := a = b. Dann ist an ≤ a = x = b ≤ bn , also x ∈ In für alle n. Sei y ∈ R mit y ∈ In
für alle n, das heißt an ≤ y ≤ bn . Durch Grenzübergang ergibt sich nach Satz 3.4 a ≤ y ≤ b,
also y = x.
Satz 4.6 (Existenz der n-ten Wurzel) Zu jedem a > 0 und n ∈ N gibt es genau ein
√
x > 0 mit xn = a. Bezeichnung: x = n a = a1/n .
Beweis: Die Eindeutigkeit wurde schon in Beispiel 3.9 aus den Anordnungsaxiomen gefolgert. Wir konstruieren die Lösung mit dem Verfahren der fortgesetzten Intervallhalbierung:
k
Bestimme Ik = [ak , bk ] für k = 1, 2, . . ., so dass mit mk = ak +b
gilt:
2
I1 = [a1 , b1 ] mit an1 ≤ a ≤ bn1 ;
[ak , mk ] falls mnk ≥ a
Ik+1 =
[mk , bk ] falls mnk < a.
Es folgt Ik+1 ⊂ Ik für alle k und |Ik | = 21−k |I1 | → 0 mit k → ∞. Sei x ∈ R wie in Satz 4.5
gegeben. Per Induktion ergibt sich aus der Definition von Ik+1 die Ungleichung ank ≤ a ≤ bnk
für alle k ∈ N, und hieraus mit den Sätzen 3.3 und 3.4
xn = lim ank ≤ a ≤ lim bnk = xn .
n→∞
n→∞
Beispiel 4.3 (Verfahren von Heron) Hier wollen wir kurz das Verfahren von Heron besprechen, das die Quadratwurzel von a > 0 effizienter berechnet als das Intervallhalbierungsverfahren.
√
Zur Motivation der Iterationsformel: die gesuchte Zahl a ist die Nullstelle x∗ der Parabel
√
y = x2 −a. Nehmen wir an, es ist schon eine n-te Näherung xn für a berechnet, wobei x0 der
Startwert sei. Dann betrachten wir die Tangente an die Parabel im Punkt (xn , x2n − a), und
wählen als nächste Näherung deren Nullstelle xn+1 . Wie lautet der zugehörige Algorithmus?
Beschreiben wir die gesuchte Tangente mit der Gleichung y = p · x + q, (p ist die Steigung, q
der y-Achsenabschnitt), so muss die quadratische Funktion (x2 − a) − (px + q) genau in xn
ihre einzige Nullstelle haben (heuristische Begündung am Bild), also
(x2 − a) − (px + q) = (x − xn )2
⇒
p = 2xn und q = −(a + x2n ).
Die Iterationsvorschrift, gegeben durch die Nullstelle der Tangente in (xn , x2n − a), lautet
demzufolge
1
a
xn+1 = f (xn ) := (xn +
), mit Startwert x0 > 0.
(4.5)
2
xn
Die Frage ist nun, ob dieses Verfahren konvergiert und, wenn ja, wie gut. Zunächst gilt für
alle x > 0
√ √ √
a
x
a
√ +
f (x) =
≥ a,
2
x
a
√
√
mit Gleichheit genau für x = a. Also gilt xn ≥ a für n ≥ 1, und es folgt weiter
1
xn+1 − xn = (a/xn − xn ) ≤ 0 für n ≥ 1.
2 | {z } |{z}
√
√
≤ a
≥ a
18
√
Ab n = 1 ist die Folge somit monoton fallend und durch a nach unten beschränkt, also
konvergiert sie wegen Satz 4.3 gegen eine Zahl ξ > 0. Um zu sehen, dass ξ die gesuchte
Wurzel ist, lassen wir in (4.5) n → ∞ gehen und erhalten ξ 2 = a wie gewünscht. Wie schnell
√
verkleinert sich nun der Näherungsfehler εn = |xn − a| ≥ 0? Für n ≥ 1 ist
εn+1 = xn+1 −
√
√
√
1
a
1
ε2
ε2
a = (xn +
)− a=
(x2n − 2 axn + a) = n ≤ √n .
2
xn
2xn
2xn
2 a
Sei zum Beispiel a ≥ 41 und die Näherung xn schon auf k ≥ 1 Dezimalstellen hinter dem
Komma genau, also εn ≤ 10−k , so ist der Fehler der nächsten Näherung nur mehr
1
εn+1 ≤ √ (10−k )2 ≤ 10−2k .
2 a
| {z }
≤1
Die Anzahl der gültigen Stellen hat sich also in einem Schritt verdoppelt. Man spricht hier
von quadratischer Konvergenz. Beim Intervallhalbierungsverfahren wird die Zahl der gültigen
Stellen jeweils höchstens um Eins verbessert, was als lineare Konvergenz bezeichnet wird.
Definition 4.4 (Teilfolge) Sei (an )n∈N eine Folge und (nk )k∈N eine Folge natürlicher Zahlen mit n1 < n2 < n3 . . . Dann heißt die Folge (ank )k∈N Teilfolge von (an )n∈N .
Durch Induktion ergibt sich sofort nk ≥ k: es ist n1 ≥ 1 und nk+1 ≥ nk + 1 ≥ k + 1. Die
Teilfolge entsteht aus der ursprünglichen Folge durch Auswahl der Nummern nk . Da Folgen
Abbildungen von N nach R sind, ist eine Teilfolge formal als Verkettung von zwei Abbildungen
definiert: der Ausgangsfolge a : N → R, n 7−→ a(n) und der Folge N → N, k 7−→ n(k), die
n
die Indizes auswählt. Am Beispiel an = (−1)
, nk = 2k − 1 sieht das wie folgt aus:
n3
a(n)=
n(k)=2k−1
(−1)n
n3
N
−→
N
−→
R
k
7−→
n(k) = 2k − 1
7−→
1
a(n(k)) = − (2k−1)
3
Definition 4.5 (Häufungspunkt von Folgen) a ∈ R heißt Häufungspunkt der Folge
(an )n∈N , wenn eine Teilfolge (ank )k∈N gibt, die mit k → ∞ gegen a konvergiert.
Beispielsweise hat die Folge an = (−1)n + n12 den Häufungspunkt +1, denn mit nk = 2k gilt
ank = a2k = 1 + 4k12 → 1 mit k → ∞. Auch −1 ist ein Häufungspunkt der Folge, denn für
1
nk = 2k − 1 ist ank = a2k−1 = −1 + (2k−1)
2 → −1 mit k → ∞.
Lemma 4.1 Die Zahl a ∈ R ist genau dann Häufungspunkt der Folge (an )n∈N , wenn die
Menge {n ∈ N : an ∈ Uε (a)} für jedes ε > 0 unendlich viele Elemente hat.
Beweis: Wenn a ∈ R Häufungspunkt von (an )n∈N ist, so gilt nach Definition ank → a mit
k → ∞ für eine Teilfolge nk . Zu jedem ε > 0 gibt es dann ein K ∈ R mit ank ∈ Uε (a) für alle
k > K. Wegen nk → ∞ mit k → ∞ für alle k ist die Menge {nk : k > K} unendlich. Dies
beweist die eine Richtung der Äquivalenz.
Umgekehrt wählen wir induktiv nk für k = 1, 2, . . . mit ank ∈ U1/k (a). Die Induktion bricht
nicht ab, da an ∈ U1/k (a) für unendlich viele n gilt. Es folgt dann |ank − a| < k1 → 0 mit
k → ∞.
19
Satz 4.7 (Bolzano-Weierstraß) Jede beschränkte Folge reeller Zahlen hat eine konvergente Teilfolge, also mindestens einen Häufungspunkt.
Beweis: Konstruktion durch fortgesetzte Intervallhalbierung: wähle eine obere Schranke b1
und eine untere Schranke a1 für (xn )n∈N , also xn ∈ [a1 , b1 ] für alle n ∈ N. Wir nehmen nun
induktiv an, dass Ik = [ak , bk ] schon gefunden ist mit der Eigenschaft
(∗) xn ∈ Ik
für unendlich viele n.
Setze mk = 21 (ak + bk ) und definiere
Ik+1 = [ak+1 , bk+1 ] =
[mk , bk ] ,
[ak , mk ]
falls xn ∈ [mk , bk ] für unendlich viele n,
sonst.
Es ist offensichtlich, dass (∗) auch für das Intervall Ik+1 gilt. Nach dem Intervallschachtelungsprinzip (Satz 4.5) gibt es ein x ∈ R mit x ∈ Ik für alle k ∈ N. Zu ε > 0 gibt es nun
ein K ∈ R mit |Ik | < ε für k > K, also Ik ⊂ Uε (x) für k > K. Damit gilt auch xn ∈ Uε (x)
für unendlich viele n. Aus Lemma 4.1 schließen wir, dass x ein Häufungspunkt der Folge
(xn )n∈N ist.
Definition 4.6 (Limes superior/inferior) Für eine Folge (xn )n∈N gilt lim supn→∞ xn =
x∗ mit x∗ ∈ R ∪ {±∞} (beziehungsweise lim inf n→∞ xn = x∗ mit x∗ ∈ R ∪ {±∞}), falls
folgende zwei Bedingungen erfüllt sind:
(i)
es gibt eine Teilfolge xnk → x∗ mit k → ∞;
(ii)
für alle x > x∗ ist die Menge {n ∈ N : xn > x} endlich (bzw. für alle x < x∗ )
ist {n ∈ N : xn > x} endlich).
Der Limes superior ist nicht notwendig obere Schranke der Folge, zum Beispiel gilt
lim supn→∞ n1 = 0. Er kann auch −∞ sein, zum Beispiel für xn = −n. Während wir
limn→∞ xn nur dann bilden können, wenn die Folge konvergiert, ist der größte Häufungspunkt
x∗ = lim supn→∞ xn und der kleinste Häufungspunkt x∗ = lim inf n→∞ xn = x∗ immer definiert, wenn wir jeweils die Möglichkeit x∗ = ±∞ bzw. x∗ = {±∞} zulassen. Dies soll nun
bewiesen werden, wobei wir uns o.B.d.A. auf den Limes superior beschränken.
Lemma 4.2 Sei lim supn→∞ xn = x∗ < ∞. Dann gilt
y > x∗ ⇒ y ist kein Häufungspunkt von (xn ).
Beweis: Für 0 < ε < 21 (y − x∗ ) gilt
|x − y| < ε ⇒ x − x∗ = y − x∗ − (y − x) > ε
| {z } | {z }
>2ε
<ε
⇒ Uε (y) ⊂ {x ∈ R : x > x∗ + ε}
Mit Lemma 4.1 folgt die Behauptung aus (ii).
Satz 4.8 (Existenz des Limes superior) Für jede Folge (xn )n∈R gibt es genau ein x∗ ∈
R ∪ {±∞} mit lim supn→∞ xn = x∗ .
20
Beweis:
Fall 1: (xn ) ist nicht nach oben beschränkt.
Dann ist {n : xn ≥ b} unendlich für alle b ∈ R. Bestimme induktiv n1 < n2 < . . . mit
xnk ≥ k. Es folgt lim supn→∞ xn = +∞.
Fall 2: Es gibt ein b1 ∈ R mit xn ≤ b1 für alle n ∈ N.
Fall 2.1: {n : xn ≥ a} ist endlich für alle a ∈ R.
Dann gilt xn → −∞ und es folgt lim supn→∞ xn = −∞.
Fall 2.2: Es gibt ein a1 ∈ R, so dass {n : xn ∈ [a1 , b1 ]} unendlich ist.
In diesem Fall wenden wir das Intervallhalbierungsverfahren aus dem Beweis von Satz 4.7 an
und behaupten
{n : xn > bk } ist endlich für alle k.
Für k = 1 ist das richtig, da b1 obere Schranke. Sei die Behauptung schon für k ∈ N gezeigt.
bk+1 = bk
⇒
Die Behauptung gilt nach Induktionsannahme.
bk+1 = mk
⇒
Die Menge {n : xn > bk+1 } = {n : xn ∈ (mk , bk ]} ∪ {n : xn > bk }
ist endlich nach Fallunterscheidung sowie Induktionsannahme.
Sei nun x∗ := limk→∞ bk . Für x > x∗ ist (x, +∞) ⊂ (bk , +∞) für k hinreichend groß, also ist
{n : xn > x} endlich und es folgt lim supn→∞ = x∗ . Damit ist die Existenz bewiesen.
Angenommen es gibt x∗1 < x∗2 mit den Eigenschaften (i) und (ii). Wähle x ∈ (x∗1 , x∗2 ). Wegen
(ii) für x∗1 ist dann {n : xn > x} endlich. Dann kann aber (i) für x∗2 nicht gelten, ein
Widerspruch.
Die Begriffe Häufungspunkt, Limes superior und Limes inferior sind gewöhnungsbedürftig,
und wir werden bei Gelegenheit mehr Beispiele betrachten. Die logische Abfolge der
zentralen theoretischen Aussagen in diesem Abschnitt war folgende:
Vollständigkeitsaxiom:
Cauchyfolgen sind konvergent
⇓
Konvergenzkriterium der
Monotonie und Beschränktheit
⇓
Intervallschachtelungsprinzip
⇓
Bolzano-Weierstraß: Auswahlsatz
⇓
Cauchyfolgen sind konvergent
Die Implikationen sind so zu verstehen, dass jeweils nur die jeweils vorangehende Eigenschaft
von R im Beweis des darauf folgenden Resultats benutzt wurde. Die letzte Implikation
werden wir dabei gleich noch zeigen. Es folgt, dass jede der vier Eigenschaften als Axiom für
R benutzt werden könnte - die anderen Eigenschaften würden als Sätze folgen. Im nächsten
21
Abschnitt werden wir eine weitere, äquivalente Eigenschaft kennenlernen, nämlich den Satz
vom Supremum (Satz 5.1). In dieser Vorlesung wird die Konvergenz der Cauchyfolgen als
grundlegendes Axiom gewählt.
Beweis: Auswahlsatz von Bolzano-Weierstraß ⇒ Cauchyfolgen sind konvergent
Wir zeigen zunächst, dass eine Cauchyfolge (an )n∈N beschränkt ist. Sei n0 ∈ N mit |an −am | ≤
1 für n, m ≥ n0 . Dann folgt
n ≥ n0 ⇒ |an | ≤ |an − an0 | +|an0 |.
| {z }
≤1
Also gilt |an | ≤ max(|a1 |, |a2 |, . . . , |an0 −1 |, |an0 |+1) = K. Sei nun N ∈ R mit |an −am | < 2ε für
n, m > N . Wir wenden den Auswahlsatz von Bolzano-Weierstraß an: es gibt eine Teilfolge
(ank )k∈N mit ank → a mit k → ∞. Wähle k0 ∈ N mit |ank0 − a| < 2ε und nk0 > N . Für
n > N folgt
|an − a| ≤ |an − ank0 | + |ank0 − a| < ε.
| {z } | {z }
< 2ε
< 2ε
Somit konvergiert die ganze Folge gegen a.
Ebenso wichtig wie die Theorie sind die behandelten Anwendungen:
• Konvergenz von unendlichen Dezimalbrüchen;
• Definition der Exponentialfunktion exp(x) = limn→∞ (1 + nx )n ;
√
• Definition der n-ten Wurzel n a.
5
Teilmengen von R und von Rn
Definition 5.1 Die Menge M ⊂ R heißt
nach oben beschränkt:
⇔
∃ K ∈ R mit x ≤ K für alle x ∈ M ;
nach unten beschränkt: ⇔ ∃ K ∈ R mit x ≥ K für alle x ∈ M .
Die Zahl K heißt dann obere bzw. untere Schranke. M heißt beschränkt, wenn M sowohl
nach oben und nach unten beschränkt ist. Dies ist äquivalent zu
∃ K ≥ 0 mit |x| ≤ K für alle x ∈ M.
Beispiel. Die Menge I = [0, 1) ist nach oben beschränkt, eine obere Schranke ist zum
Beispiel K = 106 . Es gibt aber kein größtes Element, das heißt kein Maximum in I:
x∈I⇒x<
x+1
∈ I.
2
Es gibt aber eine kleinste obere Schranke, nämlich die Zahl 1.
Definition 5.2 (Supremum/Infimum) Eine Zahl S ∈ R heißt kleinste obere Schranke
oder Supremum der Menge M ⊂ R (bzw. größte untere Schranke oder Infimum von M ),
wenn gilt:
22
(i)
S ist obere Schranke (bzw. untere Schranke): x ≤ S für alle x ∈ M
(bzw. x ≥ S für alle x ∈ M ).
(ii)
Falls S 0 auch obere (bzw. untere) Schranke ist, so folgt S 0 ≥ S (bzw. S 0 ≤ S).
Notation: S = sup M (bzw. S = inf M ). Ist M nicht nach oben (bzw. unten) beschränkt, so
setzen wir sup M = +∞ (bzw. inf M = −∞). Schließlich ist per Definition sup ∅ = −∞ und
inf ∅ = +∞.
Satz 5.1 (Existenz des Supremums) Jede nichtleere, nach oben beschränkte Menge M ⊂
R hat eine kleinste obere Schranke sup M ∈ R.
Beweis: Sei b1 obere Schranke und a1 ∈ M . Konstruiere dann induktiv In = [an , bn ] für
n ≥ 1 mit In ∩ M 6= ∅:
(
[an , mn ], falls [mn , bn ] ∩ M = ∅
In+1 = [an+1 , bn+1 ] =
[mn , bn ], sonst.
T
Sei S = n≥1 In = limn→∞ bn nach dem Intervallschachtelungsprinzip (Satz 4.5). S ist obere
Schranke: für x ∈ M gilt induktiv x ≤ bn für alle n, also x ≤ limn→∞ bn = S. Sei S 0
eine obere Schranke von M . Nach Konstruktion gibt es xn ∈ M ∩ In für alle n, also gilt
S 0 ≥ limn→∞ xn = S.
Folgerung 5.1 Sei M ⊂ R nichtleer. Dann gibt es eine Folge xn ∈ M bzw. x0n ∈ M mit
xn → sup M bzw. x0n → inf M .
Beweis: Wir zeigen die Aussage für das Supremum. Ist M nach oben beschränkt, so wurde
eine solche Folge im Beweis des vorangehenden Satzes konstruiert. Ist M nicht nach oben
beschränkt, so gibt es zu n ∈ N ein xn ∈ M mit xn ≥ n, also xn → +∞ = sup M .
Bemerkung. Es gilt (ggf. Diskussion in Anwesenheitsübungen)
lim sup an = lim (sup ak ),
n→∞
n→∞ k≥n
bzw.
lim inf an = lim ( inf ak ).
n→∞
n→∞ k≥n
Jetzt wollen wir uns einer neuen Frage zuwenden: wie kann man die unendlichen Mengen
N ⊂ Z ⊂ Q ⊂ R der Größe nach vergleichen? Gibt es wirklich mehr rationale Zahlen als
natürliche? Mehr reelle als rationale? Die Antwort lautet witzigerweise, dass es gleich viele
natürliche, ganze und rationale Zahlen gibt, aber mehr reelle Zahlen. Alle genannten Mengen
enthalten unendlich viele Elemente. Die Präzisierung der Begriffe gleichviele und mehr geht
auf Georg Cantor (1872) zurück.
Definition 5.3 Eine Menge A heißt gleichmächtig zur Menge B (Notation: A ∼ B), wenn
es eine bijektive Abbildung (Bijektion) ϕ : A → B gibt.
Lemma 5.1 Die Relation A ∼ B (A ist gleichmächtig zu B) ist eine Äquivalenzrelation, das
heißt für alle Mengen A, B, C gilt:
(i)
A∼A
(ii)
A∼B
(iii)
A ∼ B und B ∼ C
⇒B∼A
⇒ A ∼ C.
23
Beweis:
(i)
Wähle als Bijektion die Identität idA : A → A, a 7−→ a.
(ii)
Sei ϕ : A → B Bijektion. Wähle dann ϕ−1 : B → A.
(iii)
Seien ϕ : A → B und ψ : B → C bijektiv. Wähle dann ψ ◦ ϕ : A → C.
Definition 5.4 Eine Menge A heißt
-
endlich, wenn sie gleichmächtig zu einer Menge {1, 2, . . . , k} mit k ∈ N ist;
abzählbar unendlich, wenn sie gleichmächtig zu N ist;
abzählbar, wenn sie endlich oder abzählbar unendlich ist;
überabzählbar, wenn sie nicht abzählbar ist.
Lemma 5.2 Es gelten folgende Aussagen:
(i)
Die Zahl k ∈ N der Elemente einer endlichen Menge (siehe Definition 5.4) ist
wohldefiniert.
(ii)
Die Menge N der natürlichen Zahlen ist nicht endlich.
Beweis: Um (i) zu beweisen, reicht es nach Lemma 5.1 aus, für k, l ∈ N folgendes zu zeigen:
(∗) {1, . . . , k} ∼ {1, . . . , l} und k ≤ l ⇒ k = l.
Wir führen Induktion über k. Für k = 1 gibt es nach Voraussetzung eine bijektive, also
surjektive Abbildung ϕ : {1} → {1, . . . , l} und es folgt sofort l = ϕ(1) = 1. Sei (∗) schon
für ein k ∈ N gezeigt, und sei ϕ : {1, . . . , k + 1} → {1, . . . , l} bijektiv sowie l ≥ k + 1. Mit
ϕ(k + 1) =: j haben wir dann Bijektionen
ϕ : {1, . . . , k} → {1, . . . , l}\{j},
ψ : {1, . . . , l − 1} → {1, . . . , l}\{j}, ψ(i) =
i für i < j,
i + 1 für i ≥ j.
Mit Lemma 5.1 (iii) folgt {1, . . . , k} ∼ {1, . . . , l − 1} und somit k = l − 1 nach Induktionsannahme, das heißt (∗) ist für k + 1 bewiesen.
Für eine Abbildung ϕ : {1, . . . , k} → N ist z.B. die Zahl (max1≤j≤k ϕ(j)) + 1 ∈ N nicht
im Bild von ϕ, woraus die Aussage (ii) folgt.
Lemma 5.3 Falls eine surjektive Abbildung ϕ : N → A existiert, so ist A abzählbar.
Beweis: Setze n1 = 1 und definiere n1 < n2 < . . . durch
nk = min{n ∈ N : ϕ(n) 6= ϕ(nj ) für alle j < k}.
Fall 1. Die Rekursion bricht nach einem nk ab.
Dann ist die Abbildung ψ : {1, . . . , k} → A, j 7−→ ϕ(nj ) bijektiv und A ist endlich.
Fall 2. Die Rekursion bricht nicht ab.
Dann ist ψ : N → A, j 7−→ ϕ(nj ) bijektiv und A ist abzählbar.
24
Satz 5.2 Die Mengen Z und Q sind abzählbar.
Beweis: Für Z wähle
ϕ : N −→ Z,
ϕ(n) =
ϕ : Z −→ N, ϕ−1 (k) =
(
n
2
n−1
(− 2
n gerade
n ungerade
2k
1 − 2k
k>0
k≤0
Wie das Argument für Z zeigt, können wir uns bei Q auf die Menge Q+ = { pq : p, q ∈ N}
beschränken. Wir zählen die rationalen Zahlen diagonal ab:
k=
i=
1
2
3
4
5
1
2
3
4
5
6
1/1 2/1 3/1 4/1 5/1 6/1
. . . . .
1/2 2/2 3/2 4/2
·
. . . ·
1/3 2/3 3/3
·
. . ·
1/4 2/4
·
. ·
1/5
Die Diagonale mit der Nummer k enthält k Elemente. Deshalb wird N in Abschnitte
{
k(k − 1)
k(k − 1)
k(k + 1)
k(k − 1)
+ 1,
+ 2, . . . , ,
+k =
} mit k ∈ N
2
2
2
2
zerlegt. Die gesuchte Abbildung ϕ : N → Q lautet dann
ϕ(n) =
k−i+1
k(k − 1)
für n =
+ i (k ∈ N, 1 ≤ i ≤ k).
i
2
Ich empfehle, die Wohldefiniertheit von ϕ zu prüfen und eine Formel herzuleiten. Da ϕ
surjektiv ist, folgt mit Lemma 5.3 die Behauptung für Q.
Bemerkung: Durch Anordnung in einem quadratischen Schema und analoge Abzählung läßt
sich ganz analog zeigen, daß eine abzählbare Vereinigung von jeweils abzählbaren Mengen
abermals abzählbar ist.
Satz 5.3 (R ist nicht abzählbar) Es gibt keine surjektive Abbildung ϕ : N → R.
Beweis: Sei ϕ : N → R eine Abbildung, ϕ(n) = xn . Wir konstruieren eine Intervallschachtelung (In )n∈N mit xn ∈
/ In für alle n. Wähle I1 = [x1 + 1, x1 + 2]. Ist In schon
bestimmt, so zerlege In in drei abgeschlossene Teilintervalle gleicher Länge. Wähle für In+1
ein Teilintervall,
das xn+1 nicht enthält (im Zweifelsfall das rechte). Nach Satz 4.5 gibt es
T
ein x ∈ n∈N In ∈ R, also x 6= xn für alle n ∈ N.
In Zukunft brauchen wir den Begriff der Konvergenz auch für Punkte im Rn , zum Beispiel
für Punkte in der Ebene und im drei-dimensionalen Raum. Dazu brauchen wir als erstes
einen Abstandsbegriff.
25
Definition 5.5 (Euklidische Norm) Das Euklidische Skalarprodukt von Vektoren x =
(x1 , . . . , xn ), y = (y 1 , . . . , y n ) ∈ Rn ist
1 1
n n
hx, yi = x y + . . . + x y =
n
X
xi y i .
(5.1)
i=1
Die Euklidische Norm oder Länge von x = (x1 , . . . , xn ) ∈ Rn ist
|x| =
p
+
1 2
n 2
hx, xi = (x ) + . . . + (x )
1
2
=
n
X
i 2
(x )
!1/2
.
(5.2)
i=1
Lemma 5.4 (Eigenschaften des Skalarprodukts) Für α, β ∈ R und x, y, z ∈ Rn gilt:
Symmetrie:
hx, yi = hy, xi
(5.3)
Bilinearität:
hαx + βy, zi = αhx, zi + βhy, zi
(5.4)
Positivität: hx, xi ≥ 0,
Gleichheit ⇔ x = 0.
(5.5)
Beweis: Die Eigenschaften ergeben sich aus der Definition.
Lemma 5.5 (Eigenschaften der Norm) Für α ∈ R und x, y ∈ Rn gilt:
|x| ≥ 0,
Gleichheit ⇔ x = 0;
|αx| = |α| · |x|
(5.6)
(5.7)
|x + y| ≤ |x| + |y| (Dreiecksungleichung)
(5.8)
Gleichheit in der Dreiecksungleichung gilt genau dann, wenn x und y dieselbe Richtung haben.
Der Euklidische Abstand zwischen zwei Punkten x und y ist |x − y| ≥ 0. Für drei Punkte
x, y, z ergibt sich aus (5.8)
|x − z| = |x − y + y − z| ≤ |x − y| + |y − z|,
das heißt im Dreeick x, y, z ist jede Seite kürzer als die Summe der beiden anderen Seiten
(Gleichheitsdiskussion!).
Die Eigenschaften (5.6) und (5.7) sind evident, vgl. Lemma 5.4. Für den Beweis der Dreiecksungleichung benötigen wir erst das folgende Resultat.
Satz 5.4 (Ungleichung von Cauchy-Schwarz) Für x, y ∈ Rn gilt
hx, yi ≤ |x| |y|.
(5.9)
Gleichheit gilt genau dann, wenn x und y dieselbe Richtung haben.
Beweis: Im Fall x = 0 oder y = 0 ist hx, yi = |x| |y| = 0. Andernfalls betrachten wir die
y
x
Vektoren ξ = |x|
sowie η = |y|
mit Länge |ξ| = |η| = 1 (wegen (5.7)). Es gilt
x y
1 − h |x|
, |y| i = 1 − hξ, ηi
=
=
1
2
1
2
(|ξ|2 + |η|2 − 2hξ, ηi)
|ξ − η|2
≥ 0.
26
Hieraus folgt (5.9). Gilt in (5.9) Gleichheit für x, y 6= 0, so folgt aus der Abschätzung ξ = η,
das heißt x und y haben dieselbe Richtung.
Beweis: der Dreiecksungleichung (5.8):
|x + y|2 = |x|2 + 2hx, yi + |y|2
≤ |x|2 + 2|x| + |y|2 (Satz 5.4)
= (|x| + |y|)2 .
Die Behauptung folgt aus der Monotonie der Wurzel.
Im Gegensatz zu R haben wir im Rn keine Anordnung zur Verfügung. Deshalb verwenden
wir die Ungleichungszeichen <, >, ≤, ≥, Formulierungen wie ”nach oben bzw. unten beschränkt” und den Begriff der Monotonie ausschließlich für reelle Zahlen und niemals für
Punkte im Rn . Eine Ungleichung a < b ist nur für reelle Zahlen sinnvoll (später auch mal
für gewisse Matrizen, aber das tut jetzt nichts zur Sache). Ein Check zeigt jedoch, dass
die Begriffe Konvergenz, ε-Umgebung, Beschränktheit, Cauchyfolge und Vollständigkeit mit
der Betragsfunktion formuliert werden können. Sie lassen sich dann auf Rn verallgemeinern,
indem wir statt der Betragsfunktion die Euklidische Norm einsetzen.
Definition 5.6 (Konvergenz in Rn ) Die Folge xk ∈ Rn konvergiert gegen a ∈ Rn , falls
gilt:
∀ε > 0 ∃N ∈ R mit |ak − a| < ε ∀k > N.
Definition 5.7 (ε-Umgebung in Rn ) Die ε-Umgebung von a ∈ Rn ist die Menge
Uε (a) = {x ∈ Rn : |x − a| < ε}.
Sie wird auch als offene Kugel (für n ≥ 3) bzw. offene Kreisscheibe (für n = 2) um a mit
Radius ε > 0 bezeichnet. Die abgeschlossene Kugel ist
Kε (a) = {x ∈ Rn : |x − a| ≤ ε}.
Definition 5.8 (Beschränkte Teilmengen von Rn ) Eine Menge M ⊂ Rn heißt beschränkt, wenn gilt:
Es gibt ein K ≥ 0 mit |x| ≤ K für alle x ∈ M.
Zum Glück müssen wir nun nicht die ganze Theorie von vorne beginnen. Die genannten
Eigenschaften für Punkte im Rn lassen sich nämlich in Eigenschaften der Koordinaten dieser
Punkte übersetzen, und umgekehrt.
Satz 5.5 (Eigenschaften bzgl. Norm ' Eigenschaften bzgl. der Koordinaten)
Für eine Folge (ak )k∈N von Punkten ak ∈ Rn mit Koordinaten aik , i ∈ {1, . . . , n}, gelten
folgende Aussagen:
(ak )k∈N ist beschränkt
⇔
(aik )k∈N ist beschränkt für alle i ∈ {1, . . . , n};
(ak )k∈N konvergiert gegen a ∈ Rn
⇔
(aik )k∈N konvergiert gegen ai für alle i ∈ {1, . . . , n};
(ak )k∈N ist Cauchyfolge
⇔
(aik )k∈N ist Cauchyfolge für alle i ∈ {1, . . . , n}.
27
Beweis: Wir haben für x ∈ Rn die Ungleichungen
max |xi | ≤ |x| = (x1 )2 + . . . + (xn )2
1≤i≤n
1
2
≤
√
n max |xi |.
(5.10)
1≤i≤n
Geometrisch bedeutet (5.10), dass für die abgeschlossene Kugel Kr (a) mit Radius r um a
und für den abgeschlossenen Würfel Wr (a) mit Mittelpunkt a und Kantenlänge 2r > 0, also
Wr (a) = {x ∈ Rn : |xi − ai | ≤ r} = [a1 − %, a1 + %] × . . . × [an − %, an + %], folgende Inklusionen
gelten:
Kr (a) ⊂ Wr (a) ⊂ K√n r (a).
Die erste Behauptung ergibt sich nun aus der Implikation
|ak | ≤ K für alle k
⇒
|aik | ≤ K für alle i ∈ {1, . . . , n} und alle k ∈ N,
und aus dem umgekehrten Schluss
|aik | ≤ Ki
max |aik | ≤ K := max Ki
1≤i≤n
√
⇒ |ak | ≤ n K ∀ k ∈ N.
∀ i ∈ {1, . . . , n}, k ∈ N ⇒
1≤i≤n
∀k ∈ N
Das Argument für die zweite Behauptung geht wie folgt:
lim ak = a ⇔
k→∞
⇔
⇔
⇔
lim |ak − a| = 0
k→∞
max |aik − ai | = 0
1≤i≤n
(wegen Ungleichung (5.10))
lim |aik − ai | = 0 für alle i ∈ {1, . . . , n}
k→∞
lim aik = ai für alle i ∈ {1, . . . , n}.
k→∞
Schließlich gilt
(aik )k∈N Cauchyfolge
⇒
Zu ε > 0 gibt es Ni ∈ R mit
∀ i ∈ {1, . . . , n}
|aik
−
ail |
<
max1≤i≤n |aik − ail | < √εn
√
(5.10)
⇒
|ak − al | < n · √εn = ε
Die umgekehrte Richtung ist einfacher.
⇒
√ε
n
∀k, l > Ni
∀k, l > N := max1≤i≤n Ni
∀ k, l > N.
Folgerung 5.2 (Vollständigkeit von Rn ) Sei (xk )k∈N mit xk ∈ Rn eine Cauchyfolge, das
heißt
∀ ε > 0 ∃ N ∈ R mit |xk − xl | < ε ∀ k, l > N.
Dann existiert ein a ∈ Rn , so dass xk → a mit k → ∞.
Beweis: Nach Satz 5.5 sind die Folgen (xik )k∈N Cauchyfolgen in R.
Nach dem
i
i
i
Vollständigkeitsaxiom gibt es a ∈ R mit limk→∞ xk = a für alle i ∈ {1, . . . , n}. Wieder
nach Satz 5.5 folgt limk→∞ xk = a.
Folgerung 5.3 (Bolzano-Weierstraß im Rn ) Jede beschränkte Folge (xk )k∈N in Rn besitzt eine konvergente Teilfolge.
28
Beweis: Nach Satz 5.5 sind die reellen Folgen (xik )k∈N beschränkt für jedes i ∈ {1, . . . , n}.
Wir konstruieren induktiv sukzessive Teilfolgen, so dass schliesslich alle Koordinatenfolgen
konvergieren. Mit Satz 5.5 folgt dann die Behauptung. Im ersten Schritt wählen wir nach
Satz 4.7 eine Teilfolge k10 < k20 < . . ., so dass
lim x1k0 =: a1 ∈ R
j→∞
j
existiert. Im zweiten Schritt wählen wir, wieder nach Satz 4.7, aus der ersten Teilfolge eine
weitere Teilfolge k100 < k200 < . . ., so dass zusätzlich der Grenzwert
lim x2k00 =: a2 ∈ R
j→∞
j
(n)
(n)
existiert. So fahren wir fort, bis nach n Schritten eine Teilfolge k1 < k2
ist, für die alle Grenzwerte limj→∞ xi (n) =: ai mit 1 ≤ i ≤ n existieren.
< . . . gefunden
kj
Beispiel Um den Sachverhalt zu verdeutlichen, betrachte die Folge xk = (x1k , x2k ) von Punkten in R2 mit

 0 für k = 0 mod 3,
1 für k gerade,
1 für k = 1 mod 3,
x1k =
x2k =
−1 für k ungerade,

2 für k = 2 mod 3.
Die Koordinatenfolge (x1k )k∈N hat zum Beispiel die konvergente Teilfolge (x12j )j∈N , denn x12j =
1 für alle j. Ebenso ist (x23j )j∈N konvergente Teilfolge von (x2k )k∈N , denn x23j = 0 für alle
j ∈ N. Damit haben wir aber noch keine konvergente Teilfolge für die Punkte xk ∈ R2
gefunden, denn weder x22j noch x13j ist konvergent. Stattdessen wählen wir aus der Folge
(x2j )j∈N die weitere Teilfolge (x2·3l )l∈N , also j = 3l, aus. Diese konvergiert in R2 , denn es ist
x6l = (1, 0) für alle l ∈ N.
Definition 5.9 (Häufungspunkt von Mengen) Ein Punkt a ∈ Rn heißt Häufungspunkt
der Menge M ⊂ Rn , falls für jedes ε > 0 die Menge Uε (a) ∩ M unendlich viele Elemente hat.
Lemma 5.6 Der Punkt a ∈ M ist genau dann Häufungspunkt von M , wenn es eine Folge
von Punkten ak ∈ M \{a} gibt mit limk→∞ ak = a.
Beweis: Sei a Häufungspunkt gemäß Definition 5.9. Zu εk =
U 1 (a) ∩ M \{a}. Die Folge (ak )k∈N ist wie verlangt.
1
k
gibt es dann ein ak ∈
k
Sei umgekehrt eine Folge ak ∈ M \{a} gegeben mit limk→∞ ak = a. Angenommen, für ein
ε > 0 ist die Menge Uε (a) ∩ M endlich, also Uε (a) ∩ M \{a} = {x1 , . . . , xm } für ein m ∈ N0 .
Dann ist % := min1≤i≤m |xi − a| > 0. Wegen limk→∞ |ak − a| = 0 folgt für k hinreichend groß
ak ∈ U% (a) ∩ M \{a} = ∅,
ein Widerspruch.
Beispiele:
• M = { n1 : n ∈ N}
⇒
0 ∈ R ist Häufungspunkt von M .
• Jedes a ∈ R ist Häufungspunkt von Q.
29
• Eine endliche Menge M = {x1 , . . . , xm } ⊂ Rn hat keinen Häufungspunkt. Dagegen hat
die konstante Folge (ak )k∈N mit ak = 1 für alle k den Häufungspunkt 1 ∈ R. Überlegen
Sie, dass für eine beliebige Folge (ak )k∈N im Rn die Häufungspunkte des Wertebereichs
M = {ak : k ∈ N} eine Teilmenge der Häufungspunkte der Folge bilden, die aber eine
echte Teilmenge sein kann, wie das Beispiel der konstanten Folge zeigt.
Definition 5.10 (Offene und abgeschlossene Mengen)
(i) Ω ⊂ Rn heißt offen, falls zu jedem x ∈ Ω ein ε > 0 existiert mit Uε (x) ⊂ Ω.
(ii) A ⊂ Rn heißt abgeschlossen, wenn folgende Implikation stets gilt:
xn ∈ A,
lim xn = x ∈ Rn
n→∞
⇒
x ∈ A.
Nach Lemma 5.6 ist eine Menge A genau dann abgeschlossen, wenn jeder Häufungspunkt von
A schon Element von A ist.
Beispiel 5.1 Die Kugel U% (a) = {x ∈ Rn : |x − a| < %} ist offen.
Beweis: Sei x ∈ U% (a) und 0 < ε ≤ % − |x − a| > 0. Für y ∈ Uε (x) folgt
|y − a| ≤ |y − x| + |x − a| < ε + |x − a| = %.
Also gilt Uε (x) ⊂ U% (a).
Satz 5.6 Für M ⊂ Rn gilt: M offen
⇔
Rn \M abgeschlossen.
Beweis:
⇒“: Sei xk ∈ Rn \M Folge, limk→∞ xk = x ∈ Rn . Wäre x ∈ M , so folgt Uε (x) ⊂ M für ein
”
ε > 0, und somit xk ∈ M für k hinreichend groß, Widerspruch. Also ist x ∈ Rn \M .
⇐“: Angenommen, M ist nicht offen. Dann gibt es ein x ∈ M mit Uε (x)\M 6= ∅
”
für alle ε > 0. Finde induktiv xk ∈ U 1 (x) mit xk ∈ Rn \M . Es folgt x = limk→∞ xk ∈
k
Rn \M , ein Widerspruch.
Eine Menge M ⊂ Rn kann weder offen noch abgeschlossen sein; dies trifft zum Beispiel auf
ein halboffenes Intervall [a, b) zu. Die Mengen R und ∅ sind die einzigen Teilmengen von
R, die sowohl offen als auch abgeschlossen sind. Dies soll in den Übungen gezeigt werden.
Die Vereinigung beliebig vieler offener Mengen ist offen, aber nur endliche Durchschnitte von
offenen Mengen sind offen. Auch dies soll in den Übungsaufgaben behandelt werden.
Zum Abschluss dieses Abschnitts untersuchen wir als Beispiel eine spezielle Menge, und zwar
die sogenannte Cantormenge C ⊂ [0, 1]. Analog zur Dezimaldarstellung gibt es zu jedem
x ∈ [0, 1] Ziffern kj ∈ {0, 1, 2}, j ∈ N, mit
x = 0, k1 k2 . . . :=
∞
X
kj 3−j .
j=1
Auf diese Weise ist x als triadischer Bruch (b-adischer Bruch zur Basis b = 3) dargestellt.
30
Lemma 5.7 Seien x = 0, k1 k2 . . . und y = 0, m1 m2 . . . mit kj = mj für j = 1, . . . , N − 1,
aber |kN − mN | = 2. Dann gilt |x − y| ≥ 3−N > 0.
Beweis:
|x − y| = |
∞
X
(kj − mj )3−j |
j=1
≥ 2 · 3−N −
∞
X
j=N +1
|kj − mj | 3−j
| {z }
≤2
≥ 2 · 3−N − 2 · 3−(N +1) ·
1
1−
1
3
= 3−N .
Definition 5.11 (Cantormenge) Die Cantormenge ist die Menge aller reellen Zahlen in
[0, 1], die eine triadische Entwicklung nur mit den Ziffern 0 und 2 erlauben:
C = {0, k1 k2 . . . :
kj ∈ {0, 2} für alle j}.
Um diese Menge zu verstehen, betrachten wir die Mengen
Cn = {0, k1 k2 . . . :
kj ∈ {0, 2} für 1 ≤ j ≤ n}.
Wir haben dann [0, 1] = C0 ⊃ C1 ⊃ . . . ⊃ Cn ⊃ . . . ⊃ C.
Lemma 5.8 Es gilt
2 1
1
(1) Cn+1 = { x : x ∈ Cn } ∪ { + x : x ∈ Cn }
|3
{z
} | 3 3 {z
}
=: 13 Cn
(2) C =
(disjunkte Vereinigung),
=: 23 + 13 Cn
T∞
n=0 Cn .
Beweis: Aussage (1) ergibt sich direkt aus
Cn+1 = {0, k1 k2 . . . : kj ∈ {0, 2} für j ≤ n + 1},
1
Cn = {0, 0m1 m2 . . . : mj ∈ {0, 2} für j ≤ n},
3
2 1
+ Cn = {0, 2m1 m2 . . . : mj ∈ {0, 2} für j ≤ n}.
3 3
C0
0
1
C1
0
1/3
2/3
1
C2
31
0
1/9
2/9
1/3
2/3
7/9
8/9
1
C3
0
1
27
2 1
27 9
2 7
9 27
8 1
27 3
2 19
3 27
20 7
27 9
8 25
9 27
26
27
1
T
Bei der zweiten Aussage ist C ⊂ ∞
n=1 Cn klar. Sei umgekehrt x ∈ Cn für alle n ∈ N. Die
ersten n Ziffern in {0, 2} von x sind eindeutig bestimmt nach Lemma 5.7. Es folgt
x ∈ C1 ⇒ x = 0, k1 . . .
x ∈ C2 ⇒ x = 0, k1 k2 . . .
..
.
mit k1 ∈ {0, 2},
mit k2 ∈ {0, 2}und gleichem k1 ,
x ∈ Cn ⇒ x = 0, k1 k2 . . . kn . . . mit kn ∈ {0, 2}und gleichen k1 , . . . , kn−1 .
Auf diese Weise erhalten wir eine Darstellung x = 0, k1 k2 . . . mit kj ∈ {0, 2} für alle j ∈ N.
Aus der ersten Aussage des Lemmas folgt mit Induktion, dass Cn disjunkte Vereinigung von
2n abgeschlossenen Intervallen der Länge 3−n ist.
Satz 5.7 (Eigenschaften der Cantormenge) Die Cantormenge hat folgende Eigenschaften:
(1) C ist abgeschlossen.
(2) Jedes x ∈ C ist Häufungspunkt von C.
(3) [0, 1]\C ist dicht in (0, 1).
(4) C ist überabzählbar.
(5) C ist selbstähnlich: C = 31 C ∪ ( 23 + 13 C).
(6) C hat die Dimension log3 2.
Beweis: Wir werden die Aussagen (1) bis (5) beweisen, und bei (6) ein Indiz für die Richtigkeit der Behauptung angeben, aber keinen Beweis.
(1): Da C0 = [0, 1] abgeschlossen ist, ist nach Rekursionsformel (1) in Lemma 5.8 auch
Cn abgeschlossen
für alle n ∈ N. Als Durchschnitt abgeschlossener Mengen ist dann
T∞
C = n=1 Cn ebenfalls abgeschlossen.
(2): Falls die Entwicklung x = 0, k1 . . . kn von x abbricht, so wählen wir als approximierende
Folge xn = x + 2 · 3−n ∈ C. Andernfalls können wir die Zahlen xn = 0, k1 . . . kn als
Approximation wählen.
(3): Wir nehmen indirekt an, dass I = (a, b) ⊂ C ist. Dann folgt I ⊂ Cn für alle n, und
I muss schon in einem der 2n disjunkten Teilintervalle von Cn enthalten sein. Dies
bedeutet |I| ≤ 3−n → 0, ein Widerspruch.
32
(4) Wir benutzen das Diagonalverfahren von Cantor:
x1 = 0, k11 k12 k13 . . .
x2 = 0, k21 k22 k23 . . .
x3 = 0, k31 k32 k33 . . .
Setze kn := 0, falls knn = 2, und kn := 2, falls knn = 0. Aufgrund der Vollständigkeit ist
durch x := 0, k1 k2 . . . eine reelle Zahl definiert, die in der Aufzählung nicht vorkommt
(beachte die Eindeutigkeit der Zifferndarstellung mit 0 und 2).
(5) Sei x ∈ C, also x ∈ Cn für alle n ∈ N. Nach Lemma 5.8 (1) folgt 31 x ∈ Cn+1 sowie
1
2
1
2
1
3 + 3 x ∈ Cn+1 für alle n ∈ N. Aus Lemma 5.8 (ii) folgt weiter 3 x ∈ C sowie 3 + 3 x ∈ C.
2
1
1
Damit ist 3 C ∪ ( 3 + 3 C) ⊂ C bewiesen. Umgekehrt ist zu zeigen, dass jedes x ∈ C so
dargestellt werden kann:
x ∈ C ⇒ x ∈ Cn+1
(
x ≤ 13 :
Lemma 5.8 (i) ⇒
x ≥ 23
Lemma 5.8 (ii) ⇒ y ∈ C
∀n ∈ N
y := 3x ∈ Cn ∀n ∈ N
y := 3(x − 23 ) ∈ Cn ∀n ∈ N
und x = 31 y bzw. x =
2
3
+ 13 y.
(6) Wir können hier nur versuchen, einen Anhaltspunkt für die Behauptung zu geben. Bei
Streckungen des R3 mit Faktor α > 0 geht die Länge eine Objekts mit Faktor α1 ,
der Flächeninhalt mit α2 und der Rauminhalt mit α3 . Bei Verschiebungen bleiben
Länge, Fläche und Rauminhalt natürlich gleich. Angenommen, C ist d-dimensional
für ein d ∈ [0, ∞), und angenommen, wir könnten den d-dimensionalen Inhalt von C
definieren. Dann sollte für diesen d-dimensionalen Inhalt µd (C) unter Streckungen mit
Faktor α > 0 sowie unter Verschiebungen um x0 ∈ R gelten:
µd (α C) = αd µd (C),
µd (x0 + C) = µd (C).
Aus (5) würde dann folgen
1
2 1 C ∪ ( + C)
3
3 3
1
2 1
= µd ( C) + µd ( + C) (da Vereinigung disjunkt)
3
3 3
1 d
= 2 ( ) µd (C) (Streckung um 13 , Verschiebung um 23 ),
3
µd (C) = µd
bzw. nach Kürzen d = log3 2.
33
34
Kapitel 2
Funktionen und Stetigkeit
1
Polynome und komplexe Zahlen
Eine reellwertige Funktion auf einer Menge D ist eine Abbildung f : D → R. Die Menge D
heißt Definitionsbereich von f , die Menge f (D) Wertebereich oder Bild von f . Der Graph
von f ist die Menge
Graph (f ) = {(x, f (x)) : x ∈ D} ⊂ D × R.
Besonders für D ⊂ R ist der Graph sehr nützlich, um sich die Funktion f qualitativ vorzustellen. Es folgen jetzt einige Beispiele, mehr oder minder mathematischer Natur, von
reellwertigen Funktionen (zunächst auch alle mit D ⊂ R):
(1)
D = [0, ∞), t ∈ [0, ∞) Zeit
f (t) = Körpertemperatur einer Leiche zur Zeit t, nach Mord zur Zeit t = 0
f (0) = 37◦ C, f (t) = 10◦ C (Umgebungstemperatur) für t ≥ T.
t1 < t2 ≤ T ⇒ f (t1 ) > f (t2 ) (f |[0,T ] streng monoton fallend)
⇒ f |[0,T ] injektiv, also der Todeszeitpunkt eindeutig ermittelbar
Bild (f ) = [10, 37] (in Grad ◦ C).
(2)
DAX: D = [9, 18], t ∈ D Tageszeit
35
(3)
Massenformel von Einstein:
m(v) = √
(4)
(5)
(6)
(7)
(8)
m0
1−( vc )2
m0 Ruhemasse, c = 3 · 108 m/s (Lichtgeschwindigkeit)
D = [0, c) Definitionsbereich der Relativitätstheorie
Gaußklammerfunktion (Größte-Ganze-Funktion):
f : R → R, f (x) = [x] = max {n ∈ N : n ≤ x}.
Charakteristische
Funktion von M ⊂ R:
(
1 x∈M
f (x) =
0 sonst
Dirichletfunktion
(Spezialfall von (6) mit M = Q):
(
1 x∈Q
f (x) =
0 sonst
Affin-lineare Funktionen:
f : R → R, f (x) = ax + b
(a, b ∈ R)
Spezialfall: a = 0 ⇒ f (x) = b (konstante Funktion).
Quadratische Funktionen:
f : R → R, f (x) = ax2 + bx + c
quadratische Ergänzung
(i)
b2 − 4ac > 0
⇒
⇒
(a 6= 0)
f (x) = a x +
b 2
2a
−
b2 −4ac
4a2
b
zwei Nullstellen x± = − 2a
±
.
√
+
b2 −4ac
2a
f (x) = a(x − x+ )(x − x− ).
(ii)
b2 − 4ac = 0
⇒
b
.
eine Nullstelle x0 = − 2a
f (x) = a(x − x0 )2 .
(iii)
b2 − 4ac < 0
⇒
keine Nullstelle in R.
Allgemeiner sind Polynome eine grundlegende Klasse von Funktionen. Sie werden oft zur
Approximation anderer Funktionen eingesetzt, worauf wir später ausführlich eingehen werden.
Definition 1.1 Eine Funktion p : R → R heißt Polynom vom Grad n ∈ N0 , wenn es
a0 , a1 , . . . , an ∈ R mit an 6= 0 gibt, so dass gilt:
p(x) = a0 + a1 x + . . . + an xn
für alle x ∈ R.
(1.1)
Im untenstehenden Satz 1.1 wird gezeigt, dass der Grad n ∈ N0 und die Koeffizienten
a0 , a1 , . . . , an mit an 6= 0 durch (1.1) eindeutig bestimmt sind.
Lemma 1.1 (Abspaltung von Linearfaktoren) Sei p : R → R ein reelles Polynom vom
Grad n ∈ N mit Koeffizienten a0 , a1 , . . . , an , an 6= 0. Falls p(x0 ) = 0 für ein x0 ∈ R, so gibt
es ein Polynom q vom Grad n − 1 mit (n − 1)-tem Koeffizient gleich an , so dass gilt:
p(x) = (x − x0 ) q(x)
36
für alle x ∈ R.
(1.2)
Beweis: Mit dem Teleskopsummentrick folgt für x ∈ R
xk − xk0 = xk − xk−1 x0 + xk−1 x0 − . . . − xxk−1
+ xxk−1
− xk0
0
0
= (x − x0 )(xk−1 + xk−2 x0 + . . . + xk−1
0 ).
Daraus folgt weiter
p(x) = p(x) − p(x0 )
(da p(x0 ) = 0)
n
X
=
ak (xk − xk0 )
k=1
= (x − x0 )
n
X
ak (xk−1 + xk−2 x0 + . . . + x0k−1 ) .
|k=1
{z
}
=:q(x)
Der Koeffizient von xn−1 ist an nach Definition von q.
Lemma 1.2 (Nullstellenlemma) Sei p ein Polynom vom Grad n ∈ N0 . Dann hat p
höchstens n verschiedene Nullstellen.
Beweis: Induktion über n ∈ N0 .
n=0
⇒
p(x) ≡ a0 ist konstant, wobei a0 6= 0. Also hat p keine Nullstelle.
Sei nun p Polynom vom Grad n ≥ 1.
⇒
Fall 1:
p hat keine Nullstelle
Fall 2:
p(x0 ) = 0 für ein x0 ∈ R
⇒
Behauptung.
p(x) = (x − x0 ) q(x) ∀x ∈ R, grad q = n − 1 (Lemma 1.1)
q hat höchstens n − 1 Nullstellen (Induktionsannahme) ⇒
Behauptung.
Satz 1.1 (Koeffizientenvergleich) Seien p, q Polynome vom Grad n bzw. m, also
p(x) = a0 + a1 x + . . . + an xn , für alle x ∈ R, an 6= 0,
q(x) =
b0 + b1 x + . . . bm xm für alle x ∈ R,
bm 6= 0.
Es gelte p(xj ) = q(xj ) für paarweise verschiedene x1 , . . . , xk ∈ R, wobei k > max(n, m).
Dann folgt n = m und ai = bi für i = 0, . . . , n.
Beweis: Wäre n 6= m oder ai 6= bi für ein i, so wäre p − q Polynom vom Grad höchstens
max(n, m), hat aber k Nullstellen. Widerspruch zu Lemma 1.2.
Folgerung 1.1 Sei p reelles Polynom vom Grad n. Dann besitzt p eine eindeutig bestimmte
Darstellung
p(x) = (x − x1 )ν1 · . . . · (x − xr )νr q(x) ∀x ∈ R.
(1.3)
Dabei sind {x1 , . . . , xr } ⊂ R die Nullstellen von p (evtl. r = 0) und q ist Polynom vom Grad
n − (ν1 + . . . + νr ) ∈ {0, . . . , n} mit q(x) 6= 0 für alle x ∈ R. Die Zahlen νi ≥ 1 heißen
Vielfachheiten der Nullstellen.
37
Beweis: Die Existenz folgt induktiv aus Lemma 1.1. Sei p(x) = (x−x1 )µ1 ·. . .·(x−xr )µr h(x)
eine zweite solche Darstellung, o.B.d.A. ν1 ≥ µ1 . Indem wir durch (x − x1 )µ1 teilen, folgt für
x 6= x1
r
(x − x1 )ν1 −µ1 · (x − x2 )ν2 · . . . · (x − xr )ν · q(x) = (x − x2 )µ2 · . . . · (x − xr )µr · h(x).
Beide Seiten dieser Gleichung sind Polynome, haben nach Satz 1.1 also dieselben Koeffizienten. Deshalb stimmen sie auch in x = x1 überein, und es folgt ν1 = µ1 und analog νi = µi für
alle i ∈ {1, . . . , r}. Nach Division haben wir schließlich q(x) = h(x) für x ∈ R\{x1 , . . . , xr },
und Satz 1.1 liefert q = h.
Was machen wir mit Polynomen, die keine reellen Nullstellen haben, wie z. B. p(x) = x2 + 1?
Wir werden jetzt den Zahlbereich R erweitern, so dass die Gleichung x2 = −1 eine Lösung
hat:
N ⊂ Z ⊂ Q ⊂ R ⊂ C = komplexe Zahlen.
C := (R2 , +, · ) ist ein Körper. Dabei sind die Verknüpfungen wie folgt definiert:
(1) Die Addition ist die Vektoraddition in R2 :
R2 ist zweidimensionaler R-Vektorraum.
Fasse R als Teilmenge von R2 auf: R =
b R × {0} ⊂ R2 ,
Erhalte die Standardbasis {(1, 0) =: 1, (0, 1) =: i}.
⇒
x=
b (x, 0).
z = (x, y) = (1, 0)x + (0, 1)y = 1 · x + i · y = x + iy (Basisdarstellung von z)
Die Addition lautet also wie folgt:
(x1 + iy1 ) + (x2 + iy2 ) = (x1 , y1 ) + (x2 , y2 )
= (x1 + x2 , y1 + y2 )
= (x1 + x2 ) + i(y1 + y2 ).
(2) Die Multiplikation:
Forderung: i ist Lösung der Gleichung x2 = −1.
Seien z1 = x1 + iy1 , z2 = x2 + iy2 ∈ C. Aus den Körpergesetzen folgt dann
z1 z2 = (x1 + iy1 )(x2 + iy2 )
= x1 x2 + i2 y1 y2 + i(x1 y2 + y1 x2 )
z1 z2 = x1 x2 − y1 y2 + i(x1 y2 + y1 x2 )
z = x + iy ⇒ iz = −y + ix
Multiplikation mit i ist Drehung um 90◦ im entgegengesetzten Uhrzeigersinn.
Multiplikation mit α ∈ R ist Skalarmultiplikation im Vektorraum R:
αz = α(x + iy) = αx + iαy = (αx, αy) = α(x, y).
Eine weitere Struktur auf C ist die
38
(3) Konjugation: z 7→ z
Für z = x + iy setzen wir z = x − iy.
Die Konjugation ist die Spiegelung an der x-Achse.
z heißt die zu z konjugierte komplexe Zahl.
Lemma 1.3 Für die komplexe Konjugation gilt:
(i) z1 + z2 = z1 + z2 , z1 z2 = z1 z2 ,
(ii) z = z
⇔
z ∈ R,
(iii) Für z = x + iy haben wir
1
(Realteil),
x = (z + z) =: Re z ∈ R
2
1
y = (z − z) =: Im z ∈ R (Imaginärteil).
2i
Beweis:
(i) Wir zeigen die zweite Gleichung:
z1 z2 = (x1 − iy1 )(x2 − iy2 )
= x1 x2 − y1 y2 − i(x1 y2 + y1 x2 )
= z1 z2 .
(ii) x − iy = x + iy
⇔
y = 0.
(iii)
1
(z + z) =
2
1
(z − z) =
2i
1
(x + iy + x − iy) = x,
2
1
x + iy − (x − iy) = y.
2i
Als vierte Struktur der komplexen Zahlen besprechen wir nun den
(4) Zusammenhang mit der Euklidischen Struktur auf R2 :
Die Euklidische Norm und das Skalarprodukt auf R2 sind wie folgt definiert:
p
z = x + iy
⇒
|z| = + x2 + y 2 ,
z1 = x1 + iy1 , z2 = x2 + iy2
⇒
hz1 , z2 i = x1 x2 + y1 y2 .
Lemma 1.4 Für den Betrag einer komplexen Zahl gelten folgende Regeln:
(i) |z|2 = z z,
hz1 , z2 i = Re (z1 z2 ).
39
(ii) |z1 z2 | = |z1 ||z2 |.
(iii) |Re z| ≤ |z|, |Im (z)| ≤ |z|.
Beweis: Aussage (i) ergibt sich aus der Rechnung
Re (z1 z2 ) = Re (x1 + iy1 )(x2 − iy2 )
= Re x1 x2 + y1 y2 − i(x1 y2 − y1 x2 )
= x1 x2 + y1 y2
= hz1 , z2 i,
bzw.
z z = (x + iy)(x − iy) = x2 + y 2 = |z|2 .
Die Identität (ii) folgt aus (i) wegen
|z1 z2 |2 = (z1 z2 )(z1 z2 ) = z1 z1 z2 z2 = |z1 |2 |z2 |2 .
Die Ungleichungen (iii) sind klar.
Bemerkung. Aus Lemma 1.4(i) folgt für z = x + iy 6= 0
1
z
x − iy
=
= 2
.
z
zz
x + y2
(1.4)
Wir kehren jetzt zu den Polynomen zurück, und zwar betrachten wir jetzt komplexe Polynome. Analog zu Definition 1.1 sind dies Funktionen p : C −→ C, für die es Koeffizienten
a0 , a1 , . . . , an ∈ C gibt, so dass gilt:
p(z) = a0 + a1 z + . . . + an z n
für alle z ∈ C.
Die Abspaltung von Linearfaktoren (Lemma 1.1), das Nullstellenlemma (Lemma 1.2) und der
Koeffizientenvergleich (Satz 1.1) mitsamt der Folgerung 1.1 gelten für komplexe Polynome
ganz analog, denn zu ihrem Beweis wurden ausschließlich die Körperaxiome (und nicht zum
Beispiel die Anordnung) benutzt. Der Grad eines komplexen Polynoms, seine Koeffizienten
und die Vielfachheit der Nullstellen sind also wohldefiniert.
Es ist nicht schwer zu sehen, dass jedes quadratische Polynom in C eine Nullstelle hat
(Übungsaufgabe). Tatsächlich ist viel mehr wahr:
Satz 1.2 (Fundamentalsatz der Algebra, Gauß 1799) Jedes komplexe Polynom vom
Grad n ≥ 1 hat mindestens eine Nullstelle z0 ∈ C.
Diesen Satz werden wir in Analysis II beweisen. Als Konsequenz ergibt sich
Folgerung 1.2 Sei p ein komplexes Polynom vom Grad n mit Koeffizienten a0 , a1 , . . . , an ∈
C. Dann besitzt p eine eindeutige Darstellung
p(z) = an (z − z1 )ν1 · . . . · (z − zk )νk
∀z ∈ C.
(1.5)
Dabei sind z1 , . . . , zk ∈ C die Nullstellen von p, und die νi ≥ 1 sind die Vielfachheiten dieser
Nullstellen mit ν1 + . . . + νk = n.
40
Beweis: Wie oben festgestellt, gilt die Darstellung (1.3) auch über C, und das Restpolynom
q in (1.3) hat dann keine Nullstelle in C. Nach Satz 1.2 muss q den Grad Null haben, das
heißt q(z) = an für alle z ∈ C.
Was bedeuten diese Überlegungen für reelle Polynome? Da R ⊂ C, können wir jedes reelle
Polynom p : R → R auch als komplexes Polynom auffassen: wir setzen statt x ∈ R komplexe
Zahlen z ∈ C ein. Auf diese Weise wird die reelle Funktion p : R → R zu einer komplexen
Funktion p : C → C fortgesetzt.
Lemma 1.5 Sei p(x) = a0 + a1 x + . . . + an xn mit a0 , a1 , . . . , an ∈ R ein reelles Polynom vom
Grad n. Dann besitzt p, aufgefasst als komplexes Polynom, eine Faktorisierung der Form
p(z) = an
r
k
Y
Y
(z − xi )νi
(z − zj )µj (z − zj )µj
i=1
für alle z ∈ C.
j=1
Dabei sind {x1 , . . . , xr } ⊂ R die reellen Nullstellen von p mit Vielfachheit νi ≥ 1, und
{z1 , z1 , . . . , zk , zk } ⊂ C\R die nichtreellen Nullstellen von p. Diese treten also in Paaren
von konjugiert komplexen Zahlen zj , zj gleicher Vielfachheit µj auf. Es gilt ν1 + . . . + νr +
2 (µ1 + . . . + µk ) = n.
Beweis: Es gilt für z ∈ C, da ai ∈ R, wegen Lemma 1.3 (i)
p(z) = a0 + a1 z + . . . + an z n = a0 + a1 z + . . . + an z n = p(z).
Insbesondere folgt p(z) = 0 ⇒ p(z) = 0. Ist daher z1 ∈ C\R eine nichtreelle Nullstelle,
so erhalten wir nach Lemma 1.1 die Darstellung
p(z) = (z − z1 )(z − z1 ) q(z) = (z 2 − 2(Re z1 )z + |z1 |2 ) q(z),
(1.6)
mit einem Polynom q vom Grad n − 2. Beachten Sie, dass wir Lemma 1.1 hier über
C anwenden, das heißt die Koeffizienten des Polynoms q sind zunächst komplexe Zahlen
b0 , b1 , . . . , bn−2 ∈ C. Um zu sehen, dass die bi doch reell sind, setzen wir z := x ∈ R in (1.6)
ein und bilden die Imaginärteile beider Seiten:
0 = Im p(x)

(da p reelle Koeffizienten hat)

= Im (x2 − 2(Re z1 )x + |z1 |2 ) q(x)
|
{z
}
∈R
= (x2 − 2(Re z1 )x + |z1 |2 ) Im q(x)
n−2
X
= (x2 − 2(Re z1 )x + |z1 |2 )
(Im bi )xi .
i=0
Da der linke Faktor in der letzten Zeile für x ∈ R niemals Null ist, folgt
n−2
X
(Im bi )xi = 0
für alle x ∈ R.
i=0
Nach Satz 1.1 muss Im bi = 0 für alle i = 0, 1, . . . , n−2 gelten, das heißt bi ∈ R. Das Polynom
q ist also wieder ein reelles Polynom, und durch Induktion erhalten wir die gewünschte
Darstellung.
41
Folgerung 1.3 Jedes Polynom p(x) = a0 + a1 x + . . . + an xn mit a0 , a1 , . . . , an ∈ R zerfällt
über R in lineare und quadratische Faktoren. Genauer gilt
p(x) = an
r
k
Y
Y
(x − xi )νi
(x2 − 2(Re zj )x + |zj |2 )µj
i=1
für alle x ∈ R,
(1.7)
j=1
wobei die xi ∈ R die reellen und die zj , zj ⊂ C\R die nichtreellen Nullstellen von p sind.
2
Stetige Funktionen
Definition 2.1 (Stetigkeit) Sei x0 ∈ D ⊂ R (bzw. x0 ∈ D ⊂ Rm ). Die Funktion f : D →
R (bzw. f : D → Rn ) heißt stetig im Punkt x0 , falls es zu jedem ε > 0 ein δ > 0 gibt, so dass
für x ∈ D gilt:
|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε.
(2.1)
Wir wollen einige Beispiele betrachten.
Beispiel 2.1 Konstante Funktionen: f (x) = c für alle x ∈ D.
Es gilt |f (x) − f (x0 )| = 0 für alle x ∈ D. Zu ε > 0 können wir also jedes δ > 0 wählen.
Beispiel 2.2 Identische Funktion: f (x) = x für alle x ∈ D ⊂ Rn .
Zu ε > 0 wähle δ := ε > 0 und erhalte
|x − x0 | < δ
⇒
|f (x) − f (x0 )| = |x − x0 | < δ = ε.
Beispiel 2.3 Betragsfunktion: f (x) = |x| für x ∈ R.
Zu ε > 0 wähle δ := ε > 0 und schließe mit der Dreiecksungleichung
|x − x0 | < δ
⇒
|f (x) − f (x0 )| = ||x| − |x0 || ≤ |x − x0 | < δ = ε.
Analog : Die Euklidische Norm | · | : Rm → R ist eine stetige Funktion auf Rm .
Beispiel 2.4 Gaußklammerfunktion: f (x) = [x] = max{k ∈ Z : k ≤ x}.
Wir betrachten zwei verschiedene Definitionsbereiche:
• D = [1, ∞)
⇒
f ist stetig in x0 = 1.
Zu ε > 0 wähle zum Beispiel δ =
|x − 1| < δ, x ∈ D
• D = [0, 1]
⇒
⇒
1
2
und schließe
3
x ∈ [1, )
2
⇒
|f (x) − f (1)| = |[x] − [1]| = 0.
f ist nicht stetig in x0 = 1.
Angenommen es gibt zu ε = 1 ein δ > 0 wie gefordert. Wähle dann x ∈ (1 − δ, 1) mit
x ≥ 0, und erhalte den Widerspruch
1 = ε > |f (x) − f (1)| = |[x] − [1]| = 1.
42
Fazit: Bei der Stetigkeit kommt es auch darauf an, welcher Definitionsbereich gewählt wird.
Beispiel 2.5 Die n-te Wurzel f : [0, ∞) → R, f (x) =
√
n
x ≥ 0, ist stetig in allen x0 ∈ [0, ∞).
Sei ε > 0 gegeben. Wir unterscheiden zwei Fälle:
Fall 1 x0 = 0.
Wähle δ = εn > 0. Für |x − x0 | = x < δ folgt |f (x) − f (x0 )| =
√
n
x < ε.
Fall 2 x0 > 0.
√
√
Setze n x0 = y0 ≥ 0 und n x = y ≥ 0. Dann gilt
x − x0 = y n − y0n
= (y n−1 + y n−2 y0 + . . . + y y0n−2 + y0n−1 )(y − y0 ).
⇒ |x − x0 | ≥ y0n−1 |y − y0 |.
Wähle nun δ = y0n−1 ε > 0. Für |x − x0 | < δ folgt
|f (x) − f (x0 )| = |y − y0 | ≤ y01−n |x − x0 | < y01−n δ = ε.
Definition 2.2 Sei D ⊂ Rm . Die Abbildung f : D → Rn heißt Lipschitzstetig mit Konstante
L ≥ 0, falls gilt:
|f (x) − f (y)| ≤ L|x − y| für alle x, y ∈ D.
Beispiel 2.6 Lipschitzstetig
⇒
stetig:
Die Lipschitzkonstante von f : D → Rn sei L ≥ 0, o.B.d.A. L > 0. Zu ε > 0 wähle
δ = ε/L > 0 und erhalte
|f (x) − f (x0 )| ≤ L|x − x0 | < L δ = ε
für |x − x0 | < δ.
Beispiel 2.7 Lineare Abbildungen A : Rm → Rn .
Sei A : Rm → Rn linear. Bezüglich der Standardbasen {e1 , . . . , em } des Rm und {e1 , . . . , en }
des Rn besitzt A eine Matrixdarstellung A = (Aij )1≤i≤n,1≤j≤m , das heißt die Bilder A(ej )
der Basisvektoren ej des Rm besitzen bzgl. der Vektoren ei im Rn die Koordinaten Aij :
A(ej ) =
n
X
Aij ei
für j = 1, . . . , m.
i=1
Definition 2.3 Die Euklidische Norm der linearen Abbildung A : Rm → Rn ist

|A| = 
m
X
j=1
1/2
|Aej |2 

=
43
n X
m
X
i=1 j=1
1/2
A2ij 
.
Es gilt nun für jedes x ∈ Rm
|A(x)| = |A(x1 e1 + . . . + xm em )|
= |x1 A(e1 ) + . . . + xm A(em )|
≤
=
≤
(da A linear)
|x1 | |A(e1 )| + . . . + |xm | |A(em )|
1
(|x |, . . . , |xm |), (|A(e1 )|, . . . , |A(em )|)
(|A(e1 )|2 + . . . + |A(em )|2 )1/2 (|x1 |2 + . . .
(Normeigenschaften)
(Definition von h·, ·i auf Rm )
+ |xm |2 )1/2
(Cauchy-Schwarz).
Damit haben wir gezeigt:
|A(x)| ≤ |A| |x| für alle A ∈ Hom(Rm , Rn ), x ∈ Rm .
(2.2)
Insbesondere folgt für x, y ∈ Rm
|A(x) − A(y)| = |A(x − y)| ≤ |A| |x − y|,
d. h. A ist Lipschitzstetig mit Konstante |A|.
Um nicht den Überblick zu verlieren, konzentrieren wir uns im folgenden auf relle Funktionen
einer Variablen, also m = n = 1. Die meisten Aussagen haben aber offensichtliche Verallgemeinerungen für Funktionen mehrerer Variabler (m ≥ 2) und/oder vektorwertige Funktionen
(n > 1).
Satz 2.1 (Definition der Stetigkeit mittels Folgen) Sei f : D ⊂ R und x0 ∈ D. Dann
sind folgende Aussagen äquivalent:
(1) f ist stetig in x0 ∈ D.
(2) Für jede Folge (xn )n∈N mit xn ∈ D und limn→∞ xn = x0 gilt: limn→∞ f (xn ) = f (x0 ).
Beweis:
(1)⇒(2): Sei xn ∈ D mit limn→∞ = x0 , sowie ε > 0.
f stetig in x0
⇒
∃δ > 0 :
|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε
limn→∞ xn = x0
⇒
∃N ∈ R :
n > N ⇒ |xn − x0 | < δ
⇒
n > N ⇒ |f (xn ) − f (x0 )| < ε.
(2)⇒(1): Angenommen, f ist nicht stetig in x0 :
∃ ε > 0: für alle n ∈ N gibt es xn ∈ D mit |xn − x0 | < n1 , aber |f (xn ) − f (x0 )| ≥ ε. Daraus
folgt limn→∞ xn = x0 , aber f (xn ) konvergiert nicht gegen f (x0 ), ein Widerspruch.
Satz 2.2 (Stetigkeitsregeln) Sei x0 ∈ D ⊂ R und f, g : D → R seien stetig in x0 . Dann
gelten folgende Aussagen:
(1) αf + βg ist stetig in x0 , für beliebige α, β ∈ R.
(2) f g ist stetig in x0 .
44
(3)
f
g
: D0 = D\{x : g(x) = 0} → R ist stetig in x0 , falls g(x0 ) 6= 0.
Beweis: Die Funktionen sind punktweise definiert, das heißt für alle x ∈ D gilt
f
f (x)
(αf + βg)(x) := αf (x) + βg(x), (f g)(x) = f (x)g(x) und ( )(x) =
.
g
g(x)
Wir führen die Aussagen auf die entsprechenden Aussagen für Folgen zurück: Sei (xn )n∈N
eine beliebige Folge mit xn ∈ D und limn→∞ xn = x0 . Nach Satz 2.1 folgt f (xn ) → f (x0 )
und g(xn ) → g(x0 ) mit n → ∞. Aus Kapitel I, Satz 3.3 folgt
αf (xn ) + βg(xn ) → αf (x0 ) + βg(x0 ), f (xn )g(xn ) → f (x0 )g(x0 ),
sowie im Fall g(x0 ) 6= 0
f (xn )
f (x0 )
→
.
g(xn )
g(x0 )
Aus Satz 2.1 folgt nun die Behauptung.
Die Aussage in Satz 2.2 (iii) ist nur dann wirklich sinnvoll, wenn x0 ein Häufungspunkt von
D0 = D\{x : g(x) = 0} ist. Dazu tragen wir folgendes nach:
Lemma 2.1 Sei g : D → R mit g(x0 ) 6= 0. Ist g stetig in x0 , so gibt es ein ε > 0 und ein
δ > 0 mit |g(x)| ≥ ε für alle x ∈ D ∩ Uδ (x0 ).
Beweis: Wähle ε := |g(x0 )|/2 > 0. Aufgrund der Stetigkeit gibt es dann ein δ > 0 mit
|g(x) − g(x0 )| < ε für alle x ∈ D ∩ Uδ (x0 ). Es folgt für diese x
|g(x)| = |g(x0 ) − (g(x0 ) − g(x))| ≥ |g(x0 )| − |g(x) − g(x0 )| ≥ 2ε − ε = ε.
Definition 2.4 Die Funktion f : D → R heißt stetig auf D, wenn sie in allen Punkten
x0 ∈ D stetig ist. Wir setzen
C 0 (D) = {f : D → R : f ist stetig auf D}.
(2.3)
Nach Satz 2.2 (1) ist C 0 (D) ein R-Vektorraum.
Satz 2.3 (Verkettung stetiger Funktionen) Für D, E ⊂ R betrachten wir die Verketf
g
tung g ◦ f : D −→ E −→ R, wobei f (D) ⊂ E. Ist f stetig in x0 ⊂ D, g stetig in
y0 = f (x0 ) ∈ E, so ist g ◦ f : D → R stetig in x0 .
Beweis: Sei xn ∈ D eine beliebige Folge mit limn→∞ xn = x0 . Dann schließen wir
Satz2.2 ⇒ f (xn ) → f (x0 )mit n → ∞,
Satz2.2 ⇒ g f (xn ) → g f (x0 ) mit n → ∞,
Satz2.2 ⇒ Behauptung.
45
Beispiel 2.8 Seien f, g : D → R stetig. Dann ist auch |f | : D → R stetig, und ebenso die
Funktionen max(f, g) = 21 (f + g + |f − g|) : D → R sowie min(f, g) = 12 (f + g − |f − g|) :
D → R.
Definition 2.5 (Grenzwert für Funktionen) Sei x0 ∈ D Häufungspunkt von D. Die
Funktion f : D → R konvergiert für x → x0 gegen a ∈ R, falls gilt:
∀ε > 0 ∃ δ > 0 : |x − x0 | < δ, x ∈ D\{x0 }
⇒
|f (x) − a| < ε.
Notation: limx→x0 f (x) = a oder f (x) → a für x → x0 .
Beispiel 2.9 f : R\{1} → R, f (x) =
x2 −1
x−1 .
Dann gilt limx→1 f (x) = limx→1 (x + 1) = 2.
Für die Existenz und den Wert von limx→x0 f (x) ist es egal, ob die Funktion in x0 definiert ist
bzw. welchen Funktionswert sie dort hat. Die Beziehung zwischen Grenzwert und Stetigkeit
ist wie folgt:
Lemma 2.2 (Stetigkeit und Grenzwert) Sei x0 ∈ R ein Häufungspunkt von D. Für die
Funktion f : D ∪ {x0 } → R sind folgende Aussagen äquivalent:
(1) limx→x0 f (x) = f (x0 ).
(2) f ist stetig in x0 .
Beweis: Die Voraussetzung (1) bedeutet
∀ ε > 0 ∃ δ > 0 : |x − x0 | < δ, x ∈ D\{x0 }
⇒
|f (x) − f (x0 )| < ε.
⇒
|f (x) − f (x0 )| < ε.
Dagegen besagt (2)
∀ ε > 0 ∃ δ > 0 : |x − x0 | < δ, x ∈ D ∪ {x0 }
Die Aussagen sind offensichlich äquivalent.
Wie bei der Stetigkeit spielt auch beim Grenzwert der zugrundeliegende Definitionsbereich
eine Rolle. Wir schreiben limx→x0 ,x∈D f (x), wenn wir den gewählten Definitionsbereich hervorheben möchten. Zum Beispiel werden oft einseitige Grenzwerte gebraucht:
lim f (x) =
x&x0
So ist etwa limx&0
x
|x|
= 1,
lim
x→x0 ,x>x0
aber
f (x) und
limx%0
x
|x|
lim f (x) =
x%x0
lim
x→x0 ,x<x0
f (x).
= −1.
Definition 2.6 (Grenzwert bei ±∞) Sei f : (r, ∞) → R für ein r ∈ R. Dann setzen wir
lim f (x) = a ∈ R
x→+∞
⇔
∀ε > 0 ∃ R ∈ R mit |f (x) − a| < ε für alle x > R.
Analog für f : (−∞, a) → R und limx→−∞ f (x) = a.
Definition 2.7 (Uneigentlicher Grenzwert) Sei f : D → R und x0 ∈ R Dann setzen wir
lim f (x) = +∞
x→x0
⇔
∀K > 0 ∃ δ > 0 mit f (x) > K für alle x ∈ D\{x0 } mit |x − x0 | < δ.
Entsprechend wird limx→x0 f (x) = −∞ erklärt.
46
Beispiel 2.10 (Rationale Funktionen)
Seien p, q Polynome vom Grad m bzw. n:
p(x) = a0 + a1 x + . . . + am xm (ai ∈ R, am 6= 0)
q(x) = b0 + b1 x + . . . + bn xn
(bj ∈ R, bn 6= 0)
Setze N = {x ∈ R : q(x) = 0} und definiere
f : R\N −→ R,
f (x) =
p(x)
.
q(x)
Wann hat f eine stetige Fortsetzung bei x0 ∈ N ? Dazu sei x0 eine µ-fache Nullstelle von p,
evtl. µ = 0 falls p(x0 ) 6= 0, und eine ν-fache Nullstelle von q mit ν ≥ 1. Also gilt
p(x) = (x − x0 )µ pe(x) mit
q(x) = (x − x0 )ν qe(x) mit
Es folgt
und wir erhalten
pe(x0 ) 6= 0,
qe(x0 ) 6= 0.
p(x)
pe(x)
= (x − x0 )µ−ν
für x ∈ R\N,
q(x)
qe(x)
µ > ν ⇒ limx→x0 f (x) = 0,
(x0 )
µ = ν ⇒ limx→x0 f (x) = pqee(x
6= 0
0)
sowie
Im Fall µ < ν hat f in x0 eine Polstelle. Sei zum Beispiel pe(x0 )/e
q (x0 ) > 0. Dann ergibt sich
für limx→x0 f (x)
ν − µ gerade
ν − µ ungerade
x & x0
+∞
+∞
x % x0
+∞
−∞
Um das Verhalten des Polynoms für x → +∞ zu untersuchen, ist es günstig, x = 1/y zu
substituieren und den Grenzwert für y & 0 zu bestimmen, und zwar gilt
lim f (x) = a
x→+∞
⇔
1
lim f ( ) = a.
y
y&0
Wir berechnen
1
a0 + a1 y −1 + . . . + am y −m
a0 y m + a1 y m−1 + . . . + am
f( ) =
= y n−m
.
−n
−1
y
b0 + b1 y + . . . + bn y
b0 y n + b1 y n−1 + . . . + bn
Es folgt
m < n ⇒ limx→+∞ f (x) = 0,
m
m = n ⇒ limx→+∞ f (x) = abm
6= 0,
= ±1.
m > n ⇒ limx→+∞ f (x) = ±∞
falls sign abm
n
Satz 2.4 (Rechenregeln für Grenzwerte) Für den Grenzwert von Funktionen gelten folgende Regeln (auf einen Beweis wird verzichtet).
47
(1) Es gelte f (x) → a und g(x) → b für x → x0 ∈ R ∪ {±∞}. Dann folgt für λ, µ ∈ R
λf (x) + µg(x) → λa + µb für x → x0 ,
f (x) g(x) → ab
für x → x0 ,
f (x)/g(x) → a/b
für x → x0 , falls b 6= 0.
f
g
(2) Betrachte g ◦ f : D −→ E −→ R, wobei f (D) ⊂ E. Gilt f (x) → a mit x → x0 und ist
g stetig in a, so folgt (g ◦ f )(x) → g(f (a)) mit x → x0 .
(3) Falls f (x) → a, g(x) → b für x → x0 und f ≤ g auf Uδ (x0 )\{x0 }, so folgt a ≤ b.
(4) Ist f > 0 auf D, so gilt: limx→x0 f (x) = 0 ⇔ limx→x0
3
1
f (x)
= +∞.
Zwischenwertsatz und Umkehrfunktionen
Satz 3.1 (Zwischenwertsatz) Sei f : [a, b] → R stetig. Dann nimmt f jeden Wert zwischen f (a) und f (b) an.
Beweis: Sei oBdA f (a) < f (b). Zu y ∈ f (a), f (b) konstruieren wir die gesuchte Lösung
x ∈ [a, b] der Gleichung f (x) = y mittels Intervallhalbierung. Wir setzen dazu I0 = [a, b] und
bestimmen induktiv Ik = [ak , bk ] mit |Ik | = 21−k |I0 | und f (ak ) ≤ y ≤ f (bk ) für alle k. Ist Ik
schon gefunden für ein k ≥ 0 und mk = 12 (ak + bk ), so setzen wir
Es gibt genau ein x ∈
4.5) folgt, da f stetig,
T∞
f (mk ) ≥ y
⇒
Ik+1 := [ak , mk ]
f (mk ) < y
⇒
Ik+1 := [mk , bk ].
k=0 Ik ,
und wegen x = limk→∞ ak = limk→∞ bk (vgl. Kap. I, Satz
f (x) = lim f (ak ) ≤ y ≤ lim f (bk ) = f (x).
k→∞
k→∞
Folgerung 3.1 Sei I ⊂ R ein Intervall und f : I → R stetig. Dann ist f (I) ein Intervall
mit Endpunkten α = inf x∈I f (x) und β = supx∈I f (x).
Bemerkung. Unendliche Intervallgrenzen sind hier zulässig.
Beweis: Zu y ∈ (α, β) gibt es x1 , x2 ∈ I mit f (x1 ) < y < f (x2 ). Dann gibt es nach Satz 3.1
ein x ∈ [x1 , x2 ] (bzw. x ∈ [x2 , x1 ]) mit f (x) = y. Es folgt (α, β) ⊂ f (I) ⊂ [α, β].
Jede streng monotone Funktion f : I → R ist injektiv und hat damit eine Umkehrfunktion
g : f (I) → R. Ein Beispiel ist die Potenzfunktion; wir sehen, dass der Graph von f und der
Graph der Umkehrfunktion f −1 = g durch Spiegelung an der Winkelhalbierenden des ersten
Quadranten auseinander hervorgehen.
48
Zum nächsten Lemma vgl. das entsprechende Resultat für Folgen, Satz 4.3 in Kapitel 1.
Lemma 3.1 (Einseitige Grenzwerte monotoner Funktionen) Sei D ⊂ R und f :
D → R sei monoton wachsend. Für x0 ∈ R gebe es eine Folge xn ∈ D mit xn & x0 (bzw.
xn % x0 ). Dann existiert der Grenzwert limx&x0 f (x) (bzw. limx% f (x)) im eigentlichen
oder uneigentlichen Sinn.
Beweis: Es gilt für jede Folge xn & x0 , xn ∈ D,
inf{f (x) : x > x0 } ≤ lim inf f (xn )
n→∞
(da xn > x0 )
≤ lim sup f (xn )
n→∞
≤ f (x0 ),
falls x0 > x0
(da xn < x0 für n hinreichend groß).
Wir bilden das Infimum über alle x0 > x0 und erhalten Gleichheit in der obigen Abschätzung,
also gilt (siehe Übungsaufgabe 3, Serie 6)
lim f (x) = inf{f (x) : x > x0 } und analog lim f (x) = sup{f (x) : x < x0 }.
x&x0
x%x0
(3.1)
Satz 3.2 (Monotonie und Umkehrfunktion) Sei I ⊂ R ein Intervall mit Endpunkten
a < b, und sei f : I → R streng monoton wachsend und stetig. Dann gilt:
(1) Die Umkehrfunktion g : f (I) → R ist ebenfalls streng monoton wachsend und stetig.
(2) I ∗ := f (I) ist ein Intervall mit Endpunkten α := limx&a f (x) < limx%b f (x) =: β.
(3) limy&α g(y) = a und limy%β g(y) = b.
Beweis: Seien y1 , y2 ∈ f (I) mit y1 < y2 . Wäre g(y1 ) ≥ g(y2 ), so folgt aus der Monotonie
von f
y1 = f g(y1 ) ≥ f g(y2 ) = y2 ,
im Widerspruch zur Annahme. Also ist g streng monoton wachsend.
Für y0 = f (x0 ) gilt somit {y : y ∈ f (I), y > y0 } = {f (x) : x ∈ I, x > x0 } und wir erhalten
x0 = g(y0 )
≤
lim g(y)
y&y0
(da g monoton wachsend)
= inf{g(y) : y ∈ f (I), y > y0 } (nach (3.1))
= inf{g f (x) : x ∈ I, x > x0 } = x0 .
| {z }
=x
Entsprechend wird die linksseitige Stetigkeit und damit die Stetigkeit von g in y0 gezeigt.
Nach Folgerung 3.1 ist I ∗ = f (I) ein Intervall mit linkem Randpunkt
inf f (x) =
x≥a
=
inf f (x)
x>a
lim f (x)
x&a
(da f stetig in a, falls a ∈ I)
(nach (3.1)).
49
Genauso ergibt sich, dass β = limx%b f (x) der rechte Endpunkt von I ∗ ist. Die Aussage (3)
folgt aus (1) und (2), angewandt auf die Umkehrfunktion g statt f .
Ergänzung: In der Situation des Satzes gilt genauer
a ∈ I ⇔ α ∈ I∗
b ∈ I ⇔ β ∈ I ∗.
und
(3.2)
Denn aus a ∈ I folgt α = limx&a f (x) = f (a) ∈ f (I), da f stetig in a. Andererseits gilt
f (x) > α für x > a, denn wäre f (x) = α für ein x > a, so wäre f (ξ) < α für ξ ∈ (a, x), ein
Widerspruch. Aus α ∈ I ∗ = f (I) folgt deshalb schon α = f (a), insbesondere a ∈ I.
Wir wollen den Satz nun auf die Exponentialfunktion anwenden. Zur Erinnerung:
exp : R → R, exp(x) = lim (1 +
n→∞
x n
) .
n
In Kapitel 1, Satz 4.4 hatten wir die Existenz des Grenzwerts bewiesen. Von dort ist außerdem
Folgendes schon bekannt:
n > −x
⇒
(1 +
x n+1
x
)
≥ (1 + )n
n+1
n
exp(x) exp(−x) = 1
(Kapitel 1, (4.3)),
(Kapitel 1, (4.4)).
Lemma 3.2 Es gelten folgende Aussagen:
(1) exp(x) > 0, exp(0) = 1.
(2) exp(x) ≥ 1 + x für alle x ∈ R, exp(x) ≤
(3) limn→∞ xn = x
⇒
limn→∞ (1 +
xn n
n )
1
1−x
für x < 1.
= exp(x).
Beweis: exp(x) ≥ 1 für x ≥ 0 und exp(0) = 1 gelten nach Definition. Mit Kap. 1, (4.4) folgt
für x < 0 dann exp(x) = 1/ exp(−x) ∈ (0, 1], und (1) ist gezeigt. Die Bernoulli-Ungleichung
(Kap. I, Satz 2.3) liefert
(1 +
x
x n
) ≥1+n =1+x
n
n
(für n > −x),
also exp(x) = limn→∞ (1 + nx )n ≥ 1 + x. Wieder mit Kap. 1, (4.4) erhalten wir weiter
exp(x) =
1
1
≤
exp(−x)
1−x
für x < 1.
Wir zeigen (3) zuerst im Fall limn→∞ xn = 0, und zwar gilt, wobei oBdA −1 < xn < 1,
xn n
)
(Bernoulli)
n
xn k
≤ lim (1 +
) (nach Kap. I, (4.3))
k→∞
k
= exp(xn ) (Definition von exp)
1
≤
(nach (2)).
1 − xn
1 + xn ≤ (1 +
50
Mit n → ∞ folgt limn→∞ (1 + xnn )n = 1 = exp(0). Für limn→∞ xn = x ∈ R berechnen wir
schließlich, indem wir den schon bewiesenen Fall x = 0 anwenden,
(1 + xnn )n
=
(1 + nx )n
1+
+ xnn −
1 + nx
x
n
also
lim (1 +
n→∞
x n
n
=
xn − x
1+
n(1 + nx )
n
−→ 1,
xn n
x
) = lim (1 + )n = exp(x).
n→∞
n
n
Satz 3.3 (Eigenschaften der Exponentialfunktion) Sei exp die in Kapitel 1, Satz 4.4
definierte Exponentialfunktion.
(1) Es gilt die Funktionalgleichung
exp(x + y) = exp(x) exp(y)
für alle x, y ∈ R.
(2) exp : (−∞, ∞) → (0, ∞) ist streng monoton wachsend, stetig und bijektiv. Es gilt
exp(x) → +∞ mit x → +∞ und exp(x) → 0 mit x → −∞.
Bemerkung. In der Sprache der Algebra bedeutet der Satz insbesondere:
exp : (R, +) → (R+ , · )
ist ein Gruppenisomorphismus.
Beweis: Die Funktionalgleichung folgt aus Lemma 3.2 (3):
y
x
lim (1 + )n lim (1 + )n
n→∞
n→∞
n
n
x + y + xy/n n
= lim 1 +
n→∞
n
= exp(x + y).
exp(y) exp(y) =
Fr x1 < x2 ist nach Lemma 3.2 (1) und (2)
exp(x2 ) = exp(x2 − x1 ) exp(x1 ) > exp(x1 ).
|
{z
} | {z }
≥1+x2 −x1 >1
>0
Die Stetigkeit von exp in x0 = 0 folgt direkt aus Lemma 3.2 (2), und für beliebiges x0 ∈ R
verwenden wir wieder die Funktionalgleichung
exp(x) = exp(x − x0 ) exp(x0 ) → exp(x0 )
|
{z
}
mit x → x0 .
→1
Der Grenzwert limx→+∞ exp(x) = +∞ folgt direkt aus Lemma 3.2 (2), und
limx→−∞ exp(x) = 0 ergibt sich dann aus Kapitel 1, (4.4). Die behauptete Surjektivität
folgt somit aus dem Zwischenwertsatz bzw. aus Folgerung 3.1.
51
Folgerung 3.2 (Definition des Logarithmus) Die Funktion exp : (−∞, ∞) → (0, ∞)
hat eine streng monoton wachsende, stetige und bijektive Umkehrfunktion log : (0, ∞) →
(−∞, ∞), y 7→ log(y), den (natürlichen) Logarithmus. Nach Definition haben wir also
log(exp(x)) = x
∀ x ∈ (−∞, ∞),
exp(log(y)) = y
∀ y ∈ (0, ∞).
Es gilt log(1) = 0, und log erfüllt die Funktionalgleichung
log(y1 y2 ) = log(y1 ) + log(y2 )
∀ y1 , y2 > 0.
Außerdem ist limy&0 log(y) = −∞ und limy→∞ log(y) = +∞.
Beweis: Die Existenz, Monotonie und Stetigkeit der Umkehrfunktion folgen aus Satz 3.2
und Satz 3.3, ebenso die behaupteten Grenzwerte. Die Funktionalgleichung für log ergibt
sich aus der Funktionalgleichung für exp durch Einsetzen von x1 = log(y1 ) und x2 = log(y2 ):
log(y1 y2 ) = log (exp(x1 ) exp(x2 )) = log (exp(x1 + x2 )) = log(y1 ) + log(y2 ).
Lemma 3.3 Für a > 0 und r ∈ Q gilt
ar = exp (r log(a)) .
(3.3)
Beweis: Wir behaupten zunächst
exp(p x) = exp(x)p
für p ∈ Z, x ∈ R.
Für p = 0 gilt das per Definition. Für p ∈ N folgt aus der Funktionalgleichung per Induktion
exp(px) = exp ((p − 1)x) exp(x) = exp(x)p−1 exp(x) = exp(x)p .
Schließlich erhalten wir mit Kap. 1, Gleichung (4.4)
exp(px) =
1
1
=
= exp(x)p .
exp(−px)
exp(x)−p
Sei nun r = p/q mit p ∈ Z, q ∈ N. Wir wählen oben x = log(a) und erhalten
exp (r log(a))q = exp (q · r log(a))
= exp (p log(a))
= exp (log(a))p
= ap .
Nun ist nach Definition ap/q die eindeutig bestimmte Lösung y > 0 der Gleichung y q = ap ,
vgl. Übungsaufgabe 1, Serie 4. Die Behauptung folgt.
Definition 3.1 (Potenz mit rellen Exponenten) Für a > 0, x ∈ R definieren wir ax =
exp (x log(a)) .
52
Diese Definition ist nach Lemma 3.3 konsistent mit der auf Q bereits in Übungsaufgabe 1,
Serie 4 definierten Funktion r 7→ ar , r ∈ Q. Umgekehrt besitzt nach Übungsaufgabe 1, Serie
9 die auf der dichten Menge Q in Übungsaufgabe 1, Serie 4 erklärte Funktion höchstens eine
Fortsetzung, die auf ganz R definiert und stetig ist. Genau dies leistet die Funktion
expa : R → R, expa (x) = ax .
Die Regeln der Potenzrechnung (mit a, b > 0)
ax ay = ax+y (ax )y = ax y
x
1
= a−x ax bx = (ab)x
a
ergeben sich leicht aus den Definitionen und den Funktionalgleichungen von exp bzw. log.
Weiter lassen sich nun auch die Potenzfunktionen für beliebige reelle Exponenten erklären:
f : (0, ∞) → R, f (x) = xα = exp (α log(x)) .
Folgerung 3.3 (Charakterisierung von exp durch die Funktionalgleichung) Die
Funktion f : R → R habe folgenden beiden Eigenschaften:
(1) f (x + y) = f (x) f (y)
(2) limx→0 f (x) = f (0)
für alle x, y ∈ R,
(Stetigkeit bei x0 = 0).
Dann ist entweder a := f (1) > 0 und f (x) = ax für alle x, oder f ist identisch Null.
2
Beweis: Es ist f (1) = f 12 ≥ 0. Falls f (1) = 0, so folgt für alle x ∈ R
f (x) = f (x − 1) + 1 = f (x − 1) f (1) = 0.
Im Fall a > 0 kann wie oben argumentiert werden (Übungsaufgabe).
Zum Abschluss dieses Abschnitts wollen wir die Funktionalgleichung der Exponentialfunktion
im Zusammenhang mit der Zinseszinsrechnung interpretieren. Zur Erinnerung: Anlegen des
Startkapitals K0 mit jährlichem Zinssatz x ∈ R ergibt im linearen Modell nach einem Jahr
(1 + x)K0 , im Zinseszinsmodell dagegen
K(1) = K0 lim (1 +
n→∞
x n
) = K0 exp(x).
n
Allgemeiner muss nach t Jahren dann gelten
K(t) = K0 lim (1 +
n→∞
xt n
) = K0 exp(xt).
n
Bei gleichem Zinssatz x sollte es nun egal sein, ob das Geld zunächst für einen Zeitraum t1
angelegt wird und dann die ersparte Summe für einen weiteren Zeitraum t2 , oder eben gleich
für die Gesamtdauer t1 + t2 . Genau das besagt die Funktionalgleichung:
K(t1 + t2 ) = K0 exp(x(t1 + t2 )) = K0 exp(xt1 ) exp(xt2 ).
53
4
Existenz von Extremwerten
Extremwertaufgaben spielen sowohl in der Theorie wie in den Anwendungen der Analysis
eine zentrale Rolle. In diesem kurzen Abschnitt soll die Existenz von Minimalstellen bzw.
Maximalstellen unter geeigneten Voraussetzungen gezeigt werden.
Beispiel 4.1
Ein Triathlet muss von einem Punkt a1 = (x1 , y1 ), y1 > 0, im Wasser zu einem Punkt
a2 = (x2 , y2 ), y2 < 0 auf dem Land. Für y > 0 schwimmt er geradlinig mit Geschwindigkeit
v − 1, für y < 0 rennt er geradlinig mit Geschwindigkeit v2 . An welchem Punkt (x, 0) muss
er das Ufer ansteuern, um seine Zeit zu minimieren? Ist s1 bzw. s2 die im Wasser bzw. zu
Land zurückgelegte Strecke, so ist hier also folgende Funktion zu minimieren:
f (x) =
s1
s2
1
+
=
v1 v2
v1
q
(x − x1 )2 + y12 +
1
v2
q
(x − x2 )2 + y22 .
Beispiel 4.2
Gegeben sind drei Punkte a1 , a2 , a3 ∈ R2 (z.B. die Städte Freiburg, Tübingen und Zürich).
Gesucht ist ein Punkt x0 ∈ R2 , dessen Abstandssumme von den drei Punkten minimal ist
(optimaler Treffpunkt). Zu minimieren ist hier die Funktion
f : R2 → R2 , f (x) = |x − a1 | + |x − a2 | + |x − a3 |.
Nicht jede Optimierungsaufgabe hat eine Lösung. Betrachte etwa für x ∈ R2 die Summe der
Abstände von zwei gegebenen Punkten a und b:
f (x) = |x − a| + |x − b| (a, b ∈ R2 ).
In der Menge der Punkte x, die nicht auf der Strecke von a nach b liegen, können wir die
Funktion nicht minimieren, weil das Infimum inf{f (x) : x ∈ R2 , x ∈
/ [a, b]} = |a − b| durch
2
keinen Punkt aus R \[a, b] realisiert wird. Dieses Beispiel sieht etwas künstlich aus, aber
bei komplexen Extremwertaufgaben ist die Frage der Existenz einer Lösung oft schwer zu
entscheiden und von großer Wichtigkeit.
Definition 4.1 (Kompakte Menge) Eine Menge D ⊂ Rm heißt kompakt (genauer: folgenkompakt), wenn gilt: zu jeder Folge (xn )n∈N von Punkten xn ∈ D gibt es eine Teilfolge
(xnk )k∈N , die konvergiert und deren Grenzwert in D liegt:
lim xnk = x0 ∈ D.
k→∞
Satz 4.1 (Heine-Borel) Für D ⊂ Rm sind äquivalent:
(1) D ist kompakt.
(2) D ist abgeschlossen und beschränkt.
54
Beweis: Wir zeigen zuerst die Implikation (1) ⇒ (2). Für die Abgeschlossenheit von D ist
eine beliebige Folge xn ∈ D mit limn→∞ xn = x0 ∈ Rm zu betrachten. Zu zeigen ist: x0 ∈ D
(vgl. Definition 5.10). Da nach Voraussetzung d kompakt, gibt es eine Teilfolge xnk , die
gegen ein x00 ∈ D konvergiert. Da der Grenzwert der Teilfolge eindeutig bestimmt ist, folgt
x0 = x00 ∈ D, q.e.d.
Wäre D nicht beschränkt, so gibt es zu n ∈ N ein xn ∈ D mit |xn | ≥ n. Da D kompakt, gibt
es eine konvergente Teilfolge xnk , und diese ist nach Kapitel 1, Satz 3.2 beschränkt. Aber
|xnk | ≥ nk → ∞, ein Widerspruch.
Jetzt beweisen wir umgekehrt (2) ⇒ (1). Sei (xn )n∈N eine Folge in D. Da D beschränkt,
gibt es nach Bolzano-Weierstraß (Satz 4.7 bzw. Satz 5.3) eine Teilfolge (xnk )k∈N , die gegen
ein x0 ∈ Rm konvergiert. Es ist x0 ∈ D, weil D nach Voraussetzung abgeschlossen ist.
Definition 4.2 Eine Funktion f : D → Rm heißt beschränkt, wenn es eine K > 0 gibt mit
|f (x)| ≤ K für alle x ∈ D ( mit andern Worten: wenn die Menge f (d) ⊂ R beschränkt ist).
Satz 4.2 (Existenz von Extremalstellen) Sei D ⊂ Rm kompakt, D 6= ∅, und f : D → R
sei stetig. Dann ist f beschränkt und f nimmt sein Infimum und Supremum auf D an: es
gibt x0 ∈ D und x1 ∈ D mit
f (x0 ) = inf f (x)
x∈D
bzw.
f (x0 ) = sup f (x).
x∈D
Beweis: Wir zeigen die Aussage für das Infimum. Nach Kapitel 1, Folgerung 5.1 gibt es eine
Folge (xn )n∈N mit xn ∈ D und f (xn ) → inf x∈D f (x). Da D kompakt, gibt es eine konvergente
Teilfolge xnk → x0 ∈ D. Es folgt, da f stetig,
−∞ < f (x0 ) = lim f (xnk ) = inf f (x).
k→∞
x∈D
Die Bezeichnungen Minimum und Maximum sind nur dann zulässig, wenn die Existenz der
Lösung der Extremwertaufgabe bakannt ist. Die folgenden Fälle illustrieren, was im Fall D
nicht kompakt schiefgehen kann:
Beispiel 4.3
D = (−1, 1),
D = (−1, 1),
D = (1, ∞),
1
f (x) = 1−x
f ist nicht beschränkt, kein Maximum.
2 :
f (x) = x :
Extremwerte für x → ±1 ∈
/ D.
1
f (x) = 1+x
:
Infimum
für
x
→
∞.
2
Wir zeigen jetzt am Beispiel der Abstandssumme von drei Punkten a1 , a2 , a3 ∈ R2 , wie der
Existenzsatz eingesetzt wird. Als erstes zeigen wir, dass die Funktion
f : R2 → R2 , f (x) = |x − a1 | + |x − a2 | + |x − a3 |
55
Lipschitzstetig mit Konstante L = 3 ist.
3
3
X
X
|f (x) − f (y)| = |x − ai | −
|y − ai |
≤
≤
i=1
3
X
i=1
||x − ai | − |y − ai ||
i=1
3
X
|(x − ai ) − (y − ai )|
i=1
= 3 |x − y|.
Wir wollen die Funktion auf ganz R2 minimieren und haben das Problem, dass R2 unbeschränkt und damit nicht kompakt ist. Aber für große |x| ist f (x) ebenfalls groß, so dass
weit entfernte Punkte keine Rolle spielen sollten. Wir behaupten: es gibt ein R > 0, so dass
mit D := {x ∈ R2 : |x| ≤ R} gilt:
inf f (x) = inf f (x).
x∈R2
x∈D
(4.1)
Denn es gilt einerseits
inf f (x) ≤ f (0) = |a1 | + |a2 | + |a3 |,
x∈D
und andererseits haben wir für |x| ≥ R
f (x) =
≥
3
X
i=1
3
X
|x − ai |
(|x| − |ai |)
i=1
≥ 3 R − (|a1 | + |a2 | + |a3 |).
Wählen wir also R := |a1 | + |a2 | + |a3 | > 0, so folgt
inf f (x) ≤ R < 2 R ≤ inf f (x),
x∈D
|x|≥R
und Behauptung (4.1) ist gezeigt. Es bleibt nun die Funktion f auf D zu minimieren. Die
Menge D ist aber nach Definition beschränkt, nämlich durch R. Ist xn ∈ D und xn → x ∈ R2 ,
so folgt aus der Stetigkeit der Normfunktion |x| = limn→∞ |xn | ≤ R, also x ∈ D. Damit ist
D auch abgeschlossen, und nach Satz 4.2 gibt es ein x0 ∈ D mit
f (x0 ) = inf f (x) = inf f (x).
x∈R2
x∈D
Dieses x0 ist die gesuchte Minimalstelle.
56
Kapitel 3
Differentialrechnung für Funktionen
einer Variablen
1
Die Ableitung: Definition und Regeln
Definition 1.1 (Ableitung) Sei D ⊂ R offen. Die Funktion f : D → R hat in x0 ∈ D die
Ableitung a ∈ R (Notation: f 0 (x0 ) = a), falls gilt:
lim
x→x0
f (x) − f (x0 )
= a.
x − x0
(1.1)
Wir nennen f differenzierbar in x0 , falls es ein a ∈ R mit (1.1) gibt, falls also der in (1.1)
betrachtete Grenzwert existiert.
Bemerkung. f 0 (x0 ) = a
⇔
f (x0 + h) − f (x0 )
= a.
h→0
h
lim
Leibniz interessierte sich für die Definition der Ableitung im Zusammenhang mit dem Problem, die Tangente an eine ebene Kurve in einem gegebenen Punkt zu definieren. Sei die
Kurve als Graph von f : D → R gegeben und die Tangente im Punkt (x0 , f (x0 )) gesucht.
(x0 )
Der Differenzenquotient f (x)−f
ist geometrisch die Steigung der Sekante. Die Tangente
x−x0
wird nun definiert als diejenige Gerade y = g(x) = a(x − x0 ) + b, so dass gilt:
1. Die Gerade geht durch (x0 , f (x0 )), das heißt b = f (x0 ).
2. Die Gerade hat die Steigung a = limx→x0
f (x)−f (x0 )
x−x0
= f 0 (x0 ).
Aus den Bedingungen ergibt sich die Gleichung
g(x) = f (x0 ) + f 0 (x0 )(x − x0 )
(x ∈ R).
Die gegebene Definition der Ableitung ist auch für vektorwertige Funktionen f : D → Rn
sinnvoll. Die Ableitung ist dann ein Vektor a ∈ Rn und es gilt:
lim
x→x0
f (x) − f (x0 )
=a
x − x0
⇔
57
|
f (x) − f (x0 )
− a| → 0.
x − x0
Hierbei bezeichnet | · | die Euklidische Norm, siehe Kap. I, Definition 5.5. Der dort bewiesene
Satz 5.5 über die Äquivalenz von Normkonvergenz und Konvergenz der Koordinaten besagt
hier Folgendes:
Lemma 1.1 Sei D ⊂ R offen. Die Funktion f : D → Rn ist genau dann in x0 ∈ D differenzierbar, wenn alle Koordinatenfunktionen f i : D → R, i = 1, . . . , n, in x0 differenzierbar
sind. Die Ableitung kann dann koordinatenweise berechnet werden, das heißt es gilt:
f 0 (x0 ) = ((f 1 )0 (x0 ), . . . , (f n )0 (x0 )) ∈ Rn .
Newton entwickelte den Differentialkalkül, um zum Beispiel die Dynamik der Planetenbewegung zu erklären. Kepler hatte vorher aufgrund von Beobachtungen des Astronoms Tycho
Brahe drei Gesetze für die Bewegung der Planeten geraten – Newton konnte diese Gesetze nun
mithilfe des Differentialkalküls (Englisch: Calculus) allein aus der Formel für die Anziehungskraft (dem Gravitationsgesetz) herleiten. Die Bewegung eines Massenpunkts (Planeten) wird
dabei durch eine Abbildung
f : D −→ R3 , f (t) = x(t), y(t), z(t)
beschrieben, d. h. die Koordinaten des Massenpunkts zur Zeit t ∈ D bzgl. eines Euklidischen
Koordinatensystems sind durch f (t) gegeben. Erstes Ziel ist dann die Definition der
Momentangeschwindigkeit als Vektor in R3 . Die vektorielle Durchschnittsgeschwindigkeit
(t0 )
auf dem Zeitintervall [t0 , t] ist der Quotient f (t)−f
, nämlich Weg:Zeit.
t−t0
Die Momentangeschwindigkeit v(t0 ) zum Zeitpunkt t = t0 ist deshalb als vektorielle Ableitung
zu definieren (wobei Newton einen Punkt statt eines Strichs benutzt hat):
v(t0 ) = f 0 (t0 ) = (x0 (t0 ), y 0 (t0 ), z 0 (t0 )) ∈ R3 .
Definition 1.2 (Ableitungsfunktion) Sei D ⊂ R offen. Die Funktion f : D → R heißt
differenzierbar auf D (oder einfach differenzierbar), falls f in jedem Punkt x0 ∈ D differenzierbar ist. Die hierdurch gegebene Funktion
f 0 : D → R,
x0 7→ f 0 (x0 ) = lim
x→x0
f (x) − f (x0 )
∈R
x − x0
heißt Ableitung von f .
Beispiel 1.1 Für eine konstante Funktion, also f (x) = c ∈ R für alle x ∈ D, gilt für x 6= x0 :
f (x) − f (x0 )
c−c
=
=0
x − x0
x − x0
⇒ f 0 (x0 ) = 0 bzw. f 0 = 0.
Beispiel 1.2 Für die Potenzfunktionen f : R → R, (x) = xn mit n ∈ N gilt für x 6= x0
f (x) − f (x0 )
= xn−1 + xn−2 x0 + . . . + xn−2
x + xn−1
,
0
0
x − x0
also folgt mit x → x0
f 0 (x0 ) = nxn−1
0
58
für x0 ∈ R.
Beispiel 1.3 Die Exponentialfunktion exp : R −→ R ist an allen Punkten x0 ∈ R differenzierbar und hat die Ableitung exp0 = exp:
Fall 1: x0 = 0
Nach Kapitel 2, Lemma 3.2 gelten die Abschätzungen
exp(x) − exp(0)
1
≤
,
x
1−x
exp(x) − exp(0)
1
x<0 ⇒ 1≥
≥
.
x
1−x
0<x<1 ⇒ 1≤
Also folgt exp0 (0) = 1 = exp(0).
Fall 2: x0 ∈ R beliebig
Aus der Funktionalgleichung (Satz 3.3 (1)) und Fall 1 folgt für h 6= 0
exp(x0 + h) − exp(x0 )
exp(h) − 1
= exp(x0 )
→ exp(x0 ).
h
h
Also gilt insgesamt exp0 = exp.
Beispiel 1.4 f (x) = |x| ist nicht differenzierbar in x0 = 0:
f (x) − f (0)
x
= lim = 1
x&0
x&0 x
x−0
f (x) − f (0)
−x
f−0 (0) := lim
= lim
= −1.
x%0
x%0 x
x−0
f+0 (0) :=
lim
Die rechts- und linksseitige Ableitung existieren in x0 = 0, sie sind aber verschieden.
Lemma 1.2 (differenzierbar = linear approximierbar) Sei f : D → R, D ⊂ R offen,
und x0 ∈ D. Genau dann hat f in x0 die Ableitung a ∈ R, wenn gilt:
lim
h→0
r(h)
= 0,
h
wobei
r(h) = f (x0 + h) − (f (x0 ) + a h).
(1.2)
Beweis: Für h 6= 0 gilt
f (x0 + h) − f (x0 )
f (x0 + h) − (f (x0 ) + a h)
r(h)
−a=
=
.
h
h
h
Hieraus ergibt sich die Behauptung.
Satz 1.1 (differenzierbar ⇒ stetig) Ist f : D → R differenzierbar in x0 ∈ D, so ist f
auch stetig in x0 .
Beweis: Nach Satz 2.2 in Kapitel 2 reicht es zu zeigen, dass limh→0 f (x0 + h) = f (x0 ). Aber
für h 6= 0 gilt nach Lemma 1.2
f (x0 + h) = f (x0 ) + a h + h
59
r(h)
→ f (x0 ) mit h → 0.
h
Satz 1.2 (Differenzierbarkeitsregeln) Seien f, g : D → R differenzierbar in x0 ∈ D.
Dann sind auch die Funktionen αf + βg (α, β ∈ R), f g und f /g (im Fall g(x0 ) 6= 0) in x0
differenzierbar mit folgenden Ableitungen:
(1)
(2)
(3)
(αf + βg)0 (x0 ) = αf 0 (x0 ) + βg 0 (x0 )
(f g)0 (x0 )
0
f
g
= f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 )
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) =
g(x0 )2
(Ableitung ist linear)
(1.3)
(Produktregel)
(1.4)
(Quotientenregel)
(1.5)
Beweis: Wir müssen jeweils für x 6= x0 die Differenzenquotienten bilden und zeigen, dass
diese mit x → x0 gegen das gewünschte konvergieren. Für (1.3) haben wir
(αf (x) + βg(x)) − (αf (x0 ) + βg(x0 ))
x − x0
f (x) − f (x0 )
g(x) − g(x0 )
+β
x − x0
x − x0
0
0
→ αf (x0 ) + βg (x0 ).
=
α
Die Produktregel (1.4) folgt durch Mischen der Terme“:
”
f (x) − f (x0 )
g(x) − g(x0 )
f (x)g(x) − f (x0 )g(x0 )
=
g(x) + f (x0 )
x − x0
x − x0
x − x0
→ f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ),
wobei die Stetigkeit von g in x0 benutzt wurde (Satz 1.1). Wir zeigen die Quotientenregel
(1.5) zunächst für die Funktion 1/g, also f ≡ 1. Es gibt ein δ > 0 mit g(x) 6= 0 für |x−x0 | < δ
nach Kapitel 2, Lemma 2.1. Für diese x gilt
1
1
1
1
g(x) − g(x0 )
−
= −
x − x0 g(x) g(x0 )
g(x)g(x0 )
x − x0
1
g 0 (x0 ) mit x → x0 .
→ −
g(x0 )2
Für beliebiges f schreiben wir f /g = f ·
1
und verwenden die Produktregel.
g
Beispiel 1.5 Für fn (x) = xn mit n ∈ N gilt fn0 (x) = (n − 1) xn−1 . Dies wurde schon in
Beispiel 1.2 gezeigt. Hier verwenden f10 (x) = 1 für alle x ∈ R und erhalten per Induktion für
n≥2
0
fn0 (x) = (f1 fn−1 )0 (x) = f10 (x)fn−1 (x) + f1 (x)fn−1
(x) = 1 xn−1 + x (n − 1)xn−2 = n xn−1 .
Beispiel 1.6 Für f (x) = x−n = 1/xn mit n ∈ N gilt f 0 (x) = −n x−n−1 :
f 0 (x) = −
n xn−1
= −n x−n−1 .
(xn )2
Beispiel 1.7 Die hyperbolischen Funktionen cosh : R → R und sinh : R → R sind definiert
durch
ex + e−x
ex − e−x
cosh x =
, sinh x =
.
2
2
0
(ex )0
−x folgt cosh0 = sinh und sinh0 = cosh.
Wegen (e−x )0 = e1x = − (e
x )2 = −e
60
Satz 1.3 (Kettenregel) Betrachte die Verkettung
f
g
g ◦ f : D −→ E −→ R, (g ◦ f )(x) = g(f (x)).
Es sei f in x0 ∈ D ⊂ R differenzierbar, und g sei in y0 = f (x0 ) ∈ E differenzierbar. Dann
ist g ◦ f in x0 differenzierbar und hat die Ableitung
(g ◦ f )0 (x0 ) = g 0 f (x0 f 0 (x0 ).
Beweis: Wir betrachten wieder für x 6= x0 den Differenzenquotienten:

g(f (x)) − g(f (x0 )) f (x) − f (x0 )
falls f (x) 6= f (x0 )
g(f (x)) − g(f (x0 )) 
f (x) − f (x0 )
x − x0
=

x − x0
0
falls f (x) = f (x0 ).
Wir definieren

 g(y) − g(f (x0 ))
y − f (x0 )
a : E → R, a(y) =
 0
g (f (x0 ))
für y 6= f (x0 )
für y = f (x0 ).
Die Funktion a ist stetig in y0 nach Satz 2.2. Mit x → x0 folgt, da f (x) → f (x0 ),
f (x) − f (x0
g(f (x)) − g(f (x0 ))
= a(f (x))
→ a(f (x0 )f 0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ).
x − x0
x − x0
Satz 1.4 (Differenzierbarkeit der Umkehrfunktion) Sei I = (a, b) offenes Intervall,
f : I → f (I) = I ∗ stetig und streng monoton. Ist dann f in x0 ∈ I differenzierbar und
f 0 (x0 ) 6= 0, so ist die Umkehrfunktion g : I ∗ → I in y0 = f (x0 ) ∈ I ∗ gleichfalls differenzierbar
und es gilt
1
.
g 0 (y0 ) = 0
f g(y0 )
Beweis: Nach Satz 3.2 in Kapitel 2 (inklusive der Ergänzung (3.2)) ist I ∗ = (α, β) ein offenes
Intervall und g : I ∗ → R ist stetig, insbesondere g(y) → g(y0 ) mit y → y0 . Für y 6= y0 folgt
g(y) − g(y0 )
g(y) − g(y0 )
1
1
=
=
→ 0
.
f (g(y)) − f (g(y0 ))
y − y0
f (g(y)) − f (g(y0 ))
f (x0 )
g(y) − g(y0 )
Bemerkung: Sei f : (a, b) → (α, β) in x0 differenzierbar und bijektiv mit Umkehrabbildung
g : (α, β) → (a, b). Wenn die Funktion g in y0 = f (x0 ) differenzierbar ist, so folgt schon aus
der Kettenregel
g(f (x)) = x ⇒ g 0 (f (x0 ))f 0 (x0 ) = 1,
also die Formel für die Ableitung der Umkehrfunktion. Insbesondere muss dann f 0 (x0 ) 6= 0
sein. Die Funktion f : R → R, f (x) = x3 ist streng monoton wachsend; ihre Umkehrfunktion
lautet
(√
3 y
für y ≥ 0
g : R → R, g(y) =
√
− 3 −y für y ≤ 0.
61
Die Umkehrfunktion ist nicht differenzierbar in y = 0, denn
g(y) − g(0)
= y −2/3 → +∞ mit y & 0.
y−0
Die Bedingung des Satzes ist hier verletzt, f 0 (0) = 0.
Die beiden vorangegangengen Regeln sind in der von Leibniz eingeführten Notation besonders
suggestiv. Leibniz schreibt Funktionen in der Form y = y(x) und bezeichnet die Ableitung
dy
mit dx
( Differentialquotient “). Dann lauten die Kettenregel und die Regel für die Ableitung
”
der Umkehrfunktion wie folgt:
y = y(x), z = z(y) ⇒
y = y(x), x = x(y) ⇒
dz
dz dy
=
,
dx
dy dx
dx
1
= dy .
dy
dx
Bei der Anwendung dieser saloppen Notation ist jedoch darauf zu achten, wo die jeweiligen
Funktionen definiert sind.
Beispiel 1.8 Die Exponentialfunktion exp : R → (0, ∞) hat die Ableitung exp0 (x) =
exp(x) 6= 0 für alle x ∈ R. Nach Satz 1.4 ist die Logarithmusfunktion log : (0, ∞) → R
differenzierbar und es gilt
log0 (y) =
1
1
1
=
= .
exp0 (log y)
exp(log y)
y
Beispiel 1.9 Die Funktion f : (0, ∞) → R, f (x) = xα mit α ∈ R ist Verkettung der
Funktionen exp : R → R und h : R → R, h(x) = α log(x). Mit der Kettenregel berechnen wir
f 0 (x) = exp0 (h(x))h0 (x) = exp(α log(x))
α
= α xα−1 .
x
Beispiel 1.10 Die Funktion f (x) = ax ist Verkettung von exp und h(x) = log(a) x. Deshalb
gilt
f 0 (x) = exp0 (h(x))h0 (x) = exp(log(a) x) log(a) = log(a)ax .
Beispiel 1.11 Wir berechnen die Ableitung der Wurzelfunktion g(y) =
tion von f (x) = x2 :
1
1
1
=
g 0 (y) = 0
= √ .
2 g(y)
2 y
f g(y)
√
y als Umkehrfunk-
Beispiel 1.12 Nach Übungsaufgabe 2, Serie 10 besitzt die Funktion sinh : R → R eine streng
monoton wachsende Umkehrfunktion Arsinh : R → R. Da sinh0 x = cosh x > 0 für alle x ∈ R,
ist die Funktion Arsinh differenzierbar und hat die Umkehrfunktion
Arsinh0 (y) =
1
1
=
.
cosh(Arsinh(y))
sinh (Arsinh(y))
0
62
Um dies umzuformen, beachte
2
2
cosh x − sinh x =
Also gilt cosh x =
p
ex + e−x
2
2
−
2
= 1.
1 + sinh2 x und es folgt
1
Arsinh0 (y) = p
1 + y2
2
ex − e−x
2
.
Mittelwertsatz und Anwendungen
Definition 2.1 Die Funktion f : (a, b) → R hat in x0 ∈ (a, b) ein lokales Minimum, falls es
ein δ > 0 gibt, so dass gilt:
f (x0 ) ≤ f (x)
für alle x ∈ Uδ (x0 ) = (x0 − δ, x0 + δ).
Ist sogar f (x0 ) < f (x) für x ∈ Uδ (x0 )\{x0 }, so heißt das lokale Minimum isoliert. Ein
(isoliertes) lokales Maximum ist entsprechend definiert.
Satz 2.1 (notwendige Bedingung für Extrema) Die Funktion f : (a, b) → R habe in
x0 ∈ (a, b) ein lokales Extremum (d. h. Minimum oder Maximum). Ist f in x0 differenzierbar,
so gilt f 0 (x0 ) = 0.
Beweis: Wir nehmen an, dass f ein lokales Minimum hat. Es gibt also ein δ > 0 mit
f (x) ≥ f (x0 ) für x ∈ (x0 − δ, x0 + δ). Daraus folgt
x ∈ (x0 , x0 + δ) ⇒
x ∈ (x0 − δ, , x0 ) ⇒
f (x) − f (x0 )
≥0
x − x0
f (x) − f (x0 )
≤ 0.
x − x0
Mit x & x0 folgt f 0 (x0 ) ≥ 0, mit x % x0 folgt f 0 (x0 ) ≤ 0.
Die Funktion f (x) = x3 erfüllt f 0 (0) = 0, aber in x = 0 liegt kein lokales Extremum vor.
Die Bedingung f 0 (x0 ) = 0 ist notwendig für eine lokale Extremalstelle einer differenzierbaren
Funktion, aber sie ist nicht hinreichend.
Das Argument des Beweises von Satz 2.1 liefert auch dann etwas, wenn eine Funktion
f : [a, b] → R ein lokales Extremum in einem Randpunkt von [a, b] hat und dort einseitig differenzierbar ist. Ist zum Beispiel a eine Extremalstelle von f , so folgt
(
f (x) − f (a) ≥ 0 (Minimum)
0
f+ (a) = lim
x&a
x−a
≤ 0 (Maximum).
Es ist eine zentrales Problem der Analysis, aus Eigenschaften der Ableitung auf Eigenschaften
der Funktion selbst zu schließen:
63
Informationen über f 0
−→
Verhalten von f .
Der Mittelwertsatz ist ein einfaches und gleichzeitig effektives Hilfsmittel, um solche Schlüsse
zu ziehen.
Satz 2.2 (Mittelwertsatz der Differentialrechnung) Sei f : [a, b] → R stetig, differenzierbar auf (a, b). Dann gibt es ein ξ ∈ (a, b) mit
f 0 (ξ) =
f (b) − f (a)
.
b−a
Beweis:
Schritt 1 Beweis im Fall f (a) = f (b) = 0 (Satz von Rolle)
Wir brauchen ein ξ ∈ (a, b) mit f 0 (ξ) = 0. Es ist deshalb naheliegend, nach Extremalstellen
zu suchen. Nach Kapitel 3, Satz 4.2 gibt es ξ1 , ξ2 ∈ [a, b] mit
f (ξ1 ) = inf f (x)
und
x∈[a,b]
f (ξ2 ) = sup f (x).
x∈[a,b]
Ist ξ1 ∈ (a, b), so folgt f 0 (ξ1 ) = 0 nach Satz 2.1 und wir können ξ := ξ1 wählen. Analog,
wenn ξ2 ∈ (a, b). Im verbleibenden Fall ξ1 , ξ2 ∈ {a, b} folgt inf f = sup f = 0 bzw. f (x) = 0
für alle x ∈ [a, b], und damit auch f 0 (x) = 0 für alle x.
Schritt 2 Beweis für f (a), f (b) ∈ R beliebig
Definiere h : [a, b] −→ R durch Abziehen der Sekante “
”
h(x) = f (x) − g(x), g(x) = f (a) +
f (b) − f (a)
(x − a).
b−a
Dann erfüllt h die Voraussetzungen von Schritt 1, insbesondere gilt h(a) = h(b) = 0. Also
existiert ein ξ ∈ (a, b) mit
0 = h0 (ξ) = f 0 (ξ) −
Satz von Rolle: ∃ horizontale Tangente
f (b) − f (a)
.
b−a
Mittelwertsatz: ∃ sehnenparallele Tangente
64
Folgerung 2.1 (Monotoniekriterium) Sei f differenzierbar auf (a, b), stetig auf [a, b].
Dann gelten folgende Aussagen:
f 0 (x) ≥ 0 für alle x ∈ (a, b) ⇒ f ist wachsend auf [a, b]
f 0 (x) ≤ 0 für alle x ∈ (a, b) ⇒ f ist fallend auf [a, b]
f 0 (x) = 0 für alle x ∈ (a, b) ⇒ f ist konstant.
Bei strikter Ungleichung folgt strenge Monotonie auf [a, b].
Beweis: Sei a ≤ x1 < x2 ≤ b. Nach dem Mittelwertsatz


≥0





> 0
0
f (x2 ) − f (x1 ) = f (ξ) (x2 − x1 ) ≤ 0
| {z } 


<0

>0



=0
gibt es ein ξ ∈ (x1 , x2 ), so dass gilt:
wenn
wenn
wenn
wenn
wenn
f 0 (ξ) ≥ 0
f 0 (ξ) > 0
f 0 (ξ) ≤ 0 .
f 0 (ξ) < 0
f 0 (ξ) = 0
Definition 2.2 Sei f : (a, b) → R. Eine differenzierbare Funktion F : (a, b) → R heißt
Stammfunktion von f , wenn gilt:
F0 = f
⇔ F 0 (x) = f (x)
für alle x ∈ (a, b).
Folgerung 2.2 Ist F eine Stammfunktion von f auf (a, b), so ist jede Stammfunktion von f
auf (a, b) von der Form F + c für eine Konstante c ∈ R.
Beweis: Sei G auch Stammfunktion auf (a, b). Es folgt
(G − F )0 = G0 − F 0 = f − f = 0.
Nach Folgerung 2.1 gibt es eine Konstante c ∈ R mit G − F = c, also G = F + c.
Die Gleichung F 0 = f ist ein elementares Beispiel für eine Differentialgleichung. Folgerung
2.2 sagt aus, dass eine Lösung der Gleichung bis auf eine additive Konstante
c ∈ R eindeutig bestimmt ist. Es schließt sich hier unmittelbar die Frage nach der Existenz
an:
Für welche f ist die Differentialgleichung F 0 = f auf dem Intervall (a, b) lösbar?
Wie gesagt, ist dies eine zentrale Frage der Analysis. Wir werden eine Antwort geben, sobald
uns die Integralrechnung zur Verfügung steht, und zwar mit dem Hauptsatz der Differentialund Integralrechnung.
Folgerung 2.3 (Schrankensatz) Ist f : [a, b] → R stetig und differenzierbar auf (a, b), so
gilt für a ≤ x1 < x2 ≤ b:
f 0 (x) ≥ m für alle x ∈ (a, b) ⇒
f 0 (x) ≤ M für alle x ∈ (a, b) ⇒
65
f (x2 ) − f (x1 )
≥m
x2 − x1
f (x2 ) − f (x1 )
≤ M.
x2 − x1
Beweis: Wir zeigen die erste Aussage. Mit g(x) = mx gilt (f − g)0 = f 0 − g 0 ≥ m − m = 0.
Nach Folgerung 2.1 ist f − g wachsend, d. h.
f (x2 ) − m x2 ≥ f (x1 ) − m x1 .
Die Behauptung folgt.
Für vektorwertige Funktionen f : [a, b] → Rn , n ≥ 2, gilt der Mittelwertsatz der Differentialrechnung nicht. Es gibt Abbildungen f : [a, b] → R2 mit f (a) = f (b), aber f 0 (ξ) 6= 0 für alle
ξ ∈ (a, b); die Gleichung f (b)−f (a) = f 0 (ξ) (b−a) kann dann nicht erfüllt sein. Ein konkretes
Beispiel ist die Bewegung auf einer Kreislinie mit konstanter Absolutgeschwindigkeit. Nach
einer gewissen Zeit kommt man wieder am Ausgangspunkt an, ohne dass die Geschwindigkeit
jemals Null war (im nächsten Abschnitt werden wir die gleichförmige Kreisbewegung noch
ausführlich behandeln). Gewisse Konsequenzen des Mittelwertsatzes lassen sich dennoch auf
den verktorwertigen Fall übertragen. Dies gilt für Folgerung 2.2 (F 0 = 0 ⇒ F = const.)
sowie für die folgende Aussage.
Folgerung 2.4 (f 0 beschränkt ⇒ f Lipschitz) Sei f : [a, b] → Rn stetig und auf (a, b)
differenzierbar. Falls |f 0 (x)| ≤ L für alle x ∈ (a, b), so folgt
|f (x1 ) − f (x2 )| ≤ L|x1 − x2 |
für alle x1 , x2 ∈ [a, b].
Beweis: Um die Aussage auf den R-wertigen Fall zu reduzieren, betrachten wir für einen
beliebigen Vektor v ∈ Rn mit |v| = 1 die Funktion
ϕ : [a, b] → R, ϕ(x) = hv, f (x)i =
n
X
v i f i (x).
i=1
Aus der Cauchy-Schwarz-Ungleichung (Kapitel 1, Satz 5.4) folgt
0
ϕ (x) =
n
X
v i (f i )0 (x) = hv, f 0 (x)i ≤ |v| |f 0 (x)| ≤ L.
i=1
Für x1 , x2 ∈ [a, b], oBdA x1 > x2 , erhalten wir aus Folgerung 2.3
hv, f (x1 ) − f (x2 )i = ϕ(x1 ) − ϕ(x2 ) ≤ L(x1 − x2 ) = L|x1 − x2 |.
Wir können f (x1 ) 6= f (x2 ) annehmen, denn sonst ist nichts zu zeigen. Nun wählen wir
v :=
f (x1 ) − f (x2 )
|f (x1 ) − f (x2 )|
⇒
|v| = 1,
und wir erhalten
|f (x1 ) − f (x2 )| = hf (x1 ) − f (x2 ), vi ≤ L|x1 − x2 |.
Wir wollen als Anwendung des Mittelwertsatzes Aussagen über das Wachstum der Exponentialfunktion machen. Die Exponentialfunktion beschreibt Wachstums- bzw. Zerfallprozesse,
bei denen die Geschwindigkeit der Zunahme bzw. Abnahme proprotional zur vorhandenen
Menge ist. Zum Beispiel ist bei Anlegen eines Kapitals zum Zinssatz α ∈ R der Kontostand
nach t Jahren gegeben durch f (t) = f (0) exp(αt), es gilt also die Gleichung
f0 = α f
(Differentialgleichung von f (x) = eαx )
Wir benötigen nun folgende multiplikative“ Variante des Schrankensatzes.
”
66
(2.1)
Folgerung 2.5 Sei f : [a, b] → R stetig, auf (a, b) differenzierbar, und sei a ≤ x1 < x2 ≤ b
sowie α ∈ R. Dann gilt:
f 0 ≥ αf auf (a, b) ⇒ e−αx2 f (x2 ) ≥ e−αx1 f (x1 )
f 0 ≤ αf auf (a, b) ⇒ e−αx2 f (x2 ) ≤ e−αx1 f (x1 ).
Beweis: Wir berechnen mit der Produktregel, wobei
d
die Ableitung bezeichnet,
dx
d −αx
(e
f (x)) = −αe−αx f (x) + e−αt f 0 (x) = e−αx (f 0 (x) − αf (x)).
dx
Die Behauptung ergibt sich aus Folgerung 2.1.
Satz 2.3 (Wachstum von exp und log) Es gelten folgende Grenzwertaussagen:
lim x−s ex = +∞
und
lim y −s log y = 0
und
x→+∞
y→+∞
lim xs e−x = 0
x→+∞
lim y s log y = 0
y&0
für jedes s > 0,
für jedes s > 0.
(2.2)
(2.3)
Beweis: Wir setzen f (x) = x−s ex mit s > 0 und berechnen für x > 0
f 0 (x) = −s x−s−1 ex + x−s ex = (1 −
⇒ f 0 (x) ≥
1
f (x)
2
s
)f (x)
x
für x ≥ 2s.
Aus Folgerung 2.5 mit x1 = 2s, x2 = x > 2s folgt
1
f (x) ≥ e 2 (x−2s) f (2s) → +∞
mit x → +∞.
Damit ist (2.2) gezeigt, wobei sich die zweite Aussage durch Bildung des Kehrwerts ergibt.
Für (2.3) substituieren wir y = ex/s ⇔ log y = x und schließen, da y → +∞ ⇔ x → +∞
sowie y & 0 ⇔ x → −∞,
y −s log y = e−x x/s → 0
s
x
y log y = e x/s → 0
mit y → +∞,
mit y & 0.
Definition 2.3 Sei D ⊂ R offen und f : D → R. Wir setzen f (0) = f und definieren
induktiv die k-te Ableitung f (k) : D → R für k ≥ 1 durch f (k) := (f (k−1) )0 . Damit f (k)
existiert, muss also f (k−1) noch differenzierbar sein.
Definition 2.4 Für D ⊂ R offen und k ∈ N0 bezeichnen wir mit C k (D) den R-Vektorraum
der k mal stetig differenzierbaren Funktionen f : D → R, das heißt
C k (D) = {f : D → R : f (i) : D → R sind definiert und stetig für i = 0, 1, . . . , k}.
Weiter definieren wir C ∞ (D) als den R-Vektorraum der unendlich oft differenzierbaren Funktionen, also ist
\
C ∞ (D) =
C k (D).
k≥0
67
Der Umgang mit C ∞ -Funktionen ist besonders angenehm, weil die Klasse im Gegensatz zu
den Räumen C k (D) unter der Bildung von Ableitungen abgeschlossen ist. Es ist klar, dass
Polynome unendlich oft differenzierbar sind, ebenso die Exponentialfunktion. Das folgende
Beispiel einer zusammengestückelten C ∞ -Funktion wird sich später als sehr nützlich erweisen
Folgerung 2.6 Die Funktion
(
e−1/x
f (x) =
0
für x > 0
für x ≤ 0
ist unendlich oft differenzierbar.
Beweis: Wir zeigen durch Induktion, dass es Polynome pn gibt, so dass gilt:
(
pn ( x1 ) e−1/x für x > 0
(n)
f (x) =
0
für x ≤ 0.
Für n = 0 ist das richtig mit p0 (s) ≡ 1. Ist die Aussage für ein n ∈ N0 gezeigt, so folgt:
1 0 1
1
1
(n+1)
x>0 ⇒ f
(x) = − 2 pn ( ) + 2 pn ( ) e−1/x
x
x
x
x
x < 0 ⇒ f (n+1) (x) = 0.
Wir setzen also pn+1 (s) = s2 (pn (s) − p0n (s)). Zu zeigen bleibt f (n+1) (0) = 0. Für den
linksseitigen Differenzenquotienten ist das klar, für x > 0 berechnen wir mit (2.2)
1
1
f (n) (x) − f (n) (0)
= pn ( ) e−1/x → 0
x
x
x
mit x & 0,
Wir kommen jetzt zurück zu der Bestimmung von Extremwerten.
Folgerung 2.7 Sei f : (a, b) → R zweimal differenzierbar und f 0 (x0 ) = 0 für x0 ∈ (a, b). Ist
dann f 00 (x0 ) > 0, so hat f in x0 ein isoliertes, lokales Minimum.
Beweis: Nach Voraussetzung gilt, da f 0 (x0 ) = 0,
0 < f 00 (x0 ) = lim
x→x0
f 0 (x)
.
x − x0
Also gibt es ein δ > 0 mit f 0 (x) > 0 auf (x0 , x0 + δ) und f 0 (x) < 0 auf (x0 − δ, x0 ). Nach
Folgerung 2.1 ist f streng monoton fallend auf (x0 − δ, x0 ] und streng monoton wachsend auf
[x0 , x0 + δ), woraus die Behauptung folgt.
Bei Extremwertaufgaben ist in der Regel nicht die lokale, sondern die globale Minimalität von
Interesse. In diesem Zusammenhang ist der Begriff der Konvexität von erheblicher Bedeutung.
Definition 2.5 Sei I ⊂ R ein Intervall. f : I → R heißt konvex, falls gilt:
f (1 − t)x0 + t x1 ≤ (1 − t) f (x0 ) + tf (x1 ) ∀x0 , x1 ∈ I, t ∈ [0, 1].
Gilt dies mit ≥ statt mit ≤, so heißt f konkav.
68
(2.4)
Geometrische Interpretation:
Die Sekante durch x0 , f (x0 ) und x1 , f (x1 ) ist Graph der linearen Funktion
g(x) = f (x0 ) +
f (x1 ) − f (x0 )
(x − x0 ).
x1 − x0
An der Stelle x(t) = (1 − t)x0 + t x1 gilt
f (x1 ) − f (x0 )
t(x1 − x0 ) = (1 − t)f (x0 ) + tf (x1 ).
g x(t) = f (x0 ) +
x1 − x0
Die Konvexitätsbedingung besagt also anschaulich, dass der Graph von f unterhalb jeder
Sekanten liegt.
Satz 2.4 (Konvexitätskriterien) Sei f : (a, b) → R differenzierbar. Dann sind folgende
Aussagen äquivalent:
(1) f 0 ist monoton wachsend auf (a, b).
(2) f ist konvex.
(3) f (y) ≥ f (x) + f 0 (x)(y − x) für alle x, y ∈ (a, b).
Ist f zweimal differenzierbar auf (a, b), so ist außerdem äquivalent:
(4) f 00 ≥ 0.
3
Die Winkelfunktionen
In der Schule werden die Funktionen Sinus, Kosinus und Tangens durch die Längenverhältnisse im rechtwinkligen Dreieck eingeführt:
Um dies jedoch zu einer exakten Definition auszubauen, wird das Konzept der Winkelmessung, also der Bestimmung der Länge des zugehörigen Einheitskreisbogens, gebraucht.
Anstatt die Bogenlänge hier ad hoc zu definieren (dies wird in Analysis II für allgemeine
Kurvenstücke als Anwendung der Integralrechnung behandelt), wählen wir einen anderen
Zugang. Bei diesem stehen die Differentialgleichung der harmonischen Schwingung bzw.
die Differentialgleichung der gleichförmigen Kreisbewegung im Mittelpunkt. Im folgenden
betrachten wir Funktionen, die vom Parameter t ( Zeit“) abhängen.
”
Die Differentialgleichung der harmonischen Schwingung lautet bei geeigneter Normierung
x00 + x = 0.
Physikalisch beschreibt x : I → R, I = (t1 , t2 ) ⊂ R, die Auslenkung eines schwingungsfähigen
Systems (Oszillators) aus der Ruhelage x = 0; ein Beispiel ist die Schwingung einer elastischen
Feder. Die Differentialgleichung kann aus der Annahme hergeleitet werden, dass auf das
System eine Rückstellkraft wirkt, die proportional zur Auslenkung, aber entgegengesetzt
gerichtet ist. Um die Schwingung zu bestimmen, sollten die Position und Geschwindigkeit zu
einer Anfangszeit vorgegeben sein; wir wählen stets die Anfangszeit t = 0.
69
Definition 3.1 (Anfangswertproblem für die harmonische Schwingung) Sei 0 ∈
I = (t1 , t2 ). Eine Funktion x ∈ C 2 (I) heißt Lösung des Anfangswertproblems für die harmonische Schwingung zu den Anfangsdaten a, b ∈ R, falls gilt:
x00 + x = 0
auf I,
x(0) = a,
x0 (0) = b.
(3.1)
Sei x ∈ C 2 (I) eine Lösung von (3.1). Wir definieren die Funktion y = −x0 und erhalten
y 0 = −x00 = x, das heißt es gilt das System von Gleichungen
x0 = −y
0
y =
x(0) = a,
y(0) = −b.
x
Mit komplexen Zahlen können wir das noch kürzer schreiben: wir definieren die Funktion
c : I → C,
c(t) = x(t) + iy(t).
Wir erhalten c0 = x0 + i y 0 = −y + ix = i(x + iy), beziehungsweise
c0 = ic auf I,
c(0) = z0 ∈ C,
(3.2)
wobei hier z0 = a − ib. Im folgenden brauchen wir uns um die Differenzierbarkeit der
beteiligten Funktionen keine Gedanken zu machen, denn es gilt
Lemma 3.1 (Regularität) Ist c : I → C differenzierbar und c0 = ic, so folgt c ∈ C ∞ (I, C).
Insbesondere ist jede Lösung x : I → R der Gleichung x00 + x = 0 in C ∞ (I).
Beweis: Aus Satz 1.1 folgt c ∈ C 0 (I, C). Sei nun induktiv c ∈ C k (I, C) schon gezeigt für
ein k ∈ N0 . Dann folgt c0 = ic ∈ C k (I, C), also c ∈ C k+1 (I, C).
Lemma 3.2 (Reduktion der Ordnung) Für Funktionen x, y : I → R sind folgende Aussagen äquivalent:
(1) x ist Lösung von (3.1), und y = −x0 ,
(2) c = x + iy ist Lösung von (3.2) mit z0 = a − ib.
Beweis: (1)⇒(2) wurde oben gezeigt. Umgekehrt folgt aus (2)
x0 + iy 0 = c0 = ic = i(x + iy) = −y + ix,
also x00 = −y 0 = −x sowie x(0) = a und x0 (0) = −y(0) = −(−b) = b.
Das Anfangswertproblem (3.1) zweiter Ordnung für eine gesuchte reellwertige Funktion ist
also gleichwertig mit dem Anfangswertproblem (3.2) erster Ordnung für zwei gesuchte reellwertige Funktionen, bzw. eine C-wertige Funktion. Diesem wenden wir uns jetzt zu.
Lemma 3.3 (Erhaltungssatz) Für jede Lösung c = x + iy : I → C, I = (t1 , t2 ) der
Gleichung c0 = ic ist die Funktion |c(t)|2 = x(t)2 + y(t)2 konstant.
70
Beweis: Es gilt, indem wir z und iz als Punkte in R2 auffassen,
hz, izi = h(
x
−y
), (
)i = 0
y
x
für alle z ∈ C.
Daraus folgt
d 2
|c| = 2 hc, c0 i = 2 hc, ici = 0.
dt
Mit Folgerung 2.1 ergibt sich die Behauptung.
Wir bezeichnen die Gleichung c0 = ic als Differentialgleichung der gleichförmigen Kreisbewegung, denn nach Lemma 3.3 verläuft jede Lösung c(t) auf einem Kreis um den Nullpunkt
und hat konstante Absolutgeschwindigkeit |c0 (t)| = |c(t)| = const.
Satz 3.1 (Eindeutigkeitssatz für die gleichförmige Kreisbewegung) Das
wertproblem (3.2) hat höchstens eine Lösung c : I → C.
Anfangs-
Beweis: Seien c1 , c2 Lösungen von (3.2). Für c := c1 − c2 folgt
c0 = c01 − c02 = ic1 − ic2 = ic,
c(0) = 0.
Nach Lemma 3.3 ist |c(t)| = |c(0)| = 0 für alle t, also c1 = c2 .
Satz 3.2 (Existenzsatz für die gleichförmige Kreisbewegung) Das Anfangswertproblem (3.2) besitzt eine (eindeutig bestimmte) Lösung c ∈ C ∞ (R, C).
Wir stellen den Beweis dieses Satzes zurück, denn er erfordert Hilfsmittel, die an dieser Stelle
noch nicht zur Verfügung stehen. Wir verweisen auf die Diskussion nach Folgerung 3.4 am
Ende des Abschnitts. Wir wollen hier zeigen, dass sich Definition und Eigenschaften der
trigonometrischen Funktionen unabhängig vom gewählten Lösungsverfahren allein aus der
Differentialgleichung herleiten lassen. Aus Lemma 3.2 ergibt sich zunächst direkt
Folgerung 3.1 (Eindeutigkeits- und Existenzsatz für die harmonische Schwingung)
Das Anfangswertproblem (3.1) besitzt eine eindeutig bestimmte Lösung x ∈ C ∞ (R).
Definition 3.2 (Kosinus und Sinus) Die Funktion cos : R → R (bzw. sin : R → R) ist
die eindeutig bestimmte Lösung der Gleichung x00 + x = 0 zu den Anfangsdaten x(0) = 1,
x0 (0) = 0 (bzw. x(0) = 0, x0 (0) = 1).
Lemma 3.4 Die Funktion c : R → C, c(t) = cos t + i sin t ist Lösung des Anfangswertproblems
c0 = ic, c(0) = 1 ∈ C.
Insbesondere gilt cos0 = − sin, sin0 = cos und
cos2 t + sin2 t = 1.
Beweis: Die Funktion y = − cos0 erfüllt
y 00 + y = −(cos000 + cos0 ) = −(cos00 + cos)0 = 0,
y(0) = − cos0 (0) = 0
sowie
y 0 (0) = − cos00 (0) = cos(0) = 1.
71
(3.3)
Aus der Eindeutigkeitaussage von Folgerung 3.1 folgt − cos0 = sin, und durch Differentiation
sin0 = − cos00 = cos. Also gilt (3.2) mit z0 = cos(0) + i sin(0) = 1. Die Identität (3.3) gilt
nach Lemma 3.3.
Es ist jetzt nicht schwer zu überprüfen, dass die Lösung des allgemeinen Anfangswertproblems
(3.1) durch
x(t) = a cos t + b sin t
gegeben ist. Unser Ziel ist es, im Folgenden anhand der Definition die Eigenschaften der
Funktionen Kosinus und Sinus herzuleiten. Wir beginnen mit dem Nachweis, dass cos und
sin periodische Funktionen sind. Dazu zeigen wir wiederum, dass die Funktion c(t) den
Punkt i ∈ C in endlicher Zeit τ > 0 zum ersten Mal erreicht und dabei den rechten oberen
Viertelkreis durchläuft.
Lemma 3.5 Sei τ := sup{t > 0 : cos s > 0
für alle s ∈ (0, t)}. Dann gilt:
(1) cos t > 0 und sin t > 0 für alle t ∈ (0, τ ).
(2) τ ∈ (0, ∞) und c(τ ) = cos τ + i sin τ = i.
Beweis: Da cos 0 = 1 und cos stetig, ist cos s > 0 für hinreichend kleine s ≥ 0 und folglich
τ > 0. Für t ∈ (0, τ ) folgt sin0 t = cos t > 0, also ist sin streng monoton wachsend auf [0, τ ]
nach Folgerung 2.1. Da sin 0 = 0, ist (1) gezeigt. Wähle nun ein beliebiges t0 ∈ (0, τ ). Dann
gilt
t ∈ (t0 , τ ) ⇒ cos0 t = − sin t ≤ − sin t0 .
Aus (1) und dem Schrankensatz (Folgerung 2.3) folgt für jedes t ∈ (t0 , τ )
0 < cos t ≤ cos t0 − (t − t0 ) sin t0
⇒
t < t0 +
cos t0
.
sin t0
Also ist τ < ∞. Nun ist cos τ = limt%τ cos t ≥ 0. Nach Definition von τ gibt es auf der
anderen Seite ti & τ√mit cos ti ≤ 0. Es folgt cos τ = 0 sowie, wieder wegen (1), sin τ =
limt%τ sin t = limt%τ 1 − cos2 t = 1. Damit ist auch (2) bewiesen.
Auf dem Intervall [0, τ ] durchläuft c(t) mit Geschwindigkeit |c0 (t)| = 1 den Viertelkreis von
1 nach i. Dies motiviert die
Definition 3.3 (Die Zahl π) Wir setzen π = 2τ mit τ aus Lemma 3.5.
Für ω ∈ R ist die Exponentialfunktion f (t) = eωt Lösung des Anfangswertproblems
f 0 = ωf,
f (0) = 1.
Die komplexwertige Funktion c(t) = cos t + i sin t ist Lösung des analogen Anfangswertproblems, nur mit ω = i ∈ C:
c0 = ic, c(0) = 1.
Diese Analogie und das nachfolgende Lemma rechtfertigen es, die Exponentialfunktion für
imaginäre Argumente wie folgt zu erklären:
Definition 3.4 (Eulersche Formel) Wir definieren
eit := exp(it) := cos t + i sin t
72
für t ∈ R.
(3.4)
Lemma 3.6 (Funktionalgleichung) Es gilt
ei(α+β) = eiα eiβ
für alle α, β ∈ R.
(3.5)
Beweis: Betrachte mit c(t) = eit die Funktionen
c1 (t) = c(α + t)
und
c2 (t) = c(α) c(t).
Aus Lemma 3.4 folgt c1 (0) = c(α) = c2 (0) sowie
c01 (t) = c0 (α + t) = ic(α + t) = ic1 (t),
c02 (t) = c(α)c0 (t) = i c(α) c(t) = i c2 (t).
Aus Satz 3.1 (Eindeutigkeitssatz) folgt c1 (t) = c2 (t) für alle t, also mit t = β
c(α + β) = c1 (β) = c2 (β) = c(α) c(β).
Wegen eit e−it = ei(t−t) = 1 gilt e−it = eit . Dies ist äquivalent zu cos(−t) = cos t und
sin(−t) = − sin t, das heißt cos ist eine gerade und sin eine ungerade Funktion. Ferner gelten
die Relationen:
c(t + π/2) = ic(t)
cos(t + π/2) = − sin t
sin(t + π/2) = cos t
c(t + π) = −c(t)
cos(t + π) = − cos t
sin(t + π) = − sin t
c(t + 2π) = c(t)
cos(t + 2π) = cos t
sin(t + 2π) = sin t.
Insbesondere folgt
eit = 1
⇔
t = k · 2π mit k ∈ Z,
(3.6)
und die Nullstellen von cos (bzw. sin) sind von der Form π/2 + k · π (bzw. k · π) mit k ∈ Z.
Folgerung 3.2 (Additionstheoreme)
cos(α + β) = cos α cos β − sin α sin β,
sin(α + β) = sin α cos β + cos α sin β.
Beweis: Aus (3.5) folgt
cos(α + β) + i sin(α + β) = ei(α+β) = eiα eiβ = (cos α + i sin α) (cos β + i sin β).
Die Behauptung folgt durch Vergleich der Real- und Imaginärteile.
Zur Definition der Umkehrfunktionen müssen cos und sin auf geeignete Intervalle eingeschränkt werden. Die Funktionen
π π
cos : [0, π] → [−1, 1] und sin : [− , ] → [−1, 1]
2 2
sind streng monoton fallend bzw. wachsend. Ihre Umkehrfunktionen sind die Arcusfunktionen
π π
arccos : [−1, 1] → [0, π] und arcsin : [−1, 1] → [− , ].
2 2
73
Für x ∈ [−1, 1] gilt, da cos2 t + sin2 t = 1,
arccos0 (x) =
arcsin0 (x) =
1
1
,
1 − x2
1
1
=√
.
0
sin (arcsin x)
1 − x2
cos0 (arccos x)
= −√
Folgerung 3.3 (Polardarstellung auf C) Zu z = x + iy ∈ C\{0} gibt es eindeutig bestimmte r > 0, ϑ ∈ [0, 2π) mit z = r eiϑ .
Beweis: Um die Eindeutigkeit zu zeigen, seien r1 , r2 > 0 und ϑ1 , ϑ2 ∈ [0, 2π) mit z =
r1 eiϑ1 = r2 eiϑ2 . Dann folgt |z| = r1 = r2 , und weiter
eiϑ1 = eiϑ2
bzw.
ei(ϑ1 −ϑ2 ) = 1.
Nach (3.6) ist ϑ1 − ϑ2 = 2k · π für ein k ∈ Z. Aber 2 |k|π = |ϑ1 − ϑ2 | < 2π, also gilt k = 0
und ϑ1 = ϑ2 .
Für die Existenz der Polardarstellung von z = x + iy ∈ C\{0} definieren wir
(
p
arccos xr
für y ≥ 0
r = x2 + y 2 > 0, ϑ =
x
2π − arccos r für y < 0.
√
Wir rechnen die geforderte Eigenschaft nach: wegen sin ϑ = 1 − cos2 ϑ für ϑ ∈ [0, π] gilt im
Fall y ≥ 0
r
x
x
x
x
x
y
iϑ
e = cos(arccos ) + i sin(arccos ) = + i 1 − ( )2 = + i ,
r
r
r
r
r
| {z r}
∈[0,π]
also z = r eiϑ . Für y < 0 haben wir, da cos, sin 2π-periodisch sind und außerdem cos gerade,
sin ungerade,
r
x
x
y
x
x
x
iϑ
e = cos(arccos ) − i sin(arccos ) = − i 1 − ( )2 = + i .
r
r
r
r
r
r
| {z }
∈[0,π]
In der Polardarstellung wird die Multiplikation sowie das Potenzieren von komplexen Zahlen
besonders einfach:
z1 = r1 eiα , z2 = r2 eiβ
⇒
z1 z2 = r1 r2 ei(α+β) .
Zum Beipiel sind die Lösungen der Gleichung z n = 1, die n-ten Einheitswurzeln, gegeben
durch ζk = ei 2πk/n für k = 0, 1, . . . , n − 1.
Spalten wir die Polardarstellung in Real- und Imaginärteil auf, so erhalten wir die reellen
Formeln für Polarkoordinaten auf R2 :
x = r cos ϑ,
y = r sin ϑ
mit r > 0, ϑ ∈ [0, 2π).
Zum Schluss wollen wir unsere Definition der Exponentialfunktion nochmals erweitern:
74
Definition 3.5 (Komplexe Exponentialfunktion) Die komplexe Exponentialfunktion ist
definiert durch
exp : C → C, z = x + iy 7→ exp(z) = ex eiy = ex (cos y + i sin y).
Mit dieser Definition gilt die Funktionalgleichung nun auf ganz C, denn für z1 = x1 + iy1 ,
z2 = x2 + iy2 gilt
exp(z1 + z2 ) = exp((x1 + x2 ) + i(y1 + y2 ))
= ex1 +x2 ei(y1 +y2 )
= ex1 eiy1 ex2 eiy2
= exp(z1 ) exp(z2 ).
Aus diesem Grund können wir auch exp(z) = ez schreiben; die Regeln der Potenzrechnung
gelten. Mit der komplexen Exponentialfunktion können wir nun allgemeinere Anfangswertprobleme lösen.
Folgerung 3.4 (Differentialgleichung der e-Funktion) Sei ω = α + iβ ∈ C und 0 ∈
I = (t1 , t2 ). Dann ist die Funktion c(t) = eωt die eindeutig bestimmte Lösung f : I → C des
Anfangswertproblems
f 0 = ωf auf I, f (0) = 1.
(3.7)
Beweis: Aus der Differentialgleichung der reellen e-Funktion und der Differentialgleichung
der gleichförmigen Kreisbewegung, siehe Lemma 3.4, folgt mit der Produktregel und der
Kettenregel
d αt iβt
(e e )
dt
d
d
= ( eαt ) eiβt + eαt ( eiβt )
dt
dt
αt iβt
αt
iβt
= αe e + e iβe
d ωt
=
e
dt
= ωeωt .
Also gilt c0 = ωc auf ganz R und c(0) = 1. Sei f : I → C eine weitere Lösung von (3.7).
Dann berechnen wir
d −ωt
d
d
(e f (t)) = ( e−ωt ) f + e−ωt ( f )
dt
dt
dt
= −ωe−ωt f + e−ωt ωf
= 0.
Es folgt e−ωt f (t) = e−ωt f (t)|t=0 = 1, und die Funktionalgleichung liefert f (t) = eωt für alle
t ∈ I.
In diesem Abschnitt haben wir gesehen, dass sich die charakteristischen Eigenschaften der trigonometrischen Funktionen, insbesondere ihre Periodizität und ihre Additionstheoreme, sehr
einfach aus der Differentialgleichung der harmonischen Schwingung herleiten lassen. Grundlegend war dabei die Umformulierung mittels des Systems der gleichförmigen Kreisbewegung.
Während sich die eindeutige Lösbarkeit leicht aus dem Erhaltungssatz Lemma 3.3 ergab,
bleibt die Konstruktion einer Lösung zunächst offen. Es gibt hier mehrere Zugänge, von
denen zwei in diesem Skript vorgestellt werden:
75
• In Kapitel 4, Satz 2.4 wird das Existenzproblem auf das Auffinden einer Stammfunktion
reduziert, deren Existenz durch den Hauptsatz der Differential- und Integralrechnung
gesichert ist.
• In Kapitel 5.2 wird für die gesuchte Lösung eine Darstellung als Potenzreihe hergeleitet. Es wird dann nachgewiesen, dass die gewonnene Potenzreihe (unendlich oft)
differenzierbar ist und in der Tat das Anfangswertproblem 3.2 löst.
Im zweiten Semester werden wir als weitere Methode zur Konstruktion einer Lösung ein
Iterationsverfahren (Picard-Lindelöf) behandeln.
76
Kapitel 4
Integralrechnung
1
Das Riemannsche Integral
Als Motivation für die Definition des Integrals betrachten wir das Problem, den Flächeninhalt
auszurechnen, den der Graph einer Funktion f : [a, b] = I → R mit der x-Achse einschließt:
Anschaulich soll also gelten
Z
b
f = Flächeninhalt von {(x, y) : x ∈ I, 0 ≤ y ≤ f (x)}.
a
Allerdings wollen wir Flächen unterhalb der x-Achse negativ zählen.
Definition 1.1 (Riemannsche Summe) Sei I = [a, b] ein kompaktes Intervall. Eine Diskretisierung D auf I ist durch folgende Daten gegeben: 1
• eine Unterteilung a = x0 ≤ x1 ≤ . . . ≤ xN = b von I in aufeinanderfolgende Intervalle
Ik = [xk−1 , xk ],
• zugehörige Stützstellen ξk ∈ Ik für k = 1, . . . , N .
Wir setzen ∆xk := xk − xk−1 und nennen ∆(D) = max1≤k≤N ∆xk die Feinheit der Diskretisierung D. Für f : I → R heißt dann die Zahl
SD (f ) =
N
X
f (ξk )∆xk ∈ R
(1.1)
k=1
die Riemannsche Summe von f zur Diskretisierung D.
Die Riemannsche Summe ergibt einen Näherungswert für das Integral, der auf endlich vielen
Daten, nämlich den Unterteilungspunkten sowie den Werten der Funktion an den Stützstellen,
beruht. Im Prinzip könnte diese Näherung von einem Computer berechnet werden. Sinnvoll
ist das aber natürlich nur, wenn bei Verfeinerung der Diskretisierung der Approximationsfehler kleiner wird. Dies führt auf den folgenden Begriff von Integrierbarkeit.
1
In der Literatur wird meist von einer Unterteilung mit Stützstellen gesprochen; der Begriff Diskretisierung
ist nicht Standard.
77
Definition 1.2 (Riemann-Integral) Die Funktion f : I = [a, b] → R heißt integrierbar
mit Integral S ∈ R, falls es für alle ε > 0 ein δ > 0 gibt, so dass gilt:
D Diskretisierung von I mit ∆(D) < δ
⇒
|SD (f ) − S| < ε.
Bezeichnung. Die Zahl S nennen wir das (bestimmte) Integral von f auf [a, b] und schreiben
Rb
S = S(f ) = a f ∈ R.
Beispiel 1.1 Sei f (x) = c ∈ R für alle x ∈ I. Dann gilt für jede Diskretisierung D
SD (f ) =
N
X
N
X
c ∆xk = c
k=1
also ist f integrierbar mit
Rb
a
(xk − xk−1 ) = c (b − a),
k=1
f = c(b − a).
Es ist praktisch, neben der ε − δ−Formulierung der Integrierbarkeit auch eine Version mit
Folgen zur Verfügung zu haben, ganz analog zur Definition der Stetigkeit.
Lemma 1.1 Für f : I = [a, b] → R und S ∈ R sind folgende Aussagen äquivalent:
(1) f ist Riemann-integrierbar mit Integral S ∈ R.
(2) SDj (f ) → S für jede Folge Dj mit ∆(Dj ) → 0.
Beweis: Die Implikation (1) ⇒ (2) folgt unmittelbar aus den Definitionen. Sei umgekehrt
(2) erfüllt. Wäre (1) falsch, so gibt es ein ε > 0 mit folgender Eigenschaft: zu jedem
δ = 1/j, j ∈ N, gibt es eine Diskretisierung Dj mit Feinheit ∆(Dj ) < 1/j, aber dennoch
|SDj (f ) − S| ≥ ε. Dies ist ein Widerspruch zu (2).
Satz 1.1 (Linearität des Integrals) Die Menge R(I) der Riemann-integrierbaren FunkRb
tionen f : I → R ist ein R-Vektorraum und das Integral S : R(I) → R, f 7→ S(f ) = a f ist
ein lineares Funktional. Es gilt also
Z b
Z b
Z b
(λ f + µ g) = λ
f +µ
g.
a
a
a
Beweis: Für eine beliebige Diskretisierung D gilt
SD (λf + µg) =
N
X
λf (ξk ) + µg(ξk ) ∆xk
k=1
N
X
= λ
f (ξk ) ∆xk + µ
k=1
N
X
g(ξk )∆xk
k=1
= λSD (f ) + µSD (g).
Für jede Folge von Diskretisierungen Dj mit ∆(Dj ) → 0 folgt
SDj (λf + µg) = λSDj (f ) + µSDj (g) → λS(f ) + µS(g).
Natürlich hoffen wir, dass möglichst viele Funktionen Riemann-integrierbar sind. Im Gegensatz zur Differentiation können wir aber hier nicht direkt Regeln zum Beispiel für Produkt,
Quotient, Verkettung und Umkehrfunktion herleiten. Stattdessen müssen wir einen konzeptuellen Weg beschreiten, der auf folgenden drei Schritten beruht:
78
a) Stückweise konstante Funktionen (sogenannte Treppenfunktionen) sind integrierbar.
b) Läßt sich eine Funktion f gut“ durch integrierbare Funktionen approximieren, so ist
”
auch f integrierbar.
c) Stetige Funktionen lassen sich gut“ durch Treppenfunktionen approximieren, und sind
”
damit integrierbar.
Natürlich wird dabei unter anderem noch zu klären sein, was die gute Approximation“
”
eigentlich sein soll. Wir beginnen unser Programm, indem wir zunächst einige Eigenschaften
des Integrals zeigen.
Lemma 1.2 Sei f ∈ R(I) und fe : I → R. Es gebe endlich viele Punkte A = {a1 , . . . , ar } ⊂ I
Rb
Rb
mit fe(x) = f (x) für alle x ∈ I\A. Dann ist fe ∈ R(I) und es gilt a fe = a f .
Beweis: Wir zeigen die Aussage im Fall eines Ausnahmepunkts a1 ∈ I; der allgemeine Fall
folgt daraus per Induktion. Es gilt für jede Diskretisierung D
SD (fe) − SD (f ) =
N
X
k=1
(fe(ξk ) − f (ξk )) ∆xk =
N
X
k: ξk =a1
(fe(a1 ) − f (a1 )) ∆xk .
Es ist ξk = a1 höchstens für zwei k mit ∆xk > 0. Für eine Folge Dj mit ∆(Dj ) → 0 erhalten
wir
|SDj (fe) − S(f )| ≤ |SDj (fe) − SDj (f )| + |SDj (f ) − S(f )|
≤ 2|fe(a1 ) − f (a1 )|∆(Dj ) + |SD (f ) − S(f )|,
j
und die rechte Seite geht gegen Null mit ∆(Dj ) → 0.
Beispiel 1.2 In Lemma 1.2 lässt sich endlich“ nicht zu abzählbar unendlich“ verbessern.
”
”
Betrachte die Funktion
(
1 x∈Q
f : [0, 1] → R, f (x) =
0 sonst,
und die Unterteilung von [0, 1] in N Intervalle Ik gleicher Länge 1/N . Wählen wir irrationale
Stützstellen, so ist SD (f ) = 0; bei rationalen Stützstellen gilt aber SD (f ) = 1. Da wir dabei
die Feinheit beliebig klein machen können, ist f nicht Riemann-integrierbar.
Satz 1.2 Jede Riemann-integrierbare Funktion ist beschränkt.
Beweis: Es gibt ein δ > 0, so dass mit S = S(f ) gilt:
∆(D) < δ
⇒
1
|SD (f ) − S| < .
2
Wähle N ∈ N so dass ∆ := (b − a)/N < δ und betrachte die äquidistante Unterteilung
xk = a + k∆ fürk = 0, 1, . . . , N . Wir behaupten
|f (ξ)| ≤ max |f (xk )| +
1≤k≤N
79
1
∆
für alle ξ ∈ [a, b].
Für die gegebene Unterteilung sei D die Diskretisierung mit den Stützstellen xk für k =
1, . . . , N . Ist ξ ∈ I gegeben und ξ ∈ Ik , so betrachte außerdem die Diskretisierung D0 , bei der
die Stützstelle xk durch ξ ersetzt wird (ebenfalls zur äquidistanten Unterteilung). Es folgt
f (ξ) − f (xk ) ∆
1
⇒ |f (ξ)| ≤ |f (xk )| + |SD0 (f ) − SD (f )| .
{z
}
∆|
SD0 (f ) − SD (f ) =
<1
Die behauptete Abschätzung folgt.
Definition 1.3 (Supremumsnorm) Für eine beschränkte Funktion f : D → R setzen wir
kf kI = sup |f (x)|.
x∈I
Lemma 1.3 Sei D ⊂ R. Die Menge der beschränkten Funktionen
B(D) = {f : D → R : f ist beschränkt }
ist ein Vektorraum mit Norm k · kD , d. h. für f, g ∈ B(D) und α ∈ R gilt:
(1) kf kD ≥ 0, Gleichheit nur für f = 0.
(2) kαf kD = |α| kf kD .
(3) kf + gkD ≤ kf kD + kgkD (Dreiecksungleichung).
Beweis: Die Regel (2) folgt aus
sup |αf (x)| = sup (|α||f (x)|) = |α| sup |f (x)|.
x∈D
x∈D
x∈D
Weiter gilt für x ∈ D
|f (x) + g(x)| ≤ |f (x)| + |g(x)| ≤ sup |f (y)| + sup |g(y)| = kf kD + kgkD .
y∈D
y∈D
Daraus folgt
kf + gkD = sup |f (x) + g(x)| ≤ kf kD + kgkD .
x∈D
Die Vektorraumeigenschaft von B(D) ergibt sich aus (2) und (3).
Sei wieder I = [a, b] ein kompaktes Intervall. Nach Satz 1.1 und Satz 1.2 ist R(I) ⊂ B(I) ein
Untervektorraum; die Norm k · kI ist auf R(I) definiert.
Lemma 1.4 Sei I = I1 ∪. . .∪In eine Unterteilung von I = [a, b] in Intervalle Ik = [ak−1 , ak ].
Falls f auf jedem der Teilintervalle Ik integrierbar ist, so folgt f ∈ R(I) und
Z
a
b
f=
n Z
X
k=1
80
ak
ak−1
f.
Beweis: Der allgemeine Fall ergibt sich aus dem Fall n = 2 leicht durch Induktion über n
mit der Klammerung I = (I1 ∪ . . . ∪ In−1 ) ∪ In . Für n = 2 müssen wir zeigen, dass für jede
Folge SDj mit ∆(Dj ) → 0 gilt:
Z a1
Z a2
lim SDj (f ) =
f+
f =: S1 + S2 .
j→∞
a0
a1
Sei D eine beliebige Diskretisierung mit den Unterteilungspunkten bzw. Stützstellen
a0 = x0 ≤ x1 ≤ . . . ≤ xr−1 ≤ a1 < xr ≤ . . . ≤ xN = a2 , ξ1 , . . . , ξN .
Definiere dann die Diskretisierungen D1 von I1 und D2 von I2 wie folgt:
D1 :
Unterteilungspunkte a0 = x0 ≤ . . . ≤ xr−1 ≤ a1 ,
D2 :
Unterteilungspunkte a1 < xr ≤ . . . ≤ xN = a2 ,
Stützstellen ξ1 , . . . , ξr−1 , a1
Stützstellen a1 , ξr+1 , . . . , ξN .
Die Bilanz der Riemannschen Summen ergibt
|SD (f ) − (SD1 (f ) + SD2 (f ))| = |(f (ξr ) − f (a1 ))∆xr | ≤ 2 kf kI ∆(D).
Daraus folgt
|SD (f ) − (S1 + S2 )| ≤ |SD (f ) − (SD1 (f ) + SD2 (f ))| +|SD1 (f ) − S1 | + |SD2 (f ) − S2 |,
{z
}
|
≤2 kf kI ∆(D)
und die rechte Seite geht mit ∆(D) → 0 gegen Null.
Folgerung 1.1 Sei f : I → R eine Treppenfunktion, d. h. es gibt eine Unterteilung a = a0 <
a1 < . . . < an = b und ci ∈ R (i = 1, . . . , n) mit f (x) = ci für alle x ∈ (ai−1 , ai ). Dann ist f
integrierbar und es gilt
Z b
n
X
f=
(ai − ai−1 )ci .
a
i=1
Beweis: Nach Lemma 1.2 ist f : [ai−1 , ai ] → R integrierbar für alle i = 1, . . . , n. Aus Lemma
1.4 folgt die Behauptung.
Damit ist Schritt a) unseres Programms erledigt, wobei wir auch einige zusätzliche Informationen gewonnen haben. Jetzt wollen untersuchen, wie sich Integrierbarkeit und Integral
unter der Approximation von Funktionen verhalten. Ziel ist es, für einen geeigneten Begriff
von Konvergenz fk → f“ folgende Aussage zu zeigen:
”
Z b
Z b
fk → f mit fk integrierbar ⇒ f integrierbar und
f = lim
fk .
a
k→∞ a
Welcher Konvergenzbegriff ist dabei zu wählen? Betrachte zunächst die punktweise Konvergenz:
fk → f punktweise
⇔ fk (x) → f (x) für alle x ∈ I.
In der Vorlesung haben wir sehr oft Operationen zwischen Funktionen punktweise definiert,
zum Beispiel (f + g)(x) := f (x) + g(x). Aber hier ist die punktweise Definition nicht gut,
wie das folgende Beispiel zeigt:
81
Beispiel 1.3 Betrachte die Treppenfunktionen
fk : [0, 1] → R,
(
k
fk (x) =
0
für 0 < x <
sonst.
1
k
Dann gilt limk→∞ fk (x) = 0 für alle x ∈ [0, 1], denn
(
für alle k, falls x = 0
fk (x) = 0
für k ≥ x1 , falls x > 0.
Also konvergiert fk punktweise gegen die Nullfunktion f = 0. Aber es ist
Z 1
Z 1
1
0=
f 6= lim
fk = lim
· k = 1.
k→∞ 0
k→∞ k
0
Fazit: Der Begriff der punktweisen Konvergenz ist ungeeignet, weil das Integral i. a. nicht
approximiert wird. Es wird ein stärkerer Konvergenbegriff benötigt.
Definition 1.4 (Gleichmäßige Konvergenz) Sei D ⊂ R. Die Folge fk : D → R, k ∈ N,
konvergiert gleichmäßig gegen f : I → R, falls gilt:
kfk − f kI → 0
mit k → ∞.
Bei gleichmäßiger Konvergenz liegt der gesamte Graph der fk in einem ε-Streifen um den
Graph von f , wenn k groß genug ist. In Quantorensprache sieht der Unterschied von punktweiser Konvergenz und gleichmäßiger Konvergenz wie folgt aus:
∀ε > 0
∀ε > 0
∀x ∈ D
∃N
∃N
∀x ∈ D
∀k > N :
∀k > N :
|fk (x) − f (x)| < ε
|fk (x) − f (x)| < ε
(Punktweise Konvergenz),
(Gleichmäßige Konvergenz).
Der Unterschied ist, dass die Schranke N bei gleichmäßiger Konvergenz für alle x ∈ D gleich
gewählt werden kann, während sie bei nur punktweiser Konvergenz von x abhängen darf, das
heißt N = N (ε, x). Im Beispiel 1.3 gilt etwa, falls ε ≤ 1 und x > 0,
|fk (x) − f (x)| < ε
⇒
k≥
1
,
x
so dass N (x, ε) ≥ 1/x sein muss, also nicht unabhängig von x gewählt werden kann.
Es ist klar, dass aus gleichmäßiger Konvergenz die punktweise Konvergenz folgt, denn es gilt
ja
|fk (x) − f (x)| ≤ sup |fk (y) − f (y)| = kfk − f kD → 0 mit k → ∞.
y∈D
Wenn Sie deshalb prüfen wollen, ob eine gegebene Folge fk gleichmäßig konvergiert, so können
Sie wie folgt vorgehen:
• Sie untersuchen zuerst, ob die Folge punktweise konvergiert, das heißt ob für jedes feste
x der Grenzwert limk→∞ fk (x) existiert. Wenn nicht, so ist die Folge nicht gleichmäßig
konvergent.
82
• Wenn doch, so setzen Sie f (x) := limk→∞ fk (x) und berechnen die Norm kfk − f kD =
supx∈D |fk (x) − f (x)|, bzw. schätzen diese Norm ab. Gilt kfk − f kD → 0 mit k → ∞,
so ist die Folge gleichmäßig konvergent gegen f . Wenn nicht, so ist fk zwar punktweise,
aber nicht gleichmäßig konvergent.
Im Beispiel 1.3 gilt fk → f mit f = 0 punktweise auf [0, 1], aber nicht gleichmäßig. Es ist
nämlich
sup |fk (x) − f (x)| = k → ∞ mit k → ∞.
x∈[0,1]
Wir wollen nun untersuchen, wie sich das Integral mit diesem Konvergenzbegriff verträgt.
Satz 1.3 (Abschätzung des Integrals durch Supremumsnorm) Für f ∈ R(I) gilt die
Ungleichung
Z b
|
f | ≤ |b − a| kf kI .
a
Beweis: Für jede Diskretisierung gilt mit der Dreiecksungleichung
|
N
X
k=1
f (ξk )∆xk | ≤
N
X
|f (ξk )| ∆xk ≤ kf kI
k=1
N
X
∆xk = kf kI |b − a|,
k=1
das heißt
|SD (f )| ≤ kf kI |b − a|.
(1.2)
Rb
Wähle eine Folge Dj mit ∆(Dj ) → 0 und erhalte | a f | = limj→∞ |SDj (f )| ≤ kf kI |b − a|.
Satz 1.3 besagt, dass die lineare Abbildung
S : (R(I), k · kI ) → R, S(f ) =
Z
b
f
a
Lipschitzstetig bezüglich der Norm k · kI ist, denn es gilt
Z b
|S(f ) − S(g)| = |
(f − g)| ≤ kf − gkI |b − a|.
a
Die Lipschitzkonstante ist die Intervalllänge |b − a|. Insbesondere erhalten wir die Stetigkeit
der Abbildung bzgl. k · kI :
Z b
Z b
fk , f ∈ R(I), kfk − f kI → 0 mit k → ∞ ⇒
fk →
f,
a
a
Rb
Rb
denn | a fk − a f | ≤ kfk − f kI |b − a| → 0. Der nachfolgende Satz macht insofern eine
stärkere Aussage, als die Integrierbarkeit der Grenzfunktion nicht vorausgesetzt, sondern
bewiesen wird.
Satz 1.4 (Integral und gleichmäßige Konvergenz) Die Funktionenfolge fk ∈ R(I)
konvergiere gleichmäßig gegen f : I → R, also kfk − f kI → 0. Dann ist f ∈ R(I) und
es gilt
Z b
Z b
f = lim
fk .
a
k→∞ a
83
Beweis: Wir setzen Sk =
Rb
a
fk ∈ R.
Schritt 1 Der Grenzwert S := limk→∞ Sk existiert.
Die Folge Sk ist eine Cauchyfolge, denn wir haben
Z b
|Sk − Sl | = |
(fk − fl )| (Satz 1.1)
a
≤ |b − a| kfk − fl kI
(Satz 1.3)
< |b − a| (kfk − f kI + kf − fl kI )
(Dreiecksungleichung)
< ε
für k, l hinreichend groß.
Rb
Schritt 2 f ist integrierbar mit a f = S.
Sei ε > 0 gegeben. Wähle ein k ∈ N, so dass folgende beiden Aussagen gelten:
(i) |Sk − S| < ε/3 (nach Schritt 1),
(ii) |SD (f ) − SD (fk )| ≤ |b − a| kf − fk kI < ε/3 (nach Ungleichung (1.2)).
Für festes k mit (i) und (ii) gibt es nun ein δ > 0 mit |SD (fk ) − Sk | < ε/3 für jede Diskretisierung mit Feinheit ∆(D) < δ. Damit folgt
|SD (f ) − S| ≤ |SD (f ) − SD (fk )| + |SD (fk ) − Sk | + |Sk − S| < ε.
|
{z
} |
{z
} | {z }
<ε/3
<ε/3
<ε/3
Damit ist auch Schritt b) unseres Programms abgeschlossen. Um zu zeigen, dass stetige Funktionen auf I = [a, b] integrierbar sind, müsses wir jetzt noch nachweisen, dass sie gleichmäßig
durch Treppenfunktionen approximiert werden können.
Lemma 1.5 Sei I = [a, b] kompaktes Intervall und f : I → R stetig. Dann ist f gleichmäßig
stetig, d. h. zu ε > 0 gibt es ein δ > 0, so dass gilt:
x, x0 ∈ I,
|x − x0 | < δ
⇒
|f (x) − f (x0 )| < ε.
(1.3)
Beweis.
Angenommen, die Behauptung ist falsch. Für ein ε > 0 gibt es dann Punkte
0
xn , xn ∈ I, so dass gilt:
|xn − x0n | → 0, aber |f (xn ) − f (x0n )| ≥ ε.
Da I kompakt, können wir nach Übergang zu einer Teilfolge und Umnumerierung annehmen,
dass die Folge (xn ) gegen ein x0 ∈ I konvergiert. Es folgt limn→∞ x0n = x0 , denn
|x0n − x0 | ≤ |x0n − xn | + |xn − x0 | → 0
mit n → ∞.
Da f stetig, folgt weiter
ε ≤ lim |f (xn ) − f (x0n )| = |f (x0 ) − f (x0 )| = 0,
n→∞
ein Widerspruch.
84
Beispiel 1.4 Ist f : D → R stetig, aber D nicht kompakt, so muss f nicht gleichmäßig stetig
sein. Betrachte zum Beispiel
1
f : (0, ] → R,
π
Dann gilt für xn =
1
f (x) = sin .
x
1
1
, x0n =
mit n ∈ N
2nπ
π/2 + 2nπ
|xn − x0n | =
π/2
1
≤ 2 → 0,
2nπ(π/2 + 2nπ)
8n π
aber |f (xn ) − f (x0n )| = 1 für alle n.
Satz 1.5 (C 0 (I) ⊂ R(I)) Sei I = [a, b] ein kompaktes Intervall. Dann ist jede stetige Funktion f : I → R Riemann-integrierbar.
Beweis: Zu ε > 0 konstruieren wir eine Treppenfunktion g : I → R mit kf − gkI ≤ ε. Die
Behauptung ergibt sich dann aus Folgerung 1.1 und Satz 1.4. Nach Lemma 1.5 gibt es ein
δ > 0, so dass gilt:
x, x0 ∈ I,
|x − x0 | < δ
⇒
|f (x) − f (x0 )| < ε.
Sei D eine beliebige Diskretisierung mit Feinheit ∆(D) < δ. Definiere die Treppenfunktion
(
f (ξk ) für x ∈ [xk−1 , xk )
g(x) =
f (ξN ) für x = xN .
Für x ∈ I gilt x ∈ [xk−1 , xk ) für ein k ∈ {1, . . . , N } (bzw. evtl. x = xN ). Dann folgt
|x − ξk | ≤ ∆xk < δ, und somit |f (x) − g(x)| = |f (x) − f (ξk )| < ε nach Wahl von δ > 0. Also
folgt kf − gkI ≤ ε, ws zu zeigen war.
Definition 1.5 (Stückweise Stetigkeit) Eine Funktion f : [a, b] → R heißt stückweise
stetig, wenn es eine Unterteilung a = a0 < . . . < aN = b gibt, so dass gilt:
• f |(aj−1 ,aj ) ist stetig für alle j = 1, . . . , N ;
• in den aj existieren die links- bzw.
limx&aj f (x).
rechtsseitigen Grenzwerte limx%aj f (x) bzw.
Aus Satz 1.5 und Lemma 1.4 ergibt sich die folgende, nützliche Verschärfung von Satz 1.5.
Folgerung 1.2 Stückweise stetige Funktionen sind Riemann-integrierbar.
Satz 1.6 (Monotonie des Integrals) Sind f, g ∈ R(I), so gilt:
Z b
Z b
f ≤g ⇒
f≤
g.
a
(1.4)
a
Insbesondere gilt, falls f , |f | ∈ R(I)
Z
b
f≤
Z
a
a
85
b
|f |.
(1.5)
Beweis: Für jede Diskretisierung D gilt
SD (f ) =
N
X
f (ξk )∆xk ≤
k=1
N
X
g(ξk )∆xk = SD (g).
k=1
Durch Wahl einer Folge Dj mit ∆(Dj ) → 0 folgt die Behauptung durch Grenzübergang.
Folgerung 1.3 (Mittelwertsatz der Integralrechnung) Seien f, ϕ : [a, b] → R stetig
und ϕ ≥ 0. Dann gibt es ein ξ ∈ [a, b] mit
Z b
Z b
f ϕ = f (ξ)
ϕ.
a
⇒
Spezialfall: ϕ = 1
Rb
a
a
f = f (ξ)(b − a).
Beweis: Setze m = inf x∈I f (x), M = supx∈I f (x). Dann gilt
mϕ ≤ f ϕ ≤ M ϕ
Z b
Z b
b
⇒m
ϕ ≤
fϕ ≤ M
ϕ
a
a
a
Z b
Z b
⇒
fϕ = µ
ϕ für ein µ ∈ [m, M ].
Z
a
a
Nach dem Zwischenwertsatz gibt es ein ξ ∈ [a, b] mit f (ξ) = µ.
2
Ableitung und Integral
Wir kommen nun zu dem zentralen, von Newton und Leibniz studierten Zusammenhang zwischen Differentiation und Integration. Vorher erweitern wir noch die Definition des Integrals,
indem wir für f ∈ R([a, b]) setzen:
Z a
Z b
Z a
f := −
f und
f = 0.
b
a
a
Mit Lemma 1.4 folgt daraus
b
Z
f+
a
c
Z
f=
b
Z
c
f,
(2.1)
a
falls f auf allen beteiligten Intervallen Riemann-integrierbar ist.
Bemerkung. Im Folgenden verwenden wir die Notation
Z b
Z b
f=
f (x) dx.
a
a
Dies ist vor allem dann nützlich, wenn die Funktion f außer von x noch von weiteren Größen
(Variablen) y, z, . . . abhängt: durch das Anhängsel dx“ wird definiert, bzgl. welcher Varia”
blen integriert werden soll. Zum Beispiel gilt
Z b
Z b
f (x) − y dx =
f (x) dx − y(b − a), aber
a
a
Z b
Z b
y dy.
f (x) − y) dy = f (x)(b − a) −
a
a
86
Der nachfolgende Satz löst das in Kapitel 3, Abschnitt 2 formulierte Problem, eine Stammfunktion zu finden, also ein Lösung der Differentialgleichung F 0 = f .
Satz 2.1 (Hauptsatz der Differential- und Integralrechnung) Sei f : I = [a, b] → R
stetig. Für jedes x0 ∈ I ist die Funktion
Z x
F : I → R, F (x) =
f (ξ) dξ
x0
eine Stammfunktion von f : F 0 (x) = f (x)
∀x ∈ I.
Bemerkung. In den Endpunkten des Intervalls ist dies im Sinne der einseitigen Ableitungen
F+0 (a) = f (a) bzw. F−0 (b) = f (b) zu verstehen.
Beweis: Die Funktion F ist wohldefiniert nach Satz 1.5. Wir berechnen
Z
Z x
F (x + h) − F (x)
1 x+h
− f (x) =
f (ξ) dξ −
f (ξ) dξ − hf (x)
h
|h| x0
x0
Z
1 x+h
=
f (ξ) − f (x) dξ |h| x
≤
1
|h|
|h|
sup
|f (ξ) − f (x)| (Satz 1.3).
|ξ−x|≤|h|
Da f im Punkt x stetig ist, geht die rechte Seite mit h → 0 gegen Null.
Folgerung 2.1 Sei f ∈ C 0 (I) mit I = [a, b], und F : [a, b] → R sei eine Stammfunktion von
f auf I, das heißt F 0 (x) = f (x) für alle x ∈ [a, b] 1 . Dann gilt für jedes x0 ∈ I
Z x
F (x) = F (x0 ) +
f (ξ) dξ.
(2.2)
x0
Beweis: Nach Folgerung 2.2 in Kapitel 3 und Satz 2.1 gibt es ein c ∈ R mit
Z x
F (x) = c +
f (ξ) dξ für alle x ∈ (a, b).
x0
Weiter ist jede Stammfunktion F von f auf [a, b] stetig in a und b nach Kapitel 3, Satz 1.1.
Durch Grenzübergang x & a bzw. x % b folgt
Z a
Z b
F (a) = c +
f (ξ)dξ, F (b) = c +
f (ξ) dξ.
x0
x0
Setze nun x = x0 und erhalte F (x0 ) = c.
Folgerung 2.2 (Berechnung von bestimmten Integralen mit einer Stammfunktion)
Die Funktion F : I = [a, b] → R sei Stammfunktion von f ∈ C 0 (I) auf I. Dann gilt
Z b
x=b
f (x) dx = F (b) − F (a) =: F (x) x=a
a
1
In den Intervallgrenzen bedeutet das F+0 (a) = f (a) bzw. F−0 (b) = f (b).
87
Beweis: Folgt aus (2.2) mit x0 = a, x = b.
Über den Hauptsatz bzw. Folgerung 2.2 lassen sich Differentiationsregeln aus Kapitel 3.1 in
Integrationsregeln übersetzen“. Dies wird im Folgenden durchgeführt.
”
Satz 2.2 (Partielle Integration) Seien f, g ∈ C 1 (I) mit I = [a, b]. Dann gilt
Z b
Z b
x=b
0
f 0 g.
f g = f (x) g(x) x=a −
a
a
Beweis: Es gilt nach der Produktregel
(f g)0 = f 0 g + f g 0
auf I = [a, b].
Folgerung 2.2 liefert die Behauptung.
Satz 2.3 (Substitutions- oder Transformationsregel) Sei I = [a, b], I ∗ = [α, β] und
ϕ ∈ C 1 (I ∗ ) mit ϕ(I ∗ ) ⊂ I. Dann gilt für f ∈ C 0 (I)
Z ϕ(β)
Z β
f (x) dx =
f ϕ(s) ϕ0 (s) ds.
ϕ(α)
α
Beweis: Wähle nach Satz 2.1 eine Stammfunktion F ∈ C 1 (I) von f . Dann gilt
Z ϕ(β)
x=ϕ(β)
f (x) dx = F (x) x=ϕ(α) (Folgerung 2.2)
ϕ(α)
s=β
F ϕ(s) s=α
Z β
=
(F ◦ ϕ)0 (s) ds (Folgerung 2.2)
α
Z β
=
F 0 ϕ(s) ϕ0 (s) ds (Kettenregel)
α
Z β
=
f ϕ(s) ϕ0 (s) ds.
=
α
Für die Anwendung
R b der Substitutionsregel ist folgendes Kochrezept nützlich: bei einem gegebenen Integral a f (y) dy möchten wir y = y(x) substituieren. Dazu berechnen wir
y = y(x)
dy = y 0 (x) dx.
⇒
Zur Umrechnung der Intervallgrenzen bestimmen wir die Umkehrfunktion ( Auflösen nach
”
x“)
x = x(y) ⇒ α = x(a), β = x(b).
Damit gilt
Z
a
b
f (x) dx =
b
Z
a
f y(x) y 0 (x) dx.
Im folgenden zeigen wir an einigen Beispielen, wie die Integrationsregeln angewandt werden.
Zunächst erhalten wir direkte Integrationsformeln immer dann, wenn die Stammfunktion
bekannt ist:
88
Beispiel 2.1 (Bekannte Ableitungsregeln und zugehörige Integrationsregeln)
α+1 x=b
Z b
x
α
x dx =
(α ∈ R\{−1}, a, b > 0)
α
+ 1 x=a
a
Z b
x=b
dx
= log x x=a , (a, b > 0)
a x
Z b
x=b
dx
= arctan x x=a , (a, b ∈ R).
2
a 1+x
Ein Beispiel für die Anwendung der partiellen Integration ist
Beispiel 2.2
x
Z
log u du =
1
Z
x
1 · log u du
1
=
u=x
u log u u=1 −
x
Z
1
u du
u
1
= x log x − (x − 1).
Eine schöne Anwendung von Satz 2.2 ist
Beispiel 2.3 (Wallis-Produkt) Wir berechnen hier An =
A0 = π/2
R π/2
0
sinn x dx. Offenbar gilt
x=π/2
und A1 = − cos x x=0 = 1.
Für n ≥ 1 leiten wir durch partielle Integration eine Rekursionsformel her:
Z π/2
An+1 =
sin x sinn x dx
0
=
n
−
| cos x
{zsin x}
= n
Z
=0
π/2
x=π/2
x=0
+n
sinn−1 x dx − n
Z
π/2
cos2 x sinn−1 x dx
0
Z
0
π/2
sinn+1 x dx,
0
wobei wir cos2 x = 1 − sin2 x benutzt haben. Es folgt
An+1 =
n
An−1
n+1
(n ≥ 1).
Durch Induktion erhalten wir
A2n =
A2n+1 =
Es folgt weiter
2n − 1 2n − 3
1
·
· . . . · · A0 =
2n
2n − 2
2
2n
2n − 2
2
·
· . . . · · A1 =
2n + 1 2n − 1
3
n
A2n
π Y 4k 2 − 1
= ·
.
A2n+1
2
4k 2
k=1
89
n
Y
2k − 1
2k
k=1
n
Y
k=1
2k
2k + 1
!
!
π
,
2
1.
Nun gilt An+1 =
R π/2
0
sinn+1 x dx ≤
1≤
R π/2
0
sinn x dx = An , und es folgt
An
An−1
n+1
≤
=
−→ 1.
An+1
An+1
n
Daraus ergibt sich die Produktdarstellung von Wallis
∞
Y
π
4k 2
2·2 4·4
=
=
·
· ...
2
2
4k − 1
1·3 3·5
k=1
Als nächstes behandeln wir Beispiele zur Substitutionsregel.
0
Beispiel 2.4 (Lineare Parameterwechsel) Mit der Substitution y = x−x
m haben wir dy =
1
m dx und x = x0 + my, also als neue Grenzen α = x0 + ma und β = x0 + mb. Es folgt die
Regel
Z x0 +mb
Z b
1
x − x0
f (y) dy =
f(
) dx.
m
m
a
x0 +ma
Beispiel 2.5 (Integration von
Z b 0
f (x)
dx
(x)
Za b fp
u 1 + u2 du
Za b
F 0 f (x) f 0 (x) dx
a
Ableitungen)
Z b
x=b
=
(log f )0 (x) dx = log f (x) x=a (f > 0),
aZ
u=b
1
3 0
3
1 b
=
(1 + u2 ) 2 du = (1 + u2 ) 2
.
3 a
3
u=a
x=b
= F f (x) x=a .
Beispiel
2.6 (Flächeninhalt unter Hyperbel) Zu berechnen ist das Integral A(x) =
Rx√
2
u − 1 du. Wir substituieren u = cosh t und erhalten du = sinh t dt, t = Arcosh u,
1
also
Z Arcosh x
A(x) =
sinh2 t dt
0
Z
1 Arcosh x 2t
=
(e + e−2t − 2) dt
4 0
t=Arcosh x
1
1 2t
−2t
− Arcosh x
=
(e − e )
8
2
t=0
(
)
t=Arcosh x
1
et + e−t et − e−t
=
− Arcosh x
2
2
2
t=0
1 p 2
=
x x − 1 − Arcosh x .
2
Für rationale Funktionen, also Quotienten von Polynomen, hat man ein spezielles Integrationsverfahren, die Partialbruchzerlegung, die wir hier nur an einem Beispiel vorführen:
Beispiel 2.7 (Partialbruchzerlegung) Um das Integral
wir den Ansatz
R 1/2
dx
−1/2 1−x2
zu berechnen, machen
1
1
A
B
(A − B)x + (A + B)
!
=
=
+
=
.
2
1−x
(1 + x)(1 − x)
1−x 1+x
1 − x2
90
Der Koeffizientenvergleich ergibt A = B = 1/2, also folgt
Z 1/2
Z 1/2 1
1/2
1/2
=
+
dx
2
1+x
−1/2 1 − x
−1/2 1 − x
1 + x x=1/2
= 1/2 · log
1 − x x=−1/2
= 1/2 · (log 3 − log 1/3)
= log 3.
Als wichtige Anwendung des Hauptsatzes wollen wir nun den Existenzbeweis für die
gleichförmige Kreisbewegung führen.
Satz 2.4 (Kapitel 3, Satz 3.2) Für gegebenes z0 ∈ C hat das Anfangswertproblem
c0 = ic auf R,
c(0) = z0
(2.3)
eine Lösung c : R → C.
Beweis: In den ersten beiden Schritten wird der Beweis auf das wesentliche Problem reduziert, das dann in Schritt 3 gelöst wird.
Schritt 1: Es reicht, den Fall z0 = 1 zu betrachten.
Ist nämlich c(t) die Lösung für z0 = 1, so ist c̃(t) = z0 c(t) die Lösung zu gegebenem z0 ∈ C.
Schritt 2: Es reicht, eine Lösung c : (−α, α) → C von (2.3) für z0 = 1 zu finden mit
limt%α c(t) = i und limt&−α c(t) = −i.
Wir setzen diese Lösung dann in drei Schritten (a),(b) und (c) auf ganz R fort:
(a) c(α) = i, c(−α) = −i.
Nach Voraussetzung ist c dann stetig auf [−α, α].
(b) c(t) = −c(t − 2α) für t ∈ [α, 3α].
Dann ist c stetig in α, da −c(−α) = −(−i) = i. Weiter gilt für t ∈ (α, 3α) die
Differentialgleichung, denn
c0 (t) = −c0 (t − 2α) = −i c(t − 2α) = i c(t).
Ferner haben wir limt→α c0 (t) = limt→α ic(t) = −1 ∈ C. Nach Übungsaufgabe 1, Serie
12, folgt c0 (α) = −1 = i c(α), das heißt die Differentialgleichung gilt auf (−α, 3α).
Außerdem ist c stetig auf [α, 3α] mit c(3α) = −c(α) = −i = c(−α).
(c) c(t + 4kα) = c(t) für t ∈ [−α, 3α] und k ∈ Z (4α-periodische Fortsetzung).
Dann folgt die Lösungseigenschaft auf ganz R analog zu (b).
Schritt 3: Konstruktion der Lösung c : (−α, α) → C für z0 = 1.
Definiere mit Satz 1.5 die Funktion
Z y
ds
√
ψ : (−1, 1) → R, ψ(y) =
.
1 − s2
0
91
Ry
Ry
Für y ≥ 0 gilt 0 (1 − s2 )−1/2 ds ≤ 0 (1 − s)−1/2 ds = [−2(1 − s)1/2 ]s=y
s=0 ≤ 2. Also existiert
der Grenzwert α := limy%1 ψ(y) ∈ (0, 2]. Da ψ(−y) = −ψ(y), folgt limy&1 ψ(y) = −α.
Betrachte nun mit Satz 3.2 in Kapitel 2 die Umkehrfunktion ϕ : (−α, α) → (−1, 1). Aus dem
Hauptsatz der Differential- und Integralrechnung sowie aus dem Satz über die Ableitung der
Umkehrfunktion, Satz 1.4 in Kapitel 3, ergibt sich
p
1
= 1 − ϕ2 (t).
ϕ0 (t) = 0
ψ (ϕ(t))
Weiter gilt, wieder nach Satz 3.2 in Kapitel 2, limt%α ϕ(t) = 1 und limt&−α ϕ(t) = −1. Sei
nun c̃ : (−1, 1) → C die Parametrisierung des Halbkreises {x + iy : x2 + y 2 = 1, x > 0} als
Graph über der y-Achse, das heißt
p
c̃(y) = 1 − y 2 + iy, y ∈ (−1, 1).
Wir behaupten, dass die Umparametrisierung
c = c̃ ◦ ϕ : (−α, α) → C, c(t) =
p
1 − ϕ(t)2 + iϕ(t)
die gesuchte Lösung von (2.3) ist. Denn es gilt
ϕϕ0
c0 = − p
1 − ϕ2
p
p
+ iϕ0 = −ϕ + i 1 − ϕ2 = i( 1 − ϕ2 + iϕ) = ic.
Da ϕ(0) = 0, ist außerdem c(0) = 1. Schließlich haben wir limt%α c(t) = limy%1 c̃(y) = i und
limt&−α c(t) = limy&−1 c̃(y) = −i. Also ist c die gesuchte Lösung.
Als Ansatz für den obigen Beweis sucht man eine Umparametrisierung
c = c̃ ◦ ϕ, so dass
p
0 =
2 lösen muss. Für
c0 = ic gilt. Als Bedingung ergibt sich, dass ϕ die Gleichung
ϕ
1
−
ϕ
p
0
2
die Umkehrfunktion ψ von ϕ ergibt sich daraus ψ (y) = 1/ 1 − y . Nun kann man wie oben
mit dem Beweis loslegen.
Bei der Definition des Riemannschen Integrals ist das Definitionsintervall I = [a, b] nach
Voraussetzung kompakt. Wir wollen nun kurz erläutern, wie auch unendliche Integrationsintervalle −∞ ≤ a < b ≤ ∞ und in den Intervallgrenzen unbeschränkte Funktionen im Rahmen
des Riemann-Integrals behandelt werden können.
Definition 2.1 Sei I = (a, b) mit −∞ ≤ a < b ≤ ∞. Die Funktion f : I → R sei Riemannintegrierbar
R c auf jedem kompakten
R b Teilintervall J ⊂ I. Falls für ein cR∈b I die Grenzwerte
limα&a α f (ξ) dξ und limβ%b c f (ξ) dξ existieren, so heißt das Integral a f (ξ) dξ konvergent
Rb
(bzw. a f (ξ) dξ existiert) und wir setzen
Z b
Z c
Z β
f (ξ) dξ = lim
f (ξ) dξ + lim
f (ξ) dξ.
α&a α
a
β%b c
Diese Definition ist unabhängig von der Wahl von c ∈ R, denn es gilt
Z ec
Z c
Z ec
f (ξ) dξ =
f (ξ) dξ +
f (ξ) dξ,
Z
α
β
e
c
α
β
f (ξ) dξ =
Z
c
f (ξ) dξ −
c
Z
c
92
e
c
f (ξ) dξ.
Beispiel 2.8

α+1 x=R

1
x

∞
=−
limR→∞
α
x dx =
α + 1 x=1
α+1

1
divergent


Z 1
für
divergent
α+1 x=1
α
x dx =
x
1

=
für
0
limε→0
α + 1 x=ε
α+1
Z ∞
xα dx = divergent für alle α ∈ R.
Z
für α < −1,
für α ≥ −1.
α ≤ −1,
α > −1.
0
Z
∞
−∞
dx
1 + x2
=
lim
Z
R→∞ 0
R
dx
+ lim
1 + x2 R→∞
Z
0
dx
1 + x2
−R
lim (arctan R) − lim arctan(−R)
R→∞
R→∞
π π
− −
= π.
=
2
2
=
93
Kapitel 5
Approximation von Funktionen
durch Reihen
Zur Motivation betrachten wir für eine gesuchte Funktion f : R → C das Anfangswertproblem
f 0 = λf,
für λ ∈ C.
f (0) = 1
Die Lösung ist uns bereits bekannt: nach Folgerung 3.4 in Kapitel 3 ist die eindeutig bestimmte Lösung dieses Anfangswertproblems die Funktion f (x) = eλx . Wir wollen aber
hier einen anderen, von Satz 2.4 in Kapitel 4 unabhängigen Lösungszugang entwickeln. Und
zwar wollen wir zunächst versuchen, die Gleichung näherungsweise zu lösen, indem wir einen
Ansatz der Form
n
X
fn (x) = a0 + a1 x + . . . + an xn =
ak xk
k=0
mit einem Polynom n-ten Grades fn machen. Wir berechnen
fn0 (x) = a1 + 2a2 x + . . . + n an xn−1 =
n
X
k ak xk−1 =
k=1
sowie
λ fn (x) =
n
X
n−1
X
(k + 1) ak+1 xk
k=0
λ ak xk .
k=0
Es gilt also
fn0
− λfn =
n−1
X
((k + 1) ak+1 − λak )xk − λan xn ,
fn (0) = a0 .
k=0
Wie vorhergesehen, ist das Anfangswertproblem auf diese Weise nicht exakt lösbar. Aber die
ak können so gewählt werden, dass fn die Gleichung bis auf einen Term der Ordnung xn löst.
Und zwar setzen wir
a0 = 1
(Anfangsbedingung), ak+1 =
95
λ
ak
k+1
für k = 0, 1, . . . , n − 1.
Dies ergibt ak =
λk
für k = 0, 1, . . . , n. Die Näherungslösung ist also die Summe
k!
fn (x) =
n
X
(λx)k
k=0
k!
,
und sie erfüllt fn0 − λfn = −λn+1 xn /n!. Es stellt sich die Frage, ob diese Näherungslösungen
fn mit n → ∞ gegen die tatsächliche Lösung f des Anfangswertproblems konvergieren. Wenn
ja, so folgt die Reihendarstellung
∞
X
(λx)k
eλx =
.
k!
k=0
Im Folgenden soll die Konvergenz von solchen unendlichen Reihen untersucht werden.
1
Reihen von reellen und komplexen Zahlen
Definition 1.1 Eine Folge (Sn )n∈N0 heißt (unendliche) Reihe mit Gliedern an ∈ C, falls
gilt:
n
X
Sn =
ak für alle n ∈ N0 .
k=0
Die Reihe heißt konvergent mit Wert S ∈ R, wenn die Folge (Sn )n∈N0 gegen S konvergiert:
∞
X
ak := lim
k=0
n→∞
n
X
an = lim Sn = S.
k=0
n→∞
Die Zahl Sn wird auch als n-te Partialsumme der Reihe bezeichnet. Oft wird die Reihe in der
Form a0 + a1 + a2 + . . . durch ihre ersten Glieder angegeben. Leider ist es auch üblich,
P die
Reihe selbst - unabhängig von der Frage der Konvergenz - ebenfalls mit dem Symbol ∞
k=0 ak
zu bezeichnen.
1
1
1
Beispiel 1.1 Die Reihe 1·2
+ 2·3
+ 3·4
+ . . . wird auch mit
ist jeweils die Folge (Sn )n∈N mit den Gliedern
S1 =
1
,
1·2
S2 =
1
1
2
+
= ,
1·2 2·3
3
S3 =
P∞
1
k=1 k(k+1)
bezeichnet. Gemeint
1
1
1
3
+
+
= ,...
1·2 2·3 3·4
4
Allgemein gilt
n X
1
X
n
n+1
1
1
1 X1
Sn =
−
=
−
=1−
.
k k+1
k
k
n+1
k=1
k=1
k=2
P∞
1
Also ist die Reihe konvergent mit Wert k=1 k(k+1) = 1.
P
Jede beliebige Folge (Sn )n∈N0 läßt sich als Reihe ∞
n=0 an schreiben. Wir müssen nur a0 = S0
und an = Sn − Sn−1 für n ≥ 1 setzen. Die oben benutzte, mit dem Index Null statt mit Eins
beginnende Numerierung tritt öfter auf. Es stellen sich nun zwei Fragen:
• Wie kann ich den Gliedern an der Reihe ansehen, ob die Reihe konvergiert bzw. divergiert?
96
• Im Fall der Konvergenz: welchen Wert hat die Reihe?
√
Bei der zweiten Frage ist zum Beispiel gemeint, ob eine bereits definierte Zahl wie 2, e,
π, . . . als Grenzwert einer Reihe dargestellt werden kann. Im Folgenden steht aber die erste
Frage im Zentrum des Interesses. Dabei ist das nächste Beispiel fundamental.
Beispiel 1.2 (Geometrische Reihe) Für die geometrische Reihe
mit z ∈ C gilt:
|z| < 1 ⇒ konvergent mit Wert
P∞
k=0 z
k
= 1+z+z 2 +. . .
1
,
1−z
|z| ≥ 1 ⇒ divergent.
Denn für |z| < 1 folgt aus der Formel für die geometrische Summe (Kapitel 1, Satz 2.2)
n
X
zk =
k=0
Dagegen gilt für |z| ≥ 1 mit Sn =
Pn
1 − z n+1
1
−→
.
1−z
1−z
k=0 z
k
|Sn+1 − Sn | = |z n+1 | = |z|n+1 ≥ 1,
so dass (Sn )n∈N keine Cauchyfolge sein kann.
P
1
1
1
Beispiel 1.3 (Harmonische Reihe) Die harmonische Reihe ∞
k=1 k = 1 + 2 + 3 + . . . ist
bestimmt divergent gegen +∞. Dies zeigen wir durch Vergleich mit einem Integral:
Betrachte die Treppenfunktion f : [1, ∞) → R mit
f (x) =
Es gilt f (x) ≥
1
x
1
k
für k ≤ x < k + 1
(k ∈ N).
für alle x ∈ [1, ∞), also
Z n+1
Z n+1
n
X
dx
1
=
f (x) dx ≥
= log(n + 1) → ∞
k
x
1
1
k=1
mit n → ∞, was zu zeigen war. Alternativ folgt die Divergenz der harmonischen Reihe,
indem wir in den Partialsummen wie folgt Klammern setzen:
1
1 1
1 1 1 1
1 1
1
+
+
+
+...
+
+ + +
+ + ... +
1
2 3
4 5 6 7
8 9
15
| {z } | {z } |
{z
} |
{z
}
≥1/2
≥1/2
≥1/2
≥1/2
In den Klammern werden jeweils die Zahlen k1 für 2m−1 ≤ k < 2m summiert für m ∈ N;
damit ist jede Klammer größer als 2m−1 · 2−m = 21 .
Beispiel 1.4 (Unendliche Dezimalbr
üche) Ist (nk )k∈N eine Folge von Ziffern nk ∈
P∞
{0, 1, . . . , q}, so ist die Reihe k=1 nk 10−k konvergent, vgl. Kapitel 1, Satz 4.2.
Wir beginnen die allgemeine Diskussion der Konvergenzfrage damit, dass wir die bekannten
Aussagen für Folgen in der Situation von Reihen reformulieren.
97
P∞
Lemma 1.1 (Konvergenzkriterium von Cauchy) Eine Reihe
k=0 ak
dann und nur dann, wenn es zu jedem ε > 0 ein N ∈ R gibt, so dass gilt:
m≥n>N
⇒
|
m
X
konvergiert
ak | < ε.
k=n
Beweis: Kapitel 1, Satz 4.1.
Satz 1.1 (Nullfolgentest) Wenn die Glieder ak einer Reihe
gegen Null gehen, so ist die Reihe divergent.
P∞
k=0 ak
mit k → ∞ nicht
Beweis:
Ist die Reihe konvergent, mit anderen Worten die Folge der Partialsummen Sn =
Pn
k=0 ak konvergent, so folgt an = Sn − Sn−1 → 0 mit n → ∞.
P∞
Lemma 1.2 (Reihen mit Gliedern ak ≥ 0) Eine reelle Reihe
k mit ak ≥ 0 für
k=0 a
P
alle k konvergiert genau dann, wenn die Folge der Partialsummen Sn = nk=0 ak nach oben
beschränkt ist.
Beweis: Da ak ≥ 0, ist die Folge (Sn ) monoton wachsend. Die Behauptung folgt aus Kapitel
1, Satz 4.3 und Satz 3.2.
Beispiel 1.5 Für s > 1 ist die Reihe
tion f : [1, ∞) → R mit
f (x) =
Da f (x) ≤
P∞
1
k=1 ks
1
(k + 1)s
konvergent. Betrachte dazu die Treppenfunk-
für k ≤ x < k + 1
(k ∈ N).
1
für alle x ∈ [1, ∞), folgt
xs
n
X
1
ks
= 1+
Z
n
f (x) dx
1
k=1
Z
n
dx
xs
1
x=n
1
1−s
= 1+
x
1−s
x=1
s
≤
.
s−1
≤ 1+
Also ist die Folge der Partialsummen beschränkt.
P∞
Definition
1.2
Die
Reihe
ak mit ak ∈ C heißt absolut konvergent, wenn die Reihe
k=0P
P∞
∞
k=0 |ak | konvergiert, das heißt
k=0 |ak | < ∞.
Lemma 1.3 (absolut konvergent ⇒ konvergent) Wenn die Reihe
vergiert, so ist sie konvergent.
98
P∞
k=0 ak
absolut kon-
Beweis: Sei ε > 0 gegeben. Nach Voraussetzung und dem Cauchykriterium, Lemma 1.1,
gibt es ein N ∈ R mit
m≥n>N
⇒
m
X
|ak | < ε
k=n
⇒
m
X
ak < ε.
k=n
Aus Lemma 1.1 folgt die Behauptung.
P
(−1)k−1
Beispiel 1.6 Die Reihe ∞
= 1 − 12 + 13 − . . . ist konvergent, aber nicht absolut
k=1
k
konvergent. Um die Konvergenz zu zeigen, betrachten wir getrennt die Folge der geraden bzw.
der ungeraden Partialsummen. Es gilt
1
1
+
> 0,
2n 2n − 1
1
1
−
< 0.
2n + 1 2n
S2n − S2n−2 = −
S2n+1 − S2n−1 =
Die Folge (S2n )n∈N ist also monoton wachsend, die Folge (S2n−1 )n∈N monoton fallend. Weiter
gilt für alle n ∈ N
1
S2n−1 − S2n =
> 0,
2n
und es folgt S2n ≤ S2n−1 ≤ S1 sowie S2n−1 ≥ S2n ≥ S2 . Nach Satz 4.3 in Kapitel 1 sind
somit beide Folgen (S2n ) und (S2n−1 ) konvergent. Wegen S2n−1 − S2n → 0 mit n → ∞ sind
die beiden Grenzwerte gleich und die gesamte Reihe (SP
k )k∈N konvergiert. Andererseits ist die
1
Reihe der Absolutbeträge aber die harmonische Reihe ∞
k=0 k , und diese ist nicht konvergent
nach Beispiel 1.3.
Der folgende Satz fasst die wesentlichen Kriterien für die absolute Konvergenz von Reihen
zusammen.
P
Satz 1.2 (Tests für absolute Konvergenz)PSei ∞
k=0 ak eine Reihe mit ak ∈ C. Ist eine
der drei folgenden Bedingungen erfüllt, so ist ∞
a
k=0 k absolut konvergent:
(a) Majorantenkriterium (Weierstraß M-Test)
P
Es gilt |ak | ≤ ck ∈ [0, ∞) mit ∞
k=0 ck < ∞.
(b) Quotientenkriterium
Es gibt ein θ ∈ [0, 1) und ein k0 ∈ N mit
|ak+1 |
|ak |
≤ θ für k ≥ k0 (ak 6= 0 für k ≥ k0 ).
(c) Wurzelkriterium
Es gibt ein θ ∈ [0, 1) und ein k0 ∈ N mit
p
k
|ak | ≤ θ für alle k ≥ k0 .
Umgekehrt ist die Reihe divergent, wenn gilt:
p
|ak+1 |
≥ 1 oder k |ak | ≥ 1 für k ≥ k0 .
|ak |
99
Bemerkung. In (b) oder (c) reicht es nicht, nur die Abschätzung
zu haben. Zum Beispiel gilt für
|ak+1 |
<1
|ak |
P∞ 1
bzw.
p
k
|ak | < 1
k=1 k
|ak+1 |
k
< 1,
=
|ak |
k+1
p
k
1
|ak | = √
<1
k
k
für alle k,
trotzdem ist die Reihe nicht konvergent (Beispiel 1.3).
Beweis des Satzes: Aussage (a) folgt aus Lemma 1.2, angewandt auf
Lemma 1.3. Voraussetzung (b) liefert per Induktion
|ak | ≤ θk−k0 |ak0 |
P∞
k=0 |ak |,
und aus
für k ≥ k0 .
Da die geometrische Reihe auf der rechten Seite konvergiert (Beispiel 1.2), folgt die Behauptung aus (a) und wir erhalten außerdem die Abschätzung
∞
X
|ak | ≤
k=k0
|ak0 |
.
1−θ
(1.1)
Unter der Voraussetzung (c) folgt
|ak | ≤ θk
für k ≥ k0 .
Wieder folgt die Behauptung durch M-Test mit der geometrischen Reihe. Die Abschätzung
lautet hier
∞
X
θ k0
|ak | ≤
.
(1.2)
1−θ
k=k0
Die Divergenzaussagen folgen unmittelbar aus dem Nullfolgentest Satz 1.1.
Beispiel 1.7 Für α ∈ C, z ∈ C betrachten wir die Binomialreihe
Bα (z) =
∞ X
α
k=0
k
z k = 1 + αz +
α(α − 1) 2
z + ...
2
Für α ∈ N0 bricht die Reihe nach k = α ab, denn es gilt
α(α − 1) · . . . · α − (k − 1)
α
=
.
k
k!
Nach Binomischem Lehhrsatz (Kapitel 1, Satz 2.1) gilt dann Bα (z) = (1 + z)α . Im Folgenden
sei oBdA α ∈
/ N0 . Außerdem setzen wir z 6= 0 voraus, denn für z = 0 ist Bα (z) = α0 = 1.
Unter diesen Annahmen folgt
α k
ak =
z 6= 0 für alle k ∈ N0 ,
k
100
und wir erhalten
ak+1 |α − k|
ak = k + 1 |z| −→ |z|
mit k → ∞.
Falls nun |z| < 1, so gilt |ak+1 /ak | ≤ θ < 1 für k ≥ k0 , wenn wir zum Beispiel θ :=
(1 + |z|)/2 < 1 und k0 ∈ N hinreichend groß wählen. Also ist die Binomialreihe für |z| < 1
absolut konvergent. Umgekehrt gilt im Fall |z| > 1 für hinreichend große k ≥ k0
|ak+1 /ak | ≥ 1
(falls |z| > 1).
Für |z| > 1 ist die Reihe also divergent. Für z ∈ C mit |z| = 1 können wir ohne weiteres
keine Aussage treffen.
Die Rechenregeln für Addition von konvergenten Reihen sowie Multiplikation mit komplexen
Zahlen ergeben sich direkt aus der entsprechenden P
Regel für konvergente
Folgen, siehe Satz
P∞
∞
3.3 a) in Kapitel
1.
So
ist
für
konvergente
Reihen
a
und
b
und
λ, µ ∈ R auch
k=0 k
k=0 k
P∞
die Reihe k=0 (λak + µbk ) konvergent und es gilt
∞
X
(λak + µbk ) = λ
k=0
∞
X
∞
X
+µ
k=0
bk .
k=0
Durch
P∞ Abänderung, Hinzufügen oder Weglassen von endlich vielen Gliedern in einer Reihe
k=0 ak wird die Konvergenz oder Divergenz nicht beeinflusst. Überlegen Sie, wie die Folge
der Partialsummen durch diese Operationen beeinflusst wird. Natürlich ändert sich im Fall
der Konvergenz in der Regel der Wert der Reihe, zum Beispiel haben wir
∞
X
k=n
ak = lim
m→∞
m
X
m
X
ak = lim
m→∞
k=n
ak −
k=0
n−1
X
ak
!
=
k=0
∞
X
ak −
k=0
n−1
X
ak .
k=0
P∞
P
Bei der Multiplikation von zwei Reihen ∞
k=0 ak und
k=0 bk treten die doppelt indizierten Produkte ak bl (k, l ∈ N0 ) auf. Es ist zunächst nicht klar, in welcher Reihenfolge diese
summiert werden sollen. Eine naheliegende Möglichkeit, das sogenannte Cauchyprodukt, ist
folgende: erst werden die n + 1 Produkte ak bl in jeder Diagonale k + l = n addiert, dann wird
die Konvergenz der resultierenden Reihe untersucht. Der folgende Satz besagt, dass dieses
Verfahren bei absolut konvergenten Reihen funktioniert.
Satz 1.3 (Cauchyprodukt) Die Reihen
Dann ist auch die Reihe
∞
X
cn
mit
P∞
cn =
k=0
k=0 ak
X
und
ak bl =
k+l=n
P∞
k=0 bk
n
X
seien absolut konvergent.
ak bn−k
k=0
absolut konvergent und es gilt
∞
X
k=0
ak ·
∞
X
k=0
bk =
∞
X
cn =
n=0
∞
X
n=0
101
X
k+l=n
ak bl
!
.
Beweis: Wir setzen für N ∈ N0
AN :=
N
X
|ak | →
k=0
∞
X
|ak | =: A
und
BN :=
k=0
N
X
|bk | →
k=0
∞
X
|bk | =: B.
k=0
Dann gilt
N
X
|cn | ≤
n=0
Also ist
P∞
n=0 cn
N X
X
|ak | |bl | ≤
n=0 k+l=n
X
|ak | |bl | = AN BN → A B < ∞.
0≤k,l≤N
absolut konvergent. Ferner haben wir
|A2N B2N −
2N
X
cn |
=
n=0
X
|
ak bl −
0≤k,l≤2N
X
X
≤
ak bl |
k+l≤2N
|ak | |bl |
0≤k,l≤2N, max(k,l)>N
=
A2N B2N − AN BN
→ 0
Somit konvergiert die Reihe
P∞
n=0 cn
Beispiel 1.8 Die Reihe f (z) =
ist
gegen A B.
∞
X
zk
k=0
mit N → ∞.
k!
ist absolut konvergent für alle z ∈ C. Denn für z 6= 0
k+1
z
/(k
+
1)!
= |z| ≤ 1
k+1
k
2
z /k
für k ≥ k0 ,
also ist das Quotientenkriterium anwendbar. Es folgt für z, w ∈ C aus dem Cauchyprodukt
und der Binomischen Formel
f (z) f (w) =
∞
∞
X
z k X wk
k!
k
k=0
k=0
∞ X
X
1 k l
z w
k!l!
k=0 k+l=n
∞
n X
1 X n k n−k
=
z w
n!
k
=
=
n=0
∞
X
n=0
k=0
(z + w)n
n!
= f (z + w).
Die Reihe f (z) erfüllt also die Funktionalgleichung der e-Funktion, siehe Kapitel 2, Satz 3.3.
Beim Cauchyprodukt trat das Problem der Summationsreihenfolge auf. Allgemein kann eine
Änderung der Summationsreihenfolge, eine sogenannte Umordnung, die Konvergenz bzw.
102
Divergenz einer Reihe beeinflussen. Betrachte z. B. für die Reihe 1 − 21 +
nachstehende Umordnung
1
1 1 1
1 1
1
1
1
1−
+
+ −
+
+ +
+
−
+ ....
2
3 5 4
7 9 11 13 6
1
3
− + . . . die
Während die Ausgangsreihe konvergiert (Beispiel 1.6), ist die so umgeordnete Reihe sogar
bestimmt divergent gegen +∞, denn die Summe der positiven Zahlen in jeder der Klammern ist mindestens 1/4. Zum Glück gibt es derart merkwürdige Phänomene bei absolut
konvergenten Reihen nicht.
P
Satz 1.4 (Umordnungsatz) SeiP
τ : N0 → N0 bijektiv. Falls ∞
k=0 ak absolut konvergent
∞
ist, so konvergiert auch die Reihe k=0 aτ (k) absolut und hat denselben Grenzwert.
P
Beweis: Sei S = ∞
n=0 an . Zu ε > 0 existiert ein n0 ∈ N mit
∞
X
|an | < ε/2.
n=n0
Sei m ≥ max{k ∈ N0 : τ (k) < n0 }. Aus τ (k) < n0 folgt dann k ≤ m, und wir können
folgendermaßen abschätzen:
m
X
S −
aτ (k) = S −
k=0
≤ S −
m
X
aτ (k) +
k=0, τ (k)<n0
m
X
k=0, τ (k)<n0
aτ (k) +
m
X
k=0, τ (k)≥n0
m
X
aτ (k) |aτ (k) |
k=0, τ (k)≥n0
X
nX
∞
0 −1
≤ S −
an +
|an |
n=n0
n=0
≤
2
ε ε
+ .
2 2
Potenzreihen
P
k
Eine Reihe des Typs P (z) = ∞
∈ C heißt Potenzreihe. Die
k=0 ak z mit Koeffizienten akP
n
k
Partialsummen der Potenzreihe sind die Polynome Pn (z) =
k=0 ak z . Folgende Fragen
interessieren uns:
• Für welche z ∈ C konvergiert die Potenzreihe P (z)?
• Lassen sich Eigenschaften der approximierenden Polynome wie Stetigkeit und Differenzierbarkeit auf die Potenzreihen Übertragen? Wenn ja, wie?
Die erste Frage hat eine überraschend klare und einfache Antwort. Wir brauchen dazu
folgenden Hilfssatz.
103
P
k
Lemma 2.1 (Abelsches Lemma) Sei ∞
k=0 ak z eine gegebene Potenzreihe mit Koeffizienten ak ∈ C. Für r ∈ (0, ∞) gebe es ein M ∈ [0, ∞), so dass gilt
|ak | rk ≤ M
für alle k ∈ N0 .
(2.1)
Auf jeder kleineren Kreisscheibe K% (0) = {z ∈ C : |z| ≤ %} mit Radius % ∈ [0, r) konvergiert
die Reihe dann absolut und gleichmäßig.
Beweis: Für z ∈ K% (0) gilt
k
|ak z | = |ak | r
k
|z|
r
k
≤M
% k
r
.
Die absolute Konvergenz
folgt aus dem Majorantenkriterium, durch Vergleich mit der geoP
metrischen Reihe ∞
M
(%/r)k ; diese konvergiert wegen %/r < 1. Weiter gilt
k=0
z ∈ K% (0)
⇒
|Pn (z) − P (z)| ≤
∞
X
∞ X
% k
(%/r)n+1
|ak z | ≤ M
≤M
.
r
1 − %/r
k
k=n+1
(2.2)
k=n+1
Also gilt für die Supremumsnorm auf der Kreisscheibe K% (0) die Abschätzung
kPn − P kK% (0) ≤ M
(%/r)n+1
→0
1 − %/r
mit n → ∞.
Im Bezug auf die beiden Konvergenzaussagen des Lemmas ist Folgendes zu beachten: der
Begriff absolute
Konvergenz bezieht sich auf eine Reihe von komplexen Zahlen, das heißt
P
k wird an einer festen Stelle z betrachtet. Dagegen bezieht sich der Begriff
P (z) = ∞
a
z
k=0 k
gleichmäßige Konvergenz auf die Folge von Funktionen Pn : K% (0) → C.
P
k
Satz 2.1 (Konvergenzradius) Zu jeder Potenzreihe P (z) = ∞
k=0 ak z gibt es genau ein
R ∈ [0, ∞], den Konvergenzradius, mit folgender Eigenschaft:
|z| < R ⇒ P (z)
absolut konvergent,
|z| > R ⇒ P (z)
divergent.
Beweis: Die Eindeutigkeit von R ist klar. Zur Existenz definieren wir
R = sup{|z| : P (z)
konvergiert} ∈ [0, ∞].
Ist |z| < R, so gibt es nach Definition ein z0 ∈ C mit |z| < |z0 | ≤ R, so dass P (z0 ) konvergiert.
Aus dem Nullfolgentest, Satz 1.1, folgt |ak z0k | → 0 mit k → ∞, also gilt die Voraussetzung
(2.1) in Lemma 2.1 mit r = |z0 | und geeignetem M < ∞. Da |z| < r, ist P (z) absolut
konvergent nach Lemma 2.1. Ist andererseits |z| > R, so ist P (z) divergent nach Definition
von R.
BeispielP
2.1 Der Konvergenzradius einer Potenzreihe kann R = 0 sein, wie das Beispiel
∞
k k
P (z) =
k=0 k z zeigt. Aus dem Nullfolgentest ergibt sich nämlich, dass die Reihe für
kein z ∈ C mit |z| > 0 konvergieren kann. Dass auch R = +∞ möglich ist, sieht man am
P
zk
Beispiel der Exponentialreihe P (z) = ∞
k=0 k! , vgl. Beispiel 1.8. Eine Potenzreihe mit endlichem, positiven
Konvergenzradius
ist schließlich die in Beispiel 1.7 betrachtete Binomialreihe
k
P
α
Bα (z) = ∞
z
;
für
α
∈
/
N
hat
diese Reihe den Konvergenzradius R = 1.
0
k=0 k
104
Wir kommen jetzt zu der zweiten Frage, die am Anfang des Abschnitts formuliert wurde.
Unser Ziel ist es,Pdie Stetigkeit – anschließend die Differenzierbarkeit
– der PolynomfunkP
k zu übertragen. Hierzu
tionen Pn (z) = nk=0 ak z k auf die Potenzreihe P (z) = ∞
a
z
k=0 k
ist allgemein zu untersuchen, unter welchen Voraussetzungen an die Konvergenz fn → f einer Funktionenfolge die Eigenschaft der Stetigkeit – sowie im Anschluss die Eigenschaft der
Differenzierbarkeit – erhalten bleiben.
Satz 2.2 (Gleichmäßige Konvergenz und Stetigkeit) Die Funktionen fn : D → Rp
mit D ⊂ Rm seien stetig. Falls die Folge (fn )n∈N gleichmäßig gegen f : D → Rp konvergiert,
das heißt
kfn − f kD = sup |fn (x) − f (x)| → 0 mit n → ∞,
x∈D
so ist auch f stetig auf D.
Beweis: Sei x0 ∈ D und ε > 0 gegeben. Wähle N ∈ N mit kf − fN kD < 3ε . Dann wähle
δ > 0 mit der Eigenschaft
|x − x0 | < δ
⇒
ε
|fN (x) − fN (x0 )| < .
3
Es folgt für |x − x0 | < δ mit der Dreiecksungleichung
|f (x) − f (x0 )| ≤ |f (x) − fN (x)| + |fN (x) − fN (x0 )| + |fN (x0 ) − f (x0 )| .
|
{z
} |
{z
} |
{z
}
< 3ε
< 3ε
< 3ε
P
k
Folgerung 2.1 Sei P (z) = ∞
mit Konvergenzradius R > 0. Dann
k=0 ak z eine Potenzreihe
Pn
k
konvergiert die Folge der Polynome Pn (z) =
k=0 ak z gleichmäßig gegen P (z) auf jeder
Kreisscheibe K% (0) = {z ∈ C : |z| ≤ %} mit % < R, und P ist stetig auf der offenen
Kreisscheibe UR (0).
P
k
k
Beweis: Wähle r ∈ (%, R). Dann ist ∞
k=0 ak r konvergent nach Satz 2.1, und |ak |r ist
beschränkt nach dem Nullfolgentest (Satz 1.1). Die gleichmäßige Konvergenz auf K% (0) folgt
aus Lemma 2.1. Die Stetigkeit von P auf UR (0) folgt nun aus Satz 2.2.
Wie bei Polynomen, siehe Satz 1.1 in Kapitel 2, stellt sich auch bei Potenzreihen die Frage,
ob durch eine hinreichend große Menge von Funktionswerten die Koeffizienten ak eindeutig
festgelegt sind. Dies können wir nun beantworten.
P∞
k und
Satz 2.3 P
(Koeffizientenvergleich für Potenzreihen) Seien P (z) =
k=0 ak z
∞
k
Q(z) =
Potenzreihen mit positivem Konvergenzradius. Falls es eine Folge
k=0 bk z
zi → 0, zi 6= 0 gibt mit P (zi ) = Q(zi ) für alle i ∈ N, so folgt ak = bk für alle k ∈ N0
und die Potenzreihen sind gleich.
Beweis: Indem wir von P zu P − Q übergehen, können wir bk = 0 für alle k ∈ N0 annehmen.
Wäre die Behauptung falsch, so gilt für ein n ∈ N0
a0 = a1 = . . . = an−1 = 0,
105
aber an 6= 0.
Ist R > 0 der Konvergenzradius von P , so folgt für 0 < |z| < R und jedes m ∈ N0 , da
a0 = . . . = an−1 = 0,
m
X
k=0
an+k z k = z −n
m
X
an+k z n+k = z −n
n+m
X
aj z j → z −n P (z)
mit m → ∞.
j=0
k=0
P∞
Die Potenzreihe F (z) = k=0 an+k z k konvergiert also für |z| < R, und aus Folgerung 2.1
schließen wir
an = F (0) = lim F (zi ) = lim (zi−n P (zi )) = 0,
i→∞
i→∞
ein Widerspruch zur Annahme.
Wir kommen nun schließlich zur Differenzierbarkeit von Potenzreihen. Auch hierzu brauchen
wir erst ein allgemeines Resultat:
Satz 2.4 (Vertauschung von Konvergenz und Ableitung) Sei fn ∈ C 1 (I) eine Folge
stetig differenzierbarer Funktionen, wobei I = (a, b) ⊂ R. Es möge gelten:
(i) Die Folge fn konvergiert punktweise gegen f : I −→ R.
(ii) Die Folge fn0 konvergiert gleichmäßig gegen g : I −→ R.
Dann ist f ∈ C 1 (I) und es gilt f 0 = g.
Beweis: Für x0 ∈ I gilt nach dem Hauptsatz der Differential- und Integralrechnung (Kapitel
4, Satz 2.1)
Z
x
fn (x) = fn (x0 ) +
fn0 (ξ) dξ
∀x ∈ I.
x0
Mit n → ∞ folgt aus der Vertauschbarkeit von Integral und gleichmäßiger Konvergenz (Kapitel 4, Satz 1.4)
Z x
f (x) = f (x0 ) +
g(ξ) dξ ∀x ∈ I.
x0
Die Funktion g ist stetig nach Satz 2.2, also folgt aus dem Hauptsatz f ∈ C 1 (I) und f 0 = g.
Für Funktionen f : I → Rp oder f : I → C gilt der Satz entsprechend. Dies ergibt sich sofort
durch Anwendung auf die einzelnen Koordinatenfunktionen, vgl. Lemma 1.1 in Kapitel 3.
Bei der Anwendung auf Potenzreihen ist zunächst zu beachten, dass wir den Begriff der
Ableitung nur für für Funktionen f = f (x) einer reellen Variablen erklärt haben. Deshalb
schränken wir die Potenzreihen im Folgenden auf das reelle Intervall I = (−R, R) ⊂ R ein,
wobei R > 0 der Konvergenzradius ist.
P∞
k
Satz 2.5 (Differenzierbarkeit von Potenzreihen) Die Potenzreihe P (z) =
k=0 ak z
mit ak ∈ C habe den Konvergenzradius R > 0. Dann ist die Funktion
P : (−R, R) → C, P (x) =
∞
X
ak xk
k=0
unendlich oft differenzierbar und die Ableitung kann durch gliedweises Differenzieren der
Reihe berechnet werden:
∞
X
0
P (x) =
(k + 1)ak+1 xk füf alle x ∈ (−R, R).
(2.3)
k=0
106
Beweis: Für Pn (x) =
Pn
k
k=0 ak x
Pn0 (x) =
gilt
n
X
n−1
X
kak xk−1 =
k=1
(k + 1)ak+1 xk .
k=0
Die Folge der Funktionen Pn : (−R, R) → R konvergiert punktweise gegen P nach Satz
2.1.
dass die durch gliedweises Differenzieren erhaltene Potenzreihe Q(z) =
P∞ Wir zeigen nun,
k
k=0 (k + 1)ak+1 z ebenfalls den Konvergenzradius R > 0 hat. Das bedeutet nach Folgerung
2.1, dass die Folge Pn0 auf jedem kleineren Teilintervall [−%, %] ⊂ (−R, R) gleichmäßig gegen
die Funktion Q : [−%, %] → C konvergiert. Nach Satz 2.4 ist dann P : (R, R) → C stetig
differenzierbar und hat die Ableitung Q : (R, R) → C, was zu zeigen war.
Für 0 < |z| < R wähle ein r ∈ (|z|, R), zum Beispiel r = (|z| + R)/2. Es gibt dann ein
M < ∞ mit |ak | rk ≤ M für alle k ∈ N0 wegen des Nullfolgentests (Satz 1.1), und es folgt
|(k + 1)ak+1 z k | = |ak+1 |rk+1
k+1
r
|z|
r
k
≤
M (k + 1)
r
|z|
r
k
.
Die rechte Reihe konvergiert aber absolut nach dem Quotientenkriterium, denn
k + 2 |z|
|z|
→
<1
k+1 r
r
mit k → ∞.
Damit ist der Satz gezeigt.
Jetzt stehen alle Hilfsmittel zur Verfügung, um die Potenzreihenentwicklungen der klassischen
analytischen Funktionen herzuleiten.
Satz 2.6 (Potenzreihenentwicklung der Exponentialfunktion) Es gilt
ez =
∞
X
zk
k=0
für alle z ∈ C.
k!
(2.4)
Beweis: Für λ ∈ C betrachten wir die Potenzreihe
P (z) =
∞
X
λk
k=0
k!
zk .
Nach dem Quotientenkriterium, vgl. Beispiel 1.8, hat P den Konvergenzradius R = +∞.
Aus Satz 2.5 folgt für alle x ∈ R
P 0 (x) =
∞
X
(k + 1)
k=0
λk+1 k
x = λ P (x).
(k + 1)!
Also ist P : R → C Lösung des Anfangswertproblems
f 0 = λf
auf R,
f (0) = 1.
Aus Folgerung 3.4 ergibt sich P (x) = eλx für alle x ∈ R, und mit x = 1 folgt die Behauptung,
indem wir λ durch z ersetzen.
107
Durch die Potenzreihe ergibt sich ein zweiter, von Satz 2.4 in Kapitel 4 unabhängiger Zugang
zur Lösung des Anfangswertproblems für die gleichförmige Kreisbewegung. Und zwar ergibt
sich wie oben gezeigt, dass die Funktion
c(t) =
∞ k
X
i
k=0
k!
tk
die Differentialgleichung c0 = ic auf ganz R löst und den Anfangswert c(0) = 1 hat.
Folgerung 2.2 (Potenzreihenentwicklung von cos und sin) Für alle x ∈ R gilt
cos x =
sin x =
∞
X
k=0
∞
X
(−1)k
x2k
x2 x4
=1−
+
− +...
(2k)!
2!
4!
(2.5)
(−1)k
x2k+1
x3 x5
=x−
+
− +...
(2k + 1)!
3!
5!
(2.6)
k=0
Beweis: Nach Satz 2.6 gilt
ix
e
=
∞
X
(ix)n
n=0
=
n!
∞
X
k=0
∞
X
x2k
x2k+1
(−1)
+i
(−1)k
.
(2k)!
(2k + 1)!
k
k=0
Die Behauptung folgt aus der Definition 3.4 von eix , nämlich aus der Eulerschen Formel.
Satz 2.7 (Potenzreihenentwicklung von log) Für x ∈ (−1, 1) ⊂ R gilt
log(1 + x) =
∞
X
(−1)k−1
k=1
k
xk = x −
x2 x3
+
− +....
2
3
(2.7)
Beweis: Wir berechnen für f (x) = log(1 + x) mit x ∈ (−1, 1)
∞
X
1
f (x) =
=
(−1)k xk ,
1+x
0
k=0
wobei im letzten Schnitt die Formel für die geometrische Reihe benutzt wurde. Die Reihe
P
(−1)k−1 k
P (x) = ∞
x konvergiert für x ∈ (−1, 1) nach dem Quotientenkriterium. Aus Satz
k=1
k
2.5 folgt nun
∞
X
(−1)k
0
P (x) =
(k + 1) xk = f 0 (x) (x ∈ (−1, 1).
k+1
k=0
Da P (0) = 0 = f (0), folgt f (x) = P (x).
108
Herunterladen