Mathematik für Informatiker 1 - an der Universität Duisburg

Mathematik für Informatiker 1
Version: 19.07.2012
Gerhard Freiling und Hans-Bernd Knoop
bearbeitet von Frank Müller
iii
Inhalt von Teil I
Inhalt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii-iv
§ 0 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
0.1 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.2 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
0.3 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
§ 1 Reelle Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1 Die Körperaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2 Die Anordnungsaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3 Die reellen Zahlen als vollständig geordneter Körper . . . . . . . . . . . . . . . . . . . . . . 16
1.4 Das Induktionsprinzip. Induktive Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.5 Endliche, abzählbare und überabzählbare Mengen . . . . . . . . . . . . . . . . . . . . . . . . 28
1.6 R als metrischer Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.7 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.8 Gleitpunktarithmetik und Rundungsfehler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
1.8.1
1.8.2
1.8.3
1.8.4
Darstellungen natürlicher Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Die p-al-Bruch-Darstellung der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 52
Gleitpunktzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Arithmetik von Gleitpunktzahlen: Ein Ausblick . . . . . . . . . . . . . . . . . . . . . . 63
§ 2 Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66
2.1 Konvergente Folgen. Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.2 Das Rechnen mit konvergenten Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.3 Prinzipien der Konvergenztheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.4 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.5 Multiplikation von Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
§ 3 Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.1 Reell- bzw. komplexwertige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2 Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.3 Stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.4 Sätze über stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
3.5 Logarithmus und allgemeine Potenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
iv
3.6 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.7 Uneigentliche Grenzwerte und Grenzwerte im Unendlichen . . . . . . . . . . . . . . 114
§ 4 Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.1 Die Ableitung einer differenzierbaren Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.2 Relative Extrema. Mittelwertsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
4.3 Höhere Ableitungen. Taylor-Polynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.4 Konvexe und konkave Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.5 Grenzwertbestimmung mittels Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . .132
§ 5 Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.1 Integration und Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
5.2 Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.3 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.4 Näherungsweise Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
§ 6 Folgen und Reihen von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
6.1 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
6.2 Gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
1
§ 0 Einleitung
Der Studienplan für das Studium der Angewandten Informatik an der Universität Duisburg-Essen sieht im Grundstudium vier mathematische Grundvorlesungen vor. Dies sind
neben zwei 3-stündigen Vorlesungen zur Diskreten Mathematik auch zwei 4-stündige Vorlesungen mit dem Titel Mathematik für Informatiker. Gegenstand dieser beiden letztgenannten Vorlesungen sind im Wesentlichen Grundlagen der Analysis und Elemente der
Stochastik.
Der Autor der ersten Version dieser Vorlesung (Hans-Bernd Knoop) hat im Sommersemester 2003 und dem nachfolgenden Wintersemester 2003/04 den Versuch unternommen, aus
dem Stoff der entsprechenden Mathematik-Vorlesungen (Analysis I bis III und Stochastik)
im Diplom- bzw. Lehramtsstudiengang Mathematik die Grundlagen zusammenzustellen,
die einerseits für das Informatik-Studium unabdingbar erscheinen und die andererseits für
den Besuch mathematisch orientierter Veranstaltungen im Hauptstudium Angewandte Informatik unbedingt notwendig sind. Gedacht ist dabei an Vorlesungen aus dem Bereich der
Numerischen Mathematik wie Mathematisches Modellieren, Bildverarbeitung oder Computer Aided Geometric Design bzw. an Veranstaltungen aus dem Bereich der Optimierung.
Wegen der in diesen Vorlesungen üblichen mathematischen Strenge haben wir auch in
diesen Einführungsvorlesungen fast alle Aussagen bewiesen. Diese Notwendigkeit mag
vielleicht einem Studierenden der Angewandten Informatik gerade zu Beginn des Studiums nicht einsichtig sein; wir sind aber der festen Überzeugung, dass dies zum Verständnis
im weiteren Verlauf des Studiums nur hilfreich sein kann.
Grundlage für die Gegenstände aus der Analysis ist eine Vorlesung Analysis I bis IV,
die der zweitgenannte Autor in der Zeit zwischen dem Wintersemester 2001/02 und dem
Sommersemester 2003 für den Diplom- bzw. Lehramtsstudiengang Mathematik gehalten
hat.
Ab dem Sommersemester 2004 wurde die Vorlesung von Gerhard Freiling übernommen;
hierbei wurde das Vorlesungsmanuskript überarbeitet und um einige Themen ergänzt,
die teilweise dem Vorlesungsmanuskript Analysis I bis IV von G. Freiling bzw. anderen
Quellen entnommen wurden; dieses Skript erhebt keinerlei Anspruch auf Originalität.
An dieser Stelle möchten die Autoren Herrn D. Winkler (Karlsruhe) danken, der die
Unterlagen (files) eines von ihm ausgearbeiteten Vorlesungsmanuskripts zur Verfügung
gestellt hat - wir haben hier insbesondere einige von ihm angefertigte Abbildungen verwandt. Ferner danken wir unserem Kollegen Heinz H. Gonska (Duisburg), der zu diesem
Skript die erste Version von §1.8 beigetragen hat.
Mit Sicherheit wird diese Vorlesung, die durch einen ungemein umfangreichen Stoffkatalog
geprägt ist, nicht alle Wünsche der Informatik und der Mathematik, speziell der Studierenden der Angewandten Informatik erfüllen. Deshalb sind uns Anregungen, Ergänzungen,
Änderungswünsche oder auch Hinweise zu Fehlern in dem nachfolgenden Text sehr willkommen.
Um die Dinge, die wir beweisen wollen, möglichst eindeutig, klar und dennoch kurz darstellen zu können, benötigen wir einige Verabredungen, die wir als erstes zusammenstellen.
Dabei stellen wir uns auf einen naiven Standpunkt.
2
0.1 Aussagenlogik
Wir wollen den Begriff Aussage klären: Als Aussage soll jeder sprachliche Satz verstanden
werden, der seiner inhaltlichen Bedeutung nach entweder wahr oder falsch ist. Dabei
kommt es nicht darauf an, dass man tatsächlich weiß, ob der Satz wahr oder falsch ist.
Der Satz Morgen wird es regnen ist schon heute eine Aussage, obwohl sich erst morgen
herausstellen wird, ob sie wahr oder falsch ist. Wir legen uns also auf eine zweiwertige
Logik fest und führen zur Formalisierung die Wahrheitswerte W (für wahr) und F (für
falsch) ein. Wenn wir kurz davon sprechen, dass eine Aussage wahr ist, so bedeutet das:
Einer Aussage wird der Wahrheitswert W zugeordnet.
Wir verknüpfen Aussagen miteinander; dabei kommt es uns nicht auf die neu entstandenen
Sätze unserer Sprache an, sondern auf die Wahrheitswerte der Aussage-Verknüpfungen.
Wir verstehen also die Aussage-Verknüpfungen als Verknüpfungen von Wahrheitswerten:
a) Die Negation (Verneinung, im Zeichen ¬) ordnet jedem Wahrheitswert den entgegengesetzten W -Wert zu:
A
¬ A
W
F
F
W
b) Die Konjugation (UND-Verknüpfung, im Zeichen ∧) ordnet den Aussagen A und B
genau dann den Wahrheitswert W zu, wenn sowohl A als auch B wahr sind:
A
B
A ∧B
W
W
W
W
F
F
F
W
F
F
F
F
c) Die Disjunktion (ODER-Verknüpfung, im Zeichen ∨) ordnet den Aussagen A und
B genau dann den Wahrheitswert W zu, wenn A oder B wahr sind:
A
B
A ∨B
W
W
W
W
F
W
F
W
W
F
F
F
d) Die Subjunktion (Implikation, im Zeichen A ⇒ B) ordnet den Aussagen A und B
3
Wahrheitswerte gemäß der folgenden Tabelle zu:
A
B
A ⇒B
W
W
W
W
F
F
F
W
W
F
F
W
e) Die Bijunktion (Äquivalenz, im Zeichen A ⇔ B) ordnet den Aussagen A und B
genau dann den Wahrheitswert W zu, wenn A und B denselben Wahrheitswert
besitzen:
B A ⇔B
A
W
W
W
W
F
F
F
W
F
F
F
W
Mit den so definierten Verknüpfungen kann man komplizierte Gebilde, sog. aussagenlogische Ausdrücke aufbauen, z.B.:
(A ⇒ B) ∧ (B ∨ (¬A)) = C.
Bei der Ermittlung des Wahrheitswertes eines solchen Ausdrucks verwendet man vorteilhaft Wahrheitstabellen.
A ⇒ B B ∨ (¬A)
A
B
W
W
W
W
W
W
F
F
F
F
F
W
W
W
W
F
F
W
W
W
C
Der Satz x ist eine Großstadt ist keine Aussage. Erst wenn x durch den Namen eines
Objekts ersetzt wird, ergibt sich eine Aussage. Wir nennen x eine Variable und x ist
eine Großstadt eine Aussageform. Wir schreiben allgemein für eine Aussageform mit einer
Variablen x auch kurz A(x). Wir setzen nun alle zur Verfügung stehenden Objekte aus dem
Variablenbereich ein und überprüfen die entstandenen Aussagen auf ihren Wahrheitswert.
Folgende drei Fälle sind möglich:
(i) Alle aus A(x) entstandenen Aussagen sind wahr.
(ii) Mindestens eine der aus A(x) entstandenen Aussagen ist wahr.
4
(iii) Keine der aus A(x) entstandenen Aussagen ist wahr.
Die Sätze unter (i), (ii) und (iii) sind Aussagen. Untersuchungen dieser Art sind – gerade
in der Mathematik – so häufig, dass man für die verwendeten Redewendungen eigene
Symbole zur Abkürzung eingeführt hat:
Statt (i) sagt man:
Für alle x gilt A(x)
oder mit der Abkürzung:
∀x : A(x)
∧ : A(x)
x
oder:
Statt (ii) sagt man:
Es existiert ein x, so dass A(x) gilt
oder
∃x : A(x)
∨ : A(x)
x
bzw.
∀ heißt Allquantor und ∃ heißt Existenzquantor. Für den Satz in (iii) brauchen wir keinen
eigenen Quantor, denn die Aussage unter (iii) ist die Verneinung der Aussage unter (ii).
Auf einen der beiden anderen Quantoren könnte man noch verzichten, denn es gilt:
(∀x : A(x)) ⇔ ¬(∃x : ¬A(x))
bzw.
(∃x : A(x)) ⇔ ¬(∀x : ¬A(x)).
Hieraus folgt die bei mathematischen Beweisen oft benutzte Äquivalenz:
¬(∀x : A(x)) ⇔ ∃x : ¬A(x)
bzw.
¬(∃x : A(x)) ⇔ ∀x : ¬A(x).
Will man nun einen mathematischen Satz beweisen, so reiht man eine Kette wahrer Aussagen aneinander. Jedes Glied der Kette ist entweder ein Postulat oder ein bereits früher
bewiesener Satz oder es geht nach gewissen Regeln aus den vorangehenden Gliedern der
Kette hervor. Diese Regeln heißen Beweisregeln; wir geben einige wichtige Regeln an:
a) Modus ponens (Abtrennungsregel): Wenn man weiß, dass die Implikation A ⇒ B
wahr ist und dass A wahr ist, so ist auch B wahr.
b) Modus tollens (Widerlegungsregel): Wenn man weiß, dass die Implikation A ⇒ B
wahr ist und dass ¬B wahr ist, so ist A falsch.
c) Kontrapositionsregel: (A ⇒ B) ⇔ (¬B ⇒ ¬A).
Diese Regel überprüft man sofort anhand der zugehörigen Wahrheitswertetafel.
d) Kettenschluß: Wenn man weiß, dass die Implikation A ⇒ B wahr ist und dass
B ⇒ C wahr ist, so ist auch A ⇒ C wahr. Diese Regel kann man sofort aus der
Wahrheitswertetafel für die Implikation ablesen.
5
0.2 Mengen
Wir verstehen unter einer Menge M die Zusammenfassung gewisser wohlunterschiedener
Objekte x unserer Anschauung oder unseres Denkens zu einem Ganzen. Die Objekte x
nennen wir die Elemente der Menge und schreiben: x ∈ M. Es dürfen nur solche Mengen
gebildet werden, bei denen objektiv entscheidbar ist, ob ein gewisses Objekt Element
dieser Menge ist oder nicht. Ist x kein Element der Menge M, so schreiben wir: x 6∈ M.
Dies ist äquivalent dazu, dass die Aussage x ∈ M falsch ist oder die Aussage ¬(x ∈ M)
wahr ist. Die Menge, die kein Element besitzt, bezeichnen wir mit ∅. Sie heißt leere Menge.
In der Regel beschreiben wir eine Menge in der Form {x | x besitzt die Eigenschaft A},
also z.B.:
{x | x ist eine natürliche Zahl} oder ∅ = {x | x 6= x}.
Ausgehend von zwei Mengen können wir neue Mengen konstruieren:
Definition 0.1
Sind M und N Mengen, so heißen M und N gleich (M = N), wenn gilt: x ∈ M ⇔ x ∈ N.
Wir schreiben ferner:
M ∪ N := {x | x ∈ M ∨ x ∈ N} (Vereinigung)
M ∩ N := {x | x ∈ M ∧ x ∈ N} (Durchschnitt)
M \ N := {x | x ∈ M ∧ x 6∈ N} (Differenzmenge)
M ⊂ N :⇔ (x ∈ M ⇒ x ∈ N)
P(M) := {N | N ⊂ M}
CM N := M \ N für N ∈ P(M)
(Teilmenge, Inklusion)
(Potenzmenge)
(Komplement)
Ist klar, bezüglich welcher Menge M das Komplement zu bilden ist, so lassen wir auch
das M bei CM N weg. Die definierende Eigenschaft für den Durchschnitt von M und N
können wir dabei folgendermaßen auffassen: Wir schreiben x ∈ M ∩N, wenn die Aussagen
x ∈ M und x ∈ N wahr sind. Diese Interpretation ermöglicht es, Eigenschaften bei der
Verknüpfung von Mengen auf die Verknüpfung von Aussagen zurückzuführen.
Wir wollen dies an einem demonstrieren an einem
Beispiel: Sind L, M, N Mengen, so folgt aus L ⊂ M und M ⊂ N stets L ⊂ N (Transitivität von ⊂).
Beweis: Wir setzen also
L ⊂ M ⇔ (x ∈ L ⇒ x ∈ M)
und
M ⊂ N ⇔ (x ∈ M ⇒ x ∈ N).
voraus und müssen zeigen, dass x ∈ L ⇒ x ∈ N wahr ist. Diese Implikation ist nach der
Kettenschluß-Regel wahr.
2
Weitere Eigenschaften bei der Verknüpfung von Mengen fassen wir zusammen in
6
Satz 0.2.
Für beliebige Mengen L, M, N gilt:
a) M ∩ N = N ∩ M,
M ∪N = N ∪M
(Kommutativität)
b) (M ∩ N) ∩ L = M ∩ (N ∩ L)
(Assoziativität)
(M ∪ N) ∪ L = M ∪ (N ∪ L)
(Assoziativität)
c) M ∩ (N ∪ L) = (M ∩ N) ∪ (M ∩ L)
(Distributivität)
M ∪ (N ∩ L) = (M ∪ N) ∩ (M ∪ L)
(Distributivität)
d) M \ (N ∩ L) = (M \ N) ∪ (M \ L)
(de Morgansche Regel)
M \ (N ∪ L) = (M \ N) ∩ (M \ L)
(de Morgansche Regel)
e) L ⊂ (M ∩ N) ⇔ (L ⊂ M ∧ L ⊂ N)
Aufgrund der Assoziativität können wir bei Vereinigungs- und Durchschnittsbildung von
mehr als zwei Mengen auf Klammern verzichten. Wir können diese Begriffe auch auf
beliebige Mengensysteme ausdehnen:
Definition 0.3:
Es sei I eine nichtleere Menge und {Mi , i ∈ I} eine Familie von Mengen. Dann heißt
\
Mi := {x | ∀i ∈ I : x ∈ Mi }
[
Mi := {x | ∃i ∈ I : x ∈ Mi }
i∈I
der Durchschnitt und
i∈I
die Vereinigung der Mengen Mi , i ∈ I.
Die Eigenschaften aus Satz 0.2 übertragen sich sinngemäß. Wir wollen dies speziell für
die de Morganschen Regeln zeigen:
Satz 0.4.
Es sei {Mi , i ∈ I} eine Familie von Teilmengen von X. Dann gilt:
[
Mi ) =
\
Mi ) =
CX (
bzw.
CX (
i∈I
i∈I
\
CX Mi
[
CX Mi .
i∈I
i∈I
7
Beweis: Wir zeigen eine Gleichheit, z.B.
x ∈ CX (
[
i∈I
Mi ) ⇔ x ∈
\
i∈I
CX Mi ;
die andere Gleichheit folgt völlig analog.
x ∈ CX (
[
i∈I
Mi ) ⇔ x ∈ X ∧ x 6∈
[
Mi
i∈I
⇔ x ∈ X ∧ (¬(x ∈
[
Mi ))
i∈I
⇔ x ∈ X ∧ (¬(∃i ∈ I : x ∈ Mi ))
⇔ x ∈ X ∧ (∀i ∈ I : ¬(x ∈ Mi ))
⇔ x ∈ X ∧ (∀i ∈ I : x 6∈ Mi )
⇔ x ∈ X ∧ (∀i ∈ I : x ∈ CX Mi )
⇔ x∈
\
(CX Mi )
i∈I
2
0.3 Abbildungen
Definition 0.5.
Gegeben seien zwei nichtleere Mengen M und N. Unter einer Abbildung oder Funktion f
von M nach N verstehen wir eine (Zuordnungs-) Vorschrift, die jedem x ∈ M genau ein
y ∈ N in eindeutiger Weise zuordnet. Dieses Element y bezeichnen wir auch mit f (x) und
nennen es den Wert der Funktion f an der Stelle x oder das Bild von x unter f , während
x ein Urbild von f (x) heißt. M heißt Definitionsbereich von f , N Bildbereich von f . Wir
schreiben auch
f : M ∋ x 7→ f (x) ∈ N
oder
f : M → N, x 7→ f (x).
Bemerkung 0.6.
Jede Abbildung f : M → N können wir mit einer Teilmenge von
M × N = {(x, y) | x ∈ M, y ∈ N}
identifizieren. Ist f gegeben, so können wir f die Menge
Gf := G(f ) := {(x, f (x)) | x ∈ M} ⊂ M × N
zuordnen. G(f ) heißt Graph von f ; wir können uns die Elemente von G(f ) im cartesischen
Koordinatensystem vorstellen.
8
Abbildung 1: Beispiel: f0 : [0, 2] → R, x 7→ x2
Definition 0.7.
Zwei Abbildungen f1 : M1 → N1 und f2 : M2 → N2 heißen gleich, wenn M1 = M2 ,
N1 = N2 und f1 (x) = f2 (x) für alle x ∈ M1 gilt. Wir schreiben kurz: f1 = f2 . Vermöge
einer Abbildung f : M → N können wir Teilmengen von M bzw. N solche in N bzw. M
zuordnen. Für A ⊂ M bzw. B ⊂ N definieren wir
f (A) := {f (x) | x ∈ A}
(Bild von A)
bzw.
f −1 (B) := {x ∈ M | f (x) ∈ B}
(Urbild von B).
Wir erhalten
Satz 0.8.
Gegeben seien eine Abbildung f : M → N sowie Teilmengen Ai ⊂ M bzw. Bj ⊂ N. Dann
gilt:
(a) A1 ⊂ A2 ⇒ f (A1 ) ⊂ f (A2 )
B1 ⊂ B2 ⇒ f −1 (B1 ) ⊂ f −1 (B2 )
(b) f (
[
Ai ) =
\
Ai ) ⊂
i∈I
f(
i∈I
(c) f −1 (
[
f (Ai )
\
f (Ai )
i∈I
i∈I
[
Bj ) =
\
Bj ) =
j∈J
f −1 (
j∈J
[
f −1 (Bj )
\
f −1 (Bj )
j∈J
j∈J
9
(d) f −1 (CN B0 ) = CM f −1 (B0 )
(e) f −1 (f (A0 )) ⊃ A0 ,
f (f −1(B0 )) ⊂ B0 .
Beweis: Wir demonstrieren an einem Beispiel, wie die Aussagen bewiesen werden können:
x ∈ f −1 (
[
j∈J
Bj ) ⇔ x ∈ M ∧ f (x) ∈
[
Bj
j∈J
⇔ x ∈ M ∧ (∃j ∈ J : f (x) ∈ Bj )
⇔ ∃j ∈ J : x ∈ f −1 (Bj )
⇔ x∈
[
f −1 (Bj ).
j∈J
2
Definition 0.9.
Eine Abbildung f : M → N heißt surjektiv, falls f (M) = N gilt. Eine Abbildung
f : M → N heißt injektiv, falls aus x1 , x2 ∈ M und x1 6= x2 stets f (x1 ) 6= f (x2 )
folgt. (Nach obigen Überlegungen ist f genau dann injektiv, wenn aus x1 , x2 ∈ M und
f (x1 ) = f (x2 ) stets x1 = x2 folgt.) Für eine injektive Abbildung f können wir die Umkehrabbildung f −1 : f (M) → M dadurch definieren, dass wir jedem f (x) ∈ f (M) das
eindeutig bestimmte x ∈ M zuordnen. Es gilt
f −1 (f (x)) = x für alle x ∈ M
und
f (f −1 (y)) = y für alle y ∈ f (M).
Eine Abbildung f , die injektiv und surjektiv ist, heißt bijektiv.
Beispiele 0.10.
Bezeichnen wir die Menge der natürlichen Zahlen mit N, d.h. N := {1, 2, 3, . . .}, so ist
f : N ∋ n 7→ n2 ∈ N
injektiv, aber nicht surjektiv und
g : N ∋ n 7→
surjektiv, aber nicht injektiv.









n
2
, falls n gerade






n+1


, falls n ungerade 
2
∈N
10
Definition 0.11.
Gegeben seien zwei Abbildungen g : M → N1 und f : N2 → L. Ist g(M) ⊂ N2 , so ist die
Komposition f ◦ g : M → L definiert durch
M ∋ x 7→ f (g(x)) ∈ L.
Bezeichnen wir die Abbildung M ∋ x 7→ x ∈ M mit idM (Identität auf M), so erhalten
wir für injektives f : M → N:
f −1 ◦ f = idM
und
f ◦ f −1 = idf (M ) .
Beispiel 0.12.
Betrachten wir die Beispiele aus 0.10, so erhalten wir
f (g(n)) =
also











f
n
n2
=
2
4
, falls n gerade
(n + 1)2
n+1
=
f
, falls n ungerade
2
4
n
f (g(n))
1
1
2
1
3
4
4
4
5
9
6
9
,
...
;
...
die Abbildung g ◦ f ist ebenfalls definiert, und es gilt:
2
g(f (n)) = g(n ) =
d.h.
n
g(f (n))
1
1
2
2











n2
2
, falls n gerade
n2 + 1
, falls n ungerade
2
3
5
4
8
5
13
6
18
,
...
.
...
Hieraus liest man ab, dass im Allgemeinen gilt: f ◦ g 6= g ◦ f , selbst wenn beide Verknüpfungen definiert sind.
11
§ 1 Reelle Zahlen
Wir wollen bei der Einführung der reellen Zahlen, der Grundlage der Differential- und
Integralrechnung, den axiomatischen Weg verfolgen, d.h. dass wir die fundamentalen Rechenregeln für den Umgang mit reellen Zahlen als definierende Eigenschaften wählen.
1.1 Die Körperaxiome
Definition 1.1.
Ein Körper K ist eine Menge mit zwei Abbildungen + : K × K → K und · : K × K → K,
Addition bzw. Multiplikation genannt, die den folgenden Axiomen genügen:
(A1) (x + y) + z = x + (y + z) für alle x, y, z ∈ K.
(Die Addition ist assoziativ; hierbei haben wir an Stelle von +(x, y) kurz x + y
geschrieben.)
(A2) x + y = y + x für alle x, y ∈ K.
(Die Addition ist kommutativ.)
(A3) Es existiert ein Element 0 ∈ K mit 0 + x = x für alle x ∈ K.
(Existenz des neutralen Elements bzgl. + .)
(A4) Zu jedem x ∈ K existiert ein Element −x ∈ K mit x + (−x) = 0.
(Existenz des inversen Elements bzgl. + ; −x heißt auch Negatives zu x.)
(M1) (xy)z = x(yz) für alle x, y, z ∈ K.
(Die Multiplikation ist assoziativ; hierbei haben wir an Stelle von ·(x, y) kurz xy
geschrieben.)
(M2) xy = yx für alle x, y ∈ K.
(Die Multiplikation ist kommutativ.)
(M3) Es existiert ein Element 1 ∈ K, 1 6= 0, mit 1x = x für alle x ∈ K.
(Existenz des neutralen Elements bzgl. · .)
(M4) Zu jedem x ∈ K \ {0} existiert ein x−1 ∈ K mit xx−1 = 1.
(Existenz des inversen Elements bzgl. · .)
(D) Für alle x, y, z ∈ K gilt: x(y + z) = xy + xz.
(Distributivgesetz.)
12
Man sagt, dass K mit der Verknüpfung + eine kommutative Gruppe bildet ((A1) - (A4));
K \ {0} bildet bzgl. · eine kommutative Gruppe.
Beispiele 1.2.
Die rationalen Zahlen
Q :=
m
| m ∈ Z, n ∈ N
n
mit Z := {z | z = 0 ∨ z ∈ N ∨ −z ∈ N}
bilden einen Körper. Der kleinste Körper besteht aus zwei Elementen, mit obigen Bezeichnungen 0 und 1, die folgendermaßen verknüpft werden:
+
0
1
0
0
1
·
0
1
1
1
0
0
0
0
1
0
1
Wir halten einige Regeln für das Rechnen in Körpern fest; diese Regeln sind uns von Q
her bekannt.
Satz 1.3.
Die Axiome der Addition ergeben folgende Regeln in einem Körper K:
a) Ist x + y = x + z, so folgt y = z. (Kürzungsregel)
b) Ist x + y = x, so folgt y = 0, d.h. 0 ist eindeutig bestimmt.
c) Ist x + y = 0, so folgt y = −x, d.h. dass das inverse Element bzgl. + eindeutig
bestimmt ist.
d) Für alle x ∈ K gilt −(−x) = x.
Beweis:
Zu a): Aus x + y = x + z folgt
y
(A3)
=
(V or)
=
(A4)
(A1)
0 + y = (−x + x) + y = −x + (x + y)
(A1)
−x + (x + z) = (−x + x) + z = 0 + z = z.
Zu b): Setze in a) z = 0.
Zu c): Setze in a) z = −x.
Zu d): Aus c) folgt mit −x statt x:
Ist −x+y = 0, so ist y = −(−x). Andererseits ist −x+x = 0, also wegen der Eindeutigkeit
des Inversen: x = −(−x).
2
13
Bemerkung.
Wir schreiben x − y an Stelle von x + (−y). Wegen
(x + y) + ((−x) + (−y)) = (x + y) + ((−y) + (−x))
= ((x + y) + (−y)) + (−x)
= (x + (y + (−y))) + (−x)
= (x + 0) + (−x) = x + (−x) = 0
ist dann
−(x + y) = −x + (−y) = −x − y.
Weiter folgt
x − (y + z) = x + (−(y + z)) = x + ((−y) + (−z))
= (x + (−y)) + (−z) = (x − y) + (−z) = x − y − z.
Entsprechend zu Satz 1.3 folgt
Satz 1.4.
Die Axiome der Multiplikation ergeben:
a) Ist x 6= 0 und xy = xz, dann ist y = z.
b) Ist x 6= 0 und xy = x, dann ist y = 1 (Eindeutigkeit des neutralen Elements).
c) Ist x 6= 0 und xy = 1, so folgt y = x−1 (Eindeutigekeit der Inversen).
d) Ist x 6= 0, so gilt (x−1 )−1 = x.
Bemerkung: Wir schreiben für x 6= 0 auch
1
an Stelle von x−1 .
x
Ferner gelten in einem Körper folgende Aussagen:
Satz 1.5.
a) 0x = 0.
b) Ist x 6= 0 und y 6= 0, so auch xy 6= 0.
c) (−x)y = −(xy) = x(−y).
d) (−x)(−y) = xy.
14
Beweis:
Zu a): Es gilt
(A3)
0x = (0 + 0)x
(D,M 2)
=
0x + 0x,
also nach Satz 1.3 b): 0x = 0.
Zu b): Angenommen, es gilt x 6= 0, y 6= 0 und xy = 0, so folgt
1 = (x−1 x)(y −1 y) = ((x−1 )xy −1 )y = (x−1 (xy −1))y
= (x−1 (y −1 x))y = ((x−1 y −1)x)y = (x−1 y −1)(xy) = 0
also ein Widerspruch zu (M3). Also muß xy 6= 0 gelten.
Zu c): Es ist
(D)
also
(a)
(−x)y + xy = (−x + x)y = 0 · y = 0,
(−x)y = −(xy).
Entsprechend folgt die zweite Gleichheit.
Zu d): Es gilt nach c) und Satz 1.3 d):
(−x)(−y) = −(x(−y)) = −(−(xy)) = xy.
2
Der Körper Q der rationalen Zahlen trägt noch mehr Struktur als wir bisher aus der
Addition und der Multiplikation entnehmen konnten.
1.2 Die Anordnungsaxiome
Definition 1.6.
Ein Körper K heißt geordnet, wenn gewisse Elemente als positiv ausgezeichnet sind (wir
schreiben: x > 0), so dass folgende Anordnungsaxiome erfüllt sind:
(O.1) Für jedes x ∈ K gilt genau eine der drei Beziehungen: x > 0, x = 0 oder −x > 0.
(O.2) Sind x > 0 und y > 0, so folgt x + y > 0.
(O.3) Sind x > 0 und y > 0, so folgt xy > 0.
Wir setzen x > y, falls x − y > 0 gilt, und schreiben x ≥ y, falls x > y oder x = y gilt;
statt x > y (bzw. x ≥ y) schreiben wir auch y < x (bzw. y ≤ x).
15
Satz 1.7.
Ist K ein geordneter Körper, so gilt:
a) x > 0 ⇔ −x < 0
b) Aus x < y und y < z folgt x < z.
(Transitivität der <-Beziehung .)
c) Ist x < y und z ∈ K beliebig, so folgt x + z < y + z.
d) Ist x < y und z > 0, so folgt xz < yz.
e) Ist x ∈ K \ {0}, so folgt x2 = x · x > 0; insbesondere ist 1 > 0.
f) Ist 0 < x < y, so folgt 0 < y −1 < x−1 .
Beweis: Zu a): Es gilt: −x < 0 ⇔ 0 > −x ⇔ 0 − (−x) > 0 ⇔ −(−x) = x > 0.
Zu b): Aus y − x > 0 und z − y > 0 folgt nach (O.2):
(y − x) + (z − y) > 0, d.h. z − x > 0.
Zu c): Aus y − x > 0 folgt (y + z) − (x + z) > 0.
Zu d): Aus y − x > 0 und z > 0 folgt nach (O.3):
(y − x)z > 0, d.h. yz − xz > 0.
Zu e): Ist x ∈ K \ {0}, so folgt nach (O.1): x > 0 oder x < 0. Für x > 0 folgt die
Behauptung aus (O.3). Ist x < 0, so gilt nach Teil a): −x > 0 und damit nach (0.3):
(−x)(−x) > 0; nach Satz 1.5 d) bedeutet dies: x2 > 0. Wegen 12 = 1 folgt speziell: 1 > 0.
Zu f): Aus x > 0 folgt x−1 6= 0 und damit nach Teil e): (x−1 )2 > 0. Teil d) liefert:
x(x−1 )2 > 0, d.h. (x · x−1 )x−1 = x−1 > 0. Entsprechend folgt y −1 > 0. (O.3) liefert:
x−1 y −1(= (xy)−1) > 0. Multiplikation der Ungleichung x < y mit x−1 y −1 > 0 ergibt
y −1 = x(x−1 y −1 ) < y(x−1 y −1) = x−1 .
2
Der Körper Q der rationalen Zahlen wird durch die übliche Anordnung zu einem geordneten Körper. Wir werden an einem Beispiel demonstrieren, dass der geordnete Körper
Q einen Nachteil aufweist:
16
Beispiel 1.8.
Es sei A := {p ∈ Q | p > 0, p2 < 2} und B := {p ∈ Q | p > 0, p2 > 2}.
Wir zeigen, dass A kein größtes und B kein kleinstes Element enthält, d.h.: zu jedem
p ∈ A existiert ein q ∈ A mit p < q und zu jedem p ∈ B existiert ein q ∈ B mit q < p.
Um dies einzusehen, betrachten wir zu jedem p ∈ Q mit p > 0 die Zahl
(i)
q =p−
p2 − 2
2p + 2
=
;
p+2
p+2
dann gilt
(ii)
q2 − 2 =
2(p2 − 2)
.
(p + 2)2
Ist nun p ∈ A, d.h. p2 − 2 < 0, so folgt aus (i): q > p und aus (ii): q ∈ A.
Ist dagegen p ∈ B, d.h. p2 − 2 > 0, so folgt aus (i): 0 < q < p und aus (ii): q ∈ B.
Wir werden im Folgenden mit einem Körper rechnen, der dieses Manko nicht hat.
1.3 Die reellen Zahlen als vollständig geordneter Körper
Definition 1.9.
Es sei K ein geordneter Körper und M ⊂ K: Existiert ein b ∈ K derart, dass für jedes
x ∈ M gilt: x ≤ b, so heißt M nach oben beschränkt, und wir nennen b eine obere Schranke
von M. Untere Schranken definiert man analog.
Ist M ⊂ K nach oben beschränkt und existiert ein a ∈ K mit folgenden Eigenschaften:
(i) a ist obere Schranke von M;
(ii) ist b < a, so ist b keine obere Schranke von M,
so heißt a kleinste obere Schranke oder Supremum von M; wir schreiben: a = sup M.
Analog heißt a größte untere Schranke oder Infimum einer nach unten beschränkten
Menge M, Schreibweise a = inf M, wenn gilt:
(i) a ist untere Schranke von M;
(ii) ist b > a, so ist b keine untere Schranke von M,
17
Beispiele 1.10.
a) Wir betrachten die Mengen A und B aus Beispiel 1.8 als Teilmengen des geordneten
Körpers Q. A ist nach oben beschränkt; die oberen Schranken von A sind genau die
Elemente von B. Da B kein kleinstes Element enthält, hat A keine kleinste obere
Schranke in Q. Entsprechend hat B keine größte untere Schranke in Q.
b) Falls a = sup M existiert, kann a ∈ M oder a 6∈ M sein. Z.B. gilt für die Mengen
M1 := {p ∈ Q | p < 0} bzw. M2 := {p ∈ Q | p ≤ 0} :
0 = sup M1 = sup M2 .
c) Für M :=
1
| n ∈ N ist sup M = 1 und inf M = 0 mit 1 ∈ M und 0 6∈ M.
n
Satz 1.11.
Es existiert ein geordneter Körper, der Q enthält und in dem jede nichtleere, nach oben
beschränkte Teilmenge ein Supremum besitzt. Diesen Körper bezeichnen wir mit R und
nennen seine Elemente reelle Zahlen.
Beweis: vgl. W. Rudin: Analysis. Oldenbourg-Verlag.
Bemerkung.
Ein geordneter Körper, in dem jede nichtleere nach oben beschränkte Teilmenge ein Supremum besitzt, heißt vollständig geordnet. (Man könnte auch fordern, dass jede nichtleere
nach unten beschränkte Teilmenge ein Infimum besitzt.) Konstruktiv kann eine reelle
Zahl als eine Äquivalenzklasse von Cauchy-Folgen rationaler Zahlen definiert werden. Der
Beweis bei Rudin verwendet die Methode der Dedekindschen Schnitte. Beide Verfahren
gehen auf das Jahr 1872 zurück.
Wir ziehen einige Folgerungen aus Satz 1.11:
Satz 1.12.
a) Sind x, y ∈ R gegeben mit x > 0, so existiert ein n ∈ N mit
nx > y.
(Archimedisches Prinzip)
b) Sind x, y ∈ R gegeben mit x < y, so gibt es ein p ∈ Q mit
x < p < y.
(Q ist eine dichte Teilmenge von R.)
18
Beweis: Zu a): Wir nehmen an, die Behauptung sei falsch; dann ist die Menge
A := {nx | n ∈ N}
nichtleer und nach oben beschränkt (durch y). Aufgrund der Vollständigkeit von R existiert a = sup A (in R). Wegen x > 0 ist a − x < a, also a − x keine obere Schranke von
A. Daher gibt es ein m ∈ N mit a − x < mx, d.h. a < (m + 1)x, im Widerspruch dazu,
dass a eine obere Schranke von A ist.
Zu b): Wegen y − x > 0 existiert nach Teil a) ein n ∈ N mit
n(y − x) > 1.
Weiter gibt es m1 , m2 ∈ N mit
m1 > nx bzw. m2 > −nx,
d.h.
−m2 < nx < m1 .
Also existiert ein m ∈ Z (mit −m2 + 1 ≤ m ≤ m1 ) derart, dass
m − 1 ≤ nx < m
gilt. Zusammenfassen dieser Ungleichungen liefert
Wegen n > 0 folgt mit p =
m
:
n
nx < m ≤ 1 + nx < ny.
x<
m
= p < y.
n
2
Bemerkungen.
a) Häufig wird das Archimedische Prinzip in folgender Form benutzt:
Zu jedem ε > 0 existiert ein n ∈ N mit
1
< ε.
n
Diese Eigenschaft ist äquivalent zu der in Satz 1.12 a) formulierten Eigenschaft.
(Aus Satz 1.12 a) folgt, dass zu ε = 1 und y = 1 ein n ∈ N exisitiert mit nε > 1,
1
woraus < ε folgt. Für die Umkehrung seien x > 0 und y ∈ R gegeben. Wir wollen
n
zeigen, dass ein n ∈ N existiert mit nx > y; o.B.d.A. können wir y > 0 voraussetzen,
x
da sonst die Ungleichung für jedes n ∈ N richtig ist. Zu > 0 finden wir ein n ∈ N
y
1
x
mit < , was zu
n
y
x
d.h.
nx > y
äquivalent ist.)
n>
y
19
b) Wir haben die reellen Zahlen als Oberkörper von Q und damit als Obermenge von N
eingeführt. Will man darauf verzichten, so führt man R als vollständig geordneten
Körper ein, in dem das Archimedische Axiom (x, y > 0 ⇒ ∃n ∈ N : nx > y) gilt.
(Dabei sind die natürlichen Zahlen induktiv einzuführen, d.h. 2 := 1 + 1, 3 :=
2 + 1, . . . .) Bis auf Isomorphie ist R dann eindeutig bestimmt.
1.4 Das Induktionsprinzip. Induktive Definition.
Gegeben sei eine Zahl n0 ∈ Z; wir betrachten die Aussagen A(n) für jedes n ≥ n0 , n ∈
Z. Wir wollen beweisen, dass die Aussagen A(n) für alle n ≥ n0 wahr sind, ohne die
Richtigkeit einzeln nachzuprüfen. Dabei hilft uns
Das Induktionsprinzip
Um die Richtigkeit der Aussagen A(n) für alle n ≥ n0 zu beweisen, genügt es, Folgendes
zu zeigen:
(I) A(n0 ) ist richtig. (Induktionsanfang)
(II) Für beliebiges n ≥ n0 gilt: Falls A(n) richtig ist, so ist auch A(n + 1) richtig.
(Induktionsschritt)
Bemerkung.
Häufig formuliert man das Induktionsprinzip nur für n0 = 1. Bei vielen Abschätzungen
ist es jedoch besser, bei einem anderen n0 zu starten.
Wir fügen einige Beispiele an, bei denen das Induktionsprinzip erfolgreich beim Beweis
angewandt werden kann:
Satz 1.13.
Es gilt für alle n ∈ N
1 + 2 + 3 + ...+ n =
n(n + 1)
,
2
12 + 22 + 32 + . . . + n2 =
n(n + 1)(2n + 1)
,
6
13 + 23 + 33 + . . . + n3 =
n2 (n + 1)2
.
4
Beweis: Wir beweisen die dritte Aussage mit Hilfe des Induktionsprinzips.
(I) Induktionsanfang für n0 = 1. Die linke Seite ergibt: 13 = 1; die rechte Seite ergibt:
12 · 22
= 1. Also ist die Formel für n = 1 richtig.
4
20
(II) Induktionsschritt: Es gelte 13 + . . . + n3 =
der Formel für n + 1, d.h.
n2 (n + 1)2
; zu zeigen ist die Richtigkeit
4
13 + . . . + n3 + (n + 1)3 =
(n + 1)2 (n + 2)2
.
4
Nun ist
13 + . . . + n3 + (n + 1)3 = (13 + . . . + n3 ) + (n + 1)3
1
n2 (n + 1)2
+ (n + 1)3 = (n + 1)2 (n2 + 4(n + 1))
=
4
4
=
1
(n + 1)2 (n + 2)2 .
4
Das Induktionsprinzip liefert dann die Gültigkeit der Aussage für alle n ∈ N.
2
Beim Prinzip der induktiven Definition geht man davon aus, dass eine Größe für die
natürliche Zahl n schon definiert ist und sagt, wie sich die Größe für n + 1 aus der für n
ergibt. Allgemein läßt sich das Prinzip folgendermaßen beschreiben:
Prinzip der induktiven Definition
Gegeben seien eine Menge X, eine Abbildung g : X × N → X und ein a ∈ X. Dann gibt
es genau eine Abbildung f : N → X mit f (1) = a und f (n + 1) = g(f (n), n) für alle
n ∈ N.
Beispiele 1.14.
a) Sei X = R und g definiert durch g(r, n) = a · r und f (1) = a. Dann ist
f (n) = an = a
| · a ·{z. . . · a} ∀ n ∈ N.
n−mal
Dies beweist man mit dem Induktionsprinzip.
b) Sei X = N, a = 1 und g definiert durch g(m, n) = m(n + 1). Dann ist f (n) =
1 · 2 · 3 · . . . · n. Dieses spezielle Produkt trägt den Namen n-Fakultät ; wir schreiben
dafür n! . Wir setzen noch 0! = 1.
Wir können auch allgemeinere Produkte bzw. Summen in abgekürzter Form aufschreiben;
so setzen wir für (reelle) Zahlen a1 , a2 , . . . , an :
n
X
k=1
ak := a1 + a2 + . . . + an
21
und
n
Y
k=1
ak := a1 · a2 · . . . · an .
Den Summationsindex k können wir auch anders bezeichnen; so gilt z.B.
n
X
ak =
k=1
n
X
aℓ =
ℓ=1
n+10
X
n+m
X
am−10 =
m=11
ak−m .
k=m+1
Ganz allgemein setzen wir für n ≥ m, m, n ∈ Z:
n
X
ak := am + am+1 + . . . + an
k=m
bzw.
n
Y
k=m
ist dagegen n < m, so sei
n
X
ak := am · am+1 · . . . · an ;
ak := 0
n
Y
und
k=m
ak := 1.
k=m
Satz 1.15.
Es gilt für m ≤ n
n
X
(ak − ak−1 ) = an − am−1 ,
n
X
(ak − ak+1 ) = am − an+1
k=m
(Teleskop-Summen)
k=m
sowie
n
X
ak bk = An bn+1 +
k=1
mit Ak =
k
P
j=1
n
X
k=1
Ak (bk − bk+1 )
(Abelsche Partielle Summation)
aj und beliebigem bn+1 .
Beweis: Wir beweisen nur die Behauptung über die Abelsche Partielle Summation. Mit
A0 = 0 folgt ak = Ak − Ak−1 für k = 1, . . . , n, also
n
X
ak bk =
k=1
n
X
(Ak − Ak−1 )bk =
n
X
Ak bk −
n−1
X
Ak bk+1
n
X
Ak bk −
n
X
Ak bk+1 + An bn+1
k=1
=
k=1
=
k=1
= An bn+1 +
n
X
k=1
Ak bk −
n
X
Ak−1 bk
k=1
k=1
k=1
n
X
k=1
Ak (bk − bk+1 ).
2
22
Wir wollen nun an einigen Beispielen den Umgang mit dem Summen- und dem Produktzeichen üben.
Es sei A = {a1 , a2 , . . . , an } eine n-elementige Menge. Eine Permutation (auf A) ist eine
bijektive Abbildung von A in sich. Jede solche Abbildung ist eindeutig durch die Bilder
der a1 , . . . , an festgelegt. Wegen der Injektivität einer Permutation kommt jedes Element
ai unter den Bildern f (a1 ), . . . , f (an ) genau einmal vor. Also beschreibt z.B. das n-Tupel
(a2 , a3 , . . . , an , a1 ) eine Permutation auf A, wenn man vereinbart, dass an der i-ten Stelle
das Bild f (ai ) steht. Hier ist
f (ai ) =



ai+1
für
a1
für
i = 1, . . . , n − 1
i = n.
Hieraus ist ersichtlich, dass es im Prinzip nur auf die Reihenfolge der Indizes bei den
ai ankommt; deshalb beschreibt man eine Permutation auch kurz durch ein n-Tupel der
natürlichen Zahlen 1, . . . , n, z.B. (2, 3, . . . , n, 1). Wieviele n-Tupel der Zahlen 1, . . . , n gibt
es? Das führt auf eine Aussage der elementaren Kombinatorik (vgl. Vorlesung Diskrete
Mathematik für Informatiker), das sog.
Abzähltheorem 1.16.
Es sei k ∈ N und K1 , . . . , Kk seien k Kästen, die belegt werden können, z.B. mit Kugeln
verschiedener Farbe. Gibt es
n1 Möglichkeiten, K1 zu belegen,
nach vorgenommener Belegung
n2 Möglichkeiten, K2 zu belegen,
und daran anschließend
n3 Möglichkeiten, K3 zu belegen,
. . . und schließlich
nk Möglichkeiten, Kk zu belegen,
so gibt es insgesamt
k
Y
ni
Belegungen der K1 , . . . , Kk .
i=1
Beweis: Induktion nach k.
2
Wenden wir diesen Satz auf die Frage nach der Anzahl der bijektiven Abbildungen von
A in sich an, so erhalten wir
n−1
Y
i=0
Permutationen von n Elementen.
(n − i) = n!
23
Definition 1.17.
Für k, n ∈ N0 := N ∪ {0} setzen wir
!
k
Y
n−j+1
n
n(n − 1) · . . . · (n − k + 1)
:=
=
k
j
1 · 2 · ...· k
j=1
!
n
heißen Binomialkoeffizienten.
(lies: n über k). Die Zahlen
k
Bemerkung.
Aus der Definition folgt unmittelbar
!
n
= 0 für k > n
k
und
!
n!
n
n
=
=
k
k!(n − k)!
n−k
Für 1 ≤ k ≤ n gilt ferner
!
!
!
für 0 ≤ k ≤ n.
!
n−1
n−1
n
.
+
=
k
k−1
k
Beweis: Für k = n ist die Formel richtig. Für 1 ≤ k ≤ n − 1 erhalten wir
!
n−1
n−1
+
k
k−1
!
=
(n − 1)!
(n − 1)!
+
(k − 1)!(n − k)! k!(n − k − 1)!
!
k(n − 1)! + (n − k)(n − 1)!
(n − 1)!n
n
=
.
=
=
k!(n − k)!
k!(n − k)!
k
2
Satz 1.18.
Die Anzahl der
Menge A = {a1 , . . . , an }
!
! k-elementigen Teilmengen einer n-elementigen
n
n
∈ Z ist.
, 0 ≤ k ≤ n. Speziell folgt, dass
ist gleich
k
k
Beweis: Mit Ckn bezeichnen wir die Anzahl der k-elementigen Teilmenge von A.
Wir beweisen
Ckn
!
n
durch Induktion nach n.
=
k
(I) Induktionsanfang: Sei n = 1; dann gibt es eine 0-elementige Teilmenge von A =
1
1
{a1 }, nämlich ∅ und
eine
1-elementige Teilmenge, nämlich A. Also ist C0 = C1 = 1.
Andererseits ist 10 = 11 = 1.
24
n
k
(II) Induktionsschritt: Es gelte Ckn =
n+1
n+1
. Wegen C0n+1 = 1 =
n+1
0
n+1
und Cn+1
=1=
brauchen wir nur den Fall 1 ≤ k ≤ n zu behandeln, d.h. Ckn+1 =
n+1
k
Die k-elementigen Teilmengen von {a1 , . . . , an+1 } zerfallen in zwei Klassen K0 und
K1 , wobei K0 alle Teilmengen umfasse, die an+1 nicht enthalten, und K1 alle Teilmengen, die an+1 enthalten. Die Anzahl der Mengen in der Klasse K0 stimmt mitder
Anzahl der k-elementigen Teilmengen von {a1 , . . . , an } überein, ist also gleich nk .
Jede Menge der Klasse K1 enthält an+1 ; die übrigen k − 1 Elemente
sind
der Menge
n
{a1 , . . . , an } entnommen. Nach Induktionsvoraussetzung gibt es k−1 Möglichkeiten dieser Auswahl. Zusammen folgt also mit der Formel aus der vorhergehenden
Bemerkung
!
!
!
n+1
n
n
n+1
.
=
+
Ck =
k
k−1
k
2
Beispiel.
!
49
= 13983816 6-elementige Teilmengen einer Menge von 49 Elementen.
Es gibt
6
Also ist die Chance, beim Lotto 6 aus 49 den Hauptgewinn zu erzielen, etwa 1 : 14 Mill.
Satz 1.19. (Binomischer Lehrsatz)
Es seien a, b ∈ R und n ∈ N, dann gilt mit a0 = b0 := 1:
n
(a + b) =
n
X
k=0
Beweis: Durch Induktion nach n.
1
(I) Es ist (a + b) = a + b und
k=0
für n = 1 richtig.
(II)
1
X
(a + b)
n+1
= (a + b) · (a + b) =
n
X
k=0
=
a
+
n
X
k=1
n+1
= a
+
n
X
n+1
= a
+
=
k=0
n
X
k=0
!
!
!
!
!
n−1
X n
n n+1−k k
an−k bk+1 + bn+1
a
b +
k
k
k=0
!
!!
an+1−k bk + bn+1
n + 1 n+1−k k
a
b + bn+1
k
!
!
n n−k k
a b (a + b)
k
n
n n−k k+1
n n+1−k k X
a b
a
b +
k
k=0 k
!
n
X
k=1
n+1
X
!
n
n
+
k−1
k
k=1
!
!
!
1
1
1 1−k k
b = a + b; also die Aussage
a+
a b =
1
0
k
n
=
n+1
!
n n−k k
a b .
k
n + 1 n+1−k k
a
b
k
!
25
2
Folgerung.
Es gilt
n
X
k=0
!
n
= 2n
k
; also gibt es 2n Teilmengen einer n-elementigen Menge {a1 , . . . , an }.
Ferner gilt
n
X
(−1)
k=0
k
!
n
= 0 für n ≥ 1.
k
Die Binomialkoeffizienten ergeben sich aus dem sog. Pascal’schen Dreieck
(a + b)0 :
1
(a + b)1 :
1
(a + b)2 :
1
(a + b)3 :
1
(a + b)4 :
1
(a + b)5 :
1
1
2
1
3
3
1
ց ւ ց ւ ց ւ
4
6
4
5
10
10
·
··
5
1
1
··
·
Satz 1.20. (Bernoullische Ungleichung)
Es seien x ∈ R mit x ≥ −1 und n ∈ N0 gegeben; dann gilt
(1 + x)n ≥ 1 + nx.
Beweis: Durch Induktion nach n.
(I) Für n = 0 ist die Behauptung klar.
(II) Es gelte also (1+x)n ≥ 1+nx. Durch Multiplikation dieser Ungleichung mit 1+x ≥ 0
folgt nach Satz 1.7:
(1 + x)n+1 ≥ (1 + nx)(1 + x) = 1 + (n + 1)x + nx2
≥ 1 + (n + 1)x.
Ist 1 + x = 0, d.h. x = −1, so gilt die Ungleichung wegen nx = −n ≤ 0, also
1 + nx = −n + 1, und (1 + x)n = 1 für n = 0 bzw. (1 + x)n = 0 für n ≥ 1.
2
Folgerung 1.21.
a) Es sei b > 1; dann gibt es zu jedem K > 0 ein n ∈ N mit bn > K.
26
b) Ist 0 < b < 1, so existiert zu jedem ε > 0 ein n ∈ N mit bn < ε.
Beweis: Zu a): Sei x := b − 1; Satz 1.20 liefert
bn = (1 + x)n ≥ 1 + nx.
Nach dem Archimedischen Prinzip existiert zu x > 0 und y = K − 1 ein n ∈ N mit
nx > K − 1. Für dieses n gilt:
bn > 1 + (K − 1) = K.
−1
Zu b): Nach Satz 1.7 ist b
Satz 1.7 liefert dann wegen
> 1; also existiert nach Teil a) ein n ∈ N mit
n
1
b
=
1
die Behauptung bn < ε.
bn
n
1
b
>
1
.
ε
2
In engem Zusammenhang hiermit ist die Summenformel für die geometrische Reihe zu
sehen.
Satz 1.22.
Es sei x ∈ R \ {1}; dann gilt für jedes n ∈ N0 :
n
X
xk =
k=0
1 − xn+1
.
1−x
Beweis durch Induktion nach n:
(I) n = 0 ergibt:
n
X
xk = x0 = 1 und
k=0
(II)
n+1
X
xk =
k=0
n
X
k=0
=
1 − x0+1
= 1.
1−x
xk + xn+1 =
1 − xn+1
+ xn+1
1−x
1 − xn+1 + xn+1 − xn+2
1 − xn+2
=
.
1−x
1−x
2
Satz 1.23.
Zu jedem x ∈ R√mit x > 0 und jedem n ∈ N existiert genau ein y > 0 mit y n = x. Wir
schreiben: y = n x oder y = x1/n .
√
Bemerkung: Es gilt n x = sup{t > 0 | tn < x}. Dies folgt aus Satz 3.27. Wir geben auch
noch einen direkten Beweis an.
27
Beweis: Sei E := {t > 0 | tn < x}; betrachten wir r :=
x
, so ist 0 < r < 1, also
1+x
r n ≤ r < x.
Damit ist r ∈ E; d.h. E 6= ∅.
Für t > 1 + x gilt tn ≥ t > x, also t 6∈ E. Daher ist 1 + x eine obere Schranke von E.
Nach Satz 1.11 existiert
y = sup E
in R. Wir zeigen, dass y n = x gilt. Dazu beweisen wir, dass die Ungleichungen y n > x
und y n < x zu Widersprüchen führen.
1. Fall: Sei y > 0 und y n < x; wir wählen h so, dass 0 < h < 1 und
h<
x − yn
n(y + 1)n−1
gilt. Mit b = y und a = y + h > b > 0 folgt dann wegen
n
n
a − b = (a − b)
also
nan−1 ≥
n−1
X
an−1−k bk ,
k=0
X n−1−k k
an − bn n−1
=
a
b ≥ nbn−1
a−b
k=0
für a > b > 0 die folgende Abschätzung:
an − bn ≤ nan−1 (a − b)
= nan−1 h = nh(y + h)n−1
≤ nh(y + 1)n−1 < x − y n .
Also ist
(y + h)n − y n < x − y n
oder
(y + h)n < x,
d.h.
y + h ∈ E.
Wegen y + h > y widerspricht dies der Tatsache, dass y eine obere Schranke von E ist.
2. Fall: Sei y > 0 und y n > x; wir wählen
0<k<
Dann ist k <
yn
y
= ≤ y.
n−1
ny
n
yn − x
.
ny n−1
28
Mit a := y und b := y − k > 0 folgt wie im ersten Fall
an − bn ≤ nan−1 (a − b)
= nan−1 k < y n − x.
Also ist
y n − (y − k)n < y n − x
oder
(y − k)n > x,
d.h.
y − k 6∈ E.
Also ist y − k eine obere Schranke von E im Widerspruch dazu, dass y die kleinste obere
Schranke von E ist.
Also muss y n = x gelten; sind y1 , y2 ∈ R, etwa 0 < y1 < y2 , so folgt 0 < y1n < y2n . Also
existiert genau ein y mit y n = x.
2
1.5 Endliche, abzählbare und überabzählbare Mengen
Definition 1.24.
Es sei Nn := {1, 2, . . . , n} für n ∈ N und M irgendeine Menge. Wir schreiben M ∼ N
(M gleichmächtig wie N, M äquivalent N), wenn eine bijektive Abbildung f : M → N
existiert. M heißt
a) endlich, wenn ein n ∈ N mit M ∼ Nn existiert. (∅ wird ebenfalls als endlich betrachtet.)
b) unendlich, falls M nicht endlich ist.
c) abzählbar, wenn M ∼ N ist.
d) überabzählbar, falls M weder endlich noch abzählbar ist.
e) höchstens abzählbar, wenn M endlich oder abzählbar ist.
Bemerkung.
Zwei endliche Mengen M und N sind genau dann gleichmächtig, wenn sie gleichviele
Elemente enthalten. Für unendliche Mengen ist der Begriff gleichviele Elemente recht
29
undeutlich, wogegen die Definition mit Hilfe der bijektiven Abbildung eindeutig ist. So
ist z.B. Z ∼ N vermöge der Abbildung
 n



für gerades n




 2

f : N ∋ n 7→
∈ Z.




n
−
1


 −
für ungerades n 
2
Wir konstruieren nun aus gegebenen unendlichen Mengen neue:
Satz 1.25.
Jede unendliche Teilmenge einer abzählbaren Menge ist abzählbar.
Beweis: Sei M abzählbar und N ⊂ M unendlich. Wir ordnen die Elemente von M in der
Form f (1), f (2), f (3), . . . , an, wobei f : N → M bijektiv ist. Sei nun n1 ∈ N die kleinste
natürliche Zahl mit f (n1 ) ∈ N. Sind nun n1 , . . . , nk−1 schon gewählt, so sei nk ∈ N für
k ≥ 2 die kleinste natürliche Zahl mit nk > nk−1 und f (nk ) ∈ N. Wir definieren dann
g : N → N durch g(k) = f (nk ); g ist injektiv, da f injektiv ist; außerdem ist g surjektiv:
ist nämlich x ∈ N ⊂ M, so existiert ein ℓ ∈ N mit f (ℓ) = x; ist dann k die Anzahl der
Elemente in {f (1), . . . , f (ℓ)} mit f (j) ∈ N, so gilt f (ℓ) = g(k).
2
Satz 1.26.
Für jedes n ∈ N sei En eine abzählbare Menge. Dann ist auch
M :=
∞
[
En :=
n=1
[
En
n∈N
abzählbar. (D.h.: Die Vereinigung von abzählbar vielen abzählbaren Mengen ist wieder
abzählbar.)
Beweis: Seien En ∼ N vermöge der Abbildungen fn : N → En , d.h.
En = {fn (k) | k ∈ N}.
Wir betrachten das folgende unendliche Schema
f1 (1) f1 (2) f1 (3) f1 (4) . . .
ր
ր
ր
f2 (1) f2 (2) f2 (3)
...
ր
ր
f3 (1) f3 (2) f3 (3)
...
ր
f4 (1) . . .
Das Schema enthält alle Elemente von M. Wir ordnen die Elemente des Schemas gemäß
der durch die Pfeile angedeuteten Weise an:
f1 (1); f2 (1), f1 (2); f3 (1), f2 (2), f1 (3); f4 (1), . . .
30
Haben zwei der Mengen En gemeinsame Elemente, so treten diese in der Anordnung
mehrfach auf. (Wenn wir dies nicht berücksichtigen, so kann genau angegeben werden,
an welcher Stelle in dieser Reihenfolge das Element fk (ℓ) steht.) Streichen wir in dieser
Anordnung vom zweiten Auftreten an alle Elemente heraus, so wird durch diese Anordnung eine bijektive Abbildung von einer Teilmenge N ⊂ N auf M beschrieben. Also ist
M höchstens abzählbar; wegen E1 ⊂ M und E1 ∼ N folgt, dass M abzählbar ist.
2
Satz 1.27.
Sei M eine abzählbare Menge und M n für n ∈ N die Menge aller n-Tupel (x1 , . . . , xn ) mit
xk ∈ M, also
M n := {(x1 , . . . , xn ) | xk ∈ M für 1 ≤ k ≤ n}.
Dann ist M n abzählbar.
Beweis: Durch Induktion nach n.
(I) Für n = 1 ist M 1 = M, also M 1 abzählbar.
(II) Sei n > 1 und M n−1 abzählbar; dann ist
M n = {(x1 , . . . , xn−1 , xn ) | mit (x1 , . . . , xn−1 ) ∈ M n−1 und xn ∈ M}
= {(y, xn ) | mit y ∈ M n−1 , xn ∈ M},
also
Mn =
[
xn ∈M
=
[
{(y, xn ) | y ∈ M n−1 }
y∈M n−1
{(y, xn ) | xn ∈ M}.
Für festes y ∈ M n−1 ist die Menge {(y, xn ) | xn ∈ M} abzählbar. Satz 1.26 liefert
dann die Abzählbarkeit von M n .
2
Folgerung 1.28.
Q ist abzählbar.
n
o
Beweis: Es ist Q = {0} ∪ m
| m, n ∈ Z \ {0} . Die Menge M := Z \ {0} ist abzählbar,
n
2
also nach Satz 1.27 auch M , d.h.: dass die Menge aller Paare (m, n) mit m, n ∈ M und
m
damit die Menge aller Brüche
abzählbar ist.
2
n
31
Satz 1.29.
Es sei F := {f | f : N → {0, 1}}; dann ist F überabzählbar. (F enthält alle Folgen, die
aus Nullen und Einsen gebildet werden können.)
Beweis: Sei E ⊂ F eine beliebige abzählbare Teilmenge von F , etwa E = {fk | k ∈ N};
wir konstruieren ein f ∈ F mit f 6∈ E. Dazu sei
f (k) :=



0 , falls fk (k) = 1
1 , falls fk (k) = 0
.
Dann ist f 6= fk für alle k ∈ N, denn es gilt f (k) 6= fk (k). Also ist jede abzählbare
Teilmenge von F eine echte Teilmenge von F . Damit ist F überabzählbar, denn andernfalls
wäre F eine echte Teilmenge von F .
2
Bemerkung.
R und R \ Q sind überabzählbar.
1.6 R als metrischer Raum
Aufgrund der Anordnung von R können wir einen Absolutbetrag einführen:
Definition 1.30.
Für x ∈ R heißt


|x| := 
x
für
−x
für
x≥0
x<0
Absolutbetrag von x. Wir können | · | : R ∋ x 7→ |x| ∈ R als Funktion auffassen; diese
Funktion erfüllt folgende Eigenschaften:
Satz 1.31.
Es seien x, y ∈ R; dann gilt:
(B1) |x| ≥ 0 und (|x| = 0 ⇔ x = 0).
(B2) |xy| = |x| · |y|
(B3) |x + y| ≤ |x| + |y|
(Dreiecksungleichung)
Beweis: (B1) ist klar; durch Diskussion aller möglichen Fälle sieht man (B2) ein.
Zu (B3): Wegen x ≤ |x| und y ≤ |y| folgt aus Axiom (O2) bzw. Satz 1.7:
x + y ≤ |x| + |y|.
32
Wegen −x ≤ |x| und −y ≤ |y| gilt auch
−(x + y) ≤ |x| + |y|.
Also ist
|x + y| ≤ |x| + |y|.
2
Folgerung 1.32.
Für x, y ∈ R gilt
a)
x
y =
|x|
, falls y 6= 0, und
|y|
b) ||x| − |y|| ≤ |x − y|
||x| − |y|| ≤ |x + y|.
sowie
Beweis: Zu a): Wegen x =
x
· y folgt nach (B2):
y
|x| =
x
· |y|,
y
|x| x d.h.
= |y| y Zu b): Sei u := x + y und v := −y; dann gilt nach (B3):
|u + v| ≤ |u| + |v|,
d.h.
|x| ≤ |x + y| + |y| wegen | − y| = |y|
oder
|x| − |y| ≤ |x + y|.
Entsprechend folgt mit u := x + y und v := −x:
|y| ≤ |x + y| + |x|
oder
−(|x| − |y|) ≤ |x + y|.
Insgesamt heißt das: ||x| − |y|| ≤ |x + y|. Die erste Ungleichung in b) folgt aus der zweiten
wegen | − y| = |y|.
2
Im Zusammenhang mit Abschätzungen sind folgende Aussagen nützlich:
Satz 1.33.
Seien ε > 0, x0 , x ∈ R; dann gilt:
(−)
(−)
(−)
a) |x| < ε ⇔ −ε < x < ε
33
(−)
(−)
(−)
b) |x − x0 | < ε ⇔ x0 − ε < x < x0 + ε.
Beweis: Zu a): Folgt sofort aus x ≤ |x| durch die Fallunterscheidung x ≥ 0 bzw. x < 0.
Zu b): Nach a) gilt
|x − x0 | < ε ⇔ −ε < x − x0 < ε
⇔ x0 − ε < x < x0 + ε.
2
Wir führen an dieser Stelle Abkürzungen für spezielle Mengen in R ein:
Definition 1.34.
Seien a, b ∈ R mit a < b gegeben; dann sei
[a, b]
(a, b) :=]a, b[
(a, b] :=]a, b]
:= {x ∈ R | a ≤ x ≤ b} das abgeschlossene Intervall,
:= {x ∈ R | a < x < b} das offene Intervall,
:= {x ∈ R | a < x ≤ b} das links offene
bzw. [a, b) := [a, b[ := {x ∈ R | a ≤ x < b} das rechts offene
a+b
b−a
Intervall mit den Randpunkten a und b. Ist x0 :=
der Mittelpunkt und r :=
2
2
der Radius eines Intervalls mit den Randpunkten a und b, so schreiben wir auch
Kr (x0 ) :=]a, b[= {x ∈ R | |x − x0 | < r}
bzw.
Schließlich sei noch
K r (x0 ) := [a, b] = {x ∈ R | |x − x0 | ≤ r}.
(−∞, a) :=] − ∞, a[:= {x ∈ R | x < a},
(−∞, a] :=] − ∞, a] := {x ∈ R | x ≤ a},
(a, ∞) :=]a, ∞[:= {x ∈ R | x > a},
[a, ∞) := [a, ∞[:= {x ∈ R | x ≥ a},
(−∞, ∞) := ] − ∞, ∞[:= R.
Satz 1.35.
Eine Menge M ⊂ R ist genau dann nach oben und nach unten beschränkt, wenn ein r > 0
existiert mit M ⊂ K r (0).
Beweis:
>: Sei a eine untere Schranke und b eine obere Schranke für M, so ist r := max(|a|, |b|)
eine obere und −r eine untere Schranke für M; also gilt nach Satz 1.33 für alle
x ∈ M : |x| ≤ r. O.B.d.A. können wir r > 0 annehmen.
34
<: Ist M ⊂ K r (0), so gilt für alle x ∈ M:
−r ≤ x ≤ r;
also ist −r eine untere und r eine obere Schranke von M.
2
Mit Hilfe des Absolutbetrages können wir den Abstand d(x, y) zweier reeller Zahlen x
und y definieren durch
d(x, y) := |x − y|.
Aufgrund der Eigenschaften des Betrages folgt:
d(x, y) = 0 ⇔ x = y
d(x, y) = d(y, x)
sowie
d(x, y)
≤ d(x, z) + d(z, y)
(|x − y| = |(x − z) + (z − y)| ≤ |x − z| + |z − y|)
Diese Eigenschaften fordert man ganz allgemein für eine Abstandsfunktion auf einer beliebigen (nichtleeren) Menge X:
Definition 1.36.
(i) Ist d : X × X → R eine Abbildung mit den Eigenschaften:
(Me 1)
(Me 2)
(Me 3)
d(x, y) = 0 ⇔ x = y
d(x, y) = d(y, x) für alle x, y ∈ X
d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z ∈ X (Dreiecksungleichung),
so heißt (X, d) ein metrischer Raum; d heißt Metrik oder Abstandsfunktion und
d(x, y) der Abstand der Punkte x und y (bzgl. der Metrik d).
(Bemerkungen:
a)
Es gilt stets d(x, z) ≥ 0. Aus (Me 1) bis (Me 3) folgt nämlich für y = x:
0 = d(x, x) ≤ d(x, z) + d(z, x) = 2d(x, z).
b)
Mit der oben definierten Abbildung ist (R, d) ein metrischer Raum.)
(ii) Es sei V ein Vektorraum über K (K = R oder C). Eine Abbildung k · k : V → R
heißt Norm (auf V ), wenn gilt:
(N1)
(N2)
(N3)
kxk ≥ 0 ∀ x ∈ V , kxk = 0 ⇔ x = 0 ∈ V
kλxk = |λ| kxk ∀ x ∈ V, ∀ λ ∈ K
kx + yk ≤ kxk + kyk ∀ x, y ∈ V .
Ein Vektorraum mit einer Norm heißt normierter Raum . d0 (x, y) := kx − yk heißt
Abstand von x und y. Man verifiziere zur Übung, dass d0 : V × V → R eine Metrik
auf V definiert; mann nennt d0 die von der Norm induzierte Metrik .
35
Wir wollen weitere Beispiele für metrische Räume kennenlernen. Zuvor halten wir noch
eine allgemeine Eigenschaft fest:
Satz 1.37. (Vierecksungleichung)
Sind x1 , x2 , y1, y2 vier Punkte in einem metrischen Raum (X, d), so gilt:
|d(x1 , x2 ) − d(y1 , y2 )| ≤ d(x1 , y1) + d(x2 , y2 ).
Beweis: Zweimalige Anwendung von (Me 3) liefert:
d(x1 , x2 ) ≤ d(x1 , y1 ) + d(y1, x2 )
≤ d(x1 , y1 ) + d(y1, y2 ) + d(y2 , x2 ),
d.h.
(∗)
bzw.
d(x1 , x2 ) − d(y1 , y2) ≤ d(x1 , y1 ) + d(x2 , y2)
d(y1, y2 ) ≤ d(y1 , x1 ) + d(x1 , y2 )
≤ d(y1 , x1 ) + d(x1 , x2 ) + d(x2 , y2 )
oder
(∗∗)
d(y1, y2 ) − d(x1 , x2 ) ≤ d(x1 , y1 ) + d(x2 , y2 ).
(∗) und (∗∗) ergeben die Behauptung.
2
Wegen
0 ≤ (a − b)2 = a2 − 2ab + b2
d.h.
4ab ≤ a2 + 2ab + b2 = (a + b)2
erhalten wir für a, b ∈ [0, ∞[ folgende Beziehung zwischen dem geometrischen und dem
arithmetischen Mittel
√
1
a+b
.
ab = (ab) 2 ≤
2
Mit Hilfe dieser Ungleichung beweisen wir
Satz 1.38. (Cauchy-Schwarzsche Ungleichung)
Für reelle Zahlen a1 , . . . , an , b1 , . . . , bn gilt:
n
X
k=1
|ak bk | ≤
Beweis: Sei
A :=
n
X
n
X
k=1
a2k
k=1
!1
a2k
!1
2
·
2
,
B :=
n
X
b2k
k=1
n
X
k=1
!1
b2k
2
.
!1
2
.
36
Es ist A = 0 ⇔ ak = 0 für 1 ≤ k ≤ n bzw. B = 0 ⇔ bk = 0 für 1 ≤ k ≤ n. In diesen
Fällen ist nichts mehr zu beweisen. Deshalb setzen wir A > 0 und B > 0 voraus. Mit
|ak |
|bk |
αk :=
bzw. βk :=
erhalten wir nach der obigen Ungleichung:
A
B
n
X
k=1
|ak bk | = AB
≤ AB
n
X
k=1
αk2 βk2
k=1
n
X
αk2
+
2
k=1
n
X
AB
=
2
αk2
+
k=1
βk2
2
!
n
X
βk2
k=1
!
n
n
1 X
1 X
2
a
+
b2
A2 k=1 k B 2 k=1 k
AB
=
2
=
αk βk = AB
n q
X
!
AB
(1 + 1) = AB.
2
2
Bemerkungen.
(i) Aufgrund der Dreiecksungleichung gilt:
n
X
k=1
ak bk ≤
n
X
ak bk k=1
≤
n
X
k=1
|ak bk |.
(ii) Setzt man für die Spaltenvektoren a = (a1 , . . . , an )T und b = (b1 , . . . , bn )T aus Rn
(sowie analog für n-dimensionale Zeilenvektoren a, b)
ha, bi :=
n
X
ak bk
(Skalarprodukt von a und b)
k=1
und
kak2 := kak :=
n
X
a2k
k=1
!1
2
(Euklidische Norm von a),
so lautet die Cauchy-Schwarzsche Ungleichung
| ha, bi |≤
n
X
k=1
|ak bk | ≤
n
X
k=1
a2k
!1
2
·
n
X
k=1
b2k
!1
2
= kak · kbk.
Dass die Euklidische Norm eine Norm im Sinne von Definition 1.36 ist ergibt sich wegen
kak ≥ 0 und kλak = |λ| kak ∀ a ∈ Rn , ∀ λ ∈ R aus
37
Satz 1.39. (Minkowski-Ungleichung)
Für reelle Zahlen a1 , . . . , an , b1 , . . . , bn gilt:
n
X
ka + bk =
(ak + bk )2
k=1
Beweis: O.B.d.A. können wir
n
X
!1
2
≤
n
X
a2k
k=1
!1
n
X
2
+
b2k
k=1
!1
2
= kak + kbk.
(ak + bk )2 > 0 voraussetzen. Dann gilt nach Satz 1.38:
k=1
n
X
(ak + bk )2 =
k=1
n
X
(ak + bk )ak +
n
X
|ak + bk | |ak | +
k=1
≤
k=1
Division durch
n
X
(ak + bk )
k=1
(ak
k=1
2
!1
(ak + bk )bk
k=1
n
X
≤
n
X
n
X
k=1
!1 
2
+ bk )2 
|ak + bk | |bk |
n
X
a2k
k=1
!1
2
+
n
X
k=1
!1 
2
b2  .
k
2
ergibt die Behauptung.
2
Als Anwendungsbeispiel erhalten wir die vom R2 bzw. R3 her bekannte Abstandsfunktion:
Satz 1.40.
Wir definieren auf dem Rn × Rn eine Abbildung d2 durch
d2 (x, y) = d2 ((x1 , . . . , xn ), (y1 , . . . , yn )) :=
n
X
(xk − yk )2
k=1
!1
2
= kx − yk2;
dann ist (Rn , d2 ) ein metrischer Raum und d2 die sog. euklidische Metrik.
Beweis: (Me 1) und (Me 2) sind klar. Sind (x1 , . . . , xn )T , (y1, . . . , yn )T und (z1 , . . . , zn )T ∈
Rn , so ergibt sich (Me 3) aus der Minkowski-Ungleichung, wenn wir ak = xk − zk und
bk = zk − yk für 1 ≤ k ≤ n setzen:
n
X
(xk − yk )
k=1
2
!1
2
≤
n
X
(xk − zk )
k=1
2
!1
2
+
n
X
(zk − yk )
k=1
2
!1
2
,
d.h.
d2 ((x1 , . . . , xn ), (y1, . . . , yn )) ≤ d2 ((x1 , . . . , xn ), (z1 , . . . , zn )) + d2 ((z1 , . . . , zn ), (y1 , . . . , yn )).
2
38
Bemerkung.
Ist n = 2, so erhalten wir
d2 ((x1 , x2 ), (y1 , y2)) =
q
(x1 − y1 )2 + (x2 − y2 )2 ,
also die nach dem Satz des Pythagoras definierte Entfernung der Punkte (x1 , x2 ) und
(y1 , y2 ) im cartesischen Koordinatensystem.
Satz 1.41.
Auf dem Rn werden durch
d1 ((x1 , . . . , xn ), (y1 , . . . , yn )) :=
n
X
k=1
bzw.
|xk − yk | =: kx − yk1
d∞ ((x1 , . . . , xn ), (y1 , . . . , yn )) := max{ |xk − yk | ; 1 ≤ k ≤ n} =: kx − yk∞
zwei Metriken definiert.
Beweis: (Me 1) und (Me 2) sind jeweils klar.
Zu (Me 3): Sei x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) und z = (z1 , . . . , zn ); dann folgt
d1 (x, y) =
n
X
|(xk − zk ) + (zk − yk )|
n
X
(|xk − zk | + |zk − yk |) =
k=1
≤
k=1
n
X
k=1
|xk − zk | +
n
X
k=1
|zk − yk |
= d1 (x, z) + d1 (z, y)
sowie
letzteres wegen
d∞ (x, y) ≤ d∞ (x, z) + d∞ (z, y),
max{|ak + bk | | 1 ≤ k ≤ n} ≤ max{|ak | | 1 ≤ k ≤ n} + max{|bk | | 1 ≤ k ≤ n}
angewendet auf ak = xk − zk , bk = zk − yk .
2
Beispiel 1.42. (Französische Eisenbahnmetrik)
Wir wählen einen beliebigen, aber festen Punkt P0 aus dem R2 und definieren
d : R2 × R2 → R durch
d(P1 , P2 ) = d2 (P1 , P2 ),
falls P1 und P2 auf einer Geraden durch P0 liegen bzw.
d(P1 , P2 ) = d2 (P1 , P0 ) + d2 (P2 , P0 ),
falls P1 und P2 nicht auf einer solchen Geraden liegen. Dann ist d eine Metrik auf dem
R2 . Beweis als Übung.
Um z.B. mit der Eisenbahn von Versailles (P1 ) nach Reims (P2 ) zu kommen, muss man
die Entfernungen von Versailles nach Paris (P0 ) und die von Paris nach Reims addieren.
Um von Reims nach Chartres zu gelangen, kann man direkt die Entfernung von Reims
nach Chartres zurücklegen.
39
Versailles
Reims
Paris
Chartres
Abbildung 2: Französische Eisenbahnmetrik
1.7 Komplexe Zahlen
Definition 1.43.
Eine komplexe Zahl ist ein Paar z = (x, y) reeller Zahlen. Dabei ist z1 = (x1 , y1) gleich
z2 = (x2 , y2 ), wenn x1 = x2 und y1 = y2 gilt. Wir definieren Summe bzw. Produkt
komplexer Zahlen durch
z1 + z2 := (x1 + x2 , y1 + y2 )
und
z1 z2 := (x1 x2 − y1 y2 , x1 y2 + x2 y1 ).
Dann gilt
Abbildung 3: Darstellung und Addition komplexer Zahlen
Satz 1.44.
Die Menge C aller komplexen Zahlen bildet mit den Verknüpfungen aus Definition 1.43
einen Körper mit dem neutralen Element (0, 0) bzgl. + und (1, 0) bzgl. · .
Beweis: Die Axiome (A1) bis (A4) sind für die Tupel (x, y) erfüllt, da R ein Körper ist
und die Addition komponentenweise definiert ist. Es gilt −z = −(x, y) = (−x, −y).
40
Zu (M1):
(z1 z2 )z3 = (x1 x2 − y1 y2 , x1 y2 + x2 y1 ) · (x3 , y3)
= (x1 x2 x3 − x3 y1 y2 − x1 y2 y3 − x2 y1 y3 , x1 x2 y3 − y1 y2 y3 + x1 x3 y2 + x2 x3 y1 )
z1 (z2 z3 ) = (x1 , y1)(x2 x3 − y2 y3 , x2 y3 + x3 y2 )
= (x1 x2 x3 − x1 y2 y3 − x2 y1 y3 − x3 y1 y2 , x1 x2 y3 + x1 x3 y2 + x2 x3 y1 − y1 y2 y3 )
(M2) und (M3) sind klar.
Zu (M4): Es ist mit
z
für z 6= 0:
zz
−1
=
−1
= (x, y)
−1
=
x
y
,− 2
2
2
x +y
x + y2
!
y2
−xy
xy
x2
+
, 2
+ 2
2
2
2
2
2
x +y
x +y x +y
x + y2
(D) ergibt sich durch eine ähnliche Rechnung wie bei (M1).
!
= (1, 0).
2
Folgerung 1.45.
Es gilt für xi ∈ R:
(x1 , 0) + (x2 , 0) = (x1 + x2 , 0)
sowie
(x1 , 0) (x2 , 0) = (x1 x2 , 0).
Das zeigt, dass die komplexen Zahlen der Form (x, 0) dieselben arithmetischen Eigenschaften wie die entsprechenden reellen Zahlen x haben. Deshalb können wir (x, 0) als neue
Bezeichnung für x ∈ R auffassen. Vermöge dieser Identifikation ist R ein Unterkörper von
C oder C eine Erweiterung von R. Setzen wir noch i := (0, 1), so gilt
(0, y) = (0, 1) (y, 0) = iy,
i2 = (0, 1) (0, 1) = (−1, 0) = −1,
also
(x, y) = (x, 0) + (0, y) = x + iy.
Da wir beim Beweis des Binomischen Lehrsatzes nur die Körperaxiome benutzt haben,
gilt dieser auch für komplexe Zahlen, d.h.
Satz 1.46.
Für a, b ∈ C und n ∈ N gilt mit a0 = b0 := 1:
n
(a + b) =
n
X
k=0
!
n n−k k
a b ,
k
41
also z.B.:
(1 + i)2 = 1 + 2i + i2 = 2i.
Definition 1.47.
Ist z = x + iy ∈ C, so heißt z := x − iy die zu z konjugiert komplexe Zahl, x der Realteil
(x = Re z) und y der Imaginärteil (y = Im z) von z.
Folgerung 1.48.
Für z, w ∈ C gilt:
a) z + w = z + w
b) zw = z w
c) z + z = 2 Re z,
z − z = 2i Im z
d) zz = (Re z)2 + (Im z)2 ≥ 0 und (zz = 0 ⇔ z = 0)
Beispiele 1.49.
Es ist für z = x + iy, w = u + iv ∈ C und w 6= 0 auch w 6= 0, also
z
zw
zw
zw
=
=
= 2
.
w
ww
ww
u + v2
Das erleichtert häufig die Berechnung von Quotienten komplexer Zahlen, so ist z.B.:
1
1−i
1 1
=
= − i
1+i
2
2 2
1
= −i ,
i
und
1 + 2i
1 + 2i
(1 + 2i)(−5 − 12i)
19
22
=
=
=
−
i.
2
2
2
(2 + 3i)
−5 + 12i
5 + 12
169 169
Definition 1.50.
1
Ist z ∈ C, so heißt |z| := (zz) 2 =
z = x + iy.
√
x2 + y 2 =
q
(Re z)2 + (Im z)2 der Absolutbetrag von
Bemerkung.
Im Allgemeinen gilt für komplexe Zahlen: |z|2 6= z 2 . Wähle z.B. z = i; dann ist |z|2 = 1
und z 2 = i2 = −1. Ist z reell, so gilt
1
2
1
2
(zz) = (z 2 ) =



z
für
−z
für
z≥0
z<0
.
Also stimmt dann der reelle Absolutbetrag mit dem komplexen überein.
42
wz
y
z
v
w
a+b
a
b
x
1
u
Abbildung 4: Multiplikation komplexer Zahlen
Geometrische Interpretation der Multiplikation komplexer Zahlen
Gehen wir vom naiven Verständnis der Sinus- bzw. Cosinus-Funktion aus, so gilt für ein
Tupel z = (x, y) ∈ R2
cos α =
also
x
y
und sin α =
,
|z|
|z|
z = (|z| cos α, |z| sin α) = |z|(cos α + i sin α) =: |z|eiα := reiα .
Dies ist die Darstellung von |z| in Polarkoordinaten; hierbei ist r = |z| der Betrag von |z|,
α heißt Argument von |z| (und ist nur modulo 2π, d.h. bis auf Vielfache von 2π bestimmt).
Hier wollen wir den Winkel zwischen der positiven Realteil-Achse und der Verbindungsgeraden durch z und 0 im Bogenmaß mit 0 ≤ α < 2π gegen den Uhrzeigersinn messen.
Ist nun w = (u, v) eine weitere komplexe Zahl, deren Verbindungsgerade durch w und
den Nullpunkt mit der positiven Re-Achse den Winkel β einschließt, so folgt aufgrund
der Additionstheoreme für die Sinus- bzw. Cosinus-Funktion
z w = xu − yv + (yu + xv)i
= |z| |w| [(cos α cos β − sin α sin β) + (cos α sin β + sin α cos β)i]
= |z| |w|[cos(α + β) + i sin(α + β)] .
Zwei komplexe Zahlen werden also miteinander multipliziert, indem man die Absolutbeträge multipliziert und die Argumente, das sind die Winkel mit der positiven RealteilAchse, addiert. Daraus erhalten wir induktiv die sog. Moivresche Formel
z n = |z|n [cos nα + i sin nα] = |z|n einα .
43
Abbildung 5: z = eit = cos t + i sin t, t = arg z
Auf eine exakte Begründung dieser Sachverhalte (d.h. ohne naives Verständnis der trigonometrischen Funktionen) gehen wir später ein.
Weiter ist für z 6= 0 mit r = |z|:
1
z
1
=
= 2 (|z| (cos(−α) + i sin(−α))
z
zz
r
1
(cos α − i sin α) ,
r
woraus sich die Gültigkeit der Moivreschen Formel für n ∈ Z ergibt.
=
1
Sowohl für das Produkt zweier komplexer Zahlen als auch für die Kehrwertbildung
z
lassen sich geometrische Konstruktionen mit Hilfe des Strahlen- und des Kathetensatzes
angeben. Wir betrachten zunächst die Multiplikation zweier komplexer Zahlen.
zw liegt auf dem vom Nullpunkt ausgehenden Strahl, der mit der positiven Realteilachse
den Winkel α + β einschließt. Der Abstand vom Nullpunkt ergibt sich aus dem Strahlensatz: ziehen wir eine Parallele zu der Geraden durch (1, 0) und w durch den Punkt (|z|, 0),
so gilt für den Schnittpunkt u dieser Geraden mit der Geraden durch (0, 0) und w:
|z|
|u|
=
|w|
1
oder
|u| = |w||z| = |wz| .
Schlagen wir also einen Kreisbogen um (0, 0) mit Radius |u|, so schneidet dieser Bogen
den von (0, 0) ausgehenden Strahl mit Winkel α + β im Punkt zw.
w
Die Division
zweier komplexer Zahlen z, w ∈ C können wir zurückführen auf die Mulz
1
tiplikation von w mit . Deshalb beschäftigen wir uns nun mit der Inversenbildung einer
z
44
komplexen Zahl z. Es ist
1
z
= 2 ,
z
|z|
1
auf dem vom Nullpunkt (0, 0) ausgehenden Strahl, der mit der positiven Rez
alteilachse den Winkel −α einschließt, d.h. der durch (0, 0) und z geht. Wir unterscheiden
die Fälle |z| > 1, |z| = 1 und |z| < 1. Sei zunächst |z| > 1 (vgl. Abbildung 6).
also liegt
z=x+iy
s
w
x-iy
Abbildung 6: Inverse komplexer Zahlen (|z| > 1)
Wir zeichnen über dem Durchmesser von (0, 0) zu z den Thaleskreis; dieser schneidet den
Einheitskreis im Punkt s. Von s fällen wir das Lot auf den Durchmesser; der Lotfußpunkt
sei w. Dann gilt nach dem Kathetensatz
|w||z| = 12 = 1 ,
woraus
|w| =
1
1
=
|z|
|z|
folgt.
Ist |z| < 1 (vgl. Abbildung 7), so errichten wir in z das Lot auf der Geraden durch (0, 0)
und z; dieses Lot schneidet den Einheitskreis in s. Wir zeichnen ein rechtwinkliges Dreieck
mit den Eckpunkten (0, 0) und s und dem rechten Winkel im Punkt s. Der freie Schenkel
schneidet die Gerade durch (0, 0) und z im Punkt w, für den nach dem Kathetensatz gilt:
|w||z| = 12 = 1 ,
woraus wie im ersten Fall die Behauptung folgt.
45
w
x-iy
z
s
Abbildung 7: Inverse komplexer Zahlen (|z| < 1)
Ist schließlich |z| = 1, so ist
1
= z.
z
Abschließend halten wir noch einmal die wesentlichen Eigenschaften des Absolutbetrages
in C fest:
Satz 1.51.
Im Folgenden seien z, w ∈ C; dann gilt:
a) |z| ≥ 0,
|z| = 0 ⇔ z = 0
b) |z| = |z|
c) |zw| = |z| |w|
d) |Re z| ≤ |z|, |Im z| ≤ |z|
e) |z + w| ≤ |z| + |w|.
Beweis: a) und b) sind klar. Zu c): Es ist
|zw|2 = zw zw = zw z w = zz ww = |z|2 |w|2 .
Daraus folgt durch Wurzelziehen
|zw| = |z||w|.
46
Zu d): Es ist
|Re z| =
q
(Re z)2 ≤
analog folgt die zweite Relation.
q
(Re z)2 + (Im z)2 = |z|,
Zu e): Es gilt unter Verwendung von d):
|z + w|2 = (z + w)(z + w) = zz + zw + wz + ww
= |z|2 + zw + zw + |w|2
= |z|2 + 2Re(zw) + |w|2
≤ |z|2 + 2 |zw| + |w|2
= |z|2 + 2 |z| |w| + |w|2
= |z|2 + 2 |z| |w| + |w|2 = (|z| + |w|)2.
2
Ergänzende Bemerkungen.
(i) Betrachten wir auf C die durch den Absolutbetrag induzierte Metrik mit
d(z, w) = |z − w|,
so erhalten wir gerade den R2 mit der euklidischen Metrik d2 , wenn wir C nur als
Menge und nicht als Körper auffassen.
Sind a1 , . . . , an , b1 , . . . , bn komplexe Zahlen, so gilt nach Satz 1.51 und Satz 1.38
n
X
ak bk k=1
≤
n
X
k=1
|ak ||bk | ≤
n
X
k=1
|ak |
2
!1
2
·
n
X
k=1
|bk |
2
k=0
π
4
+π
π
4
Abbildung 8: Quadratwurzeln aus a = i, i.e. n = 2
!1
2
.
47
(ii) Multiplikation (in Polarkoordinaten): Sind z1 = r1 eiϕ1 und z2 = r2 eiϕ2 gegeben, so
ist
z1 · z2 = r1 r2 eiϕ1 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) .
Also: Multiplikation der Beträge, Addition der Argumente.
Aus der Moivre’schen Formel erhalten wir damit z.B. zwei Zahlen z ∈ C mit z 2 = i.
Allgemein kann man zeigen: Sei a = |a|eiα 6= 0. Dann besitzt die Gleichung
zn = a
genau n verschiedene Lösungen in C, nämlich
ζk =
q
n
α
2π
|a| ei( n +k n ) , 0 ≤ k ≤ n − 1.
Entsprechend gibt es 8 Zahlen z ∈ C mit z 8 = 1, die sog. 8-ten Einheitswurzeln.
cw
2
cw
w3 c
w4
w8 = 1
2π
8
c
w5
c
c
c
w7
c
w6
Abbildung 9: 8-te Einheitswurzeln
Beachte: Es gilt offenbar ζkn = a für 0 ≤ k ≤ n − 1.
2π
Im Fall a = 1, d.h. α = 0, ergeben sich mit ζk = eik n die n-ten Einheitswurzeln .
48
1.8 Gleitpunktarithmetik und Rundungsfehler
1.8.1 Darstellungen natürlicher Zahlen
Das Rechnen im Dezimalsystem ist uns so vertraut, dass wir uns nicht in jeder Situation
klar machen, dass die Zahl 1654 eigentlich die Bedeutung hat
1 · 103 + 6 · 102 + 5 · 101 + 4 · 100 .
An Stelle der Potenzen der Zahl 10 können wir auch Potenzen einer anderen natürlichen
Zahl p ≥ 2 wählen. Jede natürliche Zahl kann dann mit Hilfe dieser sog. Basen p dargestellt
werden, z.B. als
Dualzahl
Dezimalzahl
Oktalzahl
Hexadezimalzahl
(p = 2),
(p = 10),
(p = 8),
(p = 16).
Wir überlegen uns zuerst, welche Zahlen als endliche Linearkombination von Potenzen
einer Basis p dargestellt werden können.
Ist
n=
k
X
i=0
ai · pi
eine solche Linearkombination mit 0 ≤ ai < p, so gilt stets
0 ≤ n < pk+1 .
Dies ergibt sich sofort aus folgender Abschätzung
0≤
k
X
i=0
ai · pi ≤
k
X
i=0
(p − 1) · pi = pk+1 − 1 < pk+1 .
Um die Umkehrung dieser Aussage zu beweisen, benutzen wir folgende allgemeingültige
Aussage über die ganzzahlige Division mit Rest:
Sind a, b ∈ N, so existieren ein x ∈ N0 und ein r ∈ N0 mit 0 ≤ r < b derart, dass
a= x·b+r
gilt. Unter Verwendung dieser Aussage beweisen wir
Satz 1.52.
Sei p ∈ N, p > 1 gegeben (sog. Basis) und k ∈ N0 . Dann besitzt jede Zahl n ∈ N0 mit
0 ≤ n < pk+1 eine eindeutig bestimmte Darstellung der Form
n=
k
X
i=0
ai · pi
mit 0 ≤ ai < p.
Die Zahlen ai heißen Ziffern der Zahldarstellung, jede Darstellung einer Zahl n zur Basis
p heißt p-adische Darstellung.
49
Beweis:
(i) Wir zeigen die Existenz der obigen Darstellung mit Hilfe vollständiger Induktion
über k.
Induktionsanfang (k = 0):
Für k = 0 sind alle Zahlen n mit 0 ≤ n < p Ziffern, d.h. n =
0 ≤ a0 < p.
0
P
i=0
ai · pi = a0 mit
Induktionsschritt (k → k + 1):
Nach der obigen Aussage über die Division mit Rest läßt sich eine Zahl n ∈ N0 mit
0 ≤ n < pk+2 in der Form
n = xpk+1 + n′
mit 0 ≤ n′ < pk+1 darstellen.
Die Annahme x ≥ p führt wegen
n = xpk+1 + n′ ≥ p · pk+1 + n′ ≥ pk+2
zu einem Widerspruch. Also ist x eine Ziffer.
Wegen 0 ≤ n′ < pk+1 liefert die Induktionsvoraussetzung:
k
X
n′ =
i=0
ai · pi
woraus insgesamt
n = x · pk+1 +
k
X
i=0
ai · pi =
k+1
X
i=0
ai · pi
mit ak+1 = x folgt. Also gilt die Behauptung für k + 1.
(ii) Die Eindeutigkeit beweisen wir ebenfalls mit vollständiger Induktion über k
Induktionsanfang (k = 0):
Aus n = a0 · p0 = a′0 · p0 folgt direkt a0 = a′0 (= n)
Induktionsschritt von k auf k + 1:
Seien
k+1
X
i=0
i
ai · p =
dann ergibt sich aus der Darstellung
n = ak+1 · p
k+1
+
k
X
i=0
k+1
X
i=0
i
a′i · pi = n ;
ai · p =
a′k+1
·p
k+1
+
k
X
i=0
a′i · pi
bei Division durch pk+1 wegen
k
X
i=0
ai · pi < pk+1
und
k
X
i=0
a′i · pi < pk+1
50
zunächst
ak+1 = a′k+1
und damit
k
X
i=0
i
ai · p =
k
X
i=0
a′i · pi .
Die Induktionsvoraussetzung liefert dann
ai = a′i
für 0 ≤ i ≤ k .
Zusammen folgt:
ai = a′i ,
für 0 ≤ i ≤ k + 1 .
2
Korollar 1.53. (Bestimmung der Ziffern einer p-adischen Darstellung)
Ist n =
k
P
i=0
ai · pi , 0 ≤ ai < p, so gelten für 0 ≤ i ≤ k die Beziehungen
(i) ai = (n div pi ) mod p = ((n div pi−1 ) div p) mod p,
(ii) ai = (n mod pi+1 ) div pi .
Hierzu bezeichnet mod den Rest bei der ganzzahligen Division und div den ganzzahligen
Anteil bei der Division. Ist also a = xb + r mit 0 ≤ r < b, so ist a mod b = r und
a div b = x.
Beweis: Sei i0 ∈ {0, . . . , k} fest gewählt.
Zu (i): Aus
n=
k
X
i=0
=
ai · pi =
iX
0 −1
i=0
iX
0 −1
i=0
ai · pi + ai0 · pi0 +
ai · pi + ai0 · pi0 + pi0 ·
k
X
i=i0 +1
k
X
i=i0 +1
ai · pi
ai · pi−i0
folgt
n div pi0 = ai0 +
k
X
i=i0 +1
ai · pi−i0 = ai0 + p ·
k
X
i=i0 +1
ai · pi−i0 −1
mit ai0 < p; also ist
(n div pi0 ) mod p = ai0 .
Um die zweite Darstellung in (i) zu beweisen gehen wir von
n div pi0 −1 = ai0 −1 +
k
X
i=i0
ai · pi−i0 +1 = ai0 −1 + p ·
aus, woraus sofort
(n div pi0 −1 ) div p =
k
X
i=i0
ai · pi−i0
k
X
i=i0
ai · pi−i0
51
folgt; hieraus ergibt sich wegen
k
X
i=i0
ai · pi−i0 = ai0 + p ·
k
X
i=i0 +1
ai · pi−i0 −1
die Behauptung
((n div pi0 −1 ) div p) mod p = ai0 .
Zu (ii): Aus
n=
k
X
i=0
ai · pi =
i0
X
i=0
ai · pi +
k
X
i=i0+1
ai · pi
folgt
n mod pi0 +1 =
i0
X
i=0
mit
ai · pi =
iX
0 −1
i=0
Also ist
iX
0 −1
i=0
ai · pi + ai0 · pi0
ai · pi < pi0 .
(n mod pi0 +1 ) div pi0 = ai0 .
2
Bemerkung
Ist die Zahl p vorgegeben, so schreiben wir die p−adische Darstellung einer Zahl
n=
k
X
i=0
ai · pi
auch in der Form
(ak ak−1 . . . a0 )p .
Beispiel 1.54.
(i) Die Zahl 236 zur Basis p = 8 lässt sich folgendermaßen in das Dezimalsystem umwandeln:
2368 = 2 · 82 + 3 · 81 + 6 · 80
= ((2 · 8) + 3) · 8 + 6)
= 15810 .
← Hornerschema
(ii) Will man 15810 zur Basis 3 darstellen, so dividieren wir sukzessive nach den Regeln
aus Korollar 1.53:
a0 = (158 div 30 ) mod 3 = 2,
a1 = (158 div 31 ) mod 3 = 52 mod 3 = 1,
a2 = (158 div 32 ) mod 3 = ((158 div 31 ) div 3) mod 3
= (52 div 3) mod 3,
= 17 mod 3 = 2,
52
a3 = (158 div 33 ) mod 3 =
=
=
4
a4 = (158 div 3 ) mod 3 =
=
=
5
a5 = (158 div 3 ) mod 3 =
=
((158 div 32 ) div 3) mod 3
(17 div 3) mod 3
5 mod 3 = 2,
((158 div 33 ) div 3) mod 3
(5 div 3) mod 3
1 mod 3 = 1
((158 div 34 ) div 3) mod 3
(1 div 3) mod 3 = 0.
Also ist
2368 = 15810 = 122123 = (((1 · 3 + 2) · 3 + 2) · 3 + 1) · 3 + 2 .
(iii) Im Hexadezimalsystem verwendet man üblicherweise die Ziffernsymbole
0, 1, . . . , 9, A, B, C, D, E, F.
Dabei ist
A16 = 1010
B16 = 1110
..
.
E16 = 1410
F16 = 1510
Für 15810 gilt im Hexadezimalsystem für die Ziffern dann
a0 = 158 mod 16 (= 1410 ) = E
a1 = (158 div 16) mod 16 = 9
Also
15810 = 9E16 = 9 · 16 + 14 .
1.8.2 Die p–al–Bruch–Darstellung der reellen Zahlen
Wir betrachten nun bei gegebenem p ≥ 2 Zahlen der Form
k
X
n=1
cn · p−n
mit 0 ≤ cn < p, etwa im Fall p = 2 die Zahl
1 1
1
1
53
+ +
+
=
= 0.828125 .
2 4 16 64
64
53
Wir gehen der Frage nach, welche Zahlen bei gegebenem p ≥ 2 in der obigen Form
1
dargestellt werden können. Betrachten wir z.B. für p = 10 die Zahl a = , so gilt für jede
3
natürliche Zahl k ≥ 1 mit
ak :=
k
X
n=1
und
bk :=
k
X
n=1
die Ungleichung
3 · 10−n = 0.33 . . . 3
3 · 10−n + 4 · 10−(k+1)
ak <
1
< bk
3
mit
bk − ak = 4 · 10−(k+1) .
Je größer wir k wählen, umso kleiner wird die Differenz zwischen ak und bk . Man kann
aber für keine endliche Summe der Form
k
X
n=1
cn · 10−n
1
ergibt. Wir erhalten aber eine Folge (ak )k≥1
3
1
von Zahlen, die sich erst in der (k + 1)−sten Stelle von unterscheiden.
3
Wir können uns mit Kenntnissen aus der Zinseszins-Rechnung veranschaulichen, dass wir
1
bei immer größer werdendem k die Zahl beliebig genau annähern können. Es ist nämlich
3
für q 6= 1:
1 − q k+1
,
1 + q + . . . + qk =
1−q
also
1 − qk
q + . . . + q k = q(1 + . . . + q k−1 ) = q
.
1−q
Damit lässt sich die Zahl ak folgendermaßen darstellen:
mit 0 ≤ cn < 9 erreichen, dass sich der Wert
ak = 3 ·
und wir erhalten
k X
n=1
1
10
n
k
1
3 1 − 10
=
·
1
10
1 − 10
1
1
= · 1−
3
10
k !
,
1 1 k
1
− ak =
,
3
3 10
also z.B. für k = 6 einen Unterschied von 3-Millionstel. Da wir die Differenz beliebig klein
machen können, schreiben wir (was wir später präzisieren werden)
∞
X
1
1
=3·
3
n=1 10
n
.
54
Mit diesem intuitiven Verständnis des Zeichens
∞
X
beweisen wir folgenden
n=0
Satz 1.55 (Entwicklung in p–al–Brüche).
Sei p ≥ 2, p ∈ N. Jede nichtnegative reelle Zahl r besitzt eine eindeutige Darstellung der
Form
r=
∞
X
n=0
cn · p−n = c0 +
∞
X
n=1
cn · p−n
mit
(i) 0 ≤ cn < p für n ≥ 1,
(ii) c0 ∈ N0 ,
(iii) cn ≤ p − 2 für unendlich viele n.
Beweis: Wir zeigen zuerst die Existenz einer solchen Darstellung; setzen wir
c0 = ⌊r⌋ = max{n ∈ N0 : n ≤ r}
so ist (ii) erfüllt. Weiter sei
r1 := p · (r − c0 ) und c1 = ⌊r1 ⌋ ;
wegen r − c0 < 1 ist dann 0 ≤ r1 < p. Wir definieren nun induktiv für n ≥ 1
rn+1 := p(rn − cn ) und cn+1 = ⌊rn+1 ⌋.
Wegen 0 ≤ rn − cn < 1 ist
0 ≤ rn+1 = p(rn − cn ) < p ,
also
0 ≤ cn+1 = ⌊rn+1 ⌋ < p .
Damit gilt stets (i).
Zu (iii): Annahme: Es existieren nur endlich viele n mit cn ≤ p − 2.
Dann gibt es ein N ∈ N mit cn = p − 1 für alle n ≥ N. Sei n ≥ N.
Dann ist
rn+1 = p · (rn − cn ) = p · (rn − (p − 1)) ;
also
rn =
rn+1
+p−1
p
oder
p − rn =
p − rn+1
.
p
Stellt man p − rn+1 analog dar, also
p − rn+1 =
p − rn+2
,
p
55
so ergibt sich
p − rn =
p−rn+2
p
=
p
p − rn+2
,
p2
und induktiv erhält man
p − rn =
p − rn+m
pm
für alle m ≥ 1 .
Wegen 0 ≤ rn+m < p gilt weiter
p − rn =
p
1
p − rn+m
≤ m = m−1 .
m
p
p
p
Nun ist für festes n ∈ N stets p − rn > 0, wogegen
1
1
p
=
pm−1
!m−1
≤
m−1
1
2
=
1
2m−1
für hinreichend großes m wegen p ≥ 2 beliebig klein gemacht werden kann. Das ist ein
Widerspruch .
Es ist noch zu zeigen, dass für hinreichend große k die Summe
k
X
n=0
Zahl r beliebig nahe kommt.
cn · p−n der gegebenen
Dazu beweisen wir durch vollständige Induktion über k, dass gilt
r−
k
X
n=0
cn · p−n =
rk+1
(≥ 0) .
pk+1
Induktionsanfang (k = 0):
r − c0 =
r1
,
p
denn
Induktionsschritt (k → k + 1):
Es ist
r−
=
k+1
X
n=0
cn · p−n = r −
k
X
n=0
r1 = p(r − c0 ).
cn · p−n − ck+1 · p−(k+1)
rk+1
rk+2
− ck+1 · p−(k+1) = (rk+1 − ck+1 ) · p−(k+1) = k+2
k+1
p
p
Wegen rk+1 < p und p ≥ 2 ist
1
1
rk+1
< k ≤ k ,
k+1
p
p
2
woraus dann wie oben die Behauptung folgt.
Die Eindeutigkeit werden wir später zeigen.
2
56
Die p–al–Bruch–Darstellung erweist sich über die folgende Bemerkung für die Erfassung
der reellen Zahlen im Rechner als wichtig.
Bemerkung 1.56.
Jede reelle Zahl r 6= 0 besitzt eine eindeutige Darstellung der Form
r = sign (r) · m · pk ,
wobei 0 < p−1 ≤ m < 1 und k ∈ Z gilt.
Hierbei ist



1
sign (r) =
0


−1

falls r > 0 

falls r = 0 .

falls r < 0 
Beweis: Die Beziehung 0 < p−1 ≤ m < 1 ist äquivalent zu 0 < pk−1 ≤ m · pk < pk .
Also ist k so zu bestimmen, dass pk−1 ≤ |r| < pk gilt. Dann folgt mit m = |r · p−k | die
Behauptung.
2
1.8.3 Gleitpunktzahlen
Definition 1.57.
Gleitpunktzahlen sind die 0 und alle Zahlen z = ± m · pi , wobei
m=
t
X
k=1
ak · p−k
ein endlicher p–al–Bruch mit m 6= 0 und i ∈ Z aus dem Intervall I = [−I1 , I2 ] ⊂ Z ist.
Die Zahl i sei dabei so gewählt, dass a1 6= 0 ist (d.h. p−1 ≤ m < 1 gilt). m heißt Mantisse,
i Exponent von z. Die Menge aller Gleitpunktzahlen mit diesen Parametern bezeichnen
wir mit F (p, t, I1, I2 ).
Bemerkung 1.58.
(i) Gleitpunktzahlen sind spezielle reelle Zahlen (für p = 10: spezielle real-Zahlen)
(ii) Für real-Zahlen hat man normalerweise die Normierung
schreibt m als
m=
t2
X
k=−t1
ak · p−k ,
0 ≤ ak ≤ p − 1,
1
p
≤ m < 1 nicht, sondern
ti ∈ N.
(daher verschiedene Darstellungen einer Gleitpunktzahl als real-Zahl,
0.23 · 102 = 2.3 · 101 , etc.)
57
(iii) Wir geben die größte positive Gleitpunktzahl zmax in F (p, t, I1 , I2 ) an:
Wähle i = I2 , ak = p − 1 für 1 ≤ k ≤ t; dann erhalten wir die größte Mantisse
mmax =
t
X
(p − 1) · p−k =
k=1
t
X
k=1
p−k+1 −
t
X
p−k
k=1
= 1 − p−t
also
zmax = +mmax · pI2 = (1 − p−t ) · pI2 .
Entsprechend berechnen wir die kleinste positive Gleitpunktzahl zmin in F (p, t, I1, I2 ):
Wähle i = −I1 , a1 = 1, ak = 0 für 2 ≤ k ≤ t; dann ist
mmin = p−1 ,
also
zmin = +p−1 · p−I1 = p−(I1 +1) (= p−I1 −1 ) .
Beispiel 1.59.
Sei p = 2,
t = 3,
I = [−1, 1]; jede Mantisse m hat die Form
m = a1 · 2−1 + a2 · 2−2 + a3 · 2−3 ,
0 ≤ ai ≤ 1 .
Wegen 12 ≤ m < 1 muss stets a1 = 1 gelten. Dann ergeben sich als Möglichkeiten für die
Mantissen:
0.100, 0.101, 0.110, 0.111 .
Als Exponenten treten auf:
−1, 0, 1 .
Damit gibt es 4 · 3 + 1 = 13 nichtnegative Gleitpunktzahlen, da die Null ebenfalls
eine nichtnegative Gleitpunktzahl ist. Nimmt man die strikt negativen Gleitpunktzahlen
hinzu, so erhält man in obigem System insgesamt
2 (4 · 3) + 1 = 25
verschiedene Gleitpunktzahlen in F (2, 3, 1, 1).
Eine Veranschaulichung des obigen Beispiel am Zahlenstrahl zeigt, dass die Gleitpunktzahlen nicht äquidistant liegen.
Hilfssatz 1.60.
Seien t, p, I1 , I2 wie oben gegeben. Dann gilt:
(i) Es gibt (p − 1) · pt−1 · (I1 + I2 + 1) + 1 nichtnegative Gleitpunktzahlen.
(ii) Für jedes k ∈ I gilt: Es liegen mindestens (p−1)·pt−1 äquidistante Gleitpunktzahlen
im Intervall [pk−1 , pk ].
58
Beweis:
(i) a1 kann die Werte 1, . . . , p − 1 annehmen, die restlichen Koeffizienten a2 , . . . , at
können p verschiedene Werte annehmen.
Also gibt es (p − 1) · pt−1 verschiedene Mantissen.
Wegen −I1 ≤ i ≤ I2 gibt es I1 + I2 + 1 verschiedene Exponenten. Nach Hinzunahme
der 0 erhält man insgesamt (p−1)·pt−1 (I1 +I2 +1)+1 nichtnegative Gleitpunktzahlen.
(ii) Sei k ∈ I = [−I1 , I2 ] fest gewählt. Betrachte
{m · pk | m ist Mantisse } ;
da es (p−1)·pt−1 verschiedene Mantissen gibt, liegt die gleiche Anzahl äquidistanter
Gleitpunktzahlen vor.
Ist k ∈ I \ {I2 }, so kann die Zahl pk hinzugenommen werden.
2
Beispiel 1.61.
Sei I = {−1, 0, 1},
k=0:
t = 3,
p = 2; dann erhalten wir folgende Gleitpunktzahlen für
0.100, 0.101, 0.110, 0.111
1
2
5
8
3
4
7
8
Das sind (p − 1) · pt−1 = 1 · 22 = 4 äquidistante Zahlen. Nach Hinzunahme von 1 =
ergeben sich (p − 1) · pt−1 + 1 = 5 äquidistante Zahlen
k = 1 = I2 :
1
2
· 2 = 1,
5
8
· 2 = 45 ,
3
4
· 2 = 32 ,
7
8
·2=
8
8
7
4
Die Hinzunahme von 21 ist nicht möglich, da 2 keine Gleitpunktzahl ist (nur (p−1)·pt−1 =
4 äquidistante Zahlen).
k = −1 = I1 :
1
2
·
1
2
Die Hinzunahme von
= 14 ,
1
2
=
5
8
8
16
·
1
2
=
5
,
16
3
4
·
1
2
= 38 ,
7
8
·
1
2
=
7
16
ist möglich; also gibt es 5 äquidistante Zahlen.
Das Verfahren der Rundung besteht darin, die reellen Zahlen auf (die im Rechner darstellbaren) Gleitpunktzahlen abzubilden. Dabei sind verschiedene Rundungsmethoden
möglich.
Definition 1.62.
Sei F (t, p, I1, I2 ) ein Gleitpunktzahlensystem und r ∈ R, r 6= 0. Dann gibt es nach
Bemerkung 1.56 eindeutig bestimmte k und m mit
p−1 ≤ m < 1, so dass r = sign (r) · m · pk .
59
Für −I1 ≤ k < I2 oder k = I2 und m < 1 − 12 p−t sei die gerundete Zahl rR ∈ F (p, t, I1, I2 )
definiert durch
|r − rR | =
(∗)
min
r ′ ∈F (p,t,I1 ,I2 )
|r − r ′ |
Ist rR nicht eindeutig bestimmt, so wähle man die betragsgrößte unter den Gleitpunktzahlen mit minimalem Abstand.
Bemerkung 1.63.
(i) Gilt k < −I1 , so spricht man von einem Unterlauf (underflow). Setze in diesem Fall
rR = 0.
(ii) Gilt k > I2 oder k = I2 und m ≥ 1− 12 p−t , so setzt man rR = Ω (overflow, Überlauf).
Hilfssatz 1.64.
Sei F (p, t, I1 , I2 ) ein Gleitpunktzahlensystem und r ∈ R mit
pk−1 ≤ |r| < pk und k ∈ I = [−I1 , I2 ]
bzw. falls k = I2 sei pI2 −1 ≤ |r| < pI2 · (1 − 21 p−t ), (so dass rR = Ω ausgeschlossen ist).
Dann gilt:
rR = sign (r) · |r|p
t−k
1 k−t
+
p .
2
Beweis: Sei r = sign (r) · m · pl ; aus pk−1 ≤ |r| < pk folgt:
pk−1 ≤ m · pl < pk .
Wegen m < 1 ergibt sich pk−1 < pl und wegen m ≥
1
p
ist
pl = 1 · pl ≤ (mp)pl = p · (mpl ) < p · pk = pk+1 .
Demnach ist pk−1 < pl < pk+1 und damit k − 1 < l < k + 1 oder l = k. Also folgt
r
1 k−t k
− sign (r) · |r|p +
p = mp −
2
1 k−t
t
t
≤
= mp − mp + · p
2
j
t−k
k t−k
mp p
1 k−t
p
2
k
1 k−t +
p 2
Damit ist sign(r) · |r|pt−k + 21 pk−t eine reelle Zahl, deren Abstand von r kleiner oder
gleich 12 pk−t ist.
Wir zeigen nun, dass diese Zahl Element von F (p, t, I1 , I2 ) ist.
1. Fall: Ist |r| < pk (1 − 12 p−t ), so gilt:
|r|pt−k +
1
1
1
< pk (1 − p−t ) · pt−k + = pt ,
2
2
2
60
also
t−1
X
1
⌊|r|pt−k + ⌋ =
cj · p j
2
j=0
mit 0 ≤ cj < p
und damit
t
t−1
X
X
1
ct−j · p−j .
cj · pj−t = sign (r) · pk ·
sign (r) · ⌊|r|pt−k + ⌋ · pk−t = sign (r) · pk ·
2
j=1
j=0
Wegen k ∈ I = [−I1 , I2 ] ist letzteres ein Element von F (p, t, I1 , I2 ).
2. Fall: Für
|r| ≥ pk (1 − 21 p−t )
ist
k < I2
, d.h.
k ≤ I2 − 1.
Weiter ist
|r|pt−k +
1
1
1
< pk pt−k + = pt +
2
2
2
und
|r|pt−k +
j
d.h. |r|pt−k +
1
2
k
1
1
1
≥ pk (1 − p−t )pt−k + = pt ,
2
2
2
= pt . Daraus folgt
sign (r) |r|p
t−k
1 k−t
+
p
= sign (r)pk
2

= sign (r)p−1 pk+1 = sign (r) · 
t
X
j=1

cj p−j  pk+1
mit c1 = 1 und cj = 0 für j > 1 und k + 1 ≤ I2 − 1 + 1 = I2 , d.h. k + 1 ∈ I; also gilt auch
in diesem Fall
1 k−t
t−k
sign (r) |r|p +
p
∈ F (p, t, I1 , I2 ) .
2
Aus Hilfssatz 1.60 (ii) folgt:
Im Intervall [pk−1 , pk ] liegen für k < I2 genau (p−1)·pt−1 +1 äquidistante Gleitpunktzahlen,
die voneinander den Abstand pk−t haben; im Fall k = I2 und m < 1 − 21 p−t sind es
(p − 1) · pt−1 äquidistante Gleitpunktzahlen.
Also hat die r nächstgelegene Gleitpunktzahl, nämlich rR , einen Abstand zu r, welcher
kleiner oder gleich 12 pk−t ist. Offensichtlich gibt es höchstens zwei solche Zahlen.
1. Fall: Ist rR eindeutig bestimmt, so ist
rR = sign (r) · |r| · p
t−k
1
· pk−t .
+
2
2. Fall: Es existieren zwei Gleitpunktzahlen, die von r den Abstand
1
2
· pk−t haben.
61
Wir müssen zeigen, dass in der Behauptung angegebene Gleitpunktzahl die größere der
beiden Zahlen ist. Sei o.B.d.A. r > 0; dann ist

r=


t
X
aj · p−j  · pk
j=1
|
{z
+
}
kleinere Gleitpunktzahl
Wir zeigen nun, dass


|
t
X
j=1
aj · p

−j 
k
·p +p
k−t
{z
!
=
1 k−t
·p
|2 {z }
Abstand
rp
t−k
1
· pk−t
+
2
}
größere Gleitpunktzahl
gilt. Wir erhalten durch Einsetzen, ausgehend von der rechten Seite:
=






t

 X
1
1
1
r · pt−k +
· pk−t =  aj · p−j  · pk + · pk−t  · pt−k +  · pk−t
2
2
2
j=1

 t
 X

aj
j=1
=











t−1
t

X

X
1 1
· p−j  pt + +  · pk−t =  aj · pt−j + 1 · pk−t =  at−j · pj + 1 · pk−t
2 2
j=0
j=1


t−1
X
j=0
at−j · p
j

+ 1 · pk−t
=
Also ist auch im 2. Fall
=
t−1
X
j=0


t
X
j=1
at−j · p
j+k−t
+p
k−t
=
t
X
j=1
aj · pk−j + pk−t

aj · p−j  · pk + pk−t
rR = sign (r) |r| · p
t−k
1
+
· pk−t .
2
2
Satz 1.65 (über den relativen Rundungsfehler).
Sei r ∈ R und rR 6= Ω. Dann gilt
rR = r(1 + δ) mit |δ| ≤
1 1−t
·p
2
Beweis: Sei o.B.d.A. r > 0 und k so, dass gilt:
pk−1 ≤ r < pk .
1. Fall: Ist k < I2 , so liegen im Intervall [pk−1 , pk ] insgesamt (p − 1)pt−1 + 1 äquidistante
Gleitpunktzahlen (unter denen pk−1 und pk vorkommen). Jedes Teilintervall hat die Länge
pk−t .
62
Da r immer zur nächstliegenden Gleitpunktzahl gerundet wird und benachbarte Gleitpunktzahlen den Abstand pk−t haben, gilt
|r − rR | ≤
also
1 k−t
·p
,
2
1
· pk−t
1
|r − rR |
≤ 2 k−1 = p1−t
r
p
2
oder
|r − rR | ≤ r ·
d.h.
−r ·
1 1−t
p
2
1
1 1−t
p ≤ rR − r ≤ r · · p1−t .
2
2
Daraus folgt
1
1
rR ≤ r + r · p1−t = r 1 + · p1−t
2
2
Also existiert ein δ mit |δ| ≤
1
2
1
1
und rR ≥ r − r · · p1−t = r 1 − p1−t
2
2
p1−t derart, dass rR = r(1 + δ) gilt.
2. Fall: Ist k = I2 , dann liegen im Intervall [pk−1 , pk ] nur (p − 1)pt−1 äquidistante Gleitpunktzahlen mit dem Abstand pI2 −t ; die kleinste ist pI2 −1 und die größte ist (1 − p−t ) · pI2 ,
Wegen rR 6= Ω gilt im Fall r = m · pI2 stets m < 1 − 21 p−t . Ist r ≤ (1 − p−t ) · pI2 , so ergibt
sich wie im 1. Fall: |r − rR | ≤ 21 · pI2 −t und damit die Behauptung.
Ist dagegen r > (1 − p−t ) · pI2 , d.h.
(1 − p−t ) · pI2 < r < (1 −
1 −t
· p ) · pI 2 ,
2
so folgt
1
1 − p−t pI2 − (1 − p−t ) · pI2
2
1
1 −t I2
· p · p = · pI2 −t
=
2
2
|r − rR | ≤
Daraus folgt die Behauptung wie im 1. Fall.
2
Beispiel 1.66 (Relativer Fehler bei Rundung von π).
Sei p = 10,
t = 4,
I1 = 0,
I2 = 1;
Betrachte π = 3.14159265.... und schreibe
π = +.314159265... · 101
Also ist k = 1. Hilfssatz 1.64 liefert
πR = |π| · 103 +
1
1
· 10−3 = 3141.5 . . . +
· 10−3
2
2
63
= 3142 · 10−3 = 3.142 = +.3142 · 101 .
Damit ist
.3142 · 101 − .314159265... · 101
πR − π
=
≈ 1.28597 · 10−4 = 0.000128597 .
1
π
.314159265... · 10
Die Abschätzung von Satz 1.65 liefert
1
1
· 101−4 = · 10−3 = 0.0005.
2
2
|δ| ≤
Bemerkung 1.67.
Die Schranke von Satz 1.65 ist fast scharf. Wähle dazu
1 1−t
·p
2
r = pk · 1 +
=
Dann ist
Daraus folgt
1 −t
·p
·pk+1
{z2
}
p−1 +
|
(Gleitpunktdarstellung)
=m
rR = p−1 + p−t · pk+1 = pk (1 + p1−t ) (vgl. die Mantisse !) .
1
· pk+1−t
1
1 1−t
p1−t
rR − r
2
=
= k
·
·p
für große t.
1
1 1−t ≈
1−t
r
p (1 + 2 · p )
2 1 + 2p
2
1.8.4 Arithmetik von Gleitpunktzahlen: Ein Ausblick
Da arithmetische Grundoperationen mit Gleitpunktoperanden i.a. nicht zu einer Gleitpunktzahl führen, muss dies durch eine Änderung der arithmetischen Operationen erzwungen werden.
Definition 1.68.
Für x, y ∈ F (p, t, I1 , I2 ) definiert man für jede Operation ω ∈ {+, ·, −, /}:
x ω y := (x ω y)R .
Bemerkung 1.69.
Nach Satz 1.65 gilt für ω ∈ {+, ·, −, /}:
x
ω y−x ω y 1 1−t
≤ ·p
xωy
2
(Je größer t ist, desto kleiner ist der relative Rundungsfehler.)
Rechenregeln werden durch Rundung beeinflußt:
64
Beispiel 1.70.
Betrachte F (10, 2, 2, 2) und die Gleitpunktzahlen
x = + 0.10 · 101
y = − 0.99 · 100
z = + 0.10 · 10−2
Dann ist
(x ⊕ y) = (1.0 − 0.99)R = (0.01)R = + 0.10 · 10−1 ,
(x ⊕ y) ⊕ z = (0.01 + 0.001)R = (0.011)R = 0.11 · 10−1 .
Andererseits gilt
(y ⊕ z) = (−0.99 + 0.001)R = (−0.989)R = − .99 · 100 ,
x ⊕ (y ⊕ z) = (1.0 − 0.99)R = (0.01)R = 0.1 · 10−1 .
D.h.: Bei der Gleitpunktaddition gilt das Assoziativgesetz nicht.
Andere Rechenregeln bleiben erhalten, die wir unten nur auflisten:
Hilfssatz 1.71 (Rechengesetze für die Gleitpunktarithmetik).
(i) xR = (xR )R ,
(ii) x ≥ x′ ⇒ xR ≥ x′R
(iii) x ⊕ x′ = x′ ⊕ x
(iv) x ⊙ x′ = x′ ⊙ x
(v) x, x′ ≥ 0 ⇒ (x ⊖ x′ ) ⊕ x′ = x
(vi) x ⊖ x′ = x ⊕ (−x′ ) = −(x′ ⊖ x)
(−x) ⊙ x′ = x ⊙ (−x′ ) = −(x ⊙ x′ )
(−x) ⊘ x′ = x ⊘ (−x′ ) = −(x ⊘ x′ )
x⊖x= 0
(vii) 0 ≤ x ≤ x1 , 0 ≤ x′ ≤ x′1 ⇒
x ⊕ x′ ≤ x1 ⊕ x′1
x ⊖ x′1 ≤ x1 ⊖ x′
x ⊙ x′ ≤ x1 ⊙ x′1
x ⊘ x′1 ≤ x1 ⊘ x′ , wenn x′1 6= 0 und x′ 6 0
(viii) x′ ≥ 0 ⇒ x ⊕ x′ ≥ x
(ix) x ≥ x′ ⇒ x ⊖ x′ ≥ 0
(x) 0 ≤ x und 0 ≤ x′ ≤ 1 ⇒ x ⊙ x′ ≤ x
65
(xi) 0 ≤ x ≤ x′ ⇒ x ⊘ x′ ≤ 1, wenn x′ 6= 0
(xii) x ⊕ 0 = x ⊖ 0 = x ⊙ 1 = x ⊘ 1 = x
(xiii) x ⊙ 0 = 0
(xiv) x ⊘ x = 1, wenn x 6= 0
(xv) −(x)R = (−x)R
Warnung:
Die Assoziativgesetze bzgl. ⊕ und ⊙, die Distributivgesetze und die Kürzungsregeln gelten
nicht (Beispiele: Aufgabe).
Rundungsfehler können das Ergebnis einer Rechnung ganz erheblich verfälschen. Ein besonders gefährliches Phänomen ist das der sog. Stellenauslöschung bei Differenzen etwa
gleich großer Zahlen.
Beispiel 1.72.
Löse das folgende Gleichungssystem in F (10, 3, 10, 10):
(I) 0.100 · 10−3 x1 + 0.100 · 101 x2 = 0.100 · 101
(II) 0.100 · 101 x1 + 0.100 · 101 x2 = 0.200 · 101
Als exakte Lösung erhalten wir:
104
104 − 2
und
x
=
2
104 − 1
104 − 1
Ein Programm möge folgendermaßen arbeiten:
Gleichung (I) werde mit 104 multipliziert, und davon wird Gleichung (II) subtrahiert. Man
erhält:
x1 =
(I’) x1 + 104 · x2 = 104
(II) x1 + x2 = 2
Also (I’) - (II) exakt:
(II’) (104 − 1) x2 = 104 − 2
Aber in F (10, 3, 10, 10) wird folgendermaßen gerechnet:
(104 − 1)R · x2 = (104 − 2)R ,
also
woraus
0.100 · 105 x2 = 0.100 · 105
(Auslöschung signifikanter Stellen),
x2 = 1
folgt. Setzt man in Gleichung (I) ein, so folgt:
0.100 · 10−3 x1 + 0.100 · 101 · 1 = 0.100 · 101 ,
also
x1 = 0 .
66
§2 Folgen und Reihen
Häufig werden Größen, die sich nicht durch einen in endlich vielen Schritten berechenbaren
Ausdruck angeben lassen, durch Näherungen oder Approximationen ersetzt. Dabei muss
z.B. in Abhängigkeit der Stellenzahl eines Rechners mit unterschiedlich vielen Schritten
gerechnet werden; man ist dann mit einer Näherung zufrieden, wenn die vom Rechner
angezeigten Stellen mit denen der exakten Größe übereinstimmen. Grundlage für die
Untersuchung solcher Fragen ist der Begriff des Grenzwertes einer Zahlenfolge.
2.1 Konvergente Folgen. Beispiele
Obwohl wir uns im Folgenden fast ausschließlich mit reellen bzw. komplexen Zahlenfolgen
beschäftigen, werden wir den Begriff einer (konvergenten) Folge etwas allgemeiner fassen.
Definition 2.1.
Gegeben sei ein metrischer Raum (X, d); unter einer Folge verstehen wir eine Abbildung
f : N → X. Jedem n ∈ N ist also genau ein an := f (n) ∈ X zugeordnet. Statt f
schreiben wir auch (an )n∈N , (an )n≥1 oder (a1 , a2 , . . .). Ist n0 ∈ Z, so bezeichnet (an )n≥n0
oder (an0 , an0 +1 , . . .) ebenfalls eine Folge. Wir sprechen auch von einer Folge in X; ist
speziell (X, d) = (R, d2 ) bzw. = (C, d2 ), so reden wir von einer reellen bzw. einer komplexen
(Zahlen-)Folge.
Beispiele 2.2.
a) an = a für alle n ∈ N ergibt die konstante Folge (a, a, . . .) in (X, d).
b) an =
1
1 1 1
ergibt 1, , , , . . . .
n
2 3 4
c) an = (−1)n ergibt (−1, 1, −1, 1, . . .).
d) an = in ergibt (i, −1, −i, 1, i, −1, −i, 1, . . .).
e) a1 = 1, a2 = 1 und an = an−1 + an−2 für n ≥ 3 ergibt (1, 1, 2, 3, 5, 8, 13, 21, . . .), die
sog. Folge der Fibonacci-Zahlen.
1
1
1
1
, (−1)n ergibt in (R2 , d2 ) die Folge (1, −1), , 1 , , −1 , , 1 , . . . .
f) an =
n
2
3
4
g) Sei b ∈ C beliebig und an = bn für n ∈ N0 , das ergibt die Folge (1, b, b2 , b3 , . . .) in C.
Definition 2.3.
Eine Folge (an )n≥1 in (X, d) konvergiert gegen a ∈ X (heißt konvergent gegen a ∈ X),
wenn Folgendes gilt:
67
Zu jedem ε > 0 existiert ein N(ε) ∈ R derart, dass für alle n ∈ N mit n > N(ε) gilt:
d(an , a) < ε.
Wir schreiben a = lim an oder an → a für n → ∞; a heißt Grenzwert oder Limes der
n→∞
Folge (an )n≥1 . Eine Folge konvergiert oder heißt konvergent, wenn ein a ∈ X existiert,
gegen das sie konvergiert; sie heißt divergent, wenn sie nicht konvergiert.
Anschaulich bedeutet die Konvergenz, dass in jeder Kugel
Kε (a) := {x ∈ X | d(x, a) < ε}, ε > 0,
das Endstück (an(ε) , an(ε)+1 , . . .) der Folge (an )n≥1 mit n(ε) ∈ N und n(ε) > N(ε) liegt.
Satz 2.4.
Ist (an )n≥1 konvergent, so besitzt (an )n∈N genau einen Grenzwert.
Beweis: Wir nehmen an → a und an → b für n → ∞ mit a 6= b an; dann ist ε :=
1
d(a, b) > 0 und jede der Kugeln Kε (a) bzw. Kε (b) müsste ein Endstück der Folge (an )n≥1
2
enthalten, was unmöglich ist.
(Zu ε existieren ein N1 (ε) und ein N2 (ε) mit
d(an , a) < ε für alle n > N1 (ε)
bzw.
d(an , b) < ε für alle n > N2 (ε);
für alle n > max(N1 (ε), N2 (ε)) gilt dann mit der Dreiecksungleichung
1
d(a, b) ≤ d(a, an ) + d(an , b) < 2ε = 2 · d(a, b) = d(a, b).
2
Das ist ein Widerspruch.)
2
Definition 2.5.
Sei (an )n≥1 eine Folge und n1 < n2 < n3 < . . . eine aufsteigende Folge natürlicher Zahlen;
dann heißt (ank )k∈N = (an1 , an2 , . . .) eine Teilfolge der Folge (an )n≥1 .
Direkt aus Definition 2.3 folgt der
Satz 2.6.
Jede Teilfolge einer konvergenten Folge (an )n≥1 konvergiert ebenfalls gegen lim an .
n→∞
68
Definition 2.7.
Eine reelle oder komplexe Zahlenfolge (an )n≥1 heißt beschränkt, wenn ein M > 0 existiert
mit |an | ≤ M für alle n ≥ 1.
Satz 2.8.
Jede konvergente Folge in R oder C ist beschränkt.
Beweis: Sei (an )n≥1 eine komplexe Zahlenfolge mit lim an = a; dann existiert ein N =
n→∞
N(1) ∈ R mit
|an − a| < 1 für alle n > N.
Daraus folgt für alle n ∈ N
|an − a| ≤ max(|a1 − a|, . . . , |aN − a|, 1) =: M ′ ,
also
|an | ≤ |an − a| + |a| ≤ M ′ + |a| =: M.
2
Wir untersuchen nun die Beispiele aus 2.2 auf Konvergenz:
Beispiele 2.9.
a) (a, a, . . .) konvergiert wegen d(a, a) = 0 gegen a.
1
= 0, da nach dem Archimedischen Prinzip zu jedem ε > 0 ein m =
n→∞ n
1
< ε (vgl. Bemerkungen im Anschluß an Satz 1.12). Daraus
N(ε) ∈ N existiert mit
m
1
1
folgt für alle n > m wegen <
n
m
b) Es ist lim
1
1
d( , 0) = < ε.
n
n
c) Es ist (a2 , a4 , a6 , . . .) = (a2n )n≥1 eine Teilfolge von (an )n≥1 und (a1 , a3 , a5 , . . .) =
(a2n−1 )n≥1 eine Teilfolge von (an )n≥1 . Nach Teil a) gilt wegen a2n = 1 und a2n−1 = −1
für alle n ∈ N:
lim a2n
= 1
n→∞
lim a2n−1 = −1.
n→∞
Nach Satz 2.6 kann (an )n≥1 also nicht konvergieren.
69
d) Betrachte die Teilfolgen
(a4n+2 )n≥0 = (−1, −1, . . .),
(a4n+1 )n≥0 = (i, i, . . .),
(a4n+3 )n≥0 = (−i, −i, . . .), (a4n )n≥1 = (1, 1, . . .),
die gegen vier verschiedene Grenzwerte konvergieren; also konvergiert auch (in )n≥0
nicht.
e) Es gilt an ≥ n für alle n ≥ 5. (Betrachte die Aussagen A(n) an−1 ≥ 1 und an ≥ n
für n ≥ 5 und wende das Induktionsprinzip an. A(5) ist richtig wegen a5 = 5 und
a4 = 3. Der Induktionsschritt liefert aus der Induktionsvoraussetzung an−1 ≥ 1 und
an ≥ n sofort an ≥ 1 und an+1 = an + an−1 ≥ n + 1. )
Also ist die Folge unbeschränkt und damit nach Satz 2.8 divergent.
f) Betrachte die Teilfolgen
a2n
1
=
,1
2n
und a2n−1
Es gilt
1
=
, −1 .
2n − 1
lim a2n = (0, 1),
n→∞
denn zu jedem ε > 0 existiert ein m ∈ N mit
d2 (a2n , (0, 1)) =
s
1
2n
2
+
Entsprechend folgert man:
02
1
< ε; daraus folgt für alle n ≥ m:
m
1
1
1
1 =
≤
< ε<ε.
=
2n
2n
2m
2
lim a2n−1 = (0, −1).
n→∞
Satz 2.6 liefert die Divergenz von (an )n≥1 in (R2 , d2 ).
g)
(i) Sei zunächst |b| < 1; dann gilt
lim bn = 0.
n→∞
(ii) Ist |b| = 1, so ist (bn )n≥1 divergent für b 6= 1 und konvergent für b = 1.
(iii) Für |b| > 1 ist (bn )n≥1 divergent.
Zu (i): Nach Folgerung 1.21 (b) existiert zu beliebigem ε > 0 ein m = N(ε) ∈ N
mit |b|m < ε. Es folgt für alle n ≥ m:
|bn − 0| = |b|n = |b|m |b|n−m < |b|m < ε.
Zu (ii): Die Konvergenz für b = 1 ist klar; die Divergenz für die anderen b mit |b| = 1
läßt sich anhand der geometrischen Interpretation der Multiplikation komplexer
Zahlen veranschaulichen. Wir werden später darauf noch einmal zurückkommen.
Zu (iii): Nach Folgerung 1.21 (a) ist die Folge (|b|n )n≥1 = (|bn |)n≥1 unbeschränkt;
wegen Satz 2.8 ist (bn )n≥1 somit divergent.
70
Bemerkung 2.10.
Eine Folge (an )n≥1 in einem metrischen Raum (X, d) ist genau dann konvergent gegen a,
wenn eine Konstante K > 0 und zu jedem ε > 0 ein N(ε) ∈ R existieren mit
d(an , a) < K ·ε für alle n > N(ε).
Beweis:
>: Wähle K = 1.
<: Zeige, dass zu jedem ε > 0 ein M(ε) ∈ R mit
d(an , a) < ε für alle n > M(ε)
existiert. Nach Voraussetzung gibt es zu ε1 :=
ε
> 0 ein N(ε1 ) ∈ R mit
K
d(an , a) < K ε1 = ε für alle n > N(ε1 ) =: M(ε).
2
Satz 2.11.
(n)
(n)
Es sei (an )n≥1 eine Folge in (Rm , d2 ) und an = (a1 , a2 , . . . , a(n)
m ). Es gilt genau dann
lim an = (a1 , . . . , am ) =: a ∈ Rm ,
n→∞
(n)
wenn für die m reellen Zahlenfolgen (aj )n≥1 mit 1 ≤ j ≤ m gilt:
(n)
lim aj
n→∞
= aj .
Beweis:
>: Aus an → a für n → ∞ folgt wegen
(n)
|aj
− aj | =
r
(n)
(aj
sofort
− aj )2 ≤
(n)
lim aj
n→∞
v
um
uX (n)
t (a
i
i=1
− ai )2 = d2 (an , a)
= aj für 1 ≤ j ≤ m.
<: Umgekehrt existiert zu jedem ε > 0 und jedem j ∈ {1, . . . , m} ein Nj (ε) ∈ R mit
(n)
|aj − aj | < ε
für alle n > Nj (ε). Für alle n > max(N1 (ε), . . . , Nm (ε)) gilt dann


m
X
(n)
(aj
j=1
1
2
− aj )
2
Bemerkung 2.10 liefert die Behauptung.
<


m
X
j=1
1
2
ε
2
=
√
m·ε
2
71
Folgerung 2.12.
Ist (an )n≥1 eine komplexe Zahlenfolge, so konvergiert (an )n≥1 genau dann, wenn die beiden
reellen Zahlenfolgen (Re an )n≥1 und (Im an )n≥1 konvergieren. Im Falle der Konvergenz
gilt:
lim an = lim Re an + i lim Im an .
n→∞
Beispiel:
lim
n→∞
n→∞
n
1
2
+
n→∞
n
i
1
= lim
n→∞ 2
n
1
= 0.
n→∞ n
+ i lim
2.2 Das Rechnen mit konvergenten Folgen
Satz 2.13.
Es seien (an )n≥1 und (bn )n≥1 zwei konvergente (komplexe) Zahlenfolgen mit a = lim an
n→∞
und b = lim bn ; dann gilt:
n→∞
a) Es ist auch die Folge (an + bn )n≥1 konvergent mit
lim (an + bn ) = lim an + lim bn .
n→∞
n→∞
n→∞
b) Ist λ ∈ C, so konvergiert auch (λan )n≥1 mit
lim (λan ) = λ lim an .
n→∞
n→∞
c) Die Produktfolge (an · bn )n≥1 konvergiert mit
lim (an bn ) = lim an · lim bn .
n→∞
n→∞
n→∞
d) Ist b 6= 0, so existiert ein n0 ∈ N mit bn 6= 0 für alle n > n0 . Dann ist
konvergent mit
lim an
an
= n→∞ .
n→∞ b
lim bn
n
n→∞
lim
Beweis: Zu a): Zu ε > 0 existieren ein N1 (ε) ∈ R mit
|an − a| < ε für alle n > N1 (ε),
sowie ein N2 (ε) ∈ R mit
|bn − b| < ε für alle n > N2 (ε).
an
bn
n≥n0
72
Für alle n > max(N1 (ε), N2(ε)) gilt dann
|(an + bn ) − (a + b)| ≤ |an − a| + |bn − b| < 2ε.
Zu b): Folgt direkt aus Bemerkung 2.10 mit K = |λ|.
Zu c): Nach Satz 2.8 ist (an )n≥1 beschränkt, also |an | ≤ M für alle n ∈ N mit einem
geeigneten M > 0. Für ε > 0 seien N1 (ε) ∈ R und N2 (ε) ∈ R so, dass
|an − a| < ε für alle n > N1 (ε)
und
|bn − b| < ε für alle n > N2 (ε)
gilt. Dann erhalten wir für alle n > max(N1 (ε), N2(ε)):
|an bn − ab| = |an (bn − b) + (an − a)b|
≤ |an | |bn − b| + |an − a| |b|
< M ε + |b| ε = (M + |b|)ε.
an
1
1
1
= an · genügt es zu zeigen, dass die Folge
gegen konverbn
bn
bn n≥n0
b
giert; Teil c) liefert dann die Behauptung. Wegen bn → b für n → ∞ und b 6= 0 existiert
ein n0 ∈ N mit
|b|
|bn − b| <
für alle n > n0 .
2
Zu d): Wegen
Daraus ergibt sich mit Folgerung 1.32:
|bn | ≥ |b| − |bn − b| >
|b|
2
für alle n > n0 , also speziell bn 6= 0 für alle n > n0 . Ist nun ε > 0 beliebig und N(ε) ∈ R
so gewählt, dass |bn − b| < ε für alle n > N(ε) gilt, so folgt für alle n > max(N(ε), n0 ):
1
1
1 b − bn 2
=
− = |bn − b| < 2 ε
bbn bn
b
|b| |bn |
|b|
2
Beispiel 2.14.
Sei an =
3n2 + 13n
für n ≥ 1; dann gilt auch
n2 − 2
an =
n2 3 +
n2 1 −
13
n
2
2
n
=
3+
1−
13
n
2
n2
.
73
2
1
1
Nach Satz 2.13 c) gilt wegen lim
= 0 auch lim 2 = 0, Teil b) liefert lim − 2 = 0,
n→∞ n
n→∞ n
n→∞
n
2
Teil a) schließlich lim 1 − 2 = 1 6= 0. Entsprechend folgt
n→∞
n
lim
n→∞
3+
Teil d) liefert dann
lim an =
n→∞
13
= 3.
n
3
= 3.
1
Satz 2.15.
Konvergiert die komplexe Zahlenfolge (an )n≥1 gegen a, so gilt n→∞
lim |an | = |a|.
Beweis: Nach Folgerung 1.31 gilt:
||an | − |a|| ≤ |an − a|.
2
Wir halten noch einige Aussagen fest, die nur für reelle Zahlenfolgen gelten:
Satz 2.16.
a) Es seien (an )n≥1 und (bn )n≥1 zwei konvergente (reelle) Zahlenfolgen mit a = lim an
n→∞
sowie b = lim bn .
n→∞
(i) Gilt an ≤ bn für alle n ≥ n0 , so folgt auch a ≤ b. (an < bn impliziert nicht
a < b.) (Vergleichssatz)
(ii) Ist (cn )n≥1 eine Folge mit an ≤ cn ≤ bn für alle n ≥ n0 und ist a = b, so
konvergiert auch (cn )n≥1 mit n→∞
lim cn = a. (Einschnürungs- oder Sandwich-Satz)
b) Ist (bn )n≥1 eine Nullfolge, d.h. n→∞
lim bn = 0, (an )n≥1 eine Folge und a ∈ R mit
|an − a| ≤ bn für alle n ≥ n0 , so konvergiert auch (an )n≥1 mit lim an = a.
n→∞
Beweis: Zu a):
1
(i) Wäre a > b, d.h. ε := (a − b) > 0, so existiert ein N1 (ε) mit
2
|an − a| < ε für alle n > N1 (ε),
und es gibt ein N2 (ε) mit
|bn − b| < ε für alle n > N2 (ε).
Für alle n > max(N1 (ε), N2(ε)) gilt dann (vgl. Satz 1.33 b)
bn < b + ε =
a+b
= a − ε < an . Widerspruch.
2
74
(ii) Aus
a − ε < an < a + ε für alle n > N1 (ε)
und
a − ε < bn < a + ε für alle n > N2 (ε)
folgt für alle n > max(N1 (ε), N2 (ε)):
a − ε < an ≤ cn ≤ bn < a + ε
d.h.
|cn − a| < ε.
Zu b): Folgt sofort aus dem Einschnürungssatz wegen −bn ≤ an − a ≤ bn .
2
Beispiele.
a) Nach dem Einschnürungssatz gilt zum Beispiel
1
lim
= 0.
n→∞ 2n2 + 3
b) Es gilt für jedes feste a > 0:
lim
n→∞
1
=0
n+1
oder
√
n
a=1
√
√
Beweis: 1. Fall Es sei a > 1; dann gilt auch n a > 1. Also ist n a = 1 + hn mit
hn > 0. Daraus folgt mit der Bernoullischen Ungleichung
lim
n→∞
a = (1 + hn )n ≥ 1 + nhn
oder
a−1
.
n
Der Einschnürungssatz liefert die Behauptung.
1
2. Fall Ist a < 1, so ist > 1; also existiert nach Fall 1 ein N(ε) ∈ R mit
a
0 ≤ hn ≤
Wegen
√
n
s
n
a < 1 folgt somit
1
− 1 < ε für alle n > N(ε).
a
n
1 − √
√
a n 1
n
| a − 1| = a √
<
−
1
< ε für alle n > N(ε),
n
a
a
√
n
s
also die Behauptung.
3. Fall Ist a = 1, so ist die Behauptung trivialerweise erfüllt.
2
75
Bemerkung 2.17.
Ist (an )n≥1 eine (komplexe) Nullfolge und (bn )n≥1 eine beschränkte (komplexe) Zahlenfolge, so konvergiert auch (an bn )n≥1 gegen Null.
2.3 Prinzipien der Konvergenztheorie
Definition 2.18.
Eine reelle Folge (an )n≥1 heißt (monoton) wachsend, wenn an+1 ≥ an für alle n ∈ N gilt.
Sie heißt (monoton) fallend, wenn an+1 ≤ an für alle n ∈ N gilt. (an )n≥1 heißt streng
(monoton) wachsend bzw. fallend, wenn stets an+1 > an bzw. an+1 < an gilt. (an )n≥1
heißt (streng) monoton, wenn sie (streng) monton wächst oder fällt.
Satz 2.19. (Monotonieprinzip)
Eine monotone Folge konvergiert genau dann, wenn sie beschränkt ist. In diesem Falle
konvergiert sie gegen ihr Supremum, wenn sie wächst, und gegen ihr Infimum, wenn sie
fällt.
sup an =: a
a−ǫ
an0
}
ǫ
a3
a2
a1
Abbildung 10: Monotonieprinzip
Beweis: Sei (an )n≥1 monoton wachsend und beschränkt; nach Satz 1.11 existiert das
Supremum a = sup{an | n ∈ N}. Zu jedem ε > 0 existiert ein n0 ∈ N mit an0 > a − ε
(sonst wäre a − ε eine kleinere obere Schranke); für alle n > n0 gilt dann ebenfalls:
an ≥ an0 > a − ε. Da außerdem für alle n ∈ N gilt: an ≤ a, haben wir für alle n ≥ n0 :
a − ε < an ≤ a.
76
Umgekehrt ist jede konvergente Folge beschränkt (vgl. Satz 2.8).
2
Beispiel 2.20. (Eulersche Zahl)
1 n
ist streng monoton wachsend, die Folge
Die Folge
1+
n
n≥1
streng monoton fallend.
1
1+
n
n+1 !
n≥1
(Beweis der Monotonie: Nach der Bernoullischen Ungleichung gilt nämlich
1
1−
n
n n
1
1+
n
1
= 1− 2
n
n
1
,
n
≥1−
also
1+
1
n−1
n−1
=
n
n−1
n−1
=
n−1
n
1−n
1
n
= 1−
1−n
≤ 1+
1
n
n
,
und
1
1−
n
n 1
1+
n
n
also
1
= 1− 2
n
1
1+
n
n+1
Ferner gilt
1
1+
n
also
n
n
n2 − 1
n2
=
!n
n2
n2 + 1
≤
1
1
n = 1 +
≤
1
n−1
1− n
1
< 1+
n
1
2≤ 1+
n
n
n+1
Folge
d.h.
1+
1
n
n
1
1
n ≤
,
=
1
1 + n1
1 + n2
.)
für alle n ∈ N,
1
< 1+
n
n+1
Nach dem Monotonieprinzip konvergiert also die Folge
n+1 !
!n
≤ 4.
1
1+
n
n und ebenso die
n≥1
. Wir nennen den Grenzwert der ersten Folge e (Eulersche Zahl),
n≥1
e = lim
n→∞
1+
1
n
n
.
1
Wir zeigen, dass die zweite Folge ebenfalls gegen e konvergiert: Wegen 1 +
n
1 n
≤ e für alle n ∈ N folgt
und 1 +
n
0 ≤
1
1+
n
n+1
−e ≤
=
1
1+
n
1+
1
n
n+1
n 1
− 1+
n
1+
n
1
1
1
1+
−1 =
n
n
n
n
.
n+1
≥e
77
1
= 0 gilt, folgt nach Satz 2.13 c) und dem Einschnürungssatz:
n→∞ n
Da lim
lim
1+
n→∞
Beispiel 2.21. (Heron-Verfahren)
Gegeben sei a ∈ R, a > 0; gesucht ist
√
1
n
n+1
= e.
a. Definieren wir die Folge (an )n≥1 induktiv durch
a1 := a
an+1
a
1
an +
:=
2
an
für n ≥ 1,
so entsteht eine monoton fallende Folge (an )n≥2 mit lauter positiven Gliedern, und es gilt:
√
lim an = a.
n→∞
Beweis:
(α) Mit dem Induktionsprinzip kann man an > 0 für alle n ∈ N zeigen.
√
(β) Für alle n ≥ 2 gilt:
an ≥ a.
Es ist nämlich
an+1 −
√
√
1
1
a
a
1 √
a =
an +
− ·2 a=
an − 2 a +
2
an
2
2
an
=
√ 2
√
1 2
1 an − 2an a + a =
an − a ≥ 0.
2an
2an
(γ) (an )n≥2 ist monoton fallend wegen
an − an+1 = an −
a
1
an +
2
an
a
1 √
a− √
≥
2
a
!
=
1
a
an −
2
an
= 0.
(δ) √
Das Monotonieprinzip liefert die Konvergenz der Folge (an )n≥1 gegen g; wegen an ≥
a ist g 6= 0. Die Grenzwertsätze ergeben dann! auch die Konvergenz der Folge
a
a
1
1
an +
g+
. Wegen
mit dem Grenzwert
2
an n≥1
2
g
lim an+1 = n→∞
lim an
n→∞
folgt hieraus
1
a
g=
g+
2
g
!
oder g 2 = a, d.h. g =
√
a.
2
78
Beispiel 2.20 läßt sich verallgemeinern zu einer Aussage, die häufig an Stelle des Supremumprinzips (Satz 1.11) zur Charakterisierung reeller Zahlen tritt.
Definition 2.22.
Eine Folge abgeschlossener Intervalle In := [an , bn ], n ∈ N, definiert eine Intervallschachtelung, wenn Folgendes gilt:
(i) In ⊃ In+1 für alle n ∈ N, d.h. (an )n≥1 ist monoton wachsend und (bn )n≥1 monoton
fallend.
(ii) lim (an − bn ) = 0.
n→∞
Satz 2.23. (Prinzip der Intervallschachtelung)
Jede Intervallschachtelung (In )n≥1 definiert genau eine Zahl a, die in allen Intervallen In
liegt, d.h.
{a} =
∞
\
In .
n=1
Beweis: Nach dem Monotonieprinzip existieren
a = n→∞
lim an und b = n→∞
lim bn ;
Satz 2.13 liefert lim (an − bn ) = a − b und (ii) ergibt a = b.
n→∞
2
Definition 2.24.
a heißt Häufungspunkt einer Zahlenfolge (an )n≥1 , wenn eine Teilfolge von (an )n≥1 existiert,
die gegen a konvergiert. (a wird auch Häufungswert der Folge (an )n≥1 genannt.)
Beispiele 2.25
a) Die Folge (an )n≥1 mit an = (−1)n besitzt die Häufungswerte 1 und −1.
b) Die Folge (an )n≥1 = (1, 1, 2, 1, 2, 3, 1, 2, 3, 4, 1, 2, 3, 4, 5, . . .) besitzt jede natürliche
Zahl als Häufungswert.
Manchmal kann man die Konvergenz einer Folge beweisen, ohne den Grenzwert der Folge zu kennen – so wie bei einigen Anwendungen des Monotonieprinzips (vgl. z.B. das
Heronverfahren). Um das entsprechende Konvergenzprinzip zu formulieren, benötigen wir
Definition 2.26.
Eine Folge (an )n≥1 in einem metrischen Raum (X, d) heißt Cauchy-Folge, wenn zu jedem
ε > 0 ein N(ε) ∈ R existiert, so dass für alle m, n ∈ N mit m > N(ε) und n > N(ε) gilt:
d(an , am ) < ε .
Man kann zeigen, dass folgendes Kriterium gilt:
79
Satz 2.27. (Cauchysches Konvergenzprinzip)
a) Jede konvergente Folge (in einem metrischen Raum) ist eine Cauchy-Folge.
b) Jede Cauchy-Folge (an )n≥1 in R (oder C) konvergiert.
(Eine reelle oder komplexe Zahlenfolge konvergiert also genau dann, wenn sie eine CauchyFolge ist.)
Beispiele 2.28.
a) Wir betrachten Beispiel 2.9 g): (bn )n≥0 für b ∈ C mit |b| = 1 und b 6= 1. Dann gilt
|b − 1| =: ε0 > 0, also für alle n ∈ N
|bn+1 − bn | = |bn | |b − 1| = |b|n |b − 1| = ε0 .
Also ist (bn )n≥0 keine Cauchy-Folge und damit nach Satz 2.27 nicht konvergent.
b) Mit b ∈ C können wir für jedes n ∈ N0 die Summe
sn :=
n
X
bk
k=0
betrachten; dadurch erhalten wir eine Folge (sn )n≥0 . Gemäß Satz 1.22 – der auch in
C richtig ist – gilt für b ∈ C \ {1}:
sn =
Beispiel 2.9 g) liefert damit für |b| < 1:
lim sn =
n→∞
1 − bn+1
.
1−b
1 − lim bn+1
n→∞
1−b
=
1
.
1−b
2.4 Reihen
Beispiel 2.28 b) wollen wir zum Anlaß nehmen, Folgen zu betrachten, bei denen sich das
(n+1)-te Folgenglied sn+1 aus dem n-ten sn durch Addition von an+1 ∈ R (oder C) ergibt.
Definition 2.29.
Sei (an )n≥0 eine Zahlenfolge in C oder R. Die Folge (sn )n≥0 der Partialsummen
n
X
sn :=
heißt (unendliche) Reihe und wird mit
ak ,
k=0
∞
X
n ≥ 0,
ak bezeichnet. Die Zahlen ak heißen Glieder
k=0
der Reihe. Konvergiert (sn )n≥0 gegen s, so nennt man s den Wert der Reihe. Man sagt
dann, die Reihe konvergiert (gegen s) und schreibt
∞
X
k=0
anderenfalls heißt die Reihe divergent.
ak = s;
80
Bemerkung 2.30.
Jede Folge (an )n≥0 läßt sich als Reihe schreiben; wir setzen b0 = a0 und bn = an − an−1
für n ≥ 1; dann gilt
n
X
an =
bk .
k=0
Weil andererseits jede Reihe eine Folge (von Partialsummen) ist, ist klar, dass jeder Satz
über Folgen auch als Satz über Reihen formuliert werden kann und umgekehrt.
Satz 2.31.
Es seien
∞
X
ak und
k=0
∞
X
die Reihen
∞
X
k=0
bk zwei konvergente Reihen und λ ∈ C. Dann konvergieren auch
(ak + bk ),
k=0
∞
X
(ak − bk ) und
k=0
∞
X
∞
X
(ak ± bk ) =
k=0
∞
X
λak , und es gilt:
k=0
∞
X
k=0
∞
X
ak .
ak , tn :=
n
X
λak = λ
k=0
Beweis: Sei
sn :=
ak ±
n
X
n
X
(ak + bk ) =
k=0
bk ,
k=0
k=0
k=0
dann ist
∞
X
n
X
bk ;
k=0
ak +
k=0
n
X
bk = sn + tn .
k=0
Nach Satz 2.13 gilt
∞
X
(ak + bk ) = lim (sn + tn ) = lim sn + lim tn =
n→∞
k=0
n→∞
n→∞
Analog werden die anderen Aussagen bewiesen.
∞
X
k=0
ak +
∞
X
bk .
k=0
2
Aus Satz 2.27 erhalten wir sofort:
Satz 2.32. (Cauchykriterium)
Die Reihe
∞
X
k=0
ak mit ak ∈ C konvergiert genau dann, wenn für jedes ε > 0 ein N(ε) ∈ R
existiert mit
|sm − sn | =
für alle m > n > N(ε).
X
m
ak k=n+1 <ε
81
Folgerung 2.33 (Notwendiges Konvergenzkriterium für Reihen).
Konvergiert die Reihe
∞
X
ak , so gilt lim ak = 0 und lim
n→∞
k→∞
k=0
∞
X
ak = 0.
k=n+1

Beweis: Setze in Satz 2.32 m = n + 1 bzw. betrachte die Folge 
m
X
k=n+1

ak 
.
2
m>n
Satz 2.34.
Eine Reihe
∞
X
k=0
ak mit ak ≥ 0 für alle k ∈ N0 konvergiert genau dann, wenn die Folge der
Partialsummen beschränkt ist.
Beweis: Wegen ak ≥ 0 ist die Folge (sn )n≥0 der Partialsummen monoton wachsend. Das
Monotonieprinzip liefert dann die Behauptung.
2
Satz 2.35 (Leibniz-Kriterium für alternierende Reihen).
Es sei (an )n≥0 eine monoton fallende Folge nicht-negativer Zahlen mit lim an = 0. Dann
n→∞
konvergiert die Reihe
∞
X
(−1)k ak .
k=0
Beweis: Wir betrachten die Partialsummen sn =
n
X
(−1)k ak für gerades und ungerades
k=0
n. Es gilt
s2m+2 − s2m = a2m+2 − a2m+1 ≤ 0
und
s2m+1 − s2m−1 = −a2m+1 + a2m ≥ 0 .
Also ist (s2m )m≥0 monoton fallend und (s2m+1 )m≥0 monoton wachsend. Wegen
s2m − s2m+1 = a2m+1 ≥ 0,
also
s0 ≥ s2m ≥ s2m+1 ≥ s1
ist (s2m )m≥0 nach unten beschränkt und (s2m+1 )m≥0 nach oben beschränkt. Damit konvergieren die Teilfolgen, d.h. es ist
lim s2m = s
m→∞
und
lim s2m+1 = t .
m→∞
Die Grenzwertsätze liefern
s − t = lim (s2m − s2m+1 ) = lim a2m+1 = 0 ,
m→∞
d.h. s = t.
m→∞
2
82
Definition 2.36.
Eine Reihe
∞
X
ak heißt absolut konvergent, wenn die Reihe
k=0
∞
X
k=1
|ak | konvergiert.
Bemerkung 2.37.
Wegen
X
m
ak k=n+1 ≤
m
X
k=n+1
|ak | folgt aus der absoluten Konvergenz einer Reihe sofort
ihre Konvergenz. Für die Grenzwerte erhalten wir aus dem Vergleichssatz sofort die
Abschätzung
∞
∞
X ak k=0
≤
X
k=0
|ak |.
Umgekehrt folgt aus der Konvergenz einer Reihe nicht die absolute Konvergenz, wie das
∞
∞
X
X
1
1
führt.
Beispiel
(−1)k+1 zeigt, das auf die sog. divergente harmonische Reihe
k
k=1 k
k=1
Es ist nämlich
n
2
X
1 1 1 1 1 1 1
1
1
1
= 1 + + + + + + + + . . . + n−1
+ ...+ n
k
2 |3 {z 4} |5 6 {z 7 8}
2
+ 1 {z
2}
k=1
|
≥ 2· 41
≥ 4· 18
≥ 2n−1 · 21n
1
≥1+n· ,
2
also ist die zugehörige Partialsummenfolge unbeschränkt. Nach Satz 2.34 kann die harmonische Reihe damit nicht konvergieren.
Durch die direkte Anwendung von Satz 2.34 erhalten wir einige Konvergenz- bzw. Divergenzkriterien:
Satz 2.38 (Majorantenkriterium).
Ist
∞
X
k=0
ak eine unendliche Reihe mit ak ∈ C,
∞
X
k=0
bk eine konvergente Reihe mit bk ≥ 0 für
alle k ∈ N0 und gilt für alle k ≥ n0 : |ak | ≤ bk , so konvergiert
∞
X
ak absolut.
k=0
Satz 2.39 (Minorantenkriterium).
Ist
∞
X
k=0
ak eine unendliche Reihe mit ak ∈ R, ak ≥ 0 für alle k ∈ N0 und gilt für alle
k ≥ n0 : 0 ≤ bk ≤ ak und ist
∞
X
k=0
bk divergent, so ist auch
∞
X
k=0
ak divergent.
83
Beispiele 2.40.
• Untersuche
und
∞
X
(−1)k
k=1
2 −k
k 3 − 2k
auf Konvergenz bzw. Divergenz. Für k ≥ 2 gilt
k 5 + 3k 2 + 1
k 3 − 2k k 2 −k
(−1)
k 5 + 3k 2 + 1 ∞
X
1
2
k=1 k
=
k 3 − 2k
k3
1
<
= 2,
5
2
5
k + 3k + 1
k
k
ist konvergent mit
π2
1
=
.
2
6
k=1 k
∞
X
Die Konvergenz der letzteren Reihe ergibt sich aus folgender Überlegung: Für n ≥ 2
gilt
n
n
n
X
X
X
1
1
1
1
1
=
1
+
≤
1
+
=
1
+
−
2
2
k
k=2 k
k=2 k(k − 1)
k=2 k − 1
k=1 k
n
X
1
= 1+ 1−
≤2.
n
Also ist die Partialsummenfolge beschränkt und damit die Reihe konvergent. Den
Reihenwert können wir mit den bisher gelieferten Hilfsmitteln nicht berechnen.
Das Majorantenkriterium liefert nun die absolute Konvergenz der ursprünglich be∞
X
k 3 − 2k
2
trachteten Reihe
(−1)k −k 5
.
k + 3k 2 + 1
k=1
∞
X
1
√
k
k=1
∞
X
1
nische Reihe
k=1 k
• Die Reihe
ist divergent, da für alle k ≥ 1 gilt
√
k ≤ k und die harmo-
divergent ist.
Satz 2.41 (Quotientenkriterium).
Gegeben sei
Zahl q < 1
∞
X
k=0
ak mit ak ∈ C, ak 6= 0 für alle k ≥ k0 . Gilt dann mit einer festen positiven
ak+1 ak
so ist
∞
X
≤ q für alle k ≥ k0 ,
ak absolut konvergent.
k=0
Ist dagegen
ak+1 ak
so ist
∞
X
k=0
ak divergent.
≥ 1 für alle k ≥ k0 ,
84
Beweis: Mittels Induktion erhalten wir für k0 = 0 (dies können wir o.B.d.A. voraussetzen,
da ein Abändern endlich vieler Summanden das Konvergenzverhalten nicht ändert):
|ak | ≤ |a0 |q k für alle k ∈ N0 .
Daraus folgt die Behauptung über die Konvergenz mit dem Majorantenkriterium wegen
∞
X
k=0
Aus
ist.
ak+1 ak
k
|a0 |q = |a0 |
∞
X
qk =
k=0
|a0 |
.
1−q
≥ 1 folgt, dass |ak+1 | ≥ |ak | > 0 für alle k > k0 gilt, also (ak )k≥0 keine Nullfolge
2
Beispiele 2.42.
zk
= ez (siehe Beispiel 2.47 unten), denn
k!
k=0
nach dem Quotientenkriterium gilt für alle k ≥ 2|z|:
• Für jedes z ∈ C konvergiert die Reihe
• Die Reihe
k2
k
k=0 2
∞
X
k+1 z
(k+1)! zk k! kk
k
k=0 k!2
∞
X
|z|
|z|
1
<
= .
k+1
2|z|
2
ist absolut konvergent, da für alle k ≥ 4 gilt:
(k + 1)2 2k
1
=
k+1
2
2
k
2
• Die Reihe
=
∞
X
k+1
k
!2
≤
2
1 5
2 4
=
25
= q < 1.
32
divergiert, denn es gilt für alle k ∈ N:
(k + 1)k+1 k! 2k
(k + 1)k!
· k =
k+1
(k + 1)! 2
k
(k + 1)!
k+1
k
!k
1
1
1
1+
=
2
2
k
k
≥
1
·2
2
nach Beispiel 2.20.
Satz 2.43 (Wurzelkriterium).
Gegeben sei
∞
X
k=0
ak mit ak ∈ C. Gilt dann mit einer festen positiven Zahl q < 1
q
k
|ak | ≤ q für alle k ≥ k0 ,
85
so ist
∞
X
ak absolut konvergent.
k=0
Ist jedoch M ⊂ N0 eine unendliche Menge und gilt für alle k ∈ M
q
k
so ist
∞
X
|ak | ≥ 1,
ak divergent.
k=0
q
Beweis: Aus k |ak | ≤ q ergibt sich |ak | ≤ q k für k ≥ k0 und damit die geometrische
Reihe als konvergente Majorante. Aus der zweiten Bedingung folgt, dass (ak )k∈N0 keine
Nullfolge ist.
2
Bemerkung 2.44.
Wir müssen noch zeigen, dass die Entwicklung in p-al-Brüche eindeutig ist (vgl. Satz 1.55).
Dazu überlegen wir uns zunächst, dass für eine unendliche Reihe der Form
∞
X
an p−n
n=1
mit 0 ≤ an ≤ p − 1 für n ≥ 1 und an0 ≤ p − 2 für mindestens ein n0 ≥ 1 gilt:
∞
X
an p−n < 1 .
n=1
Die Summenformel für die geometrische Reihe liefert nämlich
∞
X
an p
−n
<
∞
X
(p − 1)p−n = (p − 1)
n=1
n=1
Seien nun
r = c0 +
∞
X
cn p−n = d0 +
∞
X
1
=1.
p−1
dn p−n
n=1
n=1
zwei verschiedene p-al-Entwicklungen der nichtnegativen reellen Zahl r gemäß Satz 1.55.
Ist m ≥ 0 die kleinste natürliche Zahl mit cm 6= dm , so erhalten wir
p−m (cm +
∞
X
cn+m p−n ) = p−m (dm +
0≤
∞
X
n=1
cn+m p−n < 1 und 0 ≤
woraus wegen cm , dm ∈ N0 und
|cm − dm | = |
dn+m p−n )
n=1
n=1
mit
∞
X
∞
X
n=1
cn+m p−n −
∞
X
dn+m p−n < 1 ,
n=1
∞
X
n=1
dn+m p−n | < 1
im Widerspruch zur Voraussetzung cm 6= dm folgt. Damit ist Satz 1.55 jetzt vollständig
bewiesen.
86
2.5 Multiplikation von Reihen
Multipliziert man zwei endliche Summen (a1 + . . . + an ) und (b1 + . . . + bn ) miteinander, so
bildet man alle Produkte ai bj und summiert sie in einer beliebigen Reihenfolge auf; will
man dieses Verfahren auf Reihen übertragen, so steht man vor dem Problem, dass sich in
Abhängigkeit von der Anordnung der Produkte ai bj der Reihenwert ändern kann.
Eine spezielle Anordnung dieser Produkte erhält man, wenn man sich an der Multiplikation zweier Polynome
P1 : R ∋ x 7→
n
X
ak xk ∈ R
n
X
bk xk ∈ R
k=0
bzw.
P2 : R ∋ x 7→
k=0
orientiert. Multipliziert man P1 (x) mit P2 (x) und sortiert anschließend nach den Potenzen
von x, so gilt:
P1 (x)P2 (x) =
2n
X
ck xk
k=0
mit
ck = a0 bk + a1 bk−1 + . . . + ak b0 für 0 ≤ k ≤ 2n,
wobei wir noch ak = 0, bk = 0 für n < k ≤ 2n gesetzt haben.
Definition 2.45.
Sind zwei absolut konvergente Reihen
man die Reihe
∞
X
∞
X
ak bzw.
k=0
∞
X
k=0
bk mit ak , bk ∈ C gegeben, so nennt
ck mit
k=0
ck =
k
X
ai bk−i
i=0
das Cauchy-Produkt der Reihen
∞
X
ak und
k=0
∞
X
bk .
k=0
Man kann zeigen, dass folgende Aussage richtig ist:
Satz 2.46.
Das Cauchy-Produkt zweier absolut konvergenter Reihen
konvergent, und es gilt:
∞
X
k=0
∞
X
k=0
ck =
∞
X
k=0
!
ak ·
∞
X
k=0
!
bk .
ak und
∞
X
k=0
bk ist absolut
87
Abbildung 11: Die reelle Exponentialfunktion
Beispiel 2.47 (Die Exponentialfunktion).
zk
für jedes z ∈ C absolut; den Grenzwert
k=0 k!
bezeichnen wir mit exp(z) oder ez . Dadurch definieren wir eine Abbildung
Nach Beispiel 2.42 konvergiert die Reihe
∞
X
exp : C ∋ z 7→ exp(z) =
zk
∈ C.
k=0 k!
∞
X
Wir berechnen das Cauchy-Produkt der Reihen
∞
∞
X
X
wk
zk
und
= exp(w).
exp(z) =
k!
k!
k=0
k=0
Es gilt nach dem Binomischen Lehrsatz:
!
k
X
k
z i w k−i
1
1 X
k i k−i
ck :=
zw
= (z + w)k ,
=
k! i=0 i
k!
i=0 i! (k − i)!
also
∞
X
k=0
ck =
∞
X
1
(z + w)k = exp(z + w).
k!
k=0
Damit haben wir gemäß Satz 2.46 die Funktionalgleichung der Exponentialfunktion exp
bewiesen:
exp(z + w) = exp(z) · exp(w)
für alle z, w ∈ C. Weiter erhalten wir
88
Folgerung 2.48.
a) exp(z) 6= 0 und exp(−z) = (exp(z))−1 für alle z ∈ C.
b) exp(z) = exp(z) für alle z ∈ C.
c) exp(x) > 0 für alle x ∈ R.
d) exp(n) = en für alle n ∈ Z.
Beweis: Zu a): Aus der Funktionalgleichung folgt
exp(z)exp(−z) = exp(0) = 1.
Zu b): Sei
sn (z) :=
dann gilt gemäß §1.7:
n
X
zk
;
k=0 k!
n
X
zk
zk
=
= sn (z).
sn (z) =
k=0 k!
k=0 k!
n
X
Grenzübergang n → ∞ liefert die Behauptung.
Zu c): Für x ≥ 0 ist exp(x) ≥ 1 + x ≥ 1 > 0; für x < 0 ist −x > 0, also exp(−x) > 0,
und nach Teil a) ist dann
1
exp(x) =
> 0.
exp(−x)
Zu d): Für n ∈ N0 beweisen wir die Behauptung durch Induktion: n = 0 ist klar. Um zu
zeigen, dass exp(1) = e gilt, betrachten wir
1
an = 1 +
n
und setzen
sn :=
n
n
X
1
.
k=0 k!
Nach Beispiel 2.20 gilt an → e (n → ∞). Weiter konvergiert die Reihe
setzen e′ := lim sn und zeigen e′ = e: Nach dem Binomischen Lehrsatz gilt
n→∞
an =
n
X
k=0
=1+1+
!
n
X
n 1
n(n − 1) · . . . · (n − k + 1)
=
k
k n
k!nk
k=0
n X
k=2
k−1
1
· ...· 1 −
1−
n
n
!
1
≤ sn ;
k!
∞
X
1
k=0 k!
; wir
89
also ist e ≤ e′ gemäß des Vergleichssatzes. Andererseits gilt für m ≥ n ≥ 1
am = 1 + 1 +
m X
k=2
≥1+1+
n X
k=2
k−1
1
·...· 1 −
1−
m
m
1
k−1
1−
· ...· 1 −
m
m
!
!
1
k!
1
k!
Für festes n erhalten wir daraus
e = lim am ≥ sn ,
m→∞
also e ≥ e′ .
und damit zusammen e = e′ . Nun führen wir den Induktionsschritt von n auf n + 1 durch:
exp(n + 1) = exp(n) · exp(1) = en · e = en+1 .
Ist n ∈ Z \ N0 , so ist −n ∈ N, also
exp(−n) = e−n und damit exp(n) =
1
= en .
exp(−n)
2
90
§3 Stetige Funktionen
Bevor wir uns mit der Definition der Stetigkeit und den Eigenschaften stetiger Funktionen
näher beschäftigen, wollen wir im Folgenden ein paar wichtige Beispiele betrachten.
3.1 Reell- bzw. komplexwertige Funktionen
Definition 3.1.
Eine Abbildung von einer nichtleeren Menge X in den Bildbereich R bzw. C heißt reellbzw. komplexwertige Funktion.
Beispiele 3.2.
Falls X nicht näher spezifiziert ist, handelt es sich um eine beliebige nichtleere Menge.
a) Ist c ∈ R bzw. c ∈ C fest, dann heißt f : X ∋ x 7→ c ∈ K mit K ∈ {R, C} eine
konstante Funktion.
b) Ist X = R bzw. X = C und sind a0 , . . . , an ∈ R bzw. a0 , . . . , an ∈ C, so heißt
f : X ∋ x 7→
n
X
ν=0
aν xν ∈ X
ein Polynom vom Grad ≤ n mit den Koeffizienten a0 , . . . , an , n ∈ N0 . Ist an =
6 0,
so heißt n der Grad von f . Der Funktion X ∋ x 7→ 0 ∈ X wird der Grad −∞
zugeordnet.
c) Ist X = R bzw. X = C, so heißt
f : X ∋ x 7→ |x| ∈ R
die Betragsfunktion.
d) Sind
p1 : X ∋ x 7→
und
p2 : X ∋ x 7→
n
X
aν xν ∈ X
m
X
bµ xµ ∈ X
ν=0
µ=0
mit X = R oder X = C zwei Polynome vom Grad ≤ n bzw. ≤ m und ist
D := {x ∈ X | p2 (x) 6= 0},
so wird die rationale Funktion r =
p1
durch
p2
r : D ∋ x 7→ r(x) =
definiert.
p1 (x)
∈X
p2 (x)
91
e) Es sei [a, b] ein Intervall, d.h. a < b, a, b ∈ R; eine Funktion f : [a, b] → K (mit
K = R oder K = C) heißt Treppenfunktion, wenn es eine Unterteilung
a = t0 < t1 < . . . < tn−1 < tn = b
von [a, b] und Konstanten c1 , . . . , cn ∈ K derart gibt, dass
f (x) = ck für x ∈ ]tk−1 , tk [
und 1 ≤ k ≤ n gilt. In den Unterteilungspunkten tk kann der Funktionswert beliebig
sein.
f) Ist ∅ =
6 Y ⊂ X, so heißt
χY : X ∋ x 7→




1 , falls x ∈ Y 
0 , sonst

∈R
die charakteristische Funktion der Menge Y . Speziell für X = R und Y = Q erhalten
wir die Dirichletsche Funktion (auch Dirichletsche Sprungfunktion genannt).
Da der Bildbereich einer reell- bzw. komplexwertigen Funktion ein Körper ist, können wir
solche Funktionen additiv und multiplikativ verknüpfen.
Definition 3.3.
Ist X 6= ∅ eine beliebige Menge, so wird die Menge aller reell- bzw. komplexwertigen
Funktionen auf X mit Abb (X, R) bzw. Abb (X, C) bezeichnet. Mit K = R oder K = C
können wir für f, g ∈ Abb (X, K) die Summe f + g, das skalare Vielfache αf für α ∈ K
und das Produkt f g auf X definieren durch:
f + g : X ∋ x 7→ f (x) + g(x) ∈ K
αf
: X ∋ x 7→ αf (x) ∈ K
fg
: X ∋ x 7→ f (x)g(x) ∈ K.
f
definiert man üblicherweise nur auf einer Teilmenge von X, nämlich
g
auf D = {x ∈ X | g(x) 6= 0} durch
Den Quotienten
f
f (x)
: D ∋ x 7→
∈ K.
g
g(x)
Definition 3.4.
Eine reell- bzw. komplexwertige Funktion f ∈ Abb(X, K) heißt beschränkt, wenn eine
Konstante K > 0 existiert mit |f (x)| ≤ K für alle x ∈ X, d.h. wenn F (X) ⊂ K eine beschränkte Menge ist. Die Menge aller beschränkten Funktionen aus Abb(X, K) bezeichnen
wir mit B(X, K), K = R oder K = C.
92
Definition 3.5.
Ist speziell K = R und f : X → R beschränkt, so existiert nach Satz 1.11 das Infimuum
und das Supremum von f (X), etwa
a = inf f (X) und b = sup f (X).
Existiert ein x0 ∈ X mit f (x0 ) = a, so sagen wir, dass a das Minimum von f auf X ist
und x0 eine Minimalstelle. Gibt es ein x1 ∈ X mit f (x1 ) = b, so heißt b das Maximum
von f auf X und x1 eine Maximalstelle. Wir schreiben auch
min f , min f (x) oder min{f (x) | x ∈ X}
x∈X
bzw.
max f , max f (x) oder max{f (x) | x ∈ X}.
x∈X
Ist speziell X ⊂ R und K = R, so können wir monotone Funktionen auszeichnen:
Definition 3.6.
Eine Funktion f : R ⊃ X ∋ x 7→ f (x) ∈ R heißt (monoton) wachsend, wenn für alle
x1 , x2 ∈ X mit x1 < x2 folgt: f (x1 ) ≤ f (x2 ). Sie heißt (monoton) fallend, wenn für alle
x1 , x2 ∈ X mit x1 < x2 folgt: f (x1 ) ≥ f (x2 ). Sie heißt streng (monoton) wachsend bzw.
fallend, wenn aus x1 < x2 , x1 , x2 ∈ X, stets f (x1 ) < f (x2 ) bzw. f (x1 ) > f (x2 ) folgt. f
heißt (streng) monoton, wenn f (streng) monoton wächst oder fällt.
Bemerkung 3.7.
Ist f : X → R streng monoton, so ist f injektiv und besitzt damit eine Umkehrabbildung
f −1 : f (X) → R.
3.2 Grenzwerte von Funktionen
Definition 3.8.
Es sei (X, d) ein metrischer Raum und M ⊂ X.
(i) p ∈ X heißt Häufungspunkt der Menge M, wenn zu jedem r > 0 ein xr ∈ M \ {p}
existiert mit d(xr , p) < r. p ist also genau dann Häufungspunkt von M, wenn eine
Folge (pn )n≥1 in M existiert, die gegen p konvergiert, deren Glieder aber alle von p
verschieden sind.
(ii) p ∈ X heißt Randpunkt der Menge M, wenn in jeder ε-Umgebung Uε (p) := {x ∈
X | d(x, p) < ε} von p (mit ε > 0) sowohl ein Punkt von M als auch ein Punkt von
X \ M liegt. Die Menge aller Randpunkte vom M wird mit ∂M bezeichnet.
◦
M := M \ ∂M heißt Menge der inneren Punkte oder Inneres von M und
M := M ∪ ∂M heißt abgeschlossene Hülle oder Abschluß von M.
93
Abbildung 12: Umgebungen Uε (y) und Uδ (a)
(iii) M ⊂ X heißt offene Menge, wenn für jedes p ∈ M ein ε > 0 existiert mit Uε (p) ⊂ M.
M ⊂ X heißt abgeschlossene Menge , wenn X \ M offen ist.
Beispiel 3.9.
Betrachte das Intervall ]0, 1] im metrischen Raum (R, | · |). 0 und 1 sind Häufungspunkte
von ]0, 1]. Der Punkt 2 ist aber kein Häufungspunkt von M :=]0, 1] ∪ {2}, es gilt
◦
M =]0, 1[, M = [0, 1] ∪ {2} und ∂M = {0, 1, 2}.
]0, 1] und auch M sind weder offen noch abgeschlossen.
Offenbar ist jedes offene (bzw: abgeschlossene) Intervall aus R eine offene (bzw: abgeschlossene) Menge. Ferner kann man zeigen, dass jede offene Menge aus R abzählbare
Vereinigung von offenen Intervallen aus R ist.
Definition 3.10.
Gegeben seien zwei metrische Räume (X, dX ) und (Y, dY ), eine nichtleere Menge M ⊂ X
und eine Abbildung f : M → Y . Sei p ein Häufungspunkt von M; f hat einen Grenzwert
q an der Stelle p, wenn für jede Folge (pn )n≥1 in M \ {p} mit
lim pn = p gilt:
n→∞
lim f (pn ) = q .
n→∞
Wir schreiben dann:
lim f (x) = q.
x→p
Beispiele 3.11.
Sei X = Y = R und dX (x, y) = |x − y|.
a) Ist M = ]0, 1] und f : M ∋ x 7→ c ∈ R, so hat f an der Stelle 0 einen Grenzwert,
obwohl 0 6∈ M. Es gilt:
lim f (x) = c.
x→0
b) Ist M = [0, 1] und
g : M ∋ x 7→
(
0 für
x=0
,
1 sonst
so hat g an der Stelle 0 einen Grenzwert, nämlich 1, und es ist 1 6= g(0) = 0.
94
Satz 3.12.
Es seien nun M eine Teilmenge des metrischen Raumes (X, d), p ein Häufungspunkt von
M und f, g ∈ Abb(M, C) mit
lim f (x) = a,
lim g(x) = b.
x→p
x→p
Dann gilt:
a) lim (f + g)(x) = a + b,
x→p
b) lim (λf )(x) = λa für beliebiges λ ∈ C.
x→p
c) lim (f g)(x) = ab,
x→p
f
d) lim
x→p g
!
a
(x) = , wenn b 6= 0.
b
Beweis: Die Behauptungen ergeben sich direkt aus Satz 2.13. Wir demonstrieren dies für
Teil c): Nach Definition 3.10 genügt es zu zeigen, dass für jede Folge (pn )n≥1 in M \ {p}
mit lim pn = p gilt:
n→∞
lim (f g)(pn ) = a · b.
n→∞
Nun ist aber nach Definition 3.3:
(f g)(pn ) = f (pn ) g(pn ).
und
lim f (pn ) = a,
lim g(pn ) = b.
n→∞
n→∞
Satz 2.13 c) liefert dann die Behauptung.
2
Beispiel 3.13.
Es seien x0 ∈ R und k ∈ N fest, und f : R \ {x0 } −→ R sei definiert durch
f (x) =
xk − xk0
.
x − x0
Besitzt f an der Stelle x0 einen Grenzwert? Zunächst ist x0 ein Häufungspunkt des Definitionsbereichs von f . Für x 6= x0 ist
X
xk − xk0 k−1
xj x0k−1−j .
=
x − x0
j=0
Also gilt nach Satz 3.12
lim f (x) =
x→x0
k−1
X
j=0
lim xj x0k−1−j = kx0k−1 .
x→x0
95
3.3 Stetige Funktionen
Definition 3.14.
Seien (X, dX ), (Y, dY ) zwei metrische Räume, M ⊂ X, f : M → Y eine Abbildung und
p ∈ M. f heißt stetig im Punkt p, wenn zu jedem ε > 0 ein δ = δ(ε) > 0 existiert mit
dY (f (x), f (p)) < ε
für alle x ∈ M, für die
dX (x, p) < δ
gilt. f ist also genau dann stetig im Punkt p, wenn für jede Folge (xn )n≥1 in M mit
lim xn = p stets
lim f (xn ) = f (p) folgt; ist p Häufungspunkt von M, so ist dies
n→∞
n→∞
äquivalent zu lim f (x) = f (p).
x→p
Ist f in allen Punkten aus M stetig, so heißt f stetig auf M.
Wie bei der Konvergenzdefinition (vgl. Bem. 2.10) reicht es für die Stetigkeit im Punkt
p zu zeigen, dass eine Konstante K = K(p) > 0 und zu jedem ε > 0 ein δ = δ(ε, p) > 0
existieren mit
dY (f (x), f (p)) < K ·ε
für alle x ∈ M mit dX (x, p) < δ.
Wir betrachten nun ein paar Prozesse, mit denen man aus stetigen Funktionen neue
gewinnen kann:
Satz 3.15.
Es seien (X, dX ), (Y, dY ) und (Z, dZ ) metrische Räume, ∅ 6= M ⊂ X, f : M → Y ,
g : f (M) → Z und h = g ◦ f : M → Z. Ist f stetig im Punkt p ∈ M und g stetig im
Punkt f (p), so ist h im Punkt p stetig.
Beweis: Sei (xn )n≥1 eine Folge in M mit lim xn = p; wegen der Stetigkeit von f gilt
n→∞
lim f (xn ) = f (p). Die Stetigkeit von g im Punkt f (p) liefert dann auch lim g(f (xn )) =
n→∞
n→∞
g(f (p)), d.h. n→∞
lim h(xn ) = h(p).
2
Direkt aus Satz 3.12 erhalten wir
Satz 3.16.
Seien M eine Teilmenge eines metrischen Raumes (X, d) sowie f, g : M → C stetig
im Punkt p ∈ M und α ∈ C; dann sind auch die Funktionen f + g, αf und f g im
f
Punkt p stetig. Ist g(p) 6= 0, so ist auch die Funktion
: M ′ → C mit M ′ = {x ∈
g
M | g(x) 6= 0} im Punkt p stetig. Die Menge aller stetigen reell- bzw. komplexwertigen
Funktionen bezeichnen wir mit C(X, R) bzw. C(X, C); manchmal lassen wir auch den
Körper weg, wenn aus dem Zusammenhang hervorgeht, ob es sich um komplex- oder
reellwertige Funktionen handelt.
96
Beispiele 3.17.
a) Jedes Polynom P : C → C bzw. P : R → R ist auf C bzw. R stetig.
b) Jede rationale Funktion ist in ihrem Definitionsbereich stetig.
c) Die Dirichlet-Funktion χQ : R → R ist in keinem Punkt x ∈ R stetig. Dagegen ist
χQ · idR genau im Nullpunkt stetig.
Beweis: Trivialerweise sind π0 : K ∋ x 7→ 1 ∈ K und π1 : K ∋ x 7→ x ∈ K auf K
stetig. Dann liefert Satz 3.16 unter Berücksichtigung von πk (x) = xk = π1 (x)k die
Behauptungen a) und b).
√ !
√ !
2
2
Zu c): Sei p ∈ Q; dann ist p +
eine Folge in R \ Q mit lim p +
= p und
n→∞
n n≥1
n
lim χQ
n→∞
√ !
2
p+
= 0 6= χQ (p).
n
Ist p ∈ R \ Q, etwa p = p0 + a mit p0 ∈ Z und a ∈ ]0, 1], so existiert nach Satz 1.55 eine
Folge rationaler Zahlen an mit a = lim an ; also ist
n→∞
p = lim (p0 + an ) und p0 + an ∈ Q
n→∞
sowie
lim χQ (p0 + an ) = 1 6= χQ (p).
n→∞
Entsprechend erhalten wir für p ∈ Q \ {0}:
√ !
√ !
2
2
· p+
=0
lim χ p +
n→∞ Q
n
n
und
sowie für p ∈ R \ Q
χQ (p) · p = p 6= 0
lim χQ (p0 + an )·(p0 + an ) = p 6= 0
n→∞
und
χQ (p) · p = 0.
Ist dagegen p = 0, (pn )n≥1 eine beliebige Folge in R mit lim pn = 0, so folgt wegen
n→∞
χQ (pn )·pn = 0 für pn ∈ R \ Q
und
χQ (pn )·pn = pn für pn ∈ Q
auch
lim χQ (pn )·pn = 0 = χQ (0)·0.
n→∞
2
97
3.4 Sätze über stetige Funktionen
Satz 3.18 (Nullstellensatz von Bolzano).
Es sei f : [a, b] → R stetig auf dem abgeschlossenen Intervall [a, b] mit f (a) < 0 und
f (b) > 0 (oder f (a) > 0 und f (b) < 0). Dann existiert ein x0 ∈ ]a, b[ mit f (x0 ) = 0.
Beweis: Wir definieren induktiv eine Intervallschachtelung [an , bn ] ⊂ [a, b] mit
bn − an = 2−n (b − a)
und
f (an ) ≤ 0,
f (bn ) ≥ 0.
f (a)
a
x0
b
f (b)
Abbildung 13: Nullstellensatz von Bolzano
Dabei haben wir f (a) < 0 und f (b) > 0 vorausgesetzt. Wir setzen [a0 , b0 ] := [a, b];
sei das Intervall [an , bn ] mit obigen Eigenschaften schon definiert. Dann betrachten wir
1
m := (an + bn ); es gibt zwei Fälle:
2
(α) f (m) ≥ 0; dann setzen wir [an+1 , bn+1 ] := [an , m]
(β) f (m) < 0; dann setzen wir [an+1 , bn+1 ] := [m, bn ]
Offensichtlich sind die geforderten Eigenschaften für [an+1 , bn+1 ] erfüllt. Sei
x0 = lim an = lim bn .
n→∞
n→∞
Wegen der Stetigkeit von f folgt
f (x0 ) = lim f (an ) = lim f (bn ).
n→∞
n→∞
Der Vergleichssatz (Satz 2.16) liefert
f (x0 ) = lim f (an ) ≤ 0 und f (x0 ) = lim f (bn ) ≥ 0.
n→∞
n→∞
98
Daraus folgt f (x0 ) = 0.
2
Folgerung 3.19 (Zwischenwertsatz).
Es sei f : [a, b] → R stetig und c eine reelle Zahl zwischen f (a) und f (b). Dann existiert
ein x0 ∈ [a, b] mit f (x0 ) = c.
Abbildung 14: Zwischenwertsatz
Beweis: O.B.d.A. sei f (a) < c < f (b); wir definieren g : [a, b] → R durch g(x) = f (x) − c.
Dann ist g stetig mit g(a) < 0 < g(b). Satz 3.18 liefert die Existenz eines x0 ∈ [a, b] mit
g(x0 ) = 0, d.h. f (x0 ) = c.
2
Folgerung 3.20.
Ist f : [a, b] → [a, b] stetig, so existiert ein x0 ∈ [a, b] mit f (x0 ) = x0 ; dieser wird Fixpunkt
von f genannt.
Beweis: Es ist a ≤ f (x) ≤ b für alle x ∈ [a, b]. Im Fall a = f (a) oder b = f (b) sind wir
fertig. Sei also a < f (a) und f (b) < b; dann besitzt aber die Funktion
g : [a, b] ∋ x 7→ f (x) − x ∈ R
wegen g(a) = f (a) − a > 0 und g(b) = f (b) − b < 0 nach Satz 3.18 eine Nullstelle
x0 ∈ ]a, b[. Damit hat die Funktion f einen Fixpunkt x0 , d.h. ein x0 mit f (x0 ) = x0 . 2
Bevor wir weitere Sätze formulieren können, benötigen wir noch ein paar Verabredungen:
Definition 3.21.
Es sei (X, d) ein metrischer Raum und K ⊂ X; K heißt kompakt, wenn jede Folge in K
eine konvergente Teilfolge besitzt, deren Grenzwert zu K gehört.
99
Beispiele 3.22.
a) K ⊂ X ist genau dann abgeschlossene Menge, wenn der Grenzwert jeder konvergenten Folge in K zu K gehört.
Ein reelles Intervall ist genau dann abgeschlossen, wenn es von der Form [a, b] mit
a, b ∈ R und a ≤ b, von der Form ] − ∞, b] mit b ∈ R, [a, ∞[ mit a ∈ R oder
] − ∞, ∞[ ist.
b) Eine Teilmenge K ⊂ R bzw. K ⊂ C ist genau dann kompakt, wenn K abgeschlossen
und beschränkt ist.
c) Ein reelles Intervall ist also genau dann kompakt, wenn es von der Form [a, b] mit
a ≤ b ist.
d) Ist ∅ =
6 A ⊂ R kompakt, so existieren x0 , x1 ∈ A mit x0 ≤ x ≤ x1 für alle x ∈ A.
e) Sei (X, d) ein metrischer Raum. Dann ist K ⊂ X genau dann abgeschlossen, wenn
K = K ist.
Beweis: a), c) und e) sind trivial.
Zu b): ⇒: Wäre K unbeschränkt, so existierte eine Folge (xn )n≥1 in K mit |xn | > n.
Dann wäre auch jede Teilfolge hiervon unbeschränkt und damit divergent, Widerspruch;
also ist K beschränkt.
Ist nun (xn )n≥1 mit xn ∈ K eine konvergente Folge mit lim xn = x0 ∈ C, so existiert
n→∞
wegen der Kompaktheit von K eine Teilfolge von (xn )n≥1 , die gegen ein Element aus K
konvergiert. Da diese Teilfolge ebenfalls gegen x0 konvergiert, folgt: x0 ∈ K, d.h. K ist
auch abgeschlossen nach a).
⇐: 1) Sei K ⊂ R und (xn )n≥1 eine Folge in K; als beschränkte Folge besitzt (xn )n≥1 eine
konvergente Teilfolge (xnk )k≥1 ; dies läßt sich mit Hilfe des Prinzips der Intervallschachtelung beweisen. Der Grenzwert sei x0 . Wegen der Abgeschlossenheit von K ist x0 ∈ K,
d.h. K ist kompakt.
2) Sei K ⊂ C und (zn )n≥1 eine Folge in K; als beschränkte Folge besitzt (Re zn )n≥1 eine
konvergente Teilfolge (Re znk )k≥1 mit Grenzwert x0 . Die Folge (Im znk )k≥1 enthält nun
eine konvergente Teilfolge (Im zmk )k≥1 ; ihr Grenzwert sei y0 . Als Teilfolge von (Re znk )k≥1
konvergiert (Re zmk )k≥1 ebenfalls gegen x0 , und damit ist nach Folgerung 2.12:
lim zmk = (x0 , y0 ) = z0 .
k→∞
Wegen der Abgeschlossenheit von K ist z0 ∈ K.
Zu d): Als beschränkte Menge besitzt A ein Infimum x0 ∈ R und ein Supremum x1 ∈ R.
Dann existieren Folgen (wn )n≥1 und (zn )n≥1 in A mit x0 = n→∞
lim wn und x1 = n→∞
lim zn .
1
(Ist x0 6∈ A, so wähle wn ∈ A mit x0 < wn < x0 + n ; ist x1 6∈ A, so wähle zn ∈ A mit
x1 − n1 < zn < x1 .) Wegen der Abgeschlossenheit von A folgt: x0 ∈ A und x1 ∈ A.
2
100
Satz 3.23.
Sind (X, dX ) und (Y, dY ) metrische Räume, K ⊂ X kompakt und f : K → Y stetig, so
ist auch f (K) kompakt.
Beweis: Sei (f (xn ))n≥1 eine Folge in f (K); dann besitzt die Urbildfolge wegen der Kompaktheit von K eine konvergente Teilfolge (xnk )k≥1 mit lim xnk = x0 ∈ K. Die Stetigkeit
k→∞
von f liefert:
lim f (xnk ) = f (x0 ) ∈ f (K),
k→∞
d.h. die Kompaktheit von f (K).
2
Folgerung 3.24.
Ist (X, d) ein metrischer Raum, ∅ =
6 K ⊂ X kompakt und f : K → D := f (K) ⊂ R
stetig, so nimmt f Maximum und Minimum auf K an, d.h. es existieren eine Minimalstelle
x1 ∈ K mit f (x1 ) = min f , und eine Maximalstelle x2 ∈ K mit f (x2 ) = max f .
max D = f (x2 )
min D = f (x1 )
a
x1
x2 = b
Abbildung 15: Maximum und Minimum werden auf K = [a, b] angenommen
Beweis: Nach Satz 3.23 und Beispiel 3.22 d) folgt direkt die Behauptung.
2
Folgerung 3.25.
Ist K ⊂ R ein kompaktes Intervall und f : K → R stetig, so ist f (K) entweder eine
einpunktige Menge oder ein kompaktes Intervall.
Beweis: Seien K = [a, b], x0 eine Minimalstelle und x1 eine Maximalstelle von f . Im
Fall f (x0 ) = f (x1 ) ist f (K) = {f (x0 )}. Im Fall f (x0 ) < f (x1 ) existiert nach dem
Zwischenwertsatz zu jedem c ∈ [f (x0 ), f (x1 )] ein x ∈ [a, b] mit f (x) = c. Also ist
f (K) = [f (x0 ), f (x1 )].
2
101
3.5 Logarithmus und allgemeine Potenzen
Bevor wir uns speziellen Funktionen zuwenden, formulieren wir einen Satz über die Umkehrfunktion einer stetigen, streng monotonen Funktion:
Satz 3.26.
Ist f : [a, b] → R stetig und streng monoton mit A := f (a) und B := f (b), so bildet f das
Intervall [a, b] bijektiv auf das Intervall [A, B] bzw. [B, A] ab, und die Umkehrfunktion
f −1 : [A, B] → R (bzw. f −1 : [B, A] → R)
ist ebenfalls stetig und im selben Sinne streng monoton.
Abbildung 16: Umkehrfunktion
Beweis: Der erste Teil der Behauptung folgt aus Bemerkung 3.6 und Folgerung 3.25.
O.B.d.A. sei nun f streng monoton wachsend. Aus A ≤ y1 < y2 ≤ B folgt dann mit
xi ∈ [a, b], f (xi ) = yi sofort x1 < x2 ; also ist f −1 ebenfalls streng monoton wachsend.
Bleibt nur noch die Stetigkeit von f −1 zu zeigen. Sei dazu y0 ∈ [A, B] und (yn )n≥1 eine
Folge in [A, B] mit lim yn = y0 ; zur Vereinfachung bezeichnen wir f −1 mit g; dann ist zu
n→∞
zeigen:
lim g(yn ) = g(y0).
n→∞
Angenommen, dies gilt nicht. Dann existieren ein ε > 0 und eine Teilfolge (ynk )k≥1 von
(yn )n≥1 derart, dass
|g(ynk ) − g(y0)| ≥ ε
für alle k ∈ N gilt. Wegen a ≤ g(ynk ) ≤ b ist die Folge (g(ynk ))k≥1, beschränkt, besitzt
also eine konvergente Teilfolge; o.B.d.A. können wir annehmen, dass (g(ynk ))k≥1 selbst
gegen c konvergiert. Der Vergleichssatz liefert
|c − g(y0)| ≥ ε.
Wegen f (g(ynk )) = ynk folgt aber aus der Stetigkeit von f :
y0 = lim ynk =
k→∞
lim f (g(ynk ))
k→∞
= f
lim g(ynk ) = f (c),
k→∞
102
d.h.
g(y0) = g(f (c)) = c,
im Widerspruch zu |c − g(y0)| ≥ ε.
2
Satz und Definition 3.27.
Sei n ∈ N. Die Abbildung
πn : [0, ∞[→ R
mit πn (x) = xn ist streng monoton wachsend und bildet [0, ∞[ bijektiv auf [0, ∞[ ab. Die
Umkehrfunktion
πn−1 : [0, ∞[→ R
√
mit πn−1 (x) = n x ist ebenfalls stetig und streng monoton wachsend und wird als n-te
Wurzel bezeichnet (vgl. Satz 1.23).
Beweis: Die Stetigkeit von πn wurde in Beispiel 3.17 a) gezeigt. Die strenge Monotonie
folgt direkt aus der Binomischen Formel wegen
xn2 = (x1 + h)n =
n
X
k=0
!
n k n−k
x h
> xn1
k 1
für h > 0. Nach Satz 3.26 bildet πn das Intervall [0, k] für jedes k > 0 bijektiv auf [0, k n ]
ab. Deshalb ist πn eine bijektive Abbildung von [0, ∞[ auf sich. πn−1 ist also definiert
auf [0, ∞[ mit πn−1 ([0, ∞[) = [0, ∞[. Schließlich ist πn−1 nach Satz 3.26 streng monoton
wachsend und stetig auf [0, k n ] für jedes k > 0, also auch stetig in allen Punkten x ≥ 0.
2
Satz und Definition 3.28.
Die Exponentialfunktion exp : R → R ist streng monoton wachsend, stetig (sogar als
Abbildung von C nach C) und bildet R bijektiv auf ]0, ∞[ ab. Die Umkehrfunktion (exp)−1
wird mit ln bezeichnet, d.h.
ln : ]0, ∞[→ R,
und ist ebenfalls stetig sowie streng monoton wachsend und heißt der natürliche Logarithmus. Es gilt für alle x, y > 0 die Funktionalgleichung
ln(xy) = ln x + ln y.
Beweis: Die strenge Monotonie ergibt sich wegen
exp(h) =
hk
>1
k=0 k!
∞
X
für h > 0 aus der Funktionalgleichung folgendermaßen: sind x1 < x2 , d.h. x2 = x1 + h mit
h > 0, so gilt:
exp(x2 ) = exp(x1 + h) = exp(x1 )exp(h) > exp(x1 ).
103
1
1
2
3
e
0
–1
–2
8cm
Abbildung 17: Der natürliche Logarithmus
Wir beweisen nun die Stetigkeit von exp als Funktion von C nach C. Seien dazu z0 ∈ C
fest und h ∈ C; dann gilt
|exp(z0 + h) − exp(z0 )| = |exp(z0 )exp(h) − exp(z0 )| = |exp(z0 )(exp(h) − 1)|
mit
∞
X
∞
∞
X
X
hk |h|k
|h|k
|exp(h) − 1| =
≤ |h|
≤ |h|
≤ exp(|h|)
k=1 k!
k=0 (k + 1)!
k=0 k!
ε
Wählen wir zu vorgegebenem ε > 0 die Größe δ(ε) := min 1,
, so folgt für alle
e
|h| < δ(ε) wegen der Monotonie:
|h|exp(|h|) < |h|exp(1) = |h|e < ε
und damit
|exp(z0 + h) − exp(z0 )| < |exp(z0 )|·ε .
Nun zeigen wir:
exp(R) = ]0, ∞[.
Für alle n ∈ N0 gilt exp(n) ≥ 1 + n sowie exp(−n) =
1
1
≤
und somit, also
exp(n)
1+n
wegen exp(x) > 0
exp(R) =
[
n∈N
[exp(−n), exp(n)] ⊃
[ n∈N
1
, 1 + n =]0, ∞[.
1+n
Wegen exp(x) > 0 für alle x ∈ R, d.h. exp(R) ⊂ ]0, ∞[, folgt die Behauptung.
Also existiert die Umkehrfunktion ln : ]0, ∞[→ R. Nach Satz 3.26 ist ln auf jedem Intervall
[exp(−n), exp(n)] und folglich in jedem Punkt aus ]0, ∞[ stetig.
104
Die Funktionalgleichung folgt schließlich aus der für die Exponentialfunktion. Dazu setzen
wir
v := ln x, w := ln y
d.h.
exp(v) = x,
exp(w) = y;
dann folgt
exp(v + w) = exp(v)exp(w) = xy
und daraus
ln(xy) = v + w = ln x + ln y.
2
Satz und Definition 3.29.
Für a > 0 definieren wir die Exponentialfunktion zur Basis a durch
expa : R ∋ x 7→ exp(x · ln a) ∈ R.
expa ist stetig und streng monoton wachsend für a > 1 bzw. streng monoton fallend für
0 < a < 1 und bildet R bijektiv auf ]0, ∞[ ab. Es gilt
a) expa (x + y) = expa (x)expa (y) für alle x, y ∈ R,
b) expa (n) = an für alle n ∈ Z,
c) expa
p
q
!
=
√
q
ap für alle p ∈ Z und q ∈ N.
Aufgrund dieser Eigenschaften nennt man expa auch die allgemeine Potenz zur Basis a,
und schreibt
ax := expa (x)
(Man beachte: expe (x) = exp x = ex .) Ferner gilt für alle a, b ∈ ]0, ∞[ und alle x, y ∈ R
d) (ax )y = axy ,
e) ax bx = (ab)x ,
f)
x
1
a
= a−x .
Die Umkehrfunktion (expa )−1 : ]0, ∞[→ R ist für a > 0, a 6= 1, ebenfalls stetig und streng
monoton. Wir erhalten
ln x
(expa )−1 (x) =
ln a
und schreiben dafür loga x. Die Funktion loga heißt Logarithmus zur Basis a. Ist a = 10,
so schreiben wir kurz log oder lg statt log10 .
105
2x
4
3
2
1
-3
-2
x
-1
1
2
Abbildung 18: Beispiel für allgemeine Potenzen (a > 1), hier a = 2
3-x
3
2
1
-1
x
1
2
3
Abbildung 19: Beispiel für allgemeine Potenzen ( 0 < a < 1), hier a = 1/3
106
3.6 Trigonometrische Funktionen
Definition 3.30.
Für x ∈ R definieren wir
cos x := Re(eix ) = Re(exp(ix)),
sin x := Im(eix ) = Im(exp(ix));
es ist also
eix = cos x + i sin x
(Eulersche Formel).
Bemerkung 3.31.
Nach Folgerung 2.48 b) gilt für x ∈ R : e−ix = eix = eix = cos x − i sin x, also
|eix |2 = eix · eix = e0 = 1.
Stellen wir also die komplexe Zahl eix im cartesischen Koordinatensystem dar, so liegt
eix auf dem Einheitskreis und cos x ist die Abszisse, sin x die Ordinate des Punktes eix .
Ferner ergibt sich daraus und aus der Definition gemäß Folgerung 1.48:
1
a) cos x = (eix + e−ix ),
2
b) cos(−x) = cos x,
sin x =
1 ix
(e − e−ix )
2i
sin(−x) = − sin x
c) sin2 x + cos2 x = 1
d) cos(x + y) = cos x cos y − sin x sin y
sin(x + y) = sin x cos y + cos x sin y
für alle x, y ∈ R (Additionstheorem)
Aussage d) folgt aus ei(x+y) = eix eiy mit der Eulerschen Formel:
cos(x + y) + i sin(x + y) = (cos x + i sin x)(cos y + i sin y)
= (cos x cos y − sin x sin y) + i(sin x cos y + cos x sin y).
Für komplexes z ∈ C wird cos z bzw. sin z in Anlehnung an a) definiert durch
1
1
cos z = (eiz + e−iz ) bzw. sin z = (eiz − e−iz ).
2
2i
107
Satz 3.32.
Die Funktionen cos : C → C und sin : C → C sind stetig, und es gilt für alle z ∈ C:
cos z =
∞
X
(−1)k
k=0
bzw.
sin z =
∞
X
(−1)k
k=0
z 2k
(2k)!
z 2k+1
.
(2k + 1)!
Beide Reihen konvergieren absolut.
Beweis: Die Stetigkeit ergibt sich aus der Stetigkeit der Abbildungen z 7→ iz und
z 7→ −iz sowie der der Exponentialfunktion.
Wir beweisen die Darstellung für die sin-Funktion:
∞
∞
(−iz)k
1 X
(iz)k X
sin z =
−
2i k=0 k!
k!
k=0
!
∞
zk
1 X
(ik − (−i)k ) .
=
2i k=0
k!
Ist nun k gerade, etwa k = 2n, so folgt
ik − (−i)k = i2n − (−1)2n i2n = 0;
ist dagegen k ungerade, etwa k = 2n + 1, so folgt
1 k
1
(i − (−i)k ) = 2 · i2n+1 = i2n = (−1)n .
2i
2i
Entsprechend folgt die Behauptung für die cos-Funktion. Die absolute Konvergenz ergibt
sich direkt aus der der Exponentialreihe (vgl. Beispiel 2.47).
2
Satz 3.33.
Die Funktion cos hat im Intervall [0, 2] genau eine Nullstelle.
Beweis:
• Existenz: Zeige m.H. von Satz 3.32 cos 0 = 1, cos 2 < 0 und verwende den Nullstellensatz, Satz 3.18.
• Eindeutigkeit: Zeige sin x > 0 in (0, 2] und damit die strenge Monotonie von cos in
[0, 2]; letzteres folgt aus Bemerkung 3.31 d).
2
108
Definition 3.34.
π
ist die (eindeutig bestimmte) Nullstelle der cos-Funktion im Intervall [0, 2].
2
Satz 3.35.
Wir erhalten spezielle Werte der Exponential-, Sinus- und Cosinus-Funktion, nämlich:
π
ei 2 = i,
eiπ = −1,
ei
3π
2
= −i,
e2πi = 1
und
\\ t
\
0
π
3
π
2
2π
4
2
0
−1
0
0
−1
0
1.
π
6
π
4
π
3
π
2
√
√
√
√
\
sin t
cos t
1
2
√
3
2
0
√
4
2
2
2
√
2
2
3
2
√
1
2
π
π
π
= 0 folgt sin2 = 1 − cos2 = 1, also wegen der Überlegungen
2
2
2
π
beim Beweis zu Satz 3.33: sin = 1 und damit
2
Beweis: Wegen cos
π
ei 2 = cos
Weiter ist dann
in· π2
e
Ferner gilt
π n
i2
= e
π
π
+ i sin = i.
2
2



−1
= i =  −i

1
n
für
für
für
n=2
n=3
n = 4.
sin 0 = Im ei0 = 0
und
cos 0 = Re ei0 = 1.
Die Additionstheoreme (oder die Moivresche Formel) liefern (nachrechnen!)
Daraus folgt mit y := cos
π
6
cos 3x = 4 cos3 x − 3 cos x.
4y 3 − 3y = cos
und daraus wegen y > 0 :
π
=0
2
√
3
π
.
y = cos =
6
2
109
Wegen 0 <
π
< 2 ist:
6
π
π
sin = 1 − cos2
6
6
1
2
=
s
1
1
= .
4
2
Die Beziehung
cos 2x = cos2 x − sin2 x
liefert dann:
cos
und damit wegen sin
π
π
π
1
= cos2 − sin2 =
3
6
6
2
π
>0
3
π
sin =
3
r
1−
cos2
√
3
π
=
.
3
2
Schließlich erhalten wir aus cos 2x = 2 cos2 x − 1 mit y = cos
2
2y − 1 = 0 oder y =
und daraus
π
sin =
4
π
:
4
√
2
2
√
π
2
.
1 − cos2 =
4
2
r
2
Folgerung 3.36.
Für alle z ∈ C gilt:
a) cos(z + 2π) = cos z,
b) cos(z + π) = − cos z,
c) cos z = sin
π
−z ,
2
sin(z + 2π) = sin z
sin(z + π) = − sin z
sin z = cos
π
−z
2
Die Eigenschaften in a) bezeichnet man als 2π-Periodizität der cos- bzw. sin-Funktion.
Beweis: Die Beziehungen ergeben sich direkt aus den Additionstheoremen und Satz 3.35.
2
Folgerung 3.37. Die Nullstellenmengen von sin bzw. cos sind:
a) {x ∈ C | sin x = 0} = {kπ | k ∈ Z}
b) {x ∈ C | cos x = 0} =
und
π
+ kπ | k ∈ Z .
2
110
Beweis: Sei zunächst x ∈ R:
π
und wegen cos(−x) = cos x gilt
2
π
π
cos x > 0 für alle − < x < .
2
2
Zu a): Wegen der Definition von
π
Die Beziehung sin x = cos
− x liefert damit
2
sin x > 0 für alle 0 < x < π ,
und wegen sin(x + π) = − sin x gilt dann
sin x < 0 für alle π < x < 2π .
Also sind 0 und π die einzigen Nullstellen von
[0, 2π[. Ist nun x ∈ R
sin im Intervall
x
x
x
+ t mit
∈ Z und t ∈ [0, 1[; daraus
=
beliebig mit sin x = 0, so schreiben wir
2π
2π
2π
folgt
x = 2πm + r
mit m ∈ Z und mit r ∈ [0, 2π[, also
sin r = sin(x − 2πm) = sin x cos 2πm − sin 2πm cos x
= sin x · 1 − 0 · cos x = sin x = 0.
Also ist r = 0 oder r = π und damit
x = 2mπ oder x = (2m + 1)π.
π
.
2
Ist z ∈ C und cos z = 0, so folgt Re cos z = 0 und Im cos z = 0. Nun ist aber für z = x+iy
mit x, y ∈ R:
cos z = 21 (eiz + e−iz )
b) folgt aus a) wegen cos x = − sin x −
d.h.
und
=
1 ix−y
(e
2
=
1 −y
(e (cos x
2
=
1 −y
(e
2
+ e−ix+y )
+ i sin x) + ey (cos x − i sin x))
+ ey ) cos x + 21 i(e−y − ey ) sin x ,
1
Re cos z = (e−y + ey ) cos x = 0
2
1
Im cos z = (e−y − ey ) sin x = 0 .
2
y
Daraus folgt cos x = 0 und e = e−y bzw. y = 0 mit x, y ∈ R.
Entsprechend folgt, dass die sin-Funktion nur die angegebenen reellen Nullstellen besitzt.
2
111
sin x
1
x
-2 p
-p
p
2p
-1
Abbildung 20: sin-Funktion auf [−2π, 2π]
cos x
1
x
-2 p
-p
p
-1
Abbildung 21: cos-Funktion auf [−2π, 2π]
2p
112
Definition 3.38.
π
Für z ∈ C \
+ kπ | k ∈ Z definieren wir die Tangens-Funktion tan durch
2
tan z =
sin z
,
cos z
und für z ∈ C \ {kπ | k ∈ Z} sei die Cotangens-Funktion cot durch
cot z =
cos z
sin z
gegeben.
Bemerkung 3.39.
a) Wegen Folgerung 3.36 b) gilt für alle z ∈ C \
k ∈ Z}:
tan(z + π) = tan z,
π
+ kπ | k ∈ Z bzw. z ∈ C \ {kπ |
2
cot(z + π) = cot z.
In ihren Definitionsbereichen sind also der Tangens bzw. der Cotangens π-periodisch.
b) Es ist
{z ∈ C | tan z = 0} = {kπ | k ∈ Z}
c) und
{z ∈ C | cot z = 0} = {(2k + 1)
π
| k ∈ Z} .
2
d) Es ist tan :] − π2 , π2 [→ R stetig, streng monoton wachsend und bildet ] − π2 , π2 [ bijektiv
auf R ab. Die zugehörige Umkehrfunktion heißt Arcus tangens; wir schreiben arctan
(oder auch Arctan).
e) Aufgrund der Additionstheoreme für die sin- bzw. cos-Funktion gilt für alle x, y ∈ C,
für die tan x, tan y, tan(x + y) definiert sind mit tan x tan y 6= 1:
tan(x + y) =
tan x + tan y
.
1 − tan x tan y
f) Eine entsprechende Aussage gilt für die cot-Funktion, nämlich
cot(x + y) =
cot x cot y − 1
.
cot x + cot y
Hier wird auch für x, y ∈ C vorausgesetzt, dass cot x, cot y und cot(x + y) definiert
sind mit cot x + cot y 6= 0
113
tan x
1
x
-2 p
-p
p
2p
-1
Abbildung 22: tan-Funktion zwischen −2π und 2π
cot x
1
x
-2 p
-p
p
2p
-1
Abbildung 23: cot-Funktion zwischen −2π und 2π
114
3.7 Uneigentliche Grenzwerte und Grenzwerte im Unendlichen
Unter den divergenten Folgen zeichnen wir noch eine Klasse aus in
Definition 3.40.
Eine reelle Zahlenfolge (an )n≥1 heißt bestimmt divergent gegen +∞ (bzw. −∞), wenn es
zu jedem K ∈ R ein N(K) ∈ R gibt, so dass
an > K (bzw. an < K) für alle n > N(K)
gilt. Wir schreiben an → +∞ oder an → −∞ und nennen lim an = ±∞ einen uneigentn→∞
lichen Grenzwert der Folge (an )n≥1 .
Direkt aus der Definition können wir folgende Aussagen herleiten:
Satz 3.41.
a) Ist (an )n≥1 eine Folge mit an > 0 (bzw. an < 0) und lim an = 0, so besitzt die Folge
n→∞
1
den uneigentlichen Grenzwert +∞ (bzw. −∞).
an n≥1
b) Ist (an )n≥1 bestimmt divergent gegen+∞(bzw. −∞), so existiert ein n0 ∈ N mit
1
an 6= 0 für alle n ≥ n0 , und die Folge
konvergiert gegen 0.
an n≥n0
c) Gegeben seien drei reelle Folgen (an )n≥1 , (bn )n≥1 , (cn )n≥1 mit n→∞
lim an = +∞,
lim bn = +∞ und lim cn = c; dann gilt:
n→∞
n→∞
an + bn → +∞,
αan →



+∞ für α > 0
−∞ für α < 0
an bn → +∞
Über das Verhalten von (an − bn )n≥1 und
hergeleitet werden.
an + cn → +∞
an
bn
kann keine allgemeine Aussage
n≥1
Mit Hilfe der uneigentlichen Grenzwerte erhalten wir
Definition 3.42.
Sei X ⊂ R nach oben unbeschränkt, (Y, dY ) ein metrischer Raum und f : X → Y
eine Funktion. Konvergiert für jede Folge (xn )n≥1 in X mit lim xn = +∞ die Folge
n→∞
(f (xn ))n≥1 stets gegen q ∈ Y , so besitzt f für x → +∞ den Grenzwert q. Wir schreiben
dann lim f (x) = q. Entsprechend definieren wir lim f (x) = q, wenn X nach unten
x→+∞
x→−∞
unbeschränkt ist.
115
Defintion 3.43.
(a) Es seien (X, dX ) ein metrischer Raum, M ⊂ X und f : M → R eine Funktion. Ist p
ein Häufungspunkt von M und gilt f (xn ) → +∞ (bzw. −∞) für jede Folge (xn )n≥1
in M \ {p} mit xn → p, so heißt +∞ (bzw. −∞) der uneigentliche Grenzwert von
f für x → p; wir schreiben
f (x) → +∞ (bzw. − ∞) für x → p
oder
lim f (x) = +∞ (bzw. − ∞).
x→p
Für +∞ schreiben wir auch einfach ∞.
(b) Sei X ⊂ R und p Häufungspunkt von X mit (p, p + ε) ⊂ X für ein ε > 0. Ist (Y, dY )
metrischer Raum, f : X → Y beliebig und existiert ein q ∈ Y , so dass für jede Folge
(xn )n≥1 ⊂ (p, p + ε) mit xn → p gilt f (xn ) → q, so heißt q rechtseitiger Grenzwert
von f in p und wir schreiben
f (x) → q für x → p +
oder
lim f (x) = q.
x→p+
Analog definieren wir den linksseitigen Grenzwert q von f im Punkt p, wenn (p −
ε, p) ⊂ X gilt und f (xn ) → q für jede Folge (xn )n≥1 ⊂ (p − ε, p) mit xn → p erfüllt
ist; wir schreiben dann
f (x) → q für x → p −
oder
lim f (x) = q.
x→p−
(c) Schließlich erklären wir für Funktionen f : X ⊂ R → R und einen Häufungspunkt
p von X analog zu (a) die uneigentlichen rechts- bzw. linksseitigen Grenzwerte
lim f (x) = ±∞ und
x→p+
lim f (x) = ±∞.
x→p−
Ist X ⊂ R nach oben bzw. unten unbeschränkt, so können wir auch noch die uneigentlichen Grenzwert
lim f (x) = ±∞ bzw.
x→+∞
lim f (x) = ±∞
x→−∞
definieren.
Beispiele 3.44.
a) Für alle k ∈ N0 gilt:
ex
= ∞.
x→∞ xk
(ex wächst für x → ∞ schneller gegen ∞ als jede Potenz von x.)
lim
116
b) Für alle k ∈ N0 ist
1
lim xk e−x = 0 und
lim xk e x = ∞.
x→∞
c) Es ist
lim ln x = ∞
lim ln x = −∞.
und
x→∞
x→0+
x→0+
d) Ist P ein reelles Polynom der Form
P (x) =
n
X
ak xk
k=0
mit n ∈ N und an 6= 0, so gilt
lim P (x) =
x→∞
und
lim P (x) =
x→−∞
e) Für jedes reelle α > 0 gilt






∞, falls an > 0
−∞, falls an < 0
∞, falls (−1)n an > 0
−∞, falls (−1)n an < 0.
lim xα = 0 und
x→0+
lim x−α = ∞.
x→0+
f) Für alle α ∈ R mit α > 0 ist
lim x−α ln x = 0.
x→∞
(Der Logarithmus wächst für x → ∞ langsamer gegen ∞ als jede positive Potenz
von x.)
Beweis: Zu a): Für alle x > 0 gilt
ex =
also
xn
xk+1
>
,
(k + 1)!
n=0 n!
∞
X
x
ex
>
,
k
x
(k + 1)!
woraus die Behauptung folgt.
Zu b): Die erste Behauptung folgt mit Satz 3.41 direkt aus a) wegen xk e−x =
die zweite folgt ebenfalls aus a) wegen lim f (x) = lim f
y→∞
x→0+
k
1
x
lim x e = lim
x→0+
y→∞
1
y
!k
!
1
, also
y
ey
= ∞.
y→∞ y k
ey = lim
ex
xk
−1
;
117
Zu c): Die erste Behauptung ist klar, da ln : ]0, ∞[→ R streng monoton wachsend und
bijektiv ist. Daraus folgt dann wie in b):
lim ln x = lim ln
y→∞
x→0+
n
Zu d): Für x 6= 0 gilt: P (x) = an x
1
= − lim ln y = −∞.
y→∞
y
an−1
a0
1+
; ist an > 0,
+ ...+
an x
an xn
|an−1 |
|a0 |
K := max 1, 2n
, . . . , 2n
|an |
|an |
!
und x ≥ K, so folgt
1
1
P (x) ≥ an xn ≥ an x
2
2
und daraus die Behauptung für x → ∞. Ist an < 0, so betrachte das Polynom Q mit
Q(x) = −P (x); dieses hat den positiven Höchtskoeffizienten −an . Satz 3.41 c) liefert
dann die Behauptung. Die Behauptung für x → −∞ ergibt sich wegen
P (−x) = (−1)n Q(x)
mit
Q(x) =
n
X
bk xk
k=0
und
bn = an sowie bk = (−1)k−n ak für 0 ≤ k ≤ n − 1.
Zu e): Sei (xn )n≥1 eine reelle Zahlenfolge mit xn > 0 und n→∞
lim xn = 0. Nach Teil c) und
Satz 3.41 folgt
lim α ln xn = −∞.
n→∞
Nach Teil b) ist lim ey = 0, also insbesondere
y→−∞
lim xαn = lim eα ln xn = 0,
n→∞
n→∞
d.h. lim xα = 0. Die zweite Behauptung folgt wegen x−α =
x→0+
1
aus Satz 3.41.
xα
Zu f): Sei (xn )n≥1 eine reelle Zahlenfolge mit xn > 0 und lim xn = ∞; dann ist auch
n→∞
lim yn = ∞ mit yn := α ln xn . Wegen xαn = eα ln xn = eyn erhalten wir
n→∞
lim
n→∞
nach Teil b).
1 yn
1
1
ln
x
=
lim
=
lim
yn e−yn = 0
n
α
y
n
n→∞
n→∞
xn
e α
α
2
118
§4 Differentiation
In diesem Paragraphen sei der Definitionsbereich X ⊂ R einer reellwertigen Funktion f
stets ein Intervall mit den Endpunkten a und b, ein Halbstrahl (also z.B. [a, +∞), (−∞, b),
. . . ) oder ganz R.
4.1 Die Ableitung einer differenzierbaren Funktion
Definition 4.1.
Die Funktion f : X → R heißt differenzierbar im Punkt x0 ∈ X, wenn der Grenzwert
f (ζ) − f (x0 )
ζ→x0
ζ − x0
lim
existiert und endlich ist. Dieser Limes wird mit f ′ (x0 ) bezeichnet und die Ableitung von
f an der Stelle x0 genannt. Ist f in jedem Punkt x0 ∈ X differenzierbar, so heißt f
differenzierbar auf X.
Abbildung 24: Steigungsdreieck
Es ist möglich, rechts- bzw. linksseitige Ableitungen von f an einer Stelle x0 ∈ X zu
definieren (vgl. dazu Definition 3.43 (b)). Ist x0 ein Randpunkt von X, so ist in Definition
4.1 der Grenzwert natürlich als einseitiger Grenzwert zu verstehen.
Ist f : X → R im Punkt x0 ∈ X differenzierbar, so betrachten wir die Funktion g : R → R
mit
g(x) = f (x0 ) + f ′ (x0 )(x − x0 ) ;
dann ist g affin, d.h. es gilt
g(y) − g(x) = c(y − x) für alle x, y ∈ R
mit der Konstante c = f ′ (x0 ). Ist ferner die Funktion Fx0 : X → R definiert durch
Fx0 : X ∋ x 7→











f (x) − f (x0 )

für x 6= x0 

x − x0
∈R,
f ′ (x0 )



für x = x0 
119
so ist Fx0 im Punkt x0 stetig, und es gilt für alle x ∈ X:
f (x) = f (x0 ) + (x − x0 )Fx0 (x).
Daraus erhalten wir
f (x) − g(x)
= 0.
0
x − x0
lim
x→x
Deshalb sagt man, dass die Funktion f in x0 durch g linear approximiert wird. Setzen wir
r(x) := f (x) − g(x) ,
so finden wir
f (x) = f (x0 ) + f ′ (x0 )(x − x0 ) + r(x)
mit
r(x)
= 0.
x→x0 x − x0
lim
Aus der Stetigkeit der Abbildung X ∋ x 7→ f (x0 ) + (x − x0 )Fx0 (x) ∈ R erhalten wir:
Satz 4.2.
Ist f : X → R differenzierbar im Punkt x0 ∈ X, so ist f auch in x0 stetig.
Bezüglich der in Definition 3.3 eingeführten Operationen verhält sich der Differenzierbarkeitsprozeß aus Definition 4.1 folgendermaßen:
Satz 4.3. (Ableitungsregeln)
Es seien f, g : X → R differenzierbar im Punkt x0 ∈ X und c ∈ R. Dann sind auch
f + g, c · f, f · g und fg differenzierbar im Punkt x0 . (Dabei ist fg natürlich nur für solche
x ∈ X definiert, für die g(x) 6= 0 ist; also muß speziell g(x0 ) 6= 0 sein.) Ferner gilt:
a) (f + g)′(x0 ) = f ′ (x0 ) + g ′ (x0 )
b) (cf )′ (x0 ) = cf ′ (x0 )
c) (f · g)′ (x0 ) = f ′ (x0 )g(x0 ) + f (x0 )g ′ (x0 )
d)
f
g
!′
(x0 ) =
g(x0 )f ′ (x0 ) − g ′ (x0 )f (x0 )
g 2 (x0 )
(Produktregel)
(Quotientenregel)
Beweis: a) und b) folgen direkt aus Satz 3.12.
Zu c): Es ist unter Beachtung von Satz 4.2 und Satz 3.12:
f (x)g(x) − f (x0 )g(x0 )
x − x0
= f (x)
g(x) − g(x0 )
f (x) − f (x0 )
+ g(x0 )
x − x0
x − x0
→ f (x0 )g ′(x0 ) + g(x0 )f ′ (x0 ) für x → x0 .
120
Zu d): Wir erhalten wie in Teil c):
f (x)
g(x)
−
f (x0 )
g(x0 )
x − x0
"
=
f (x) − f (x0 )
1
g(x) − g(x0 )
g(x0 )
− f (x0 )
g(x)g(x0 )
x − x0
x − x0
→
1
[g(x0 ) · f ′ (x0 ) − g ′ (x0 )f (x0 )] .
(g(x0 ))2
#
2
Beispiele 4.4.
a) Ist P ein Polynom der Form P (x) =
n
X
k=0
differenzierbar mit
P ′(x) =
n
X
ak xk , so ist P in jedem Punkt x ∈ R
kak xk−1 =
k=1
n−1
X
(k + 1)ak+1xk ;
k=0
speziell für n = 0 erhalten wir P ′(x) = 0 für alle x ∈ R.
In Paragraph 6 werden wir sehen, dass sich konvergente Potenzreihen der Form
P (x) =
∞
X
ak xk analog differenzieren lassen.
k=0
b) Die Funktionen exp, sin, cos : R → R sind in jedem Punkt x ∈ R differenzierbar mit
exp′ (x) = exp(x) = ex ,
sin′ (x)
= cos x ,
cos′ (x)
= − sin x ,
tan′ (x) = 1 + tan2 (x) =
1
.
cos2 x
c) fn : ]0, ∞[ ∋ x 7→ x−n ∈ R, n ∈ N, ist in jedem Punkt x ∈ ]0, ∞[ differenzierbar mit
fn′ (x) = −nx−n−1 .
Beweis: Zu a): Wir schreiben πk (x) := xk und erhalten direkt π0′ (x) = 0 sowie nach
Beispiel 3.13
πk′ = kπk−1 für k ∈ N .
Satz 4.3 a) und b) liefern dann die Behauptung für P .
Zu b): Es gilt mit h = x − x0 aufgrund der Funktionalgleichung der e-Funktion
ex0 +h − ex0
h→0
h
lim
ex0 (eh − 1)
eh − 1
= ex0 lim
h→0
h→0
h
h
= lim
= ex0 · 1
121
wegen
|eh − (1 + h)| ≤
∞
|h|2 X
|h|
2 k=0 3
also
eh − 1
h
Wegen
sin x − sin y = sin
= sin
∞
X
|h|k
|h|k
= |h|2
≤
k=2 k!
k=0 (k + 2)!
∞
X
!k
≤
− 1
3
|h|2
2 für |h| ≤ ,
2
2
3
≤ |h| für |h| ≤ .
2
x+y x−y
x+y x−y
− sin
+
−
2
2
2
2
x−y
x+y
x−y
x+y
cos
+ cos
sin
2
2
2
2
x+y
x−y
x+y
x−y
− sin
cos
− cos
sin
2
2
2
2
= 2 cos
x−y
x+y
sin
2
2
folgt:
!
sin(x0 + h) − sin(x0 )
1
h
h
lim
2 cos x0 +
sin
= lim
h→0
h→0 h
h
2
2
!
!
sin h2
h
· lim h = cos(x0 ) · 1
= lim cos x0 +
h→0
h→0
2
2
wegen
sin x
=1,
x→0 x
lim
was sich aus der Reihendarstellung der sin–Funktion (vgl. Satz 3.32) und einer Überlegung
zur Fehlerabschätzung bei einer alternierenden Reihe ergibt (siehe aber auch Satz 4.27
unten).
Entsprechend erhalten wir
!
cos(x0 + h) − cos x0
h
h
1
lim
2 sin x0 +
sin
= lim −
h→0
h→0
h
h
2
2
!!
!
sin h
h
· lim h 2 = − sin(x0 ).
= − lim sin x0 +
h→0
h→0
2
2
Alternativ kann man diese Ableitungsregeln durch Differentiation der entsprechenden
sin
folgt nun aus der
Potenzreihen berechnen (vgl. Satz 6.13). Die Formel für tan =
cos
Quotientenregel.
122
Zu c): Die Quotientenregel liefert nach Teil a):
fn′ (x0 ) =
xn0 · 0 − nx0n−1 · 1
1
= −n n+1 .
2n
x0
x0
2
Ein weiteres Hilfsmittel zur Differentiation von Funktionen liefert
Satz 4.5. (Kettenregel)
Seien f : X → R und g : X ′ → R Funktionen mit f (X) ⊂ X ′ . Die Funktion f sei im
Punkt x0 ∈ X differenzierbar und g sei in y0 := f (x0 ) ∈ X ′ differenzierbar. Dann ist die
Komposition g ◦ f : X → R im Punkt x0 differenzierbar, und es gilt:
(g ◦ f )′ (x0 ) = g ′ (f (x0 )) · f ′ (x0 ).
Beweis: Betrachte die Funktion
Gy 0
dann ist für alle y ∈ X ′ :





g(y) − g(y0 )
für y 6= y0
y − y0
,
: X ′ ∋ y 7→ 



g ′ (y0 )
für y = y0
g(y) − g(y0) = Gy0 (y)(y − y0 ),
und Gy0 ist im Punkt y0 stetig. Daraus folgt:
(g ◦ f )′ (x0 ) =
=
lim
x→x0
g(f (x)) − g(f (x0 ))
Gy0 (f (x))(f (x) − f (x0 ))
= lim
x→x
0
x − x0
x − x0
f (x) − f (x0 )
x→x0
x − x0
lim Gy0 (f (x)) lim
x→x0
= Gy0 (f (x0 ))f ′ (x0 ) wegen der Stetigkeit von f im Punkt x0
= g ′(f (x0 ))f ′ (x0 ).
2
Beispiel 4.6.
Für a > 0 erhalten wir
(ax )′ = exp′a (x) = ln a · ax .
Beweis: Es ist mit f (x) = x ln a und g(x) = ex nach Satz 4.5 und Beispiel 4.4 b):
(ax )′ = (g ◦ f )′ (x) = g ′(f (x)) · f ′ (x)
= ex·ln a · ln a = ln a · ax .
2
123
Satz 4.7.
Sei f : X → R stetig und streng monoton auf X. Dann existiert die Umkehrfunktion
f −1 : f (X) → R und ist stetig (siehe Satz 3.26). Ist f im Punkt x0 ∈ X differenzierbar
mit f ′ (x0 ) 6= 0, so ist f −1 in y0 = f (x0 ) differenzierbar mit
(f −1 )′ (y0 ) =
1
f ′ (x0 )
1
=
f ′ (f −1 (y
0 ))
.
Beweis: Für y ∈ f (X) mit y = f (x) gilt gemäß Satz 3.12 wegen der Stetigkeit von f −1
und wegen f ′ (x0 ) 6= 0:
lim
y→y0
f −1 (y) − f −1 (y0 )
=
y − y0
x − x0
f (x)→f (x0 ) f (x) − f (x0 )
lim
=
1
lim
x→x0
f (x)−f (x0 )
x−x0
=
1
f ′ (x0 )
.
2
Beispiele 4.8.
√
n
a) Für die n-te Wurzel πn−1 (mit πn−1 (x) =
1
x = x n ) gilt
(πn−1 )′ (x) =
1 1 −1
xn .
n
b) Für x > 0 ist
(ln)′ (x) =
1
.
x
c) Für α ∈ R sei f : ]0, ∞[ ∋ x 7→ xα = eα ln x ∈ R; dann gilt
f ′ (x) = α · xα−1 .
d) Es ist
(arctan)′ (x) =
1
.
1 + x2
Beweis: Zu a): Gemäß Beispiel 4.4 a) und Satz 4.7 gilt
(πn−1 )′ (y) =
1
πn′ (πn−1 (y))
=
1
1
=
n−1
n(πn−1 (y))n−1
ny n
=
1 1−n
1 1
y n = y n −1 .
n
n
Zu b): Nach Beispiel 4.4 b) folgt:
ln′ (y) =
1
exp′ (ln y)
=
1
1
= .
exp(ln y)
y
124
Zu c): Die Kettenregel und b) liefern:
f ′ (x) = eα ln x (α ln x)′ = αxα
1
= αxα−1 .
x
Zu d): Nach Satz 4.7 und Beispiel 4.4 b) gilt
(arctan)′ (x) =
1
1
1
=
=
.
2
(tan)′ (arctan x)
1 + tan (arctan x)
1 + x2
2
4.2 Relative Extrema. Mittelwertsätze.
Wir wenden den Ableitungsbegriff bei der Kurvendiskussion und hier zunächst bei den
lokalen oder relativen Extrema an.
Definition 4.9.
Wir sagen, dass die Funktion f : X → R ein relatives ( oder lokales) Maximum bzw.
Minimum an der Stelle x0 ∈ X besitzt, wenn eine Umgebung Kδ (x0 ) = {x ∈ R | |x−x0 | <
δ} von x0 existiert mit
f (x) ≤ f (x0 ) (bzw. f (x) ≥ f (x0 ))
für alle x ∈ Kδ (x0 ) ∩ X. Lokale Maxima und Minima heißen auch lokale ( oder relative)
Extrema.
Abbildung 25: Lokale Extrema
Satz 4.10. (Notwendiges Kriterium für lokale Extrema)
Seien f : X → R eine Funktion und x0 ∈ X ein innerer Punkt von X, d.h. es gebe ein
r > 0 mit Kr (x0 ) ⊂ X. Ist f im Punkt x0 differenzierbar und besitzt f in x0 ein lokales
Extremum, so ist f ′ (x0 ) = 0.
125
Beweis: O.B.d.A. nehmen wir an, dass f in x0 ein relatives Maximum besitzt. Wir wählen
δ > 0 so, dass Kδ (x0 ) ⊂ X gilt und
f (x) ≤ f (x0 )
für alle x0 − δ < x < x0 + δ. Dann erhalten wir für x0 − δ < x < x0 :
f (x) − f (x0 )
≥ 0,
x − x0
und für x0 < x < x0 + δ:
f (x) − f (x0 )
≤ 0.
x − x0
Die Differenzierbarkeit in x0 liefert dann einerseits f ′ (x0 ) ≥ 0 und andererseits f ′ (x0 ) ≤ 0,
also f ′ (x0 ) = 0.
2
Satz 4.11. (Satz von Rolle)
Es sei f : [a, b] → R (mit a < b) eine stetige Funktion mit f (a) = f (b); ferner sei f in
]a, b[ differenzierbar. Dann exisiert ein x0 ∈]a, b[ mit f ′ (x0 ) = 0.
Beweis: Ist f konstant, so ist die Aussage trivial. Ist f nicht konstant, so existiert ein
x ∈]a, b[ mit f (x) > f (a) oder f (x) < f (a). Also wird das Maximum oder das Minimum
von f in einem Punkt x0 ∈]a, b[ angenommen (Die Existenz ist nach Folgerung 3.24
gesichert.). Satz 4.10 liefert dann die Behauptung.
2
Folgerung 4.12. (Mittelwertsatz der Differentialrechnung)
Es sei f : [a, b] → R (mit a < b) eine stetige Funktion; ferner sei f in ]a, b[ differenzierbar.
Dann existiert ein x0 ∈]a, b[ mit
f (b) − f (a)
= f ′ (x0 ).
b−a
Abbildung 26: Mittelwertsatz
Beweis: Betrachte die Funktion ϕ : [a, b] → R mit
ϕ(x) = f (x) −
f (b) − f (a)
(x − a);
b−a
126
dann ist ϕ auf [a, b] stetig und auf ]a, b[ differenzierbar mit ϕ(a) = f (a) = ϕ(b). Nach dem
Satz von Rolle existiert ein x0 ∈]a, b[ mit ϕ′ (x0 ) = 0, d.h.
f ′ (x0 ) −
f (b) − f (a)
= 0.
b−a
2
Folgerung 4.13.
Sind fi : [a, b] → R stetige, in ]a, b[ differenzierbare Funktionen mit f1′ (x) = f2′ (x) für alle
x ∈ ]a, b[ , so ist f1 = f2 + c mit einer Konstanten c ∈ R. Insbesondere ist f1 konstant,
wenn f1′ auf ]a, b[ verschwindet.
Beweis: Betrachte ein festes x0 ∈ ]a, b[ und f := f1 − f2 . Ist nun x ∈ [a, b] \ {x0 } beliebig,
so erhalten wir aus Folgerung 4.12 mit a = x0 , b = x (oder a = x und b = x0 ):
oder
f (x) − f (x0 )
= f ′ (ξ) = 0 für ein ξ zwischen x0 und x
x − x0
d.h.
f (x) = f (x0 ) = f1 (x0 ) − f2 (x0 ) =: c
f1 (x) = f2 (x) + c.
Mit f2 = 0 erhalten wir die zweite Behauptung.
2
Folgerung 4.14. (Verallgemeinerter Mittelwertsatz)
Sind f, g : [a, b] → R stetig und in ]a, b[ differenzierbar, so existiert ein x0 ∈ ]a, b[ mit
(f (b) − f (a))g ′(x0 ) = (g(b) − g(a))f ′ (x0 ).
Beweis: Betrachte die Funktion ϕ : [a, b] → R mit
ϕ(x) = (f (b) − f (a))g(x) − (g(b) − g(a))f (x);
dann ist ϕ auf [a, b] stetig und auf ]a, b[ differenzierbar mit ϕ(a) = f (b)g(a) − f (a)g(b) =
ϕ(b). Der Satz von Rolle liefert die Behauptung.
2
Folgerung 4.15.
Es sei f : [a, b] → R stetig und auf ]a, b[ differenzierbar.
a) Ist f ′ (x) ≥ 0 (bzw. f ′ (x) > 0) für alle x ∈ ]a, b[, so ist f monoton (bzw. streng
monoton) wachsend.
b) Ist f ′ (x) ≤ 0 (bzw. f ′ (x) < 0) für alle x ∈ ]a, b[, so ist f monoton (bzw. streng
monoton) fallend.
Beweis: Betrachte x1 , x2 ∈ [a, b] mit x1 < x2 ; dann existiert nach Folgerung 4.12 ein
x0 ∈ ]x1 , x2 [ mit
f (x2 ) − f (x1 ) = (x2 − x1 )f ′ (x0 ).
Daraus folgen die Behauptungen.
2
127
Aus Folgerung 4.15 erhalten wir sofort eine hinreichende Bedingung für das Vorliegen
eines relativen Extremwertes in einem inneren Punkt des Definitionsbereiches:
Satz 4.16.
Es sei f : X → R eine Funktion und δ > 0 derart, dass Kδ (x0 ) ⊂ X gilt und f auf Kδ (x0 )
differenzierbar ist mit f ′ (x0 ) = 0. f besitzt an der Stelle x0 ein lokales Maximum bzw.
Minimum, wenn gilt:
f ′ (x) ≥ 0 für alle x ∈ ]x0 − δ, x0 [ und f ′ (x) ≤ 0 für alle x ∈ ]x0 , x0 + δ[
bzw.
f ′ (x) ≤ 0 für alle x ∈ ]x0 − δ, x0 [ und f ′ (x) ≥ 0 für alle x ∈ ]x0 , x0 + δ[.
Beweis: Folgerung 4.15 liefert, dass f auf [x0 − δ, x0 ] monoton wachsend bzw. fallend ist
und auf [x0 , x0 + δ] monoton fallend bzw. wachsend. Daraus folgt sofort die Behauptung.
2
Beispiel 4.17.
Wenden wir das Kriterium aus Satz 4.16 auf die Funktion f : R ∋ x 7→ x4 ∈ R an,
so erhalten wir f ′ (0) = 0 und f ′ (x) = 4x3 > 0 für x > 0 sowie f ′ (x) = 4x3 < 0 für
x < 0. Also liegt im Punkt x0 = 0 ein relatives Minimum vor. Das sonst häufig benutzte
Kriterium mit Hilfe der zweiten Ableitung versagt in diesem Fall. Um dieses Kriterium zu
formulieren, benötigen wir den Begriff der höheren Ableitung.
4.3 Höhere Ableitungen. Taylor-Polynome
Definition 4.18.
Induktiv definieren wir die n-te Ableitung (n ∈ N) einer Funktion f : X → R. f heißt
n-mal differenzierbar im Punkt x0 ∈ X, wenn ein δ > 0 derart existiert, dass
f : Kδ (x0 ) ∩ X → R
auf Kδ (x0 ) ∩ X (n − 1)-mal differenzierbar ist und die (n − 1)-te Ableitung von f in x0
differenzierbar ist. Wir schreiben
f
(n)
dn f (x0 )
(x0 ) =
=
dxn
d
dx
!n
d
f (x0 ) = D f (x0 ) :=
dx
n
!
dn−1
f (x0 ).
dxn−1
f heißt n-mal differenzierbar auf (in) X, wenn f in jedem Punkt x0 ∈ X n-mal differenzierbar ist. Ist die n-te Ableitung f (n) : X → R noch stetig, so heißt f n-mal stetig
differenzierbar. Aus formalen Gründen versteht man unter f (0) die Funktion f selbst.
In Verallgemeinerung der Produktregel erhalten wir für höhere Ableitungen
128
Satz 4.19. (Leibniz-Regel)
Sind f, g : X → R in X n-mal differenzierbar, so ist auch f g n-mal differenzierbar, und
es gilt für alle x ∈ X
!
n
X
dn
n (n−k)
f
(x)g (k) (x).
(f
(x)g(x))
=
n
k
dx
k=0
Beweis: Induktion nach n analog zum Beweis des Binomischen Lehrsatzes, Satz 1.19. 2
Beispiele 4.20.
a) Für alle n, k ∈ N0 gilt
(n)
πk (x) = k(k − 1) · . . . · (k − n + 1)xk−n ,
(k)
(n)
also speziell πk (x) = k! und πk (x) = 0 für n > k (vollständige Induktion über n).
b) Es ist stets
exp(n) (x) = exp(x) = ex .
c) Es ist
d2 2
(2)
d
d2
(x sin x) = π2 (x) sin x + 2π2′ (x) dx
(sin x) + x2 dx
2 (sin x)
2
dx
= 2 sin x + 4x cos x − x2 sin x
nach Satz 4.19.
= (2 − x2 ) sin x + 4x cos x
Satz 4.21. (Satz von Taylor)
Es seien f : X → R eine Funktion, x0 und x aus X sowie n ∈ N. Mit hx0 , xi =: I
bezeichnen wir das kompakte Intervall mit den Eckpunkten x und x0 . Es sei f (n − 1)-mal
◦
stetig differenzierbar auf I und es existiere f (n) für alle z aus dem offenen Intervall I .
◦
Dann existiert ein y0 ∈ I derart, dass gilt:
f (x) =
n−1
X
f (k) (x0 )
f (n) (y0 )
(x − x0 )k +
(x − x0 )n .
k!
n!
k=0
◦
y0 ∈ I läßt sich in der Form y0 = x0 + ϑ(x − x0 ) mit ϑ ∈ ]0, 1[ schreiben.
Tn−1 (f, x0 ) : x 7→
n−1
X
f (k) (x0 )
(x − x0 )k
k!
k=0
f (n) (y0 )
heißt Taylorpolynom (n − 1)-ten Grades von f im Punkt x0 und
(x − x0 )n heißt
n!
Lagrange-Restglied.
129
Beweis: Betrachte F : I ∋ y 7→
differenzierbar mit
F (x0 ) =
und
n−1
X
◦
f (k) (y)
(x − y)k ; dann ist F auf I stetig und auf I
k!
k=0
n−1
X
f (k) (x0 )
(x − x0 )k ,
k!
k=0
F (x) = f (x)
n−1
n−1
X f (k+1) (y)
X f (k) (y)
d
k
F (y) =
(x − y) −
(x − y)k−1
dy
k!
(k − 1)!
k=0
k=1
=
f (n) (y)
(x − y)n−1 .
(n − 1)!
◦
Der verallgemeinerte Mittelwertsatz liefert mit g(y) = (x − y)n die Existenz eines y0 ∈ I
mit
(F (x) − F (x0 ))g ′(y0 ) = (g(x) − g(x0 ))F ′ (y0 )
d.h.
f (x) −
n−1
X
−(x − x0 )n
f (n) (y0)
f (k) (x0 )
(x − x0 )k =
(x − y0 )n−1
n−1
k!
−n(x − y0 )
(n − 1)!
k=0
=
f (n) (y0 )
(x − x0 )n .
n!
2
Wir wenden Satz 4.21 bei einem hinreichenden Kriterium für das Vorliegen eines relativen
Extremums an:
Satz 4.22. (Hinreichendes Kriterium für lokale Extrema)
Sei f : [a, b] → R n-mal stetig differenzierbar auf [a, b], und es gelte für ein x0 ∈ ]a, b[:
f ′ (x0 ) = f (2) (x0 ) = . . . = f (n−1) (x0 ) = 0, aber f (n) (x0 ) 6= 0.
Dann besitzt f für gerades n ∈ N in x0 ein relatives Extremum, und zwar
i) ein lokales Minimum, wenn f (n) (x0 ) > 0 und
ii) ein lokales Maximum, wenn f (n) (x0 ) < 0 ist.
Ist n ungerade, so ist f in einer Umgebung von x0 streng monoton, besitzt also dort kein
relatives Extremum.
Beweis: Aus Satz 4.21 folgt:
f (x) = f (x0 ) +
(x − x0 )n (n)
f (x0 + ϑ(x − x0 ))
n!
mit ϑ ∈ ]0, 1[. Sei nun o.B.d.A. f (n) (x0 ) > 0; dann existiert ein δ > 0 mit
f (n) (x) > 0 für alle a ≤ x0 − δ < x < x0 + δ ≤ b
130
(Stetigkeit von f (n) ). Daher ist
f (n) (x0 + ϑ(x − x0 )) > 0 für alle x0 − δ < x < x0 + δ.
1. Fall: Ist n gerade, so ist (x − x0 )n ≥ 0 für alle x, also
f (x) ≥ f (x0 ) für alle x0 − δ < x < x0 + δ .
2. Fall: Ist n ungerade, so betrachten wir das Taylorpolynom (n − 2)-ten Grades von f ′
im Punkt x0 , d.h.
f ′ (x) =
n−2
X
f (n) (x0 + ϑ(x − x0 ))
f (k+1) (x0 )
(x − x0 )k +
(x − x0 )n−1
k!
(n
−
1)!
k=0
mit ϑ ∈ ]0, 1[. Daher ist also für alle x0 − δ < x < x0 + δ
f (n) (x0 + ϑ(x − x0 ))
f ′ (x) =
(x − x0 )n−1
(n − 1)!



>0
für
=0
für
x 6= x0
x = x0 .
Somit ist f in [x0 − δ, x0 + δ] gemäß Folgerung 4.15 streng monoton wachsend.
2
4.4 Konvexe und konkave Funktionen
Definition 4.23.
f : X → R heißt (streng) konvex, wenn für alle x1 , x2 ∈ X und alle λ ∈ ]0, 1[ gilt
(<)
f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ).
f heißt konkav, wenn −f konvex ist.
Ist x1 < x2 , so bedeutet die Konvexitätsbedingung, dass der Graph von f in [x1 , x2 ]
unterhalb der Sekante durch (x1 , f (x1 )) und (x2 , f (x2 )) liegt (vgl. Abbildung).
Satz 4.24.
◦
◦
Es sei f : X → R stetig und im Inneren X differenzierbar. Ist f ′ auf X (streng) monton
wachsend bzw. fallend, so ist f auf X (streng) konvex bzw. konkav.
Beweis: Seien x1 , x2 ∈ X und λ ∈ ]0, 1[ vorgegeben und o.B.d.A. gelte x1 < x2 . Wir
setzen x := λx1 + (1 − λ)x2 und beachten
x2 − x1 = (1 − λ)(x2 − x1 ),
x2 − x1 = λ(x2 − x1 ).
Nach dem Mittelwertsatz existieren nun Punkte y1 ∈ ]x1 , x[ und y2 ∈ ]x, x2 [ mit
f (x) − f (x1 ) = f ′ (y1 )(x − x1 ), f (x2 ) − f (x) = f ′ (y2 )(x2 − x).
(∗)
131
Abbildung 27: Konvexe Funktion
Hieraus und aus (∗) folgt
f (x) = λf (x) + (1 − λ)f (x)
= λ[f (x1 ) + f ′ (y1 )(x − x1 )] + (1 − λ)[f (x2 ) − f ′ (y2 )(x2 − x)]
= λf (x1 ) + (1 − λ)f (x2 ) + λ(1 − λ)(x2 − x1 )[f ′ (y1 ) − f ′ (y2 )].
Aus y1 < y2 folgen nun die Behauptungen.
2
Anwendung von Folgerung 4.15 liefert aus Satz 4.24 sofort
Satz 4.25.
◦
Es sei f : X → R stetig und im Inneren X von X zweimal differenzierbar.
(>)
◦
a) Ist f ′′ (x) ≥ 0 für alle x ∈ X , so ist f (streng) konvex.
(<)
◦
b) Gilt f ′′ (x) ≤ 0 für alle x ∈ X , so ist f (streng) konkav.
Beispiele 4.26.
′
(x) = 2nx2n−1 ist dort streng monoton
a) π2n , n ∈ N, ist streng konvex auf R, denn π2n
wachsend. π2n+1 , n ∈ N, ist streng konkav auf ]−∞, 0[ und streng konvex auf [0, ∞[.
b) fα : [0, ∞[ ∋ x 7→ xα ist streng konvex auf [0, ∞[ für α > 1 und streng konkav für
0 < α < 1 wegen (xα )′′ = α(α − 1)xα−2 für x > 0.
c) ln : ]0, ∞[ → R ist streng konkav wegen
1
d2
ln(x) = − 2 .
2
dx
x
132
4.5 Grenzwertbestimmung mittels Differentiation
Satz 4.27. (Regel von de l’Hospital)
◦
◦
Es seien f, g : X → R differenzierbar auf X mit g ′ (x) 6= 0 für alle x ∈ X = ]a, b[ (evtl.
a = −∞ oder b = ∞). Gilt eine der Voraussetzungen:
a) lim f (x) = lim g(x) = 0,
x→a+
x→a+
b) lim f (x) = ±∞, lim g(x) = ±∞,
x→a+
x→a+
dann ist
f (x)
f ′ (x)
= lim ′
,
x→a+ g(x)
x→a+ g (x)
lim
falls der rechtsstehende Limes im eigentlichen oder uneigentlichen Sinne existiert.
Eine entsprechende Aussage gilt für x → b−.
Beweis: 1. Fall: Es treffe a) zu und es sei a ∈ R. Definiere
F (x) :=



f (x)
für
x>a
0
für
x=a
,
G(x) :=



g(x)
für
x>a
0
für
x = a,
dann sind F und G stetig auf [a, b[ und differenzierbar auf ]a, b[. Der verallgemeinerte
MWS liefert für x ∈ ]a, b[ :
f (x)
F (x) − F (a)
F ′ (a + ϑ(x − a))
=
= ′
mit ϑ ∈ ]0, 1[
g(x)
G(x) − G(a)
G (a + ϑ(x − a))
Mit x → a+ gilt auch a + ϑ(x − a) → a+; daraus folgt die Behauptung.
Entsprechend folgt die Behauptung für b ∈ R und x → b−.
2. Fall: Es treffe a) zu und es sei a = −∞; wir setzen f1 (y) := f
dann gilt mit h(x) = x1 :
1
y
und g1 (y) := g
1
y
;
− x12 · f1′ x1
f1′ x1
(f1 ◦ h)′ (x)
f ′ (x)
=
=
=
g ′ (x)
(g1 ◦ h)′ (x)
− x12 · g1′ x1
g1′ x1
Mit x → −∞ gilt x1 → 0− und die Behauptung folgt dann aus dem 1. Fall. Ist b = ∞, so
führt die Transformation h auf x1 → 0+ für x → +∞.
3. Fall: Es treffe b) zu und es sei a ∈ R. O.B.d.A. sei g(x) 6= 0 für alle x ∈ Kδ (a) ∩ X.
Dann gilt nach dem verallgemeinerten MWS
(∗)
f (x0 )
g(x0 )
f (x)
=
+ 1−
g(x)
g(x)
g(x)
mit ϑ ∈ ]0, 1[ bei festen x, x0 ∈ Kδ (a) ∩ X.
!
f ′ (x0 + ϑ(x − x0 ))
g ′(x0 + ϑ(x − x0 ))
133
f ′ (x)
= α ∈ R; δ > δ0 > 0 so gewählt, dass zu vorgegebenem ε > 0
x→a+ g ′ (x)
f ′ (x)
gilt: ′
− α < ε für alle a < x < a + δ0 . Mit x, x0 ∈ ]a, a + δ0 [ ist dann auch
g (x)
x0 + ϑ(x − x0 ) ∈ ]a, a + δ0 [ für jedes ϑ ∈ ]0, 1[, also wegen (∗):
(i) Sei lim
f (x0 )
g(x0 )
f (x)
−α =
+ 1−
g(x)
g(x)
g(x)
oder
f (x)
g(x)
− α
≤
!
!
f ′ (x0 + ϑ(x − x0 ))
g(x0 )
−
α
−
α
g ′ (x0 + ϑ(x − x0 ))
g(x)
f (x ) 0 + 1 −
g(x) g(x0 ) ε + |α|
g(x) g(x ) 0 g(x) .
Bei nun festgehaltenem x0 können wir wegen lim |g(x)| = ∞ ein δ1 > 0 so wählen,
x→a+
dass für alle x ∈ ]a, a + δ1 [ gilt:
Damit ist für solche x
d.h.
f (x ) 0 g(x) f (x)
g(x)
< ε und
− α
g(x ) 0 g(x) < ε.
< ε + (1 + ε)ε + |α|ε,
lim
x→a+
f (x)
= α.
g(x)
f ′ (x)
= ∞, so sei δ > δ0 > 0 so gewählt, dass zu vorgegebenem M > 0
(ii) Ist lim ′
x→a+ g (x)
f ′ (x)
gilt: ′
> M für alle a > x < a + δ0 . δ1 > 0 wird dann so gewählt, dass für alle
g (x)
x ∈ ]a, a + δ1 [ gilt:
g(x0 )
1
f (x0 )
> −1 und 1 −
> .
g(x)
g(x)
2
Dann folgt für solche x:
f (x)
1
> −1 + M,
g(x)
2
also
f (x)
= ∞.
x→a+ g(x)
lim
Völlig analog wird der Fall a = −∞ behandelt.
Ebenso wird der Fall x → b− bewiesen.
2
134
Beispiel 4.28.
Betrachte
ex − e−x
;
x→0
x
lim
es ist
d x
(e − e−x ) = ex + e−x
dx
also
und
d
(x) = 1 ,
dx
ex − e−x
ex + e−x
= lim
=2.
x→0
x→0
x
1
lim
Damit folgt z.B.
ex − e−x
ex + e−x − 2
ex − e−x
= lim
= 2.
=
lim
(1
+
x)
x→0 1 − 1
x→0
x→0 x − ln(1 + x)
x
1+x
lim
In Ergänzung zu Abschnitt 3.7 betrachten wir die Umkehrfunktionen der trigonometrischen Funktionen:
Beispiele 4.29. (Umkehrfunktionen der trigonometrischen Funktionen)
(i) Die Funktion sin ist in [− π2 , π2 ] streng monton wachsend und bildet [− π2 , π2 ] bijektiv
auf [−1, 1] ab. Für die zugehörige Umkehrfunktion, genannt Arcussinus, gilt
1
d
Arc sin y = √
dy
1 − y2
(−1 < y < 1).
(ii) Die Funktion cos ist in [0, π] streng monoton fallend und bildet [0, π] bijektiv auf
[−1, 1] ab, für die zugehörige Umkehrfunktion, genannt Arcuscosinus, gilt
d
−1
Arc cos y = √
dy
1 − y2
(−1 < y < 1).
Bemerkung.
Die in Beispiel 4.29 definierten Funktionen Arcussinus und Arcuscosinus nennt man
Hauptzweige von arc sin, arc cos, arc tan.
Für beliebige k ∈ Z gilt:
a) sin bildet [− π2 + kπ, π2 + kπ] bijektiv auf [−1, 1] ab.
b) cos bildet [kπ, (k + 1)π] bijektiv auf [−1, 1] ab.
Die zugehörigen Umkehrfunktionen heißen für (festes) k 6= 0 Nebenzweige von arc sin, arc cos.
135
Abbildung 28: Umkehrfunktionen der trigonometrischen Funktionen
§ 5 Integration
Vorbemerkungen
Unser nächstes Ziel besteht darin, einer krummlinig begrenzten Fläche eine Flächenmaßzahl zuzuordnen. Dabei wollen wir uns der Einfachheit halber zunächst auf solche
Flächen einschränken, die durch die x-Achse, zwei zur y-Achse parallele Geraden durch
die Punkte (a, 0) und (b, 0) mit a < b und den Graphen einer beschränkten, auf dem
Intervall [a, b] definierten, dort nichtnegativen Funktion f eingeschlossen werden.
Sei
T ([a, b]) := {ϕ | ϕ : [a, b] → R Treppenfunktion }
der Vektorraum aller Treppenfunktionen auf [a, b]; siehe Beispiel 3.2 e).
Sei ϕ ∈ T [a, b] := T ([a, b]) sowie
Z1 :
a = x0 < x1 < . . . < xn = b
eine Zerlegung von [a, b] mit ϕ(x) = ck ∀ x ∈ (xk−1 , xk ), 1 ≤ k ≤ n.
Dann ist
Z
Z
n
ϕ :=
b
a
X
ϕ(x)dx :=
k=1
ck (xk − xk−1 )
unabhängig von der Zerlegung Z1 und heißt das Integral von ϕ.
Bemerkung: Ist ϕ(x) ≥ 0 ∀ x ∈ [a, b], so ist
und Gf .
Z
b
a
ϕ(x)dx die Fläche zwischen der x-Achse
Sei f : [a, b] → R beschränkt. Dann heißt
Z
f :=
Z
b
a
f (x)dx := inf
Z
b
a
ϕ(x)dx | ϕ ∈ T [a, b], ϕ ≥ f
136
Abbildung 29: Integral einer Treppenfunktion
Oberintegral von f und
Z
f :=
Z
b
f (x)dx := sup
a
Z
b
a
ϕ(x)dx | ϕ ∈ T [a, b], ϕ ≤ f
Unterintegral von f .
f heißt (Riemann)-integrierbar (kurz:f ∈ R[a, b]), wenn
diesem Fall
Z
f :=
Z
b
a
f (x)dx :=
Z
Z
b
a
f =
Z
b
f , und man setzt in
a
f =: Integral von f (über [a, b]).
Man kann zeigen: f : [a, b] → R ist genau dann integrierbar, wenn zu jedem ε > 0
Treppenfunktionen ϕ, ψ ∈ T [a, b] existieren mit
ϕ ≤ f ≤ ψ und
Z
ψ−
Z
ϕ ≤ ε.
5.1 Integration und Differentiation
Definition und Satz 5.1.
Im Folgenden sei der Definitionsbereich I einer reellwertigen Funktion f : I → R entweder
ein beschränktes Intervall mit den Eckpunkten a und b oder ein Halbstrahl der Form
] − ∞, b] , ] − ∞, b[ , [a, ∞[ bzw. ]a, ∞[ oder ganz R.
F : I → R heißt Stammfunktion oder unbestimmtes Integral von f in I, wenn für alle
x ∈ I gilt:
F ′ (x) = f (x) .
R
Wir schreiben statt F auch
f (x) dx.
Besitzt f auf I eine Stammfunktion, so ist f (Riemann)-integrierbar (über jedes Intervall
[α, β] ⊂ I); ferner heißt F (β) − F (α), α, β ∈ I beliebig, das bestimmte Integral über f von
α bis β , und es gilt (sog. Hauptsatz der Differential- und Integralrechnung)
Z
β
α
β
f (x) dx = F (β) − F (α) =: F (x) .
α
Satz 5.2.
Ist F eine Stammfunktion zu f auf I, so ist {F + cπ0 | c ∈ R} die Gesamtheit aller
Stammfunktionen von f in I.
137
Beweis: Mit F ist auch F +cπ0 eine Stammfunktion zu f . Ist umgekehrt F0 eine beliebige
Stammfunktion von f , so gilt gemäß Definition: (F0 − F )′ (x) = 0 für alle x ∈ I. Gemäß
Folgerung 4.13 ist dann F0 − F konstant.
2
Bemerkungen 5.3.
Sind F, G Stammfunktionen von f in I und sind α, β ∈ I beliebig, so gilt nach Satz 5.2
mit einer geeigneten Konstanten c ∈ R:
G(x) = F (x) + c für alle x ∈ I ,
also
Z
β
α
f (x) dx = F (β) − F (α) = (F (β) + c) − (F (α) + c) = G(β) − G(α) .
Demnach ist das bestimmte Integral über f von α bis β unabhängig von der speziellen
Wahl der Stammfunktion.
Mit den Ableitungen der in §3 und §4 betrachteten Funktionen erhalten wir:
Beispiele 5.4.
Z
xr dx =
Z
1
dx = ln |x| auf einem Intervall, das 0 nicht enthält,
x
Z
ex dx = ex ,
Z
sin x dx = − cos x,
Z
cos x dx = sin x,
Z
1
π
dx = tan x für |x| < ,
2
cos x
2
Z
1
dx = − cot x für 0 < x < π,
sin2 x
Z
√
Z
1
dx = Arc tan x,
1 + x2
1 r+1
x
für r 6= −1,
r+1
1
dx = Arc sin x für |x| < 1,
1 − x2
Z X
n
k=0
ak xk dx =
n
X
ak k+1
x ,
k=0 k + 1
138
und damit z.B.
Z
1
−1
1
(1 − 2x + 3x2 ) dx = x − x2 + x3 = 4.
−1
Wir halten ein paar Eigenschaften des Integrals fest:
Satz 5.5.
Es sei F eine Stammfunktion von f bzw. G eine Stammfunktion von g auf I; ferner seien
c, d ∈ R beliebig sowie α, β, γ ∈ I beliebig. Dann gilt:
a)
Z
und
Z
β
α
(cf + dg)(x) dx = c
(cf + dg)(x) dx = c
Z
Z
f (x) dx + d
β
α
Z
f (x) dx + d
g(x) dx
Z
β
g(x) dx
α
(Linearität des Integrals)
b)
Z
β
α
Z
f (x) dx =
γ
α
f (x) dx +
Z
β
γ
f (x) dx
(Intervall-Additivität)
c)
Z
β
α
f (x) dx = −
Z
α
β
f (x) dx und
Z
α
α
f (x) dx = 0 .
Beweis: Zu a): Die Behauptungen folgen aus
(cF + dG)′ = cF ′ + dG′ = cf + dg .
Zu b) und c): Es ist
Z
β
α
f (x) dx = F (β) − F (α) = (F (γ) − F (α)) + (F (β) − F (γ)) =
und
Z
β
α
Z
f (x) dx = F (β) − F (α) = −(F (α) − F (β)) = −
γ
α
Z
f (x) dx +
α
β
Z
γ
β
f (x) dx
f (x) dx
2
Bemerkung 5.6.
Das bestimmte Integral
Z
β
α
f (x) dx
läßt sich (wie bereits aus den Vorbemerkungen zu §5 folgt) deuten als Inhalt der Fläche,
die von der x−Achse, dem Graphen von f und den beiden Geraden x = α und x = β
139
mit α < β berandet wird. Hierbei sind die Maßzahlen der Flächen, die oberhalb der
x−Achse liegen, positiv und entsprechend die der Flächen, die unterhalb der x−Achse
liegen, negativ.
Wir können uns dies auch folgendermaßen klar machen:
Ist α < β und f ≥ 0 auf [α, β] integrierbar mit Stammfunktion F , so unterteilen wir [α, β]
in Teilintervalle
α = x0 < x1 < . . . < xn−1 < xn = β .
Dann gilt wegen der Intervalladditivität
Z
β
α
f (x) dx =
n−1
X Z xk+1
k=0 xk
f (x) dx =
n−1
X
k=0
(F (xk+1 ) − F (xk )) .
Da F auf [α, β] differenzierbar ist, gibt es nach dem Mittelwertsatz der Differentialrechnung ein tk ∈]xk , xk+1[ mit
F (xk+1 ) − F (xk ) = F ′ (tk )(xk+1 − xk ) = f (tk )(xk+1 − xk ) .
Also folgt
Z
β
α
f (x) dx =
n−1
X
k=0
f (tk )(xk+1 − xk ) ;
dabei nennt man die rechte Seite dieser Identität eine Riemann-Summe. Liegen die Teilpunkte nahe genug beieinander, so ist der Flächeninhalt der Fläche, die von der x−Achse,
dem Graphen von f und den beiden Geraden x = xk und x = xk+1 berandet wird, ungefähr gleich dem Flächeninhalt des Rechtecks der Breite xk+1 − xk und der Höhe f (tk ).
Bemerkung 5.7.
Man kann zeigen: Ist I = [a, b] und f auf I stetig, so besitzt f auf I eine Stammfunktion
F . Mit Hilfe der Überlegungen aus Bemerkung 5.6 läßt sich F als Flächeninhaltsfunktion
definieren.
Eine weitere Möglichkeit zur Berechnung von Stammfunktionen bietet die Produktregel
der Differentiation.
Satz 5.8. (Partielle Integration)
Es seien f und g auf I = [a, b] stetig differenzierbare Funktionen. Dann gilt für beliebige
α, β ∈ I:
Z
Z
β
α
β
f (x)g ′ (x)dx = f (x)g(x) −
α
β
α
f ′ (x)g(x)dx.
Beweis: Mit h = f · g gilt nach der Produktregel h′ = f ′ g + f g ′ , also
Z
β
α
β
h′ (x) dx = h(β) − h(α) = f (x)g(x)
α
und andererseits wegen der Linearität des Integrals
Z
β
α
h′ (x) dx =
Z
β
α
f ′ (x)g(x) dx +
Z
β
α
f (x)g ′(x) dx .
140
2
Beispiele 5.9.
Für 0 < a < b gilt mit g ′ = π0 und f = ln
Z
b
a
ln x dx =
Z
b
a
1 · ln x dx
b
= x ln x −
a
=
Für beliebige a, b ∈ R gilt
Z
b
a
2
sin x dx =
b
x ln x a
Z
b
a
1
dx
x
x·
b
b
− x = x(ln x − 1) .
a
a
b
− sin x cos x a
b
+
= − sin x cos x +
a
Z
b
Z
b
a
a
b
cos2 x dx
(1 − sin2 x) dx
= (x − sin x cos x) −
a
in Form einer Stammfunktion also
2
und damit
Z
Z
Z
b
a
sin2 x dx,
sin2 x dx = x − sin x cos x
1
sin2 x dx = (x − sin x cos x).
2
2
Als Umkehrung der Kettenregel erhalten wir
Satz 5.10. (Substitutionsregel)
Es seien I ein Intervall gemäß Definition 5.1, f : I → R stetig und ϕ : [a, b] → R stetig
differenzierbar mit ϕ([a, b]) ⊂ I. Dann gilt
Z
b
a
′
f (ϕ(t))ϕ (t)dt =
Z
ϕ(b)
ϕ(a)
f (x)dx.
Ist ϕ injektiv (z.B. ϕ′ (t) 6= 0 für alle t ∈ ]a, b[ ), so gilt für alle α, β ∈ ϕ([a, b]):
Z
β
α
f (x)dx =
Z
ϕ−1 (β)
ϕ−1 (α)
f (ϕ(t))ϕ′ (t)dt.
141
Beweis: Ist F eine Stammfunktion von f auf I, so gilt nach der Kettenregel für die
Funktion F ◦ ϕ : [a, b] → R:
(F ◦ ϕ)′ (t) = F ′ (ϕ(t))ϕ′ (t) = f (ϕ(t))ϕ′(t).
Daraus folgt
Z
b
a
f (ϕ(t))ϕ′(t)dt = (F ◦ ϕ)(b) − (F ◦ ϕ)(a) = F (ϕ(b)) − F (ϕ(a))
Z
=
ϕ(b)
f (x)dx.
ϕ(a)
2
Beispiele 5.11.
Ist ϕ : [a, b] → R stetig differenzierbar mit ϕ(t) 6= 0 für alle t ∈ [a, b], so gilt mit f (x) =
Z
b
a
1
x
Z ϕ(b)
ϕ′ (t)
dx
ϕ(b)
dt =
= ln |x| ϕ(a)
ϕ(t)
ϕ(a) x
b
= ln |ϕ(t)| .
a
Z
β
√
e x dx zu berechnen. Wir setzen x = ϕ(t) = t2 für
Für 0 < α < β sei
α
dann ist wegen der Injektivität von ϕ
Z √
Z
β
α
√
e
x
dx =
=
β
√
α
t
= 2e
α≤t≤
√
β,
et 2t dt
√β
t
2 te √

√
α
−
Z
√
√
√
β
(t − 1) √
α
α
β

et dt
√
= 2e
x
β
√
( x − 1) .
α
Als Merkregel halten wir hier fest:
dx
= 2t oder dx = 2t dt. Damit folgt
Ist x = ϕ(t) = t2 , so gilt
dt
Z
√
e
x
dx =
Z
√
et 2t dt = 2et (t − 1) = 2e
x
√
( x − 1) .
2
142
5.2 Integration rationaler Funktionen
Wir gehen von einer rationalen Funktion
D ∋ x 7→ R(x) =
P (x)
∈R
Q(x)
mit Polynomen P und Q sowie D = {x ∈ R | Q(x) 6= 0} aus. Ist Grad P ≥ Grad Q (also
R unecht rational ), lässt sich R durch Polynomdivision in der Form
R(x) = P1 (x) +
P2 (x)
Q(x)
mit Polynomen P1 , P2 darstellen, wobei Grad P2 < Grad Q ist (P2 /Q ist echt rational ).
Zu P1 kann gemäß Beispiel 5.4 eine Stammfunktion berechnet werden. Um für P2 /Q
eine Stammfunktion zu finden, stellen wir eine Partialbruchzerlegung von P2 /Q her. Dazu
benötigen wir die Nullstellen von Q. In diesem Zusammenhang halten wir die folgenden
Sätze fest:
Satz 5.12. (Fundamentalsatz der Algebra)
a) Ist Q =
n
X
k=0
ak πk mit ak ∈ C und an 6= 0 ein (komplexes) Polynom vom Grad n ≥ 1,
so lässt sich Q mit Hilfe seiner verschiedenen Nullstellen z1 , . . . , zm ∈ C in der Form
Q(z) = an
m
Y
µ=1
(z − zµ )νµ ,
z ∈ C,
darstellen, wobei die νµ ∈ N eindeutig bestimmt sind mit
Vielfachheit der Nullstelle zµ .)
m
X
νµ = n. ( νµ heißt
µ=1
b) Sind alle Koeffizienten ak von Q reell mit an 6= 0, so ist mit zµ stets auch z µ eine
Nullstelle von Q mit gleicher Vielfachheit. Fassen wir die Produkte mit zµ und z µ
zusammen, so erhalten wir für x ∈ R die Darstellung
Q(x) = an
s
Y
(x − xj )kj
j=1
mit kj , mℓ ∈ N sowie
s
X
j=1
kj + 2
r
Y
(x2 + Aℓ x + Bℓ )mℓ
ℓ=1
r
X
mℓ = n.
ℓ=1
Dabei sind x1 , . . . , xs die verschiedenen reellen Nullstellen von Q, und keines der
unter sich verschiedenen Polynome x 7→ x2 + Aℓ x + Bℓ mit Aℓ , Bℓ ∈ R hat eine reelle
Nullstelle.
143
Satz 5.13. (Partialbruchzerlegung)
Gegeben sei eine rationale Funktion P2 /Q mit reellen Polynomen P2 und Q, es gelte
Grad P2 < Grad Q. Hat Q die Darstellung aus Satz 5.12 b), so lässt sich P2 /Q in
folgender Form zerlegen:
k
mℓ
j
s X
r X
X
P2 (x) X
Ajν
Bℓµ x + Cℓµ
an
=
+
.
ν
2
µ
Q(x)
j=1 ν=1 (x − xj )
ℓ=1 µ=1 (x + Aℓ x + Bℓ )
Die Berechnung der Koeffizienten Ajν , Bℓµ und Cℓµ ist auf (mindestens) drei Arten möglich:
i) durch Koeffizientenvergleich,
ii) durch Einsetzen spezieller Werte,
iii) durch die Grenzwertmethode.
Wir werden diese drei Verfahren an Beispielen erläutern.
Beispiele 5.14.
a) Sei
x2 + 2x + 3
;
(x − 1)2 (x + 1)2
dann erhalten wir gemäß Satz 5.13 die Partialbruchzerlegung
R(x) =
(∗)
R(x) =
A11
A12
A21
A22
+
+
+
,
2
x − 1 (x − 1)
x + 1 (x + 1)2
nach Multiplikation mit dem Hauptnenner N(x) folgt für alle x ∈ R (!)
(∗∗) R(x)N(x) = A11 (x−1)(x+1)2 +A12 (x+1)2 +A21 (x−1)2 (x+1)+A22 (x−1)2 .
Zum Koeffizientenvergleich wird ausmultipliziert
x2 +2x+3 = A11 (x3 +x2 −x−1)+A12 (x2 +2x+1)+A21 (x3 −x2 −x+1)+A22 (x2 −2x+1),
es ist also
A11
A11 +
+ A21
= 0
A12 − A21 +
A22 = 1
A12 + A21 +
A22 = 3
−A11 + 2A12 − A21 − 2A22 = 2
−A11 +
Der Gauß-Algorithmus, angewandt auf die erweiterte Koeffizientenmatrix des obigen
Gleichungssystems mit den Unbekannten A11 , A12 , A21 , A22 , liefert die Dreiecksgestalt:


1
0
1
0 0
 0
1 −2
1 1 




 0
0
1 −1 0 
0
0
0
4 2
144
und damit
1
A22 = ,
2
A21 =
3
A12 = ,
2
1
A11 = − .
2
1
2
Durch Einsetzen von vier verschiedenen Werten (besonders zu empfehlen sind die
Nullstellen des Nenners von R) in (∗∗) erhalten wir ebenfalls vier Gleichungen mit
vier Unbekannten und dann nach dem Gauß-Algorithmus wieder die obige Lösung.
Um die Grenzwertmethode anzuwenden, multipliziere man (∗) mit (x − 1)2 , d.h.
"
#
A21
A22
A11
x2 + 2x + 3
,
= A12 + (x − 1)2
+
+
2
(x + 1)
x − 1 x + 1 (x + 1)2
und hieraus folgt
x2 + 2x + 3
3
= .
2
x→1
(x + 1)
2
A12 = lim
Entsprechend folgt
x2 + 2x + 3
1
= .
x→−1 (x − 1)2
2
A22 = lim
Durch Substitution der Terme
R∗ (x) = −
A22
A12
und
von R(x) erhalten wir
2
(x − 1)
(x + 1)2
1
A11
A21
=
+
(x − 1)(x + 1)
x−1 x+1
und hieraus
A11 = lim −
x→1
1
1
=−
x+1
2
sowie
A21 = lim −
x→−1
1
1
= .
x−1
2
b) Sei
R(x) =
nun gilt
x3
x−2
;
− 3x2 + 4x − 2
x3 − 3x2 + 4x − 2 = (x − 1)(x − (1 + i))(x − (1 − i))
= (x − 1)(x2 − 2x + 2).
Damit lautet die Partialbruchzerlegung
R(x) =
B11 x + C11
A11
+ 2
;
x − 1 x − 2x + 2
145
also gilt
x − 2 = A11 (x2 − 2x + 2) + (B11 x + C11 )(x − 1)
= (A11 + B11 )x2 + (−2A11 − B11 + C11 )x + 2A11 − C11 .
Koeffizientenvergleich liefert
A11 + B11
=
0
−2A11 − B11 + C11 =
1
− C11 = −2
2A11
Als Lösung erhalten wir
A11 = −1,
B11 = 1,
C11 = 0.
2
Gemäß Satz 5.13 kann also die Integration (echt) rationaler Funktionen auf die Integration
einiger einfacher Funktionen zurückgeführt werden; es gilt
i)
Z
A
dx = A · ln |x − xj |,
x − xj
ii)
Z
A
A
dx
=
(x − xj )−ν+1 für ν > 1,
ν
(x − xj )
−ν + 1
iii)
Z
Z
Bx + C
BZ
2x + 2α
dx
dx
=
dx
+
(C
−
Bα)
,
(x2 + 2αx + β)k
2
(x2 + 2αx + β)k
(x2 + 2αx + β)k
wobei x2 + 2αx + β > 0 ist für alle x ∈ R.
Zunächst gilt nach Beispiel 5.11
Z
x2
2x + 2α
dx = ln(x2 + 2αx + β)
+ 2αx + β
und mittels Substitution y = x2 + 2αx + β folgt
Z
(x2
2x + 2α
1
dx =
(x2 + 2αx + β)−k+1 für k > 1.
k
+ 2αx + β)
−k + 1
Es bleibt noch das Integral
für x ∈ R folgt
Z
dx
zu bestimmen. Wegen x2 + 2αx + β > 0
(x2 + 2αx + β)k

x+α
x + 2αx + β = (β − α )  √
β − α2
2
2
!2

+ 1
146
mit β − α2 > 0. Wir substituieren
x = ϕ(t) = t ·
d.h.
q
β − α2 − α
x+α
;
t= √
β − α2
dann gilt:
Z
Z
Z
q
1
dx
dt
β − α2 dt = K
=
.
2
k
2
2
k
2
(x + 2αx + β)
((β − α )(t + 1))
(t + 1)k
Für das verbleibende Integral lässt sich eine Rekursionsformel herleiten, es gilt für k > 1:
Ik :=
Z
Z
Z
dt
t2
dt
=
−
dt
(t2 + 1)k
(t2 + 1)k−1
(t2 + 1)k
= Ik−1 −
Z
2t
t
· 2
dt
2 (t + 1)k
(partielle Integration)
t
1
1
1
= Ik−1 −
(t2 + 1)−k+1 −
2 (−k + 1)
2 (−k + 1)
=
Z
dt
2
(t + 1)k−1
!
!
t
1
1
1
Ik−1 −
(t2 + 1)−k+1.
1+
2 (−k + 1)
2 (−k + 1)
Beginn der Rekursion ist
I1 =
Z
t2
Z
dx
3
+
x−1 2
dt
= arctan t.
+1
Beispiele 5.15.
a) Gemäß Beispiel 5.14 a) gilt:
Z
x2 + 2x + 3
1
dx = −
2
2
(x − 1) (x + 1)
2
Z
dx
1
+
2
(x − 1)
2
Z
dx
1
+
x+1 2
Z
dx
(x + 1)2
3
1
1
1
1
1
= − ln |x − 1| − ·
+ ln |x + 1| − ·
2
2 x−1 2
2 x+1
1 x + 1 2x + 1
−
ln
.
=
2 x − 1 x2 − 1
b) Für das Beispiel aus 5.14 b) folgt
Z
Z
Z
x−2
dx
xdx
dx = −
+
3
2
2
x − 3x + 4x − 2
x−1
x − 2x + 2
= − ln |x − 1| +
1
2
Z
2x − 2
dx +
2
x − 2x + 2
Z
dx
(x − 1)2 + 1
Z
dt
1
2
= − ln |x − 1| + ln(x − 2x + 2) +
2
2
t +1
= − ln |x − 1| +
(t = x − 1)
1
ln(x2 − 2x + 2) + arctan(x − 1).
2
147
5.3 Uneigentliche Integrale
Ziel: Integration unbeschränkter Funktionen, Integration über unendliche Intervalle.
Der Interpretation des bestimmten Integrals als Flächenmaßzahl liegen im Wesentlichen
zwei Voraussetzungen zugrunde: Erstens ist der Integrationsbereich [a, b] beschränkt und
zweitens ist die zu integrierende Funktion beschränkt. In gewissen Fällen kann auf diese
Voraussetzungen verzichtet werden; dann gelangt man zu den sog. uneigentlichen Integralen. Wir betrachten drei Fälle:
(i) Eine Integrationsgrenze ist unendlich.
(ii) Der Integrand ist an einer Integrationsgrenze nicht definiert.
(iii) Beide Integrationsgrenzen sind kritisch.
Abbildung 30: Uneigentliche Integrale
Wir betrachten zunächst drei Beipiele:
Beipiele 5.16.
F (x) :=
Z
G(x) :=
Z
aber
lim
x
−t
e
0
x
Z
1
x→0+ x
Definition 5.17.
dt = −e = 1 − e−x =⇒ lim F (x) = 1,
x→∞
dt
√ =
t
1
x
−t √ 1
2 t
x
0
= 2(1 −
√
x) =⇒ lim G(x) = 2,
x→0+
1
dt
= lim log t = lim (− log x) = +∞.
x→0+
x→0+
t
x
Es sei f : [a, ∞[ → R über jedem Intervall [a, b] mit b > a integrierbar. Existiert der
Grenzwert
Z b
lim
f (x)dx,
b→∞ a
148
so heißt das Integral
Z
∞
a
f (x)dx konvergent und man setzt für dessen Wert
Z
∞
a
f (x)dx := lim
Z
b
b→∞ a
f (x)dx.
Existiert der Grenzwert nicht, so heißt das uneigentliche Integral
Existiert lim
Z
b
b→∞ a
Z
∞
a
f (x)dx divergent.
|f (x)|dx, so heißt das uneigentliche Integral absolut konvergent. Analog
definiert man im Fall f : ] − ∞, b] → R das uneigentliche Integral
Beispiel 5.18.
Z
konvergiert genau dann, wenn s > 1 ist.
∞
1
Z
b
f (x)dx.
−∞
dx
xs
Beweis: Es gilt für beliebiges b > 1:
Z
b
1




b1−s
1
−
für s 6= 1
dx
1
−
s
1
−
s
=

xs

 ln b
für s = 1
Durch Grenzübergang b → ∞ ergibt sich sofort die Behauptung.
2
Zwischen uneigentlichen Integralen und Reihen besteht ein enger Zusammenhang.
Satz 5.19. (Integralkriterium für unendliche Reihen)
Ist für ein n0 ∈ N die Funktion f : [n0 , ∞[ → R nichtnegativ und monoton fallend und
besitzt f auf jedem Intervall [n0 , R] mit R > n0 eine Stammfunktion, so konvergiert das
uneigentliche Integral
Z
∞
n0
f (x)dx genau dann, wenn die Reihe
∞
X
f (k) konvergiert.
k=n0
Beweis: Aus f (k) ≤ f (x) ≤ f (k − 1) für k − 1 ≤ x ≤ k folgt
f (k) ≤
Z
k
k−1
f (x)dx ≤ f (k − 1),
also
N
X
(∗)
k=n0 +1
f (k) ≤
Z
N
n0
f (x)dx ≤
N
−1
X
f (k)
k=n0
für alle N > n0 .
>: Ist
gent.
Z
∞
n0
f (x)dx konvergent, so ist nach (∗) die Reihe
∞
X
k=n0
f (k) beschränkt, also konver-
149
<: Ist
∞
X
f (k) konvergent, so folgt aus (∗), dass mit einer Konstanten K > 0 für alle
k=n0
t ≥ n0 gilt:
Z
t
n0
f (x)dx ≤ K. Die Funktion
F (t) :=
Z
t
n0
f (x)dx
ist also monoton wachsend und beschränkt. Sei s = sup F (t) und ǫ > 0. Dann existiert
t≥n0
ein t0 ∈ R mit
s − ǫ < F (t0 ) ≤ s ,
also gilt für alle t ≥ t0
s − ǫ < F (t) ≤ s ,
daher ist s = lim F (t).
2
t→∞
Beispiel 5.20.
∞
X
1
auf Konvergenz; zunächst ist f : [2, ∞[ ∋ x 7→ x · ln x
n=2 n · ln(n)
1
monoton wachsend, also g = monoton fallend, und wir erhalten
f
Wir untersuchen
Z
2
∞
dx
=
x ln x
=
lim
Z
b
b→∞ 2
b
dx
= lim ln(ln x)
2
x ln x b→∞
lim ln(ln b) − ln(ln 2) = ∞.
b→∞
Also divergiert die obige Reihe.
Wir untersuchen nun den oben angegebenen Fall (ii):
Definition 5.21.
Es sei f : ]a, b] → R eine Funktion, die über jedem Teilintervall [α, b] mit a < α < b
integrierbar ist. Existiert der Grenzwert
lim
Z
b
α→a+ α
so heißt das Integral
Z
b
a
f (x)dx,
f (x)dx konvergent und man setzt
Z
b
a
f (x)dx = lim
Z
b
α→a+ α
f (x)dx.
ExistiertZder Grenzwert nicht, so heißt das Integral divergent. Analog definiert man das
Integral
b
a
f (x)dx für bei b nicht definiertem f .
150
Beispiele 5.22.
a) Für α 6= −1 gilt
Z
0
1
α
x dx =
lim
1
ǫ→0+ ǫ




=
Für α = −1 erhält man
Z
1
0
Also konvergiert das Integral
Z
ǫ→0+
1
(1 − ǫα+1 )
α+1
1
für α > −1
α+1



Z
xα dx = lim
∞
für α < −1.
dx
= − lim ln ǫ = ∞.
ǫ→0+
x
1
0
xα dx genau für α > −1.
b) Es ist
Z
1
0
√
dx
=
1 − x2
Z
dx
= lim (Arcsin (1 − ǫ) − Arcsin 0)
ǫ→0+ 0
1 − x2 ǫ→0+
π
= Arcsin 1 = .
2
lim
1−ǫ
√
Wir wollen nun auf den vorne erwähnten Fall (iii) näher eingehen:
Definition 5.23.
Sei f : ]a, b[→ R mit a ∈ R ∪ {−∞}, b ∈ R ∪ {∞} eine Funktion, die auf jedem
Intervall [α, β] ⊂ ]a, b[ integrierbar ist, und ferner sei c ∈ [a, b] beliebig. Existieren die
uneigentlichen Integrale
Z c
Z c
f (x)dx = lim
f (x)dx
α→a+ α
a
und
Z
b
c
so heißt das Integral
Z
b
a
f (x)dx = lim
Z
β
β→b− c
f (x)dx,
f (x)dx konvergent , und wir setzen
Z
b
a
f (x)dx =
Z
c
a
f (x)dx +
Z
c
b
f (x)dx.
Im Fall a = −∞ bzw. b = ∞ fordern wir natürlich die Existenz von
Z
c
−∞
f (x)dx bzw.
Z
∞
c
f (x)dx.
Wie man sich leicht überlegt, ist diese Definition von der Wahl des Punktes c ∈ ]a, b[
unabhängig.
151
Beispiele 5.24.
a) Nach Beispiel 5.18 und 5.22 a) ist
Z
∞
0
dx
für jedes s ∈ R divergent.
xs
b) Es ist
Z
∞
−∞
dx
=
1 + x2
Z
lim
0
R→∞ −R
dx
+ lim
1 + x2 R→∞
Z
R
0
dx
1 + x2
= − lim Arctan (−R) + lim Arctan R =
R→∞
R→∞
π π
+ = π.
2
2
Satz und Definition 5.25.
Für jedes x > 0 konvergiert das uneigentliche Integral
Z
∞
0
e−t · tx−1 dt =: Γ(x).
Die dadurch definierte Funktion Γ : ]0, ∞[→ R heißt Gamma-Funktion .
Abbildung 31: Gamma-Funktion
Beweis: Wir betrachten die beiden Integrale
I1 :=
Z
0
1
−t x−1
e t
dt und I2 :=
Z
∞
1
e−t tx−1 dt.
α) Für x ≥ 1 ist I1 ein eigentliches Integral, und für 0 < x < 1 und 0 < t ≤ 1 gilt
|e−t tx−1 | ≤ tx−1 .
Damit ist
Z
ǫ
1
e−t tx−1 dt ≤
Z
1
ǫ
tx−1 dt für 0 < ǫ < 1,
und Beispiel 5.22 a) liefert die Konvergenz von I1 .
152
t
t
β) Wegen lim e− 2 tx−1 = 0 existiert ein t0 > 0 mit e− 2 tx−1 ≤ 1 für alle t ≥ t0 ; damit
t→∞
ist
t
t
t
|e−t tx−1 | = e− 2 e− 2 tx−1 ≤ e− 2
für alle t ≥ t0 . Da das uneigentliche Integral
Z
das uneigentliche Integral
∞
−t x−1
e t
t0
Z
∞
t0
t
e− 2 dt konvergiert, konvergiert auch
dt und damit I2 .
2
Satz 5.26.
Für alle x > 0 gilt die Funktionalgleichung der Gamma-Funktion:
x · Γ(x) = Γ(x + 1);
es gilt Γ(1) = 1 und Γ(n + 1) = n! für alle n ∈ N0 .
Beweis: Partielle Integration liefert
Z
ǫ
R
R
−tx e−t ǫ
−t x
e t dt =
+x
Z
R
ǫ
tx−1 e−t dt
= −Rx e−R + ǫx e−ǫ + x
also
Γ(x + 1) =
lim
ǫ→0+
R→∞
=
Ferner ist
Z
R
ǫ
ǫ
R
tx−1 e−t dt,
e−t tx dt
x −R
lim −R e
R→∞
Z
x −ǫ
+ lim ǫ e
ǫ→0+
+ x ǫ→0+
lim
R→∞
Z
R
ǫ
tx−1 e−t dt
= x · Γ(x).
Z
Γ(1) = lim
R
R→∞ 0
e−t dt = lim (1 − e−R ) = 1.
R→∞
Durch Induktion nach n folgt daraus der Zusammenhang zur Fakultät.
2
Satz 5.27.
Für jedes x > 0 gilt:
n! · nx
.
n→∞ x(x + 1) · . . . · (x + n)
Γ(x) = lim
Wir
beweisen zur Vorbereitung des u.a. Satzes 5.29 eine Rekursionsformel für Im (x) :=
Z
sinm xdx, die auch für sich gesehen eine interessante Beziehung liefert. Eine entspre-
chende Formel läßt sich auch für
Z
cosm xdx beweisen.
153
Satz 5.28.
Es gilt für alle m ≥ 2:
Im (x) = −
1
m−1
cos x · sinm−1 x +
Im−2 (x)
m
m
mit
I0 (x) = x und I1 (x) = − cos x.
Beweis: Partielle Integration liefert
Im (x) = −
Z
sinm−1 x(− sin x)dx
= − cos x · sinm−1 x + (m − 1)
Z
cos2 x sinm−2 x dx
= − cos x · sinm−1 x + (m − 1)Im−2 (x) − (m − 1)Im (x).
2
Satz 5.29. (Wallissches Produkt)
Es gilt
∞
k
Y
Y
4n2
π
4n2
=
:=
lim
2
k→∞
2 n=1 4n2 − 1
n=1 4n − 1
Beweis: Wir erhalten aus Satz 5.28 folgende Rekursionsformel für die bestimmten Intgrale
Am :=
nämlich
Am =
m−1
Am−2
m
Z
0
π
2
sinm x dx,
mit A0 =
π
2
und A1 = 1.
Daraus folgt
A2n
(2n − 1)(2n − 3) · . . . · 3 · 1 π
· =
=
2n(2n − 2) · . . . · 4 · 2
2
und
A2n+1 =
n
Y
2k − 1
2k
k=1
!
n
Y
2n(2n − 2) · . . . · 4 · 2
2k
·1=
.
(2n + 1)(2n − 1) · . . . · 5 · 3
2k + 1
k=1
h
i
Wegen sin2n+2 x ≤ sin2n+1 x ≤ sin2n x für x ∈ 0, π2 gilt
A2n+2 ≤ A2n+1 ≤ A2n .
Also folgt aus
lim
n→∞
2n + 1
A2n+2
= lim
=1
n→∞
A2n
2n + 2
π
2
154
auch
A2n+1
= 1.
n→∞ A2n
lim
Nun ist aber
n
n
Y
(2k)2
4k 2
2
2 Y
A2n+1
=
· =
.
A2n
π k=1 4k 2 − 1
k=1 (2k + 1)(2k − 1) π
2
Als Anwendung liefert das Wallissche Produkt:
Satz 5.30. (Gauß’sches Fehlerintegral)
Es gilt
Z
∞
−x2
e
dx = Γ
−∞
Beweis: Die Substitution x =
√
Z
t liefert für ǫ > 0 und R > ǫ:
R
ǫ
√
1
= π.
2
2
e−x dx =
1 Z R2 − 1 −t
t 2 e dt
2 ǫ2
Grenzübergang ǫ → 0+ und R → ∞ ergibt
Z
∞
0
und damit
Z
∞
−x2
e
−x2
e
dx = 2
−∞
1
1
dx = Γ
2
2
Z
∞
0
−x2
e
dx = Γ
1
.
2
Nun ist nach Satz 5.27:
√
√
n! n
n! n
1
= lim ,
= lim 1 Γ
1
1
1
1
1
1
n→∞
n→∞
2
1
+
·
.
.
.
·
n
+
1
−
2
−
·
.
.
.
·
n
−
n
+
2
2
2
2
2
2
2
also nach Satz 5.29
Γ
2
1
2
=
n
k2
2n Y
n→∞ n + 1
k2 −
2 k=1
lim
= 2·
d.h.
Γ
1
4
4k 2
π
= 2 · = π,
2
2
k=1 4k − 1
∞
Y
√
1
= π.
2
2
155
5.4 Näherungsweise Integration
Die geometrische Interpretation des bestimmten Integrals führt zu Näherungsverfahren
zur Berechnung von
Z
β
α
f (x) dx ,
wenn das Integral nicht geschlossen berechnet werden kann. Hierzu wählen wir eine
Schrittweite
β−α
h :=
mit n ∈ N
n
und dann die Punkte
xk := α + kh mit k = 0, 1, . . . , n .
Wir betrachten drei der häufig eingesetzten Verfahren.
(i) Die Mittelpunktsregel:
Wir ersetzen im Intervall [xk , xk+1] den Flächeninhalt unter dem Graphen von f
durch den Flächeninhalt des Rechtecks mit der Breite xk+1 − xk und der Höhe
f (xk + h2 ). So ergibt sich die Mittelpunktsregel
!
n−1
X
h
h
h
h
Mh (f ) := h f (x0 + ) + f (x1 + ) + . . . + f (xn−1 + ) = h
f (xk + ) .
2
2
2
2
k=0
Für f ∈ C 2 ([α, β]) gilt für den Fehler folgende Abschätzung:
|
Z
β
α
f (x) dx − Mh (f )| ≤
(β − α)3 ′′
||f || .
24n2
Dabei bezeichnet ||.|| die Supremumsnorm, bezogen auf das Intervall [α, β].
(ii) Die Trapez-Regel:
Ersetzen wir im Intervall [xk , xk+1 ] den Graphen der Funktion f durch die die Punkte
(xk , f (xk )) und (xk+1 , f (xk+1 )) verbindende Gerade, so erhalten wir als Flächeninhalt des sich ergebenden Trapezes
1
h
(xk+1 − xk )(f (xk ) + f (xk+1 )) = (f (xk ) + f (xk+1 ))
2
2
und damit die Trapezregel
1
1
f (x0 ) + f (x1 ) + . . . + f (xn−1 ) + f (xn ) .
2
2
Th (f ) := h ·
Ist f ∈ C 2 ([α, β]), so erhalten wir für den Fehler folgende Abschätzung:
Z
β
α
f (x) dx − Th (f ) ≤
(β − α)3 ′′
||f || .
12n2
156
(iii) Die Simpson-Regel:
Ersetzt man den Graphen in [xk , xk+1 ] durch die (eindeutig bestimmte) Parabel
h
h
durch die Punkte (xk , f (xk )), (xk + , f (xk + )) und (xk+1 , f (xk+1 )), so ergibt sich
2
2
die Simpson-Regel als Linearkombination der beiden vorhergenannten Regeln, und
zwar folgendermaßen:
1
Sh (f ) := (Th (f ) + 2Mh (f )) .
3
Ausgeschrieben lautet die Simpson-Regel damit
Sh (f ) =
h
h
h
f (x0 ) + 4f (x0 + ) + 2f (x1 ) + 4f (x1 + ) + 2f (x2 ) + . . .
6
2
2
h
. . . + 2f (xn−1 ) + 4f (xn − ) + f (xn )
2
!
Ist f viermal stetig differenzierbar auf dem Intervall [α, β], so gilt:
|
Z
β
α
f (x) dx − Sh (f )| ≤
(β − α)5 (4)
||f || .
2880n4
157
§ 6 Folgen und Reihen von Funktionen
6.1 Potenzreihen
In diesem Paragraphen sei immer K = C oder K = R. Wir betrachten Funktionen, die
sich als Reihe von Potenzfunktionen darstellen lassen:
Definition 6.1.
Eine Reihe der Form
p(x) =
∞
X
n=0
an (x − x0 )n = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + . . .
mit an ∈ K heißt Potenzreihe mit dem Mittelpunkt x0 und den Koeffizienten an . Für
x0 = 0 hat eine Potenzreihe die Form
p(x) =
∞
X
an xn .
n=0
Durch die Transformation y := x − x0 kann jede Potenzreihe auf diese Form gebracht
werden. Deshalb beschränken wir uns in den meisten Fällen auf Potenzreihen mit dem
Mittelpunkt x0 = 0.
Wir untersuchen, für welche x ∈ C eine Potenzreihe konvergiert; für x = x0 ist dies stets
richtig.
Satz 6.2. (Formel von Cauchy-Hadamard)
Gegeben sei eine Potenzreihe der Form
n=0
durch
r :=
 −1
q

n


lim
sup
|a
|

n


n→∞










∞
X
an (x − x0 )n ; wir definieren r ∈ [0, ∞[∪{∞}
, falls dieser Limes superior existiert und größer als 0 ist.
0
, falls der Limes superior nicht existiert
∞
, falls der Limes superior gleich 0 ist.
Dann konvergiert die obige Potenzreihe für alle x ∈ C mit |x − x0 | < r absolut und sie
divergiert für alle x ∈ C mit |x − x0 | > r. r heißt Konvergenzradius und K := {x ∈ C |
|x − x0 | < r} Konvergenzkreis der Potenzreihe.
Bemerkung:
Sei (xn )n≥1 eine nach oben beschränkte Folge reeller Zahlen und die Menge der Häufungspunkte sei nicht leer. Dann heißt die Zahl
lim sup xn := sup H
n→∞
158
der Limes superior von (xn )n≥1 . Entsprechend erklärt man für nach unten beschränkte
Folgen den Limes inferior als
lim inf xn := inf H.
n→∞
Ist xn ≤ K für alle n ≥ 1 richtig, so gilt offenbar auch lim sup xn ≤ K.
n→∞
Umgekehrt folgt aus lim sup xn < K auch xn < K für n ≥ n0 mit geeignetem n0 ∈ R.
n→∞
Beweis von Satz 6.2: Sei r ∈]0, ∞[∪{∞} und x ∈ K; nach Satz 2.43 konvergiert die
Reihe
∞
X
n=0
an (x − x0 )n absolut, denn es gilt:
lim sup
n→∞
q
n
|an | |x − x0 |n = lim sup
n→∞
q
n
|an ||x − x0 |
= |x − x0 | lim sup
n→∞
q
n
|an | < 1.
Ist dagegen |x − x0 | > r ∈ [0, ∞[, so folgt analog
lim sup
n→∞
q
n
|an | |x − x0 |n > 1,
also gemäß Satz 2.43 Divergenz.
2
Beispiel 6.3.
Die Reihen
∞
X
xn ,
n=0
haben wegen
lim
n→∞
√
n
xn
n=1 n
∞
X
xn
2
n=1 n
∞
X
und
1
1
1 = lim √
=1
= lim √
n→∞ n n
n→∞ n n2
alle den Konvergenzkreis K = {z ∈ C | |z| < 1}. Die erste divergiert für x = ±1,
die zweite konvergiert für x = −1 nach dem Leibniz-Kriterium und divergiert für x = 1
(harmonische Reihe), die letzte konvergiert für x = ±1.
Wenden wir das Quotientenkriterium für Reihen an, so folgt
Satz 6.4.
Ist
∞
X
n=0
an (x − x0 )n eine Potenzreihe mit an 6= 0 für alle n ≥ n0 , so gilt für den Konver-
genzradius r:
lim
inf
n→∞
n≥n0
|an |
|an |
≤ r ≤ lim sup
.
n→∞
|an+1 |
|a
|
n+1
n≥n
0
159
Beweis: Ist |x − x0 | < lim
inf
n→∞
reihe wegen
|an |
, so folgt nach Satz 2.41 die Konvergenz der Potenz|an+1 |
n+1 a
n+1 (x − x0 )
lim sup n→∞ an (x − x0 )n
< 1;
also ist x ∈ K und damit gilt die linke Hälfte der behaupteten Ungleichung. Ist dagegen
∞
X
|an |
an (x − x0 )n und
|x − x0 | > lim sup
, so folgt analog die Divergenz der Reihe
|a
|
n→∞
n+1
n=0
damit die rechte Hälfte der Ungleichung.
2
6.2 Gleichmäßige Konvergenz
An Stelle der Potenzreihen können wir auch allgemeinere Reihen oder Folgen von Funktionen betrachten.
Definition 6.5.
Es sei X 6= ∅ eine Menge und (fn )n≥1 eine Folge in Abb(X, K); für jedes x ∈ X konvergiere
(fn (x))n≥1 in K. Nennen wir den Grenzwert f (x), so erhalten wir dadurch eine Abbildung
f : X ∋ x 7→ n→∞
lim fn (x) ∈ K.
f heißt Grenzfunktion von (fn )n≥1 und wir sagen (fn ) konvergiert punktweise auf X gegen
f . Konvergiert die Reihe
∞
X
n=1
fn (x) für jedes x ∈ X, so schreiben wir analog
f (x) :=
∞
X
fn (x)
n=1
und nennen f die Summe der Reihe
P∞
n=1
fn .
Da sich jede Reihe als Folge auffassen lässt und umgekehrt, genügt es häufig, nur für
einen Fall die Aussagen zu formulieren oder zu beweisen. Wir untersuchen, ob und wie
sich die Eigenschaften Stetigkeit, Differenzierbarkeit und Integrierbarkeit der fn auf die
Grenzfunktion bzw. die Summe der Reihe vererben.
Dazu führen wir noch einen stärkeren Konvergenzbegriff als den der punktweisen Konvergenz aus Definition 6.5 ein. Unter Zugrundelegung dieser Konvergenz sind dann die
gewünschten Vererbungseigenschaften gültig.
Definition 6.6.
Es sei X 6= ∅ und fn ∈ Abb(X, K) für n ∈ N. (fn )n≥1 konvergiert gleichmäßig auf X
gegen ein f ∈ Abb(X, K), wenn zu jedem ǫ > 0 ein N(ǫ) ∈ R derart existiert, dass für
alle n ∈ N mit n ≥ N(ǫ) und alle x ∈ X gilt:
|fn (x) − f (x)| < ǫ.
160
Eine Reihe
∞
X
fn konvergiert gleichmäßig, wenn die Folge der Partialsummen
n=1
n
X
i=1
gleichmäßig konvergiert.
fi
!
n≥1
}ǫ
fn (x)
f (x)
Abbildung 32: Veranschaulichung der gleichmäßigen Konvergenz
Beispiele 6.7.
(i) Betrachte fn : D = [0, 1] → R mit D ∋ x 7→ xn ∈ R. Dann gilt
fn (x) →
(
0 x ∈ [0, 1)
1 x=1
)
=: f (x),
d.h.sfn konvergiert punktweise, aber nicht gleichmäßig gegen f , denn z.B. gilt
1
1
n
fn
= .
2
2
(ii) Sei
∞
P
n=0
an (x−x0 )n eine Potenzreihe mit Konvergenzradius r > 0. D = (x0 −r, x0 +r).
n
fn (x) := an (x − x0 ) ,
s(x) :=
∞
X
n=0
P
an (x − x0 )n
Dann konvergiert fn auf D punktweise gegen s; auf jeder kompakten Teilmenge
von D ist die Konvergenz gleichmäßig, wie sofort aus u.a. Satz 6.8 folgt.
(iii) D = [0, ∞),
n·x
fn (x) =
=
1 + n2 x2
für n → ∞ für alle x ∈ D.
1
n2
x
n
+ x2
→0
Also: (fn ) konvergiert auf D punktweise, aber nicht gleichmäßig gegen f ≡ 0, denn
1
1
z.B. gilt fn
= .
n
2
161
1
f1 (x)
f3 (x)
f2 (x)
0
1
Abbildung 33: Punktweise aber nicht gleichmäßig konvergente Folge (i)
0.5
f1 (x)
f2 (x)
f3 (x)
0
1
2
Abbildung 34: Punktweise aber nicht gleichmäßig konvergente Folge (iii)
162
Ein nützliches Kriterium für die gleichmäßige Konvergenz einer Reihe liefert
Satz 6.8. (Weierstraß’sches Majorantenkriterium)
Es sei (fn )n≥1 eine Folge in Abb(X, K) und es gelte für alle n ∈ N und alle x ∈ X:
|fn (x)| ≤ cn .
Konvergiert die Reihe
∞
X
cn , so konvergiert
∞
X
fn gleichmäßig auf X.
n=1
n=1
Beweis: Das Cauchy-Kriterium für Reihen liefert zu jedem ǫ > 0 die Existenz eines
N(ǫ) ∈ R mit
m
X
fk (x)
k=n+1
≤
m
X
k=n+1
|fk (x)| ≤
m
X
ck < ǫ
k=n+1
für alle m > n > N(ǫ) und alle x ∈ X.
2
Beispiel 6.9.
Konvergiert die Reihe
∞
X
cn absolut, so konvergieren die Reihen
n=1
∞
X
cn sin nx und
∞
X
cn cos nx
n=1
m=1
gleichmäßig auf R.
Satz 6.10.
Es sei (X, d) ein metrischer Raum. Ist (fn )n≥1 eine Folge von stetigen Funktionen auf X
und konvergiert (fn )n≥1 gleichmäßig gegen f auf X, so ist f stetig auf X.
Beweis. Seien x ∈ X und ε > 0 beliebig. Wir wählen N = N(ε) ∈ N so, dass gilt
|fN (z) − f (z)| <
ε
3
für alle z ∈ X;
vgl. Definition 6.6. Da fN stetig ist, existiert ein δ = δ(ε, x) > 0, so dass gilt
|fN (y) − fN (x)| <
ε
3
für alle y ∈ X : d(x, y) < δ.
Diese beiden Ungleichungen liefern zusammen mit der Dreiecksungleichung:
|f (y) − f (x)| ≤ |f (y) − fN (y)| + |fN (y) − fN (x)| + |fN (x) − f (x)|
ε ε ε
<
+ +
= ε für alle y ∈ X : d(x, y) < δ,
3 3 3
d.h. f ist stetig im beliebig gewählten Punkt x ∈ X.
2
163
Satz 6.11.
Die Funktionenfolge fn : [a, b] → R sei differenzierbar auf [a, b] und es existiere ein
x0 ∈ [a, b] derart, dass (fn (x0 ))n≥1 konvergiert. Konvergiert die Folge (fn′ )n≥1 gleichmäßig
auf [a, b], dann konvergiert auch (fn )n≥1 auf [a, b] gleichmäßig gegen eine auf [a, b] differenzierbare Funktion f , und es gilt für alle x ∈ [a, b]:
f ′ (x) = lim fn′ (x) .
n→∞
Satz 6.12.
Es besitze fn : [a, b] → R für alle n ∈ N eine Stammfunktion, und es konvergiere (fn )n≥1
gleichmäßig auf [a, b] gegen f . Dann besitzt auch f eine Stammfunktion, und es gilt
Z
b
a
f (x) dx =
Z
b
a
lim fn (x) dx = n→∞
lim
n→∞
Z
b
a
fn (x) dx.
Wir wollen die Sätze 6.10-12 speziell auf Potenzreihen anwenden und beginnen mit dem
Satz 6.13.
Besitzt die reelle Potenzreihe
∞
X
n=0
an xn einen Konvergenzradius r 6= 0, so können wir für
x ∈] − r, r[ die Funktion f definieren durch f (x) :=
∞
X
an xn .
n=0
Dann konvergiert die Potenzreihe auf jedem abgeschlossenen Intervall [−ǫ, ǫ] mit 0 < ǫ < r
gleichmäßig; die Funktion f ist stetig und differenzierbar in ] − r, r[, und es gilt
f ′ (x) =
∞
X
nan xn−1
n=1
für alle x ∈] − r, r[.
Beweis.
1. Die gleichmäßige Konvergenz der Potenzreihe auf [−ε, ε] für jedes ε ∈]0, r[ folgt
sofort aus dem Majorantenkriterium; Satz 6.10 angewendet auf die Partialsummen
fn (x) :=
n
X
ak xk ,
k=0
n ∈ N,
liefert dann direkt die Stetigkeit von f in ] − r, r[.
2. Zum Beweis der Differenzierbarkeit beachten wir
fn′ (x) =
n
X
k=1
kak xk−1 ,
n ∈ N.
164
Wegen
lim sup
k→∞
besitzt die Reihe
∞
X
q
k
k|ak | = lim
k→∞
√
k
k · lim sup
k→∞
q
k
|ak | = lim sup
k→∞
q
k
|ak |
kak xk−1 den gleichen Konvergenzradius r wie die Reihe f . Folg-
k=1
lich konvergiert auch diese Reihe auf jedem Intervall [−ε, ε] mit ε ∈]0, r[ gleichmäßig;
Satz 6.11 liefert somit die Differenzierbarkeit von f und die Relation
∞
X
kak xk−1 = lim fn′ (x) = f ′ (x),
n→∞
k=1
wie behauptet.
2
Folgerung 6.14.
Mit den Bezeichnungen aus Satz 6.13 ist f beliebig oft differenzierbar in ] − r, r[ mit
(∗)
f
(k)
(x) =
∞
X
n=k
n(n − 1) · . . . · (n − k + 1)an xn−k ;
speziell gilt
f (k) (0) = k!ak für k ∈ N0 .
Die Potenzreihe ist die Taylor-Reihe von f im Punkt 0, d.h. es gilt
f (x) =
f (k) (0) k
x .
k!
k=0
∞
X
Beweis. Sukzessive Anwendung von Satz 6.13 auf f, f ′ , f ′′, . . . , f (k−1) ergibt die erste
Behauptung; Einsetzen von x = 0 in (∗) ergibt die zweite Behauptung; Einsetzen von
f (k) (0)
ak =
in die Potenzreihe ergibt die letzte Behauptung.
2
k!
Satz 6.15.
Wir übernehmen die Bezeichnungen aus Satz 6.13; f besitzt auf ] − r, r[ eine Stammfunktion. Eine solche ist z.B. F mit
F (x) :=
∞
X
an n+1
x .
n=0 n + 1
Beweis. Analog zu Teil 2 des Beweises von Satz 6.13 durch Anwendung von Satz 6.12.
2
165
Beispiel 6.16.
Es gilt für alle |x| < 1:
ln(1 + x) =
∞
X
(−1)n
n=0
xn+1
.
n+1
Beweis. Für |x| < 1 gilt
∞
X
d
1
1
(−1)n xn ;
ln(1 + x) =
=
=
dx
1+x
1 − (−x) n=0
nach Satz 6.15 ist F mit
F (x) =
∞
X
(−1)n
n=0
eine Stammfunktion von
∞
X
xn+1
n+1
(−1)n xn auf ] − 1, 1[. Also gilt mit einer Konstanten c die
n=0
Beziehung
ln(1 + x) = F (x) + c
für alle x ∈] − 1, 1[. Einsetzen von x = 0 liefert c = 0, also die Behauptung für x ∈] − 1, 1[.
2
Bemerkung 6.17.
Für |x| < 1 gilt:
ln(1 + x) = x −
x2 x3 x4
+
−
±...
2
3
4
ln(1 − x) = −x −
x2 x3 x4
−
−
− ... .
2
3
4
Subtraktion ergibt:
!
∞
X
1+x
x3 x5
x2n+1
ln
=2 x+
+
+ ... = 2
.
1−x
3
5
n=0 2n + 1
Für x =
1
folgt hieraus
3
ln 2 = 2 ·
= 2
∞
X
2n+1
1
1
n=0 2n + 1 3
1 1
1 1 1
+
+
+ ...
3 3 33 5 35
.
Um ln 2 mit einer Genauigkeit von 10−6 zu berechnen, benötigt man nur die ersten 6
Glieder; es ergibt sich
ln 2 = 0.693147 . . .