Analysis I - Fakultät für Mathematik

Werbung
Analysis I
Kai-Uwe Bux
Stand: 12. Februar 2016
Inhaltsverzeichnis
1 Naive Mengenlehre
1
2 Einige Axiome
3
3 Relationen, Funktionen und das Ersetzungsschema
6
4 Ordnungen
14
5 Die natürlichen Zahlen nach von Neumann
19
6 Die
6.1
6.2
6.3
reellen Zahlen nach Dedekind
Angeordnete Körper . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vollständigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Eine willkürliche Wahl . . . . . . . . . . . . . . . . . . . . . . . . . .
27
27
34
38
7 Die
7.1
7.2
7.3
Zahlbereiche
Die natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . .
Die ganzen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Die rationalen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
39
45
46
8 Die Eindeutigkeit der reellen Zahlen
50
9 Folgen und Konvergenz
9.1 Häufungspunkte und Grenzwerte
9.2 Limes inferior und Limes superior
9.3 Cauchy-Konvergenz . . . . . . . .
9.4 Monotone Folgen . . . . . . . . .
.
.
.
.
55
55
58
61
62
.
.
.
.
66
66
68
70
72
.
.
.
.
.
.
.
.
10 Rechnen mit Folgen
10.1 Folgen vergleichen . . . . . . . . . . .
10.2 Gliedweises Rechnen mit Folgen . . .
10.3 Teilfolgen . . . . . . . . . . . . . . .
10.4 Der Differenzen- und Summenkalkül
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11 Reihen
11.1 Absolute Konvergenz und Umordnungen
11.2 Konvergenzkriterien und Potenzreihen .
11.3 Doppelsummen und Produkte . . . . . .
11.4 Der binomische Satz . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12 Integration
12.1 Die Fläche unter dem Graphen einer Treppenfunktion .
12.2 Das Integral nach Archimedes, Riemann und Darboux
12.3 Elementare Eigenschaften des Integral . . . . . . . . .
12.4 Rechnen mit integrierbaren Funktionen . . . . . . . . .
12.5 Gleichmäßige Konvergenz . . . . . . . . . . . . . . . .
12.6 Unbestimmte Integrale . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
76
77
79
82
85
.
.
.
.
.
.
88
90
92
98
101
104
107
13 Stetigkeit
110
13.1 Beispiele und Gegenbeispiele . . . . . . . . . . . . . . . . . . . . . . . 111
13.2 Eigenschaften stetiger Funktionen . . . . . . . . . . . . . . . . . . . . 116
13.3 Der Mittelwertsatz der Integralrechnung . . . . . . . . . . . . . . . . 119
14 Vom Ableiten
14.1 Approximierbarkeit . . . . . . . . . . . . . . . . . . .
14.2 Definitionen der Differenzierbarkeit . . . . . . . . . .
14.3 Der Mittelwertsatz der Differentialrechnung . . . . .
14.4 Hauptsatz der Differential- und Integralrechnung . . .
14.5 Ableitungsregeln und Integrationsverfahren . . . . . .
14.6 Approximation höherer Ordnung: der Taylorsche Satz
14.7 Der Umkehrsatz . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
121
121
124
127
128
130
138
142
15 Anwendungen und Beispiele
148
15.1 Die Länge einer Kurve . . . . . . . . . . . . . . . . . . . . . . . . . . 148
15.2 Ein paar Flächeninhalte . . . . . . . . . . . . . . . . . . . . . . . . . 157
16 Die
16.1
16.2
16.3
16.4
komplexen Zahlen
Interpretation von C . . . . . . . . . . . . . . . . .
Folgen, Reihen und Doppelreihen komplexer Zahlen
Komplexe Potenzreihen . . . . . . . . . . . . . . . .
Der Fundamentalsatz der Algebra . . . . . . . . . .
A Beispiele und Aufgaben zur Integration
A.1 Die nützlichen Funktionen . . . . . . . .
A.2 Grundintegrale . . . . . . . . . . . . . .
A.3 Partielle Integration . . . . . . . . . . .
A.4 Integration durch Substitution . . . . . .
A.5 Partialbruchzerlegung . . . . . . . . . . .
A.6 Aufgaben . . . . . . . . . . . . . . . . .
ii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
158
159
162
166
168
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
170
170
170
171
175
181
183
1
Naive Mengenlehre
Unter einer Menge“ verstehen wir jede Zusammenfassung M von
”
bestimmten wohlunterschiedenen Objekten m unsrer Anschauung oder
unseres Denkens (welche die Elemente“ von M genannt werden) zu
”
einem Ganzen.
[. . . ]
Jeder Menge M kommt eine bestimmte Mächtigkeit“ zu, welche wir
”
ihre Kardinalzahl“ nennen.
”
Mächtigkeit“ oder Kardinalzahl“ von M nennen wir den
”
”
Allgemeinbegriff, welcher mit Hilfe unseres aktiven Denkverögens
dadurch aus der Menge M hervorgeht, daß von der Beschaffenheit ihrer
verschiedenen Elemente m und von der Ordnung ihres Gegebenseins
abstrahiert wird.
[Cantor: Beiträge zur Begründung der transfiniten Mengenlehre]
Das ist an Unklarheit kaum zu überbieten. Cantor stellt sich eine Menge als eine
(eventuell unendliche) Liste von Elementen vor. Wenn wir nun davon absehen, in
welcher Ordnung die Elemente aufgeführt sind, und welche Gegenstände im
einzelnen es genau sind, die da als Elemente aufgeführt werden, so ist die einzige
Information, die über die Liste noch bleibt, ihre Länge.
Cantor wollte also zählen. Mengenlehre ist zunächst das Ringen darum, den Begriff
der Zahl zu klären (auch wenn, Cantor hier nicht eben klar ist).
Der Versuch, die Cantorsche Intuition zu präzisieren, führt auf Begriffsbildungen
(Menge, Element, Paar, Funktion, . . . ), die es erlauben, beliebig komplexe
Strukturen zu definieren. Die Mengenlehre bietet darum eine Sprache, in der sich
die gesamte Mathemtik formulieren läßt. Der erste Versuch in dieser Richtung
stammt von Frege (Grundgesetze der Arithmetik).
Frege präzisiert Mengen durch zwei Forderungen:
Mengengleichheit Jede Menge ist durch ihre Elemente vollständig bestimmt.
D.h., zwei Mengen M und L sind gleich, wenn sie dieselben Elemente
enthalten:
M = L falls ∀x : x ∈ M genau dann, wenn x ∈ L
Mengenbildung Ist ϕ ein einstelliges Prädikat, so gibt es eine Menge M (die
Extension des Prädikats), die genau diejenigen Gegenstände enthält, auf die ϕ
zutrifft. D.h.:
∀x : x ∈ M genau dann, wenn ϕ(x)
In Zeichen schreiben wir {x ϕ(x)} für die Extension von ϕ. (Wegen der ersten
Forderung ist die Extension eines Prädikats eindeutig bestimmt.)
1
Frege wollte damit die Zahlen definieren. So ist die Fregesche Zwei definiert als
2F := {M M hat genau zwei Elemente}
und man kann sagen, daß M genau zwei Elemente enthält, wenn gilt:
• M enthält mindestens zwei Elemente. D.h.:
∃x, y : x ∈ M und y ∈ M und x 6= y
und
• M enthält höchstens zwei Elemente. D.h.:
∀x, y, z ∈ M : x = y oder y = z oder x = z
Wichtig ist hier natürlich, daß das Wort zwei“ durch diese Erläuterung eliminiert
”
wird.
Bemerkung 1.1. Wichtig ist insbesondere die Übersetzung von höchstens ein“ in
”
die Sprache der reinen Logik. Es gibt höchstens ein x mit der Eigenschaft ϕ(x)
genau dannn, wenn
∀x, y : x = y, wenn ϕ(x) und ϕ(y)
gilt. Von dieser Präzisierung werden wir im folgenden laufend Gebrauch machen.
Aufgabe 1.2. Drücke analog aus, daß M genau drei Elemente hat.
Russel hat beobachtet, daß das Prinzip der unbeschränkt zulässigen Mengenbildung
einen Widerspruch impliziert. Er bildet die Menge
R := {x x 6∈ x}
Dann ist:
R∈R
genau dann, wenn
R 6∈ R
Dieser Widerspruch zeigte, daß Freges Prinzip der freien (unbeschränkten)
Mengenbildung aufgegeben werden mußte.
2
2
Einige Axiome
Die Version von Mengenlehre, die im folgenden dargestellt wird, ist ein Teil des
Systems von Zermelo und Fraenkel. Wir sagen nicht, was Mengen sind. Wir legen
lediglich fest, welchen Regeln der Begriff Menge“ unterworfen ist. Die Aussagen,
”
deren Wahrheit hier stipuliert wird, heißen Axiome“, und wir werden sie als solche
”
kennzeichnen. Bevor wir aber Axiome formulieren können, benötigen wir wenigstens
ein rudimentäres Vokabular. Dieses wird durch die Redeweise . . . ist Element von
”
. . .“ oder . . . ist enthalten in . . .“ (oder umgekehrt . . . enthält . . .“ bereitgestellt.
”
”
Wir schreiben dafür x ∈ M (beziehungsweise umgekehrt M ∋ x). Unsere Variablen,
also die Buchstaben a“, b“, c“, . . . , beziehen sich durchweg auf Mengen. Das
”
”
”
einzige, was es in dieser Mengenlehre gibt, sind Mengen, Mengen von Mengen,
Mengen von Mengen von Mengen, und so weiter. In technischer Sprache: unsere
Mengenlehre kennt keine Atome.
Axiom 2.1 (Extensionalität). Zwei Mengen sind gleich, wenn sie die gleichen
Elemente enthalten. Also:
M =L
⇐⇒
∀x : x ∈ M ⇐⇒ x ∈ L
Gilt nur eine Implikation und keine Äquivalenz, so haben wir:
Definition 2.2. Eine Menge M heißt Teilmenge der Menge L, wenn gilt
∀x : x ∈ M =⇒ x ∈ L.
Für diesen Fall schreiben wir M ⊆ L.
Gilt außerdem M 6= L, so nennen wir M eine echte Teilmenge und schreiben M ⊂ L.
Axiom 2.3 (Aussonderungsschema). Sei ϕ eine Bedingung, die von freien
Variablen abhängen kann. Sei M eine Menge, dann gibt es eine Menge L mit
∀x : x ∈ L ⇐⇒ x ∈ M und ϕ(x) .
Für diese Menge schreiben wir:
{x ∈ M ϕ(x)}
Das Aussonderungsschema erinnert an das problematische Mengenbildungsschema
der naiven Mengenlehre. Wenn wir also schon nicht beliebige Bedingungen zur
Mengenbildung benutzen können, so können wir wenigstens aus schon vorhandenen
Mengen Teilmengen mit Hilfe beliebiger Bedingungen auswählen.
Mit diesem Schema kommt man natürlich nicht hoch“: die Mengen werden immer
”
kleiner. Außerdem ist ja noch nicht einmal klar, daß es überhaupt eine Menge gibt.
Wir benötigen noch weitere, hoffentlich unproblematische, Einsetzungsinstanzen des
allgemeinen Mengenbildungsschemas. Hier sind ein paar, die wir akzeptieren:
3
Axiom 2.4 (leere Menge). Es gibt eine leere Menge ∅. D.h., ∀x : x 6∈ ∅.
Aufgabe 2.5. Zeige, daß es genau eine leere Menge gibt.
Axiom 2.6 (Paarbildung). Für beliebige x und y gibt es eine Menge M, so daß
∀z : z ∈ M ⇐⇒ z = x oder z = y.
Bemerkung 2.7. Wir schreiben {x, y} für diese Paarmenge. Sie ist wegen
Extensionalität eindeutig.
Definition 2.8 (Einermenge). Der Fall x = y ist im Paarbildungsaxiom nicht
ausgeschlossen. In diesem Fall schreiben wir {x} für die eindeutig bestimmte Menge
die
∀z : z ∈ {x} ⇐⇒ z = x
erfüllt.
Axiom 2.9 (Vereinigung). Sei M eine Menge, dann gibt es eine Menge V(M),
genannt Vereinigung über M, so daß
∀x : x ∈ V(M) ⇐⇒ (∃y ∈ M : x ∈ y)
gilt.
Bemerkung 2.10. Für jedes Element m ∈ M gilt: m ⊆ V(M).
Beweis. Sei nämlich x ∈ m, so gibt es ein m ∈ M mit x ∈ m. Mithin ist x ∈ V(M).
Also:
∀x : x ∈ m =⇒ x ∈ V(M)
D.h.:m ⊆ V(M).
q.e.d.
Definition 2.11. Für zwei Mengen M und L heißt
M ∪ L := V({M, L}) = {x x ∈ M oder x ∈ L}
auch die Vereinigung von M und L.
Mit Paarmenge und Vereinigung können wir auch mehr-elementige Mengen basteln:
Aufgabe 2.12. Für Mengen x, y und z, definiere
{x, y, z} := V({{x, y} , {z}}).
Zeige:
{x, y, z} = {m m = x ∨ m = y ∨ m = z}
4
Axiom 2.13 (Potenzmenge). Für jede Menge M gibt es die Menge aller ihrer
Teilmengen, also eine Menge P(M) mit
∀x : x ∈ P(M) ⇐⇒ x ⊆ M.
Aufgabe 2.14. Zeige oder widerlege: Für jede Menge M gilt:
P(V(M)) = V(P(M))
Aufgabe 2.15. Zeige: Sei M eine nicht-leere Menge, dann existiert eine Menge
D(M), genannt der Durchschnitt über M, so daß
∀x : x ∈ D(M) ⇐⇒ ∀y ∈ M : x ∈ y.
5
3
Relationen, Funktionen und das
Ersetzungsschema
Definition 3.1. Für zwei Mengen x und y heißt
(x, y) := {{x} , {x, y}}
das geordnete Paar von x und y.
Aufgabe 3.2. Zeige: Für alle x1 , x2 , y1 und y2 ist:
(x1 , y1 ) = (x2 , y2)
⇐⇒
x1 = x2 und y1 = y2
(1)
Bemerkung 3.3. Die Gleichung (1) ist das eigentlich Wichtige am geordneten
Paar. Zahllose weitere Definitionen erfüllen diese Bedingung und können ebensogut
gewählt werden. Wir haben uns an diejenige gehalten, die Kuratowski vorgeschlagen
hat. Für manche Versionen axiomatischer Mengenlehre sind alternative Definitionen
des geordneten Paares vorteilhaft. Siehe Aufgaben (3.28) bis (3.30).
Definition 3.4. Durch
(x, y, z) := ((x, y), z)
werden Tripel definiert.
Satz und Definition 3.5. Für je zwei Mengen M und L gibt es eine (wegen
Extensionalität sogar genau eine) Menge M × L, genannt direktes Produkt, mit:
∀z
:
z ∈ M × L ⇐⇒ (∃x ∈ M, y ∈ L : z = (x, y)) .
Also wird das Kreuzprodukt beschrieben durch den Mengenterm
M × L = {z ∃x ∈ M, y ∈ L : z = (x, y)}
Wir schreiben auch
M × L = {(x, y) x ∈ M, y ∈ L}
In dieser Darstellung heißen x und y Laufvariablen. Sie durchlaufen M bzw. L.
Der Beweis ist typisch für die Anwendung der Axiome. In einem ersten Schritt
nutzen wir die Konstruktionen von Paarmenge, Vereinigung und Potenzmenge, um
eine Menge zu bilden, die alle nötigen geordneten Paare enthält. In einem zweiten
Schritt benutzen wir das Aussonderungsschema, um aus dieser Obermenge das
direkte Produkt als Teilmenge auszuschneiden“. Dieses Prinzip führen wir hier
”
einmal vor. Im weiteren, werde ich über diesen Punkt oft hinweggehen.
6
Beweis. Die Vereinigung M ∪ L enthält alle Elemente von M und alle Elemente
von L. Die Potenzmenge P(M ∪ L) enthält darum alle Mengen {x} und {x, y} für
x, y ∈ M ∪ L. Schlußendlich enthält P(P(M ∪ L)) alle geordneten Paare (x, y) mit
x ∈ M und y ∈ L. (Natürlich enthält P(P(M ∪ L)) noch viel mehr, auch geordnete
Paare, aber darauf kommt es hier nicht an.)
Jetzt können wir M × L mit dem Aussonderungsaxiom bilden:
M × L = {z ∈ P(P(M ∪ L)) ∃x ∈ M, y ∈ L : z = (x, y)}
q.e.d.
Bemerkung 3.6. Wie man sieht, kommt es bei der Menge P(P(M ∪ L)) nur
darauf an, daß diese Menge alle nötigen geordneten Paare enthält. Außerdem sieht
man, daß dieser Beweis natürlich an der gewählten Definition des geordneten Paares
hängt. Eine andere Definition erfordert einen anderen Beweis für die Existenz des
direkten Produktes (einfach weil die Aussage, daß zu je zwei Mengen das direkte
Produkt existiert, dann etwas anderes besagt).
Definition 3.7. Eine freie Relation ist eine Menge R geordneter Paare.
Sind M und L Mengen, so ist eine Relation zwischen M und L ein Tripel (M, L, R),
worin R eine Teilmenge von M × L ist. Die Menge R ist also eine freie Relation.
Wir nennen M den Definitionsbereich der Relation und L ihren Wertebereich.
Eine Relation zwischen M und M nennen wir eine Relation auf M .
Bemerkung 3.8. Sind Definitionsbereich und Wertebereich einer Relation aus dem
Zusammenhang klar, so unterscheiden wir in der Notation nicht zwischen der freien
Relation (Menge geordneter Paare) und der gebundenen Relation (Tripel). D.h., wir
benutzen den Buchstaben R zur Bezeichnung des Tripel (M, L, R), wenn sich diese
Bedeutung aus dem Kontext ergibt.
Der Kniff mit dem Tripel ist nötig, weil die freie Relation allein keine Angabe über
den intendierten Definition- und Wertebereich enthält. Dies wird wichtig z.B. bei
der Surjektivität von Funktionen.
Aufgabe 3.9. Zeige: Für jede freie Relation R gibt es Mengen, M und L, so daß
R ⊆ M × L. Genauer: die Ausdrücke
{x ∃y : (x, y) ∈ R}
und
{y ∃x : (x, y) ∈ R}
definieren Mengen, das Urbild und das Bild von R.
Wir versuchen gleich mal, die verkürzende Notation.
Definition 3.10. Eine Relation f ⊆ M × L zwischen den Mengen M und L heißt
Funktion (oder Abbildung) von M nach L, wenn es für jedes x ∈ M genau ein
y ∈ L gibt, für das (x, y) ∈ f. Dieses durch x eindeutig bestimmte y ∈ L notieren wir
als
f (x)
7
und nennen es den Wert der Funktion f an der Stelle x. Wir sagen auch, f bilde x
auf y ab.
Durch die Notation
f : M −→ L
drücken wir aus, daß wir mit f eine Funktion von M nach L meinen.
Für y ∈ L definiert der Ausdruck
f −1 [y] := {x ∈ M f (x) = y}
eine Menge nach Aussonderungsschema. Wir nennen sie, die Urbildmenge von y
unter f und ihre Elemente heißen Urbilder von y. Die Funktion f heißt injektiv,
wenn jedes y ∈ L höchstens ein Urbild hat. Die Funktion f heißt surjektiv, jedes
y ∈ L mindestens ein Urbild hat. Die Funktion f heißt bijektiv, wenn sie injektiv
und surjektiv ist. In diesem Fall hat jedes y ∈ L genau ein Urbild und die Menge
f −1 := {(y, x) ∈ L × M (x, y) ∈ f }
ist eine Funktion von L nach M, die Umkehrfunktion zu f .
Bemerkung 3.11. Genaugenommen ist eine Funktion also ein Tripel
(M, L, f ⊆ M × L)
dessen dritter Eintrag, der Werteverlauf oder der Graph der Funktion ist.
Beispiel 3.12. Für jede Menge M ist
idM := {(x, y) ∈ M × M x = y} = {(x, x) x ∈ M}
eine Funktion. Sie erfüllt die definierende Bediungung
∀m ∈ M
idM (m) = m
Die Funktion idM heißt auch die identische Abbildung auf M.
Bemerkung 3.13. Funktionen werden oft als Zuordnungen eingeführt. Dann liegt
eine Notation wie die folgende nahe:
idM : M → M
x 7→ x
Aufgabe 3.14. Sei M eine Menge und f : M → ∅ eine Funktion von M nach der
leeren Menge ∅. Zeige, daß M leer und f die identische Abbildung ist.
Satz und Definition 3.15. Seien M, L und K Mengen. Ferner seien f : M → L
und g : L → K Funktionen. Dann ist die Verkettung
g ◦ f := {(m, k) ∈ M × K ∃l ∈ L : (m, l) ∈ f und (l, k) ∈ g}
(ich lese das als g nach f“) eine Funktion von M nach K. Es gilt:
”
(g ◦ f )(m) = g(f (m))
∀m ∈ M
8
Beweis. Zunächste zeigen wir die Eindeutigkeit von k. Seien also k1 , k2 ∈ K mit
(m, k1 ) ∈ g ◦ f und (m, k2 ) ∈ g ◦ f . Wir haben zu zeigen, daß k1 = k2 ist. Nach
Voraussetzung gibt es dann Elemente l1 , l2 ∈ L mit
(m, li ) ∈ f und (li , ki) ∈ g
(i = 1, 2)
Da f eine Funktion ist, ist l1 = l2 . Da auch g eine Funktion ist, folgt k1 = k2 . Sei
m ∈ M. Zu zeigen ist, daß es genau ein k ∈ K mit (m, k) ∈ g ◦ f gibt.
Nun Zur Existenz: wir betrachten l := f (m) und k := g(l) = g(f (m)). Dann ist für
diese Wahl von l ∈ L:
(m, l) ∈ f und (l, k) ∈ g
Also ist (m, k) ∈ g ◦ f .
Wir bemerken auch, daß daraus die Identität
(g ◦ f )(m) = g(f (m))
∀m ∈ M
folgt.
q.e.d.
Bemerkung 3.16. In der Literatur findet sich zuweilen die Erläuterung, daß eine
Abbildung eine Abbildungsvorschrift sei. Das ist irreführend, selbst für Funktionen,
die durch eine Vorschrift (was auch immer das sein mag) erklärt werden können. So
betrachte man die Funktionen
f :R → R
x 7→ x2
und
g:R → R
x 7→ 1 + (x + 1)(x − 1)
Diese Funktionen sind gleich, aber die zur Definition von f und g angegebenen
Vorschriften sind verschieden. Wer Funktionen als Vorschriften einführt muß also
eigens erklären, wann Funktionen gleich sein sollen. (Darüberhinaus ergibt sich noch
das Problem, daß der Begriff der Vorschrift selbst nicht klar ist.)
Aufgabe 3.17. Seien f : M → L, g : L → K und h : K → H Funktionen. Zeige,
daß Verkettung von Funktionen assoziativ ist:
(h ◦ g) ◦ f = h ◦ (g ◦ f )
Aufgabe 3.18. Seien f : M → L und g : L → K Funktionen. Zeige:
1. Sind f und g beide injektiv, so ist die Verkettung g ◦ f injektiv.
2. Sind f und g beide surjektiv, so ist die Verkettung g ◦ f surjektiv.
9
3. Sind f und g beide bijektiv, so ist die Verkettung g ◦ f bijektiv.
4. Ist die Verkettung g ◦ f injektiv, so ist f injektiv.
5. Ist die Verkettung g ◦ f surjektiv, so ist g surjektiv.
Aufgabe 3.19. Seien M und L Mengen. Ferner seien f : M → L und g : L → M
Funktionen mit
idM = g ◦ f
und
idL = f ◦ g
Zeige: f und g sind beide bijektiv und g = f −1 .
Definition 3.20. Zwei Mengen M und L heißen gleichmächtig, wenn es eine
Bijektion von M nach L gibt.
Aufgabe 3.21. Seien M und L Mengen. Es gebe injektive Abbildungen von M
nach L und von L nach M. Zeige: M und L sind gleichmächtig.
Satz 3.22 (Cantor). Keine Menge ist gleichmächtig mit ihrer Potenzmenge.
Genauer: Sei M eine Menge und f : M → P(M) eine Funktion. Dann ist f nicht
surjektiv.
Beweis. Wir bilden die Teilmenge
L := {x ∈ M x 6∈ f (x)}
und behaupten, daß L ∈ P(M) nicht im Bild von f liegen kann.
Nehmen wir also an, es gäbe ein y ∈ M mit L = f (y). Dann wäre
y∈L
⇐⇒ y 6∈ f (y)
⇐⇒ y 6∈ L
Das ist absurd.
q.e.d.
Korollar 3.23. Es gibt keine Menge, die alle Mengen enthält, denn solch eine
Menge müßte ihre Potenzmenge enthalten und ihr (da es keine Atome gibt) sogar
gleich sein.
q.e.d.
Bemerkung 3.24. Ein alternativer Beweis des Korollars ist natürlich, daß sich
jede Menge aus der Allmenge aussondern ließe, so daß das Aussonderungsschema
auf das naive Mengenbildungsschema zurückfällt, das ja widersprüchlich ist. Aber
dieser Beweis des Korollar zeigt, daß der Pferdefuß in der naiven Mengenlehre sich
aus der Theorie der Mächtigkeiten ergibt. In der Tat hat schon Cantor den Schluß
gezogen, daß es keine maximale Mächtigkeit
10
Bemerkung 3.25. Die Nähe zur Russelschen Konstruktion ist noch näher.
Nehmen wir an, es gäbe eine Menge M, die alles enthielte. Dann wäre M = P(M)
und wir könnten die Abbildung f aus dem Satz als die identische Abbildung x 7→ x
wählen. Für diese Wahl stellt sich die konstruierte Menge L genau als die
Russelmenge heraus.
So wie das naive Mengenbildungsschema die Extension eines Prädikates postuliert,
so sollen Relationen und Funktionen das mengentheoretische Abbild von Relationsund Funktionstermen sein. In naiver Mengenlehre gibt es da kein Problem.
Axiomatisch fordern wir:
Axiom 3.26 (Ersetzungsschema). Sei ϕ(x, y) ein zweistelliges Prädikat (das
von weiteren freien Variablen abhängen darf). Sei M eine Menge, so daß gilt:
∀x ∈ M ∃ ! y : ϕ(x, y) .
Dann gibt es eine Menge L, so daß:
∀y
:
y ∈ L ⇐⇒ (∃x ∈ M : ϕ(x, y)) .
Bemerkung 3.27. Das Ersetzungsschema sichert, daß der Ausdruck ϕ eine
Funktion f auf M beschreibt, indem es postuliert, daß die Bildmenge L existiert
(d.h., daß es eine Menge gibt, die als Bildmenge fungieren kann). Dann gibt es nach
Satz (3.5) auch das direkte Produkt M × L, und daraus läßt sich f per
Aussonderungsschema bilden:
f := {(x, y) ∈ M × L ϕ(x, y)} .
Auf diese Weise gilt ϕ(x, f (x)) für jedes x ∈ M.
Aufgabe 3.28. Sei M eine Menge. Zeige, daß wiefolgt zwei Mengen definiert sind:
LM := {{{x}} x ∈ M}
RM := {P({x}) x ∈ M}
Hier ist die Problematik natürlich, daß die rechte Seite jeweils ein Ausdruck mit
unbeschränkter Mengenbildung ist. Die Aufgabe besteht darin, in Abhängigkeit von
M, Mengen anzugeben, aus denen sich LM und RM aussondern lassen.
Aufgabe 3.29. Eine Definition des geordneten Paares nach Schmidt lautet:
[M, L] := LM ∪ RL
Zeige:
[M, L] = [M ′ , L′ ]
⇐⇒
M = M ′ und L = L′
11
∀M, M ′ , L, L′
Aufgabe 3.30. Seien M und L Mengen. Zeige, daß auch mit der Definition nach
Schmidt das Kreuzprodukt eine Menge ist, d.h., durch
M ⊠ L := {[x, y] x ∈ M, y ∈ L}
wird eine Menge beschrieben.
Was, wenn es zu jedem x ∈ M zwar mindestens einen aber nicht unbedingt genau
einen Partner gibt?
Axiom 3.31 (Auswahlaxiom). Seien M und L Mengen, und sei R ⊆ M × L ein
Relationsgraph. Wenn gilt:
∀m ∈ M ∃l ∈ L : (m, l) ∈ R
dann gibt es eine Funktion f : M → L, so daß (m, f (m)) ∈ R ist für jedes
m ∈ M.
Eine andere Formulierung ist:
Axiom 3.32 (Auswahlaxiom). Sei f : M → L eine surjektive Funktion. Dann
gibt es einen Schnitt, d.h. eine Funktion g : L → M, so daß
∀y ∈ L : f (g(y)) = y.
Bemerkung 3.33. Das ist meine Lieblingsformulierung. Man ist versucht, für diese
Aussage folgenden Beweis“ zu geben:
”
Sei f : M → L surjektiv. Dann gibt es zu jedem y ∈ L ein xy ∈ M, das
von y abhängt (dafür der Index), mit:
f (xy ) = y
Nun definiere die Abbildung:
g:L → M
y 7→ xy
Dann ist g ein Schnitt zu f , denn für y ∈ L haben wir
f (g(y)) = f (xy ) = y
q.e.d.
Das Auswahlaxiom dient dazu, diese Schlußweisen in dem Sinne zu legitimieren, daß
die mengentheoretische Repräsentation der Zuordnung y 7→ xy als Menge geordneter
Paare sichergestellt wird. Es ist gewissermaßen so: (a) Wir wollen den Begriff
Funktion“ so verstehen, daß Argumentation wie in diesem Argument gültig sind.
”
(b) Nun haben wir den Begriff Funktion“ aber schon definiert (siehe 3.10). (c) Also
”
führen wir ein Axiom ein, so das die gewünschten Schlußweisen auch unter der
gewählten Definition (3.10) gültig sind.
Schlüsse dieser Art kommen in der Analysis haufenweise vor, und es hat einige Zeit
gedauert, bis man überhaupt erkannt hat, daß sie ein eigenes Axiom erforderlich
machen.
12
Man kann das Auswahlaxiom auch ohne Referenz auf geordnete Paare formulieren:
Axiom 3.34 (Auswahlaxiom). Sei M eine Menge, deren Elemente nicht-leere
und paarweise disjunkte Mengen sind. Dann gibt es eine Menge L, so daß
jedes Element von L genau einem Element von M als Element angehört.
Zwei Mengen heißen disjunkt oder elementfremd, wenn ihr Durchschnitt leer
ist.
Aufgabe 3.35. Zeige die Äquivalenz aller Formulierungen des Auswahlaxioms
(unter Annahme der übrigen Axiome).
Aufgabe 3.36. Seien M und L Mengen. Zeige: Es gibt eine Injektion von M nach
L oder es gibt eine Injektion von L nach M. (Und wenn es Injektionen in beiden
Richtungen gibt, dann sind M und L gleichmächtig: siehe 3.21)
Aufgabe 3.37. Seien M und L nicht-leere Mengen. Zeige: Es gibt eine Surjektion
von M nach L oder es gibt eine Surjektion von L nach M. Und wenn es
Surjektionen in beiden Richtungen gibt, dann sind M und L gleichmächtig.
Bemerkung 3.38. Mengen, die wir bisher bilden können sind z.B.:
∅
{∅} , {{∅}} , {{{∅}}} , . . .
{∅, {∅}} , {∅, {{∅}}} , {∅, {{{∅}}}} , . . .
{{∅} , {{∅}}} , {{∅} , {{{∅}}}} , . . .
Alle diese Mengen sind endlich, und ihre Elemente auch, und auch die Element ihrer
Element, usw. Usere Axiome bisher führen über diesen Bereich der erblich endlichen
Mengen nicht hinaus.
Aufgabe 3.39. Sei f : M → L eine Abbildung. Sei ferner A ⊆ M eine Teilmenge.
Zeige, daß durch
g : A −→ L
x 7→ f (x)
eine Funktion von A nach L erklärt ist.
Diese Funktion g heißt Einschränkung von f auf A und wird mit f |L notiert.
Aufgabe 3.40. Sei M eine Menge und A eine Teilmenge. Die Einschränkung der
identischen Abbildung idM auf die Teilmenge A ist die Abbildung
ιA,M : A −→ M
x 7→ x
Wir nennen ιA,M die Einbettung von A in M .
Zeige: Für jede Funktion f : M → L und jede Teilmenge A ⊆ M ist:
f |A = f ◦ ιA,M
13
4
Ordnungen
Definition 4.1. Sei M eine Menge. Eine Relation := (M, M, R ⊆ M × M) auf M
heißt Ordnung oder partielle Ordnung, wenn folgende Bedingungen erfüllt sind:
1. Die Relation ist reflexiv:
∀x ∈ M : x x
2. Die Relation ist antisymmetrisch:
∀x, y ∈ M :
x y und y x =⇒ x = y
3. Die Relation ist transitiv:
∀x, y, z ∈ M :
x y und y z =⇒ x z
Bemerkung: Wir schreiben dabei x y für (x, y) ∈ R.
Zwei Element x, y ∈ M heißen vergleichbar bezüglich , wenn
xy
oder y x
gilt. Sind je zwei Elemente von M vergleichbar miteinander bezüglich , so heißt
die Ordnung total oder Anordnung.
Beispiel 4.2. Sei M eine Menge. Dann ist die Relation
(P(M), P(M), {(A, B) A, B ∈ P(M) und A ⊆ B} ⊆ P(M) × P(M))
(hier explizit als Tripel beschrieben) eine Ordnung auf der Potenzmenge P(M). Wir
nennen dies die Ordnung durch Inklusion und notieren sie mit ⊆.
⊆ ist reflexiv, denn x ⊆ x.
⊆ ist antisymmetrisch, denn x ⊆ y und y ⊆ x sagt, daß x und y dieselben
Elemente haben. Nach dem Extensionalitätsaxiom sind also die Mengen x und
y gleich: x = y.
⊆ ist transitiv, denn x ⊆ y ⊆ z impliziert das jedes Element von x zunächst zu y
darum aber auch zu z gehört. Also folgt x ⊆ z.
Die Ordnung durch Inklusion ist keine totale Ordnung, wenn M mindestens zwei
Elemente enthält: Verschiedene einelementige Teilmengen von M sind nicht
miteinander vergleichbar.
Beispiel 4.3. Die vertraute Kleiner-Gleich-Relation auf den reellen Zahlen ist eine
Anordnung.
Definition 4.4. Sei eine Ordnung auf der Menge M. Ein Element m ∈ M heißt
14
• kleinstes oder erstes Element von M bezüglich , wenn es kleiner“ als alle
”
anderen ist:
∀x ∈ M : m x
• größtes oder letztes Element von M bezüglich , wenn es größer“ als alle
”
anderen ist:
∀x ∈ M : x m
• minimal oder Minimum bezüglich , wenn es kein kleineres“ Element gibt:
”
∀x ∈ M :
x m =⇒ x = m
• maximal oder Maximum bezüglich , wenn es kein größeres“ Element gibt:
”
∀x ∈ M :
m x =⇒ x = m
Beispiel 4.5. In der Ordnung P(M) aus Beispiel (4.2) ist die leere Menge ∅ ein
kleinstes Element und auch ein minimales Element. Keine anderes Element ist
minimal oder ein kleinstes Element. Die Menge M ist das einzige größte Elemente
dieser Odnung und auch ihr einziges maximales Element.
In der Anordnung der reellen Zahlen durch die Kleiner-Gleich-Relation gibt es
weder kleinste noch minimale Elemente. Ebenso gibt es kein größtes und auch kein
maximales Element.
Beobachtung 4.6. Eine Ordnung hat höchstens ein kleinstes Element und
höchstens ein größtes Element.
Beweis. Seien a und a′ zwei kleinste Elemente bezüglich der Ordnung . Dann ist
a a′ , weil a ein kleinstes Element ist. Ebenso gilt a′ a, weil a′ ein kleinstes
Element ist. Aus der Antisymmetrie von folgt dann, daß a = a′ ist.
Das Argument für größte Elemente ist analog.
q.e.d.
Bemerkung 4.7. Eine geordnete Menge hat nicht unbedingt ein kleinstes oder ein
größtes Element: Es gibt weder eine kleinste noch eine größte reelle Zahl.
Proposition 4.8. In einer Ordnung ist jedes kleinste Element ist minimal. Jedes
größte Element ist maximal.
Beweis. Sei a ein kleinstes Element bezüglich der Ordnung auf M. Wir haben zu
zeigen, daß a minimal ist, d.h.:
∀x ∈ M :
x a =⇒ x = a
Erfülle x ∈ M also die Bedingung x a. Weil a ein kleinstes Element ist, gilt
außerdem a ≤ x, und aus der Antisymmetrie folgt dann a = x.
Das Argument für größte Elemente ist analog.
q.e.d.
15
Proposition 4.9. In einer Anordnung gelten auch die Umkehrungen: Jedes
Minimum ist ein kleinstes Element und jedes Maximum ist ein größtes Element.
Insbesondere hat eine Anordnung höchstens ein Minimum und höchstens ein
Maximum.
Beweis. Sei nun eine Anordnung von M und a ∈ M ein Minimum. Wir haben zu
zeigen, daß a ein kleinstes Element ist, also:
∀x ∈ M :
ax
Sei also x ∈ M beliebig. Dann ist wegen der Totalität der Ordnung xa
oder
ax
Im zweiten Fall ist nichts weiter zu zeigen. Im ersten Fall ist x = a weil a minimal
ist. Dann ist aber x = a a, weil reflexiv ist.
q.e.d.
Satz und Definition 4.10. Sei M eine Menge, = (M, M, R) eine Ordnung auf
M und A ⊆ M eine Teilmenge. Dann ist
|A := (A, A, R ∩ A × A)
eine Ordnung auf A. Wir nennen |A die Einschränkung von auf die Teilmenge
A oder die auf A induzierte Ordnung.
Ist total, so ist auch die Einschränkung |A total.
Bemerkung 4.11. Hier ist die explizite Erinnerung daran, daß eine Relation auf
einer Menge ein Tripel ist, in der Notation ausgedrückt, denn die Einschränkung
|A unterscheidet sich von vor allem in Definitions- und Wertebereich.
Beweis. Die Eigenschaften der Reflexivität, Antisymmetrie, Transitivität und
gegebenenfalls Totalität vererben sich auf die Einschränkung. Das Argument ist in
jedem Fall von der Form:
∀x, . . . ∈ M : ϕ(x, . . .)
darum
∀x, . . . ∈ A : ϕ(x, . . .)
q.e.d.
Definition 4.12. Sei M eine Menge mit der Ordnung . Eine Teilmenge A ⊆ M
heißt Teilanordnung oder Kette, wenn je zwei Elemente von A bezüglich vergleichbar sind. Dies läßt sich auch ausdrücken durch die Forderung, daß die
Einschränkung |A eine Anordnung sei.
Sind je zwei verschiedene Elemente von A bezüglich unvergleichbar, so heißt A
eine Antikette.
Definition 4.13. Sei eine Ordnung auf M. Wir nennen eine Wohlordnung
bzw. sagen, M werde durch wohlgeordnet, wenn jede nicht-leere Teilmenge von
M ein kleinstes Element besitzt.
Eine Teilwohlordnung von M ist eine Teilmenge A ⊆ M, so daß sich zu einer
Wohlordnung auf A einschränkt.
16
Beobachtung 4.14. Jede Wohlordnung ist eine Anordnung.
Beweis. Sei eine Wohlordnung auf der Menge M. Um zu zeigen, daß eine
Anordnung ist, betrachten wir zwei Elemente x, y ∈ M. Zu zeigen ist die
Vergleichbarkeit, also:
xy
oder
yx
Die aber folgt daraus, daß die Teilmenge {x, y} ⊆ M ein kleinstes Element hat. Ist x
das kleinste Element, so ist x y; und ist y das kleinste Element, so ist
y x.
q.e.d.
Definition 4.15. Sei M eine Menge mit der Ordnung und A eine Teilmenge von
M. Wir nennen ein Element β ∈ M eine untere Schranke für A, wenn
∀x ∈ A : β x
gilt. Läßt A eine untere Schranke zu, so heißt A von unten beschränkt; andernfalls
heißt A nach unten unbeschränkt. Wenn die Menge aller unteren Schranken von A
ein größtes Element hat, so heißt es größte untere Schranke oder Infimum von A. Es
ist also eine untere Schranke α von A für die gilt:
∀β ∈ M :
β ist untere Schranke von A =⇒ β α
Das Element β ist eine obere Schranke für A, wenn
∀x ∈ A : x β
gilt. Läßt A eine obere Schranke zu, so heißt A von oben beschränkt; andernfalls
heißt A nach oben unbeschränkt. Wenn die Menge aller oberen Schranken von A ein
kleinestes Element hat, so heißt es kleinste obere Schranke oder Supremum von A.
Es ist also eine obere Schranke ω von A für die gilt:
∀β ∈ M :
β ist obere Schranke von A =⇒ ω β
Beispiel 4.16. Sei M = {a, b, c, d} eine Menge mit vier Elementen, d.h., a, b, c und
d sind paarweise verschieden. Auf der Potenzmenge betrachten wir die Ordnung
durch Inklusion wie in Beispiel (4.2). Wir setzen
A := P∗+ (M) := {x ∈ P(M) x 6= M und x 6= ∅} ⊆ P(M)
als Menge aller echten, nicht-leeren Teilmengen von M. Die Ordnung durch
Inklusion schränkt sich auf die Menge P∗+ (M) ein. Diese Menge hat kein kleinstes
und kein größtes Element. Die vier einelemtigen Mengen {a}, {b}, {c} und {d} sind
die minimalen Element; die drei-elementigen Mengen {a, b, c}, {a, b, d}, {a, c, d} und
{b, c, d} sind die maximalen Elemente.
Die Teilmenge P∗+ (M) ⊆ P(M) hat die größte untere Schranke ∅ und die kleinste
obere Schranke M.
Die Teilmenge {∅, {a} , {a, b} , {a, b, c} , {a, b, c, d}} ist eine (maximale) Kette in
S
P( ).
17
Aufgabe 4.17. Sei M eine nicht-leere Menge und A ⊆ P(M) eine nicht-leere
Menge von Teilmengen. Zeige, daß A eine größte untere Schranke und eine kleinste
obere Schranke in P(M) bezüglich Inklusion hat.
Aufgabe 4.18. Zeige: Es gibt genau 24 maximale Ketten in P({a, b, c, d})
bezüglich Inklusion. Sie entsprechen den Möglichen Anordnungen der Menge
vier-elementigen Menge {a, b, c, d}.
Aufgabe 4.19. Wieviele Ordnungen gibt es auf einer dreielementigen Menge?
wieviele auf einer vierelementigen Menge?
Aufgabe 4.20. Sei eine Anordnung auf der Menge M. Für jedes m ∈ M
betrachten wir den zugehörigen Hauptanfang
Mm := {x ∈ M x m und x 6= m}
Zeige: m l genau dann, wenn Mm ⊆ Ml .
Läßt sich das auch zeigen, wenn lediglich als Ordnung vorausgesetzt wird?
Aufgabe 4.21. Zeige: Jede nicht-leere endliche Anordnung hat ein kleinstes
Element. Folgere: Jede endliche Anordnung ist schon eine Wohlordnung.
Aufgabe 4.22. Zeige: Jede nicht-leere endliche Ordnung hat ein minimales
Element.
Definition 4.23. Sei M eine Menge und seien = (M, M, R) und ⊑= (M, M, S)
zwei Ordnungen auf M. Wir nennen ⊑ eine Verfeinerung von , wenn R ⊆ S ist.
D.h.:
∀x, y ∈ M : x y =⇒ x ⊑ y
Gilt sogar R ⊂ S, so nennen wir ⊑ eine echte Verfeinerung von .
Aufgabe 4.24. Zeige: Eine Anordnung läßt keine echte Verfeinerung zu.
Aufgabe 4.25. Ist eine Ordnung keine Anordnung, so hat sie eine echte
Verfeinerung. Genauer: Seinen m und l zwei unvergleichbare Elemente. Wir
definieren die Relation ⊑ durch
x⊑y
:⇐⇒
x y oder (x m und l y)
Zeige, daß ⊑ eine Ordnungsrelation ist, die echt verfeinert.
Aufgabe 4.26. Seien und ⊑ zwei verschiedene Ordnungen auf der Menge M.
Zeige, daß die Menge aller Anordnungen, die verfeinern, verschieden ist von der
Menge aller Anordnungen, die ⊑ verfeinern. Eine Ordnung ist also durch die Menge
der sie verfeinernden Anordnungen eindeutig bestimmt.
Aufgabe 4.27. Zeige: Jede Ordnung auf einer endlichen Menge läßt sich zu einer
Anordnung verfeinern.
18
5
Die natürlichen Zahlen nach von Neumann
Ein Nachteil der Zermelo-Fraenkelschen Mengenlehre ist, daß sich die Begründung
der Arithmetik nur mit etwas Aufwand nachvollziehen läßt. Der Grund liegt darin,
daß die Fregeschen Zahlen in der Zermelo-Fraenkelschen Mengenlehre nicht
existieren. Es gilt nämlich schon:
Korollar 5.1. Es gibt keine Menge M, die alle einelementigen Mengen enthält.
Insbesondere ist 1F keine Menge.
Beweis. Die einelementigen Mengen sind gerade die Mengen der Form {x}. Wir
haben also die Annahme zum Widerspruch zu führen, daß es eine Menge M gibt mit
∀x : {x} ∈ M
Sei also M so eine Menge. Wir bilden die Vereinigung
L := V(M)
Nach (2.10) gilt dann für jedes x:
{x} ∈ M =⇒ {x} ⊆ L =⇒ x ∈ L
Also enthält L alles. Das aber ist nach Korollar (3.23) ausgeschlossen.
q.e.d.
Als Alternative führen wir die natürlichen Zahlen nach einer Konstruktion ein, die
John von Neumann (Zur Einführung der transfiniten Zahlen) angegeben hat. Wir
setzen:
0N
1N
2N
3N
4N
:=
:=
:=
:=
:=
∅
0N
1N
2N
3N
∪ {0N } = {0N }
∪ {1N } = {0N , 1N }
∪ {2N } = {0N , 1N , 2N }
∪ {3N } = {0N , 1N , 2N , 3N }
Gut ist, daß die Zahl µ genau µ Elemente hat. Die Menge aller natürlichen Zahlen
ist dann
N∗ := {0N , 1N , 2N , 3N , 4N , . . .}
Aber was sollen die Pünktchen . . .“ bedeuten?
”
Wichtig ist offensichtlich der Übergang von einer Zahl auf die nächste:
Definition 5.2. Für jede Menge x, heißt x+ := x ∪ {x} der Nachfolger von x.
Nun möchten wir sagen, daß eine von-Neumann-Zahl eine Menge ist, die sich aus
der leeren Menge dadurch gewinnen läßt, daß die Nachfolger-Operation endlich oft
angewandt wird. Wenn wir die Menge der natürlichen Zahlen einführen, klären wir
also den Begriff des Endlichen (und damit nebenbei auch seine Negation, den Begriff
des Unendlichen).
19
Definition 5.3. Eine Menge M heißt induktiv wenn gilt:
1. M enthält die leere Menge als Element: ∅ ∈ M.
2. M ist unter Nachfolgerbildung abgeschlossen: ∀x ∈ M : x+ ∈ M.
Bemerkung 5.4. Der Begriff der induktiven Menge ist kontextabhängig. Wir
werden später andere Mengen induktiv nennen (schon im nächsten Abschnitt). Das
durchgehende Merkmal ist, daß (a) ein bestimmtes Element (Nullelement) in der
Menge gefordert wird und daß (b) die Menge abgeschlossen unter einer Operation
(Nachfolge) sein soll. Je nach Zusammenhang kann aber das Nullelement und die
Nachfolgeroperation wechseln.
Eine induktive Menge enthält 0N , und damit enthält sie also auch 1N und damit
auch 2N und damit auch 3N und damit auch 4N und so weiter. Induktive Mengen
enthalten also alle von-Neumann-Zahlen und sind somit unendlich. Daß es
unendliche Mengen überhaupt gibt, müssen wir aber erst fordern:
Axiom 5.5 (Unendlichkeitsaxiom). Es gibt eine induktive Menge U.
Um die Menge der natürlichen Zahlen einzuführen (also die drei Punkte oben zu
erläutern), müssen wir aber auch ausdrücken können, daß keine weiteren Elemente
in N∗ vorkommen.
Beobachtung 5.6. Sei I eine Menge induktiver Mengen. Dann ist der Durschnitt
D(I) wieder eine induktive Menge.
Beweis. Alle induktiven Mengen enthalten ∅, darum ist ∅ ∈ D(I).
Sei nun x ∈ D(I). D.h.: x ∈ M für jedes M ∈ I. Da jede dieser Mengen M induktiv
ist, ist aber auch x+ ∈ M für jedes M ∈ I. Das aber heißt x+ ∈ D(I).
q.e.d.
Jetzt möchten wir definieren:
N∗ := D({M M ist induktiv})
Leider ist die rechte Seite dieser Definition keine Form zulässiger Mengenbildung
(die naive Formulierung benutzt unbeschränkte Mengenbildung).
Satz und Definition 5.7. Der Ausdruck
N∗ := {µ ∀M : M ist induktiv =⇒ µ ∈ M}
beschreibt eine Menge, die wir als Menge der natürlichen Zahlen bezeichnen. Dies
ist die kleinste“ induktive Menge. Genauer:
”
1. N∗ ist induktiv.
2. N∗ ist die kleinste induktive Menge: Ist M eine beliebige induktive Menge, so
ist N∗ ⊂ M. Ist insbesondere, M ⊆ N∗ induktiv, so ist M = N∗ .
20
Beweis. Wir betrachten das Prädikat
ϕ(x)
:=
∀M : M ist induktiv =⇒ x ∈ M
Also gilt ϕ(x) genau dann, wenn x Element aller induktiven Mengen ist.
Wir haben zu zeigen, daß der Mengenausdruck {x ϕ(x)} eine Menge definiert.
Dazu brauchen wir eine Menge U, mit
∀x : ϕ(x) =⇒ x ∈ U
denn dann können wir {x ϕ(x)} durch Aussonderung aus U bilden:
∀x :
ϕ(x) ⇐⇒ (x ∈ U und ϕ(x))
und damit:
{x ϕ(x)} = {x ∈ U ϕ(x)}
Für diesen Zweck taugt wegen der Bedeutung von ϕ jede induktive Menge; und
nach Unendlichkeitsaxiom gibt es solche.
Zu den behaupteten Eigenschaften:
1. Wir zeigen, daß N∗ induktiv ist. Sei also µ ∈ N∗ und U eine induktive Menge.
Dann ist µ ∈ N∗U ⊆ U. Wegen Induktivität von U folgt µ+ ∈ U. Also liegt der
Nachfolger µ+ in allen induktiven Mengen, denn U war beliebig. Mithin ist
µ+ ∈ N∗ .
Außerdem ist ∅ Element jeder induktiven Menge, also ist ∅ ∈ N∗ .
2. Wir hatten schon festgestellt, daß sich N∗ aus jeder induktiven durch
Aussonderung gewinnen läßt. Das heißt aber gerade:
N∗ ⊂ U
∀U induktive Menge
Ist nun überdies, U ⊆ N∗ , so folgt eben U = N∗ .
q.e.d.
Oben hatten wir gesagt, daß N∗ nicht endlich ist. Die zugrundeliegende Vorstellung
ist, daß die Reihe der von-Neumann-Zahlen nicht abbricht. Aber das allein reicht
noch nicht. Wir müssen auch sehen, daß die späteren Elemente der Reihe neu sind,
also nicht schon früher aufgetreten sind. A priori könnte die Nachfolgeroperation ja
auf Zyklen führen. Daß dem nicht so ist, folgt letzlich aus der folgenden Feststellung:
Satz 5.8. Für jede natürliche Zahl µ ∈ N∗ ist
V(µ) ⊆ µ = V(µ+ ) ⊂ µ+ .
Insbesondere ist keine natürliche Zahl ihrem Nachfolger gleich. Außerdem sind zwei
natürliche Zahlen gleich, wenn sie gleiche Nachfolger haben.
Bemerkung 5.9. Die Bedingung V(L) ⊆ M besagt gerade, daß jedes Element von
L eine Teilmenge von M ist. Also sagt die Bedingung V(M) ⊆ M, daß jedes
Element von M auch Teilmenge von M ist. Man nennt Mengen M, die dieser
Bedingung genügen auch transitive Mengen.
21
Beweis. Wir setzen
n
A := µ ∈ N∗ V(µ) ⊆ µ = V(µ+ ) ⊂ µ+
und zeigen, daß A induktiv ist. Dann folgt A = N∗ .
Zunächst bestätigt man leicht:
o
V(0) = 0 = V(0+ ) ⊂ 0+
woraus 0 ∈ A folgt.
Zur Abgeschlossenheit unter Nachfolgerbildung nehmen wir an µ ∈ A. Dann ist
zunächst
+
V(µ+ ) ⊂ µ+ = V(µ+ ) ∪ µ+ = V(µ+ )
(2)
+
+
Zu zeigen bleibt V(µ+ ) ⊂ µ+ .
+
Mit µ+ = µ+ ∪ {µ+ } folgt dann aus (2)
+
V(µ+ ) = µ+ ⊆ µ+
+
+
+
Schließlich müssen wir einsehen, daß V(µ+ ) = µ+ 6= µ+ ist. Wäre aber
+
µ+ = µ+ = µ+ ∪ {µ+ }, so folgte µ+ ∈ µ+ = µ ∪ {µ}. Wegen µ ∈ A, ist µ 6= µ+ und
es folgt sogar µ+ ∈ µ.
Jetzt nutzen wir die Transitivität der Menge µ und erhalten µ+ ⊆ µ, was aber im
Widerspruch zu µ ⊂ µ+ steht.
q.e.d.
Lemma 5.10. Keine von Neumann-Zahl ν ist Teilmenge eines ihrer Elemente.
Insbesondere ist ν 6∈ ν.
Beweis. Setze
A := {ν ∈ N∗ ∀µ ∈ ν : ν 6⊆ µ}
Wir zeigen, daß A induktiv ist. Augenscheinlich ist ∅ ∈ A.
Sei also ν ∈ A und µ ∈ ν + = ν ∪ {ν}. Dann ist µ ∈ ν oder µ = ν.
Ist µ ∈ ν, dann ist wegen Transitivität µ ⊆ ν ⊂ ν + und somit ν + 6⊆ µ.
Für den Fall µ = ν folgt ν + 6⊆ µ aus ν ⊆ ν + , was sich unmittelbar aus Satz (5.8)
ergibt.
Wäre nun ν ∈ ν, dann wäre ν = ν ∈ ν und damit ν ⊆ ν ∈ ν, also wäre ν Teilmenge
eines Elements (nämlich ν).
q.e.d.
Bemerkung 5.11. Die angegebenen Axiome schließen Mengen, die sich selbst als
Element enthalten, nicht aus. Es gibt sogar Versionen der Mengenlehre, in denen die
Gleichung“
”
x = {x}
eine eindeutige Lösung hat – und die bisher diskutierten Axiome sind Bestandteil
dieser Versionen von Mengenlehre. So ein x wäre sein eigener Nachfolger:
x = {x} = x ∪ {x} = x+
Man könnte ein Fundiertheitsaxiom einführen, daß solche Mengen verbietet. Für die
Entwicklung der Analysis ist das aber nicht erforderlich.
22
Lemma 5.12. Für jede von von Neumann-Zahl µ ∈ N∗ ist ∅ = µ oder ∅ ∈ µ.
Beweis. Setze
A := {µ ∈ N∗ µ = ∅ oder ∅ ∈ µ}
Offensichtlich ist ∅ ∈ A.
Sei nun µ ∈ A. Ist µ = ∅, so ist ∅ ∈ ∅+ = µ+ , womit µ+ ∈ A ist. Ist µ 6= ∅, so ist
∅ ∈ µ wegen µ ∈ A. Da µ ⊆ µ+ nach Definition der Nachfolgeroperation gilt, folgt
∅ ∈ µ+ und damit µ+ ∈ A.
Also ist A induktiv und damit A = N∗ .
q.e.d.
Lemma 5.13. Für je zwei von Neumann-Zahlen µ, ν ∈ N∗ gilt:
µ∈ν
=⇒
Beweis. Setze
µ+ = ν oder µ+ ∈ ν
n
A := ν ∈ N∗ ∀µ ∈ N∗ : µ ∈ ν =⇒
µ+ = ν oder µ+ ∈ ν
o
Es reicht zu zeigen, daß A induktiv ist.
Das ∅ ∈ A ist, folgt daraus, daß die Voraussetzung µ ∈ ν für ν = ∅ niemals erfüllt
ist. Darum gilt die Implikation stets.
Sei nun ν ∈ A. Wir haben zu zeigen, daß ν + ∈ A ist. Sei also µ ∈ ν + = ν ∪ {ν}. Zu
zeigen ist µ+ = ν + oder µ+ ∈ ν + . Wir unterscheiden die beiden Fälle:
µ ∈ ν: Hier ist µ+ = ν ∈ ν + oder µ+ ∈ ν ⊆ ν + , weil ν ∈ A ist.
µ ∈ {ν}: Hier ist µ = ν und somit µ+ = ν + .
Also ist A induktiv.
q.e.d.
Lemma 5.14. Für je zwei von Neumann-Zahlen µ, ν ∈ N∗ gilt:
µ∈ν
=⇒
µ⊂ν
Beweis. Sei µ ∈ ν. Aus der Transitivität der von Neumann-Zahlen folgt µ ⊆ ν. Aus
Lemma (5.10) folgt jedoch ν 6⊆ µ, mithin ist µ ⊂ ν.
q.e.d.
Satz 5.15. Für je zwei von Neumann-Zahlen µ, ν ∈ N∗ gilt:
µ∈ν
oder
ν∈µ
oder
µ=ν
Beweis. Wir wählen µ ∈ N∗ beliebig aber fest und setzen
A := {ν ∈ N∗ µ ∈ ν oder ν ∈ µ oder µ = ν}
Es reicht zu zeigen, daß A induktiv ist.
Nach Lemma (5.12) ist 0 ∈ A. Sei nun ν ∈ A. Zu zeigen ist ν + ∈ A.
Wir unterscheiden drei Fälle:
23
µ ∈ ν: In diesem Fall ist µ ∈ ν + , weil ν ⊆ ν + ist. Also ist ν + ∈ A.
ν ∈ µ: In diesem Fall ist mit Lemma (5.13):
ν + = µ oder ν + ∈ µ
In jedem Fall ist ν + ∈ A.
µ = ν: Hier ist µ ∈ ν + und damit ν ∈ A.
q.e.d.
Proposition 5.16. Seien µ, ν ∈ N∗ zwei von Neumann-Zahlen. Zeige:
µ∈ν
⇐⇒
µ⊂ν
Beweis. Mit Lemma (5.14) erhalten wir die eine Richtung. Sei nun µ ⊂ ν. Wir
haben zu zeigen, daß µ ∈ ν ist.
Nach Satz (5.15) gibt es drei Möglichkeiten:
µ∈ν
oder
ν∈µ
oder
µ=ν
Der ersten Fall ist günstig, die anderen sind zum Widerspruch zu führen. Nun folgt
aus ν ∈ µ wieder mit Lemma (5.13), daß ν ⊂ µ ist, was im Widerspruch zu µ ⊂ ν
steht. Und die Aussage µ = ν steht ohnehin zu µ ⊂ ν im Widerspruch. Es bleibt
also nur die Möglichkeit µ ∈ ν.
q.e.d.
Satz 5.17 (Wohlordnungsprinzip). Jede nicht-leere Menge natürlicher Zahlen
B ⊆ N∗ hat ein kleinstes Element a ∈ B, d.h.:
∀a′ ∈ B : a ⊆ a′
Beweis. Zunächst beobachten wir, daß aus Satz (5.15) und Proposition (5.16) die
⊆-Vergleichbarkeit beliebiger von Neumann-Zahlen µ, ν ∈ N∗ folgt:
µ⊆ν
oder
ν⊆µ
Sei nun B ⊆ N∗ eine Teilmenge ohne kleinstes Element. Wir haben zu zeigen, daß B
leer ist. Dazu betrachten wir die Menge
A := {a ∈ N∗ ∀µ ∈ B : a ⊆ µ}
aller unteren Schranken von B. Ein Element von B ∩ A wäre ein kleinstes Element
von B, also sind B und A elementfremd. Wir zeigen, daß A induktiv und damit
gleich N∗ ist. Da B dazu disjunkt ist, folgt dann, daß B leer ist.
Offensichtlich ist 0 ∈ A. Betrachte a ∈ A. Wir führen die Annahme a+ 6∈ A zum
Widerspruch, d.h., die Annahme:
∃µ ∈ B : a+ 6⊆ µ
Wegen der ⊆-Vergleichbarkeit von µ und a+ folgt dann µ ⊆ a+ . Da aber a ∈ A und
a 6∈ B ist, haben wir a ⊂ µ ⊆ a+ , mithin µ = a+ . Also ist doch nicht
a+ 6⊆ µ.
q.e.d.
24
Aufgabe 5.18. Zeige: Jedes Element µ ∈ N∗ ist auch Teilmenge von N∗ .
Aufgabe 5.19. Zeige: ∅ ist die einzige von Neumann-Zahl, die nicht Nachfolger
einer von Neumann-Zahl ist. Für jede andere von Neumann-Zahl µ ist V(µ) der
Vorgänger:
∀µ ∈ N∗ : ∅ =
6 µ ⇐⇒ V(µ) ∈ N∗ und µ = V(µ)+
Aufgabe 5.20. Seien µ, ν ∈ N∗ zwei von Neumann-Zahlen. Zeige: Sind die
Nachfolger µ+ und ν + gleichmächtig, so sind auch µ und ν gleichmächtig.
Aufgabe 5.21. Gleichmächtige von Neumann-Zahlen sind gleich.
Übrigens können wir jetzt auch sagen, was wir unter einer endlichen und unter einer
unendlichen Menge verstehen.
Fakt und Definition 5.22. Sei M eine Menge. Dann sind folgende Aussagen
äquivalent:
1. Es gibt eine von-Neumann-Zahl µ ∈ N∗ die gleichmächtig zu M ist.
2. Es gibt keine injektive Funktion N∗ → M.
3. Es gibt keine surjektive Funktion M → N∗ .
4. Jede injektive Funktion von M nach M ist bijektiv. (Dedekind-Endlichkeit)
5. Jede surjektive Funktion von M nach M ist bijektiv.
6. Jede nicht-leere Teilmenge B ⊆ P(M) der Potenzmenge hat ein minimales
Element bezüglich Inklusion:
∀∅ =
6 B ⊆ P(M) ∃x ∈ B ∀y ∈ B : y ⊆ x =⇒ y = x (Tarski-Endlichkeit)
Sind diese Bedingungen erfüllt, so nennen wir M endlich und die gleichmächtige
von Neumann-Zahl #M ihre Mächtigkeit oder Kardinalität.
Der Beweis dieser Äquivalenzen gehört nicht hierher sondern in eine Vorlesung über
Mengenlehre.
Bemerkung 5.23. Daß die Kardinalität einer endlichen Menge eindeutig bestimmt
ist, folgt aus (5.21).
Aufgabe 5.24. Zeige: Teilmengen endlicher Mengen sind selbst endlich.
Aufgabe 5.25. Zeige (ohne Verwendung von Fakt 5.22), daß jede
von-Neumann-Zahl Dedekind-endlich ist.
25
Aufgabe 5.26. Zeige (ohne Verwendung von Fakt 5.22), daß für keine
von Neumann-Zahl µ ∈ N∗ eine injektive Abbildung N∗ → µ existiert.
Aufgabe 5.27. Zeige (ohne Verwendung von Fakt 5.22), daß die Menge N∗ aller
von Neumann-Zahlen nicht Dedekind-endlich ist.
Aufgabe 5.28. Zeige (ohne Verwendung von Fakt 5.22), daß jede
von-Neumann-Zahl Tarski-endlich ist.
Aufgabe 5.29. Zeige (ohne Verwendung von Fakt 5.22), daß die Menge N∗ aller
von Neumann-Zahlen nicht Tarski-endlich ist.
Definition 5.30. Eine Menge M heißt Kuratowski-endlich, wenn jede Teilmenge
B ⊆ P(M), die gegenüber Vereinigung abgeschlossen ist und außerdem die leere
Menge und alle Einermengen {m} für m ∈ M enthält, schon M als Element enthält:
∀B ⊆ P(M) :


∀x, y ∈ B : x ∪ y ∈ B und

und 

 ∅∈B
∀m ∈ M : {m} ∈ B
=⇒
M ∈B
Aufgabe 5.31. Zeige, daß alle von Neumann-Zahlen Kuratowski-endlich sind.
Aufgabe 5.32. Zeige, daß die Menge N∗ aller von Neumann-Zahlen nicht
Kuratowski-endlich ist.
Aufgabe 5.33. Zeige: die Vereinigung zweier endlicher Mengen ist endlich.
26
6
Die reellen Zahlen nach Dedekind
6.1
Angeordnete Körper
Definition 6.1. Ein angeordneter Körper ist ein Körper K mit Nullelement 0 ∈ K,
Einselement 1 ∈ K, Addition und Multiplikation
+ : K × K −→ K
(α, β) 7→ α + β
· : K × K −→ K
(α, β) 7→ α · β
und einer Anordnung ≤ auf K, genannt Kleiner-Gleich, die mit den
Körperverknüpfungen in folgendem Sinne verträglich ist:
1. Die Kleiner-Gleich-Relation ist invariant unter Addition:
α≤β
α+γ ≤β+γ
=⇒
∀α, β, γ ∈ K
2. Die Kleiner-Gleich-Relation ist invariant unter Multiplikation mit
nicht-negativen Elementen:
α ≤ β und 0 ≤ γ
α·γ ≤β·γ
=⇒
∀α, β, γ ∈ K
Erinnerung. Ausbuchstabiert heißt das: Ein angeordneter Körper ist eine Menge
K mit zwei ausgezeichneten Elementen 0 ∈ K (genannt Null) und 1 ∈ K (genannt
Eins), mit zwei Verknüpfungen
+ : K × K −→ K
· : K × K −→ K
(genannt Addition)
(genannt Multiplikation)
und mit einer Relation
≤ auf K
(genannt kleiner-gleich),
so daß folgende Bedingungen erfüllt sind:
1. Null und Eins sind verschieden: 0 6= 1.
2. Null ist ein neutrales Element bezüglich der Addition:
α+0=0+α =α
∀α ∈ K
3. Addition ist assoziativ:
(α + β) + γ = α + (β + γ)
27
∀α, β, γ ∈ K
4. Addition ist kommutativ:
∀α, β ∈ K
α+β =β+α
5. Jedes Element α ∈ K hat ein additives Inverses:
∀α ∈ K∃β ∈ K : α + β = β + α = 0
6. Eins ist ein neutrales Element bezüglich der Multiplikation:
α·1 =1·α = α
∀α ∈ K
7. Multiplikation ist assoziativ:
(α · β) · γ = α · (β · γ)
∀α, β, γ ∈ K
8. Multiplikation ist kommutativ:
α·β =β ·α
∀α, β ∈ K
9. Jedes Element α ∈ K außer 0 hat ein multiplikatives Inverses:
∀α ∈ K : α 6= 0 =⇒ ∃β ∈ K : α · β = β · α = 1
10. Für Addition und Multiplikation gelten die Distributivgesetze:
(α + β) · γ = (α · γ) + (β · γ)
α · (β + γ) = (α · β) + (α · γ)
∀α, β, γ ∈ K
∀α, β, γ ∈ K
11. Die Kleiner-Gleich-Relation ist reflexiv:
α≤α
∀α ∈ K
12. Die Kleiner-Gleich-Relation ist antisymmetrisch:
α ≤ β und β ≤ α
=⇒
α=β
∀α, β ∈ K
13. Die Kleiner-Gleich-Relation ist transitiv:
α ≤ β und β ≤ γ
=⇒
α≤γ
∀α, β, γ ∈ K
14. Die Kleiner-Gleich-Relation ist total, d.h., je zwei Elemente sind vergleichbar:
α ≤ β oder β ≤ α
28
∀α, β ∈ K
15. Die Kleiner-Gleich-Relation ist invariant unter Addition:
α≤β
=⇒
α+γ ≤β+γ
∀α, β, γ ∈ K
16. Die Kleiner-Gleich-Relation ist invariant unter Multiplikation mit
nicht-negativen Elementen:
α ≤ β und 0 ≤ γ
α·γ ≤β·γ
=⇒
∀α, β, γ ∈ K
Die ersten 10 Bedingungen stellen sicher, daß jeder angeordnete Körper ein Körper
ist.
Notation 6.2 (Klammerersparnisregeln). Wir schreiben α − β für α + (−β)
und αβ für α · β1 . Wir schreiben in der Regel αβ für α · β und lassen Klammern fort,
wo sie keine Rolle spielen. D.h.:
α+β+γ
schreiben wir ohne Klammern, weil das Ergebnis nicht von der Klammerung
abhängt. Daß die Werte dieser Ausdrücke nicht von der Klammerung abhängen,
folgt aus den Axiomen und wird entweder in der Algebra gezeigt oder bleibt als
Übungsaufgabe dem Leser überlassen.
Durch die Konvention Punkt- vor Strichrechnung“ sparen wir weitere Klammern:
”
αβ + γ = (αβ) + γ
Notation 6.3 (Potenzen). Wir setzen
x2 := x · x
x3 := x · x2
x4 := x · x3
..
.
Hier sind wieder Pünktchen am Werk. Später werden wir sehen, wie wir solche
Definitionen präzisieren können. Für’s erste reichen uns x2 und x3 .
Fakt und Beispiel 6.4. Unter Rekurs auf Schulwissen läßt sich feststellen, daß
der Körper Q der rationalen Zahlen ein angeordneter Körper ist. Wir werden später
sehen, daß sich dieser Körper in jedem angeordneten Körper definieren läßt.
Beobachtung 6.5. In einem Körper K gilt 0 · α = 0 für jedes Element α ∈ K.
Beweis. Es ist 0 = 0 + 0 wegen additiver Neutralität. Mit dem Distributivgesetz
ergibt sich dann:
0 · α = (0 + 0) · α = 0 · α + 0 · α
29
Wir addieren auf beiden Seiten das additive Inverse −(0 · α) und erhalten
0 =
=
=
=
0 · α + 0 · α + (−(0 · α))
0 · α + (0 · α + (−(0 · α))
0·α+0
0·α
q.e.d.
Bemerkung 6.6. In der (linearen) Algebra wird folgendes bewiesen: Additive
Inverse sind eindeutig. Das additive Inverse von α bezeichnen wir mit −α.
Multiplikative Inverse sind eindeutig. Das multiplikative Inverse eines Elements
α 6= 0 bezeichnen wir mit α1 .
Beweis. Für diejenigen, die die Algebra (noch) nicht hören, hier Beweise zu den
beiden Aussagen:
Eindeutigkeit additiver Inverser Sei α ∈ K und x und y seien beides additive
Inverse von α. Dann ist:
x=x+0
=x+α+y
=0+y
=y
Eindeutigkeit multiplikativer Inverser Sei nun zusätzlich α 6= 0. Sind dann
x, y ∈ K zwei multiplikative Inverse, so gilt ganz ähnlich:
x= x·1
= x·α·y
=1·y
=y
In den Rechnungen haben wir ganz massiv die Kommutativgesetze ausgenuzt. Es
gibt (leicht) aufwendigere Beweise, die ohne Verweis auf Kommutativität
hinkommen.
q.e.d.
Die Eindeutigkeit der additiven Inversen hat eine interessante Konsequenz:
Folgerung 6.7. In einem Körper K ist für jedes α ∈ K das Produkt (−1) · α ein
und damit das additive Inverse −α. Es ist nämlich
α + (−1) · α =
=
=
=
30
1 · α + (−1) · α
(1 + (−1)) · α
0·α
0
Beobachtung 6.8. In einem Körper gilt: (−1) · (−1) = 1.
Beweis. Wir rechnen:
1 =
=
=
=
=
=
=
1+0
1 + 0 · (−1)
1 + (1 + (−1)) · (−1)
1 + 1 · (−1) + (−1) · (−1)
1 + (−1) + (−1) · (−1)
0 + (−1) · (−1)
(−1) · (−1)
q.e.d.
Beobachtung 6.9. In einem angeordneten Körper K sind Quadrate nicht-negativ:
0 ≤α·α
∀α ∈ K
Insbesondere ist 0 ≤ 12 = 1 6= 0.
Beweis. Für α ∈ K ist 0 ≤ α oder α ≤ 0, weil die Relation ≤ total ist. Im Fall
0 ≤ α folgt 0 = 0 · α ≤ α · α.
Im Fall α ≤ 0 folgt 0 = α + (−α) ≤ 0 + (−α) = −α. Damit ergibt sich unter
Anwendung des ersten Falles auf das nicht-negative −α die Ungleichung
0 ≤ (−α) · (−α).
Nun ist aber
(−α) · (−α) =
=
=
=
((−1) · α) · ((−1) · α)
(−1) · (−1) · α · α
1·α·α
α·α
und es folgt wieder 0 ≤ α · α.
q.e.d.
Notation 6.10. Wir schreiben:
x<y
für
(x ≤ y und x 6= y)
Nach (6.9) haben wir zum Beispiel 0 < 1.
Da ≤ eine Anordnung ist, können wir auch sagen:
x<y
⇐⇒
y 6≤ x
Beobachtung 6.11. In einem angeordneten Körper gilt:
0<x
=⇒
31
0<
1
x
Beweis. Zum Widerspruch nehmen wir x1 ≤ 0 an und multiplizieren beide Seiten
mit dem nicht-negativen Element x. Dann erhalten wir die absurde (6.9) Aussage
1 ≤ 0.
q.e.d.
Aufgabe 6.12. Seien α und β Elemente eines angeordneten Körper K. Wir
nehmen an
1. Beide Elemente sind nicht-negativ:
0 ≤ α und 0 ≤ β
2. Die Summe verschwindet:
α+β =0
Zeige, daß beide Elemente verschwinden:
α=0=β
Aufgabe 6.13. Sei K ein angeordneter Körper und α ∈ K ein Element mit α ≤ 0.
Zeige:
x ≤ y =⇒ αy ≤ αx
∀x, y ∈ K
Aufgabe 6.14. Seien α und β Elemente eines angeordneten Körper mit α < β.
Zeige:
α+β
α<
<β
2
Also: das arithmetische Mittel zweier verschiedener Größen liegt echt dazwischen.
Proposition 6.15 (Nullteilerfreiheit). Jeder Körper K ist nullteilerfrei, d.h.:
x 6= 0 und y 6= 0
⇐⇒
xy 6= 0
∀x, y ∈ K
In Worten und negativ formuliert: ein Produkt verschwindet genau dann, wenn
mindestens einer seiner Faktoren verschwindet.
Beweis. Das sollte aus der linearen Algebra bekannt sein. Hier eine Erinnerung an
den wesentlichen Punkt: Sei x 6= 0 aber xy = 0. Dann ist:
y=
1
1
xy = · 0 = 0
x
x
q.e.d.
Als unmittelbare Konsequenz aus (6.9) und (6.15) erhalten wir:
Die Mutter aller Ungleichungen 6.16. In einem angeordneten Körper gilt
0 ≤ x2
und
Gleichheit nur für x = 0
32
q.e.d.
Aufgabe 6.17. Sei 0 < α ≤ β. Zeige:
1. 0 < β.
2.
1
β
≤ α1 .
Aufgabe 6.18. Wir schreiben 2 als Abkürzung für 1 + 1. Sei 0 < x, 0 < y und
0 < z. Zeige die Ungleichungen:
1. 2xy ≤ x2 + y 2
2. 2 ≤
x y
+
y x
3. (x + y)2 ≤ 2(x2 + y 2)
4.
5.
x+y
2xy
≤
x+y
2
x+y+z
1+1+1
1
1 ≤
1+1+1
+y+z
1
x
Wann gilt jeweils Gleichheit?
Aufgabe 6.19. Seien x, y, z echt positive Elemente des angeordneten Körper K,
d.h.:
0 < x und 0 < y und 0 < z
Zeige die Ungleichungen:
1. (x + y + z)2 ≤ (1 + 1 + 1)(x2 + y 2 + z 2 )
2.
x+y
1+1
1 ≤
1
+y
1+1
x

2
2
3.  1 1  ≤ xy
+y
x
4. (1 + 1 + 1)xyz ≤ x3 + y 3 + z 3
Beispiel 6.20. In einem angeordneten Körper gilt:
x≤y
x<y
=⇒
=⇒
x3 ≤ y 3
x3 < y 3
Im Vorgriff auf später: Die Abbildung x → x3 ist streng monoton.
33
Beweis. Zunächst bestätigt eine Rechnung:
2(y 3 − x3 ) = (y − x)(y 2 + y 2 + 2yx + x2 + x2 ) = (y − x)[y 2 + (y + x)2 + x2 ]
Nun sind Summen von Quadraten nicht negativ:
0 ≤ y 2 + (y + x)2 + x2
Ist nun x ≤ y, folgt auch 0 ≤ y − x und darum:
0 ≤ 2(y 3 − x3 )
Mit 0 ≤
1
2
erhalten wir durch Multiplikation:
0 ≤ y 3 − x3
und somit:
x3 ≤ y 3
Ist nun überdies x 6= y, so ist zunächst zumindest eines der beiden Element nicht 0.
Also ist 0 < x2 oder 0 < y 2 und auf jeden Fall gilt:
0 < y 2 + (y + x)2 + x2
weil alle drei Summanden nicht-negativ sind, und der erste oder letzte (und
wahrscheinlich alle) sind sogar echt positiv. Damit ist wegen Nullteilerfreiheit
2(y 3 − x3 ) = (y − x)[y 2 + (y + x)2 + x2 ] 6= 0
6.2
q.e.d.
Vollständigkeit
Erinnerung (siehe Definition 4.15). Sei K ein angeordneter Körper und A ⊆ K
eine Teilmenge. Das Element β ∈ K heißt obere Schranke von A, wenn α ≤ β ist für
jedes α ∈ A. Eine Teilmenge heißt von oben beschränkt, wenn sie eine obere
Schranke hat. Eine obere Schranke β von A heißt kleinste obere Schranke oder
Supremum von A, wenn A keine kleinere obere Schranke hat:
β ′ ist obere Schranke von A
=⇒
β ≤ β′
∀β ′ ∈ K
Analog sagen wir, das Element β sei untere Schranke von A, wenn β ≤ α für jedes
α ∈ K. Eine Teilmenge heißt von unten beschränkt, wenn sie eine untere Schranke
hat. Eine untere Schranke β von A heißt größte untere Schranke oder Infimum von
A, wenn A keine größere untere Schranke hat:
β ′ ist untere Schranke von A
=⇒
β′ ≤ β
∀β ′ ∈ K
Eine Teilmenge heißt beschränkt, wenn sie von oben und von unten beschränkt ist.
34
Beobachtung 6.21 (Eindeutigkeit von Supremum und Infimum). Sei K ein
angeordneter Körper. Dann hat eine Teilmenge A ⊆ K höchstens eine kleinste obere
Schranke. Bemerkung: analog hat A höchstens eine größte untere Schranke.
Beweis. Folgt direkt aus der Eindeutigkeit kleinster und größter Elemente in
Ordnungen (siehe Beobachtung 4.6). Hier nochmal das Argument spezialisiert für
einen angeordneten Körper: Seien α und β zwei Suprema von A. Dann ist α ≤ β,
denn α ist Supremum und β ist obere Schranke von A. Mit vertauschten Rollen
folgt ebenso β ≤ α. Antisymmetrie impliziert damit α = β.
q.e.d.
Satz und Definition 6.22. Sei M eine Menge und ≤ eine Ordnung auf M. Dann
sind die folgenden Aussagen äquivalent:
1. Jede nach oben beschränkte, nicht-leere Teilmenge von M hat ein Supremum.
2. Jede nach unten beschränkte, nicht-leere Teilmenge von M hat ein Infimum.
3. Für je zwei nicht-leere Teilmengen A, B ⊆ M mit x ≤ y für alle x ∈ A und
alle y ∈ B gibt es ein Element m ∈ M mit:
x≤m≤y
für alle x ∈ A und alle y ∈ B
Die Voraussetzungen sagen: jedes Element von A ist untere Schranke von B
und jedes Element von B ist obere Schranke von A.
M heißt ordnungs-vollständig bezüglich ≤, wenn diese Bedingungen erfüllt sind.
Beweis. Wir zeigen zunächst (2) ⇒ (3). Da A nicht-leer ist, ist B nach unten
beschränkt. Mit (2) hat B also ein Infimum m und es ist m ≤ y für jedes y ∈ L. Da
ferner jedes Element x ∈ A eine untere Schranke von B ist, gilt nach Definition des
Infimum: x ≤ m für jedes x ∈ A.
Vertauschen der Rollen von A und B ergibt das Argument für die Implikation (1)
⇒ (3).
Nun zeigen wir die Richtung (3) ⇒ (2). Sei also B eine nach unten beschränkte,
nicht-leere Teilmenge von M. Wir bilden die Menge
A := {x ∈ M ∀y ∈ B : x ≤ y}
aller unteren Schranken von B. Da B nach unten beschränkt ist, ist A auch
nicht-leer. Dann gibt es nach Annahme (3) ein m ∈ M mit:
x≤m≤y
für alle x ∈ A und alle y ∈ B
Damit ist m Infimum vonB.
Die fehlende Implikation (3) ⇒ (1) ergibt sich wieder durch Rollentausch von A und
B.
q.e.d.
Definition 6.23 (Dedekindscher Schnitt). Sei K eine angeordneter Körper. Ein
Dedekindscher Schnitt ist ein Paar (L, R) zweier Teilmengen L, R ⊆ K, so daß gilt:
35
1. Beide Teilmengen sind nicht leer:
L 6= ∅
und
R 6= ∅
2. Zusammen überdecken die beiden Teilmengen K:
K =L∪R
3. Die beiden Teilmengen sind disjunkt, d.h., sie haben keine Elemente
gemeinsam:
L∩R =∅
4. Jedes Element von L ist kleiner-gleich jedem Element von R:
λ≤ρ
∀λ ∈ L, ρ ∈ R
D.h.: jedes Element von L ist untere Schranke von R und jedes Element von R
ist obere Schranke von L.
Satz und Definition 6.24 (Schnittelement). Sei K ein angeordneter Körper
und (L, R) ein Dedekindscher Schnitt in K. Dann gibt es höchstens ein
Körperelement σ ∈ K, so daß gilt:
λ≤σ
σ≤ρ
∀λ ∈ L
∀ρ ∈ R
Ein solches Element heißt, falls es existiert, das durch (L, R) definierte
Schnittelement (oder die Schnittzahl, wenn wir die Elemente von K als Zahlen
ansehen).
Beweis. Sei σ ∈ K ein Schnittelement. Wir zeigen, daß σ die kleinste obere
Schranke der Menge L ist. Damit folgt die Behauptung aus der Eindeutigkeit
kleinster oberer Schranken (4.6).
Sei also α ∈ K eine obere Schranke von L. Zu zeigen ist σ ≤ α.
Mit K = L ∪ R unterscheiden wir zwei Fälle:
α ∈ R: Da σ eine Schnittzahl ist, gilt unmittelbar σ ≤ α.
α ∈ L: Hier folgt α ≤ σ, weil σ eine Schnittzahl ist. Das ist nicht die gewünschte
Richtung der Ungleichung. Hier haben wir also sogar zu zeigen, daß α = σ ist.
Wir nehmen also zum Widerspruch α < σ an. Wir wenden (6.14) an und
erhalten:
α+σ
α<
<σ
2
Das Mittel α+σ
kann also nicht in R liegen, gehört also zu L. Aber dann war α
2
keine obere Schranke von L, womit wir einen Widerspruch gefunden haben.
36
Bemerkung: Ganz analog ist ein Schnittelement auch eine größte untere Schranke
von R.
q.e.d.
Beispiel 6.25. In Q ist durch
L :=
R :=
ein Dedekindscher Schnitt gegeben.
n
µ ∈ Q µ3 < 2
n
µ ∈ Q 2 < µ3
o
o
Satz 6.26. Ein angeordneter Körper K ist genau dann ordnungs-vollständig, wenn
er Dedekind-vollständig ist, d.h. wenn es zu jedem Dedekindschen Schnitt (L, R) in
K ein zugehöriges Schnittelement σ gibt. Wegen (6.24) ist dieses Schnittelement
eindeutig durch (L, R) bestimmt.
Beweis. Sei zunächst K ordnungs-vollständig und (L, R) ein Dedekindscher
Schnitt. Dann ist die Bedingung (6.22-3) mit A = L und B = R erfüllt. Damit folgt
die Existenz des gesuchten Schnittelements.
Nun sei K Dedekind-vollständig. Wir zeigen, daß Bedingung (6.22-1) erfüllt ist: jede
nach oben beschränkte, nicht-leere Teilmenge A ⊆ K hat eine kleinste obere
Schranke.
Setze:
L : = {α ∈ K ∃x ∈ A : α < x}
R : = {α ∈ K 6 ∃x ∈ A : α < x}
= {β ∈ K ∀y ∈ A : x ≤ β}
Ist also α ∈ L, so gibt es x ∈ A mit α < x. Ist ferner yR, gilt auch x ≤ β und somit
α < β.
Ist nun x ∈ A, so ist x − 1 ∈ L. Daher ist L nicht leer. Da A von oben beschränkt
ist (sagen wir durch β), ist außerdem β ∈ R 6= ∅. Die definierenden Bedingungen für
L und R sind komplementär, also ist
K =L∪R
und
∅=L∩R
Also ist (L, R) ein Dedekindscher Schnitt.
Da K Dedekind-vollständig ist, gibt es also (genau) ein σ ∈ K mit
λ≤σ
σ≤ρ
∀λ ∈ L
∀ρ ∈ R
Wir zeigen nun, daß σ eine obere Schranke von A ist. Zu Widerspruch wollen wir
annehmen, daß es ein x ∈ A gäbe mit σ < x. Dann wäre
σ+x
σ<
<x
2
∈ L gilt und σ doch kein Schnittelement wäre. Also ist σ eine obere
womit σ+x
2
Schranke von A.
Sei nun β ∈ K eine beliebige obere Schranke von A. Dann ist β 6∈ L und somit
β ∈ R. Die zweite Bedingung impliziert σ ≤ β. Damit ist σ kleinste obere Schranke
von A.
q.e.d.
37
6.3
Eine willkürliche Wahl
Definition 6.27. Wir wählen einen beliebigen ordnungs-vollständigen Körper und
nennen ihn R. Seine Elemente bezeichnen wir als reelle Zahlen.
Bemerkung 6.28. Es stellt sich unmittelbar die Frage, ob es ordnungs-vollständige
Körper überhaupt gibt (wie in der Definition stillschweigend angenommen). Die
Axiome der Mengenlehre, die wir bisher eingeführt haben, erlauben es, die Existenz
angeordneter Körper zu beweisen. Entscheidend ist dabei das Unendlichkeitsaxiom,
das die Existenz der Menge N∗ garantiert. Einen Existenzbeweis für die reellen
Zahlen liefere ich erst später, weil er an dieser Stelle zu schwierig wäre. Für’s erste
verspreche ich, daß es einen ordnungs-vollständigen Körper gibt.
Ein zweite Frage ist die nach der Eindeutigkeit der reellen Zahlen.
Definition 6.29. Seien K und K ′ zwei angeordnete Körper. Eine Abbildung
f : K −→ K ′
heißt Morphismus angeordneter Körper, wenn gilt:
1. f (α + β) = f (α) + f (β) für alle α, β ∈ K.
2. f (α · β) = f (α) · f (β) für alle α, β ∈ K.
3. α ≤ β =⇒ f (α) ≤ f (β) für alle α, β ∈ K.
Ist f bijektiv, so heißt f Isomorphismus
Aufgabe 6.30. Sei f : K → K ′ ein Isomorphismus angeordneter Körper. Zeige,
daß die Umkehrabbildung f −1 : K ′ → K ebenfalls ein Isomorphismus angeordneter
Körper ist.
Der Körper R der reellen Zahlen ist nunmehr in folgendem Sinne eindeutig:
Satz 6.31. Seien K und K ′ ordnungs-vollständige Körper. Dann gibt es einen
Isomorphismus f : K → K ′ angeordneter Körper. Mehr noch: es gibt genau einen
solchen Isomorphismus. Wir sagen: der Körper der reellen Zahlen ist
eindeutig bis auf (eindeutige) Isomorphie.
Auch das muß ich zunächst einfach versprechen. Einen Beweis können wir erst dann
erbringen, wenn wir genug Wissen über ordnungs-vollständige Körper angehäuft
haben.
38
7
Die Zahlbereiche
In diesem Abschnitt fixieren wir einen beliebigen angeordneten Körper K. Wir
definieren die Teilmengen N ⊆ Z ⊆ Q ⊆ K der natürlichen, der ganzen und der
rationalen Zahlen in K. Implizit hängen diese Teilmengen vom Körper K ab. Wenn
wir die Abhängigkeit betonen wollen, schreiben wir auch NK , ZK und QK . Später
ist unser gewählter Körper stets R und wir benutzen die Bezeichnungen N := NR ,
Z := ZR und Q := QR . Wichtig ist aber, daß wir in diesem Abschnitt nicht
grundsätzlich K als ordnungs-vollständig annehmen. Wir machen diese Annahme
nur, wenn sie nötig wird, und dann formulieren wir sie explizit.
7.1
Die natürlichen Zahlen
Definition 7.1. Ein Teilmenge A ⊆ K heißt induktiv, wenn 0 ∈ A ist und A unter
Addition der Eins abgeschlossen ist, d.h.:
∀r : r ∈ A =⇒ (r + 1) ∈ A
Wir nennen die Elemente von
N := D({A ∈ P(K) A ist induktiv})
natürliche Zahlen. Wir setzen
2
3
4
5
6
:=
:=
:=
:=
:=
1+1
2+1=1+1+1
3+1=1+1+1+1
4+1=1+1+1+1+1
5+1=1+1+1+1+1+1
Aufgabe 7.2. Zeige: 2 + 2 = 4 und 2 · 3 = 6.
Aufgabe 7.3. Zeige:
1. N ist eine induktive Teilmenge von K.
2. Ist A ⊆ N induktiv, so ist schon A = N.
Satz 7.4. Die Summe zweier natürlicher Zahlen ist eine natürliche Zahl.
Beweis. Wir definieren die Teilmenge A ⊆ N wiefolgt:
A := {m ∈ N ∀n ∈ N : m + n ∈ N}
Offensichtlich ist A = N zu zeigen. Dazu argumentieren wir, daß A induktiv ist.
(Vollständige Induktion)
39
Zunächst ist 0 ∈ A, denn für jedes n ∈ N ist:
0+n = n ∈N
Nun zur Abgeschlossenheit unter Addition von Eins: Sei m ∈ A. Zu zeigen ist
m + 1 ∈ A, d.h.
(m + 1) + n ∈ N
∀n ∈ N
Nun ist aber für n ∈ N auch n + 1 ∈ N, weil N induktiv ist. Damit haben wir:
(m + 1) + n = m + (1 + n) = m + (n + 1) ∈ N
q.e.d.
Aufgabe 7.5. Zeige, daß das Produkt mn zweier natürlicher Zahlen wieder eine
natürliche Zahl ist.
Beobachtung 7.6. Keine natürliche Zahl ist negativ.
Beweis. Sei A := {m ∈ N 0 ≤ m}. Wir zeigen, daß A induktiv ist. Weil die
Kleiner-Gleich-Relation reflexiv ist, ist 0 ≤ 0 und somit 0 ∈ A. Sei nun m ∈ A.
Dann ist nach (6.9):
0≤m
=⇒
0≤1≤m+1
q.e.d.
Lemma 7.7. Für jede natürliche Zahl m ∈ N gilt:
0 6= m
=⇒
m−1∈ N
Damit gilt für m ∈ N auch
1≤m
=⇒
0 6= m
=⇒
m−1∈N
=⇒
0≤m−1
=⇒
1≤m
und die Bedingungen sind alle zueinander äquivalent.
Beweis. Wir setzen A := {m ∈ N 0 = m oder m − 1 ∈ N} und zeigen, daß A
induktiv ist. Offenbar ist 0 ∈ A. Wir beobachten außerdem, daß 1 ∈ A ist, weil
1 − 1 = 0 ∈ N ist.
Sei nun m ∈ A. Zu zeigen ist m + 1 ∈ A. Ist m = 0, so ist m + 1 = 1 ∈ A. Ist m 6= 0,
so folgt aus m ∈ A, daß m − 1 ∈ N ist. Dann aber ist (m + 1) − 1 = m ∈ N und
somit m + 1 ∈ A.
q.e.d.
Satz 7.8. Für zwei natürliche Zahlen m und n gilt:
m≤n
m<n
⇐⇒
⇐⇒
n−m∈N
m+1≤n
Beweis. Für die obere Äquivalenz beobachten wir zunächst die Implikationen
n − m ∈ N =⇒ 0 ≤ n − m
=⇒ 0 + m ≤ n
=⇒ m ≤ n
40
Für jede natürliche Zahl m definieren wir die Teilmenge:
Am := {n ∈ N m ≤ n
=⇒
n − m ∈ N}
und nun:
A := {m ∈ N Am = N}
Wir zeigen, daß A induktiv ist. Wegen
A0 = {n ∈ N n − 0 ∈ N} = N
ist 0 ∈ A. Nach Lemma (7.7) ist auch A1 = N und somit 1 ∈ A.
Sei nun m ∈ A. Zu zeigen ist, m + 1 ∈ A, d.h.:
m+1≤n
n − (m + 1) ∈ N
=⇒
∀n ∈ N
Ist m + 1 ≤ n, so folgt aus 0 ≤ m:
1≤m+1≤n
und damit nach Lemma (7.7):
n − 1 ∈ N = Am
Damit ist aber:
m + 1 ≤ n =⇒ m ≤ n − 1
=⇒ (n − 1) − m ∈ N
Damit ist n − (m + 1) = (n − 1) − m ∈ N. Das beweist die obere Äquivalenz.
Die untere folgt formal mit Hilfe der Äquivalenzen aus Lemma (7.7):
m < n ⇐⇒
⇐⇒
⇐⇒
⇐⇒
⇐⇒
m ≤ n und m 6= n
n − m ∈ N und n − m 6= 0
n − m ∈ N und 1 ≤ n − m
n − (m + 1) ∈ N
m+1≤n
Dabei folgt die Implikation
n − (m + 1) ∈ N
=⇒
n−m∈N
aus der Abgeschlossenheit von N unter Addition von Eins.
q.e.d.
Satz 7.9 (Wohlordnungsprinzip). Jede nicht-leere Menge M natürlicher Zahlen
hat ein kleinstes Element a ∈ M, d.h. a ≤ m für jedes m ∈ M.
41
Beweis. Sei M ⊆ N eine Teilmenge ohne kleinstes Element. Wir haben zu zeigen,
daß M = ∅ ist. Dazu betrachten wir die Menge
A := {n ∈ N n ≤ m ∀m ∈ M}
aller unteren Schranken von M.
Zunächst beobachten wir M ∩ A = ∅, denn wenn M eine untere Schranke seiner
selbst enthielte, so wäre diese ein kleinstes Element von M.
Ferner ist 0 eine untere Schranke von N und damit auch von M ⊆ N. Mithin ist
0 ∈ A.
Schließlich ist A induktiv, denn wir haben
n ∈ A =⇒
=⇒
=⇒
=⇒
∀m ∈ M : n ≤ m
∀m ∈ M : n < m
∀m ∈ M : n + 1 ≤ m
n+1∈A
weil A ∩ M = ∅
Also ist A = N und darum ∅ = A ∩ M = N ∩ M = M.
q.e.d.
Satz 7.10 (Archimedisches Prinzip). Ist K ordnungs-vollständig, so gibt es zu
jedem Element r ∈ K gibt es eine natürliche Zahl m ∈ N mit r ≤ m.
Beweis. Wir führen die Annahme der Negation zum Widerspruch. Sei also r ∈ K
mit r 6≤ m für alle natürlichen Zahlen m. Wir bilden die beiden Mengen
L := {s ∈ K ∃m ∈ N : s ≤ m}
R := {s ∈ K s 6∈ L}
Zunächst ist 0 ∈ L und r ∈ R. Außerdem ist L ∩ R = ∅ und L ∪ R = K. Schließlich
sei s ∈ L und s′ ∈ R. Zu s gibt es eine natürliche Zahl m ∈ N mit s ≤ m. Wäre also
s′ ≤ s, so wäre s′ ≤ m und damit s′ ∈ L. Also ist s′ 6≤ s. Nach Totalität der Ordnung
folgt s ≤ s′ . Damit haben wir gesehen, daß (L, R) ein Dedekindscher Schnitt ist.
Es gibt also ein t mit t − 21 ∈ L und t + 12 ∈ R. Sei nun m eine natürliche Zahl mit
t − 12 ≤ m, so wäre t + 21 ≤ m + 1 ∈ N und damit t + 12 ∈ L.
q.e.d.
Satz und Definition 7.11 (Rekursionssatz). Sei M eine Menge, m0 ∈ M ein
Element und F : N × M → M eine Abbildung. Dann gibt es genau eine Abbildung
f : N −→ M
die folgenden zwei Bedingungen genügt:
f (0) = m0
f (n + 1) = F (n, f (n))
∀n ∈ N
Wir sagen, f sei durch (3) und (4) induktiv oder rekursiv definiert.
42
(3)
(4)
Beweis. Wir beginnen mit der Eindeutigkeit. Seien also f1 und f2 zwei
Abbildungen, die beide durch dieselben Rekursionsgleichungen festgelegt sind. Wenn
die Verbrechermenge
{x ∈ N f1 (x) 6= f2 (x)}
nicht-leer wäre, hätte sie ein kleinstes Element n. Nun ist n > 0 wegen
f1 (0) = m0 = f2 (0)
Dann aber ist n − 1 ∈ N und somit
f1 (n) = F (n − 1, f1 (n − 1)) = F (n − 1, f2 (n − 1)) = f2 (n)
weil sonst n − 1 ein kleinerer Verbrecher wäre.
Zur Existenz nennen wir eine Teilmenge A ⊆ N × M F -induktiv, wenn gilt:
(0, m0 ) ∈ A
(n, m) ∈ A =⇒ (n + 1, F (n, m)) ∈ A
Man sieht auf ausgetretenen Pfaden, daß der Durschnitt F -induktiver Mengen
induktiv ist. Wir definieren die Relation f zwischen N und M durch die Forderung,
daß ihr Graph R der Durschnitt aller F -induktiven Teilmengen von N × M sei. Wir
behaupten, daß f eine Funktion von N nach M ist.
Dazu zeigen wir, daß die Menge
B := {x ∈ N ∃!y ∈ M : (n, y) ∈ R}
eine induktive Teilmenge von N ist.
Zunächst ist 0 ∈ B. Die Existenz eines y ∈ M mit (0, y) ∈ R ist klar, weil y = m0 ein
offensichtlicher Kandidat ist. Sorgen müssen wir uns allerdings um die Eindeutigkeit
dieses y. Wäre m′ ∈ M neben m0 ein weiteres Element mit (0, m′ ) ∈ R, so wäre
aber R \ {(0, m′ )} eine kleinere F -induktive Teilmenge von N × N.
Nun kommen wir zur Abgeschlossenheit von B gegenüber der Addition von 1. Sei
also n ∈ B, d.h., es gibt genau ein y ∈ M mit (n, y) ∈ R. Dann ist
(n + 1, F (n, y)) ∈ R. Gibt es andererseit ein weiteres y ′ 6= F (n, y) mit (n + 1, y ′) ∈ R
so könnten wir dieses Paar aus R entfernen, denn seine Anwesenheit ist nicht durch
Induktivität erzwungen: Es gibt kein Paar (n, x) ∈ R mit y ′ = F (n, x), denn der
einzige Partner von n in R ist y und daraus ergibt sich bloß das Element F (n, y) als
Partner von n + 1. Den hatten wir aber schon, und y ′ sollte ein weiterer möglicher
Partner sein.
q.e.d.
Bemerkung 7.12. Auch Funktionen auf den von Neumann-Zahlen lassen sich ganz
analog induktiv definieren. Die entsprechende Aussage lautet:
Sei M eine Menge, m∅ ∈ M ein Element und F : M → M eine
Selbstabbildung. Dann gibt es genau eine Abbildung
f : N∗ −→ M
43
die folgenden zwei Bedingungen genügt:
f (∅) = m∅
∀µ ∈ N∗
f µ+ = F (f (µ))
Sie wird genauso bewiesen wie der Rekursionssatz (7.11).
Beispiel 7.13. Die Potenzen der reellen Zahl x ∈ R rekursiv erklärt durch:
x0 = 1
xm+1 = x · xm
Aufgabe 7.14. Zeige: xm+n = xm · xn
Aufgabe 7.15. Sei −1 ≤ x ∈ R. Zeige, daß für jede natürliche Zahl m ∈ N gilt:
1 + mx ≤ (1 + x)m
Die natürlichen Zahlen liefern neben den von Neumann-Zahlen ein zweites Model
für das Zählen.
Definition 7.16. Für eine natürliche Zahl m ∈ N setzen wir
[m] := {x ∈ N x < m} = {0, 1, . . . , m − 1}
Dies ist der zu m gehörige Hauptanfang von N.
Satz und Definition 7.17. Die Rekursionen
f (0) = ∅
f (m + 1) = f (m)+
g(∅) = 0
g(µ+ ) = g(µ) + 1
definieren zueinander inverse Bijektionen f : N → N∗ und g : N∗ → N. Jede
von Neumann-Zahl µ ist gleichmächtig zu [g(µ)]. Darum gibt es zu jeder endlichen
Menge M genau eine natürliche Zahl |M| ∈ N, so daß [|M|] und M gleichmächtig
sind. Wir nennen |M| die Größe von M.
Beweis. Die Verkettungen f ◦ g und g ◦ f erfüllen rekursive Definitionen:
(f ◦ g)(∅) = f (0) = ∅
(f ◦ g) µ+ = f (g(µ) + 1) = (f ◦ g)(µ)+
und
(g ◦ f )(0) = g(∅) = 0
(g ◦ f )(m + 1) = g f (µ)+ = (g ◦ f )(µ) + 1
44
Die Eindeutigkeitsaussage des Rekursionssatzes impliziert daher:
g ◦ f = idN
f ◦ g = idN∗
Also sind f und g zueinander inverse Bijektionen (3.18).
Nun zeigen wir, daß jede von Neumann-Zahl µ gleichmächtig zu [g(µ)] ist. Dazu
verwenden wir die Identität
[m + 1] = {x ∈ N x < m + 1} = {x ∈ N x ≤ m}
= {x ∈ N x < m oder x = m} = [m] ∪ {m}
Wir gehen mit Induktion vor. Sei also
A := {µ ∈ N∗ µ ist gleichmächtig zu [g(µ)]} ⊆ N∗
Dann ist ∅ ∈ A, denn es ist [g(∅)] = [0] = ∅.
Sei nun µ ∈ A. Wir setzen m := g(µ). Nach Definition von A gibt es eine Bijektion
h : µ → [m]. Wir setzen h zu einer Abbildung µ+ = µ ∪ {µ} → [m] ∪ {m} = [m + 1]
fort durch die Setzung µ 7→ m. Wegen m 6∈ [m] ist die Fortsetzung injektiv und
surjektiv. Damit ist µ+ ∈ A.
Also ist A induktiv.
q.e.d.
Wir erwarten intuitiv, daß Addition etwas mit dem Vereinigen von Mengen zu tun
haben sollte:
Aufgabe 7.18. Seien M und L endliche Mengen. Zeige:
|M ∪ L| ≤ |M| + |L|
Gleichheit tritt genau dann ein, wenn M und L disjunkt sind.
7.2
Die ganzen Zahlen
Definition 7.19. Elemente der Menge
Z := {r ∈ K ∃m, n ∈ N : r = m − n} = {m − n m, n ∈ N}
heißen ganze Zahlen.
Satz 7.20. Die ganzen Zahlen Z sind abgeschlossen gegenüber Addition,
Subtraktion und Multiplikation: Summe, Differenz und Produkt zweier ganzer Zahlen
sind wieder ganze Zahlen.
Beweis. Seien a1 und a2 ganze Zahlen. Dann gibt es natürliche Zahlen
m1 , n1 , m2 , n2 ∈ N mit
a1 = m1 − n1
und
45
a2 = m2 − n2
Dann ist
a1 + a2 = (m1 − n1 ) + (m2 − n2 ) = (m1 + m2 ) − (n1 + n2 ) ∈ Z
denn m1 + m2 ∈ N und n1 + n2 ∈ N nach Satz (7.4). Genauso argumentieren wir für
die Differenz
a1 − a2 = (m1 − n1 ) − (m2 − n2 ) = (m1 + n2 ) − (n1 + m2 ) ∈ Z
Für das Produkt ist
a1 a2 = (m1 − n1 )(m2 − n2 ) = (m1 m2 + n1 n2 ) − (m1 n2 + n1 m2 ) ∈ Z
q.e.d.
Proposition 7.21. Sei a ∈ Z. Dann ist a ∈ N oder −a ∈ N.
Beweis. Sei a = m − n für m, n ∈ N. Nach Totalität der Kleiner-Gleich-Relation ist
m ≤ n oder n ≤ m. Nach Satz (7.8) ist im ersten Fall ist −a = n − m ∈ N und im
zweiten Fall a = m − n ∈ N.
q.e.d.
Aufgabe 7.22. Seien a und b ganze Zahlen. Zeige:
a≤b
7.3
⇐⇒
b−a∈N
Die rationalen Zahlen
Definition 7.23. Die Elemente der Menge
a
Q = q ∈ K ∃a, b ∈ Z : q =
b
=
a
a, b ∈ Z und b 6= 0
b
heißen rationale Zahlen oder Brüche. In einer Darstellung
q=
a
b
heißt a der Zähler und b der Nenner.
Bemerkung 7.24. Mit (7.21) sehen wir, daß jede rationale Zahl eine Darstellung
hat, in der der Nenner eine natürliche Zahl ist, denn:
−a
a
=
b
−b
Satz 7.25. Q ist abgeschlossen unter den vier Grundrechenarten. Genauer: sind q
und p rationale Zahlen, so sind auch die Summe q + p, die Differenz q − p und das
Produkt qp wieder rationale Zahlen. Ist überdies p 6= 0, so existiert der Quotient pq
und ist wieder eine rationale Zahl.
Q erbt alle Rechenregeln und die Ordnugnsrelation von K. Insbesondere ist Q selbst
ein angeordneter Körper.
46
Beweis. Die Behauptung folgt mit Satz (7.20) aus den leicht zu verifizierenden
Rechenregeln:
a1 a2
a1 b2 ± b1 a2
±
=
b1
b2
b1 b2
a1 a2
a1 a2
·
=
b1 b2
b1 b2
a1 a2
a1 b2
=
b1 b2
b1 a2
q.e.d.
Aufgabe 7.26. Leite die Regeln der Bruchrechnung aus den Körperaxiomen her.
Wir können die Ordnung auf Q ohne Rückgriff auf die Ordnung in K ausdrücken:
Beobachtung 7.27. Für zwei rationale Zahlen q1 =
positiven Nennern b1 , b2 ∈ N, gilt:
a1
b1
und q2 =
a2
,
b2
dargestellt mit
a1
a2
≤
b1
b2
a1
a2
⇐⇒ b1 b2 ≤ b1 b2
b1
b2
⇐⇒ b2 a1 ≤ b1 a2
⇐⇒ b1 a2 − b2 a1 ∈ N
q1 ≤ q2 ⇐⇒
denn 0 < b1 b2 . Damit ist Größenvergleich in Q auf die Grundrechenarten
zurückgeführt.
q.e.d.
Bemerkung 7.28. Rationale Zahlen in dem Körper K sind diejenigen Elemente,
die sich durch fortgesetzte Anwendung der Grundrechenarten aus den
ausgezeicheten Elementen 0 und 1 bilden lassen. Ausdrücke der Form
−(1 + 1 + 1 + 1 + 1)
1+1+1
lassen sich in jedem angeordneten Körper interpretieren. Die Bedeutung von
Beobachtung (7.27) liegt darin, daß der Größenvergleich für Ausdrücke dieser Form
unabhängig davon ist, in welchem angeordneten Körper wir sie ausrechnen. Die
Ungleichung
1+1
1
≤
1+1
1+1+1
gilt in jedem angeordneten Körper.
Formal läßt sich das wiefolgt beschreiben: Seien K und K ′ zwei angeordnete
Körper. Vermöge (7.17) erhalten wir Bijektionen
NK ←→ N∗ ←→ NK ′
47
die mit der Addition und Multiplikation verträglich sind. Dadurch wird eine
natürliche Bijektion
QK ←→ QK ′
induziert, die mit allen Grundrechenarten verträglich ist. Es gibt genau eine solche
Bijektion, und sie automatisch mit der Anordnung verträglich (siehe 7.27).
Definition 7.29. Ein angeordneter Körper K heißt archimedisch, wenn zwischen je
zwei verschiedenen Elementen α < β eine rationale Zahl liegt, d.h., wenn es ein
q ∈ QK mit α < q < β gibt.
Beobachtung 7.30. Sei K ein archimedischer Körper und α ∈ K ein beliebiges
Element. Dann ist
sup {ql ∈ QK ql < α} = α = inf {qr ∈ QK α < qr }
Denn nach Definition ist α eine untere Schranke von {qr ∈ QK α < qr }. Eine
größere kann es aber nicht geben, denn zwischen ihr und α müßte ja noch eine
rationale Zahl liegen.
q.e.d.
Beobachtung 7.31. In einem archimedisch angeordneten Körper K gilt das
archimedische Prinzip:
Zu jedem Element α gibt es eine natürliche Zahl m ∈ NK mit α ≤ m.
> 0, mit natürlichen
Beweis. Nur der Fall 0 < α muß behandelt werden. Sei m
n
Zahlen m, n ∈ NK als Zähler und Nennen, eine rationale Zahl zwischen α und α + 1.
Dann ist
m
α<
<m
q.e.d.
n
Proposition 7.32 (Rationale Approximierbarkeit). In einem archimedischen
Körper läßt sich jedes Element beliebig genau durch rationale Elemente
approximieren: Sei K ein archimedischer Körper und α ∈ K beliebig. Dann gibt es
zu jedem Körperelement ε > 0 rationale Zahlen ql , qr ∈ QK mit:
ql < α < qr < ql + ε
Beweis. Wir wählen ql rational mit α −
α < qr < α + 2ε .
ε
2
< ql < α und qr rational mit
q.e.d.
Satz 7.33. Jeder ordnungs-vollständige Körper K ist archimedisch.
Beweis. Seien α < β zwei verschiedene Elemente von K. Haben α und β
verschiedenes Vorzeichen, so liegt 0 dazwischen. Wir betrachten den Fall 0 ≤ α < β.
Der verbleibende Fall α < β ≤ 0 ist symmetrisch.
1
Nach dem archimedischen Prinzip gibt es m ∈ NK mit 0 < β−α
< m. Dann folgt
0 ≤ mα < mα + 1 < mβ
48
Ebenfalls mit dem archimedischen Prinzip gibt es ein n ∈ NK mit
M := {x ∈ NK x < mβ} ⊆ [n]
Die Menge M ist also endlich und hat als endliche durch ≤ angeordnete Menge ein
größtes Element m+ , d.h., m+ < mβ ≤ m+ + 1. Es folgt, mα < m+ . Schließlich ist
q.e.d.
darum α < mm+ < β.
Aufgabe 7.34. In einem angeordneten Körper K ist eine Teilmenge M ⊆ NK
genau dann endlich, wenn sie nach oben durch ein Element von NK beschränkt ist.
Hierfür spielt also keine Rolle, ob K archimedisch angeordnet ist. Vergleiche
aber (7.35).
Aufgabe 7.35. Zeige: In einem archimedisch angeordneten Körper K ist eine
Teilmenge M ⊆ NK genau dann endlich, wenn sie nach oben durch ein Element von
K beschränkt ist.
49
8
Die Eindeutigkeit der reellen Zahlen
Die Diskussion des vorigen Abschnitts, insbesondere (7.27) und (7.28), können wir
wiefolgt zusammenfassen:
Satz 8.1. Seien K und K ′ zwei angeordnete Körper. Dann gibt es genau einen
Körpermorphismus von QK nach K ′ . Sein Bild ist QK ′ und er ist automatisch
anordnungserhaltend.
q.e.d.
Korollar 8.2. Seien K und K ′ zwei angeordnete Körper. Dann sind die Teilkörper
QK und QK ′ auf eindeutige Weise isomorph, und die Isomorphie ist eine Isomorphie
angeordneter Körper.
q.e.d.
Lemma 8.3. Seien K und K ′ angeordnete Körper. Zusätzlich sei K ′ archimedisch.
Dann gibt es höchstens einen Morphismus angeordneter Körper ϕ : K −→ K ′ .
Beweis. Seien ϕ : K → K ′ und ψ : K → K ′ zwei Morphismen angeordneter
Körper. Wir haben zu zeigen, daß die Abbildungen ϕ und ψ (werteverlaufs)gleich
sind. Sei also ferner α ∈ K beliebig. Zu zeigen ist nun noch:
ϕ(α) = ψ(α)
Wäre aber ϕ(α) < ψ(α), so gäbe es eine rationale Zahl q ∈ QK mit
ϕ(α) < ϕ(q) = ψ(q) < ψ(α)
und es folgte der Widerspruch
α<q<α
Den verbleibenden Fall ψ(α) < ϕ(α) behandelt man analog.
q.e.d.
Satz 8.4 (Eindeutigkeit der reellen Zahlen). Seien K und K ′ archimedische
Körper. Zusätzlich sei K ′ ordnungs-vollständig. Dann gibt es genau einen
Morphismus angeordneter Körper ϕ : K −→ K ′ .
Sind insbesondere K und K ′ beide ordnungs-vollständig, so sind sie isomorph, und
zwar vermöge eines eindeutig bestimmten Isomophismus. Kurz: die reellen Zahlen
sind eindeutig bis auf eindeutige Isomorphie.
Beweis. Die Eindeutigkeit folgt aus Lemma (8.3).
Weil für jedes x ∈ K die Menge {q ∈ QK x < q} nach unten beschränkt ist, wird
durch
ϕ : K −→ K ′
x 7→ inf Mx
mit Mx := {q ∈ QK ′ q ∈ QK mit x < q}
ist eine Abbildung ϕ : K → K ′ erklärt. Der Übergang q 7→ q ist die
Uminterpretation rationaler Zahlen von einem umgebenden Körper zum andern
(siehe 7.28).
50
Es bleibt zu zeigen, daß ϕ ein Morphismus angeordneter Körper ist.
Zunächst setzt ϕ die Umschreibeabbildung“ fort: es gilt ϕ(q) = q für q ∈ QK .
”
Außerdem respektiert ϕ die Anordnung. Ist nämlich x < y in K, so gibt es rationale
Zahlen q, q ′ <∈ QK mit x < q < q ′ < y, denn K ist archimedisch angeordnet. Dann
aber folgt ϕ(x) ≤ q < q ′ ≤ ϕ(y).
Wir können beide Eigenschaften von ϕ : K → K ′ auch wiefolgt ausdrücken: Haben
wir eine untere und eine obere rationale Schranke für ein Element x ∈ K
ql < x < qr
so sind die entsprechenden rationalen Elemente ql und qr untere und obere
Schranken für ϕ(x) ∈ K ′ :
ql < ϕ(x) < qr
Nun zeigen wir Veträglichkeit mit der Addition, d.h.:
ϕ(x + y) = ϕ(x) + ϕ(y)
Grundsätzlich gibt es drei Möglichkeiten:
ϕ(x + y) > ϕ(x)+ϕ(y)
oder ϕ(x + y) < ϕ(x)+ϕ(y)
oder ϕ(x + y) = ϕ(x)+ϕ(y)
Um Gleichheit zu zeigen, genügt es also, die beiden Alternativen jeweils zum
Widerspruch zu führen.
Wir führen die Annahme ϕ(x + y) > ϕ(x) + ϕ(y) zum Widerspruch. In diesem Fall
gibt es nämlich eine rationale Zahl q ∈ K mit:
0 < q < ϕ(x + y) − (ϕ(x) + ϕ(y))
und nach (7.32) rationale Zahlen qx , qy ∈ K mit:
qx −
q
< x < qx
2
und
qy −
q
< y < qy
2
woraus dann folgt:
qx + qy − q < x + y < qx + qy
Da ϕ ordnungserhaltend ist, folgt:
qx −
q
< ϕ(x) < qx
2
und qy −
q
< ϕ(y) < qy
2
und qx +qy −q < ϕ(x + y) < qx +qy
Das aber widerspricht der Annahme ϕ(x) + ϕ(y) + q < ϕ(x + y).
Die Annahme ϕ(x + y) < ϕ(x) + ϕ(y) widerlegt man ganz ähnlich. Es bleibt als
Übungsaufgabe (8.6) dem Leser überlassen.
Das Argument für die Multiplikativität von ϕ ist ähnlich, wird aber durch
Vorzeichen verkompliziert. Wir zeigen nur
0 < x, y ∈ K
=⇒
51
ϕ(xy) = ϕ(x) ϕ(y)
Wieder gibt es drei Möglichkeiten:
ϕ(xy) > ϕ(x) ϕ(y)
oder ϕ(xy) < ϕ(x) ϕ(y)
oder ϕ(xy) = ϕ(x) ϕ(y)
und wir widerlegen hier lediglich ϕ(xy) > ϕ(x) ϕ(y). In diesem Fall gäbe es ein
q ∈ QK mit 0 < q < ϕ(xy) − ϕ(x) ϕ(y). Wir wählen ferner eine rationale Zahl
q ′ > x + y und eine rationale Zahl ε ∈ K mit:
q
0<ε< ′
2q
0 < ε < q′
Mit (7.32) gibt es rationale Zahlen qx und qy mit
0 < qx < x < qx + ε
und
0 < qy < y < qy + ε
Dann folgt:
qx qy < xy < (qx + ε)(qy + ε) = qx qy + ε(qx + qy ) + ε2
< qx qy + εq ′ + ε2 < qx qy + 2εq ′ < qx qy + q
Dann aber ist
qx qy < ϕ(xy) < qx qy + q
(5)
und mit analoger Rechnung folgt aus
0 < qx < ϕ(x) < qx + ε
und
0 < qy < ϕ(y) < qy + ε
die Abschätzung:
qx qy < ϕ(x) ϕ(y) < qx qy + q
(6)
Zusammengenommen widersprechen (5) und (6) der Annahme
ϕ(x) ϕ(y) + q < ϕ(xy).
Für andere Vorzeichen unterscheidet man Fälle und führt sie auf die bisher erzielten
Ergebnisse zurück. Wir haben schon gesehen, daß ϕ : K −→ K ′ ordnungserhaltend,
additiv, multiplikativ auf positiven Zahlen ist. Als additive Abbildung erhält ϕ das
neutrale Element der Addition und additive Inverse:
ϕ ist additiv =⇒
(
ϕ(0) = 0
ϕ(−x) = −ϕ(x)
Wegen 0x = 0 folgt dann zunächst Multiplikativität auf nicht-negativen Zahlen:
0 ≤ x, y ∈ K
=⇒
ϕ(xy) = ϕ(x) ϕ(y)
Ist nun x < 0 und y ≥ 0, so ist −x > 0 und wir haben:
ϕ(xy) = −ϕ(−xy) = −ϕ(−x) ϕ(y) = ϕ(x) ϕ(y)
Ist schließlich y < 0, so rechnen wir analog:
ϕ(xy) = −ϕ(x(−y)) = −ϕ(x) ϕ(−y) = ϕ(x) ϕ(y)
wobei diese Rechnung mit der Zeile vorher für beliebiges x ∈ K gültig ist.
52
q.e.d.
Bemerkung 8.5. Dieser Beweis vereinigt einige typische Merkmale von Beweisen,
wie wir sie noch häufiger sehen werden. Da ist zum einem das Motiv, Größen von
beiden Seiten zu approximieren. Die Genauigkeit ε fällt dabei typischer Weise vom
Himmel. Es ist geschickt gewählt, so daß alles am Ende hinkommt. Ein weiteres
Motiv ist, die Gleichheit zweier Größen dadurch zu zeigen, daß beide alternativen
Ungleichungen (durch hinreichende genaue Approximation) zum Widerspruch
geführt werden.
Dieser Beweis ist sogar etwas komplizierter als andere Beweise der Analysis, weil wir
nur rationale Zahlen von einem Körper K zum anderen K ′ uminterpretieren“
”
können. Weil der Beweis sich nicht für einen Körper entscheiden kann, müssen wir
bei der Approximation darauf achten, nur rationale Zahlen zu verwenden. Ab jetzt
führen wir Beweise aber immer in R, so daß Uminterpretation keine Rolle mehr
spielt. Die rationalen Zahlen verlieren dann ihre Sonderstellung und alles wird
einfacher.
Aufgabe 8.6. Führe im Kontext des Beweises von (8.4) die Annahme
ϕ(x + y) < ϕ(x) + ϕ(y)
zum Widerspruch.
Aufgabe 8.7. Sei ϕ : K → K ′ eine additive Abbildung, d.h., es gelte
ϕ(x + y) = ϕ(x) + ϕ(y)
für alle x, y ∈ K. Zeige:
1. ϕ(0) = 0
2. ϕ(−x) = −ϕ(x) für alle x ∈ K.
Aufgabe 8.8. Sei K ein ordnungs-vollständiger Körper undA, B ⊆ K seien zwei
nicht-leere Teilmengen mit
x≤y
∀x ∈ A ∀y ∈ B
Nach (6.22) hat dann A ein Supremum und B ein Infimum.
Zeige, daß das Supremum von A nicht größer ist als das Infimum von B:
sup A ≤ inf B
Aufgabe 8.9. Sei K ein ordnungs-vollständiger Körper undA, B ⊆ K seien zwei
nicht-leere Teilmengen mit
x≤y
∀x ∈ A ∀y ∈ B
Nach (6.22) hat dann A ein Supremum und B ein Infimum.
Zeige, daß folgende Bedingungen äquivalent sind:
53
1. Das Supremum von A und das Infimum von B stimmen überein:
sup A = inf B
2. Zu jedem Körperelement ε > 0 gibt es ein Paar x ∈ A und y ∈ B mit
0≤y−x< ε
3. Zu jedem rationalen Körperelement ε > 0 gibt es ein Paar x ∈ A und y ∈ B
mit
0≤y−x< ε
54
9
Folgen und Konvergenz
Definition 9.1 (Zahlenfolge). Eine Abbildung a : N → R heißt reelle Zahlenfolge
oder Folge reeller Zahlen. Traditionell bezeichnet man den Wert von a an der Stelle
m als m-tes Glied der Folge oder auch als Folgenterm. Ferner ist dafür die Notation
am anstelle von a(m) üblich. Anstelle der Funktionsnotation a : N → R verwendet
man üblicherweise die Familiennotation:
(am )m∈N
Ich probiere hier etwas anderes: Mit der Notation a⋆ notiere ich die Folge und mit ai
ihren Wert an der Stelle i.
Bemerkung 9.2. Der Unterschied zwischen Funktionen und Zahlen wird in der
Notation normalerweise dadurch ausgedrückt, daß für Funktionen Buchstaben aus
der Mitte des Alphabets verwendet werden, während Zahlen mit Buchstaben von
den Rändern bezeichnet werden. Das Bedürfnis, in der Notation durch zusätzlich
Dekoration den Unterschied zwischen Zahlen und Folgen deutlich zu machen, rührt
von dem Bedürfnis, für Folgen auch Buchstaben am Rand des Alphabets zu
verwenden (gewissermaßen um daran zu erinnern, daß jeder Folgenterm eine Zahl
ist).
Definition 9.3. Eine Folge a⋆ reeller Zahlen heißt nach unten beschränkt, wenn ihr
Bild (die Folge ist eine Funktion!) eine nach unten beschränkte Teilmenge von R ist.
Entsprechend heißt die Folge a⋆ nach oben beschränkt, wenn ihr Bild nach oben
beschränkt ist. Eine Folge, die nach unten und nach oben beschränkt ist, heißt
beschränkt.
Die Begriffe Supremum, kleinste obere Schranke, Infimum und
größte untere Schranke werden ebenso vom Bild der Folge auf die Folge selbst
übertragen.
9.1
Häufungspunkte und Grenzwerte
Definition 9.4 (Betrag). Durch
|⋆| : R −→ R
x 7→

x
−x
für 0 ≤ x
für x < 0
wird die Betragsfunktion auf den reellen Zahlen erklärt. Wie die ⋆-Notation
andeutet, notieren wir den Betrag von x mit |x|.
Definition 9.5 (Umgebung). Wir führen folgende Sprechweise ein: Seien r und s
reelle Zahlen und sei ε eine reelle Zahl mit 0 < ε. Wir sagen r
55
liege in der ε-Umgebung von s, wenn |r − s| < ε ist. Implizit in dieser Sprechweise
steck die Definition der ε-Umgebung als Teilmenge von R. Die Menge
Bε (s) := {r ∈ R |r − s| < ε}
ist die ε-Umgebung von s.
Aufgabe 9.6. Seien x, y, z, ε, ε′ ∈ R mit ε > 0 und ε′ > 0. Zeige:
1. |x + y| ≤ |x| + |y|
2. |x + y| ≥ |x| − |y|
3. Seien y ∈ Bε (x) und z ∈ Bε′ (y). Dann ist z ∈ Bε+ε′ (x).
Definition 9.7 (Häufungspunkt). Eine Zahl λ ∈ R heißt Häufungspunkt der
Folge a⋆ reeller Zahlen, wenn in jeder (noch so kleinen) ε-Umgebung von λ
unendlich viele Folgenglieder liegen:
∀ε > 0 :
{i ∈ N |ai − λ| < ε} ist unendlich
Definition 9.8 (Grenzwert und Konvergenz). Eine Zahl λ ∈ R heißt
Grenzwert oder Limes der Folge a⋆ reeller Zahlen, wenn in jeder (noch so kleinen)
ε-Umgebung von λ fast alle (d.h. alle bis auf höchstens endlich viele) Folgenglieder
liegen:
∀ε > 0 : {i ∈ N |ai − λ| <
6 ε} ist endlich
In diesem Fall sagen wir auch, die Folge a⋆ konvergiere gegen den Grenzwert λ. Die
Bedingung läßt sich auch wiefolgt ausbuchstabieren:
∀ε > 0 ∃h ∈ N ∀i ≥ h :
|ai − λ| < ε
Eine Folge, die (gegen mindestens einen Grenzwert) konvergiert heißt konvergent.
Wir schreiben dafür
λ = lim ai = lim a⋆
⋆→∞
i→∞
Eine Folge, die gegen keinen Wert konvergiert, heißt divergent. Eine Folge heißt
Nullfolge, wenn sie gegen 0 konvergiert.
Bemerkung 9.9. Für Konvergenz gegen λ sind in der Definition zwei Bedingungen
angeben. Wir überlegen besser, daß sie äquivalent sind. Die zweite Bedingung sagt,
daß {i ∈ N |ai − λ| <
6 ε} nach oben beschränkt ist durch h. Die erste Bedingung
sagt einfach die Endlichkeit dieser Menge aus. Aber nach (7.35) sind Beschränktheit
und Endlichkeit für Mengen natürlicher Zahlen äquivalent.
Aufgabe 9.10. Zeige: Jeder Grenzwert einer Folge ist auch Häufungspunkt dieser
Folge.
56
Bemerkung 9.11 (Eindeutigkeit des Grenzwertes). Eine reelle Zahlenfolge a⋆
hat höchstens einen Grenzwert. Genauer gilt: hat die Folge a⋆ einen Grenzwert, so
hat sie keine weiteren Häufungspunkte.
Beweis. Wir nehmen an, daß λ1 6= λ2 ist. Dann ist ε :=
Mengen
|λ1 −λ2 |
2
> 0 und die beiden
A1 := {i ∈ N |ai − λ1 | < ε}
A2 := {i ∈ N |ai − λ2 | < ε}
sind disjunkt. Ist nun λ1 ein Grenzwert, so enthält A1 fast alle natürlichen Zahlen,
d.h., alle bis auf höchstens endlich viele. Insbesondere ist A2 eine endliche Menge.
Dann aber ist λ2 kein Häufungspunkt.
q.e.d.
Frage 9.12. Warum ist das kein gültiger Beweis für die Eindeutigkeit von
Grenzwerten:
λ1 = lim a⋆
⋆→∞
λ2 = lim a⋆
⋆→∞
=⇒ λ1 = lim a⋆ = λ2
⋆→∞
Und warum sind solche Schlüsse letzlich doch gerechtfertigt?
Bemerkung 9.13. Trotz der Eindeutigkeit von Limiten bleibt die Notation
limi→∞ ai aber etwas tückisch. Ist a⋆ divergent, so ist jede Aussage, die den
Grenzwertausdruck enthält unsinnig. Darin ähnelt diese Notation den Brüchen xy ,
die implizit versichern, daß y 6= 0 ist.
Aufgabe 9.14. Gib ein Beispiel für eine Folge a⋆ , die genau einen Häufungspunkt
hat, aber nicht konvergiert.
Beobachtung 9.15. Für ε > 0 und x ∈ R ist
x ∈ Bε (0)
⇐⇒
|x| < ε
⇐⇒
|x| ∈ Bε (0)
Also ist a⋆ genau dann eine Nullfolge, wenn die Folge |a⋆ | der Beträge eine
Nullfolge ist.
q.e.d.
Aufgabe 9.16. Zeigt das Argument von (9.15) auch: 0 ist Häufungspunkt der
Folge a⋆ genau dann, wenn 0 Häufungspunkt der Folge |a⋆ | ist.
57
9.2
Limes inferior und Limes superior
Definition 9.17. Sei a⋆ eine Folge. Wir betrachten die Mengen
L := {x ∈ R {i ∈ N ai ≤ x} ist endlich}
R := {x ∈ R {i ∈ N x ≤ ai } ist endlich}
Wir nennen L die Linksmenge und R die Rechtsmenge der Folge a⋆ .
Ist die Linksmenge L nicht-leer und nach oben beschränkt, so nennen wir die
kleinste obere Schranke von L den Limes inferior der Folge a⋆ ; und ist die
Rechtsmenge R nicht-leer und nach unten beschränkt, so nennen wir die größte
untere Schranke von R den Limes superior von a⋆ .
Wir notieren Limes inferior und Limes superior, falls sie existieren, mit:
lim inf a⋆ = lim inf ai
⋆→∞
i→∞
bzw.
lim sup a⋆ = lim sup ai
⋆→∞
i→∞
Beobachtung 9.18. Die Linksmenge L einer Folge a⋆ ist nicht-leer genau dann,
wenn a⋆ nach unten beschränkt ist. Entsprechend ist die Rechtsmenge der Folge
nicht-leer genau dann, wenn a⋆ nach oben beschränkt ist.
Beweis. Wir zeigen nur die Linksversion. Ist a⋆ von unten beschränkt durch bL , so
ist jedes x < bL Element der Linksmenge, denn für solche x ist
{i ∈ N ai ≤ x} = ∅
Und die leere Menge ∅ ist endlich.
Sei umgekehrt x ∈ L ein Element der Linksmenge. Dann ist
{ai ai ≤ x}
eine endliche Teilmenge von R und hat also ein kleinstes Element. Dies ist eine
untere Schranke der Folge a⋆ .
q.e.d.
Beobachtung 9.19. Seien L und R die Links- bzw. Rechtsmenge der Folge a⋆ .
Dann ist:
L<R
Das soll heißen: Ist x ∈ L und y ∈ R, dann ist x < y.
Insbesondere:
1. L und R sind disjunkt.
2. Ist L 6= ∅, so ist R nach unten beschränkt.
3. Ist R 6= ∅, so ist L nach oben beschränkt.
Mit (9.18) ergibt sich unmittelbar:
Für eine beschränkte Folge existieren sowohl der Limes inferior als auch
der Limes superior.
58
Beweis. Wir zeigen die Kontraposition:
x 6< y
x 6∈ L oder y 6∈ R
=⇒
Sei also y ≤ x. Dann ist
{i ∈ N ai ≤ x} ∪ {i ∈ N y ≤ ai } = N
Darum ist mindestens eine der beiden Mengen unendlich. Es ist also x 6∈ L oder
y 6∈ R.
q.e.d.
Beobachtung 9.20. Seien L und R die Links- bzw. Rechtsmenge der Folge a⋆ .
Seien ferner x ≤ y reelle Zahlen. Dann gilt:
y ∈ L =⇒ x ∈ L
x ∈ R =⇒ y ∈ R
Insbesondere:
1. Hat L ein Supremum, so enthält L jede Zahl, die kleiner ist als sup L.
2. Hat R ein Infimum, so enthält R jede Zahl, die größer ist als inf R.
Beweis. Wegen x ≤ y gilt
{i ∈ N ai ≤ x} ⊆ {i ∈ N ai ≤ y}
Ist nun y ∈ L so ist die Obermenge endlich und es folgt x ∈ L.
Sei nun x < sup L, dann ist x keine obere Schranke von L und es gibt ein y ∈ L mit
x ≤ y. Wir haben eben gesehen, daß nun x ∈ L folgt.
Die beiden anderen Aussagen argumentiert man symmetrisch.
q.e.d.
Beobachtung 9.21. Existiert der Limes inferior der Folge a⋆ , so ist er
Häufungspunkt von a⋆ . Symmetrisch: Existiert der Limes superior der Folge, so ist
er einer ihrer Häufungspunkte.
Beweis. Sei L die Linksmenge von a⋆ und λ = sup L der Limes inferior. Wir haben
zu zeigen, daß in jeder ε-Umgebung von λ unendlich viele Folgenglieder liegen.
Sei also ε > 0 eine beliebig vorgegebene Genauigkeit. Dann ist λ + 2ε 6∈ L. Also ist
i ∈ N ai ≤ λ +
ε
2
eine unendliche Teilmenge von
{i ∈ N ai < λ + ε}
Andererseits ist λ − ε ∈ L und damit ist
{i ∈ N ai ≤ λ − ε} = {i ∈ N λ − ε 6< ai }
endlich. Also ist
{i ∈ N λ − ε < ai < λ + ε} = {i ∈ N ai < λ + ε} \ {i ∈ N λ − ε 6< ai }
unendlich.
q.e.d.
59
Aufgabe 9.22. Sei a⋆ eine Folge, deren Limes inferior existiert, was ja heißt, daß
die Linksmenge
L := {x ∈ R {i ∈ N ai ≤ x} ist endlich}
nicht-leer und nach oben beschränkt ist. Zeige, daß kein Häufungspunkt von a⋆
kleiner ist als das Supremum sup L. Also: der Limes inferior ist der kleinste
Häufungspunkt, sofern er existiert.
Satz 9.23. Eine Folge konvergiert genau dann, wenn sowohl ihr Limes inferior als
auch ihr Limes superior existieren und übereinstimmen. In diesem Fall geben sie
den Grenzwert der Folge an.
Beweis. Sei a⋆ eine Folge mit Links- und Rechtsmenge L bzw. R.
Für jedes λ ∈ R und jedes ε > 0 gilt:
{i ∈ N ai 6∈ Bε (λ)} = {i ∈ N ai ≤ λ − ε} ∪ {i ∈ N λ + ε ≤ ai }
Also ist {i ∈ N ai 6∈ Bε (λ)} genau dann endlich, wenn sowohl {i ∈ N ai ≤ λ − ε}
als auch {i ∈ N λ + ε ≤ ai } endlich sind. Das zeigt die Äquivalenz der ersten
beiden Bedingungen in folgender Liste von Äquivalenzen:
1. Die Folge a⋆ konvergiert gegen λ.
2. Für jedes ε > 0 ist λ − ε ∈ L und λ + ε ∈ R.
3. Jede reelle Zahl x < λ ist Element von L aber nicht von R und jede reelle Zahl
y > λ ist Element von R aber nicht von L.
4. sup L = λ = inf R.
Die mittlere Äquivalenz ergibt sich dabei daraus, L und R disjunkt
sind (9.19).
q.e.d.
Korollar 9.24. Jede beschränkte Folge a⋆ hat mindestens einen Häufungspunkt.
Hat sie genau einen Häufungspunkt, so ist dieser ihr Grenzwert.
Beweis. Eine beschränkte Folge hat nach (9.19) Limes inferior und Limes superior.
Das sind nach 9.21 Häufungspunkte.
Hat die Folge nur einen Häufungspunkt, so stimmen Limes inferior und superior
überein. Nach (9.23) ist die Folge also konvergent gegen den einen
Häufungspunkt.
q.e.d.
Aufgabe 9.25. Sei a⋆ eine nach unten beschränkte Folge reeller Zahlen. Wir
bezeichnen mit
Λ := {λ ∈ R λ ist Häufungspunkt von a⋆ }
die Menge aller Häufungspunkte. Dann ist Λ auch nach unten beschränkt. Ferner sei
L die Linksmenge von a⋆ . Zeige, daß L genau dann ein Supremum hat, wenn Λ ein
Infimum hat, und daß in diesem Fall
sup L = inf Λ
gilt. Formuliere die symmetrische Aussage für die Rechtsmenge R.
60
m
⋆
: m 7→ m+1
gegen 1 konvergiert.
Aufgabe 9.26. Zeige, daß die Folge ⋆+1
m
⋆
Zeige, daß die Folge (−1)⋆ ⋆+1
: m 7→ (−1)m m+1
genau zwei Häufungspunkt hat.
Aufgabe 9.27. Zeige, daß jede reelle Zahl Grenzwert einer Folge rationaler Zahlen
ist.
Aufgabe 9.28. Seien a⋆ und b⋆ zwei Folgen derart, daß jedes Folgenglied bj
Häufungspunkt der Folge a⋆ ist. Zeige, daß jeder Häufungspunkt von b⋆ auch
Häufungspunkt von a⋆ ist.
Aufgabe 9.29.
1. Beschreibe die Folge
(0, 0, 1, 0, 1, 2, 0, 1, 2, 3, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 5, . . .)
als Funktion N → R und zeige, daß sie unendlich viele Häufungspunkte hat.
2. Konstruiere eine Folge, die jede rationale Zahl q mit 0 ≤ q < 1 als
Häufungspunkt hat.
3. Konstruiere eine Folge, die jede reelle Zahl als Häufungspunkt hat.
Wenn eine Konstruktion gefordert ist, so ist stets auch zu zeigen, daß die
angegebene Konstruktion das Gewünschte leistet.
9.3
Cauchy-Konvergenz
Konvergenz von Folgen läßt sich intrinsisch charakterisieren:
Satz und Definition 9.30. Eine Folge a⋆ reeller Zahlen konvergiert genau dann,
wenn sie Cauchy-konvergent ist, d.h. wenn gilt:
∀ε > 0 ∃h ∈ N ∀i, j ≥ h :
|ai − aj | < ε
Beweis. Für ε > 0 setzen wir
Hε := {h ∈ N ∀i, j ≥ h : |ai − aj | < ε}
Seien L und R die Links- bzw. Rechtsmenge von a⋆ . Sei x ∈ L und y ∈ R. Dann gilt
x < ai < y
für fast alle Folgenglieder. Also ist in diesem Fall Hy−x 6= ∅. Daraus ergibt sich
unmittelbar, daß eine konvergente Folge Cauchy-konvergent ist, denn dann ist ja
sup L = inf R.
Umgekehrt folgt aus h ∈ Hε :
ah − ε < ai < ah + ε
∀i ≥ h
Insbesondere ist ah − ε ∈ L und ah + ε ∈ R. Ist also Hε 6= ∅, so sind L und R beide
nicht-leer und es gilt:
sup L ≤ inf R ≤ 2ε + sup L
Ist a⋆ Cauchy-konvergent folgt also sup L = inf R und damit Konvergenz.
61
q.e.d.
Definition 9.31. Seien a⋆ und b⋆ zwei Folgen. Wir nennen a⋆ und b⋆
Cauchy-kokonvergent, wenn für jedes ε > 0 ein Schwellindex h ∈ N existiert, so daß
für Indizes i, j ≥ h stets |ai − bj | < ε gilt. Wir notieren dafür:
a⋆ ≏ b⋆
Bemerkung 9.32. Beobachte, daß eine Folge genau dann Cauchy-konvergiert,
wenn sie Cauchy-kokonvergent zu sich selbst ist. Insofern ist diese Relation nicht
einmal reflexiv. Sie ist dennoch gar nicht soweit davon entfernt, eine
Äquivalenzrelation zu sein. Siehe (9.34).
Aufgabe 9.33. Cauchy-kokonvergente Folgen konvergieren, und zwar gegen
denselben Limes.
Aufgabe 9.34. Zeige, daß Cauchy-Kokonvergenz eine symmetrische und transitive
Relation ist. D.h., für Folgen a⋆ , b⋆ und c⋆ gelten die Implikationen:
a⋆ ≏ b⋆
a⋆ ≏ b⋆ und b⋆ ≏ c⋆
=⇒
=⇒
b⋆ ≏ a⋆
a⋆ ≏ c⋆
Bemerkung: Eingeschränkt auf die Menge aller Cauchy-konvergenten Folgen ist
Cauchy-Kokonvergenz also sogar eine Äquivalenzrelation.
Symmetrie 1 Punkt. Für Transitivität sind die Eckpunkte das korrekte Hantieren
mit den Indizes und die Nutzung der Dreiecksungleichung.
Aufgabe 9.35. Zeige, daß auch die Umkehrung von (9.34) gilt: Konvergieren zwei
Folgen gegen denselben Limes, so sind sie Cauchy-kokonvergent.
9.4
Monotone Folgen
Definition 9.36. Eine Folge a⋆ reeller Zahlen heißt
1. monoton wachsend (oder steigend), wenn gilt
i<j
=⇒ ai ≤ aj
∀i, j ∈ N
2. streng monoton wachsend (oder steigend), wenn gilt
i<j
=⇒ ai < aj
∀i, j ∈ N
=⇒ ai ≥ aj
∀i, j ∈ N
3. monoton fallend, wenn gilt
i<j
4. streng monoton fallend, wenn gilt
i<j
=⇒ ai > aj
62
∀i, j ∈ N
Beobachtung 9.37. Eine nach oben beschränkte, monoton wachsende Folge
konvergiert gegen ihr Supremum.
Analog konvergiert eine nach unten beschränkte, monoton fallende Folge gegen ihr
Infimum.
Beweis. Sei a⋆ eine nach oben beschränkte Folge und ω sei ihre kleinste obere
Schranke.
Ist y > ω, so liegen alle Folgenglieder unterhalb von y. Also ist y Element der
Rechtsmenge R. Ist umgekehrt x < ω, so gibt es ein h mit x < ah . Weil a⋆ monoton
ist, liegen alle weiteren Folgenglieder ebenfalls oberhalb von x und x gehört zur
Linksmenge L. Also ist sup L = ω = inf R. Somit konvergiert a⋆ gegen ω.
q.e.d.
Aufgabe 9.38. Sei a⋆ eine monotone wachsende Folge mit mindestens einem
Häufungspunkt. Zeige, daß a⋆ beschränkt ist und genau einen Häufungspunkt hat,
der zugleich Grenzwert und Supremum von a⋆ ist.
Beispiel 9.39. Die Folge
e⋆ : m 7→

1
 1+
1
m
m=0
sonst
m
ist monoton wachsend und nach oben beschränkt. Also konvergiert sie. Ihr
Grenzwert wird Eulersche Zahl genannt und mit e bezeichnet.
Beweis. Zur Monotonie: Zunächst ist e0 = 1 < 2 = e1 . Für höhere Indizes bilden
wir den Quotienten aufeinanderfolgender Glieder. Wir erhalten:
m+1 m
em+1
m + 2 m+1
=
em
m+1
m
m+1 m+1
m
m+1
m+2
=
m+1
m+1
m
!m+1
2
m + 2m
m+1
=
m2 + 2m + 1
m
!m+1
1
m+1
= 1−
(m + 1)2
m
!
m+1
m+1
1−
≥
2
(m + 1)
m
(7.15)
m m+1
=
=1
m+1 m
Wegen der Monotonie können wir uns zum Nachweis der Beschränktheit von e⋆
darauf zurückziehen, Glieder mit geradem Index 2m zu betrachten. Dafür haben wir
mit (7.15) zunächst:
1
m
0< ≤ 1−
≤
2
2m + 1 (7.15)
63
1
1−
2m + 1
m
Und damit
0<
Stürzen ergibt.
1
1
≤ 1−
4
2m + 1
2m
1 2m
≤4
2m
Also ist die Folge durch 4 nach oben beschränkt.
0 < e2m = 1 +
q.e.d.
Definition 9.40. Zwei Folgen a⋆ und b⋆ heißen kofinal, wenn die Menge
{i ∈ N ai 6= bi }
endlich ist, d.h. die Folgen unterscheiden sich nur in endlich vielen Gliedern.
Bemerkung 9.41. Kofinalität ist eine Äquivalenzrelation.
Sind zwei Folgen kofinal, so konvergiert die eine genau dann, wenn die andere
konvergiert. Also: Konvergenz von Folgen hängt nur von ihrer Kofinalitätsklasse ab.
Kofinale Folgen haben dieselben Häufungspunkte. Insbesondere konvergieren
konvergente kofinale Folgen gegen denselben Grenzwert.
Beispiel 9.42. Die geometrische Folge zur Basis t ist die Folge t⋆ : i 7→ ti . Sie ist
eine Nullfolge für −1 < t < 1, sie konvergiert für −1 < t ≤ 1 und sie ist beschränkt
für −1 ≤ t ≤ 1.
Für t = −1 hat sie zwei Häufungspunkte, nämlich 1 und −1. Für t < −1 und für
1 < t hat sie keine Häufungspunkte und ist unbeschränkt.
Beweis. Zunächst behandeln wir spezielle Werte:
t = 0: Hier ist die Folge (1, 0, 0, 0, . . .) ultimativ konstant. Sie konvergiert gegen 0.
t = 1: Hier ist die Folge (1, 1, 1, 1, . . .) konstant. Sie konvergiert gegen 1.
t = −1: Hier alterniert die Folge (1, −1, 1, −1, . . .) zwischen den Werten 1 und −1.
Sie ist nach unten und nach oben beschränkt, hat die beiden Häufungspunkte
1 und −1, aber keinen Grenzwert.
Nun zu den Bereichen:
0 ≤ t < 1: Für diese Werte von t ist die Folge t⋆ nach unten durch 0 beschränkt:
eine einfachte Induktion zeigt sogar 0 ≤ ti < 1 für alle i ∈ N.
Aus 0 ≤ ti < 1 folgt durch Multiplikation mit t auch ti+1 ≤ ti . Wir sehen also,
daß t⋆ monoton fällt.
Also konvergiert t⋆ gegen das Infimum λ der Folge. Da 0 eine untere Schranke
ist, gilt 0 ≤ λ. Wir behaupten λ = 0.
Zum Widerspruch nehmen wir 0 < λ an. Wegen 0 < 1 − t ist dann auch
0 < λ(1−t)
und wir können ε > 0 mit ε < λ(1−t)
wählen. Dann haben wir
t
t
zunächst tε < λ − λt und daraus t(λ + ε) < λ. Da t⋆ gegen λ konvergiert, gibt
es ein i ∈ N mit ti < λ + ε. Dann wäre ti+1 < t(λ + ε) < λ, was im
Widerspruch dazu steht, daß λ das Infimum der Folge t⋆ ist.
64
−1 < t < 0: Hier können wir t⋆ mit der Folge |t|⋆ vergleichen, denn sie unterscheiden
sich nur in den Vorzeichen. Mit (9.15) konvergieren beide gegen 0.
1 < t: Eine einfache Induktion zeigt, daß die Folge in diesem Fall streng monoton
wächst. Ferner ist sie unbeschränkt: Andernfalls konvergierte t⋆ gegen die
kleinste obere Schranke λ. Diese Annahme läßt sich mit ähnlichen Argumenten
wie im Fall 0 ≤ t < 1 zum Widerspruch führen. Siehe Aufgabe (9.43).
t < −1: Wieder unterscheiden sich t⋆ und |t|⋆ bloß in den Vorzeichen. Also kann t⋆
auch nicht konvergieren.
q.e.d.
Aufgabe 9.43. Sei 1 < t. Zeige, daß t⋆ monoton wächst, unbeschränkt ist und
keine Häufungspunkte hat.
65
10
10.1
Rechnen mit Folgen
Folgen vergleichen
Definition 10.1 (Majorisierung). Sei M eine Menge und f, g : M → R zwei
reellwertige Funktionen auf M. Wir sagen, daß g die Funktion f
(überall) majorisiert, wenn f (x) ≤ g(x) für alle x ∈ M gilt. Wir schreiben dafür
f ≤ g oder unter Verwendung der ⋆-Notation f (⋆) ≤ g(⋆).
Wir sagen, daß g die Funktion f (überall) strikt majorisiert, wenn f (x) < g(x) für
alle x ∈ M gilt. Wir schreiben dafür f < g oder unter Verwendung der ⋆-Notation
f (⋆) < g(⋆).
Wir sagen, daß g die Funktion f fast (überall) majorisiert, wenn f (x) ≤ g(x) für
fast alle x ∈ M gilt. Wir schreiben dafür f ✂ g oder unter Verwendung der
⋆-Notation f (⋆) ✂ g(⋆).
Wir sagen, daß g die Funktion f fast (überall) strikt majorisiert, wenn f (x) < g(x)
für fast alle x ∈ M gilt. Wir schreiben dafür f ✁ g oder unter Verwendung der
⋆-Notation f (⋆) ✁ g(⋆).
Eine überall majorisierende Funktion majorisiert insbesondere fast überall.
Beobachtung 10.2. Seien a⋆ und b⋆ zwei Zahlenfolgen mit Linksmengen La bzw.
Lb und Rechtsmengen Ra bzw. Rb . Dann gilt:
a⋆ ✂ b⋆
=⇒
La ⊆ Lb
und
Ra ⊇ Rb
Beweis. Sei nämlich x ∈ La . Dann ist die Menge
{i ∈ N ai ≤ x}
endlich. Nun ist
{i ∈ N bi ≤ x} ⊆ {i ∈ N ai ≤ x} ∪ {i ∈ N ai 6≤ bi }
endlich als Vereinigung zweier endlicher Menge. Also ist x ∈ Lb . Die andere
behauptete Inklusione folgt mutatis mutandis.
q.e.d.
Korollar 10.3 (Einschnürungssatz). Seien a⋆ , b⋆ und c⋆ drei Folgen mit
a⋆ ✂ b⋆ ✂ c⋆
Dann gilt:
1. Ist a⋆ nach unten beschränkt so ist b⋆ nach unten beschränkt.
2. Ist c⋆ nach oben beschränkt, so ist b⋆ nach oben beschränkt.
3. Konvergieren a⋆ und c⋆ gegen denselben Limes, so konvergiert auch b⋆ dagegen.
66
Beweis. Mit La und Ra bzeichnen wir die Links- bzw. Rechtsmenge von a⋆ . Analog
sind die Bezeichnungen Lb , Rb , Lc und Rc zu verstehen. Dann ist mit (10.2)
La ⊆ Lb ⊆ Lc
und
Ra ⊇ Rb ⊇ Rc
Sei nun a⋆ nach unten beschränkt. Dann ist La nicht-leer. Darum ist auch Lb
nicht-leer und b⋆ nach unten beschränkt (9.18).
Ist c⋆ nach oben beschränkt, so folgt analog, daß b⋆ nach oben beschränkt ist.
Konvergieren a⋆ und c⋆ , so sind alle betrachteten Links- und Rechtsmengen
nicht-leer und einseitig beschränkt: Linksmengen nach oben und Rechtsmengen
nach unten. Aus den Inklusionen und (9.19) folgt dann:
≤
≤
≤
sup La ≤ sup Lb ≤ sup Lc
inf Ra ≤ inf Rb ≤ inf Rc
Konvergieren a⋆ und c⋆ gegen denselben Limes, folgt durgängig Gleichheit:
sup La = sup Lb = sup Lc = inf Ra = inf Rb = inf Rc
Insbesondere konvergiert b⋆ ebenfalls gegen diesen Limes (9.23).
q.e.d.
Definition 10.4. Wir nennen zwei Folgen a⋆ und b⋆ fast gleich oder kofinal, wenn
gilt a⋆ ✂ b⋆ und b⋆ ✂ a⋆ . Wir notieren dafür a⋆ ≈ b⋆ .
Das bedeutet, daß a⋆ und b⋆ nur an endlich vielen Stellen voneinander abweichen.
Beobachtung 10.5. Aus dem Einschnürungssatz (10.3) folgt unmittelbar, daß zwei
fast gleiche Folgen entweder beide konvergieren (und dann gegen denselben Limes)
oder beide nicht konvergieren.
Beobachtung 10.6. Die Relation ✂ ist reflexiv: Seien a⋆ eine Zahlenfolge, dann
ist offensichtlich a⋆ ✂ a⋆ .
Beobachtung 10.7. Die Relation ✂ ist transitiv: Für je drei Zahlenfolgen a⋆ , b⋆
und c⋆ gilt:
a⋆ ✂ b⋆ und b⋆ ✂ c⋆
=⇒
a⋆ ✂ c⋆
Beweis. Transitivität der ≤-Relation bedeutet für drei reelle Zahlen x, y und z:
x 6≤ z
=⇒
x 6≤ y oder y 6≤ z
Also ist
{i ∈ N ai 6≤ ci } ⊆ {i ∈ N ai 6≤ bi } ∪ {i ∈ N bi 6≤ ci }
und damit endlich, wenn beide Mengen auf der rechten Seite endlich sind.
67
q.e.d.
Korollar 10.8. Fast-Gleichheit ist eine Äquivalenzrelation, also reflexiv (folgt
aus 10.6), transitiv (folgt aus 10.7), und symmetrisch (klar nach Definition 10.4).
Bemerkung 10.9. Hier ist ein allgemeines Prinzip am Werk. Wennimmer wir eine
reflexive und transitive Relation auf einer Menge M haben, wird durch
m≈l
m l und l m
:⇐⇒
eine Äquivalenzrelation auf M erklärt. Ferner induziert auf der Menge M̃ der
≈-Äquivalenzklassen eine Ordnungsrelation.
Aufgabe 10.10. Zeige: Fast gleiche Folgen haben dieselben Häufungspunkte.
10.2
Gliedweises Rechnen mit Folgen
Definition 10.11. Seien a⋆ und b⋆ zwei Folgen. Dann können wir die Folgen
gliedweise addieren, subtrahieren und multiplizieren. Verschwindet keines der
Glieder von b⋆ , so läßt sich auch der Quotient bilden:
a⋆ + b⋆
a⋆ − b⋆
a⋆ b⋆
a⋆
b⋆
: m 7→ am + bm
: m 7→ am − bm
: m 7→ am bm
am
: m 7→
bm
Entsprechend sind für eine reelle Zahl s erklärt:
s + a⋆
s − a⋆
sa⋆
s
a⋆
Beobachtung 10.12. Eine Folge a⋆ konvergiert gegen λ genau dann, wenn λ − a⋆
eine Nullfolge ist.
q.e.d.
Beobachtung 10.13. Sind a⋆ ≈ a′⋆ und b⋆ ≈ b′⋆ , so folgt
a⋆ + b⋆ ≈ a′⋆ + b′⋆
a⋆ − b⋆ ≈ a′⋆ − b′⋆
a⋆ b⋆ ≈ a′⋆ b′⋆
a′
a⋆
≈ ′⋆
b⋆
b⋆
q.e.d.
Bemerkung 10.14. Sind a⋆ und b⋆ beide beschränkt, so sind auch die Summe
a⋆ + b⋆ , die Differenz a⋆ − b⋆ und das Produkt a⋆ b⋆ beschränkt.
Aufgabe 10.15. Finde zwei beschränkte Folgen a⋆ und b⋆ derart, daß bi 6= 0 für
jeden Index i ∈ N ist und daß der Quotient ab⋆⋆ keine beschränkte Folge ist.
Proposition 10.16. Summe, Differenz und Produkt zweier Nullfolgen sind wieder
Nullfolgen.
68
Beweis. Wir behandel nur das Produkt – das ist am schwierigsten. Seien also a⋆
und b⋆ Nullfolgen. Da eine Folge genau dann eine Nullfolge ist, wenn die Folge ihrer
Beträge eine Nullfolge ist, können wir ohne Beschränkung der Allgemeinheit
annehmen, daß a⋆ und b⋆ nur nicht-negative Terme haben.
Für 0 ≤ x, y < ε < 1 gilt: 0 ≤ xy < ε2 < ε. Für beliebiges 0 < ε < 1 gilt also:
Liegen fast alle ai und fast alle bi in Bε (0), dann liegen auch fast alle
Produkte ai bi in Bε (0).
q.e.d.
Aufgabe 10.17. Sei a⋆ eine Nullfolge und b⋆ beschränkt. Zeige, daß das Produkt
a⋆ b⋆ eine Nullfolge ist.
Proposition 10.18. Konvergiert sowohl a⋆ als auch b⋆ , so konvergieren auch die
Summe a⋆ + b⋆ , die Differenz a⋆ − b⋆ und das Produkt a⋆ b⋆ . Die Grenzwerte sind die
Summe, die Differenz, bzw. das Produkt der Grenzwerte:
lim a⋆ + b⋆ = lim a⋆ + lim b⋆
⋆→∞
⋆→∞
⋆→∞
lim a⋆ − b⋆ = lim a⋆ − lim b⋆
⋆→∞
⋆→∞
lim a⋆ b⋆ =
⋆→∞
lim a⋆
⋆→∞
⋆→∞
lim b⋆
⋆→∞
Ist b⋆ gliedweise ungleich 0 und ist überdies 0 6= lim⋆→∞ b⋆ , so konvergiert der
Quotient ab⋆⋆ und es gilt:
lim⋆→∞ a⋆
a⋆
=
lim
⋆→∞ b
lim⋆→∞ b⋆
⋆
Beweis. Es konvergiere a⋆ gegen λa und b⋆ gegen λb . Dann sind λa − a⋆ und λb − b⋆
Nullfolgen. Also ist λa − a⋆ + λb − b⋆ = λa + λb − (a⋆ + b⋆ ) eine Nullfolge. Darum
konvergiert a⋆ + b⋆ gegen λa + λb . Das Argument für a⋆ − b⋆ ist entsprechend.
Für das Produkt haben wir die Nullfolge
(λa − a⋆ )(λb − b⋆ ) = λa λb − (λa − a⋆ )b⋆ − a⋆ (λb − b⋆ ) − a⋆ b⋆
Da konvergente Folgen beschränkt sind, sind (λa − a⋆ )b⋆ und a⋆ (λb − b⋆ ) Nullfolgen
wegen (10.17). Es folgt, daß λa λb − a⋆ b⋆ eine Nullfolge ist. Daher konvergiert a⋆ b⋆
gegen λa λb .
Für den Quotienten reicht es, zu zeigen, daß b1⋆ gegen λ1b konvergiert. Da b⋆
konvergiert, hat b⋆ außer dem Limes λb keine weiteren Häufungspunkte (9.11).
Insbesondere ist 0 kein Häufungspunkt von b⋆ . Es gibt also ein ε > 0, so daß nur
endlich viele Folgenglieder in Bε (0) liegen. Da kein Folgenglied verschwindet,
können wir ε soweit verkleinern, daß kein Folgenglied in Bε (0) liegt. Dann liegen
aber alle Glieder der Folge b1⋆ in B 1 (0). Das heißt:
ε
1
ist beschränkt.
b⋆
Dann aber ist
1
1
1
−
=−
(λb − b⋆ )
λb b⋆
λb b⋆
als Produkt einer beschränkten Folge und einer Nullfolge selbst beschränkt.
69
q.e.d.
Aufgabe 10.19. Die Aussage (10.18) läßt eine alternative Formulierung zu: Seien
a⋆ , a′⋆ , b⋆ und b′⋆ Folgen. Ferner sei a⋆ ≏ a′⋆ und b⋆ ≏ b′⋆ . Dann gilt auch
a⋆ + b⋆ ≏ a′⋆ + b′⋆
a⋆ − b⋆ ≏ a′⋆ − b′⋆
a⋆ b⋆ ≏ a′⋆ b′⋆
Kokonvergieren b⋆ und b′⋆ gegen einen von 0 verschiedenen Grenzwert, so ist überdies
a′⋆
a⋆
≏ ′
b⋆
b⋆
Leite (10.18) aus dieser Fassung ab und beweise diese Fassung direkt (also
ohne (10.18) zu benutzen).
10.3
Teilfolgen
Definition 10.20. Sei a⋆ eine Folge reeller Zahlen und b⋆ eine Folge natürlicher
Zahlen. Dann können wir die Glieder der Folge b⋆ als Indizes in die Folge a⋆
benutzen und die Folge ab⋆ bilden. Als Abbildung ist diese Folge einfach die
Verkettung:
i 7→ bi 7→ abi
Wir nennen Folgen, die sich so schreiben lassen, Teilfolgen der Folge a⋆ , sofern b⋆
streng monoton wächst. Durch diese Forderung wird ausgeschlossen, daß in der
Teilfolge ein Glied ai mehrfach vorkommt: Eine streng monotone Folge ist
insbesondere eine injektive Abbildung.
Beobachtung 10.21. Sei M ⊆ R eine nach oben unbeschränkte Menge. Dann gibt
es eine streng monoton wachsende Folge a⋆ mit Bild in M.
Beweis. Das offensichtliche Argument geht so: Da M unbeschränkt ist, ist M
nicht-leer und es gibt ein Element m0 ∈ M. Nun gibt es ein Element m1 > m0 , nun
gibt es ein Element m2 > m1 , nun gibt es ein Element m3 > m2 , etc.
Dieses Argument zeigt streng genommen nicht, daß es eine Folge m⋆ gibt: Die
suggestive Notation m0 , m1 , . . . darf einen nicht verleiten, eine auf ganz N definierte
Funktion i 7→ mi zu vermuten. Siehe Bemerkung (3.33) für eine Diskussion einer
ähnlichen Schwierigkeit. Das Auswahlaxiom ist das Hilfsmittel, mit dem sich diese
Schwierigkeiten überwinden lassen. Ich mache das an dieser Stelle einmal vor.
Später werde ich mich auf einen Hinweis beschränken: Mit etwas Erfahrung sieht
man, wie sich die intuitive Idee mit Hilfe des Auswahlaxiom formalisieren läßt.
Wir betrachten den Relationsgraphen
R := {(x, y) ∈ M × M x < y}
und sehen, daß jedes x ∈ M einen Partner y ∈ M mit (x, y) ∈ R hat, eben weil M
unbeschränkt ist. Damit sind die Voraussetzungen des Auswahlaxiom (3.31) erfüllt,
und wir schließen, daß es eine Funktion
F : M −→ M
70
gibt, mit F (x) > x für jedes x ∈ M. Diese Funktion F formalisiert den Teil
gegeben mi ∈ M, dann wählen wir mi+1 > mi“ des intuitiven Arguments.
”
Mit der Wählfunktion“ F können wir die Folge a⋆ rekursiv definieren durch
”
a0 ∈ M beliebig
ai+1 = F (ai )
Es ist klar, daß a⋆ streng monoton wächst.
q.e.d.
Beobachtung 10.22. Eine streng monoton wachsende Folge ist durch ihr Bild
eindeutig bestimmt. Anders herum: Sind a⋆ und b⋆ zwei streng monoton wachsende
verschiedene Folgen, dann unterscheiden sich ihre Bildmengen.
Beweis. Aus a⋆ 6= b⋆ folgt die Existenz eines kleinsten i ∈ N mit ai 6= bi . Wir
nehmen ai < bi an (nötigenfalls vertauschen wir die Rollen von a⋆ und b⋆ ). Dann
kommt die Zahl ai nicht unter den Gliedern der Folge b⋆ vor. Für j < i ist nämlich
bj = aj < ai und für j ≥ i ist bj > bi > ai .
q.e.d.
Proposition 10.23. Zu jeder unendlichen Teilmenge M ⊆ N gibt es genau eine
streng monoton wachsende Folge m⋆ mit Bild M.
Beweis. Wichtig ist hier, daß N wohlgeordnet ist. Darum hat die nicht-leere
Teilmenge M ein kleinstes Element m0 . Da M unendlich ist, ist aber auch
{x ∈ M m0 < x} nicht-leer und hat ein kleinstes Element m1 > m0 . Dann ist
{x ∈ M m1 < x} nicht-leer und hat ein kleinstes Element m2 > m1 . Das geht so
weiter.
Formal geht das so: zunächst gibt es eine Abbildung
F : M −→ M
m 7→ min {x ∈ M m < x}
und dann mit Rekursion die Folge:
m0 = min M
mi+1 = F (mi )
Monotonie ist klar, und Eindeutigkeit haben wir in (10.22) gesehen.
Wäre nun Bild(f ) 6= M, so wählen wir ein minimales y ∈ M ⊆ N, das nicht im Bild
liegt und ein minimales i ∈ N mit y < f (i). Dann ist i 6= 0 und f (i − 1) < y. Nun
ergibt sich der gesuchte Widerspruch aus der Rekursion:
f (i) = min {x ∈ M f (i − 1) < x} ≤ y
q.e.d.
Lemma 10.24. Jede Folge hat eine monoton wachsende oder eine streng monoton
fallende Teilfolge.
71
Beweis. Sei a⋆ eine Folge. Wir betrachten die Menge
M := {i ∈ N ∀j > i : aj < ai } ⊆ N
und unterscheiden die beiden Fälle
M ist unbeschränkt: In diesem Fall sei b⋆ eine streng monoton wachsende Folge in
M wie in (10.21) angegeben. Die Teilfolge ab⋆ ist dann streng monoton fallend.
M ist beschränkt: Sei m ∈ N eine Schranke. Das heißt zu jedem i > m gibt es ein
j > i mit ai ≤ aj . Wir finden also (eine Folge von) Indizes
m < i0 < i1 < i2 < i3 < · · ·
mit
ai0 ≤ ai1 ≤ ai2 ≤ ai3 ≤ · · ·
und dann ist die Folge ai⋆ monoton wachsend.
Man beachte, daß sich im zweiten Fall dasselbe Problem stellt wie in (10.21) und
sich genauso durch eine Anwendung des Auswahlaxiom lösen läßt.
q.e.d.
Aufgabe 10.25. Präzisiere das Argument in (10.24) für den Fall, daß M
unbeschränkt ist, mittels Auswahlaxiom.
Aufgabe 10.26. Sei a⋆ eine Zahlenfolge. Zeige, daß λ ∈ R genau dann
Häufungspunkt von a⋆ ist, wenn a⋆ eine Teilfolge hat, die gegen λ konvergiert.
Bemerkung 10.27. Daraus ergibt sich ein zweiter Beweis für Bolzano-Weierstraß:
eine beschränkte Folge hat eine monotone Teilfolge, die ist immer noch beschränkt
und konvergiert darum. Dieser Grenzwert der Teilfolge ist dann Häufungspunkt der
ursprünglichen Folge.
10.4
Der Differenzen- und Summenkalkül
Definition 10.28 (Indexverschiebung). Sei a⋆ eine Zahlenfolge und m ∈ Z. Wir
definieren die Folgen a⋆+m und am−⋆ wiefolgt:
a⋆+m : i 7→

a
i+m
0

a
am−⋆ : i 7→ 
m−i
0
i+m∈ N
sonst
m−i∈N
sonst
Wir nennen eine Folge der Form a⋆+m mit m ∈ N einen Rest oder ein Ende der
Folge a⋆ .
Wir nennen die Folge a⋆ ultimativ blah, wenn sie einen Rest hat, der blah ist. Z.B.
ist a⋆ ultimativ monoton wachsend, wenn ab einem Schwellindex m ∈ N gilt:
ai ≤ ai+1
∀i ≥ m
72
Beobachtung 10.29. Ist eine Folge blah, so ist sie ultimativ blah.
q.e.d.
Beobachtung 10.30. Sei a⋆ eine Zahlenfolge, m ∈ N eine natürliche Zahl und
M ⊆ R eine beliebige Teilmenge. Dann gilt:
{i ∈ N ai ∈ M und i ≥ m} ⊆ {i ∈ N ai ∈ M} ⊆ {i ∈ N ai ∈ M und i ≥ m} ∪ [m]
Nun ist [m] endlich, und darum:
{i ∈ N ai ∈ M} ist endlich
⇐⇒
{i ∈ N ai ∈ M und i ≥ m} ist endlich
Diese Äquivalenz läßt sich für verschiedene Teilmengen M ausbuchstabieren:
1. Eine Folge und jeder ihrer Reste haben diegleichen Links- und Rechtsmengen.
2. Ist ein Ende der Folge a⋆ nach unten (oben) beschränkt, so ist a⋆ nach unten
(oben) beschränkt, allerding möglicherweise mit einer anderen Schranke.
3. Eine Folge a⋆ hat dieselben Häufungspunkte wie jeder ihrer Reste.
Insbesondere ist jede ultimativ konvergente Folge konvergent.
q.e.d.
Korollar 10.31. Eine ultimativ nach unten beschränkte und ultimativ monoton
fallende Folge konvergiert.
q.e.d.
Korollar 10.32. Sei a⋆ eine Folge. Gibt es 0 < t < 1 so daß
|ai+1 | ≤ t |ai |
für alle i ≥ m gilt, so wird der Folgenrest |a⋆+m | majorisiert von dem Vielfachen
|am | t⋆ einer geometrischen Folge. Also ist ist a⋆ eine Nullfolge.
q.e.d.
Aufgabe 10.33. Die Fakultät m! einer natürlichen Zahl ist rekursiv definiert durch
0! = 1
(m + 1)! = (m + 1)m!
Sei x ∈ R beliebig. Zeige, daß die Folge
x⋆
⋆!
eine Nullfolge ist.
Aufgabe 10.34. Sei 0 ≤ x < 1 und k ∈ N. Dann ist ⋆k x⋆ : m 7→ mk xm eine
Nullfolge.
Definition 10.35. Die Folge ∆a⋆ ist definiert durch
∆ai := ai+1 − ai
Wir haben also:
∆a⋆ = a⋆+1 − a⋆
73
Beobachtung 10.36. Konvergiert a⋆ , so ist ∆a⋆ eine Nullfolge. (Folgt aus
Cauchy-Konvergenz)
q.e.d.
Definition 10.37. Sei a⋆ eine Zahlenfolge. Wir definieren rekursiv die Folge Σa⋆
wiefolgt:
Σa0 = a0
Σai+1 = (Σai ) + ai+1
Mit der Summennotation können wir das auch auf folgende Weisen schreiben:
Σam =
m
X
ai =
X
ai
i≤m
i=0
Wir nennen die Terme von Σa⋆ Partialsummen der Folge a⋆ .
Beobachtung 10.38. Für eine Folge a⋆ ist a⋆+1 = ∆Σa⋆ . Konvergiert Σa⋆ , dann
ist a⋆ eine Nullfolge (10.36).
Definition 10.39. Seien a⋆ und b⋆ zwei Folgen. Ihr Faltungsprodukt ist definiert als
(a⋆ ∗ b⋆ )m := Σ(a⋆ bm−⋆ )m
Das heißt in Summennotation:
(a⋆ ∗ b⋆ )m =
m
X
ai bm−i
i=0
Aufgabe 10.40. Sei 0⋆ die geometrische Folge zur Basis 0, also
(1, 0, 0, 0, 0, 0, . . .)
und sei a⋆ eine beliebige Zahlenfolge. Zeige:
1. (1, 1, 1, 1, 1, 1, 1, . . .) ∗ (1, −1, 0, 0, 0, 0, 0, . . .) = 0⋆
2. 0⋆ ist neutrales Element bezüglich der Faltung:
a⋆ ∗ 0⋆ = 0⋆ ∗ a⋆ = 0⋆
3. Sei a⋆ eine Zahlenfolge. Es gibt genau dann eine Folge b⋆ mit a⋆ ∗ b⋆ = 0⋆ ,
wenn a0 6= 0 ist. In diesem Fall ist b⋆ eindeutig bestimmt.
Aufgabe 10.41. Beweise die folgenden Rechenregeln:
∆(a⋆ b⋆ ) = a⋆+1 (∆b⋆ ) + (∆a⋆ )b⋆
(a⋆ + b⋆ ) ∗ c⋆ = a⋆ ∗ c⋆ + b⋆ ∗ c⋆
(∆a⋆ ) ∗ b⋆ = ∆(a⋆ ∗ b⋆ ) − a0 b⋆+1
Σa⋆ = a⋆ ∗ 1⋆
Dabei ist 1⋆ = (1, 1, 1, 1, . . .) die geometrische Folge zur Basis 1.
74
Beispiel 10.42. Seien s 6= t. Wir falten die geometrischen Folgen s⋆ und t⋆ . Aus
(t − s)
m
X
i m−i
st
=
m
X
i m+1−i
st
i=0
i=0
=
m
X
i=0
−
si tm+1−i −
= tm+1 − sm+1
m
X
si+1 tm−i
i=0
m+1
X
si tm+1−i
i=1
erhalten wir
1
1
(t⋆+1 − s⋆+1 ) =
(s⋆+1 − t⋆+1 )
t−s
s−t
t ⋆
s ⋆
s −
t
=
s−t
s−t
s⋆ ∗ t⋆ =
Bemerkung 10.43. Die Menge aller Folgen ist ein kommutativer Ring mit Eins
(fragen Sie den Algebraiker Ihres Vertrauens, was das ist) bezüglich gliedweiser
Addition und Faltung. Die geometrische Folge 0⋆ zur Basis 0 ist das neutrale
Element der Multiplikation.
75
11
Reihen
Traditionell bezeichnet man eine unendliche Summe“
”
∞
X
ai
i=0
als Reihe.
Hier wird eigentlich kein Objekt definiert, sondern eine Notation. Denn die
Definition legt ja gar nicht fest, was der Ausdruck bezeichnen soll. In der Tat ist das
etwas uneindeutig. Üblich ist:
1. Eine Reihe wird identifiziert mit der Folge ihrer Partialsummen
bm :=
m
X
ai
i=0
Das heißt: b⋆ = Σa⋆ .
2. Der Reihenausdruck
∞
X
ai
i=0
bezeichnet den Limes von Σa⋆ , sofern er existiert.
Wir können also sagen:
Definition 11.1. Ist eine Folge gegeben in der Form Σa⋆ , so bezeichnen wir sie als
Reihe. Konvergiert Σa⋆ , so schreiben wir
X
a :=
⋆ ⋆
∞
X
ai := lim Σa⋆ = lim
i=0
⋆→∞
j→∞
j
X
ai
i=0
Den Grenzwert einer konvergenten Reihe nennen wir auch ihre Summe.
In (10.38) haben wir gesehen, daß die Reihe Σa⋆ nur dann konvergieren kann, wenn
a⋆ eine Nullfolge ist. Das ist aber keine Äquivalenz:
Beispiel 11.2. Die harmonische Reihe
X
⋆
1
1 1 1 1 1 1 1 1 1
= + + + + + + + + +···
⋆+1
1 2 3 4 5 6 7 8 9
divergiert, denn sie majorisiert die offensichtlich divergente Reihe
1
1 1 1 1 1 1 1 1
+ + + + + + + +
+···
1 2 4 4 8 8 8 8 16
Aufgabe 11.3. Sei a⋆ eine monoton fallende Folge nicht-negativer Zahlen. Zeige,
daß Σa⋆ genau dann konvergiert, wenn Σ2⋆ a2⋆ konvergiert.
76
Beispiel 11.4. Die geometrische Reihe zur Basis t ∈ R ist gegeben durch
Σt⋆
Das heißt, die geometrische Reihe
∞
X
ti
i=0
hat die Partialsummen:
j
X
i=0
ti = 1 + t + t2 + · · · + tj
Archimedes hat gezeigt, daß die geometrische Reihe zur Basis
zwar gegen den Grenzwert 34 . Wir zeigen:
1
4
konvergiert und
Für −1 < t < 1 konvergiert Σt⋆ und es gilt:
∞
X
1
ti
=
1 − t i=0
Beweis. Mit (10.42) ist:
Σt⋆ = t⋆ ∗ 1⋆ =
11.1
1 ⋆
t ⋆
1 −
t
1−t
1−t
−→
⋆→∞
1
1−t
q.e.d.
Absolute Konvergenz und Umordnungen
Definition 11.5. Sei a⋆ eine Folge. Die Reihe Σa⋆ konvergiert absolut, wenn die
Reihe Σ |a⋆ | konvergiert.
Eine Reihe heißt bedingt konvergent, wenn sie konvergiert, aber nicht absolut
konvergiert.
Beobachtung und Definition 11.6. Die Reihe Σa⋆ konvergiert genau dann
absolut, wenn die Folge a⋆ summierbar ist, d.h., wenn die Menge
(
X
i∈I
)
|ai | I ⊆ N endlich
beschränkt ist.
Beobachtung 11.7. Sei Σa⋆ absolut konvergent. Dann ist die Folge
P
P
m 7→ ⋆ |a⋆+m | = ∞
i=m |a⋆+m | der Reihenreste eine Nullfolge wegen:
X
|a
| = ( lim
⋆ ⋆+m
m→∞
X
i<m
|ai |) −
X
i<m
|ai |
−→
m→∞
77
( lim
m→∞
X
i<m
|ai |) − ( lim
m→∞
X
i<m
|ai |) = 0
Definition 11.8. Sei a⋆ eine Folge und π : N → N eine bijektive Abbildung. Dann
nennen wir die Verkettung aπ(⋆) eine Umordnung der Folge a⋆ .
Die zu einer Umordnung gehörige Reihe bezeichnen wir mit Σ(aπ(⋆) ). Die
Klammerung deutet an, das wir erst die Folge umordnen und dann zu
Partialsummen übergehen. Wir betrachten also
aπ(0) + aπ(1) + · · · + aπ(i)
und nicht
a0 + a1 + · · · + aπ(i)
Satz 11.9 (Umordnungssatz). Ist eine Reihe Σa⋆ absolut konvergent, dann
konvergieren alle Umordnungen Σ(aπ(⋆) ), und überdies alle gegen denselben Limes.
Insbesondere konvergiert jede absolut konvergente Reihe.
P
P
n
π
Beweis. Wir betrachten die Folgen sm := m
i=0 ai und sn :=
j=0 aπ(j) von
Partialsummen. Nach (9.33) reicht es zu zeigen, daß s⋆ und sπ⋆
Cauchy-kokonvergent (9.31) sind. Sei also ε > 0. Wir suchen ein h ∈ N, so daß für
m, n ≥ h gilt:
X
m
ε > |sm − sπn | = i=0
ai −
n
X
j=0
aπ(j) Nach Voraussetzung Σa⋆ absolut konvergent. Dann ist die Reihe Σ |a⋆ |
Cauchy-konvergent. Zunächst gibt es also h′ ∈ N mit
j
j
i
X
X
ε X
>
|ak | −
|ak | =
|ak |
2 k=0
k=0
k=i+1
∀j ≥ i ≥ h′
Durch Weglassen nicht-negativer Summanden kann eine Summe nicht wachsen. Also
ist
X
ε
|am | <
2
m∈M
für jede endliche Menge M natürlicher Zahlen größer als h′ . Hier ist wichtig, daß wir
j stets groß genug wählen können, so daß M ⊆ [j] wird.
Nun wählen wir h ≥ h′ so, daß
{0, 1, . . . , h′ } ⊆ {π(0) , π(1) , . . . , π(h)}
P
ist. Für m, n ≥ h kommen dann die Summanden a0 , a1 , . . . , ah′ sowohl in m
i=0 ai als
Pn
auch in j=0 aπ(j) vor. Wir können sie in beiden Summen abziehen und erhalten
|sm − sπn | =
m
X
ai
i=0
aπ(j) −
j=0
n
X
=
X
ai
i∈I
−
aj j∈J
|aj | ≤
ε ε
+ =ε
2 2
X
mit endlichen Mengen I, J ⊆ N, die beide nur Elemente größer als h′ enthalten.
Darum gilt mit dieser Wahl von h die Abschätzung:
|sm − sπn | =
X
ai
i∈I
−
aj j∈J
X
≤
X
i∈I
|ai | +
78
X
j∈J
q.e.d.
Zusatz 11.10. Jede Umordnung einer absolut konvergenten Reihe konvergiert
absolut.
Beweis. Sei Σa⋆ absolut konvergent. Dann ist Σ |a⋆ | auch absolut
konvergent und
nach Umordnungssatz (11.9) konvergiert jede Umordnung Σ aπ(⋆) , was aber die
absolute Konvergenz von Σ(aπ(⋆) ) bedeutet.
q.e.d.
Aufgabe 11.11. Die Reihe
1 1 1 1 1 1 1 1 1 1 1 1 1 1
− + − + − + − + − + − + − +···
1 1 2 2 3 3 4 4 5 5 6 6 7 7
konvergiert gegen 0. Zeige, daß man sie so umordnen kann, daß die Umordnung
gegen 1 konvergiert.
Aufgabe 11.12. Wenn eine Reihe nicht absolut konvergiert, so hat sie eine
divergente Umordnung.
Aufgabe 11.13. Sei Σa⋆ eine bedingt konvergente Reihe und λ ∈ R beliebig. Zeige,
daß es eine Umordnung Σ(aπ(⋆) ) der Reihe gibt, die die Summe λ hat.
Definition 11.14. Man nennt eine Reihe Σa⋆ unbedingt konvergent, wenn jede
Umordnung Σ(aπ(⋆) ) konvergiert.
Wir fassen zusammen:
Satz 11.15 (Großer Umordnungssatz). Eine Reihe konvergiert genau dann
absolut, wenn sie unbedingt konvergiert. In diesem Fall konvergieren alle
Umordnungen absolut und unbedingt gegen dieselbe Summe. Eine bedingt
konvergente Reihe kann so umgeordnet werden, daß die Umordnung eine beliebig
vorgegebene Summe annimmt.
11.2
Konvergenzkriterien und Potenzreihen
Aufgabe 11.16. Sei a⋆ ≥ 0 eine Nullfolge nicht-negativer reeller Zahlen. Zeige, daß
die Reihe Σ(−1)⋆ a⋆ konvergiert.
Beispiel 11.17. Für jedes x ∈ R ist
die Reihe
x2⋆
(2⋆)!
cos(x) :=
eine Nullfolge (10.33). Darum konvergiert
∞
X
(−1)m
m=0
x2m
(2m)!
Satz 11.18 (Majorantenkriterium). Seien a⋆ und b⋆ Folgen nicht-negativer
Zahlen derart, daß b⋆ einen Folgenrest a⋆+m fast überall majorisiert:
a⋆+m ✂ b⋆
Wenn die Reihe Σb⋆ konvergiert, dann konvergiert auch Σa⋆ .
79
Beweis. Zunächst beseitigen wir das fast“. Es gibt nämlich ein n ∈ N, so daß
”
a⋆+m+n ≤ b⋆+n . Nun sind die alle Folgenglieder nicht-negativ. Die Partialsummen
wachsen also monoton und es geht um die Frage ihrer Beschränktheit. Die
Partialsummen von a⋆ lassen sich beschränken durch die Partialsummen von b⋆
vermöge:
!
Σa⋆ ≤
m+n
X
ai + Σb⋆+n
q.e.d.
i=0
Beispiel 11.19. Sei a⋆ eine beschränkte Folge und 0 ≤ t < 1. Dann konvergiert
Σa⋆ t⋆ absolut. Ist nämlich |a⋆ | ≤ β, so wird |a⋆ t⋆ | durch βt⋆ majorisiert.
q.e.d.
Mit Blick auf (10.32) können wir also formulieren:
Korollar 11.20 (Quotientenkriterium). Sei a⋆ eine Folge. Gibt es 0 < t < 1 so
daß
|ai+1 | ≤ t |ai |
für alle i ≥ m gilt, so wird das Ende |a⋆+m | majorisiert von dem Vielfachen |am | t⋆
einer geometrischen Folge. Also ist ist die Reihe Σa⋆ absolut konvergent.
q.e.d.
Beispiel 11.21. Für jede reelle Zahl x ∈ R konvergieren die folgenden Reihen
absolut:
exp(x) =
sin(x) =
∞
X
xm
m=0 m!
∞
X
(−1)m
m=0
∞
X
x2m+1
(2m + 1)!
x2m
(−1)
cos(x) =
(2m)!
m=0
Denn
xm
m!
=
(2x)m 1 m
(2)
m!
und
(2x)m
m!
m
ist beschränkt (11.19).
q.e.d.
Satz und Definition 11.22 (Potenzreihe und Konvergenzradius). Eine
Reihe der Form Σa⋆ x⋆ heißt Potenzreihe. Dazu gibt es genau ein nicht-negatives
R ∈ R ∪ {∞} mit folgenden Eigenschaften:
1. Ist |x| < R, dann konvergiert Σa⋆ x⋆ absolut.
2. Ist |x| > R, dann divergiert Σa⋆ x⋆ .
Wir nennen R den Konvergenzradius der Potenzreihe Σa⋆ x⋆ . Er ist gegeben als das
Supremum der Menge
n
o
M := s ∈ R≥0 a⋆ s⋆ beschränkt
sofern sie beschränkt ist. Ist M unbeschränkt, so gilt R = ∞.
Bemerkung: der formal erlaubte Wert R = ∞ bedeutet einfach, daß x < ∞ stets und
x > ∞ niemals erfüllt ist.
80
Beweis. Ist 0 ≤ x < y ∈ M, dann ist mit t :=
x
y
< 1:
a⋆ x⋆ = (a⋆ y ⋆ )t⋆
ein Produkt aus einer beschränkten und einer geometrischen Folge. Nach (11.19)
konvergiert Σa⋆ x⋆ also absolut. Daraus folgt die erste Behauptung.
Ist umgekehrt 0 < y 6∈ M und y ≤ z dann ist a⋆ z ⋆ nicht beschränkt und die Reihe
Σa⋆ z ⋆ divergiert. Daraus folgt die zweite Behauptung.
q.e.d.
Bemerkung 11.23. Im Konvergenzgebiet definiert eine Potenzreihe eine
reellwertige Funktion. Funktionen, die sich so beschreiben lassen, heißen analytisch.
Sie werden uns noch beschäftigen.
Lemma 11.24. Sei f (x) := Σa⋆ x⋆ eine Potenzreihe mit positivem
Konvergenzradius R > 0. Sei ξ⋆ eine Nullfolge, die ganz im Gebiet BR (0) absoluter
Konvergenz liegt und für keinen Index den Wert 0 annimmt. Dann ist
a0 = lim f (ξi )
i→∞
Im Vorgriff auf später: Die von der Potenzreihe dargestellte Funktion ist stetig bei
x = 0.
Beweis. Für |ξ| <
a1 ξ 1
R
2
können wir abschätzen
+ a2 ξ 2 + a3 ξ 3 + a4 ξ 4 + · · · ≤ |ξ|
∞
X
i=1
|ai | |ξ|i−1 ≤ |ξ|
∞
R
2X
|ai |
R i=1
2
i
≤ |ξ| β
Für ε > 0 ist also f (ξ) ∈ Bε (a0 ), falls |ξ| β < ε ist. Dies trifft auf fast alle ξi
zu.
q.e.d.
Bemerkung 11.25. Potenzreihen sind das Hilfsmittel für die Berechnung
interessanter Funktionen. Ein guter Teil Analysis ist der Frage gewidmet, wieviele
Glieder einer Potenzreihe man aufsummieren muß, wenn eine vorgegebene
Genauigkeit erreicht werden soll.
Aufgabe 11.26. Sei Σa⋆ x⋆ eine Potenzreihe vom Konvergenzradius R. Zeige, daß
die formale Ableitung Σ(⋆ + 1)a⋆+1 x⋆ ebenfalls den Konvergenzradius R hat.
Aufgabe 11.27. Sei Σa⋆ x⋆ eine Potenzreihe vom Konvergenzradius R. Zeige, daß
a⋆ ⋆+1
das formale Integral Σ ⋆+1
x
ebenfalls den Konvergenzradius R hat.
Aufgabe 11.28. Zeige, daß Σ⋆!x⋆ Konvergenzradius 0 hat.
81
11.3
Doppelsummen und Produkte
Aufgabe 11.29. Definiere die Folge der Dreieckszahlen
δ(0) := 0
δ(m + 1) = δ(m) + m + 1
und beobachte, daß sie streng monoton wächst. Nun definiere
f : N × N −→ N
(x, y) 7→ x + δ(x + y)
Zeige, daß f bijektiv ist.
Definition 11.30. Eine Abbildung a : N × N −→ R heißt Doppelfolge. Der
P
entsprechende Summenausdruck ∞
i,j=0 aij heißt Doppelreihe. Die Doppelfolge a⋆•
heißt summierbar, wenn die Menge

 X
beschränkt ist.

(i,j)∈M


|aij | M ⊆ N × N endlich
Aufgabe 11.31. Zeige, daß eine Doppelfolge a⋆• : N × N −→ R genau dann
summierbar ist, wenn die Menge der Quadratsummen“
”

m X
m
X
beschränkt ist.

i=0 j=0


|aij | m ∈ N
Satz 11.32 (Doppelreihensatz). Sei a⋆• eine summierbare Doppelfolge. Dann
gilt:
1. Für jede Bijektion f : N → N × N konvergiert die Reihe Σaf (⋆) absolut gegen
einen von f unabhängigen Wert λ.
2. Die Zeilen ai• und Spalten a⋆j haben absolut konvergente Reihen Σai• und
Σa⋆j . Ferner konvergieren die Reihe der Spaltensummen und die Reihe der
Zeilensummen beide absolut, und zwar gegen λ.
∞ X
∞
X
aij = λ =
i=0 j=0
∞ X
∞
X
aij
j=0 i=0
Wir nennen die Bijektion f : N → N × N eine Anordnung der Doppelfolge a⋆• .
82
Beweis. Sei f : N → N × N eine beliebige Bijektion (existiert nach 11.29). Dann
folgt aus der Summierbarkeit die absolute Konvergenz der Reihe Σaf (⋆) , denn die
Mengen {f (0) , . . . , f (i)} sind allesamt endlich.
Jede andere Bijektion g : N → N × N führt auf eine Reihe die sich nur durch
Umordnung von jener unterscheidet. Diese ist darum auch absolut konvergent und
die Summe ändert sich ebenfalls nicht.
Die Summierbarkeit liefert ebenfalls unmittelbar, daß jede Zeilensumme Σai• und
jede Spaltensumme Σa⋆j absolut konvergiert.
Sei nun β eine Summierbarkeitsschranke für die Doppelfolge a⋆• . Dann ist für alle
P
Pn
m, n ∈ N: m
i=0
j=0 |aij | ≤ β Also ist sind die monoton wachsenden Folgen
Pm Pn
n 7→ i=0 j=0 |aij | alle durch β beschränkt. Übergang zum Grenzwert liefert dann
die Abschätzung
β≥
m X
∞
X
i=0 j=0
|aij | ≥
m X
X
∞
aij i=0 j=0
P P
was die absolute Konvergenz der Reihe der Zeilensummen i j aij impliziert. Für
die Reihe der Spaltensummen argumentiert man entsprechend.
P P
Also konvergiert i j aij und es bleibt noch zu sehen, daß λ die Summe dieser
Reihe der Zeilensummen ist. Sei ε > 0. Wir benutzen (11.7) und finden zunächst ein
h ∈ N mit:
∞ X
ε
af (k) <
2
k=h+1
Nun wählen wir ein m ∈ N mit
{f (0) , f (1) , . . . , f (h)} ⊆ {(i, j) i, j ≤ m}
Dann ist für ni , nj ≥ m stets
X
nj
ni X
ai,j
i=0 j=0
−
af (k) k=0
ni ∞
X X
ai,j
i=0 j=0
−
af (k) k=0
h
X
≤
Die Ungleichung bleibt für nj → ∞ erhalten:
Andererseit ist auch:
h
X
λ −
a
f (k) h
X
=
k=0
Mithin ist
∞
X
a
f (k) k=h+1
ni X
∞
X
i=0 j=0
für fast alle ni ∈ N. Damit ist
P P
i
≤
j
∞ X
af (k) <
ε
2
<
ε
2
k=h+1
∞ X
af (k) k=h+1
≤
∞ X
af (k) k=h+1
<
ε
2
ai,j ∈ Bε (λ)
ai,j = λ.
83
q.e.d.
Satz 11.33 (Cauchy-Produkt). Seien Σa⋆ und Σb⋆ zwei absolut konvergente
P
P
Reihen. Dann konvergiert Σ(a⋆ ∗ b⋆ ) absolut gegen ( ⋆ a⋆ )( ⋆ b⋆ ).
Beweis. Wir betrachten die Doppelfolge
(i, j) 7→ ai bj
und beobachten, daß sie summierbar ist: Für jede endliche Teilmenge M ⊆ N × N ist
X
(i,j)∈M
|ai bj | =
X
(i,j)∈M
|ai | |bj | ≤
∞
X
i=0

! ∞
X
|ai |  |bj | 
j=0
Damit konvergiert jede Anordnung dieser Doppelreihe absolut und gegen dieselbe
Reihensumme.
Gliedweise Multiplikation der Partialsummenfolgen ergibt zunächst:
(
P
X
a )(
⋆ ⋆
X
b ) = lim
⋆ ⋆
m→∞
X
ai
i≤m
X
j≤m
bj = lim
m→∞
X X
ai bj
i≤m j≤m
P
Die Terme i≤m j≤m ai bj treten jedoch als Teilfolge der Partialsummen einer
bestimmten Anordnung der Doppelreihe auf:
(a0 b0 ) + (a0 b1 + a1 b1 + a1 b0 ) + (a0 b2 + a1 b2 + a2 b2 + a2 b1 + a2 b1 ) + · · ·
P
P
Darum konvergiert die Doppelreihe ij ai bj gegen das Produkt ( ⋆ a⋆ )(
Die Partialsummen von Σ(a⋆ ∗ b⋆ ) lassen sich ebenfalls als Teilfolge der
Partialsummen einer Anordnung der Doppelfolge auffassen:
P
⋆ b⋆ ).
(a0 b0 ) + (a0 b1 + a1 b0 ) + (a0 b2 + a1 b1 + a2 b0 ) + · · ·
Also hat diese Reihe dieselbe Reihensumme. Diese Anordnung entspricht der
Bijektion aus (11.29).
q.e.d.
Anwendung und Definition 11.34. Seien Σa⋆ x⋆ und Σb⋆ x⋆ zwei Potenzreihen.
Wir bilden ihr formales Produkt durch Ausmultiplizieren und Zusammenfassen von
Termen gleicher Ordnung:
(Σa⋆ x⋆ )(Σb⋆ x⋆ ) = (a0 + a1 x + a2 x2 + · · · )(b0 + b1 x + b2 x2 + · · · )
= (a0 b0 ) + (a0 b1 + a1 b0 )x + (a0 b2 + a1 b1 + a2 b0 )x2 + · · ·
= Σ(a⋆ ∗ b⋆ )x⋆
Das formale Produkt der Potenzreihen korrespondiert dem Faltungsprodukt der
Koeffizientenfolgen.
Wo beide Potenzreihen absolut konvergieren, konvergiert das formale Produkt auch,
und zwar gegen das Produkt der Reihensummen.
84
Beweis. Folgt aus (11.33) und der Identität
(a⋆ ∗ b⋆ )x⋆ = (a⋆ x⋆ ) ∗ (b⋆ x⋆ )
q.e.d.
Das ist aber nur die generalisierte Form der offensichtlichen Gleichung
m
X
!
m
ai bm−i x =
i=0
m
X
(ai xi )(bm−i xm−i )
q.e.d.
i=0
Aufgabe 11.35. Seien s, t > 0 mit s − t = 1. Zeige, daß das Cauchy-Produkt der
Reihen
s + s + s2 + s3 + s4 + s5 + s6 + · · ·
und
−t + t + t2 + t3 + t4 + t5 + t6 + · · ·
absolut konvergiert.
11.4
Der binomische Satz
Definition 11.36 (Binomialkoeffizient). Für zwei natürliche Zahlen m ≤ n heißt
!
n!
n
:=
m
m!(n − m)!
Binomialkoeffizient. Man spricht das Symbol als n über m“ aus. Ich sage gern “m
”
aus n“ wegen der kombinatorischen Interpretation (11.38).
Beobachtung 11.37. Für m + 1 ≤ n ist:
!
!
n!
n!
n
n
+
=
+
(m + 1)!(n − m − 1)! m!(n − m)!
m
m+1
n!(n − m)
n!(m + 1)
=
+
(m + 1)!(n − m)! (m + 1)!(n − m)!
n!(n − m) + n!(m + 1)
=
(m + 1)!(n − m)!
n!(n + 1)
=
(m + 1)!(n − m)!
!
(n + 1)!
n+1
=
=
(m + 1)!(n − m)!
m+1
Aufgabe 11.38. Eine endliche Menge der Größe n hat genau
Größe m.
Satz 11.39 (Binomischer Satz).
k
(x + y) =
k
X
i=0
85
!
k i k−i
xy
i
n
m
Teilmengen der
Beweis. Wir gehen mit Induktion nach k vor. Der Fall k = 0 ist klar.
Für den Induktionsschritt rechnen wir
(x + y)k+1 = (x + y)(x + y)k = (x + y)
k X
k
i
xi y k−i
i=0
=
k X
i=0
=
=
=
k
i
xi y k−i+1 +
k
i
i=0
k
0
k X
x0 y k+1 +
k X
k
i
xi+1 y k−i
k−1
X k
k
i+1 k−i
x
y
+
xk+1 y 0
i
k
i=0
k−1
X k xi+1 y k−i + xk+1 y 0
i
i=0
xi y k−i+1 +
i=1
k−1
X k xi+1 y k−i +
x0 y k+1 +
i+1
i=0
k−1
X k+1
k+1
0 k+1
xi+1 y k−i
x
y
+
i+1
0
i=0
+
k+1
k+1
xk+1 y 0
Damit ist das Gewünschte gezeigt.
q.e.d.
Korollar 11.40 (Funktionalgleichung der Exponentialfunktion).
exp(x + y) = exp(x) exp(y)
Beweis. Wir werten von rechts nach links aus und erhalten mit der Produktformel
für absolut konvergente Reihen:
∞
X
xm
exp(x) exp(y) =
m=0 m!
=
=
∞
X
!
∞
X
yn
n=0 n!
!
=
∞
X
xm y n
k=0 m+n=k m! n!
X
∞
1 X
1 X k m n
k! m n X
x y =
x y
m
k!
m!n!
k!
k=0
k=0
m+n=k
m+n=k
∞
X
1
(x + y)k = exp(x + y)
k!
k=0
q.e.d.
Aufgabe 11.41. Für jedes x ∈ R gilt exp(x) =
1
.
exp(−x)
Aufgabe 11.42. Zeige exp(r) > 0 für jede reelle Zahl x ∈ R.
Aufgabe 11.43. Die Exponentialfunktion x 7→ exp(x) wächst streng monoton.
Aufgabe 11.44. Zu jedem ε > 0 gibt es ein x ∈ R mit exp(x) < ε
Aufgabe 11.45. Zeige:
sin(x − y) = sin(x) cos(y) − cos(x) sin(y)
86
Aufgabe 11.46. Zeige:
cos(x − y) = cos(x) cos(y) + sin(x) sin(y)
Aufgabe 11.47. Zeige:
sin(x + y) = sin(x) cos(y) + cos(x) sin(y)
cos(x + y) = cos(x) cos(y) − sin(x) cos(y)
Hinweis: Eine Ableitung aus den Subtraktionstheoremen bietet sich an.
Aufgabe 11.48. Zeige:
sin(x)2 + cos(x)2 = 1
87
12
Integration
Definition 12.1. Seien a ≤ b reelle Zahlen. Wir führen Bezeichnungen für folgende
Teilmengen von R ein:
(a, b) := {x ∈ R
[a, b] := {x ∈ R
(a, b] := {x ∈ R
[a, b) := {x ∈ R
(−∞, b] := {x ∈ R
(−∞, b) := {x ∈ R
[a, ∞) := {x ∈ R
(a, ∞) := {x ∈ R
(−∞, ∞) := R
a < x < b}
a ≤ x ≤ b}
a < x ≤ b}
a ≤ x < b}
x ≤ b}
x < b}
a ≤ x}
a < x}
offenes Intervall
abgeschlossenes Intervall
halboffenes Intervall
halboffenes Intervall
Diese Teilmengen von R heißen Intervalle. Die oberen vier Typen von Intervallen
sind beschränkte Teilmengen von R. Wir nennen sie auch beschränkte Intervalle
und die anderen unbeschränkte Intervalle. Die reellen Größen a und b heißen linke
bzw. rechte Intervallgrenze. Ihre Differenz b − a heißt Länge des Intervalls. Die
Länge eines beschränkten Intervall I ⊂ R notieren wir mit |I|.
Wir nennen auch unbeschränkte Intervalle offen, wenn sie nur runde Klammern
involvieren, d.h., ihre Intervallgrenzen nicht enthalten.
Wir nennen ein Intervall entartet, wenn es aus einem einzigen Punkt besteht oder
leer ist.
Bemerkung 12.2. Die leere Menge läßt mit (a, a) eine Darstellung als
beschränktes offenes Intervall zu. Ein einzelner Punkt wird dargestellt durch [a, a].
In beiden Fällen ist die Länge 0. Ein beschhränktes Intervall ist genau dann
nicht-entartet, wenn es strikt positive Länge hat.
Beobachtung 12.3. Der Durschnitt zweier Intervalle ist ein Intervall. Der Schnitt
zweier beschränkter Intervalle ist ein beschränktes Intervall.
Definition 12.4. Sei I := [a, b] ein abgeschlossenes, beschränktes, nicht-entartetes
Intervall. Unter einer Unterteilung von I verstehen wir eine endliche Teilmenge
J ⊆ I, die die Endpunkte enthält: {a, b} ⊆ J . Die Elemente von J nennen wir
Unterteilungspunkte oder Unterteilungsstellen.
Als Teilmenge J ⊆ I ⊆ R erbt eine Unterteilung die ≤-Relation von den reellen
Zahlen. Als endliche angeordnete Menge ist J wohlgeordnet (4.21). Die Elemente
von J lassen sich also der Größe nach nummerieren:
J = {a = a0 < a1 < · · · < an = b}
Die offenen Intervalle (ai , ai+1 ) nennen wir Unterteilungsstücke oder
Unterteilungsintervalle.
88
Beobachtung 12.5. Da die Unterteilungsstücke als offene Intervalle definiert sind,
ist keiner der Unterteilungspunkte in einem der Unterteilungsstücke enthalten.
Andererseits liegt jeder Punkt s ∈ I \ J , der kein Unterteilungspunkt ist, in genau
einem Unterteilungsstück.
q.e.d.
Bemerkung 12.6. Man kann die Unterteilungsstücke ohne expliziten Verweis auf
die Nummerierung aus der Menge J der Unterteilungspunkte gewinnen. Dazu
betrachen wir die folgende Relation auf I:
x∼y
:⇐⇒
∃[a, b] ⊆ I : {x, y} ⊆ [a, b] und [a, b] ∩ J = ∅
Dann liegen x und y genau dann im gleichen Unterteilungsstück, wenn x ∼ y gilt.
Insbesondere ist x 6∼ x genau dann, wenn x ein Unterteilungspunkt ist.
Definition 12.7. Sind J1 und J2 zwei Unterteilungen von I mit
{a, b} ⊆ J1 ⊆ J2 ⊆ I,
so heißt J2 eine Verfeinerung von J1 . Bei einer Verfeinerung kommen also nur
Unterteilungspunkte hinzu, es gehen aber keine verloren.
Äquivalent: Jedes Unterteilungsstück der Verfeinerung J2 ist enthalten in einem
Unterteilungsstück J1 .
Definition 12.8 (Treppenfunktion). Sei I := [a, b] ein abgeschlossenes,
beschränktes, nicht-entartetes Intervall und f : I → R eine reellwertige Funktion auf
I. Wir nennen f eine Treppenfunktion, wenn es eine Unterteilung
J = {a = a0 < a1 < · · · < an = b} von I gibt, so daß f konstant ist auf jedem der
Unterteilungsstücke (ai , ai+1 ). Wir sagen in diesem Fall, daß J bezeugt, daß f eine
Treppenfunktion ist.
Bemerkung 12.9. Man kann diese Bedingung auch ohne Rekurs auf die
Nummerierung der Unterteilungspunkte formulieren. Die Unterteilung J bezeugt,
daß f : I → R eine Treppenfunktion ist, genau dann, wenn für x ≤ y aus I gilt:
f (x) 6= f (y)
=⇒
∃a ∈ J : x ≤ a ≤ y
Also: Zwei Stellen, an denen sich f unterscheidet, sind durch mindestens einen
Unterteilungspunkt getrennt.
Beobachtung 12.10. Ist die Unterteilung J ein Zeuge dafür, daß f : I → R eine
Treppenfunktion ist, so ist jede Verfeinerung von J ebenfalls Zeuge dafür.
Bemerkung und Definition 12.11. Die Menge aller Treppenfunktionen auf dem
Intervall I notieren wir mit Tr(I). Wir behaupten, daß Tr(I) ein Vektorraum ist,
d.h., abgeschlossen bezüglich punktweiser Addition von Funktionen und punktweiser
Multiplikation mit Skalaren.
89
Multiplikation ist dabei klar: Ist f : I → R eine Treppenfunktion mit Zeuge J ⊂ I
und s ∈ R, so ist das Produkt sf : I → R eine Treppenfunktion, und wir erfahren
das vom gleichen Zeugen J .
Seien nun f1 , f2 : I → R zwei Treppenfunktionen mit Zeugen J1 bzw. J2 . Dann ist
die Vereinigung J1 ∪ J2 eine gemeinsame Verfeinerung, die bezeugt, daß die Summe
f1 + f2 eine Treppenfunktion ist. Ist nämlich x ≤ y mit
f1 (x) + f2 (x) 6= f1 (y) + f2 (y), so folgt f1 (x) 6= f1 (y) oder f2 (x) 6= f2 (y). Mithin sind
x und y durch einen Unterteilungspunkt aus J1 oder J2 getrennt.
12.1
Die Fläche unter dem Graphen einer Treppenfunktion
Lemma und Definition 12.12. Sei I ein abgeschlossenes, beschränktes,
nicht-entartetes Intervall und f : I → R eine Treppenfunktion, bezeugt von der
Unterteilung J = {a0 < a1 < · · · < an } ⊆ I. Für i ∈ [n] wählen wir einen beliebigen
Punkt xi ∈ (ai , ai+1 ) im jeweiligen Unterteilungsstück. Dann ist
Z
n−1
X
f :=
I
i=0
f (xi ) (ai+1 − ai )
unabhängig von der Wahl der bezeugenden Unterteilung J und unabhängig von der
Wahl der Stützstellen xi .
R
Wir nennen I f das bestimmte Integral von f oder auch die
Fläche unter dem Graphen.
Beweis. Die Unabhängigkeit von der Wahl der Stützstellen xi ist klar: Eben weil
die Treppenfunktion konstant auf dem Unterteilungsstück (ai , ai+1 ) ist, hängt der
Faktor f (xi ) nicht davon ab, welcher Punkt in (ai , ai+1 ) genau gewählt wird.
Für die Unabhängigkeit von der Verteilung führen wir zunächst eine Bezeichnung
ein, die die erst auszuschließende Abhängigkeit von der Unterteilung wenigstens in
der Notation anzeigt. Wir setzen:
Z
f :=
J
n−1
X
i=0
f (xi ) (ai+1 − ai )
Nun ist zu zeigen:
Sind J1 und J2 zwei Unterteilungen von I, die beide bezeugen, daß
f : I → R eine Treppenfunktion ist, dann ist
Z
f=
J1
Z
J2
f
Diese Behauptung zeigen wir, indem wir argumentieren, daß sich das Integral
bezüglich einer Unterteilung nicht ändert, wenn wir zu einer Verfeinerung
übergehen. Dann ist nämlich
Z
J1
f=
Z
J1 ∪J2
90
f=
Z
J2
f,
denn J1 ∪ J2 ist ja eine gemeinsame Verfeinerung von J1 und J2 .
Invarianz des Integrals unter Unterteilung ergibt sich aber induktiv bereits daraus,
daß Hinzufügen eines einzelnen weiteren Unterteilungspunktes den Wert des
Integral nicht zu ändern vermag. Sei nun J eine bezeugende Unterteilung und
s ∈ (aj , aj+1) ein zusätzlicher Unterteilungspunkt. Dann ist
Z
J ∪{s}
f=
j−1
X
i=0
=
j−1
X
i=0
=
Z
J
f (xi ) (ai+1 − ai ) + f (xj ) (s − aj ) + f (xj ) (aj+1 − s) +
f (xi ) (ai+1 − ai ) + f (xj ) (aj+1 − aj ) +
n−1
X
i=j+1
n−1
X
i=j+1
f (xi ) (ai+1 − ai )
f (xi ) (ai+1 − ai )
f
Damit sind alle verbliebenen Beweislasten getilgt.
q.e.d.
Aufgabe 12.13. Im Beweis von (12.12) ist entscheidend, daß für zwei
Unterteilungen J1 und J2 , die beide bezeugten, daß f : I → R eine Treppenfunktion
ist, die Vereinigung J1 ∪ J2 ebenfalls bezeugt, daß f eine Treppenfunktion ist.
Zeige: Auch der Durchschnitt J1 ∩ J2 bezeugt, daß f eine Treppenfunktion ist.
Aufgabe 12.14. Sei f : I → R eine Treppenfunktion, und sei
M := {J ⊆ I J bezeugende Unterteilung für f }
die Menge aller Unterteilungen, die bezeugen, daß f eine Treppenfunktion ist.
Durch Inklusion (oder Verfeinerung) ⊆ ist eine Ordnungsrelation (keine Anordnung)
auf M gegeben. Zeige oder widerlege: M hat bezüglich Inklusion ein eindeutig
bestimmtes Minimum. Aquivalent: es gibt ein eindeutiges Element J ∈ M, so daß
jede Unterteilung in M eine Verfeinerung von J ist. Das hieße, die Treppenfunktion
f hat eine eindeutige gröbste“ Unterteilung, die ihre Treppenartigkeit bezeugt.
”
Aufgabe 12.15. Durch f 7→
R
I
f ist eine Abbildung
Z
: Tr(I) −→ R
defininiert. Zeige, daß diese Abbildung linear ist, das heißt:
1. Integration ist additiv:
Z
I
(f + g) =
Z
I
f+
Z
I
g
∀f, g ∈ Tr(I)
2. Integration ist verträglich mit skalarer Multiplikation:
Z
I
(sf ) = s
Z
I
∀s ∈ R, f ∈ Tr(I)
f
91
Proposition 12.16 (Monotonie). Durch f 7→
Z
R
I
f ist eine Abbildung
: Tr(I) −→ R
defininiert. Wir nehmen an, daß I nicht zu einem einzelnen Punkt entartet, also
|I| > 0. Dann ist diese Abbildung monoton in folgendem Sinne ist:
Sind f und g Treppenfunktionen auf I mit f < g, dann ist
Beweis. Mit Linearität (12.15) ist nur zu zeigen, daß
0<
Z
I
R
I
f<
R
I
g.
(g − f )
ist. Nun sei J eine Unterteilung von I, die bezeugt, daß g − f eine Treppenfunktion
ist. Auf den Unterteilungsstücken der Unterteilung ist g − f > 0 jeweils konstant.
Da es nur endlich viele Unterteilungsstücke gibt, nimmt g − f hier nur endlich viele,
sämtlich strikt positive Werte an. Es gibt also ein ε > 0, so daß g − f > ε auf allen
Unterteilungsstücken ist. Dann ist:
0 < |I| ε <
Z
I
(g − f )
q.e.d.
12.2
Das Integral nach Archimedes, Riemann und Darboux
In diesem Abschnitt wählen wir uns ein abgeschlossenes beschränktes Intervall
I = [a, b] mit a < b.
Definition 12.17. Sei f : I → R eine reellwertige Funktion auf dem
abgeschlossenenen Intervall I. Die Linksmenge L und Rechtsmenge R von f sind
wiefolgt erklärt:
L = L(f ) :=
R = R(f ) :=
Z
ZI
I
g g ∈ Tr(I) und g < f
g g ∈ Tr(I) und f < g
Wir schreiben L(f ) bzw. R(f ), wenn wir die Abhängigkeit von f betonen wollen,
oder wenn wir Links- und Rechtsmengen zu verschiedenen Funktionen betrachten.
Bemerkung 12.18. Es ist durchaus möglich, daß f keine majorisierende
Treppenfunktion zuläßt. In diesem Fall hat f eine leere Rechtsmenge. Entsprechend
kann der Fall einer leeren Linksmenge auftreten, wenn f keine Treppenfunktion
majorisiert.
Proposition 12.19. Es ist L < R, das heißt:
x ∈ L und y ∈ R
92
=⇒
x<y
R
Beweis. Sei x ∈ L und g : I → R eine Treppenfunktion
mit g < f und x = I g.
R
h
=
y ∈ R. Dann ist g < h und
Entsprechend sei h > f eine
Treppenfunktion
mit
I
R
R
q.e.d.
wegen (12.16) folgt x = I g < I h = y.
Aufgabe 12.20. Sei x < y. Zeige:
y∈L
x∈R
x∈L
y∈R
=⇒
=⇒
Die Analogie zu den Links- und Rechtsmengen einer Folge ist nicht zufällig. Wieder
ist es ein bemerkenswerter Fall, wenn das Supremum der Linksmenge mit dem
Infimum der Rechtsmenge übereinstimmt:
Definition 12.21. Wir nennen f : I → R integrierbar, wenn sup L = inf R gilt. In
diesem Fall nennen wir
Z
f := sup L = inf R
I
das bestimmte Integral der Funktion f auf dem Intervall I. Ist I = [a, b], schreiben
wir in Anlehnung an die Summennotation auch
Z
Z
b
a
f :=
I
f
Andere mögliche Notationen involvieren eine frei wählbare Integrationsvariable:
Z
b
a
f (x) d x =
Z
I
f (x) d x :=
Z
I
f
Aufgabe 12.22. Sei f : I → R eine Funktion auf einem abgeschlossenen,
beschänkten, nicht-entarteten Intervall. Zeige, daß folgende Bedingungen äquivalent
sind:
1. Die Funktion f ist integrierbar.
2. Für jedes ε > 0 gibt es Treppenfunktionen g+ , g− : I → R mit g− < f < g+
und:
Z
Z
g+ < ε + g−
I
I
3. Für jedes ε > 0 gibt es Treppenfunktionen g+ , g− : I → R mit g− ≤ f ≤ g+
und:
Z
Z
g+ ≤ ε + g−
I
I
4. Es gibt genau eine reelle Zahl ζ, so daß für jedes ε > 0 Treppenfunktionen
g+ , g− : I → R existieren mit g− < f < g+ und:
Z
I
g− < ζ <
Z
93
I
g+ < ε +
Z
I
g−
5. Es gibt genau eine reelle Zahl ξ, so daß für jedes ε > 0 Treppenfunktionen
g+ , g− : I → R existieren mit g− ≤ f ≤ g+ und:
Z
I
g− ≤ ξ ≤
Z
I
g+ ≤ ε +
Z
I
g−
Sind diese Bedingungen erfüllt, so ist
ζ=ξ=
Z
I
f
Proposition 12.23. Sei f : I → R monoton wachsend, d.h.:
x<y
f (x) ≤ f (y)
=⇒
∀x, y ∈ I
Zeige, daß f integrierbar ist.
Bemerkung: Analog zeigt man, daß monoton fallende Funktionen integrierbar sind.
Beweis. Sei I = [a, b] und für m ∈ N≥1 sei Jm die Unterteilung von I in m
gleichgroße Unterteilungsstücke:
Jm = {a = a0 < a1 < · · · < am = b}
mit
ai := a + i
Wir betrachten die Treppenfunktionen
−
fm
: I −→ R
x 7→



f (a0 )




f (a1 )



..
.





f (am−2 )




f (a
)
m−1
und
+
fm
: I −→ R
x 7→



f (a1 )





f (a2 )


..
.




f (am−1 )




f (a )
m
Dann ist
a0 ≤ x < a1
a1 ≤ x < a2
..
.
am−2 ≤ x < am−1
am−1 ≤ x ≤ am
a0 ≤ x < a1
a1 ≤ x < a2
..
.
am−2 ≤ x < am−1
am−1 ≤ x ≤ am
−
+
fm
≤ f ≤ fm
94
b−a
m
und
Z
I
+
fm
−
Z
I
−
fm
=
=
m−1
X
i=0
m−1
X
!
b−a
f (ai+1 ) −
m
m−1
X
i=0
!
b−a
f (ai )
m
b−a
(f (ai+1 ) − f (ai ))
m
i=0
X
b − a m−1
=
(f (ai+1 ) − f (ai ))
m i=0
b−a
=
(f (b) − f (a))
m
Zu jedem ε > 0 gibt es also ein m
Z
I
+
fm
≤ε+
Z
I
−
fm
und die Integrierbarkeit von f folgt aus (12.22).
q.e.d.
Korollar 12.24. Für jeden natürlichen Exponenten k ∈ N ist die Funktion x 7→ xk
auf [0, 1] monoton wachsend und damit integrierbar. Wir setzen
µk :=
Z
1
0
xk d x
q.e.d.
Bemerkung 12.25. Wir können das Integral auch ausrechnen:
µk =
Z
0
1
xk d x =
1
k+1
Später werden wir mit dem Hauptsatz einen wesentlich schnelleren Weg finden,
diesen Wert zu bestimmen. Hier folgt ein Argument, daß keine weitere Entwicklung
der Theorie benötigt.
Sei f : x 7→ xk definiert auf dem Intervall [0, 1]. Seien L und R die Links- bzw.
Rechtsmenge von f . Die konstanten Funktionen x 7→ −1 und x 7→ 2 zeigen, daß
−1 ∈ L und 2 ∈ R ist. Also ist L nach oben beschränkt (durch 2) und R nach unten
(durch −1). Insbesondere existieren sup L und inf R und es ist sup L ≤ inf R.
1
. Dazu konstuieren wir eine Familie von
Wir zeigen zunächst inf R ≤ k+1
Treppenfunktionen, die alle f majorisieren. Sei t ∈ (0, 1) und N ∈ N≥1 . Wir
betrachten die Unterteilung
0 < tN < tN −1 < · · · < t2 < t < 1
95
und definieren die Treppenfunktion
gt,N : [0, 1] −→ R
x 7→



tN k





t(N −1)k



..

.


tk







1


2
0 < x < tN
tN < x < tN −1
..
.
t2 < x < t
t<x<1
an Unterteilungspunkten
Mit
dieser künstlichen Wahl an den Unterteilungsstellen ist f < gt,N . Wir berechnen
R1
0 gt,N :
Z
0
1
gt,N = 1k (1 − t) + tk (t − t2 ) + t2k (t2 − t3 ) + · · · + t(N −1)k (tN −1 − tN ) + tN k (tN − 0)
= (1 − t) 1 + tk+1 + t2(k+1) + · · · + t(N −1)(k+1) + tN k tN
= (1 − t)
1 − tN (k+1)
+ tN (k+1)
1 − tk+1
Also ist
1 − tN (k+1)
+ tN (k+1)
1 − tk+1
und durch den Grenzübergang N → ∞ erhalten wir:
inf R ≤ (1 − t)
inf R ≤
1
1−t
=
k+1
2
1−t
1 + t + t + · · · + tk
Nun wollen wir t ganz nah bei 1 wählen. Formal betrachten wir eine Folge ti , die
gegen 1 konvergiert. Wir können zum Beispiel ti := 1 − 21i wählen. Betrachten wir
damit den Grenzübergang i → ∞, erhalten wir schließlich die gewünschte
Ungleichung:
1
1
inf R ≤
=
1+1+···+1
k+1
Um sup L abzuschätzen, betrachten wir die Treppenfunktionen
ht,N : [0, 1] −→ R
x 7→



0



tN k





..
.


t2k






tk




−1
0 < x < tN
tN < x < tN −1
..
.
t2 < x < t
t<x<1
an Unterteilungspunkten
96
mit f > ht,N . Nun ist
Z
0
1
ht,N = tk (1 − t) + t2k (t − t2 ) + t3k (t2 − t3 ) + · · · + tN k (tN −1 − tN ) + 0(tN − 0)
= tk (1 − t) 1 + tk+1 + t2(k+1) + · · · + t(N −1)(k+1)
= tk (1 − t)
Also ist
1 − tN (k+1)
∈L
1 − tk+1
1 − tN (k+1)
1 − tk+1
und mit dem Grenzüberganz N → ∞ ergibt sich:
sup L ≥ tk (1 − t)
sup L ≥ tk (1 − t)
1
1
k 1−t
k
=
t
=
t
1 − tk+1
1 − tk+1
1 + t + t2 + · · · + tk
Daraus analog zum vorigen Fall:
1
k+1
sup L ≥
Also ist sup L =
1
k+1
= inf R.
Beispiel 12.26. Die Funktion

0
f : x 7→  1
x
x=0
x 6= 0
ist auf dem Intervall [0, 1] nicht integrierbar. Genauer, ihre Rechtsmenge R ist leer
und ihre Linksmenge L enthält alle reellen Zahlen.
Beweis. Die Funktion f wird
von keiner Treppenfunktion majorisiert, denn f ist
auf [0, 1] unbeschränkt: f m1 = m. Also ist R = ∅.
Nun zeigen wir, daß L nach oben unbeschränkt ist. Dann folgt L = R aus (12.20).
Für m ∈ N betrachten wie die Treppenfunktion
gm : [0, 1] −→ R
x 7→


−1






2m





2m−1



2m−2


..



.






21




1
x ist Unterteilungspunkt
0 < x < 21m
1
1
< x < 2m−1
2m
1
1
< x < 2m−2
2m−1
..
.
1
4
1
2
Die Fläche unter dem Graphen von gm ist
Damit ist L nach oben unbeschränkt.
< x < 21
<x<1
m+2
.
2
97
Also ist
m+2
2
∈ L für jedes m ≥ 1.
q.e.d.
12.3
Elementare Eigenschaften des Integral
Wir fixieren wieder ein abgeschlossenes, beschränktes, nicht-entartetes Intervall I.
Beobachtung 12.27 (Monotonie). Sind f und g reellwertige Funktionen
definiert auf I und gilt f ≤ g, dann wird jede von f strikt majorisierte
Treppenfunktion auch von g strikt majorisiert. Es folgt:
L(f ) ⊆ L(g)
Sind f und g überdies integrierbar, dann ist
Z
I
f = sup L(f ) ≤ sup L(g) =
Z
I
g
q.e.d.
Frage 12.28. Seien f, g : I → R beide integrierbar und es gelte f < g, d.h., f wird
von g strikt majorisiert. Folgt dann auch eine strikte Ungleichung
Z
I
f<
Z
I
g
für die Integrale? Wenn f und g beide Treppenfunktionen sind, haben wir in (12.16)
eine positive Antwort gefunden. Für den allgemeinen Fall, sehe ich noch kein
Argument. Später werden wir sehen, daß zumindest für stetige Funktionen die
Antwort ebenfalls positiv ist.
Lemma 12.29 (Additivität). Seien f, g : I → R zwei integrierbare Funktionen.
Dann ist die Summe f + g : I → R integrierbar, und es gilt:
Z
I
(f + g) =
Z
I
f +
Z
I
g
Beweis. Seien f− , f+ , g− , g+ Treppenfunktionen definiert auf I mit:
f− < f < f+
und
g − < g < g+
Dann sind f− + g− und f+ + g+ ebenfalls Treppenfunktionen und es gilt:
f− + g− < f + g < f+ + g+
Also ist:
L(f + g) ⊇ {x + y x ∈ L(f ) und y ∈ L(g)} =: L(f ) + L(g)
R(f + g) ⊇ {x + y x ∈ R(f ) und y ∈ R(g)} = R(f ) + R(g)
Dann folgt aus sup L(f ) = inf R(f ) und sup L(g) = inf R(g):
sup L(f + g) ≥ sup L(f )+sup L(g) = inf R(f )+inf R(g) ≥ inf R(f + g) ≥ sup L(f + g)
q.e.d.
98
Aufgabe 12.30. Sei f : I → R eine integrierbare Funktion und α ∈ R ein Skalar.
Dann ist das Vielfache αf : I → R integrierbar, und es gilt:
Z
I
αf = α
Z
f
I
Wir können die beiden Aussagen kombinieren zu:
Korollar 12.31 (Linearität). Seien f1 , . . . , fm : I → R integrierbare Funktionen
und α1 , . . . , αm ∈ R feste Faktoren. Dann ist die Linearkombination
Pm
i=1 αi fi : I → R integrierbar, und es gilt:
Z X
m
I i=1
m
X
αi fi =
αi
i=1
Z
I
fi
q.e.d.
Aufgabe 12.32. Sei f : I → R integrierbar und α 6= 0. Dann ist die Funktion
g : αI −→ R
x
x 7→ f
α
integrierbar, und es gilt:
Z
αI
g = |α|
Z
I
f
Proposition 12.33 (Integrierbarkeit auf Teilintervallen). Sei f : I → R
integrierbar und J ⊆ I ein abgeschlossenes Teilintervall von I. Dann ist die
Einschränkung f |J : J → R ebenfalls integrierbar.
Beweis. Sei f integrierbar, also sup L(f
) = inf
R(f ).R Für jedes ε > 0 gibt es also
R
R
Treppenfunktionen g− < f < g+ mit I g+ − I g− = I (g+ − g− ) < ε.
Wir schränken g± auf das Teilintervall J ein und erhalten:
g− | J < f | J < g+ | J
und:
Z
J
Damit ist
g+ −
Z
J
Z
g− =
J
(g+ − g− ) ≤
Z
I
(g+ − g− ) < ε
sup L(f |J ) ≤ inf R(f |J ) ≤ sup L(f |J ) + ε
und die Integrierbarkeit der Einschränkung f |J folgt.
∀ε > 0
q.e.d.
Proposition 12.34 (Unterteilungsadditivität). Sei I = [a, c] und b ∈ I. Ferner
sei f : I → R eine Abbildung. Sind die Einschränkungen f |[a,b] und f |[b,c] beide
integrierbar, so ist f integrierbar, und es gilt:
Z
c
a
f=
Z
b
a
f+
99
Z
b
c
f
Beweis. Sei gL eine Treppenfunktion auf [a, b] mit gL < f |[a,b] und gR eine
Treppenfunktion auf [b, c] mit gR < f |[b,c]. Wir definieren
g : [a, c] −→ R
x 7→

g
g
(x) a ≤ x ≤ b
b<x≤c
R (x)
L
R
R
R
Dann ist g eine Treppenfunktion mit g < f und ac g = ab gL + bc gR , denn wir
R
können ac g ausrechnen bezüglich einer Unterteilung, die b enthält.
Es folgt
L(f ) ⊇ L f |[a,b] + L f |[b,c]
Analog sieht man
R(f ) ⊇ R f |[a,b] + R f |[b,c]
Daraus folgt
sup L(f ) ≥ sup L f |[a,b] +sup L f |[b,c] = inf R f |[a,b] +inf R f |[b,c] ≥ inf R(f ) ≥ sup L(f )
Also ist f integrierbar mit:
Z
c
f=
a
Z
Z
b
f+
a
c
f
b
q.e.d.
Bemerkung 12.35. Wir setzen
Z
b
und
a
f := −
Z
c
Z
b
a
f
c
f =0
für alle a, b, c.
Damit ist dann unabhängig von den Größenverhältnissen zwischen a, b, und c stets
Z
c
a
f=
Z
b
a
f+
Z
b
c
f
sobald f integrierbar ist auf dem kleinsten Intervall, das a, b und c enthält.
q.e.d.
Beispiel 12.36. Für jeden Exponenten k ∈ N ist die Funktion f : x 7→ xk auf
jedem abgeschlossenen beschränkten Intervall [a, b] integrierbar und es gilt
Z
b
a
xk d x = µk bk+1 − ak+1
Beweis. Zunächst wenden wir (12.32) auf das Beispiel (12.24) an und erhalten: Für
k
α > 0 ist x 7→ αxk auf [0, α] integrierbar und es ist
Z
α
0
xk
dx =
αk
Z
0
α
k
x
α
dx = α
100
Z
0
1
xk d x = αµk
Anwendung der Linearität ergibt die Integrierbarkeit von x 7→ xk auf [0, α] mit:
Z
α
xk d x = µk αk+1
0
Für α < 0 erhält man Integrierbarkeit auf [α, 0] mit:
Z
0
α
Also:
Z
0
α
xk
d x = −µk α
αk
xk d x = −µk αk+1
Der allgemeine Fall ergibt sich daraus durch Verkleben mit (12.34). Haben a und b
gleiches Vorzeichen, so ist zusätzlich Umzustellen. Zum Beispiel für 0 < a < b ist:
Z
b
a
12.4
k
x dx =
Z
0
b
k
x dx−
Z
0
a
xk d x = µk bk+1 − ak+1
q.e.d.
Rechnen mit integrierbaren Funktionen
In der Linearität (12.31) drückt sich aus, daß Summen und Differenzen
integrierbarer Funktionen und ihre skalaren Vielfachen wieder integrierbar sind.
Aber was ist mit Produkten und Quotienten?
Wir fixieren wieder ein abgeschlossenes, beschränktes, nicht-entartetes Intervall I.
Proposition 12.37. Zu einer Funktion f : I → R definieren wir die erweiterten
Links- und Rechtsmengen wiefolgt:
L̃ = L̃(f ) :=
R̃ = L̃(f ) :=
Z
ZI
I
g g < f und g integrierbar
g f < g und g integrierbar
Dann ist wegen (12.27) L̃ ≤ R̃. Insbesondere ist R̃ nach unten beschränkt, wenn L̃
nicht-leer ist. Umgekehrt ist L̃ nach oben beschränkt, wenn R̃ nicht-leer ist.
Die Abbildung f ist integrierbar genau dann, wenn L̃ und R̃ beide nicht-leer sind
und sup L̃ = inf R̃ gilt.
Bemerkung 12.38. Der Wert dieses Kriterium liegt darin, daß wir zum Nachweis,
daß f integrierbar ist, nicht unbedingt Treppenfunktionen heranziehen müssen.
Andere Funktionen, deren Integrierbarkeit schon bekannt ist, reichen auch.
Beweis. Da jede Treppenfunktion integrierbar ist, gelten die Inklusionen:
L ⊆ L̃
und
R ⊆ L̃
Insbesondere sind L̃ und R̃ nicht-leer, wenn L und R nicht-leer sind. Außerdem folgt
aus den Inklusionen die Unlgeichung:
sup L ≤ sup L̃ ≤ inf R̃ ≤ inf R
101
Sei nun R̃ nicht-leer. Dann gibt es eine integrierbare Funktion g > f . Weil g
integrierbar ist, gibt es eine Treppenfunktion g+ > g > f . Also ist auch R nicht-leer.
Ist R̃ überdies nach unten beschränkt, so gibt es zu jedem ε > 0 eine integrierbare
R
Funktion g > f mit 2ε + inf R̃ > I g.R Wir können
ferner eine Treppenfunktion
R
ε
g+ > g > f finden, so daß auch 2 + I g > I g− gilt. Dann aber ist
R
ε + inf R̃ > I g− ≥ inf R. Da diese Abschätzung für jedes ε > 0 gilt, folgt
inf R ≤ inf R̃.
Entsprechend gilt sup L̃ ≤ sup L, falls L̃ nicht-leer und nach oben beschränkt ist.
Also sind L und R beide nicht-leer genau dann, wenn L̃ und R̃ beide nicht-leer sind.
In diesem Fall ist überdies
sup L = sup L̃
und
inf R = inf R̃
Also ist f genau dann integrierbar, wenn L̃ und R̃ beide nicht-leer sind und
sup L̃ = inf R̃ gilt.
q.e.d.
Beobachtung 12.39. Das Produkt einer Treppenfunktion g : I → R und einer
integrierbaren Funktion f : I → R ist integrierbar.
Beweis. Zunächst (12.30) ist das Produkt einer integrierbaren Funktion mit einer
Konstanten wieder integrierbar. Nun zerfällt der Definitionsbereich der
Treppenfunktion g in endlich viele Intervalle, auf denen die Funktion konstant ist.
Auf jedem dieser Unterteilungsstücke ist das Produkt f g also integrierbar.
Aus (12.34) folgt dann die Integrierbarkeit des Produktes f g auf I.
q.e.d.
Proposition 12.40. Das Produkt zweier integrierbarer Funktionen f, g : I → R ist
integrierbar.
Beweis (erste Version). Zunächst ist für jede feste Zahl α ∈ R:
f g = (f + α)g − αg
Also ist f g (genau dann) integrierbar, wenn (f + α)g integrierbar ist. Durch
geeignete Wahl von α können wir also o.B.d.A. annehmen, daß f > 0 ist.
Da f integrierbar ist, gibt es eine Konstante β > 0 mit f < β.
Sei nun ε > 0. Da g integrierbar ist, können wir Treppenfunktionen g− < g < g+
finden, so daß
Z
Z
ε Z
g− < g+ < + g−
β
I
I
I
ist.
Nach (12.39) sind f g− < f g und f g+ > f g integrierbar. Also ist
Z
f g− ∈ L̃(f g) 6= ∅
I
Z
und
I
f g+ ∈ R̃(f g) 6= ∅
Ferner ist
Z
I
f g+ −
Z
I
f g− =
Z
I
f (g+ − g− ) ≤
Z
I
β(g+ − g− ) ≤ β
ε
=ε
β
Diese Abschätzung gilt für jedes ε > 0 und es folgt sup L̃(f g) = inf R̃(f g), woraus
mit (12.37) die Integrierbarkeit von f g folgt.
q.e.d.
102
Beweis (alternative Version). In dieser Fassung behandeln wir f und g gleich,
außerdem vermeiden wir die Verwendung von Proposition (12.37).
Zunächst rechnen wir nach, daß für zwei beliebige Skalare α, β ∈ R gilt:
f g = (f + α)(g + β) − αg − βf − αβ
Es folgt, daß f g (genau)dann integrierbar ist, wenn das Produkt (f + α)(g + β)
integrierbar ist. Da f und g integrierbar und damit beschränkt sind, können wir α
und β so wählen, daß gilt:
0<f +α
und
0<g+β
Wir können also o.B.d.A. annehmen, daß 0 < f und 0 < g gilt.
Auf kompakten Intervallen sind integrierbare Funktionen sind beschänkt. Also gibt
es Konstanten 0 < α, β ∈ R mit:
α<f <β
und
α<g<β
Sei nun ε > 0 beliebig. Wir finden Treppenfunktionen f− , f+ , g− , g+ mit:
α < f− < f+ < β
und
α < g− < g+ < β
und
Z
und:
Z
Z
Z
ε
+
f− < f < f+ <
2β
I
I
I
Z
I
f−
Z
Z
ε
g− < g < g+ <
+
2β
I
I
I
Z
I
g−
Sei nun
J = {a0 < a1 < · · · < an }
eine Unterteilung, die für alle vier Treppenfunktionen als bezeugende Unterteilung
herhalten kann. Seien xi ∈ (ai , ai+1 ) in den Unterteilungsstücken gewählte
Stützstellen. Dann sind f− g− < f g < f+ g+ Treppenfunktionen, was ebenfalls die
Unterteilung J bezeugt. Wir erhalten als Abschätzung für die Fläche zwischen der
oberen und unteren Treppenfunktion:
Z
I
f+ g+ − f− g− =
=
=
≤
n−1
X
i=0
n−1
X
i=0
n−1
X
i=0
n−1
X
(ai+1 − ai )(f+ (xi ) g+ (xi ) − f− (xi ) g− (xi ))
(ai+1 − ai )(f+ (xi ) g+ (xi ) − f− (xi ) g+ (xi ) + f− (xi ) g+ (xi ) − f− (xi ) g− (xi ))
(ai+1 − ai )((f+ (xi ) − f− (xi ))g+ (xi ) + f− (xi ) (g+ (xi ) − g− (xi )))
(ai+1 − ai )((f+ (xi ) − f− (xi ))β + β(g+ (xi ) − g− (xi )))
i=0
n−1
X
=β
=β
i=0
n−1
X
i=0
<β
(ai+1 − ai )((f+ (xi ) − f− (xi )) + (g+ (xi ) − g− (xi )))
(ai+1 − ai )(f+ (xi ) − f− (xi )) + β
ε
ε
+β
=ε
2β
2β
103
n−1
X
i=0
(ai+1 − ai )(g+ (xi ) − g− (xi ))
Diese Abschätzung beschließt den Beweis.
q.e.d.
Proposition 12.41. Sei f : I → R eine integrierbare Funktion mit 0 < α < f für
eine Konstante α ∈ R. Dann ist f1 integrierbar.
Beweis. Zu jedem ε > 0 gibt es Treppenfunktionen α ≤ f− < f < f+ mit
Z
I
f− <
Z
I
f+ < α2 ε +
Z
I
f−
Der Kehrwert einer nirgends verschwindenden Treppenfunktion ist wieder eine
Treppenfunktion (man kann dieselbe bezeugende Unterteilung verwenden). Wir
behaupten, daß die Fläche zwischen f1− und f1+ höchstens ε ist. Das reicht
nach (12.22).
Sei J = {a0 < a1 < · · · < an } eine Unterteilung die bezeugt, daß f− und f+
Treppenfunktionen sind. Seien xi ∈ (ai , ai+1 ) Stützstellen. Dann ist nach Wahl von
f− und f+ :
n−1
X
i=0
(ai+1 − ai )(f+ (xi ) − f− (xi )) < α2 ε
Wir rechnen für den Kehrwert:
n−1
X
1
1
−
(ai+1 − ai )
f− (xi ) f+ (xi )
i=0
!
n−1
X
f+ (xi ) − f− (xi )
=
(ai+1 − ai )
f− (xi ) f+ (xi )
i=0
n−1
X
f+ (xi ) − f− (xi )
(ai+1 − ai )
≤
α2
i=0
!
!
X
1 n−1
(ai+1 − ai )(f+ (xi ) − f− (xi ))
2
α i=0
1
< 2 α2 ε = ε
α
≤
q.e.d.
12.5
Gleichmäßige Konvergenz
Definition 12.42 (Funktionenfolgen). Sei M eine Menge und f⋆ : M → R sei
eine Folge reellwertiger Funktionen auf M. Das ist nichts anderes als eine Funktion
f : N × M → R, aber wir betrachten die Funktionen x 7→ f (i, x) als einzelne
reellwertige Funktionen fi auf M, indiziert durch das erste Argument i.
Natürlich können wir mit gleichem Recht für festes m ∈ M, die Abbildung
i 7→ fi (m) als eine Zahlenfolge f⋆ (m) auffassen. Das führt auf den ersten
Konvergenzbegriff für Funktionenfolgen:
Definition 12.43 (Punktweise Konvergenz). Sei M eine Menge und
f⋆ : M → R eine Folge reellwertiger Funktionen auf M. Für jedes Element m ∈ M
ist dann f⋆ (m) eine Zahlenfolge. Wir sagen, daß die Funktionenfolge f⋆
104
konvergiert punktweise gegen die Funktion g : M → R, wenn f⋆ (m) für jedes
m ∈ M gegen g(m) konvergiert. Wir können das ausbuchstabieren: f⋆ konvergiert
punktweise gegen g genau dann, wenn für jedes m ∈ M und jedes ε > 0 ein
Schwellindex h ∈ N existiert, so daß fi (m) ∈ Bε (g(m)) für alle i ≥ h gilt. Formal:
∀m ∈ M ∀ε > 0 ∃h ∈ N ∀i ≥ h : fi (m) ∈ Bε (g(m))
Punktweise Konvergenz ist ein sehr schwacher Begriff von Konvergenz. Das
Hauptproblem ist, daß zwar alle Folgen f⋆ (m) konvergieren, aber die
Geschwindigkeit der Konvergenz für unterschiedliche m ∈ M ganz verschieden sein
kann. Für viele Anwendungen sind stärkere Annahmen nötig. Bewährt hat sich
diese Verschärfung:
Definition 12.44 (Gleichmäßige Konvergenz). Sei M eine Menge und
f⋆ : M → R eine Folge reellwertiger Funktionen auf M. Die Folge f⋆
konvergiert gleichmäßig gegen g : M → R, wenn wenn für jedes ε > 0 ein
Schwellindex h ∈ N existiert, so daß fi (m) ∈ Bε (g(m)) für alle i ≥ h und alle
m ∈ M gilt. Formal:
∀ε > 0 ∃h ∈ N ∀i ≥ h ∀m ∈ M : fi (m) ∈ Bε (g(m))
Man sieht, die beiden Varianten unterscheiden sich in der Abfolge der Quantoren.
Daraus ergibt sich unmittelbar:
Beobachtung 12.45. Konvergiert f⋆ : M → R gleichmäßig gegen g : M → R, so
konvergiert f⋆ auch punktweise gegen g.
q.e.d.
Beispiel 12.46. Sei f (x) = Σa⋆ x⋆ eine Potenzreihe mit Konvergenzradius R und I
sei ein abgeschlossenes beschränktes Intervall in (−R, R). Dann konvergiert die
Funktionenfolge der Partialsummen
fm (x) :=
m
X
ai xi
i=0
auf I gleichmäßig gegen die Funktion f .
Beweis. Sei I = [a, b] mit |a| < R und |b| < R. Sei c der größere der beiden Werte
|a| und |b|. Dann ist 0 < c < R und Σa⋆ c⋆ konvergiert absolut.
Sei nun ε > 0 beliebig. Da Σa⋆ c⋆ absolut konvergiert, gibt es ein h ∈ N, so daß
P∞
i
i=h |ai | c < ε ist. Dann ist für jedes m ≥ h und jedes x ∈ I:
|f (x) − fm (x)| =
X
i>m
ai xi ≤
X ai xi i>m
≤
∞
X
i=h
|ai | ci < ε
Also konvergiert die Funktionenfolge f⋆ gleichmäßig gegen f .
q.e.d.
Satz 12.47. Sei I ein abgeschlossenes beschränktes Intervall und f⋆ : I → R eine
Folge integrierbarer Funktionen, die gleichmäßig gegen eine Funktion g : I → R
konvergiert. Dann ist g integrierbar, und es gilt
Z
I
g = lim
Z
i→∞ I
105
fi
Beweis. Sei L die Linksmenge der Funktion g, und sei Li für i ∈ N die Linksmenge
von fi . Analog sei R die Rechtsmenge von g und Ri die Rechtsmenge von fi .
Wegen gleichmäßiger Konvergenz gilt: Zu ε > 0 gibt es einen Schwellindex h ∈ N, so
daß für jedes i ≥ h gilt:
fi (x) −
ε
ε
< g(x) ∈< fi (x) +
4 |I|
4 |I|
∀x ∈ I
Da jedes fi integrierbar ist, gibt es außerdem Treppenfunktionen fi− , fi+ : I → R
mit fi− < fi < fi+ und
Z
I
Dann sind fi± ±
ε
4|I|
fi− <
Z
I
fi <
Z
I
fi+ <
ε Z −
+ fi
4
I
Treppenfunktionen mit:
ε
ε
< g < fi+ +
4 |I|
4 |I|
fi− −
Darum ist:
L∋
Analog ist:
Z
I
ε
fi− −
4 |I|
!
Z
=
Z
I
fi−
ε
− >
4
Z
I
fi −
ε
∈R
2
I
Daraus folgen zwei Dinge. Zunächst folgt,
ε
∈L
2
∀i ≥ h
∀i ≥ h
fi +
0 ≤ inf R − sup L < ε
∀ε > 0
und daraus mit (8.9) die Integrierbarkeit von g:
inf R = sup L =
Z
I
g =: ζ
Zum anderen folgt nun auch:
Z
I
fi − ζ <
ε
2
∀i ≥ h
Wieder gilt dies für jedes ε > 0 mit einem
jeweils von ε abhängigen h. Das heißt, in
R
jeder ε-Umgebung von ζ liegen fast alle I g. Nach Definition der Konvergenz (9.8)
ist also:
Z
Z
g = ζ = lim fi
q.e.d.
I
i→∞ I
Aufgabe 12.48. Die Voraussetzung der gleichmäßigen Konvergenz kann in (12.47)
nicht zu punktweiser Konvergenz abgeschwächt werden. Finde Beispiele für folgende
Szenarien:
106
1. Die Folge f⋆ konvergiert punktweise gegen g und alle fi sind integrierbar, aber
g ist nicht integrierbar.
2. Die Folge f⋆ konvergiert punktweise gegen
g und alle fi sind integrierbar, und
R
g ist auch integrierbar, aber die Folge I f⋆ konvergiert nicht.
3. Die Folge f⋆ konvergiert punktweise gegen g und alle fi sind integrierbar, und
R
R
g ist auch integrierbar, und die Folge I f⋆ konvergiert, aber nicht gegen I g.
Korollar 12.49 (Gliedweise Integration). Sei f (x) = Σa⋆ x⋆ eine Potenzreihe
mit Konvergenzradius R und [a, b] sei ein abgeschlossenes beschränktes Intervall in
(−R, R). Dann ist f auf [a, b] integrierbar und es gilt:
Z
∞
bX
a i=0
ai xi d x =
∞ Z
X
b
i=0 a
ai xi d x =
∞
X
i=0
µi ai (bi+1 − ai+1 ) =
Beweis. Wende Satz (12.47) auf Beispiel (12.46) an.
∞
X
ai
(bi+1 − ai+1 )
i
+
1
i=0
q.e.d.
Wir haben in (12.36) gesehen,
daß es feste Koeffizienten µk gibt, so daß
k
k+1
k+1
gilt. In den beiden folgenden Aufgaben nehmen wir im
−a
a x d x = µk b
1
ist.
Vorgriff auf später (oder unter Verwendung von (12.25)) an, daß µk = k+1
Rb
Aufgabe 12.50. Zeige:
Z
y
0
exp(x) d x = exp(y) − 1
Aufgabe 12.51. Zeige:
Z
y
Z 0y
0
12.6
sin(x) d x = 1 − cos(y)
cos(x) d x = sin(y)
Unbestimmte Integrale
Definition 12.52. Sei I ein beliebiges Intervall (offen, abgeschlossen, beschränkt,
unbeschränkt, etc.) und f : I → R eine reellwertige Funktion auf I. Wir nennen f
integrierbar auf I, wenn
für jedes abgeschlossene beschränkte Teilintervall J ⊆ I das
R
bestimmte Integral J f existiert.
Definition 12.53. Sei I ein beliebiges Intervall und f : I → R eine integrierbare
reellwertige Funktion auf I. Wir nennen eine Funktion F : I → R ein
unbestimmtes Integral von f , wenn für beliebige Argumente a, b ∈ I gilt:
Z
b
a
f = F (b) − F (a)
107
Proposition 12.54. Jede integrierbare Funktion f : I → R hat ein unbestimmtes
Integral. Es ist eindeutig bestimmt durch f bis auf Addition einer Konstanten.
Beweis. Sei r ∈ I fest gewählt.
Zunächst zur Eindeutigkeit. Seien F1 , F2 : I → R zwei Integrale von f . Dann ist für
jedes x ∈ I die Differenz
F1 (x) − F2 (x) = (F1 (x) − F1 (r)) − (F2 (x) − F2 (r)) + (F1 (r) − F2 (r))
=
Z
x
r
f−
Z
x
r
f + (F1 (r) − F2 (r))
= F1 (r) − F2 (r)
unabhängig von x. Also unterscheiden sich F1 und F2 nur um eine additive
Konstante.
Da f auf ganz I integrierbar ist, können wir eine Funktion definieren durch
F : I −→ R
Z
x 7→
x
f (s) d s
r
Diese Funktion F ist ein unbestimmtes Integral von f nach (12.34) und (12.35):
Z
b
a
f=
Z
b
r
f−
Z
a
r
f = F (b) − F (a)
Das zeigt die Existenz.
q.e.d.
Beispiel 12.55. Sei f (x) := Σa⋆ x⋆ eine Potenzreihe mit Konvergenzradius R. Dann
ist wegen (12.49) die Funktion f auf dem offenen Intervall (−R, R) integrierbar und
durch gliedweise Integration erhalten wir ein unbestimmtes Integral:
F : (−R, R) −→ R
x 7→
Z
∞
X
x
0
f (r) d r =
µk ak xk+1 =
k=0
Es sei daran erinnert, daß die Potenzreihe
Konvergenzradius R hat.
P∞
ak k+1
k=0 k+1 x
∞
X
ak k+1
x
k=0 k + 1
nach (11.27) ebenfalls den
Beispiel 12.56. Die Funktion
f : (0, ∞) −→ R
1
x 7→
x
ist im ganzen Definitionsbereich monoton fallend. Also ist sie integrierbar und
ln : (0, ∞) −→ R
x 7→
Z
1
x
f
ist ein unbestimmtes Integral. Wir nennen ln den natürlichen Logarithmus.
108
Proposition 12.57. Der natürliche Logarithmus genügt folgender
Funktionalgleichung:
ln(xy) = ln(x) + ln(y)
∀x, y ∈ (0, ∞)
Beweis.
Z
1
dr
r
1
Z xy
Z x
1
1
dr +
dr
=
r
1 r
x
Z xy
1
= ln(x) + x
dr
xr
x
Z y
1
x
dr
= ln(x) +
x 1 r
= ln(x) + ln(y)
ln(xy) =
xy
q.e.d.
Bemerkung 12.58. Es sei an die Funktionalgleichung der Exponentialfunktion
erinnert:
exp(x + y) = exp(x) exp(y)
∀x, y
In der Funktionalgleichung des Logarithmus sind die Rollen von Addition und
Multiplikation vertauscht. Es wird sich herausstellen, daß der natürliche
Logarithmus die Umkehrfunktion der Exponentialabbildung ist.
Aufgabe 12.59. Zeige, daß der natürliche Logarithmus im ganzen
Definitionsbereich streng monoton steigt.
Aufgabe 12.60. Wir betrachten die Verkettung
f : R −→ R
x 7→ ln(exp(x))
Zeige:
1. Die Abbildung f ist wohldefiniert, läßt sich also tatsächlich auf ganz R
erklären.
2. Die Abbildung f genügt der Funktionalgleichung:
f (r + s) = f (r) + f (s)
∀r, s ∈ R
3. Die Abbildung f steigt monoton.
Aufgabe 12.61. Sei f : R → R additiv und streng monoton wachsend. Zeige, daß
mit α := f (1) gilt:
f (x) = αx
∀x ∈ R
Also: f ist die Multiplikation mit einer Konstanten.
Hinweis: Man betrachte zunächst die rationalen Zahlen und setze dann auf ganz R
fort.
109
13
Stetigkeit
Sei I ein Intervall.
Definition 13.1. Sei f : M → L eine Abbildung und A ⊆ M eine Teilmenge des
Definitionsbereichs. Das Bild der Teilmenge A unter der Abbildung f bezeichnen
wir mit:
f (A) := {f (x) x ∈ A}
Für eine beliebige Menge K setzen wir
f (K) := f (K ∩ M) = {f (x) x ∈ K ∩ M}
Definition 13.2 (Stetigkeit). Eine Abbildung f : I → R heißt stetig im Punkt
x ∈ I, wenn gilt:
∀ε > 0 ∃δ > 0 : f (Bδ (x)) ⊆ Bε (f (x))
Sie heißt stetig, wenn sie in jedem Punkt x ∈ I stetig ist:
∀x ∈ I ∀ε > 0 ∃δ > 0 : f (Bδ (x)) ⊆ Bε (f (x))
Wir nennen die Abbildung f gleichmäßig stetig, wenn gilt:
∀ε > 0 ∃δ > 0 ∀x ∈ I : f (Bδ (x)) ⊆ Bε (f (x))
Beachte, daß die Bedingungen sich nur in der Reihenfolge der Quantoren
unterscheiden.
Bemerkung 13.3. Gleichmäßige Stetigkeit impliziert Stetigkeit.
Definition 13.4 (Folgenstetigkeit). Die Funktion f : I → R heißt
folgen-stetig im Punkt x ∈ I, wenn für jede Folge a⋆ von Zahlen in I, die gegen x
konvergiert, die Folge f (a⋆ ) gegen f (x) konvergiert:
∀a⋆ Folge in I : x = lim a⋆
⋆→∞
=⇒
f (x) = lim f (a⋆ )
⋆→∞
Die Abbildung f heißt folgen-stetig, wenn sie in jedem Punkt folgen-stetig ist.
Proposition 13.5. Sei f : I → R eine Funktion und x ∈ I, dann ist f in x stetig
genau dann, wenn f in x folgen-stetig ist.
Beweis. Zunächst nehmen wir an, f sei stetig in x. Sei ferner a⋆ eine Folge in I, die
gegen x konvergiert. Zu zeigen ist, daß die Folge f (a⋆ ) gegen f (x) konvergiert.
Sei nun ε > 0. Da f in x stetig ist, gibt es ein zugeöriges δ > 0 mit
f (Bδ (x)) ⊆ Bε (f (x)). Ist nun a⋆ eine Folge, die gegen x konvergiert, so liegen fast
alle Folgenglieder in Bδ (x), weil δ > 0 ist. Also gibt es einen Index h ∈ N, so daß
gilt:
ai ∈ Bδ (x)
∀i ≥ h
110
Aus f (Bδ (x)) ⊆ Bε (f (x)) folgt dann:
f (ai ) ∈ Bε (f (x))
∀i ≥ h
Das aber heißt, daß f (a⋆ ) gegen f (x) konvergiert.
Für die Umkehrung nehmen wir an, daß f nicht stetig in x sei. Dann gibt es ein
ε > 0 so daß für jedes noch so kleine δ > 0 ein x′ ∈ Bδ (x) ∩ I mit f (x′ ) 6∈ Bε (x)
existiert. Daraus basteln wir uns eine gegen x konvergierende Folge: Zu jedem
m ∈ N wählen wir (Auswahlaxiom) ein am ∈ I mit
1. |x − am | <
1
.
1+m
2. |f (x) − f (am )| ≥ ε
Die erste Bedingung impliziert, daß a⋆ gegen x konvergiert. Die zweite impliziert,
daß f (a⋆ ) auf keinen Fall gegen f (x) konvergiert.
q.e.d.
Korollar 13.6. Eine Funktion f : I → R ist stetig genau dann, wenn sie
folgen-stetig ist.
Beweis. Die Äquivalenz gilt an jeder Stelle x ∈ I.
q.e.d.
Aufgabe 13.7. Seien J ⊆ I Intervalle, davon J offen. Ferner sei x ∈ J eine Stelle
und f : I → R eine Funktion. Zeige, daß Stetigkeit in folgendem Sinne eine lokale
Eigenschaft ist:
Die Funktion f ist an der Stelle x genau dann stetig, wenn die
Einschränkung f |J an der Stelle x stetig ist.
13.1
Beispiele und Gegenbeispiele
Beispiel 13.8. Jede konstante Funktion f ist gleichmäßig stetig. Zu jedem ε > 0
kann man δ = 1 wählen.
Beispiel 13.9. Die identische Funktion x 7→ x ist gleichmäßig stetig: Man wähle
stets δ = ε.
Beispiel 13.10. Seien f, g : I → R beide stetig im Punkt x ∈ I. Dann ist auch jede
Linearkombination
αf + βg : I → R
stetig in x. Ebenso ist das Produkt
fg : I → R
stetig an der Stelle x. Wenn g nirgends in I verschwindet, ist der Quotient
definiert und stetig an der Stelle x.
111
f
g
Sei nämlich a⋆ eine beliebige Folge in I, die gegen x konvergiert. Dann ist
(αf + βg)(a⋆ ) = αf (a⋆ ) + βg(a⋆ )
Mit f (x) = lim⋆→∞ f (a⋆ ) und g(x) = lim⋆→∞ g(a⋆ ) folgt
(αf + βg)(x) = ⋆→∞
lim (αf + βg)(a⋆ )
aus (10.18). Die Stetigkeit von f g und
f
g
ergibt sich ebenso.
Korollar 13.11. Jedes Polynom
f (x) = a0 + a1 x + a2 x2 + · · · + an xn
beschreibt eine auf ganz R stetige Funktion.
q.e.d.
Aufgabe 13.12. Seien f, g : I → R beide gleichmäßig stetig. Dann ist auch jede
Linearkombination
αf + βg : I → R
gleichmäßig stetig.
Aufgabe 13.13. Gib Beispiele für gleichmäßig stetige Funktionen f, g : R → R
derart, daß das Produkt f g nicht gleichmäßig stetig ist.
Aufgabe 13.14. Sei f : I → R stetig auf dem Intervall I. Ferner nehmen wir an,
daß f nirgends verschwindet. Zeige, daß f1 stetig ist auf I.
Proposition 13.15. Sei f : I → R integrierbar und F : I → R ein unbestimmtes
Integral. Dann ist F stetig.
Beweis. Wir behandeln zunächst den Fall, daß I = [a, b] abgeschlossen, beschränkt
und nicht-entartet ist und x im Inneren liegt: a < x < b.
Da f auf [a, b] integrierbar ist, ist f auf [a, b] beschränkt nach oben (denn es gibt
eine majorisierende Treppenfunktion, und die hat nur endlich viele Werte), sagen
wir durch K+ , und beschränkt nach unten, sagen wir durch K− .
Für x ≤ x′ ≤ b ist die Einschränkung f |[x,x′] integrierbar und es gilt:
′
(x − x)K− ≤
Z
x′
x
f |[x,x′] = F (x′ ) − F (x) ≤ (x′ − x)K+
Für a ≤ x′ ≤ x ergibt sich auf gleiche Weise:
(x − x′ )K− ≤
Z
x
x′
f |[x,x′] = F (x) − F (x′ ) ≤ (x − x′ )K+
und wir erhalten für x′ ∈ [a, b]:
|F (x) − F (x′ )| ≤ |x − x′ | K
mit K := max {|K+ | , |K− |}
112
Daraus ergibt sich die Stetigkeit an der Stelle x.
Dieses Ergebnis überträgt sich unmittelbar auf die Situationen, in denen x in
folgendem Sinne im Inneren von I liegt: Wenn es a, b ∈ I mit a < x < b gibt, so ist
f an der Stelle x stetig.
Gibt es solche a oder b nicht, so liegt x am Rand von I. Dann betrachten wir [x, b]
oder [a, x] und die entsprechende Hälfte des eben gegebenen Arguments tut’s
schon.
q.e.d.
Beispiel 13.16. Insbesondere ist der natürliche Logarithmus im ganzen
Definitionsbereich stetig.
q.e.d.
Proposition 13.17. Sei f⋆ : I → R eine Funktionenfolge, die gleichmäßig gegen
die Grenzfunktion f : I → R konvergiert. Sind alle f⋆ stetig (an der Stelle x), so ist
auch f stetig (an der Stelle x).
Beweis. Wir geben zwei Beweise. Einmal benutzen wir Folgen-Stetigkeit und
einmal die ε-δ-Fassung von Stetigkeit.
Zunächst ein Beweis, der den Begriff der Folgen-Stetigkeit nutzt. Sei a⋆ eine Folge in
I, die gegen x konvergiert. Jede Funktion fi ist stetig in x. Also konvergiert fi (a⋆ )
gegen fi (x). Wir wollen zeigen, daß f (a⋆ ) gegen f (x) konvergiert. Dies geschieht
mittels der Dreiecksunlgeichung. Es ist nämlich:
|f (x) − f (aj )| ≤ |f (x) − fi (x)| + |fi (x) − fi (aj )| + |fi (aj ) − f (aj )|
∀i ∈ N
Sei nun ε > 0. Weil f⋆ gleichmäßig gegen f konvergiert, ist für fast alle i
ε
3
|fi (r) − f (r)| <
∀r ∈ I
Die gilt insbesondere für r = x und r = aj . Also gibt es ein i mit
|f (x) − fi (x)| <
ε
3
|fi (aj ) − f (aj )| <
und
ε
3
∀j
Schließlich ist fi stetig an der Stelle x und für fast alle j gilt dann
|fi (x) − fi (aj )| <
ε
3
Das aber impliziert, daß für fast alle j gilt:
|f (x) − f (aj )| ≤ |f (x) − fi (x)| + |fi (x) − fi (aj )| + |fi (aj ) − f (aj )| < ε
Damit konvergiert f (a⋆ ) gegen f (x).
Nun zu einem Beweis, der die ε-δ-Definition von Stetigkeit zugrunde legt. Die Idee
ist dieselbe, aber die Durchführung muß angepaßt werden. Sei also ε > 0. Gesucht
ist ein δ > 0 derart, daß für alle x′ ∈ I gilt:
|x − x′ | < δ
=⇒
|f (x) − f (x′ )| < ε
113
Wir benutzen wieder die Dreiecksungleichung:
|f (x) − f (x′ )| ≤ |f (x) − fi (x)| + |fi (x) − fi (x′ )| + |fi (x′ ) − f (x′ )|
Weil die Folge f⋆ gleichmäßig gegen f konvergiert, gibt es einen Index i, so daß gilt:
|f (x) − fi (x)| <
ε
3
und
|f (x′ ) − fi (x′ )| <
ε
3
∀x′ ∈ I
Ferner ist fi stetig bei x, also gibt es δ > 0 mit
|x − x′ | < δ
=⇒
|fi (x) − fi (x′ )| <
ε
3
Für dieses δ gilt also auch:
|x − x′ | < δ
=⇒
|f (x) − f (x′ )| ≤ |f (x) − fi (x)|+|fi (x) − fi (x′ )|+|fi (x′ ) − f (x′ )| < ε
Dieses δ > 0 bezeugt dann auch, daß f an der Stelle x stetig ist.
q.e.d.
Korollar 13.18. Jede Potenzreihe beschreibt im Gebiet absoluter Konvergenz eine
stetige Funktion. Insbesondere ist die Exponentialfunktion stetig.
q.e.d.
Aufgabe 13.19. Sei f⋆ : I → R eine Funktionenfolge, die gleichmäßig gegen die
Grenzfunktion g : I → R konvergiert. Alle Funktionen f⋆ seien gleichmäßig stetig.
Zeige, daß die Grenzfunktion g auch gleichmäßig stetig ist.
Beispiel 13.20. Die Funktion
f : (0, 1) −→ R
1
x 7→
x
ist stetig, aber nicht gleichmäßig stetig.
Beweis. Stetigkeit folgt mit (13.10).
Seien nun ε > 0 und 12 > δ > 0. Dann gilt für x ∈ (0, δ):
(0, 1) ∩ Bδ (x) = (0, x + δ)
Insbesondere ist f auf (0, 1) ∩ Bδ (x) unbeschränkt. Darum ist
f (Bδ (x)) 6⊆ Bε (f (x))
q.e.d.
Beobachtung 13.21. Jedes nicht-entartete Intervall enthält rationale Zahlen, die
in Grunddarstellung einen geraden Nenner haben, und rationale Zahlen, die in
Grunddarstellung einen ungeraden Nenner haben.
114
hat in Grunddarstellung einen geraden Nennen
Beweis. Ein Bruch der Form 2m+1
n
genau dann, wenn n gerade ist.
Halten wir den Nenner n fest, so ist der Abstand zwischen zwei
aufeinanderfolgenden Brüchen dieser Form gerade n2 . Ist also n so groß, daß n2
kleiner ist als die Länge des Intervalls, so fällt eine rationale Zahl dieser Form mit
dem gewählten Nenner in das Intervall. Offenbar können wir sowohl gerade als auch
ungerade Nenner vorgeben, die groß genug sind.
q.e.d.
Beispiel 13.22. Eine Funktion f die auf rationalen Zahl dann 0 ist, wenn der
Nenner in Grunddarstellung gerade ist, und 2, wenn der Nenner in
Grunddarstellung ungerade ist, ist nirgends stetig: Für x beliebig und 0 < ε < 1 läßt
sich einfach kein δ > 0 finden.
Aufgabe 13.23. Wir nennen das Kreuzprodukt I × J ⊆ R × R zweier
nicht-entarteter Intervalle I und J ein Rechteck. (Wäre eines der Intervalle leer, so
wäre das Produkt leer, und bestünde eines der Intervalle nur aus einem Punkt, so
wäre das Prodult ein Strich.)
Eine Teilmenge A ⊆ R × R der Ebene nennen wir dicht, wenn es jedes Rechteck
I × J nicht-trivial schneidet, d.h., jeder Durchschnitt A ∩ (I × J) ist nicht-leer.
Zeige: Es gibt eine Funktion f : R → R, deren Graph eine dichte Teilmenge von
R × R ist.
Aufgabe 13.24. Seien I und J Intervalle. Ferner seien f : I → J und g : J → R
Abbildungen. Wir nehmen an, daß f stetig an der Stelle x ist und daß g stetig an
der Stelle f (x) ist. Zeige, daß die Verkettung g ◦ f : I → R an der Stelle x stetig ist.
Gib zwei Beweise, einen unter Verwendung von Folgenstetigkeit und einen, der die
ε-δ-Definition von Stetigkeit benutzt.
Natürlich soll hier (13.5) nicht verwendet werden. Welcher Beweis war einfacher zu
finden?
Aufgabe 13.25. Sei I ein nicht-entartetes Intervall und t ∈ I eine Stelle darin. Sei
g : I \ {t} → R eine Funktion, die an der Stelle t nicht definiert ist. Zeige: Es gibt
genau dann eine Funktion f : I → R mit
1. f ist an der Stelle t stetig.
2. f stimmt auf I \ {t} mit g überein.
wenn gilt:
Für je zwei beliebige Folge a⋆ und b⋆ in I \ {t}, die beide gegen t
konvergieren, sind die Folgen g(a⋆ ) und g(b⋆ ) kokonvergent.
Wir sagen in dieser Situation, daß f die Abbildung g stetig fortsetzt auf die Stelle t.
115
13.2
Eigenschaften stetiger Funktionen
Stetige Funktionen auf zeigen auf abgeschlossenen beschränkten Intervallen
besonders gutes Verhalten.
Satz 13.26 (Beschränktheit). Sei f : [a, b] → R stetig. Dann ist f auf [a, b]
beschränkt.
Beweis. Wir zeigen, daß f nach oben beschränkt ist. Andernfalls gibt es eine
monoton wachsende und unbeschränkte Folge y⋆ im Bild von f . Für jedes yi wählen
wir ein Urbild ai und erhalten eine Folge a⋆ im Intervall [a, b], so daß f (a⋆ ) monoton
wächst und nach oben unbeschränkt ist.
Da a⋆ beschränkt ist, können wir zu einer konvergenten Teilfolge übergehen und
somit o.B.d.A. annehmen, daß a⋆ konvergiert. Sei x := lim⋆→∞ a⋆ ∈ [a, b]. Die Folge
f (a⋆ ) ist Teilfolge einer monoton wachsenden und nach oben unbeschränkten Folge.
Insbesondere konvergiert f (a⋆ ) nicht, was im Widerspruch zur Stetigkeit von f steht.
Daß f nach unten beschränkt ist, sieht man analog ein.
q.e.d.
Ein ganz ähnliches Argument zeigt:
Satz 13.27 (Minimaxprinzip). Sei f : [a, b] → R stetig. Dann nimmt die
Funktion f in ihrem Definitionsbereich ihr Minimum und ihr Maximum an. Das
heißt es gibt r, s ∈ [a, b] mit
f (r) = inf {f (x) x ∈ [a, b]}
f (s) = sup {f (x) x ∈ [a, b]}
Beweis. Da f auf [a, b] beschränkt ist, existiert das Supremum
sup {f (x) x ∈ [a, b]} und eine Folge y⋆ im Bild von f , die gegen das Supremum
konvergiert. Mit dem Auswahlaxiom gehen wir zu einer Folge a⋆ von Urbildern in
[a, b] über, für die gilt:
sup {f (x) x ∈ [a, b]} = lim f (a⋆ )
⋆→∞
Wir können o.B.d.A. annehmen, daß a⋆ gegen eine Stelle x ∈ [a, b] konvergiert. Da f
an der Stelle x stetig ist, folgt:
sup {f (x) x ∈ [a, b]} = lim f (a⋆ ) = f (x)
⋆→∞
Daß die Funktion f auch ihr Minimum annimt, sieht man auf gleichem
Wege.
q.e.d.
Satz 13.28 (Zwischenwertsatz). Sei f : [a, b] → R stetig und y liege zwischen
f (a) und f (b). Dann gibt es eine Stelle x ∈ [a, b], mit f (x) = y.
116
Beweis. Für y = f (a) oder y = f (b) ist nichts zu zeigen. Wir behandeln den Fall
f (a) < y < f (b). Der umgekehrte Fall hat einen entsprechenden Beweis.
Setze
L := {r ∈ [a, b] ∀s ∈ [a, r] : f (s) < y}
R := {r ∈ [a, b] ∃s ∈ [a, r] : f (s) ≥ y}
Dann ist L < R und [a, b] = L ∪ R. Außerdem ist a ∈ L und b ∈ R. Es folgt:
sup L = inf R =: x
Wir behaupten, daß f (x) = y ist. Zunächst läßt sich x als Grenzwert einer Folge aus
L beschreiben. Mit Stetigkeit folgt dann f (x) ≤ y.
Aus x = inf R ergibt sich jedoch, daß wir x als Grenzwert einer Folge a⋆ darstellen
können, mit f (ai ) ≥ y für jeden Index i. Dann folgt mit Stetigkeit f (x) ≥ y. q.e.d.
Proposition 13.29. Sei I = [a, b] abgeschlossen und beschränkt. Dann ist eine auf
I stetige Funktion f : I → R sogar gleichmäßig stetig auf I.
Beweis. Setze für x ∈ I und ε > 0:
∆ε (x) := {δ > 0 f (Bδ (x)) ⊆ Bε (f (x))}
δ ε (x) := sup ∆ε (x) ∈ R ∪ {∞}
Zu zeigen ist, daß es zu jedem ε > 0 ein δ > 0 gibt, mit
δ ε (x) > δ
∀x ∈ I
Wir gehen indirekt vor und nehmen das Gegenteil an. Dann gibt es ein ε > 0 und
eine Folge a⋆ mit:
lim δ ε (a⋆ ) = 0
⋆→∞
Wir nehmen o.B.d.A. an, daß a⋆ gegen einen Wert r ∈ I konvergiert. Hier benutzen
wir, daß I abgeschlossen und beschränkt ist.
Zunächst beobachten wir, daß für ε′ < ε die Inklusion ∆ε′ (x) ⊆ ∆ε (x) gilt. Daraus
folgt 0 < δ ε′ (x) ≤ δ ε (x). Mithin ist auch δ ε′ (a⋆ ) eine Nullfolge.
Setze:
δ := δ 2ε (r)
Nun gibt es einen Index h ∈ N, daß gilt:
ai ∈ B δ (r)
∀i ≥ h
2
Ist nun s ∈ I mit |s − ai | <
δ
2
ist dann:
|s − r| ≤ |s − ai | + |ai − r| < δ
und:
|f (s) − f (ai )| ≤ |f (s) − f (r)| + |f (r) − f (ai )| <
117
ε ε
+ =ε
2 2
Also folgt:
δ
∀i ≥ h
2
Das steht im Widerspruch dazu, daß δ ε (a⋆ ) eine Nullfolge ist.
δε (ai ) >
q.e.d.
Satz 13.30 (Integrierbarkeit). Eine stetige Funktion f : I → R definiert auf
einem Intervall I ist integrierbar auf I. ZurR Erinnerung: Das heißt, für jedes Paar
a < b in I existiert das bestimmte Integral ab f .
Beweis. Nach (13.29) ist f auf dem abgeschlossenen Intervall [a, b] gleichmäßig
stetig. Wir wenden nun das Kriterium (12.22) an. Sei also ε > 0. Wegen
gleichmäßiger Stetigkeit gibt es ein δ > 0, so daß für alle x, x′ ∈ [a, b] gilt:
|x − x′ | < δ
=⇒
|f (x) − f (x′ )| <
ε
(b − a)
Nun wählen wir eine Unterteilung
J = {a = a0 < a1 < · · · < an = b}
so daß jedes Unterteilungsstück eine Länge ai+1 − ai < δ hat. Das bedeutet, daß für
jedes Unterteilungsstück gilt:
max ({f ([ai , ai+1 ])}) − min ({f ([ai , ai+1 ])}) <
ε
(b − a)
ist. Darum können wir Treppenfunktionen f− ≤ f ≤ f+ finden mit
Z
b
a
f+ −
Z
b
a
f− < ε
q.e.d.
Aufgabe 13.31. Sei I ⊆ R ein Intervall und f : I eine stetige Funktion. Zeige: Das
Bild f (I) ist ein Intervall.
Aufgabe 13.32. Sei I = [a, b] ein beschränktes, abgeschlossenes Intervall und
f : I → R eine stetige Funktion mit Bild f (I) ⊆ I, d.h., f ist eine stetige
Selbstabbildung des Intervalls in sich selbst. Zeige: f hat einen Fixpunkt, d.h., es
gibt eine Stelle t ∈ I mit f (t) = t.
Aufgabe 13.33. Sei f : [a, b] → R stetig. Zeige: Es gibt eine Folge g⋆ : [a, b] → R
von Treppenfunktionen, die gleichmäßig gegen f konvergiert.
Aufgabe 13.34. Zeige oder widerlege die Aussage: Jede Folge von
Treppenfunktionen, die punktweise gegen eine stetige Abbildung f : [a, b] → R
konvergiert, konvergiert schon gleichmäßig gegen f .
118
13.3
Der Mittelwertsatz der Integralrechnung
Satz 13.35 (Mittelwertsatz mit Dichtefunktion). Seien f : [a, b] → R stetig
und ρ : [a, b] → R integrierbar. Ferner sei ρ ≥ 0. Dann gibt es eine Stelle t ∈ [a, b]
mit
Z b
Z b
f ρ = f (t)
ρ
a
a
Dieselbe Folgerung gilt, falls ρ ≤ 0 im ganzen Definitionsbereich ist: Man betrachte
einfach −ρ auf beiden Seiten.
Beweis. Wir betrachten die Funktion
g : [a, b] −→ R
Z
x 7→ f (x)
b
a
Z
ρ−
Z
b
fρ =
a
b
a
(f (x) − f (s))ρ(s) d s
Da f stetig ist, gibt es nach dem Maximumprinzip (13.27) Stellen xmin und xmax mit:
f (xmin ) = inf f
und
f (xmax ) = sup f
Dann ist
g(xmin ) = f (xmin )
g(xmin ) = f (xmax )
Z
b
Z
b
a
a
ρ−
Z
ρ−
b
fρ =
a
Z
Z
b
Z
b
b
fρ =
a
(inf f − f (s)) ρ(s) d s ≤ 0
a
a
|
{z
≤0
} | {z }
≥0
(sup f − f (s)) ρ(s) d s ≥ 0
|
{z
≥0
} | {z }
≥0
Nun ist auch g stetig (13.10) und somit gibt es nach dem Zwischenwertsatz (13.28)
eine Stelle t mit g(t) = 0. Das aber heißt:
f (t)
Z
b
a
ρ=
Z
b
a
fρ
q.e.d.
Für die Dichtefunktion ρ(x) := 1 folgt unmittelbar:
Korollar 13.36 (Mittelwertsatz der Integralrechnung). Sei f : [a, b] → R
stetig (und damit integrierbar). Dann gibt es eine Stelle t ∈ [a, b] mit
Z
b
a
f = (b − a)f (t)
q.e.d.
Bemerkung 13.37. Die Vortstellung ist, daß
1 Zb
f
b−a a
der mittlere Wert“ von f auf dem Intervall [a, b] ist. Die Aussage ist, daß dieser
”
Wert irgendwo angenommen wird.
119
Nun erhalten wir auch die positive Antwort für stetig Funktionen auf die
Frage (12.28):
Korollar 13.38. Sei f : [a, b] → R stetig. Ferner sei 0 < f . Dann ist 0 <
R
Rb
a
f.
Beweis. Wir wissen aus (12.27), daß 0 ≤ ab f ist. Würde das Integral verschwinden,
müßte f nach dem Mittelwertsatz (13.36) den Wert 0 irgendwo annehmen. q.e.d.
Für stetige Funktionen gilt sogar eine stärkere Fassung:
Aufgabe 13.39. Sei f : R[a, b] → R stetig. Ferner sei 0 ≤ f und für ein r ∈ [a, b] sei
0 < f (r). Zeige, daß 0 < ab f .
Aufgabe 13.40. Seien f, ρ : [a, b] → R integrierbare Funktionen. Dabei sei ρ ≥ 0.
Ferner seien zwei Schranken α, β ∈ R mit α ≤ f ≤ β gegeben.
Zeige: Es gibt eine Stelle t ∈ [a, b] mit
Z
b
a
fρ = α
Z
t
a
120
ρ+β
Z
b
t
ρ
14
Vom Ableiten
Sei I ein offenes Intervall und f : I → R eine Abbildung.
14.1
Approximierbarkeit
Definition 14.1 (Verschwindungsordnung). Sei k ∈ N. Wir sagen, daß f an
der Stelle t ∈ I mindestens von k-ter Ordnung verschwindet, wenn gilt:
∃ε > 0 ∃δ > 0 ∀x ∈ I ∩ Bδ (t) : |f (x)| ≤ ε |x − t|k
und f verschwindet an der Stelle t von höherer als k-ter Ordnung verschwindet,
wenn gilt:
∀ε > 0 ∃δ > 0 ∀x ∈ I ∩ Bδ (t) : |f (x)| ≤ ε |x − t|k
Beobachtung 14.2. Ein Blick auf die Quantoren genügt, und wir sehen, daß eine
Funktion, die von höherer als k-ter Ordnung verschwindet, auch von mindestens
k-ter Ordnung verschwindet.
Aufgabe 14.3. Eine Funktion f : I → R verschwinde an der Stelle t von
mindestens (k + 1)-ter Ordnung. Zeige, daß f an der Stelle t von höherer als k-ter
Ordnung verschwindet.
Bemerkung 14.4. Die Funktion f verschwindet an der Stelle t von mindestens
0-ter Ordnung genau dann, wenn f in einer offenen Umgebung von t beschränkt ist.
Die Funktion f verschwindet an der Stelle t von höherer als 0-ter Ordnung genau
dann, wenn f (t) = 0 ist und f an der Stelle t stetig ist.
Die Funktion f verschwindet an der Stelle t von mindestens erster Ordnung genau
dann, wenn es auf einer offenen Umgebung von t eine beschränkte Funktion g gibt,
so daß auf dieser Umgebung gilt:
f (x) = (x − t)g(x)
Also g verschwindet an der Stelle t von mindestens nullter Ordnung.
Die Funktion f verschwindet an der Stelle t von höherer als erster Ordnung genau
dann, wenn auf einer offenen Umgebung von t eine stetige Funktion g mit g(t) = 0
gibt, so daß auf dieser Umgebung gilt:
f (x) = (x − t)g(x)
Also g verschwindet an der Stelle t von höherer als nullter Ordnung.
Beweis. Die ersten beiden Aussagen sind einfache Umformulierungen der Definition
für k = 0.
Desweiteren beobachten wir, daß die Gleichung
f (x) = (x − t)g(x)
121
(7)
den Wert g(x) für alle x 6= t bestimmt. Für x 6= t ist darum
|f (x)| ≤ ε |x − t|
⇐⇒
|g(x)| ≤ ε
(8)
Ist nun ein f gegeben, das an der Stelle t von erster Ordnung oder höherer als erster
Ordnung verschwindet, so setzen wir g(t) = 0 und erhalten eine Funktion, die von
nullter oder höherer als nullter Ordnung verschwindet.
Ist umgekehrt eine Funktion g gegeben, die von nullter oder höherer Ordnung
verschwindet, so definiert sie durch die Gleichung (7) die Funktion f vollständig und
es ist f (t) = 0. Zusammen mit (8) folgt, daß f an der Stelle t von erster Ordnung
bzw. höherer als erster Ordnung verschwindet.
q.e.d.
Beispiel 14.5. Eine Potenzreihe f (x) = a0 + a1 x + a2 x2 + · · · = Σa⋆ x⋆ mit echt
positivem Konvergenzradius R > 0 verschwindet an der Stelle 0 genau dann von
höherer als k-ter Ordnung, wenn die Koeffizienten ai für i ≤ k verschwinden:
0 = a0 = a1 = · · · = ak
Beweis. Die Abbildung f ist auf dem offenen Intervall (−R, R) definiert. Sie
verschwindet von höherer als k-ter Ordnung an der Stelle 0 genau dann, wenn gilt:
∀ε ∃R ≥ δ > 0 ∀x ∈ (−δ, δ) : |f (x)| ≤ ε |x|k
(9)
Wir führen eine Induktion nach der Ordnungsgrenze k durch. Zunächst betrachten
wir also den Fall k = 0. In diesem Fall ist die Bedingung (9) äquivalent dazu, daß
f (0) = 0 ist und f an der Stelle 0 stetig ist. Für die Potenzreihe ist die Stetigkeit
automatisch erfüllt, und die Bedingung ist also äquivalent dazu, daß f (0) = a0 = 0
ist.
Nun nehmen wir an, die Äquivalenz gelte für k. Zu zeigen ist sie für k + 1. Wenn f
an der Stelle 0 von höherer als (k + 1)-ter Ordnung verschwindet, so verschwindet f
dort erst recht von höherer als k-ter Ordnung. Ebenso impliziert das Verschwinden
der Koeffizitenten ai mit i ≤ k + 1 das Verschwinden für i ≤ k. Darum können wir
uns für den Induktionsschritt auf Potenzreihen zurückziehen, die bei 0 von höherer
als k-ter Ordnung verschwinden, also (Induktionsannahme) der Bedingung ai = 0
für i ≤ k genügen.
Für solches f ist
f (x) = xk+1 ak+1 + ak+2 x + ak+3 x2 + · · ·
Dann ist:
|f (x)| = |x|k+1 ak+1 + ak+2 x + ak+3 x2 + · · ·
Also verschwindet f an der Stelle 0 von höherer als (k + 1)-ter Ordnung genau
dann, wenn ak+1 = 0 ist.
q.e.d.
Korollar 14.6 (Schwacher Identitätssatz für Potenzreihen). Eine
Potenzreihe f (x) von echt positivem Konvergenzradius R > 0 verschwindet auf
einem offenen Intervall um 0 genau dann, wenn alle ihre Koeffizienten
verschwinden.
q.e.d.
122
Man kann diese Aussagen etwas verschärfen:
Aufgabe 14.7. Sei f (x) := Σa⋆ x⋆ eine Potenzreihe mit positivem
Konvergenzradius R > 0. Sei ξ⋆ eine Nullfolge, die ganz im Gebiet BR (0) absoluter
Konvergenz liegt und für keinen Index den Wert 0 annimmt. Wenn f (ξi ) = 0 für alle
i ist, dann verschwinden alle Koeffizienten a⋆ = 0.
Korollar 14.8 (Identitätssatz für Potenzreihen). Seien Σa⋆ x⋆ und Σb⋆ x⋆ zwei
Potenzreihen mit positiven Konvergenzradien, die auf einer Nullfolge, die aber den
Wert 0 niemals annimmt, gleiche Werte annehmen. Dann ist a⋆ = b⋆ .
Beweis. Wir wenden (14.7) auf die Reihe Σ(a⋆ − b⋆ )x⋆ an.
q.e.d.
Beobachtung 14.9. Seien f, g : I → R Funktionen, die beide an der Stelle t von
höherer als k-ter Ordnung verschwinden. Dann verschwindet eine
Linearkombination αf + βg an der Stelle t ebenfalls von höherer als k-Ordnung.
Beweis. Sei ε > 0. Wähle δ > 0 so, daß für alle x ∈ Bδ (t) gilt:
|f (x)| ≤
ε
|x − t|k
2 |α|
und
|g(x)| ≤
ε
|x − t|k
2 |β|
Dann ist
|αf (x) + βg(x)| ≤ |α| |f (x)| + |β| |g(x)| ≤ ε |x − t|k
q.e.d.
Aufgabe 14.10. Die Funktion f : I → R verschwinde an der Stelle t von höherer
als k-ter Ordnung, und g : I → R verschwinde an der Stelle t von mindestens l-ter
Ordnung. Zeige: Das Produkt f g verschwindet an der Stelle t von höherer als
(k + l)-ter Ordnung.
Definition 14.11 (Approximation). Wir sagen, daß eine Funktion g : I → R die
Funktion f an der Stelle t ∈ I von höherer als k-ter Ordnung approximiert, wenn
die Differenz f − g an der Stelle t von höherer als k-ter Ordnung verschwindet. D.h.:
∀ε > 0 ∃δ > 0 ∀x ∈ I ∩ Bδ (t) : |f (x) − g(x)| ≤ ε |x − t|k
Definition und Behauptung 14.12 (Lineare Approximierbarkeit). Die
Funktion f : I → R heißt linear approximierbar an der Stelle t ∈ I, wenn es ein
Polynom erster Ordnung (Gerade) g(x) = a + µx gibt, das f an der Stelle t von
höherer als erster Ordnung approximiert. In diesem Fall ist die Gerade g eindeutig
bestimmt und hat die Form g(x) = f (t) + µ(x − t). Also ist f linear approximierbar
genau dann, wenn eine Steigung µ ∈ R existiert, so daß
x 7→ f (x) − f (t) − µ(x − t)
an der Stelle t von höherer als erster Ordnung verschwindet.
123
Beweis. Seien g1 und g2 zwei lineare Approximationen zu f an der Stelle t. Dann
verschwindet die Differenz g1 − g2 = (f − g2 ) − (f − g1 ) an der Stelle t von höherer
als erster Ordnung. Wir wenden (14.5) auf die Funktion h 7→ g1 (t + h) − g2 (t + h)
an und erhalten: g1 − g2 = 0.
Die angegebene Form der Geraden g ergibt sich daraus, daß insbesondere
g(t) = f (t) gilt.
q.e.d.
Proposition 14.13. Seien f, g : I → R Funktionen, deren Differenz f − g an der
Stelle t von höherer als nullter Ordnung verschwindet. Ist g an der Stelle t stetig, so
ist f dort auch stetig.
Insbesondere ist f an jeder Stelle stetig, an der f linear approximierbar ist.
Beweis. Die Differenz f − g verschwindet an der Stelle t von höherer als nullter
Ordnung. Damit ist sie insbesondere an der Stelle t stetig (14.4). Ebenso ist g an
der Stelle t stetig. Darum ist auch die Summe f = (f − g) + g an der Stelle t
stetig.
q.e.d.
14.2
Definitionen der Differenzierbarkeit
Definition 14.14 (Differenzierbarkeit I). Eine Funktion f : I → R heißt
differenzierbarh an der Stelle t ∈ I, wenn es eine Zahl f ′ (t) und eine in t stetige
Funktion o : I → R gibt, so daß gilt:
1. f (x) = f (t) + f ′ (t) (x − t) + o(x) (x − t)
2. o(t) = 0.
In diesem Fall heißt f ′ (t) die Ableitung von f an der Stelle t.
Bemerkung 14.15. Diese Definition wird oft unter Verwendung der Größe
h := x − t formuliert. Dann ist o stetig an der Stelle 0 und verschwindet dort. Die
erste Bedingung lautet in dieser Fassung:
f (t + h) = f (t) + f ′ (t) h + o(h) h
Bemerkung 14.16. Bedingung (14.14) ist mit (14.4) äquivalent dazu, daß es eine
Zahl f ′ (t) ∈ R gibt, so daß die Funktion
x 7→ f (x) − f (t) − f ′ (t) (x − t) = o(x) (x − t)
an der Stelle t von höherer als erster Ordnung verschwindet. Das wiederum ist
gerade die Bedingung, daß f an der Stelle t linear approximierbar ist (14.12).
Definition 14.17 (Differenzierbarkeit II). Eine Funktion f : I → R heißt
differenzierbarst an der Stelle t ∈ I, wenn es eine an der Stelle t stetige Funktion
ft′ : I → R mit
f (x) − f (t) = (x − t)ft′ (x)
gibt. Dann nennen wir
f ′ (t) := ft′ (t)
die Ableitung von f an der Stelle t.
124
Bemerkung 14.18. Für x 6= t ist ft′ (x) durch
ft′ (x) =
f (x) − f (t)
x−t
bestimmt. Die eigentliche Bedingung ist die Stetigkeit an der Stelle t.
Definition 14.19 (Differenzierbarkeit III). Die Abbildung f heißt
differenzierbarlim an der Stelle t ∈ I, wenn für je zwei gegen t konvergierende, den
Werte t aber nirgends annehmende Folgen x⋆ und y⋆ in I \ {t} gilt:
Die induzierten Folgen von Steigungen
f (x⋆ ) − f (t)
x⋆ − t
und
f (y⋆ ) − f (t)
y⋆ − t
sind kokonvergent.
In diesem Fall nennen wir den gemeinsamen Grenzwert f ′ (t) := lim⋆→∞
dieser Steigungsfolgen die Ableitung von f an der Stelle t.
f (x⋆ )−f (t)
x⋆ −t
all
Bemerkung 14.20. Die Definitionen (14.17) und (14.19) sind augenscheinlich
äquivalent: In (14.19) wird lediglich die stetige Fortsetzbarkeit von
x 7→
f (x) − f (t)
x−t
auf die Stelle x = t mit Hilfe der Folgenstetigkeitsdefinition ausbuchstabiert.
Satz und Definition 14.21. Für eine Funktion f : I → R, definiert auf einen
offenen Intervall I, und eine Stelle t ∈ I sind die folgenden Bedingungen äquivalent:
1. Die Funktion f ist linear approximierbar an der Stelle t.
2. Die Funktion f ist differenzierbarh an der Stelle t.
3. Die Funktion f ist differenzierbarst an der Stelle t.
4. Die Funktion f ist differenzierbarlim an der Stelle t.
Sind diese Bedingungen erfüllt, so stimmen alle definierten Ableitungen
untereinander und mit der Steigung von f an der Stelle t überein.
Wir nennen eine Funktion f , die an der Stelle t eine und damit alle oben genannten
Bedingungen erfüllt, differenzierbar an der Stelle t. die Funktion f ist
differenzierbar auf I, wenn sie an jeder Stelle t ∈ I differenzierbar ist.
Beweis. Wir beweisen einzelne Äquivalenzen.
125
(1)⇐⇒(2) Sei zunächst f differenzierbarh an der Stelle t. Die Funktion
g : x 7→ f (t) + f ′ (t) (x − t)
ist dann eine lineare Approximation, denn
f (x) − g(x) = o(x) (x − t)
verschwindet von höherer als erster Ordnung nach (14.4).
Ist umgekehrt f linear approximierbar, so gibt es einen Wert f ′ (t) ∈ R derart,
daß
g : x 7→ f (t) + f ′ (t) (x − t)
eine lineare Approximation an f ist. Das aber heißt gerade, daß die Differenz
f − g an der Stelle t von höherer als erster Ordnung verschwindet. Nun ergibt
sich die Existenz der Funktion o wieder aus (14.4).
(2)⇐⇒(3) Der Zusammenhang von o und ft′ ist gegeben durch:
o(x) = ft′ (x) − ft′ (t)
und
f ′ (t) = ft′ (t)
Mit dieser Transformation überführen sich die Bedingungen unmittelbar
ineinander:
f (x) − f (t) = f ′ (t) (x − t) + o(x) (x − t) = ft′ (x) (x − t)
Außerdem haben wir f ′ (t) = ft′ (t).
(3)⇐⇒(4) Die Bemerkung (14.18) gibt den entscheidenden Hinweis: Stetigkeit von
ft′ an der Stelle t läßt sich als Folgenstetigkeit auffassen, und damit geht
q.e.d.
Differenzierbarkeitst in Differenzierbarkeitlim über.
Korollar 14.22. Ein Polynom f (x) = α + µx ersten Grades ist differenzierbar und
seine Ableitung ist konstant f ′ (x) = µ.
q.e.d.
Notation 14.23. Ist f : I → R differenzierbar, so schreiben wir für die Ableitung
an der Stelle t
′
f (t)
oder
df
(t)
dx
oder
d f
d x x=t
Die Funktion x 7→ f ′ (x) heißt Ableitung von f . Wir notieren sie mit
f′
oder
df
dx
oder
d
f
dx
Die jeweils letzten Notationen bieten sich insbesondere dann an, wenn die Funktion
durch einen komplexen Ausdruck gegeben ist. Ist z.B. f (x) = x3 − x2 , so können wir
die Ableitung (an einer Stelle) schreiben als
d 3
x − x2
dx
und an an der Stelle 2
126
d 3
x − x2 dx
2
Proposition 14.24 (Linearität der Ableitung). Seien f, g : I → R
differenzierbar an der Stelle t ∈ I. Für beliebige feste Zahlen α, β ∈ R ist dann die
Linearkombination h := αf + βg differenzierbar an der Stelle t und die Ableitung ist:
h′ (t) = αf ′(t) + βg ′(t)
Beweis. Die Funktion f ist an der Stelle t linear approximierbar mit Steigung f ′ (t),
und g ist dort linear approximierbar mit Steigung g ′ (t). Dann verschwinden die
Funktionen
x 7→f (x) − f (t) − f ′ (t) (x − t)
x 7→g(x) − g(t) − g ′ (t) (x − t)
an der Stelle t von höherer als erster Ordnung. Das gilt mit (14.9) auch für ihre
Linearkombination
x 7→ h(x) − h(t) − (αf ′(t) + βg ′(t))(x − t)
Also ist h an der Stelle t linear approximierbar mit Steigung
h′ (t) = αf ′ (t) + βg ′(t).
q.e.d.
Aufgabe 14.25. Seien f, g, h : I → R stetige Funktionen. Es gelte überall
f (x) g(x) = h(x)
An der Stelle t seien f und h differenzierbar. Außerdem gelte f (t) = 0 = h(t). Zeige:
f ′ (t) g(t) = h′ (t)
14.3
Der Mittelwertsatz der Differentialrechnung
Satz 14.26. Die differenzierbare Funktion f : I → R nehme an der Stelle t ein
(lokales) Minimum an. Dann hat f an der Stelle t verschwindende Steigung
f ′ (t) = 0. Gleiches gilt, wenn f ein (lokale) Maximum annimmt.
Beweis. Für alle Punkte x in einer offenen Umgebung von t gilt f (x) ≥ f (t). Da f
an der Stelle t differenzierbarst ist, gibt es eine an der Stelle t stetige Funktion g mit:
0 ≤ f (x) − f (t) = (x − t)g(x)
Nun folgt daraus
g(x) ≥ 0 für x > t
g(x) ≤ 0 für x < t
Aus der Stetigkeit von g an der Stelle t folgt dann, daß die Steigung f ′ (t) = g(t) = 0
ist.
Die Aussage über Maximalstellen beweist sich analog oder läßt sich durch
Betrachtung von −f auf den behandelten Fall zurückführen.
q.e.d.
127
Mittelwertsatz der Differentialrechnung 14.27. Sei f : [a, b] → R stetig und
im Innern (a, b) differenzierbar. Dann gibt es eine Stelle t ∈ (a, b) mit
f (b) − f (a) = f ′ (t) (b − a)
(a)
Beweis. Setze µ := f (b)−f
. Zu finden ist eine Stelle mit f ′ (t) = µ.
b−a
Wir betrachten die Funktion
g(x) := f (x) − µ(x − a)
Dann ist g : [a, b] → R stetig mit g(a) = g(b) = f (a). Also nimmt g auf [a, b]
Minimum und Maximum irgendwo an (13.27). Wenn keine Minimalstelle im Innern
liegt, also das Minimum an den Rändern angenommen wird, liegt eine
Maximalstelle im Innern. In jedem Fall finden wir eine Stelle t ∈ (a, b) mit
verschwindender Ableitung (14.26). An dieser Stelle wird also g durch eine
horizontale Gerade linear approximiert und f (x) = g(x) + µ(x − a) wird durch eine
Gerade mit Steigung µ linear approximiert, d.h., f ′ (t) = µ.
q.e.d.
Korollar 14.28. Sei f : I → R differenzierbar mit überall verschwindender
Ableitung. Dann ist f konstant.
Beweis. Für a, b ∈ I ist nach dem Mittelwertsatz
f (b) − f (a) = f ′ (t) (b − a) = 0
für ein t ∈ (a, b).
q.e.d.
Aufgabe 14.29. Sei f : I → R differenzierbar. Zeige: Die Abbildung f wächst
streng monoton, wenn f ′ (x) > 0 ist für alle x ∈ I. Analog gilt: Ist die Ableitung
überall echt negativ, so fällt f streng monoton.
Gib ein Beispiel für eine streng monoton wachsende differenzierbare Funktion, deren
Ableitung mindestens eine Nullstelle hat. (Für diesen Teil dürfen die
Ableitungsverfahren aus Abschnitt (14.5) benutzt werden.)
14.4
Hauptsatz der Differential- und Integralrechnung
Lemma 14.30. Die Funktion f : I → R sei integrierbar, stetig an der Stelle t ∈ I
und verschwinde an dieser Stelle. Dann verschwindet das Integral
F : I −→ R
x 7→
Z
x
t
f (s) d s
an der Stelle t von höherer als erster Ordnung.
128
Beweis. Sei ε > 0. Wir müssen δ > 0 finden, so daß |F (x)| < ε |x − t| für alle
x ∈ Bδ (t) gilt.
Dazu wählen wir δ so, daß |f (x)| < ε ist für alle x ∈ Bδ (t). Das können wir tun, weil
f an der Stelle t stetig ist.
Nun können wir für x ∈ Bδ (t) abschätzen:
|F (x)| =
Z
t
x
f (s) d s
≤
Z
t
x
ε d s
= ε |x − t|
q.e.d.
Aufgabe 14.31. Die Funktion f : I → R sei integrierbar, stetig an der Stelle t ∈ I
und verschwinde an dieser Stelle von höhere als k-ter Ordung. Dann verschwindet
das Integral
F : I −→ R
x 7→
Z
x
t
f (s) d s
an der Stelle t von höherer als (k + 1)-ter Ordnung.
Satz 14.32 (Differenzierbarkeit nach der oberen Intergrationsgrenze). Sei
f : I → R integrierbar auf I und stetig an der Stelle t ∈ I. Dann ist jedes
unbestimmte Integral F von f differenzierbar an der Stelle t mit Ableitung f (t).
Beweis. Wir müssen zeigen, daß die Funktion
x 7→ F (x) − F (t) − f (t) (x − t) =
Z
t
x
f (s) d s −
Z
t
x
f (t) d s =
Z
t
x
(f (s) − f (t)) d s
an der Stelle t von höherer als erster Ordnung verschwindet. Das aber folgt
unmittelbar aus (14.30), weil x 7→ f (x) − f (t) an der Stelle t stetig verschwindet
(also von höherer als nullter Ordnung verschwindet).
q.e.d.
Hauptsatz der Differential- und Integralrechnung 14.33. Sei f : I → R
stetig (und damit integrierbar). Für eine Funktion F : I → R sind dann äquivalent:
1. F ist ein unbestimmtes Integral von f .
2. F ist differenzierbar auf I mit Ableitung f . Hierfür sagt man auch, daß F eine
Stammfunktion von f ist.
Beweis. Die Richtung (1)⇒(2) folgt unmittelbar aus (14.32) durch Anwendung an
jeder Stelle.
Für die Richtung (2)⇒(1) nehmen wir an, F sei eine Stammfunktion. Da f stetig
ist, hat f ein unbestimmtes Integral G. Mit der schon gezeigten Richtung schließen
wir, daß G eine Stammfunktion von f ist. Also ist F ′ = f = G′ . Ableiten ist
linear (14.24), und somit verschwindet die Ableitung der Differenz F − G überall.
Mit (14.28) folgt, daß die Differenz F − G konstant ist. Darum ist F ebenfalls ein
unbestimmtes Integral.
q.e.d.
129
Korollar 14.34. Der natürliche Logarithmus ln ist differenzierbar, und es gilt:
1
d
ln(x) =
dx
x
∀x ∈ (0, ∞)
Warnung 14.35. Die Ableitung einer differenzierbaren Funktion ist nicht
unbedingt auf dem Definitionsbereich integrierbar. Vergleiche Aufgabe (15.24).
Darum können wir im Hauptsatz nicht von einer differenzierbaren Funktion
ausgehen und dann behaupten, sie sei das Integral ihrer Ableitung.
Definition 14.36 (Stetige Differenzierbarkeit). Eine differenzierbare
Abbildung f : I → R heißt stetig differenzierbar, wenn die Ableitung f ′ eine auf I
stetige Funktion ist.
Satz 14.37. Sei f⋆ : I → R eine Folge stetig differenzierbarer Funktionen, die
punktweise gegen eine Grenzfunktion f : I → R konvergiert. Die Folge f⋆′ der
(stetigen) Ableitungen konvergiere gleichmäßig gegen die Grenzfunktion g : I → R.
Dann ist f differenzierbar und eine Stammfunktion von g.
Beweis. Zunächst ist g als gleichmäßiger Limes stetiger Funktionen eine stetige
Funktion (13.17) und damit integrierbar, genauer gilt für beliebige a, b ∈ I:
Z
b
a
g = lim
Z
b
⋆→∞ a
f⋆′ = lim (f⋆ (b) − f⋆ (a)) = f (b) − f (a)
⋆→∞
Also ist f ein unbestimmtes Integral von g. Aus dem Hauptsatz (14.33) folgt darum,
daß f differenzierbar mit Ableitung g ist.
q.e.d.
Warnung 14.38. Die Formulierung von Satz (14.37) erscheint ungewohnt. Wir
hätten vielleicht auf ein Ergebnis der folgenden Art gehofft:
Der gleichmäßige Limes einer Folge stetig differenzierbarer Funktionen
ist (stetig) differenzierbar und seine Ableitung ist der punktweise
(gleichmäßige) Limes der Ableitungsfolge.
Aussagen dieser Art sind jedoch falsch.
Aufgabe 14.39. Sei f : I → R stetig differenzierbar. Zeige: Die Abbildung f
wächst monoton genau dann, wenn f ′ (x) ≥ 0 für alle x ∈ I gilt.
Kann die Annahme der stetigen Differenzierbarkeit abgeschwächt werden zu bloßer
Differenzierbarkeit?
14.5
Ableitungsregeln und Integrationsverfahren
Produktregel 14.40. Seien f, g : I → R differenzierbar an der Stelle t ∈ I. Dann
ist das Produkt h := f g differenzierbar an der Stelle t und die Ableitung ist:
h′ (t) = f ′ (t) g(t) + f (t) g ′(t)
130
Beweis. Wir fangen genauso an wie in (14.24): Sei f an der Stelle t linear
approximierbar mit Steigung f ′ (t), und g sei dort linear approximierbar mit
Steigung g ′ (t). Dann verschwinden die Funktionen
x 7→f (x) − f (t) − f ′ (t) (x − t)
x 7→g(x) − g(t) − g ′ (t) (x − t)
an der Stelle t von höherer als erster Ordnung.
Wir multiplizieren die obere Funktion mit der Konstanten g(t) und sehen, daß die
Funktion
x 7→ f (x) g(t) − f (t) g(t) − f ′ (t) g(t) (x − t)
an der Stelle t von höherer als erster Ordnung verschwindet.
Zusätzlich bemerken wir, daß f an der Stelle t stetig ist (folgt aus der
Differenzierbarkeit, vergleiche 14.13). Darum verschwindet f an der Stelle t von
mindestens nullter Ordnung (14.4). Mit (14.10) schließen wir, daß das Produkt
x 7→ f (x) g(x) − f (x) g(t) − f (x) g ′(t) (x − t)
an der Stelle t von höherer als erster Ordnung verschwindet.
Schließlich verschwindet die Funktion
x 7→ (f (x) − f (t))g ′(t) (x − t) = f (x) g ′ (t) (x − t) − f (t) g ′ (t) (x − t)
an der Stelle t von höherer als erster Ordnung: Der Faktor x − t verschwindet von
mindestens erster Ordnung und der Faktor f (x) − f (t) verschwindet von höherer als
nullter Ordnung.
Darum verschwindet auch die Summe
f (x) g(x) − f (t) g(t) − f ′ (t) g(t) (x − t) − f (t) g ′ (t) (x − t)
an der Stelle t von höherer als erster Ordnung. Das aber heißt gerade, daß h = f g
an der Stelle t linear approximierbar ist mit Steigung
h′ (t) = f ′ (t) g(t) + f (t) g ′(t).
q.e.d.
Beweis (alternative Version). Nutzen wir, daß f und g differenzierbarst sind, so
argumentieren wir wiefolgt. Es gibt stetitige Steigungsfunktionen ft′ und gt′ mit
Dann ist:
f (x) − f (t) = ft′ (x) (x − t)
g(x) − g(t) = gt′ (x) (x − t)
h(x) − h(t) = f (x) g(x) − f (t) g(t)
= f (x) g(x) − f (x) g(t) + f (x) g(t) f (t) g(t)
= f (x) (g(x) − g(t)) + (f (x) − f (t))g(t)
= f (x) gt′ (x) (x − t) + ft′ (x) g(t) (x − t)
= (f (x) gt′ (x) + ft′ (x) g(t)) (x − t)
|
{z
=:h′t (x)
}
Die so definierte Funktion h′t ist stetig und zeigt, daß h an der Stelle t differenzierbar
ist mit Ableitung h′t (t) = f (t) gt′ (t) + ft′ (t) g(t) = f (t) g ′(t) + f ′ (t) g(t)
q.e.d.
131
Mithilfe des Hauptsatzes (14.33) können wir diese Ableitungsregel in ein
Integrationsverfahren überführen:
Partielle Integration 14.41. Seien f, g : I → R stetig differenzierbar. Dann ist
für a, b ∈ I:
Z
b
a
(f (x) g ′ (x) + g(x) f ′ (x)) d x = f (b) g(b) − f (a) g(a) =: [f g]ba
Die umgestellte Form zeigt die intendierte Anwendung:
Z
b
a
f (x) g ′ (x) d x = [f g]ba −
Z
b
a
g(x) f ′ (x) d x
Beweis. Die Ableitungen f ′ und g ′ sind nach Voraussetung stetig auf I. Darum ist
die Funktion
f ′g + f g′
stetig. Wir wenden den Hauptsatz (14.33) darauf an und erkennen f g als
unbestimmtes Integral seiner Ableitung
d
f (x) g(x) = f ′ (x) g(x) + f (x) g ′(x).
dx
q.e.d.
Aufgabe 14.42. Sei f : I → R stetig differenzierbar und monoton wachsend. Die
Funktion g : I → R sei stetig. Zeige: Zu je zwei Punkten a < b aus I gibt es eine
Stelle t ∈ [a, b] mit
Z
b
a
f (ξ) g(ξ) d ξ = f (a)
Z
t
a
g(ξ) d ξ + f (b)
Z
t
b
g(ξ) d ξ
Kettenregel 14.43. Sei f : I → J differenzierbar an der Stelle t ∈ I und
g : J → R differenzierbar an der Stelle f (t) ∈ J. Dann ist die Verkettung
h := g ◦ f : I → R differenzierbar an der Stelle t und die Ableitung ist:
h′ (t) = g ′(f (t)) f ′ (t)
Der Faktor f ′ (t) wird auch innere Ableitung genannt.
Beweis. Die Funktion f ist differenzierbarst an der Stelle t. Also gibt es eine an der
Stelle t stetige Funktion ft′ : I → R mit:
f (x) − f (t) = ft′ (x) (x − t)
Dabei ist f ′ (t) = ft′ (t). Entsprechend gibt es eine an der Stelle f (t) stetige Funktion
gf′ (t) : J → R mit:
g(y) − g(f (t)) = gf′ (t) (y) (y − f (t))
Hier gilt g ′(f (t)) = gf′ (t) (f (t)).
132
Wir rechnen:
h(x) − h(t) = g(f (x)) − g(f (t))
= gf′ (t) (f (x)) (f (x) − f (t))
= gf′ (t) (f (x)) ff′ (x) (x − t)
{z
|
=:h′t (x)
}
Die so definierte Funktion h′t : I → R ist stetig an der Stelle t. Also ist h dort
differenzierbarst . Die Ableitung hat den Wert
h′ (t) = h′t (t) = gf′ (t) (f (x)) ff′ (x) = g ′ (f (t)) f ′ (t)
q.e.d.
Substitutionsregel 14.44. Sei f : I → J stetig differenzierbar und g : J → R
stetig mit unbestimmtem Integral G : J → R. Dann gilt für a, b ∈ I:
Z
b
a
g(f (x)) f ′ (x) d x =
Z
f (b)
f (a)
f (b)
g(y) d y = [G]f (a)
Beweis. Das unbestimmte Integral G ist nach dem Hauptsatz differenzierbar und
eine Stammfunktion von g. Nun wende die Kettenregel auf die Verkettung G ◦ f
an.
q.e.d.
Proposition 14.45 (Ableitung der Potenzen). Für k ∈ N1 ist
d k
x = kxk−1
dx
Die Funktion x 7→ x0 ist konstant und darum verschwindet ihre Ableitung.
Beweis. Wir führen eine Induktion nach k durch, die wir bei k = 0 und der
verschwindenden Ableitung anfangen. Wir rechnen:
d k+1
d
x
=
(xxk )
dx
dx
d
d
= ( x)xk + x( xk )
dx
dx
k
k−1
= x + xkx
= (k + 1)xk
Der Induktionsschritt von k auf k + 1 ist somit auch gerechtfertigt.
q.e.d.
Bemerkung 14.46. Durch Anwendung des Hauptsatzes auf (14.45) erhalten wir
den Wert des kryptischen Vorfaktor µ aus (12.24). Es ergibt sich:
Z
0
x
sk d s =
1
xk+1
k+1
133
Satz 14.47 (Gliedweises Ableiten von Potenzreihen). Sei f (x) = Σa⋆ x⋆ eine
Potenzreihe mit positivem Konvergenzradius R > 0. Dann ist f auf (−R, R) stetig
differenzierbar und die Ableitung wird im ganzen Definitionsbereich (−R, R) durch
die Potenzreihe beschrieben, die sich aus f (x) durch gliedweises Ableiten ergibt:
′
f (x) =
∞
X
ai+1 (i + 1)xi
i=0
P
i
Beweis. Die Potenzreihe ∞
i=0 ai+1 (i + 1)x haben wir als formale Ableitung von
f (x) in Aufgabe (11.26) schon betrachtet und dort gesehen, daß sie ebenfalls den
Konvergenzradius R hat.
P
i
Die Partialsummen m
i=0 ai x sind Polynome und ihre Ableitung ist mit (14.24)
und (14.45) gegeben durch
!
m−1
m
X
d X
ai+1 (i + 1)xi
ai xi =
d x i=0
i=0
Wir möchten nun Satz (14.37) anwenden. Leider konvergiert die Folge der
Partialsummen auf (−R, R) nicht notwendig gleichmäßig gegen f (x). Allerding ist
die Konvergenz mit (12.46) auf jedem abgeschlossenen Teilintervall [a, b] ⊆ (−R, R)
gleichmäßig. Darum können wir (14.37) auf jedem Intervall (−r, r) mit 0 < r < R
anwenden. In diesen verkleinerten Intervallen haben wir daher die gleichmäßige
Konvergenz:
!
m−1
m
X
d X
ai+1 (i + 1)xi
ai xi =
d x i=0
i=0
gl.
−−−→
m→∞
∞
X
ai+1 (i + 1)xi
i=0
Wir deduzieren, daß Σa⋆ x⋆ auf (−r, r) eine Stammfunktion der formalen Ableitung
Σa⋆+1 (⋆ + 1)x⋆ ist. Auf der anderen Seite ist jedes t ∈ (−R, R) enthalten in einem
Intervall (−r, r) mit 0 < r < R. Darum gilt
∞
X
d
ai+1 (i + 1)xi
f (x) =
dx
i=0
an jeder Stelle in (−R, R).
q.e.d.
Beispiel 14.48. Für die Exponentialfunktion gilt
d
exp(x) = exp(x)
dx
Beweis.
∞
∞
∞
X
d
xi
xi
d X
xi X
(i + 1)
exp(x) =
=
=
= exp(x)
dx
d x i=0 i!
(i + 1)! i=0 i!
i=0
134
q.e.d.
Aufgabe 14.49. Zeige:
d
sin(x) = cos(x)
dx
d
cos(x) = − sin(x)
dx
Korollar 14.50. Der natürliche Logarithmus und die Exponentialfunktion sind
zueinander inverse Funktionen:
∀x ∈ R
∀y > 0
ln(exp(x)) = x
exp(ln(y)) = y
Beweis. Beide Funktionen sind differenzierbar: Nach (14.34) ist der Kehrwert die
Ableitung des Logarithmus, während nach (14.48) die Exponentialfunktion beim
Differenzieren unverändert bleibt. Darum ist die Verkettung differenzierbar, und wir
erhalten für die Ableitung:
1
d
ln(exp(x)) =
exp(x) = 1
dx
exp(x)
Mit dem Hauptsatz (14.33) schließen wir
ln(exp(x)) = ln(exp(x)) − 0 = ln(exp(x)) − ln(exp(0)) =
Z
x
0
1ds = x
Nun wollen wir bestätigen, daß für jedes y > 0 exp(ln(y)) = y ist.
Aus (11.44), (11.42) und (11.41) folgt, daß das Bild der Exponentialfunktion das
offene Intervall (0, ∞) ist, also der ganze Definitionsbereich des natürlichen
Logarithmus. Also gibt es ein x ∈ R mit y = exp(x) und wir erhalten:
exp(ln(y)) = exp(ln(exp(x))) = exp(x) = y
q.e.d.
Proposition 14.51. Es ist e = exp(1). Das läßt sich äquivalent ausdrücken durch
ln(e) = 1.
Beweis. Der Logarithmus ist stetig. Darum gilt:
!
1 k
ln(e) = ln lim 1 +
k→∞
k
1
= lim k ln 1 +
k→∞
k
= lim k ln 1 +
k→∞
=
1
k
= lim ln
k→∞
= lim
k→∞
ln 1 +
1
1+
k
1
k
k !
− ln(1)
1/k
d ln
1
(1) = = 1
dx
1
q.e.d.
135
Verallgemeinerte Potenzen 14.52. Für x > 0 und k ∈ R setzen wir
xk := exp(k ln(x))
Wir nennen xk eine (verallgemeinerte) Potenz von x zum Exponenten k. Es gelten
die Potzengesetze:
xk+l = xk xl
(xy)k = xk y k
und
Außerdem lassen sich die Ableitungen bestimmen:
d k
d k
x = kxk−1
und
x = ln(x) xk
dx
dk
Beweis. Natürlich benutzen wir die Funktionalgleichungen von
Exponentialfunktion (11.40) und Logarithmus (12.57). Wir erhalten:
xk+l = exp((k + l) ln(x))
= exp(k ln(x) + l ln(x))
= exp(k ln(x)) exp(l ln(x))
= xk xl
und:
(xy)k = exp(k ln(xy))
= exp(k(ln(x) + ln(y)))
= exp(k ln(x) + k ln(y))
= exp(k ln(x)) exp(k ln(y))
= xk y k
Die Ableitung nach x berechnet sich wiefolgt:
d k
d
x =
exp(k ln(x))
dx
dx
!
d
= exp(k ln(x))
k ln(x)
dx
k
= exp(k ln(x))
x
!
= kxk x−1
= kxk−1
Und mit
d
d k
x =
exp(k ln(x))
dk
dk
!
d
= exp(k ln(x))
k ln(x)
dk
= xk ln(x)
bestätigen wir die Ableitung nach dem Exponenten k.
136
q.e.d.
Notation 14.53. Für x ≥ 0 setzen wir
√
x :=

0
x
für x = 0
für x > 0
1
2
Aufgabe 14.54. Der Ausdruck x3 ist nunmehr mehrdeutig geworden. In (7.13)
hatten wir xk für Exponenten k ∈ N definiert. Wir können dies durch die Setzung
x−k :=
1
xk
auf ganz Z fortsetzen. Hier aber schlagen wir eine völlig andere Definition vor. Zeige,
daß sie für ganzzahlige Exponenten mit der ursprünglichen Setzung übereinstimmt:
∀x > 0 ∀k ∈ N
x
· · x} = exp(k ln(x))
| ·{z
k Faktoren
1
1
· · · = exp(−k ln(x))
|x {z x}
∀x > 0 ∀k ∈ N
k Faktoren
Bestätige ferner für x, y > 0:
xkl = xk
l
Aufgabe 14.55. Die Funktion
1
: R \ {0} −→ R
⋆
1
x 7→
x
ist im ganzen Definitionsbereich differenzierbar mit Ableitung
d 1
dx x
=
−1
.
x2
Aufgabe 14.56. Beweise die Quotientenregel: Seien f, g : I → R an der Stelle t ∈ I
differenzierbar. Ferner sei g(t) 6= 0. Dann ist der Quotient h := fg differenzierbar an
der Stelle t mit Ableitung h′ (t) =
f ′ (t)g(t)−f (t)g ′ (t)
.
g(t)2
Aufgabe 14.57. Bestimme! D.h., forme um mindestens, bis keine Ableitungen oder
Integrale mehr dastehen. Weiteres Vereinfachen ist nach Möglichkeit vorzunehmen:
1.
d
dx
2.
d
dx
3.
d
dx
R 2
x
0
ξ exp(ξ) d ξ
x
ln(x)
R
x
−x
sin(ξ) cos(ξ) d ξ
137
4.
5.
Rb
a
d
dx
ξ 3 exp(ξ) d ξ
ln(x)2
Hinweis: Aus (11.47) folgt:
sin(−x) = − sin(x)
und
cos(−x) = cos(x)
Aufgabe 14.58. Bestimme! D.h., forme um mindestens, bis keine Ableitungen oder
Integrale mehr dastehen. Weiteres Vereinfachen ist nach Möglichkeit vorzunehmen:
1.
2.
Rb
a
Rx
1
ξ k ln(ξ) d ξ für 0 < a < b und beliebiges k ∈ R. Beachte den Fall k = −1.
sin(ξ)
ξ
dξ +
Rx
1
cos(ξ)
ξ2
d ξ für x > 1. (Aus der gewonnenen Darstellung läßt sich
folgern, daß die Folge
3.
4.
14.6
R4√
R⋆
1
sin(ξ)
ξ
d ξ konvergiert.)
16 − ξ 2 d ξ. Gib eine geometrische Interpretation des Ergebnisses als
Inhalt einer Fläche.
0
Rb
a
ξ ln(ξ 2 ) d ξ für 0 < a < b.
Approximation höherer Ordnung: der Taylorsche Satz
Wir fixieren ein offenes Intervall I.
Definition 14.59. Eine Funktion f : I → R heißt 0-fach stetig differenzierbar,
wenn sie stetig ist. Für k ≥ 1 nennen wir f k-fach stetig differenzierbar, wenn f
differenzierbar ist, und die Ableitung f ′ (k − 1)-fach stetig differenzierbar ist. Wir
nennen die Funktion f glatt, wenn sie k-fach stetig differenzierbar ist für jede
Ordnung k.
Augenscheinlich sind die stetig differenzierbaren Funktionen gerade die einfach
stetig differenzierbaren Funktionen.
Definition 14.60. Wir nennen f : I → R
approximierbar von k-ter Ordnung an der Stelle t ∈ I, wenn es ein Polynom
gt x = a0 + a1 x + a2 x2 + · · · + ak xk gibt, das f an der Stelle t von höherer als k-ter
Ordnung approximiert.
Ist f an jeder Stelle in I approximierbar von k-ter Ordnung, so nennen wir f
approximierbar von k-ter Ordnung.
Bemerkung 14.61. In diesem Fall ist das Polynom gt (x) eindeutig bestimmt.
Seien nämlich gt1 (x) und gt2(x) zwei approximierende Polynome. Dann verschwindet
ihre Differenz gt1(x) − gt2 (x) an der Stelle t von höherer als k-ter Ordnung und hat
darum verschwindende Koeffizieten (14.5).
q.e.d.
138
Satz von Taylor 14.62. Die Funktion f : I → R sei (k + 1)-fach stetig
differenzierbar. Dann ist für x, t ∈ I:
(x − t)i (i)
f (t) + Rk+1
f (x) =
i!
i=0
k
X
(x − t)2 (2)
(x − t)k (k)
= f (t) + (x − t)f (t) +
f (t) + · · · +
f (t) + Rk+1
2!
k!
′
mit dem Restglied
(x − ξ)k (k+1)
f
(ξ) d ξ
k!
t
Ferner gibt es ein s zwischen t und x mit:
Rk+1 =
Rk+1 =
Z
x
(x − t)k+1 (k+1)
f
(s)
(k + 1)!
(Lagrangsche Form des Restgliedes)
Beweis. Wir benutzen Induktion nach k. Für den Anfang k = 0 ist der Taylorsche
Satz eine unmittelbare Konsequenz des Hauptsatzes (14.33), denn es ist:
f (x) = f (t) +
Z
t
f ′ (ξ) d ξ = f (t) +
x
Z
t
x
(x − ξ)0 ′
f (ξ) d ξ = f (t) + R1
0!
Für den Induktionsschritt wenden wir partielle Integration auf das Restglied an. Sei
also f nicht bloß (k + 1)-fach sondern (k + 2)-fach stetig differenzierbar. Dann ist
zunächst
Rk+1 =
Z
x
t
(x − ξ)k (k+1)
f
(ξ) d ξ
k!
#ξ=x
"
−(x − ξ)k+1 (k+1)
=
f
(ξ)
(k + 1)!
k+1
(x − t)
f (k+1) (ξ) +
=
(k + 1)!
k+1
=
ξ=t
Z
t
x
−
Z
t
x
−(x − ξ)k+1 (k+2)
f
(ξ) d ξ
(k + 1)!
(x − ξ)k+1 (k+2)
f
(ξ) d ξ
(k + 1)!
(x − t)
f (k+1) (ξ) + Rk+2
(k + 1)!
Mit Induktion ergibt sich:
(x − t)i (i)
f (t) + Rk+1
f (x) =
i!
i=0
k
X
(x − t)k+1 (k+1)
(x − t)i (i)
f (t) +
f
(ξ) + Rk+2
=
i!
(k + 1)!
i=0
k
X
=
k+1
X
i=0
(x − t)i (i)
f (t) + Rk+2
i!
139
Es bleibt die Lagrangesche Form des Restgliedes herzuleiten. Dazu wenden wir den
Mittelwertsatz mit Dichtefunktion (13.35) an. Wir betrachten die Dichte
(x−ξ)k
ρ : ξ 7→ k! und beobachten, daß ρ nur an der Stelle ξ = x einen Nulldurchgang
hat. Also ändert ρ das Vorzeichen nicht auf dem Intervall [t, x]. Dann gibt es also
eine Stelle s ∈ [t, x] mit
Z
x
t
ρ(ξ) f (k+1) (ξ) d ξ = f (k+1) (s)
Z
x
t
"
(x − ξ)k+1
ρ(ξ) d ξ = −
(k + 1)!
#x
f (k+1) (s)
t
k+1
=
(x − t)
f (k+1) (s)
(k + 1)!
Dabei haben wir (13.35) mit einer negativen Dichte angewendet für den Fall, daß k
ungerade und x < t ist.
q.e.d.
Aufgabe 14.63. Seien f , x und t wie im Satz von Taylor und Rk sei das Restglied.
Zeige: es gibt ein ξ zwischen t und x mit
Rk+1 =
f (k+1) (ξ)
(x − t)(x − ξ)k
k!
Korollar 14.64. Sei f : I → R mindestestens k-fach stetig differenzierbar. Dann
ist f an jeder Stelle t ∈ I von k-ter Ordnung approximierbar. Das approximierende
Polynom ist gerade durch die Taylorentwicklung gegeben. Wir haben nämlich die
Darstellung
(x − t)k (k)
(x − t)2 (2)
f (t) + · · · +
f (t) + (x − t)k o(x)
f (x) = f (t) + (x − t)f (t) +
2!
k!
worin o : I → R an der Stelle t von höherer als nullter Ordnung verschwindet
(stetiger Nulldurchgang). Somit (14.10) verschwindet der Term (x − t)k o(x) von
höherer als k-ter Ordnung.
′
Beweis. Wir wenden den Satz von Taylor an. Aufpassen müssen wir aber bei der
Differenzierbarkeitsordnung. Wir erhalten darum bloß:
(x − t)k−1 (k−1)
(x − t)2 (2)
f (t) + · · · +
f
(t) + Rk
f (x) = f (t) + (x − t)f (t) +
2!
(k − 1)!
′
Das Restglied stellen wir in der Lagrangschen Form dar:
(x − t)k (k)
f (sx )
für ein sx ∈ [t, x]
Rk =
k!
f (k) (sx ) − f (k) (t)
(x − t)k (k)
f (t) + (x − t)k
=
k!
k!
|
{z
}
=:o(x)
Damit ist die Funktion o : I → R bestimmt. Sie hat an der Stelle x = t einen
stetigen Nulldurchgang, weil f (k) stetig ist und stets gilt |sx − t| ≤ |x − t|.
q.e.d.
140
Korollar 14.65. Sei f : I → R mindestens zweifach stetig differenzierbar. An der
Stelle t ∈ I verschwinde die Ableitung f ′ (t) = 0. Die zweite Ableitung sei echt positiv
f ′′ (t) > 0. Dann nimmt f an der Stelle t ein lokales Minimum an. Das heißt, es gibt
ein δ > 0, so daß f (x) > f (t) ist für alle x 6= t in Bδ (t) ∩ I.
Entsprechend hat f ein lokales Maxiumum an der Stelle t, wenn dort die Ableitung
verschwindet und die zweite Ableitung echt negativ ist.
Beweis. Mit (14.64) stellen wir dar:
f (x) = f (t) + (x − t)f ′ (t) +
(x − t)2 ′′
f (t) + (x − t)2 o(x)
2
Da f ′ (t) = 0 ist erhalten wir:
(x − t)2 ′′
f (x) = f (t) +
(f (t) − 2o(x))
2
Die Funktion o verschwindet stetig an der Stelle t und f ′′ ist dort echt positiv. Also
gibt es δ > 0, so daß f ′′ (t) − 2o(x) > 0 in der δ-Umgebung von t gilt. Damit ist das
gesuchte δ gefunden, denn es gilt (x − t)2 ≥ 0 mit Gleichheit nur für x = t. q.e.d.
Aufgabe 14.66. Sei f : I → R glatt. Es sei k ≥ 1 die erste Ordnung, für die
Ableitung f (k) an der Stelle t verschwindet:
f (j) (t)

=
6=
0 für 1 ≤ j < k
0 für j = k
Zeige: Ist k gerade und f (k) (t) > 0, so hat f an der Stelle t ein lokales Minimum. Ist
k gerade und f (k) (t) < 0, so hat f an der Stelle t ein lokales Maxiumum. Ist k
ungerade, so hat f an der Stelle t weder ein lokales Minimum noch ein lokales
Maximum.
Warnung 14.67. Ist f : I → R glatt, so erhalten wir eine Taylorreihe
(x − t)3 (3)
(x − t)2 (2)
f (t) +
f (t) + · · ·
f (t) + (x − t)f (t) +
2!
3!
Diese Reihe muß nicht konvergieren.
Es kann auch der Fall eintreten, daß die Reihe konvergiert aber die Funktion f nicht
beschreibt.
′
Aufgabe 14.68. Bestätige, daß durch
∞
X
1
(−1)i+1
1
2
3
0 + (x − 1) − (x − 1) + (x − 1) − · · · =
(x − 1)i
2
3
i
i=1
die Taylorentwicklung des natürlichen Logarithmus an der Stelle 1 gegeben ist.
Zeige ferner:
∞
X
(−1)i+1 i
h
∀h ∈ (−1, 1)
ln(1 + h) =
i
i=1
In diesem Fall beschreibt die Taylorreihe die Funktion also zumindest innerhalb
ihres Konvergenzradius.
141
Aufgabe 14.69. Definiere
f : R −→ R
x 7→

0
exp
− x12
x=0
x 6= 0
Zeige, daß an der Stelle x = 0 die Ableitungen aller Ordnungen verschwinden.
Hinweis: Dazu überlegt man sich, daß jede Funktion der Form
x 7→
f (x) exp − x12
xk
(x 6= 0)
mit k ∈ Z und einem Polynom f (x) an der Stelle x = 0 durch der Wert 0 stetig
fortgesetzt werden kann. Hier setzt sich die Exponentialfunktion also durch.
Vergleich zu diesem Phänomen auch (10.34).
Hier verschwindet also die Taylorentwicklung an der Stelle 0 und beschreibt die
Funktion in keiner offenen Umgebung der Entwicklungsstelle.
14.7
Der Umkehrsatz
Umkehrregel 14.70. Seien I und J zwei offene Intervalle und f : I → J sei eine
stetige Bijektion mit ebenfalls stetiger Umkehrung g := f −1 : J → I. Ferner sei f
differenzierbar an der Stelle x0 ∈ I. Dann ist die Umkehrung g an der Stelle
y0 := f (x0 ) genau dann differenzierbar, wenn f ′ (x0 ) 6= 0 ist. In diesem Fall gilt
g ′ (y0 ) =
1
f ′ (x0 )
Beweis. Wir bilden die Steigungsfunktionen
f (x) − f (x0 )
f (x) − y0
=
x − x0
x − x0
g(y) − x0
g(y) − g(y0 )
=
g0′ : y →
7
y − y0
y − y0
f0′ : x 7→
Nach Voraussetzung hat f0 eine stetige Fortsetzung auf die Stelle x0 mit Wert
f ′ (x0 ). Zu zeigen ist, daß sich g0 stetig auf y0 fortsetzen läßt genau dann, wenn
f ′ (x0 ) 6= 0 ist.
Das ergibt sich aus der Rechnung:
g0′ (y) f0′ (g(y)) =
g(y) − x0 y − y0
g(y) − x0 f (g(y)) − y0
=
=1
y − y0
g(y) − x0
y − y0 g(y) − x0
die für y 6= y0 die Identität
g0′ (y) =
1
f0′ (g(y))
bestätigt. Da g und f0′ stetig sind, ist hiermit genau dann eine an der Stelle y0
stetige Funktion definiert, wenn der Nenner dort nicht verschwindet. Wie
1
.
q.e.d.
vorhergesagt, ist in diesem Fall g0′ (y0 ) = f ′ (x
0)
142
Es ist unbefriedigend, daß in (14.70) die stetige Invertierbarkeit von f vorausgesetzt
wird. Schließlich haben wir dafür kein hinreichendes Kriterium, so daß wir die
Umkehrregel eigentlich nur anwenden können, wenn wir die Umkehrfunktion explizit
kennen und wissen, daß sie stetig ist.
Lemma 14.71. Sei I ein offenes Intervall um 0 und f : I → R eine stetig
differenzierbare Funktion mit f (0) = 0 und f ′ (0) = 1. Dann gibt es ε > 0 und δ > 0
so daß für jede rechte Seite y ∈ [−δ, δ] die Gleichung f (x) = y in der Unbestimmten
x eindeutig lösbar ist im Intervall x ∈ [−ε, ε]. Die eindeutige Lösung hängt stetig
von y ab. Kurz: Die Funktion f ist in einer Umgebung von 0 stetig umkehrbar.
Beweis (erste Version). Die Ableitung ist stetig. Aus f ′ (0) = 1 > 0 folgt darum,
daß es ein ε > 0 gibt, so daß f ′ (x) > 0 ist für alle x ∈ [−ε, ε]. Mit (14.29) schließen
wir, daß f auf [−ε, ε] streng monoton wächst. Insbesondere ist f auf [−ε, ε] injektiv.
Nun wählen wir δ > 0 so, daß [−δ, δ] ⊆ [f (−ε) , f (ε)] ist. Da f stetig ist, läßt sich
mit dem Zwischenwertsatz (13.28) jedes y ∈ [−δ, δ] in der Form y = f (x) darstellen
mit einem (wie gesehen eindeutig bestimmten) x ∈ [f (−ε) , f (ε)]. Es sei g die so
definierte Umkehrfunktion.
Damit ist die eindeutige Lösbarkeit der Gleichungen f (x) = y für Werte y
hinreichend nahe bei 0 gezeigt. Es bleibt die stetige Abhängigkeit der Lösung x von
der rechten Seite y zu zeigen, also die Stetigkeit der Funktion g. Sei also y ∈ [−δ, δ]
gegeben und y⋆ sei eine Folge in [−δ, δ], die gegen y konvergiert. Nun ist x = g(y)
das Urbild von y unter f . Entsprechend ist x⋆ := g(y⋆ ) die Urbildfolge zu y⋆ . Zu
zeigen ist, daß x⋆ gegen x konvergiert, denn damit ist die Folgenstetigkeit von g an
der (beliebig gewählten) Stelle y gezeigt.
Nun ist x⋆ eine beschränkte Folge, da sie das Intervall [−ε, ε] nicht verläßt. Sie hat
darum mindestens einen Häufungspunkt λ. Sei a⋆ eine Teilfolge von x⋆ , die gegen λ
konvergiert. Da f stetig ist, konvergiert f (a⋆ ) gegen f (λ). Da f (a⋆ ) eine Teilfolge
von y⋆ ist, konvergiert f (a⋆ ) gegen y. Eindeutigkeit des Grenzwertes impliziert
darum, daß f (λ) = y ist. Die Injektivität von f auf dem Intervall [−ε, ε] impliziert
dann λ = x. Also hat x⋆ genau einen Häufungspunkt, nämlich x. Nach (9.24)
konvergiert x⋆ gegen x.
q.e.d.
Beweis (zweite Version). Für y ∈ R definieren wir die stetig differenzierbare
Abbildung
Φy : I −→ R
x 7→ y + x − f (x)
Wir beobachten:
1. Eine Stelle x ist ein Fixpunkt der Abbildung Φy genau dann, wenn y = f (x)
ist:
x = Φy (x) = y + x − f (x)
⇐⇒
y = f (x)
2. Die Abbildung ist Φy stetig differenzierbar mit Φ′y (x) = ddx Φy (x) = 1 − f ′ (x).
Insbesondere verschwindet
die Ableitung an der Stelle 0. Es gibt also ein
ε > 0, so daß Φ′y (t) < 14 ist für alle t ∈ [−ε, ε].
143
3. Da f (0) = 0 ist, gilt Φy (0) = y + 0 − f (0) = y.
4. Für je zwei Stellen s, t ∈ [−ε, ε] gibt es nach dem Mittelwertsatz der
Differentialrechnung (14.27) ein ξ zwischen s und t mit
|Φy (s) − Φy (t)| = Φ′y (ξ) (s − t) ≤
5. Insbesondere ist für t ∈ [−ε, ε]:
|Φy (t) − y| = |Φy (t) − Φy (0)| ≤
1
|s − t|
4
1
ε
|t| ≤
4
4
Für |y| ≤ 34 ε bildet die Abbildung Φy das Intervall [−ε, ε] in sich ab.
Wir setzen δ :=
3ε
4
und setzen ab jetzt y ∈ [−δ, δ] voraus.
6. Für ein gegebenes y hat die Gleichung f (x) = y höchstens eine Lösung im
Intervall [−ε, ε], denn (siehe Punkt 1) die Abbildung Φy hat höchstens einen
Fixpunkt in [−ε, ε]. Sind nämlich s und t zwei Fixpunkte, so folgt aus (4):
|s − t| = |Φy (s) − Φy (t)| ≤
1
|s − t|
4
=⇒
|s − t| = 0
7. Wir definieren rekursive die eine Folge von Funktionen
g⋆ : [−δ, δ] −→ [−ε, ε]
durch
g0 (y) := 0
gi+1 (y) := Φy (xi ) = y + gi (y) − f (gi (y))
Aus der Darstellung gi+1 (y) = Φy (xi ) folgern wir induktiv, daß das Bild von gi
im Intervall [−ε, ε] enthalten ist und darum gi+1 wohldefiniert ist.
8. Aus der Darstellung gi+1 (y) = y + gi (y) − f (gi (y)) folgern wir induktiv, daß all
gi stetig sind.
9. Für jedes feste y und je zwei Indices i ≤ j können wir abschätzen:
|gi (y) − gj (y)| ≤ |gi (y) − gi+1 (y)| + · · · + |gj−1(y) − gj (y)|
1
1
≤ |gi (y) − gi+1 (y)| 1 + + 2 + · · ·
4 4
14
≤ |g0 (y) − g1 (y)| i
4 3
14
= |y| i
4 3
ε
< i −−−→ 0
4 i→∞
Die Folge g⋆ (y) ist also Cauchy-konvergent. Die Funktionenfolge g⋆ konvergiert
darum punktweise gegen eine Grenzfunktion g : [−δ, δ] → [−ε, ε]
144
10. Die Abschätzung zeigt mehr. Für jedes j ≥ i liegt gj (y) in der 4εi -Umgebung
von gi (y). Darum liegt auch der Limes g(y) in der 4εi -Umgebung von gi (y).
Diese Distanzabschätzung hängt nicht von y ab. Die Folge g⋆ konvergiert also
gleichmäßig gegen g. Darum ist g stetig wegen (8).
11. Die Stetigkeit von Φy impliziert, daß der Grenzwert g(y) = lim⋆→∞ g⋆ (y) ein
Fixpunkt ist. Wir haben nämlich:
0,
Φy (0) ,
Φy (Φy (0)) ,
Φy (Φy (Φy (0))) ,
. . . → g(y)
Φy (0) , Φy (Φy (0)) , Φy (Φy (Φy (0))) , Φy (Φy (Φy (Φy (0)))) , . . . → Φy (g(x))
Also ist g(y) die eindeutig bestimmte (6) Lösung der Gleichung f (x) = y im
Intervall [−ε, ε].
Nach (10) hängt diese Lösung stetig von y ab.
q.e.d.
Umkehrsatz 14.72. Sei f : I → R stetig differenzierbar und t eine Stelle in I.
Dann sind äquivalent:
1. Die Abbildung f hat an der Stelle t eine nicht-verschwindende Ableitung
f ′ (t) 6= 0.
2. Die Funktion f ist in einer Umgebung von t stetig umkehrbar und die
Umkehrung ist an der Stelle t differenzierbar.
Sind diese Bedingungen erfüllt, so ist die Umkehrung stetig differenzierbar und hat
an der Stelle f (t) die Ableitung f ′1(t) .
Beweis. Die Funktionen
τ : x 7→ x + t
und
σ : y 7→
y − f (t)
f ′ (t)
sind glatt, bijektiv, und haben eine glatte Umkehrung.
Sei zunächst f ′ (t) 6= 0. Dann erfüllt die Verkettung
g := σ ◦ f ◦ τ : x 7→
f (x + t) − f (t)
f ′ (t)
die Voraussetzungen von Lemma (14.71), und wir schließen, daß g in einer
Umgebung von 0 stetig umkehrbar ist. Dann ist aber f = τ −1 ◦ g ◦ σ −1 in einer
Umgebung von t stetig umkehrbar. Mit der Umkehrregel (14.70) schließen wir, daß
die Umkehrung differenzierbar an der Stelle f (t) mit Ableitung f ′1(t) ist.
Ist nun f in einer Umgebung von t stetig umkehrbar mit einer an der Stelle f (t)
differenzierbaren Ableitung, so folgt aus der Umkehrregel unmittelbar, daß f ′ (t) 6= 0
ist.
Es bleibt der Zusatz zu zeigen. Da f stetig differenzierbar ist, folgt aus f ′ (t) 6= 0, daß
die Ableitung f ′ in einer offenen Umgebung U von t nicht verschwindet. An jedem
Punkt dieser Umgebung sind darum die Voraussetzungen erfüllt und wir erhalten
die Differenzierbarkeit der Umkehrung an allen Punktes der Bildes f (U).
q.e.d.
145
Beispiel 14.73. Die Sinus-Funktion sin ist stetig differenzierbar (sogar glatt) und
(0) = cos(0) = 1. Also ist die Sinus-Funktion in
an der Stelle 0 ist die Ableitung ddsin
x
einer Umgebung von 0 invertierbar mit stetig differenzierbarer Umkehrfunktion.
Man nennt die Umkehrung
π π
arcsin : [− , ] → R
2 2
den Arcussinus.
Wir können die Ableitung mit Hilfe der Umkehrregel bestimmen:
d
1
arcsin(y) =
dy
cos(arcsin(y))
1
= q
± 1 − sin(arcsin(y))2
1
=√
1 − y2
Es gilt das positive Vorzeichen, weil der Cosinus im Bild [− π2 , π2 ] des Arcussinus
nirgends negativ ist.
Bemerkung 14.74. In Beispiel (14.73) zeigt sich ein allgemeines Prinzip. Nehmen
wir an, eine stetig differenzierbare und invertierbare Funktion f mit Umkehrung g
habe eine Ableitung f ′ , die sich als Funktion von f ausdrücken läßt:
f ′ (x) = Ψ(f (x))
Dann können wir die Ableitung g ′ der Umkehrfunktion einfach angeben. Es ist
nämlich mit x = g(y) und damit y = f (x):
g ′ (y) =
1
f ′ (x)
=
1
1
=
Ψ(f (x))
Ψ(y)
Dieses Prinzip ist anwendbar auf die Funktionen sin, cos, tan, sinh, cosh und tanh.
Im Abschnitt (A.2) findet sich die entsprechende Tabelle.
Aufgabe 14.75. Die Gleichung
x2 = 3
läßt sich als Fixpunktbedingung darstellen: Sei α 6= 0, dann ist
x2 = 3
⇐⇒
x = x − α x2 − 3
Wir definieren also die Abbildung
Φα : x 7→ x − α x2 − 3
Wir betrachten die Iterationsfolge mit Startwert 1, 5, denn zwischen 1 und 2 muß
eine Lösung liegen (Zwischenwertsatz):
1, 5, Φα (1, 5) , Φα (Φα (1, 5)) , Φα (Φα (Φα (1, 5))) , Φα (Φα (Φα (Φα (1, 5))))
146
Finde durch Probieren Werte von α, so daß die Folge gegen eine Lösung konvergiert.
Versuche α so zu wählen, daß die Konvergenz besonders schnell erfolgt. Welche
Genauigkeit ist nach 1, 2, 3, 4, 5, 6, 7, und 8 Schritten erreicht? Wieviel gültige
Nachkommastellen hat die Approximation in den jweiligen Schritten?
Aufgabe 14.76. Das babylonische Wurzelziehen ist ungefähr 3700 Jahre alt. Sei
y > 0. Dann definieren wir die Iteration
y
x
x2 + y
2x
√
Für einen Startwert x nahe genug an der Wurzel y konvergiert die Folge
Φy : x 7→
x+
2
=
x, Φy (x) , Φy (Φy (x)) , Φy (Φy (Φy (x))) , Φy (Φy (Φy (Φy (x))))
√
dann sehr schnell gegen y.
Zum Vergleich mit (14.75) betrachten wir die Folge:
x0 := 1, 5
xi+1 := Φ3 (xi ) =
x2i + 3
2xi
Welche Genauigkeit hat die Näherung nach 1, 2, 3 und 4 Schritten? Gib auch die
jeweilige Zahl der gültigen Nachkommastellen an.
Zur Erklärung zeige:
√ 2
x− y
√
(10)
Φy (x) − y =
2x
√ Leite ab, daß der Approximationsfehler xi − 3 abgeschätzt werden kann durch
i+1
21−2
.
147
15
15.1
Anwendungen und Beispiele
Die Länge einer Kurve
Sei I ein Intervall.
Definition 15.1. Das m-fache Kreuzprodukt Rm = R × · · · × R ist die Menge aller
m-Tupel reeller Zahlen. Wir schreiben diese Tupel als Spalten- oder Zeilenvektoren.
Ich bevorzuge Spalten, aus Gründen, die der linearen Algebra entstammen. Aber
aus typographischen Gründen sind Zeilen manchmal angenehmer.
Durch komponentenweise Addition und Skalarmultiplikation versehen wir Rm mit
der Struktur eines reellen Vektorraumes (Vergleiche den Vektorraum der
Treppenfunktionen). Man nennen m die Dimension von Rm .
Der Raum Rm hat auch eine Geometrie, denn wir können die Länge eines Vektor
definieren durch:
 
x
1  . 
 . 
 . 
xm := x21 + · · · + x2m
1
2
=
q
x21 + · · · + x2m
Der Abstand zweier Vektoren ist dann einfach die Länge ihrer Differenz. Die Formel
entspricht dem, was der Satz von Pythagoras gerade für kartesische Koordinaten
erwarten läßt.
Definition 15.2. Der Abstand läßt sich auch vermöge des Skalarproduktes von
Vektoren definieren (es heißt so, weil das Ergebnis eine skalare Größe, also eine
Zahl, ist). Für zwei Vektoren


x1
 . 
. 
u=
 . 
und
definiert man
hu, vi :=
q
y1
 . 
. 
v=
 . 
ym
xm
Damit ist |u| =


m
X
xi yi
i=1
hu, ui.
Bemerkung 15.3. Das Skalarprodukt genügt den Bedingungen für ein
inneres Produkt:
hu, vi = hv, ui
hαu + βv, wi = α hu, wi + β hv, wi
hu, ui ≥ 0
Gleichheit nur für u = 0
Die erste Bedingung ist die Symmetrie. Die zweite Bedingung formuliert, daß
h⋆, wi für jeden festen Vektor w eine lineare Abbildung ist. Mit der Symmetrie
148
folgt, daß das Skalarprodukt auch im zweiten Argument linear ist. Es ist also eine
symmetrische Bilinearform. Die dritte Bedingung nennt man positive Definitheit.
Einen Vektorraum, auf dem ein innered Produkt fixiert ist, nennt man einen
euklidischen Vektorraum. In der linearen Algebra wird gezeigt, daß sich auf jedem
euklidischen Vektorraum kartesische Koordinaten einführen lasse, so daß das innere
Produkt die Form des Skalarproduktes annimmt.
Proposition 15.4 (Ungleichung von Cauchy-Schwarz). In einem euklidischen
Raum (insbesondere im Rm ) gilt:
hu, vi2 ≤ hu, ui hv, vi
Beweis. Der Fall v = 0 ist offensichtlich. Sei also v 6= 0. Betrachte das quadratische
Polynom
x 7→ hu, ui + 2x hu, vi + x2 hv, vi = hu + xv, u + xvi ≥ 0
und bestimme die Stelle x, an der das Minimum angenommen wird. Es ist
xmin = − hu,vi
. Einsetzen ergibt:
hv,vi
0 ≤ hu, ui − 2
hu, vi2
hu, vi2
hu, vi
hu, vi +
hv,
vi
=
hu,
ui
−
hv, vi
hv, vi
hv, vi2
Nach Multiplikation mit hv, vi folgt die Behauptung.
q.e.d.
Aufgabe 15.5. Der Abstand von Punkten im Rm genügt der Dreiecksungleichung.
Seien u, v und w drei Punkte in Rm . Zeige:
|w − u| ≤ |w − v| + |v − u|
Definition 15.6. Eine Abbildung γ : I → Rm heißt Kurve. Sie wird gegeben durch
m Koordinatenfunktionen γi : I → R vermöge der Beziehung:


γ1 (t)
 . 

γ(t) := 
 .. 
γm (t)
Für





integrierbar, beschränkt, stetig,

blah“ ∈ differenzierbar, stetig differenzierbar,


”


zweifach stetig differenzierbar, . . .
heißt eine Kurve blah, wenn alle ihre Koordinatenfunktionen blah sind.
149
Definition 15.7 (Tangentenvektor und Geschwindigkeit). Sei γ : I → Rm
eine an der Stelle t differenzierbare Kurve mit Koordinatenfunktionen γi . Dann heißt

 d γ1
(t)
dγ


(t) = γ̇(t) :=  · · · 
dx
d γm
(t)
dx
dx
der Tangentenvektor oder Geschwindigkeitsvektor der Kurve γ an der Stelle t. Die
Notation γ̇ ist in der Vorstellungswelt beheimatet, die die Kurve als Bewegung
ansieht und das Argument als Zeitpunkt auffaßt. Daher rührt auch die präferierte
Bezeichnung t für die Argumente und der Name Geschwindigkeitsvektor.
Der Betrag |γ̇(t)| ist die Momentangeschwindigkeit zur Zeit t.
Behauptung und Definition 15.8. Ist die Kurve γ stetig differenzierbar im
ganzen Definitionsbereich, so ist die Abbildung
t 7→ |γ̇(t)|
stetig und damit integrierbar. Die Größe
Z
b
a
|γ̇(ξ)| d ξ
heißt Kurvenlänge. Sie gibt die Länge des Kurvenstückes γ|[a,b] an.
Beweis. Stetige Differenzierbarkeit von γ bedeutet, daß die Ableitung γ̇ stetige
Koordinatenfunktionen hat. Dann ist die Abbildung
t 7→
m
X
γ̇i (t)2
i=1
stetig, weil sie mittels der Grundrechenarten aus stetigen Abbildungen
1
zusammengesetzt ist. Die Stetigkeit von y 7→ y 2 impliziert dann die Stetigkeit der
Verkettung:
t 7→
m
X
i=1
2
γ̇i(t) 7→
m
X
γ̇i (t)
2
i=1
!1
2
= |γ̇(t)|
q.e.d.
Beispiel 15.9. Seien u, v ∈ Rm . Die Kurve
γ : R −→ Rm
t 7→ u + tv
beschreibt eine gerade Linie. Die Geschwindigkeit ist hier konstant. Sogar der
Geschwindigkeitsvektor ist konstant. Es gilt nämlich γ̇(t) = v. Die Länge des
Kurvensegments γ|[a,b] ist darum
(b − a) |v| = |u + bv − u − av| = |γ(b) − γ(a)|
der Abstand der Endpunkte (unabhängig davon, mit welcher Geschwindidkeit die
Strecke zurückgelegt wird).
150
Beispiel 15.10. Die Kurve
γ : R −→ R2
cos(t)
t 7→
sin(t)
!
ist stetig differenzierbar. Es gilt:
|γ(t)| = sin(t)2 + cos(t)2
1
2
=1
und
|γ̇(t)| = cos(t)2 + (− sin(t))2
1
2
=1
Also ist beschreibt γ(t) die Bewegung eines Punktes, der sich auf dem Einheitskreis
mit konstanter Geschwindigkeit 1 bewegt. Die Ebene ist so orientiert, daß dieser
Punkt im mathematisch positiven Sinn rotiert (d.h. gegen den Uhrzeiger).
Entprechend sind cos(ϑ) und sin(ϑ) die x- bzw. y-Koordinate des Punktes auf dem
Einheitskreis, der im Bogenmaß gerade ϑ vom Punkt x = 1, y = 0 entfernt ist. Dies
erklärt, warum das Bogenmaß die natürliche Einheit für Winkel ist. Es erhellt auch
die folgende Definition:
Die Zahl π ist definiert als die kleinste echt-positive Nullstelle des Sinus.
Daraus ergibt sich auch der Definitionsbereich des Arcussinus aus Beispiel (14.73).
Definition 15.11. Die Vektoren
 
 
1
 
0
 
 
e1 := 0
.
 .. 
 
0
 
1
 
 
e2 := 0
.
 .. 
 
0
 
0
···
em :=
0
.
.
.
 
0
 
0
 
1
heißen Standardeinheitsvektoren. Sie haben jeweils die Länge 1 und für ihre
Skalarprodukte gilt:

0 i 6= j
hei , ej i =
1 i = j
Die Standardeinheitsvektoren bilden die Standardbasis des Rm .
u1
..
.
Beobachtung 15.12. Für u =
um
!
∈ Rm gilt:
|ui | ≤ |u| ≤ |u1 | + · · · + |um |
Beweis. Zunächst ist
|ui | =
q
u2i ≤
q
u21 + · · · + u2m = |u|
151
Auf der anderen Seite ist:


u1
 . 
. 
u=
 .  = u1 e1 + · · · + um em
um
Mit |ui ei | = |ui| und der Dreiecksungleichung folgt dann:
|u| ≤ |u1 e1 | + · · · + |um em | = |u1 | + · · · + |um |
q.e.d.
Definition 15.13. Sei γ : I → Rm eine Kurve und t ∈ I eine Stelle. Eine Gerade
λ : R −→ Rm
x 7→ u + xv
heißt Tangente von γ an der Stelle t, wenn die Abbildung
x 7→ |γ(x) − λ(x)|
an der Stelle t von höherer als erster Ordnung verschwindet.
Satz 15.14. Sei γ : I → Rm eine Kurve
und t ∈ I eine Stelle. Wir setzen
v1 !
u := γ(t). Für einen Vektor v = ... ∈ Rm sind dann äquivalent:
vm
1. Die Kurve γ ist differenzierbar an der Stelle t mit Ableitung γ̇(t) = v.
2. Die Gerade
x 7→ u + (x − t)v = (u − tv) + xv
ist eine Tangente an die Kurve γ an der Stelle t.
3. Es gibt eine an der Stelle t stetige Kurve γ̄ : I → Rm mit:
γ(x) − γ(t) = (x − t)γ̄(x)
und
v = γ̄(t)
Beweis. Seien γi die Koordinatenfunktionen von γ. Die Äquivalenz (1) ⇔ (3) ergibt
sich dann wiefolgt:
γ̇(t) = v
⇐⇒ ∀i : γ̇i = vi



γ̄i stetig an der Stelle t
γ̄i(t) = vi
⇐⇒ ∀i ∃γ̄i : I → R :


γi(x) − γi(t) = (x − t)γ̄i (x)
m
⇐⇒ ∃γ̄ : I → R



γ̄ stetig an der Stelle t
γ̄(t) = v
:


γ(x) − γ(t) = (x − t)γ̄(x)
152
Dies ist also nichts anderes als Ausbuchstabieren der Tatsache, daß die
Koordinatenfunktionen γi an der Stelle t differenzierbarst sind.
Man ist versucht, die Äquivalenz (1) ⇔ (2) ähnlich mittels linearer
Approximierbarkeit zu argumentieren. Dies scheitert an der Vermischung der
Koodinatenfunktionen in der Abstandsfunktion. Wir argumentieren statt dessen
beide Richtungen separat:
(1) ⇒ (2) Sei γ differenzierbar an der Stelle t mit Tangentenvektor v, so sind die
Koordinatenfunktionen γi differenzierbar an der Stelle t mit Ableitung vi . Das
heißt, daß für jeden Index i die Funktion
x 7→ γi (x) − γi(t) − (x − t)vi
von höherer als erster Ordnung verschwindet. Dann verschwinden die
Funktionen
x 7→ |γi (x) − γi(t) − (x − t)vi |
an der Stelle t ebenfalls von höherer als erster Ordnung. Es folgt, daß die
Summe
m
x 7→
X
i=1
|γi (x) − γi (t) − (x − t)vi |
an der Stelle t von höherer als erster Ordnung verschwindet. Wegen
|γ(x) − λ(x)| =
≤
v
um
uX
t
(γ
i (x)
i=1
m
X
i=1
− γi (t) − (x − t)vi )2
|γi(x) − γi(t) − (x − t)vi |
folgt, daß
x 7→ |γ(x) − λ(x)|
an der Stelle t von höherer als erster Ordnung verschwindet.
(2) ⇒ (1) Nehmen wir an, daß
x 7→ |γ(x) − λ(x)|
an der Stelle t von höherer als erster Ordnung verschwindet. Für jeden Index i
gilt:
|γi (x) − γi(t) − (x − t)vi | ≤
v
um
uX
t
(γ
i (x)
i=1
− γi(t) − (x − t)vi )2
= |γ(x) − λ(x)|
Mithin verschwinden
x 7→ |γi (x) − γi(t) − (x − t)vi |
und somit
x 7→ γi (x) − γi(t) − (x − t)vi
an der Stelle t von höherer als erster Ordnung.
153
q.e.d.
Satz 15.15 (Parametrisierungsunabhängigkeit). Die Kurvenlänge ist
unabhängig von der Parametrisierung: Sei γ : I → Rm eine stetig differenzierbare
Kurve und g : J → I eine stetig differenzierbare Abbildung mit g ′ ≥ 0, und κ := γ ◦ g
die Verkettung. Dann ist κ : J → Rm eine stetig differenzierbare Kurve, und es gilt
für a, b ∈ J:
Z
b
a
|κ̇(ζ)| d ζ =
Z
g(b)
g(a)
|γ̇(ξ)| d ξ
Beweis. Mit der Kettenregel, angewendet auf die Koordinatenfunktionen, haben
wir:
κ̇(t) = γ̇(g(t)) g ′(t)
und mit g ′ ≥ 0 auch
|κ̇(t)| = |γ̇(g(t))| g ′(t)
Die Abbildung t 7→ |γ̇(t)| ist stetig. Also ist mit der Substitutionsregel (14.44):
Z
b
a
|κ̇(ζ)| d ζ =
Z
b
a
|γ̇(g(ζ))| g ′ (ζ) d ζ =
Z
g(b)
g(a)
|γ̇(ξ)| d ξ
q.e.d.
Lemma 15.16. Sei γ : I → Rm an der Stelle t differenzierbar. Ferner sei γ(t) 6= 0.
Dann ist auch die Funktion x 7→ |γ(x)| an der Stelle t differenzierbar und es gilt:
d
|γ(t)| ≤ |γ̇(t)|
dt
Die Ableitung der Norm ist nicht größer als die Norm der Ableitung.
Beweis. Differenzierbarkeit von |γ(x)| ergibt sich aus γ(t) 6= 0 mit der Kettenregel:
|γ(x)| ist die Wurzel aus einer Summe von quadraten differenzierbarer Funktionen.
Zur Abschätzung nutzen wir (15.4). Es ist
hγ(t) , γ̇(t)i2 ≤ hγ(t) , γ(t)i hγ̇(t) , γ̇(t)i
Es folgt:
und damit:
hγ(t) , γ̇(t)i2
≤ hγ̇(t) , γ̇(t)i
hγ(t) , γ(t)i
dq
hγ(t) , γ̇(t)i
d
|γ(t)| =
≤ |γ̇(t)|
hγ(t) , γ(t)i =
dt
dt
|γ(t)|
Dabei benutzen wir die Kettenregel
d
dt
q
′
f (t)
f (t) = √
für f (t) 6= 0 und:
2
f (t)
m
m
X
d X
d
γi (t) γ̇i (t) = 2 hγ(t) , γ̇(t)i
γi (t)2 = 2
hγ(t) , γ(t)i =
dt
d t i=1
i=1
q.e.d.
Satz 15.17 (Kurvenlänge und Abstand). Sei γ : I → Rm eine stetig
differenzierbare Kurve. Dann gilt: Für je zwei Zeiten s < t in I ist
|γ(t) − γ(s)| ≤
Z
t
s
|γ̇(ξ)| d ξ
Insbesondere ist keine stetig differenzierbare Kurve zwischen zwei Punkten kürzer als
die gerade Stecke.
154
Beweis. Eine verschobene Kurve t 7→ γ(t) + u ist ebenfalls stetig differenzierbar,
hat zu jeder Zeit dieselbe Ableitung und auch die Abstände durchlaufener Punkte
bleiben gleich. Mit der Wahl u = −γ(s) können wir also o.B.d.A. annehmen, daß
γ(s) = 0 ist. Dann ist die Ungleichung
|γ(t)| ≤
Z
s
t
|γ̇(ξ)| d ξ
zu zeigen.
Die Idee ist, Lemma (15.16) anzuwenden. Wir möchten schreiben:
Z
|γ(t)| = |γ(t)| − |γ(s)| =
t
s
d
|γ(x)| d ξ ≤
dx
x=ξ
Z
s
t
|γ̇(ξ)| d ξ
Leider geht das nicht, weil an den Stellen mit γ(ξ) = 0, der Integrand
d
dx
|γ(x)| x=ξ
nicht definiert ist (Erinnerung: die Wurzelfunktion hat an der Stelle 0 keine
Ableitung).
Wir behelfen uns wiefolgt. Sei s̄ := sup {x ∈ [s, t] γ(x) = 0}. Da γ stetig ist, gilt
γ(s̄) = 0. Damit ist s̄ der späteste Zeitpunkt in [s, t] mit γ(s̄) = 0.
Für jedes x ∈ (s̄, t) ist dann mit Lemma (15.16), angewendet auf die verschobene
Kurve:
Z t
Z t
d
|γ(t)| − |γ(x)| =
|γ̇(ξ)| d ξ
|γ(ξ)| d ξ ≤
x dx
x
x=ξ
Nun sind beide Seiten als Funktion von x stetig auch in der Stelle x = s̄. Darum gilt
auch die Ungleichung:
|γ(t)| = |γ(t)| − |γ(s̄)| ≤
Z
t
s̄
|γ̇(ξ)| d ξ ≤
Z
s
t
|γ̇(ξ)| d ξ
q.e.d.
Definition 15.18. Sei γ : I → Rm eine stetige Kurve. Die Kurve γ ist von
beschränkter Variation im Intervall [a, b] ⊆ I, wenn die Menge
Lγ (a, b) :=
(
m
X
i=1
|γ(ai ) − γ(ai−1 )| a = a0 < a1 < · · · < am = b Unterteilung
)
der Längen einbeschriebener Polygonzüge beschränkt ist. In diesem Fall heißt ihr
Supremum Varγ (a, b) := sup Lγ (a, b) die totale Variation der Kurve γ im Intervall
[a, b] ⊆ I.
Aufgabe 15.19. Sei γ : [a, b] → Rm stetig und von beschränkter Variation im
Definitionsbereich. Sei ferner c ∈ [a, b]. Zeige:
1. Die Kurve γ ist von beschränkter Variation in den Intervallen [a, c] und [c, b].
2. Die totale Variation ist additiv:
Varγ (a, b) = Varγ (a, c) + Varγ (c, b)
155
Bemerkung 15.20. Es gibt Kurven, die auf keinem nicht-entarteten Teilintervall
ihres Definitionsbereichs von beschränkter Variation sind.
Satz 15.21. Sei γ : I → Rm eine stetig differenzierbare Kurve. Dann ist sie von
beschränkter Variation auf jedem kompakten Teilintervall ihres Definitionsbereichs.
Ferner stimmen Kurvenlänge und totale Variation überein:
Varγ (a, b) =
Z
b
a
|γ̇(ξ)| d ξ
∀[a, b] ⊂ I
Beweis. Sei J = {a = a0 < a1 < · · · · · · < an = b} eine Unterteilung von [a, b].
Dann ist mit (15.17):
n
X
i=1
R
|γ(ai ) − γ(ai−1 )| ≤
n Z
X
ai
|γ̇(ξ)| d ξ =
i=1 ai−1
Z
an
|γ̇(ξ)| d ξ
a0
Also ist aa0n |γ̇(ξ)| d ξ eine obere Schranke von Lγ (a, b). Also ist γ von beschränkter
Variation auf [a, b], und es gilt
Varγ (a, b) ≤
Z
b
a
|γ̇(ξ)| d ξ
Andererseits ist {t < x} eine Zerlegung von [t, x] und wir folgern mit der Additivität
der Variation (15.19), daß für feste a und t < x gilt:
|γ(x) − γ(t)| ≤ Varγ (x, t) = Varγ (a, x) − Varγ (a, t) ≤
Z
t
x
|γ̇(ξ)| d ξ
Also auch:
γ(x) − γ(t) x−t Varγ (a, x) − Varγ (a, t)
1
≤
≤
x−t
x−t
Z
x
t
|γ̇(ξ)| d ξ
In dieser Form gilt die Ungleichungskette jedoch auch für x < t, denn alle drei
Terme bleiben unverändert, wenn die Rollen von x und t vertauscht werden: links
ändern Zähler und Nenner beide ihre Vorzeichen, in der Mitte ebenso, und im
rechten Term ändert der Vorfaktor sein Vorzeichen, aber auch das Integral.
Sei nun x⋆ eine beliebige Folge in I \ {t}, die gegen t konvergiert. Dann gilt:
γ(x⋆ )−γ(t) x −t ⋆
≤
konvergiert gegen |γ̇(t)|
Varγ (a,x⋆ )−Varγ (a,t)
x⋆ −t
≤
1 R x⋆
x⋆ −t t
|γ̇(ξ)| d ξ konvergiert gegen |γ̇(t)|
γ (a,t)
gegen |γ̇(t)| durch Einschnürung (10.3). Also
Darum konvergiert Varγ (a,xx⋆⋆)−Var
−t
ist t 7→ Varγ (a, t) differenzierbarlim mit Ableitung |γ̇(t)|. Daraus folgt
Varγ (a, b) =
Z
b
a
|γ̇(ξ)| d ξ
mit dem Hauptsatz.
∀[a, b] ⊂ I
q.e.d.
156
15.2
Ein paar Flächeninhalte
Beispiel 15.22 (Einheitskreises). Mit unserem frisch gewonnenen
Verständnis (15.10) der trigonometrischen Funktionen (Sinus und Cosinus) können
wir die Fläche des Einheitskreises berechnen. Der obere Halbkreis ist Graph der
stetigen Funktion
f : [−1, 1] −→ R
√
x 7→ 1 − x2
Also hat der Halbkreis die Fläche
Z
1
−1
√
1 − x2 d x =
=
Z
0
π
Z π
0
q
1 − cos(ξ)2 (− sin(ξ)) d ξ
sin(ξ) sin(ξ) d ξ
=
[− sin(ξ) cos(ξ)]π0
=
Z
π
−
Z
π
0
cos(ξ) cos(ξ) d ξ =
0
− cos(ξ) cos(ξ) d ξ
Z
π
0
1 − sin(ξ) sin(ξ) d ξ
Damit ist die Fläche des Einheitskreises
2
Z
0
π
sin(ξ) sin(ξ) d ξ =
Z
0
π
1dξ = π
Beispiel 15.23 (Unbeschränkt aber von endlicher Fläche). Die Fläche unter
dem Graphen von x 7→ exp(−x2 ) ist endlich: Die Menge
(Z
b
a
exp −ξ
2
)
dξ a < b
ist beschränkt. ...
Aufgabe 15.24. Gib ein Beispiel für eine Funktion, die auf einem offenen Intervall
I um 0 ∈ I definiert und in I überall differenzierbar ist, deren Ableitung aber auf
keinem nicht-entarteten Teilintervall J ⊆ I mit 0 ∈ J integrierbar ist.
157
16
Die komplexen Zahlen
Die Gleichgung x2 = −1 ist in R nicht lösbar. Was geschieht, wenn wir so tun, als
ob i eine Lösung wäre? Zunächst einmal können wir dann Ausdrücke der Form
x + i y mit reellen Koeffizienten x, y ∈ R bilden. Mit diesen Ausdrücken können wir
rechnen. Dabei halten wir uns an die Regel i2 = −1:
(x1 + i y1 ) ± (x2 + i y2 ) = (x1 ± x2 ) + i (y1 ± y2 )
(x1 + i y1 )(x2 + i y2 ) = x1 x2 + x1 i y2 + i y1 x2 + i y1 i y2
= x1 x2 + i x1 y2 + i y1 x2 + i2 y1 y2
= x1 x2 + i x1 y2 + i y1 x2 + −y1 y2
= (x1 x2 − y1 y2 ) + i (x1 y2 + x2 y1 )
1 x− iy
1
=
x + iy
x+ iy x− iy
x− iy
= 2
x − i2 y 2
x
y
= 2
−
i
x + y2
x2 + y 2
Wir sehen, daß Summen, Differenzen, Produkte und Kehrwerte von Ausdrücken der
Form x + i y stets wieder auf diese Form gebracht werden können. Diese Rechnungen
motivieren die folgende:
Definition 16.1. Die Menge der komplexen Zahlen C ist die Menge R × R von
Paaren reeller Zahlen (x, y) zusammen mit den Verknüfpfungen
(x1 , y1 ) + (x2 , y2) := (x1 + x2 , y1 + y2 )
(x1 , y1 ) · (x2 , y2) := (x1 x2 − y1 y2 , x1 y2 + x2 y1 )
Mit diesen beiden Verknüpfungen ist C ein Körper. Additives und multiplikatives
Inverses sind gegeben durch
−(x, y) = (−x, −y)
1
x
y
:= ( 2
,− 2
)
2
(x, y)
x +y
x + y2
Sei z = (x, y) eine komplexe Zahl, dann nennen wir x ihren Realteil und y ihren
Imaginärteil.
Aufgabe 16.2. Rechne nach, daß C ein Körper ist.
Bemerkung 16.3. Die Teilmenge
{(x, y) ∈ C y = 0}
158
ist gegenüber Addition, Subtraktion, Multipplikation und Division abgeschlossen.
Die sie ist Bild des Körperhomomorphismus:
R −→ C
x 7→ (x, 0)
Vermöge dieser Einbettung fassen wir R als Teil von C auf. (Formal: wir nutzen
einen vollständigen archimedisch geordneten Körper zur Konstruktion von C, sehen,
daß das Bild dieser Abbildung wieder ein vollständiger archimedisch angeordneter
Körper ist, und nennen den dann R.)
Wir haben also nun die Zahlbereiche
N⊆Z⊆Q⊆R⊆C
Aufgabe 16.4. Zeige:
1. Die Teilmenge
{(x, y) ∈ C y = 0}
ist gegenüber Addition, Subtraktion, Multipplikation und Division
abgeschlossen.
2. Die Abbildung
R −→ C
x 7→ (x, 0)
ist ein Körperhomomorphismus.
Notation 16.5. Wir setzen:
i := (0, 1)
2
2
2
Dann ist i = (0 − 1 , 2 · 0 · 1). Wir nennen i die imaginäre Einheit. Damit schreiben
wir:
(x, y) = x + i y
Nun können wir in C die Rechnungen von oben glatt nachvollziehen.
Insbesondere gilt:
Die Gleichung z 2 = −1 hat in C zwei Lösungen, nämlich i und − i.
16.1
Interpretation von C
Proposition 16.6. Die Menge
(
x −y
y x
!
)
x, y ∈ R ⊆ M2×2 (R)
ist abgeschlossen unter Matrixaddition und Matrixmultiplikation. Mit diesen beiden
Verknüpfungen ist sie ein zu C isomorpher Körper. Der Isomorphismus ist gegeben
durch
!
x −y
x + i y 7→
y x
159
Beweis. Die Formeln für Matrizenaddition und -multiplikation lauten:
!
!
!
a b
e f
a+e b+f
+
=
c d
g h
c+g d+h
!
!
!
a b
e f
ae + bg af + bh
·
=
c d
g h
ce + dg cf + dh
Wir spezialisieren auf Matrizen der gegebenen Form:
!
!
x1 −y1
x −y2
x + x2 −y1 − y2
+ 2
= 1
y1 x1
y2 x2
y1 + y2 x1 + x2
!
!
!
x1 −y1
x −y2
x x − y1 y2 −x1 y2 − y1 x2
· 2
= 1 2
y1 x1
y2 x2
y1 x2 + x1 y2 −y1 y2 + x1 x2
!
Wir erkennen, wie die Regeln der Matrizenrechnung die Vorschriften für Addition
und Multiplikation komplexer Zahlen abbilden.
q.e.d.
Bemerkung 16.7. Eine Matrix der Form
x −y
y x
!
beschreibt eine Drehstreckung: Multiplikation mit der Matrix schickt den
x
−y
Standardeinheitsvektor ( 10 ) auf ( xy ) und ( 01 ) auf ( −y
x ). Nun stehen ( y ) und ( x )
senkrecht aufeinander,√weil ihr Skalarprodukt verschwindet. Außerdem sind sie
gleich lang mit Länge x2 + y 2.
Eine Drehung um den Winkel ϑ wird beschrieben durch die Matrix:
cos(ϑ) − sin(ϑ)
sin(ϑ) cos(ϑ)
!
und eine Streckung um den Faktor r wird beschrieben durch die Matrix:
!
r 0
1 0
=r
0 r
0 1
!
Also gibt es zu x und y einen Winkel ϑ, so daß gilt:
!
q
cos(ϑ) − sin(ϑ)
x −y
= x2 + y 2
cos(ϑ)
y x
| {z } sin(ϑ)
!
=:r
Den Winkel ϑ können wir daraus ermitteln, denn es folgt durch Betrachtung des
Eintrags unten links:
y = sin(ϑ)
q
x2 + y 2
=⇒
y
ϑ = arcsin √ 2
x + y2
Für den Fall x = y = 0 ist der Winkel ϑ nicht eindeutig bestimmt.
160
!
Man kann auch die ganze linke Spalte der Matrix betrachten und sieht damit:
x = r cos(ϑ)
und
y = r sin(ϑ)
Damit ergibt sich eine Interpretation von r und ϑ als Polarkoordinaten: Wir fassen
C = R2 als Ebene auf und denken uns x + i y als den Punkt mit kartesischen
Koordinaten (x, y). Dann ist r der Abstand zum Ursprung und ϑ der Winkel zur
horizontalen Achse.
y
x + i y = r cos(ϑ) + i r sin(ϑ)
r
ϑ
x
Definition 16.8. Stellen wir eine komplexe
x + i y in Polarkoordinaten dar als
√ Zahl
2
2
x + i y = r cos(ϑ) + i r sin(ϑ) so heißt
r = x + y der Betrag der komplexen Zahl
x + i y, und der Winkel ϑ = arcsin √
y
x2 +y 2
ist ihr Argument. Man schreibt dafür
auch
r = |x + i y|
ϑ = arg(x + i y)
Bemerkung 16.9. Wir beobachten, daß der Betrag einer komplexen Zahl uns
schon bekannt ist: er ist durch dieselbe Formel gegeben wie die Länge des Vektors
( xy ). Insbesondere gilt die Dreicksungleichung in C:
|z1 − z3 | ≤ |z1 − z2 | + |z2 − z3 |
∀z1 , z2 , z3 ∈ C
Bemerkung 16.10. Hier ergibt sich eine interessante Querverbindung zu den
Additionstheoremen (11.47). Die Verkettung zweier Drehstreckung ist wider eine
Drehstreckung. Dabei multiplizieren sich die Streckfaktoren, während sich die
Drehwinkel addieren. Da Verkettung linearer Abbildungen der Matrixmultiplikation
entspricht, und unter dem Isomorphismus von (16.6) die Matrixmultiplikation
wiederum der Multiplikation komplexer Zahlen entspricht, erwarten wir:
Bei der Multiplikation komplexer Zahlen multiplizieren sich ihre Beträge
und addieren sich ihre Argumente.
161
Dies läßt sich durch eine Rechnung bestätigen. Zunächst betrachten wir den Fall
reiner Drehungen (d.h., die Beträge sind 1):
cos(ϑ1 + ϑ2 ) + i sin(ϑ1 + ϑ2 ) = (cos(ϑ1 ) cos(ϑ2 ) − sin(ϑ1 ) sin(ϑ2 ))+
+ i (sin(ϑ1 ) cos(ϑ2 ) + cos(ϑ1 ) sin(ϑ2 ))
= (cos(ϑ1 ) + i sin(ϑ1 )) · (cos(ϑ2 ) + i sin(ϑ2 ))
Daraus ergibt sich für den allgemeinen Fall:
r1 r2 cos(ϑ1 + ϑ2 ) + r1 r2 sin(ϑ1 + ϑ2 ) = r1 r2 (cos(ϑ1 + ϑ2 ) + sin(ϑ1 + ϑ2 ))
= r1 r2 (cos(ϑ1 ) + i sin(ϑ1 )) · (cos(ϑ2 ) + i sin(ϑ2 ))
= r1 (cos(ϑ1 ) + i sin(ϑ1 )) · r2 (cos(ϑ2 ) + i sin(ϑ2 ))
= (r1 cos(ϑ1 ) + i r1 sin(ϑ1 )) · (r2 cos(ϑ2 ) + i r2 sin(ϑ2 ))
16.2
Folgen, Reihen und Doppelreihen komplexer Zahlen
Definition 16.11. Eine Abbildung N → C heißt komplexe Zahlenfolge oder
Folge komplexer Zahlen. Wir bezeichen komplexe Zahlen üblicherweise mit z und
entsprechend bezeichnet z⋆ eine Folge komplexer Zahlen.
Wir sagen, daß eine Folge z⋆ komplexer Zahlen gegen die komplexe Zahl z
konvergiert, wenn gilt:
∀ε > 0 ∃h ∈ N ∀i ≥ h : |z − zi | < ε
Dies ist formal dergleiche Begriff von Konvergenz wie für reelle Zahlenfolgen.
Lediglich muß man die ε-Umgebung von z entsprechend definieren als:
Bε (z) := {z ′ ∈ C |z − z ′ | < ε}
Also z⋆ konvergiert gegen z, wenn in jeder ε-Umgebung von z fast alle Folgenglieder
liegen.
Entsprechend ist z ein Häufungspunkt der Folge z⋆ , wenn in jeder ε-Umgebung
unendlich viele Folgenglieder liegen.
Jede komplexe Zahl hat Realteil und Imaginärteil. Seien x⋆ und y⋆ der Real- bzw.
Imaginärteil von z⋆ . Dann können wir eine Folge komplexer Zahlen als Paar von
Folgen reeller Zahlen auffassen. Wir nutzen das für eine alternative Definition von
Konvergenz:
Definition 16.12. Eine Folge z⋆ = x⋆ + i y⋆ konvergiert komponentenweise gegen
z = x + i y, wenn die Folge x⋆ gegen x konvergiert und wenn die Folge y⋆ gegen y
konvergiert. Eine Folge heißt komponentenweise konvergent, wenn sie
komponentenweise gegen eine komplexe Zahl konvergiert.
Wir können auch den Begriff der Cauchy-Konvergenz übertragen:
162
Definition 16.13. Eine Folge z⋆ komplexer Zahlen ist Cauchy-konvergent, wenn
gilt:
∀ε > 0 ∃h ∈ N ∀i, j ≥ h : |zi − zj | < ε
Die formale Darstellung sieht genauso aus, wie bei reellen Zahlenfolgen. Der
Unterschied liegt jedoch in der Bedeutung der Betragszeichen.
Es ist ist nicht unmittelbar klar, daß Konvergenz und Cauchy-Konvergenz für
Folgen komplexer Zahlen äquivalent sind. Dies ist wahr, und die fundamentale
Beobachtung hierzu lautet:
Beobachtung 16.14. Für eine komplexe Zahl z = x + i y gilt:
|x|
|y|
|z|
|x| + |y|
≤ |z|
≤ |z|
≤ |x| + |y|
≤ 2 |z|
Satz 16.15. Für Folge komplexer Zahlen z⋆ = x⋆ + i y⋆ sind äquivalent:
1. Die Folge z⋆ konvergiert.
2. Die Folge z⋆ konvergiert komponentenweise.
3. Die Folge z⋆ ist Cauchy-konvergent.
Beweis.
(1) =⇒ (3) Es konvergiere z⋆ gegen z. Sei ε > 0 beliebig. Dann gibt es einen
Schwellindex h mit
ε
∀i ≥ h : |zi − z| <
2
Dann gilt aber für i, j ≥ h wegen der Dreiecksungleichung:
|zi − zj | ≤ |zi − z| + |z − zj | < ε
(3) =⇒ (2) Die Folge z⋆ sei Cauchy-konvergent. Wir zeigen, daß die Folgen x⋆ und
y⋆ der Real- bzw. Imaginärteile ebenfalls Cauchy-konvergent sind. Daraus folgt
dann, daß sie konvergieren, und damit, daß z⋆ komponentenweise konvergiert.
Sei also ε > 0. Dann gibt es einen Schwellindex h ∈ N, so daß gilt:
∀i, j ≥ h : |zi − zj | < ε
Damit ist auch
|xi − xj | ≤ |zi − zj | < ε
Also ist x⋆ Cauchy-konvergent. Das Argument für y⋆ ist gleich.
163
(2) =⇒ (1) Es konvergiere x⋆ gegen x und y⋆ gegen y. Sei ε > 0. Dann gibt es
einen Schwellindex hx ∈ N, so daß gilt:
∀i ≥ hx : |x − xi | <
ε
2
Ebenso gibt es einen Schwellindex hy ∈ N, so daß gilt:
∀i ≥ hy : |y − yi| <
ε
2
Wir setzen:
z := x + i y
Für h ≥ hx , hy und i ≥ h gilt dann:
|z − zi | ≤ |x − xi | + |y − yi | < ε
Also konvergiert z⋆ gegen z.
q.e.d.
Korollar 16.16. Da wir Konvergenz komponentenweise auffassen können,
impliziert (10.18), daß auch für Folgen komplexer Zahlen gilt: Konvergiert sowohl a⋆
als auch b⋆ , so konvergieren auch die Summe a⋆ + b⋆ , die Differenz a⋆ − b⋆ und das
Produkt a⋆ b⋆ . Die Grenzwerte sind die Summe, die Differenz, bzw. das Produkt der
Grenzwerte:
lim a⋆ + b⋆ = lim a⋆ + lim b⋆
⋆→∞
⋆→∞
⋆→∞
lim a⋆ − b⋆ = lim a⋆ − lim b⋆
⋆→∞
lim a⋆ b⋆ =
⋆→∞
⋆→∞
lim a⋆
⋆→∞
⋆→∞
lim b⋆
⋆→∞
Ist b⋆ gliedweise ungleich 0 und ist überdies 0 6= lim⋆→∞ b⋆ , so konvergiert der
Quotient ab⋆⋆ und es gilt:
a⋆
lim⋆→∞ a⋆
lim
=
⋆→∞ b⋆
lim⋆→∞ b⋆
Beweis. Wir behandeln nur den Fall des Produktes zweier komplexer Folgen. Die
anderen Überlegungen sind ähnlich und in der Regel einfacher.
Seien also z⋆ = x⋆ + i y⋆ und z⋆′ = x′⋆ + i y⋆′ zwei konvergente Folgen komplexer
Zahlen, zerlegt in Realteilfolge und Imaginärteilfolge. Die Grenzwerte seien
z = x + i y bzw. z ′ = x′ + i y ′. Dann ist die Folge x⋆ x′⋆ − y⋆ y⋆′ der Realteile von z⋆ z⋆′
eine Differenz von Produkten konvergenter Folgen, mithin eine konvergente Folge.
Ihr Grenzwert ist xx′ − yy ′ also der Realteil des Produktes zz ′ . Analog konvergiert
die Folge x⋆ y⋆′ + y⋆ x′⋆ der Imaginärteile von z⋆ z⋆′ gegen den Imaginärteil xy ′ + yx′ des
Produktes zz ′ . Also konvergiert z⋆ z⋆′ (komponentenweise) gegen zz ′ .
Korollar 16.17. Wenn eine Folgeqz⋆ = x⋆ + i y⋆ komplexer Zahlen konvergiert, so
konvergiert die reelle Folge |z⋆ | = x2⋆ + y⋆2 ihrer Beträge.
164
Beweis. Zunächst konvergiert x2⋆ + y⋆2 wegen (10.18). Dann konvergiert
√
weil
folgenstetig ist.
q
x2⋆ + y⋆2 ,
q.e.d.
Aufgabe 16.18. Seien z⋆ und z⋆′ zwei Folgen komplexer Zahlen. Wir nennen z⋆ und
z⋆′ kokonvergent, wenn beide Folgen konvergieren und zwar gegen denselben
Grenzwert. Wir nennen sie Cauchy-kokonvergent, wenn gilt:
∀ε > 0 ∃h ∈ N ∀i, j ≥ h : zi − zj′ < ε
Zeige: z⋆ und z⋆′ sind genau dann kokonvergent, wenn sie Cauchy-kokonvergent sind.
Definition 16.19. Sei a⋆ eine Folge komplexer Zahlen. Dann bezeichnet Σa⋆ die
Folge der Partialsummen, welche wir auch als zugehörige Reihe bezeichnen.
P
P
Konvergiert die Folge Σa⋆ , so notieren wir ihren Grenzwert mit ⋆ a⋆ oder ∞
i=0 a⋆ .
Eine Reihe Σa⋆ komplexer Zahlen heißt absolut konvergent, wenn die Reihe Σ |a⋆ |
ihrer Beträge konvergiert.
Eine Reihe Σa⋆ komplexer Zahlen heißt unbedingt konvergent, wenn je zwei
Umordnungen der Reihe kokonvergent sind.
Beobachtung 16.20. Sei z⋆ = x⋆ + i y⋆ die Aufspaltung einer komplexen Folge in
Real- und Imaginärteil. Dann spaltet die zugehörige Partialsummenfolge
entsprechend
Σz⋆ = Σx⋆ + i Σy⋆
q.e.d.
Beobachtung 16.21. Die Reihe Σz⋆ = Σx⋆ + i Σy⋆ sei absolut konvergent. Wegen
|x⋆ | ≤ |z⋆ | ist dann auch die Reihe Σx⋆ der Realteile absolut konvergent. Genauso
sehen wir, daß Σy⋆ absolut konvergiert.
Umgekehrt seien Σx⋆ und Σy⋆ absolut konvergent. Also konvergiert auch die Summe
Σ(|x⋆ | + |y⋆ |). Wegen |z⋆ | ≤ |x⋆ | + |y⋆ | konvergiert auch Σ |z⋆ |. Das heißt Σz⋆ ist
absolut konvergent.
Wir halten fest: Eine Reihe komplexer Zahlen konvergiert genau dann absolut, wenn
Real- und Imaginärteilreihe absolut konvergieren.
q.e.d.
Beobachtung 16.22. Jede Umordnung der komplexen Reihe induziert eine
entsprechende Umordnung der Realteilreihe und der Imaginärteilreihe. Darum ist
die komplexe Reihe Σz⋆ = Σx⋆ + i Σy⋆ genau dann unbedingt konvergent, wenn
sowohl die Reihe Σx⋆ als auch die Reihe Σy⋆ unbedingt konvergiert.
Korollar 16.23 (Umordnungssatz). Eine Reihe Σz⋆ komplexer Zahlen
konvergiert genau dann absolut, wenn sie unbeding konvergiert.
Beweis. Wir zerlegen Σz⋆ = Σx⋆ + i Σy⋆ in Real- und Imaginärteil. Mit dem
Umordnungssatz für reelle Reihen (11.15) haben folgende Äquivalenzen:
Σz⋆ konvergiert absolut
⇐⇒ Σx⋆ und Σy⋆ konvergieren absolut
⇐⇒ Σx⋆ und Σy⋆ konvergieren unbedingt
⇐⇒ Σz⋆ konvergiert unbedingt
165
q.e.d.
Bemerkung 16.24. Im Komplexen gilt nicht mehr, daß man eine bedingt
konvergente Reihe zu jeder beliebigen Summe umordnen kann: eine Reihe reeller
Zahlen wird bei jeder konvergenten Umordnung eine reelle Summe haben.
Definition 16.25. Eine Abbildung N × N → C heißt Doppelfolge komplexer
Zahlen. Die Doppelfolge z⋆,• heißt summierbar, wenn

 X

(i,j)∈M
beschränkt ist.
|zi,j | M ⊂ N × N endlich



Beobachtung 16.26. Aus (16.14) folgt: Eine Doppelfolge z⋆• = x⋆• + i y⋆•
komplexer Zahlen ist genau dann summierbar, wenn sowohl die Doppelfolge x⋆• ihrer
Realteile als auch die Doppelfolge y⋆• ihrer Imaginärteile summierbar ist.
q.e.d.
Aufgabe 16.27. Zeige, daß der Doppelreihensatz (11.32) auch im Komplexen gilt:
Sei z⋆• eine summierbare Doppelfolge. Dann gilt:
1. Für jede Bijektion f : N → N × N konvergiert die Reihe Σzf (⋆) absolut gegen
einen von f unabhängigen Wert λ.
2. Die Zeilen zi• und Spalten z⋆j haben absolut konvergente Reihen Σzi• und
Σz⋆j . Ferner konvergieren die Reihe der Spaltensummen und die Reihe der
Zeilensummen beide absolut, und zwar gegen λ.
∞ X
∞
X
zij = λ =
∞ X
∞
X
zij
j=0 i=0
i=0 j=0
Wir nennen die Bijektion f : N → N × N eine Anordnung der Doppelfolge z⋆• .
16.3
Komplexe Potenzreihen
Auch Potenzreihen können wir über den komplexen Zahlen betrachten. Dieses
Unterfangen hat zwei Aspekte: Zum einen erlauben wir komplexe Zahlen als
Koeffizienten der Potenzreihe; zum anderen kann die Unbestimmte für komplexe
Werte stehen, und die Potenzreihe beschreibt dann eine Funktion, deren
Definitionsbereich eine Teilmenge von C ist.
Satz und Definition 16.28 (Potenzreihe und Konvergenzradius). Sei a⋆
eine Folge komplexer Zahlen. Dann ist die Reihe Σa⋆ z ⋆ eine komplexe Potenzreihe.
Hier ist z eine Unbestimmte, die komplexe Werte annehmen kann. Dazu gibt es
genau ein nicht-negatives R ∈ R ∪ {∞} mit folgenden Eigenschaften:
1. Ist |z| < R, dann konvergiert Σa⋆ z ⋆ absolut.
2. Ist |z| > R, dann divergiert Σa⋆ z ⋆ .
166
Wir nennen R den Konvergenzradius der Potenzreihe Σa⋆ z ⋆ . Er ist gegeben als das
Supremum der Menge
o
n
M := s ∈ R≥0 die reelle Folge |a⋆ | s⋆ ist beschränkt
sofern sie beschränkt ist. Ist M unbeschränkt, so gilt R = ∞.
Bemerkung: der formal erlaubte Wert R = ∞ bedeutet einfach, daß x < ∞ stets und
x > ∞ niemals erfüllt ist.
Beweis. Wir wenden (11.22) auf die reelle Potenzreihe Σ |a| x⋆ an und sehen, daß
das oben definierte R gerade ihr Konvergenzradius ist. Also gilt wegen der
Multiplikativität des Betrags komplexer Zahlen:
=⇒
=⇒
=⇒
|z| < R
Σ |a⋆ | |z|⋆ konvergiert (absolut)
Σ |a⋆ z ⋆ | konvergiert
Σa⋆ z ⋆ konvergiert absolut
Umgekehrt:
=⇒
=⇒
=⇒
(16.17)
|z| > R
Σ |a⋆ | |z|⋆ divergiert
Σ |a⋆ z ⋆ | divergiert
Σa⋆ z ⋆ divergiert
q.e.d.
Bemerkung 16.29. Im Komplexen sind die Konvergenzgebiete von Potenzreihen
also tatsächlich Kreise. Dies erklärt, warum man R den Konvergenzradius nennt.
Bemerkung 16.30. Vergleich der Definitionen von Konvergenzradien in (11.22)
und (16.28) zeigt, daß eine Potenzreihe mit reellen Koeffizienten aufgefaßt als
komplexe Potenzreihe ihren Potenzradius beibehält: Der in (11.22) bestimmte
Konvergenzradius der reellen Potenzreihe Σa⋆ x⋆ ist:
sup {s ∈ R die Folge a⋆ s⋆ ist beschränkt}
Doch eine Folge ist beschränkt genau dann, wenn die Folge ihrer Beträge beschränkt
ist. Also stimmt der in in (16.28) angegebene Konvergenzradius damit überein.
Beispiel 16.31. Sei t ∈ R. Die Potenzreihe exp hat unendlichen Potenzradius. Wir
werten sie an der rein imaginären Stelle i t aus:
∞ k k
X
(i t)k
i t
exp(i t) =
=
k=0 k!
k=0 k!
∞
X
t2
t3 t4
t5 t6
t7
−i + +i − −i +···
2!
3! 4! ! 5! 6!
7!
!
4
6
3
1
2
t
t
t
t5 t7
t
t
− + − +···
= 1− + − +··· +i
2! 4! 6!
1! 3! 5! 7!
= 1+ it −
= cos(t) + i sin(t)
167
Bemerkung 16.32. Der binomische Lehrsatz (11.39) gilt auch im Komplexen: Es
handelt sich um eine rein formale Rechnung, die in jedem kommutativen Ring
durchgeführt werden kann. Entsprechend folgt auch die Funktionalgleichung der
Exponentialfunktion für komplexe Argumente. Damit stellen sich die
trigonometrischen Additionstheoreme nunmehr wiefolgt dar:
exp(i (s + t)) = exp(i s) exp(i t)
16.4
Der Fundamentalsatz der Algebra
Definition 16.33. Sei K ein Ring. mit K[x] bezeichnen wir die Menge aller
Polynome
f (x) = an xn + an−1 xn−1 + an−2 xn−2 + a2 x2 + a1 x + a0
in der Unbestimmten x mit Koeffizienten ai ∈ K. Der Index des höchsten
nicht-veschwindenden Koeffizienten heißt Grad des Polynom. Wir notieren den Grad
des Polynom f (x) als grad(f ). Formal eklären wir, daß das Nullpolynom den Grad
−∞ hat. Polynome fassen wir als Potenzreihen auf, die nur endlich viele
nicht-verschwindende Koeffizienten haben. Wir können Polynome addieren,
subtrahieren und via Cauchy-Produkt auch multiplizieren. Auf diese Weise wird
K[x] wieder zu einem Ring.
Sind f (x) und g(x) zwei Polynome aus K[x], so sagen wir, g(x) teile f (x), wenn
f (x) = g(x) h(x) für ein h(x) ∈ K[x] gilt.
Ein Polynom vom Grad ≤ 0 heißt konstant. In einem Polynom
f (x) = an xn + an−1 xn−1 + an−2 xn−2 + a2 x2 + a1 x + a0 vom Grad n heißt an der
führende Koeffizient oder Leitkoeffizient. Ein Polynom f (x) mit Leitkoeffizient 1
heißt normiert.
Beobachtung 16.34. Bei der Multiplikation von Polynomen addieren sich ihre
Grade und multiplizieren sich ihre Leitkoeffizienten.
q.e.d.
Fakt 16.35. Sei K ein Körper und seien f (x) , g(x) ∈ K[x] zwei Polynome mit
g 6= 0. Dann gibt es eindeutig bestimmte Polynome q(x) , r(x) mit:
f (x) = g(x) q(x) + r(x)
grad(r) < grad(g)
Wir nennen q(x) den Quotienen und r(x) den Rest.
Beispiel 16.36. Man erhält q(x) und r(x) durch Division mit Rest. Es sehr ähnlich
zu dem Divisionsverfahren für mehrstellige Zahlen. Polynomdivision ist sogar etwas
einfacher, weil kein Schätzen nötig ist. Für K = Q und
f (x) = 6x4 + 2x3 − 2x2 − x + 2
168
und
g(x) = 3x2 − 1
erhalten wir:
4
3
2
2
6x +2x −2x −1x +2 = 3x − 1
(3x − 1) · 2x = 6x4
−2x2
3
2x +0x2 −1x +2
(3x2 − 1) · 32 x =
2x3
− 23 x
Rest:
− 13 x +2
2
2
2
1
2x + x + − x + 2
3
3
2
Korollar 16.37. Sei f (x) ∈ K[x] ein Polynom über dem Körper K und ξ ∈ K ein
Element. Dann ist ξ genau dann eine Nullstelle von f (x), wenn der Linearfaktor
x − ξ ∈ K[x] das Polynom f (x) teilt.
Beweis. Ist f (x) = (x − ξ)h(x), so verschwindet f (x) an der Stelle x = ξ.
Für die umgekehrte Richtung verwenden wir Polynomdivision. Der Linearfaktor
x − ξ ist ein Polynom vom Grad 1. Nach Division mit Rest schreiben wir also
f (x) = (x − ξ)q(x) + r(x)
mit grad(r) < 1. Es folgt, daß r ein konstantes Polynom ist. Setzten wir nun auf
beiden Seiten x = ξ ein, folgt r = 0.
q.e.d.
Definition 16.38. Ein Körper K heißt algebraisch abgeschlossen, wenn jedes
nicht-konstante Polynom (Grad mindestens 1) f (x) ∈ K[x] eine Nullstelle in K hat.
Bemerkung 16.39. Ist der Körper K algebraisch abgeschlossen, so kann jedes
normierte Polynom
f (x) = xn + an−1 xn−1 + an−2 xn−2 + a2 x2 + a1 x + a0
mit Koeffizienten aus K als Produkt von Linearfaktoren x − ξi mit ξi ∈ K
dargestellt werden:
xn + an−1 xn−1 + an−2 xn−2 + a2 x2 + a1 x + a0 = (x − ξ1 )(x − ξ2 ) · · · (x − ξn )
Dies ergibt sich mit Induktion aus (16.37): Abspalten eines Linearfaktors führt auf
eine (immer noch normiertes!) Polynom vom Grad n − 1.
Fundamentalsatz der Algebra 16.40. C ist algebraisch abgeschlossen.
Für diesen Satz gibt es zahlreiche Beweise (Gauß lieferte mehrere, den ersten in
seiner Dissertation). Kein bekannter Beweis ist in dem Sinne fundamental, daß er
im ersten Semester behandelt werden könnte. Das liegt daran, daß im
Fundamentalsatz Abbildungen mit Definitionsbereich C betrachtet werden. In dieser
Vorlesung beschränken wir uns mit guten Gründen auf den Definitionsbereich R. In
höheren Dimensionen treten neue Phänomene auf, die uns nächstes Semester
beschäftigen werden. Nun kann man diese analytischen Schwierigkeiten
kompensieren und den Gebrauch der Analysis auf den Zwischenwertsatz
einschränken, doch dafür benötigt man dann schwerere Geschütze aus der Algebra,
die im ersten Semester ebenfalls nicht zur Verfügung stehen.
169
A
A.1
Beispiele und Aufgaben zur Integration
Die nützlichen Funktionen
Neben exp, ln, sin und cos trifft man die folgenden Funktionen relativ häufig an:
tan(x)
sinh(x)
cosh(x)
tanh(x)
:=
:=
:=
:=
sin(x)
cos(x)
exp(x)−exp(−x)
2
exp(x)+exp(−x)
2
exp(x)−exp(−x)
sinh(x)
= exp(x)+exp(−x)
cosh(x)
Tangens
Sinus hyperbolicus
Cosinus hyperbolicus
Tangens hyperbolicus
Aufgabe A.1. Bestätige die Identität
cosh(x)2 − sinh(x)2 = 1
Hinweis: Benutzte die Funktionalgleichung der Exponentialfunktion.
Einschränkungen der Funktionen sin, cos, tan, sinh, cosh, tanh sind invertierbar:
sin
cos
tan
sinh
cosh
tanh
invertierbar
invertierbar
invertierbar
invertierbar
invertierbar
invertierbar
auf
auf
auf
auf
auf
auf
[− π2 , π2 ]
[0, π]
(− π2 , π2 )
(−∞, ∞)
[0, ∞)
(−∞, ∞)
Bezeichnungen, Definitionsbereiche und Namen der Umkehrfunktionen lauten:
arcsin(x)
arccos(x)
arctan(x)
arsinh(x)
arcosh(x)
artanh(x)
A.2
:= sin−1 (x)
:= cos−1 (x)
:= tan−1 (x)
:= sinh−1 (x)
:= cosh−1 (x)
:= tanh−1 (x)
für:
für:
für:
für:
für:
für:
x ∈ [−1, 1]
x ∈ [−1, 1]
x ∈ (−∞, ∞)
x ∈ (−∞, ∞)
x ∈ [1, ∞)
x ∈ (−1, 1)
Grundintegrale
170
Arcussinus
Arcuscosinus
Arcustangens
Areasinus hyperbolicus
Areacosinus hyperbolicus
Areatangens hyperbolicus
Aufgabe A.2. Bestätige die folgende Tabelle durch Ableiten (zweimal pro Zeile):
sin(x)
R
df
dx
k−1
f
xk
x−1
ln(x)
exp(x)
kx
−x−2
exp(x)
cos(x) = 1 − sin(x)2
1
2
cos(x)
tan(x)
− sin(x) = − 1 − cos(x)2
1
= 1 + tan(x)2
cos(x)2
arcsin(y)
(1 − y 2)
sinh(x)
cosh(x)
tanh(x)
− 21
sin(x)
− ln(cos(x))
1
y arccos(y) − (1 − y 2) 2
ln(1+y 2 )
y arctan(y) −
2
2
cosh(x)
1
sinh(x) = cosh(x)2 − 1
1
= 1 − tanh(x)2
cosh(x)2
− 21
arsinh(y)
(y 2 + 1)
arcosh(y)
(y 2 − 1)
1
1
cosh(x) = sinh(x)2 + 1
− 21
2
sinh(x)
ln(cosh(x))
1
y arsinh(y) − (y 2 + 1) 2
1
y arcosh(y) − (y 2 − 1) 2
ln(y 2 −1)
y artanh(y) +
2
1
1−y 2
artanh(y)
2
y arcsin(y) + (1 − y 2) 2
1
1+y 2
arctan(y)
− cos(x)
1
− 21
−(1 − y 2)
arccos(y)
Bemerkung
x > 0, k 6= −1
x > 0, x−1 = x1
x>0
ln(x)
x ln(x) − x
exp(x)
1
x
f dx
1
xk+1
k+1
Hier drücken wir bei den trigonometrischen und hyperbolischen Funktionen die
Ableitung durch die Funktion selber aus. Daraus läßt sich die Ableitung der
Umkehrfunktion ablesen. Beachte dazu das Vorgehen in (14.73).
Begründe die dazu nötigen Identitäten.
A.3
Partielle Integration
Seien f und g stetig differenzierbar. Dann gilt:
Z
b
a
′
f (ξ) g (ξ) d ξ =
[f (ξ) g(ξ)]ba
−
Z
b
a
g(ξ) f ′ (ξ) d ξ
Bemerkung A.3. Die Notationen g ′ (ξ) = dd gξ und f ′ (ξ) = dd fξ motivieren die
Umstellung zu: d g = g ′(ξ) d ξ und d f = f ′ (ξ) d ξ. Damit läßt sich partielle
Integration kurz notieren durch:
Z
f d g = fg −
Z
gdf
Dies läßt sich rechtfertigen durch die Theorie der Differentialformen, die Ausdrücken
wie d f eine klare Bedeutung zuweist.
171
Beispiel A.4. Mit partieller Integration kann man polynomielle Faktoren
wegschaffen. Die Exponentialfunktion ist als Partner besonders geeignet:
Z
b
a
Z
ξ exp(ξ) d ξ = [ξ exp(ξ)]ba −
b
exp(ξ) d ξ
a
= [ξ exp(ξ)]ba − [exp(ξ)]ba
= [ξ exp(ξ) − exp(ξ)]ba
Beispiel A.5. Auch bei trigonometrischen Funktionen hat man damit Erfolg. Bei
Polynomen höheren Grades muß man den Trick entsprechend öfter anwenden:
Z
b
a
h
ib
ξ 2 sin(ξ) d ξ = −ξ 2 cos(ξ)
h
a
ib
= −ξ 2 cos(ξ)
h
a
ib
2
= −ξ cos(ξ)
a
ib
h
= −ξ 2 cos(ξ)
h
a
−
+
Z
b
−2ξ cos(ξ) d ξ
a
Z b
2ξ cos(ξ) d ξ
a
+ [2ξ
sin(ξ)]ba
−
Z
b
a
2 sin(ξ) d ξ
+ [2ξ sin(ξ)]ba − [−2 cos(ξ)]ba
ib
= −ξ 2 cos(ξ) + 2ξ sin(ξ) + 2 cos(ξ)
=
h
ib
2 − ξ 2 cos(ξ) + 2ξ sin(ξ)
a
a
Beispiel A.6. Partielle Integration erfordert ein Produkt? Nun ja, ein Faktor kann
auch 1 sein:
Z
b
a
ln(ξ) d ξ =
Z
b
a
= [ξ
ξ 0 ln(ξ) d ξ
ln(ξ)]ba
−
= [ξ ln(ξ)]ba −
Z
b
a
b
Z
1
ξ dξ
ξ
1dξ
a
= [ξ ln(ξ) − ξ]ba
Beispiel A.7. Einen unsichtbaren Faktor 1 anzunehmen und partiell danach zu
interieren bietet sich vor allem dann an, wenn wir den sichtbaren Term ableiten
können. Die Umkehrfunktion arcsin können wir durch Anwendung der Umkehrregel
ableiten:
...
Das Integral ergibt sich nun wiefolgt:
Z
b
a
arcsin(ξ) d ξ =
Z
b
a
= [ξ
ξ 0 arcsin(ξ) d ξ
arcsin(ξ)]ba
172
−
Z
b
a
1
dξ
ξ√
1 − ξ2
Beispiel A.8. Manchmal führen mehrere Wege nach Rom:
Z
b
ln(ξ)2 d ξ =
a
Z
b
a
ξ 0 ln(ξ)2 d ξ
h
= ξ ln(ξ)
h
i
2 b
a
= ξ ln(ξ)2
h
= ξ ln(ξ)
h
ib
a
ib
2
a
−
Z
1
dξ
ξ
b
2ξ ln(ξ)
a
Z
−2
b
ln(ξ) d ξ
a
− 2 [ξ ln(ξ) − ξ]ba
= ξ ln(ξ)2 − 2(ξ ln(ξ) − ξ)
ib
a
Alternativ:
Z
b
2
ln(ξ) d ξ =
a
Z
b
a
ln(ξ) ln(ξ) d ξ
= [ln(ξ) (ξ ln(ξ) −
ξ)]ba
−
= [ln(ξ) (ξ ln(ξ) − ξ)]ba −
Z
b
a
b
Z
a
1
(ξ ln(ξ) − ξ) d ξ
ξ
ln(ξ) − 1 d ξ
= [ln(ξ) (ξ ln(ξ) − ξ)]ba − [ξ ln(ξ) − ξ − ξ]ba
= [ln(ξ) (ξ ln(ξ) − ξ) − (ξ ln(ξ) − 2ξ)]ba
Beispiel A.9. Interessant ist, wenn man sich im Kreis dreht:
Z
b
a
ξ ln(ξ) d ξ = [ξ(ξ ln(ξ) − ξ)]ba −
= [ξ(ξ ln(ξ) −
ξ)]ba
−
Z
b
a
Z b
a
1
= ξ(ξ ln(ξ) − ξ) − ξ 2
2
ξ ln(ξ) − ξ d ξ
ξdξ −
b
a
−
Z
b
a
Z
b
ξ ln(ξ) d ξ
a
ξ ln(ξ) d ξ
Hier haben wir Glück, denn wir können jetzt schließen:
2
und damit:
Z
Z
b
a
b
a
b
b
1
ξ ln(ξ) d ξ = ξ(ξ ln(ξ) − ξ) − ξ 2
2
1
1
ξ ln(ξ) d ξ =
ξ(ξ ln(ξ) − ξ) − ξ 2
2
2
a
a
Beispiel A.10. Bei der Integration trigonometrischer Funktionen mit partieller
Integration tritt der Wechsel von sin und cos auf. Hier kann ein drohender ewiger
Kreislauf bisweilen durch Ausnutzen der Identität (11.48)
sin(x)2 + cos(x)2 = 1
173
abgewendet werden:
Z
b
Z
2
sin(ξ) d ξ =
a
b
sin(ξ) sin(ξ) d ξ
a
[− cos(ξ) sin(ξ)]ba
=
−
= [− cos(ξ) sin(ξ)]ba +
= [− cos(ξ) sin(ξ)]ba +
Z
b
a
Z b
a
Z b
a
− cos(ξ) cos(ξ) d ξ
cos(ξ)2 d ξ
Schleife droht!
1 − sin(ξ)2 d ξ
Wir schließen:
2
Also:
Z
b
2
sin(ξ) d ξ =
a
[− cos(ξ) sin(ξ)]ba
+
Z
b
a
1dξ
= [− cos(ξ) sin(ξ) + ξ]ba
Z
b
sin(ξ)2 d ξ =
a
1
[ξ − sin(ξ) cos(ξ)]ba
2
Beispiel A.11. Umstellen ist auch hier ein Weg, zyklische Wiederholungen
aufzubrechen:
Z
b
a
sin(ξ) cos(ξ) d ξ =
Also:
Z
b
a
[sin(ξ) sin(ξ)]ba
−
Z
b
a
"
cos(ξ) sin(ξ) d ξ
sin(ξ)2
sin(ξ) cos(ξ) d ξ =
2
#b
a
Beispiel A.12. Höhere Potenzen erfordern die Kombination mehrerer Motive:
Z
b
a
3
sin(ξ) d ξ =
Z
b
a
sin(ξ) sin(ξ)2 d ξ
h
= − cos(ξ) sin(ξ)
h
i
2 b
a
= − cos(ξ) sin(ξ)2
h
= − cos(ξ) sin(ξ)2
h
= − cos(ξ) sin(ξ)
3
Z
b
a
Z
h
2
a
ib
a
ib
a
sin(ξ)3 d ξ = − cos(ξ) sin(ξ)2
h
ib
ib
a
−
Z
b
a
+2
+2
+2
− cos(ξ) 2 sin(ξ) cos(ξ) d ξ
Z
b
a
Z b
a
b
Z
a
sin(ξ) cos(ξ)2 d ξ
sin(ξ) d ξ − 2
+ 2 [− cos(ξ) d ξ]ba
ib
= − cos(ξ) sin(ξ)2 − 2 cos(ξ)
b
a
h
2
= − cos(ξ) 2 + sin(ξ)
ib
a
ib
−1 h
sin(ξ) d ξ =
cos(ξ) 2 + sin(ξ)2
a
3
3
174
sin(ξ) 1 − sin(ξ)2 d ξ
a
Z
b
a
sin(ξ)3 d ξ
Beispiel A.13. Manchmal dreht man sich wirklich im Kreis:
Z
b
a
sinh(ξ) exp(ξ) d ξ =
| {z } | {z }
g
[sinh(ξ) exp(ξ)]ba
f′
−
Z
b
a
cosh(ξ) exp(ξ) d ξ
= [sinh(ξ) exp(ξ)]ba − [sinh(ξ) exp(ξ)]ba +
Z
b
a
sinh(ξ) exp(ξ) d ξ
Das liegt hier auch nicht an unserer Entscheidung, welchen Faktor wir ableiten und
welchen wir integrieren. Wenn wir sinh integrieren erhalten wir dasgleiche Ergebnis:
Z
b
a
sinh(ξ) exp(ξ) d ξ = [cosh(ξ) exp(ξ)]ba −
| {z } | {z }
f′
g
Z
b
a
cosh(ξ) exp(ξ) d ξ
Für die, die sich wundern:
cosh(x) exp(x) − sinh(x) exp(x) = 1
Wir geben darum partielle Integration auf und setzen die Definition von sinh ein:
Z
Z
exp(ξ) − exp(−ξ)
exp(ξ) d ξ
2
a
a
Z b
exp(2ξ) − exp(0)
=
dξ
2
a
Z
Z
1 b
1 b
exp(2ξ) d ξ −
1dξ
=
2 a
2 a
b
1 1
1
=
exp(2ξ) − [ξ]ba
2 2
2
a
Im letzten Schritt haben wir dabei einen einfachen Fall von Substitution benutzt.
A.4
b
sinh(ξ) exp(ξ) d ξ =
b
Integration durch Substitution
Seien f : I → J und g : J → R stetig differenzierbar. Dann gilt:
Z
b
a
g(f (ξ)) f ′ (ξ) d ξ =
Z
f (b)
f (a)
g(ζ) d ζ
Bemerkung A.14. Eine wichtige Voraussetzung dieses Verfahrens ist, daß der
Wertebereich von f im Definitionsbereich von g enthalten ist.
Bemerkung A.15. Mit dem Differentialformenkalkül läßt sich Integration durch
Substitution suggestiv notieren. Man geht aus vom Integral
und setzt ζ := f (ξ). Dann ist
um, und setzt ein:
dζ
dξ
Z
g(f (ξ)) f ′ (ξ) d ξ
= f ′ (ξ). Dies stellt man formal zu d ζ = f ′ (ξ) d ξ
Z
g(f (ξ)) f ′ (ξ) d ξ
| {z } |
g(ζ)
{z
dζ
}
Die Integrationsgrenzen ergeben sich dann als Antwort auf die Frage: Wenn ξ das
Intervall [a, b] durchläuft, welches Intervall durchläuft dann ζ = f (ξ)?
175
Beispiel A.16. Am
einfachsten sind Verschiebungen des Parameter zu behandeln,
R
also Integrale wie ab sin(1
+ ξ) d ξ. Hier ist mit g = sin und f (ξ) = 1 + ξ das Integral
R
gleich von der Form g(f (ξ)) f ′ (ξ) d ξ, denn wir haben Glück und es ist f ′ (ξ) = 1.
Also:
Z
Z
b
a
sin(1 + ξ) d ξ =
1+b
sin(ζ) d ζ
1+a
= [− cos(ζ)]1+b
1+a
Beispiel A.17. Ebenfalls Fälle von Substitution sind die Streckungen und
R
Stauchungen des Arguments, also Integrale wie ab exp(2ξ) d ξ. Hier ist g = exp und
f (ξ) = 2ξ. Die innere Ableitung ist dann f ′ (ξ) = 2. Also:
Z
Z
1 b
exp(2ξ) 2 d ξ
2 a
a
1 Z 2b
exp(ζ) d ζ
=
2 2a
1
= [exp(ζ)]2b
2a
2
Man beachte, daß diese Integrale auch in Verkleidung auftreten können:
b
exp(2ξ) d ξ =
exp(2ξ) = exp(ξ)2
Beispiel A.18. Verschiebung und Streckung sind in linearen Substitutionen
kombiniert. Man hat hier die Formel:
Z b
Z
1 cb+d
g(cξ + d) d ξ =
g(ζ) d ζ
c ca+d
a
Also zum Beispiel:
Z
6
42
s
1
ξ + 2dξ = 3
3
Z
16
h
3
2
q
ζ dζ
4
2 3
= 3 ζ2
3
=2 ζ
16
4
i16
4
= 2(64 − 8) = 112
Beispiel A.19. Es kann nötig sein, eine Streckung mit Gewalt einzufügen, um auf
die Form eines Grundintegral zu kommen:
Z
b
a
Z
b
1
=
9
Z
b
Z
b
1
dξ =
9 + ξ2
1
a
9 1+
a
1+
2 ξ
3
1
2
ξ
3
dξ
1 3 1
dζ
=
3 a3 1 + ζ 2
b
1
= [arctan(ζ)] 3a
3
3
176
dξ
R
′
(ξ)
d ξ kommen oft vor. Sie entstehen durch
Beispiel A.20. Integrale der Form ff (ξ)
sogenanntes Trennen der Veränderlichen“ beim Lösen gewöhnlicher
”
Differentialgleichgungen erster Ordnung. Die Funktion g ist hier g(ζ) = 1ζ und man
erhält:
Z b ′
Z f (b)
f (ξ)
1
f (b)
dξ =
d ζ = [ln(±ζ)]f (a)
a f (ξ)
f (a) ζ
Wichtig ist aber, daß g an der Stelle 0 nicht definiert ist. Darum kommt für das
Definitionsintervall J von g nur (0, ∞) oder (−∞, 0) infrage. Die Substitution
scheitert also, wenn 0 im Bild von [a, b] unter der Abbildung f liegt.
Damit lassen sich zum Beispiel behandeln:
Z
b
a
Z
b
a
ξ
1 Z b 2ξ
d
ξ
=
dξ
1 + ξ2
2 a 1 + ξ2
Z
1 1+b2 1
dζ
=
2 1+a2 ζ
2
1
= [ln(ζ)]1+b
1+a2
2
Z
− sin(ξ)
dξ
a 2 + cos(ξ)
Z 2+cos(b)
1
=−
dζ
2+cos(a) ζ
sin(ξ)
dξ = −
2 + cos(ξ)
b
2+cos(b)
= [ln(ζ)]2+cos(a)
Auch das Grundintegral des Tangens läßt sich so ermitteln:
Z
Z
sin(ξ)
dξ
a cos(ξ)
Z b
− sin(ξ)
dξ
=−
cos(ξ)
a
Z cos(b)
1
=−
dζ
cos(a) ζ
b
tan(ξ) d ξ =
a
b
cos(b)
= − [ln(±ζ)]cos(a)
Der Cosinus darf im Intervall [a, b] keine Nullstelle haben, und dann ist in ln(±ζ)
das entsprechende Vorzeichen zu wählen.
Analog, bloß einfacher, für den Tangens hyperbolicus:
Z
b
a
Z
sinh(ξ)
dξ
a cosh(ξ)
Z cosh(b)
1
dζ
=
cosh(a) ζ
tanh(ξ) d ξ =
b
cosh(b)
= [ln(ζ)]cosh(a)
Hier stellt dich das Problem eines möglichen Nulldurchgangs nicht, wegen
cosh(x) ≥ 1.
177
Beispiel A.21. Substitution kann zuweilen auch partielle Integration ersetzen.
Folgendes Integral haben wir in (A.11) schon einmal betrachtet:
Z
b
sin(ξ) cos(ξ) d ξ =
a
Z
sin(b)
sin(a)
"
ζ2
=
2
ζ dζ
#sin(b)
sin(a)
Hier ist g einfach die identische Abbildung!
Dieses Beispiel läßt sich verallgemeinern:
Z
b
′
f (ξ) f (ξ) d ξ =
a
Z
f (b)
f (a)
"
ζ2
ζ dζ =
2
#f (b)
f (a)
Also zum Beispiel:
Z
b
a
"
arctan(ξ)
ζ2
d
ξ
=
1 + ξ2
2
#arctan(b)
arctan(a)
Beispiel A.22. Manchmal fehlt der Faktor f ′ (ξ) im Integranden. Dann kann man
ihn erzwingen:
Z
b
a
cos(ln(ξ)) d ξ =
=
=
Z
b
a
b
Z
ξ
cos(ln(ξ)) ξ d ξ
ξ
cos(ln(ξ)) exp(ln(ξ))
a
ln(b)
Z
ln(a)
1
dξ
ξ
cos(ζ) exp(ζ) d ζ
weiter mit partieller Integration:
=
ln(b)
[cos(ζ) exp(ζ)]ln(a)
−
ln(b)
= [cos(ζ) exp(ζ)]ln(a) +
= [cos(ζ) exp(ζ) +
2
Z
Z
ln(b)
ln(a)
Z ln(b)
ln(a)
− sin(ζ) exp(ζ) d ζ
sin(ζ) exp(ζ) d ζ
ln(b)
sin(ζ) exp(ζ)]ln(a)
b
a
−
Z
ln(b)
ln(a)
cos(ζ) exp(ζ) d ζ
ln(b)
cos(ln(ξ)) d ξ = [cos(ζ) exp(ζ) + sin(ζ) exp(ζ)]ln(a)
= [cos(ln(ξ)) ξ + sin(ln(ξ)) ξ]ba
Z b
1
cos(ln(ξ)) d ξ = [cos(ln(ξ)) ξ + sin(ln(ξ)) ξ]ba
2
a
Hier ist die Schreibweise im Differentialformenkalkül hilfreich: Gesucht ist
R
cos(ln(ξ)) d ξ Wir setzen ζ = ln(ξ) und erhalten dd ζξ = 1ξ sowie ξ = exp(ζ). Damit
ist:
d ξ = ξ d ζ = exp(ζ) d ζ
178
und:
Z
cos(ln(ξ)) d ξ =
Z
Z
cos(ζ) d ξ =
cos(ζ) exp(ζ) d ζ
Dieses wilde Umstellen der Differentialquotienten sieht aus wie Hexerei, führt aber
auf die richtigen Ergebnisse.
R
Ein weiteres Beispiel für dieses Vorgehen ist: ab tan(ξ)3 + tan(ξ) + 1 d ξ. Hier
möchten wir ζ := tan(ξ) substituieren. Dann ist dd ζξ = 1 + tan(ξ)2 . Damit versuchen
wir:
Z
b
a
tan(ξ)3 + tan(ξ) + 1 d ξ =
Z
b
tan(ξ)3 + tan(ξ) + 1
1 + tan(ξ)2
1 + tan(ξ)2
Z tan(b) 3
ζ +ζ +1
dζ
=
1 + ζ2
tan(a)
Z tan(b)
1
=
ζ+
dζ
1 + ζ2
tan(a)
a
"
ζ2
=
2
#tan(b)
+
"
#tan(b)
+ [arctan(ζ)]tan(a)
"
#
2 tan(b)
ζ2
=
2
=
ζ
2
tan(a)
Z
tan(b)
tan(a)
dξ
1
dζ
1 + ζ2
tan(b)
tan(a)
+ [ζ]ba
tan(a)
#b
"
tan(ζ)2
=
+ζ
2
a
√
√
Beispiel A.23. Bei Integranden, die 1 − ξ 2 oder ξ 2 ± 1 enthalten, lohnt sich
der Versuch einer trigonometrischen oder hyperbolischen Substitution ξ = sin(ζ),
ξ = sinh(ζ) oder ξ = cosh(ζ), bzw. ζ = arcsin(ξ), ζ = arsinh(ξ) oder ζ = arcosh(ξ).
Es gilt jeweils:
√
dξ
ξ = sin(ζ)
= cos(ζ) ζ = arcsin(ξ) dd ζξ = √ 1 2
1 − ξ 2 = cos(ζ)
dζ
1−ξ
√
ξ = sinh(ζ) dd ζξ = cosh(ζ) ζ = arsinh(ξ) dd ζξ = √ 12
ξ 2 + 1 = cosh(ζ)
ξ +1
√ 2
ξ − 1 = sinh(ζ)
ξ = cosh(ζ) dd ζξ = sinh(ζ) ζ = arcosh(ξ) dd ζξ = √ 12
ξ −1
Die Vorzeichen in der letzten Spalte ergeben sich aus den Wertebereichen: im
Wertebereich des arcsin ist der cos nicht-negativ, und so weiter. Wir erhalten:
Z
b
a
Z
b
a
Z b
a
q
g ξ, 1 −
g ξ,
g ξ,
q
ξ2
q
ξ2
ξ2
dξ =
+ 1 dξ =
−1 dξ =
Z
arcsin(b)
arcsin(a)
Z arsinh(b)
arsinh(a)
Z arcosh(b)
arcosh(a)
179
g(sin(ζ) , cos(ζ)) cos(ζ) d ζ
g(sinh(ζ) , cosh(ζ)) cos(ζ) d ζ
g(cosh(ζ) , sinh(ζ)) cos(ζ) d ζ
Hier die Methode in Anwendung mit ζ = sin(ξ) und
g(x, y) = x3 y:
Z
b
a
3
q
ξ2
1− dξ =
| {z
}
√
ξ
g ξ,
Z
arcsin(b)
Z
arcsin(b)
arcsin(a)
1−ξ 2
=
=
=
arcsin(a)
Z
arcsin(b)
arcsin(a)
Z
arcsin(b)
arcsin(a)
|
{z
= −
=
{z
}
dξ
sin(ζ)2 cos(ζ)2 sin(ζ) d ζ
1 − cos(ζ)2 cos(ζ)2 sin(ζ) d ζ
2
cos(ζ) sin(ζ) d ζ −
Z
arcsin(b)
arcsin(a)
"
cos(ζ)5
− −
5
arcsin(a)
cos(ζ)4 sin(ζ) d ζ
#arcsin(b)
arcsin(a)
5 #arcsin(b)
cos(ζ)3 cos(ζ)
+
3
5
arcsin(a)
3 #arcsin(b)
"
3 cos(ζ)5 − 5 cos(ζ)
15

5
2
=
}|
g(sin(ζ),cos(ζ))
cos(ζ)
= −
3
"
= cos(ξ) auf die Funktion
sin(ζ)3 cos(ζ) cos(ζ) d ζ
3 #arcsin(b)
"
dζ
dξ
arcsin(a)
3 b
2 2
3(1 − ξ 2 ) − 5(1 − ξ ) 
15
a
Man beachte die Rücksubstitution am Ende, die die trigonometrischen Funktionen
wieder fortschaft.
Hier die Methode in Anwendung mit ζ = cosh(ξ) und dd ζξ = sinh(ξ) auf die Funktion
g(x, y) = xy :
Z
b
a
√
ξ
ξ2
−1
dξ =
=
Z
arcosh(b)
arcosh(a)
Z
arcosh(b)
arcosh(a)
cosh(ζ)
sinh(ζ) d ζ
sinh(ζ)
cosh(ζ) d ζ
arcosh(b)
= [sinh(ζ)]arcosh(a)
=
q
ξ2 − 1
180
b
a
Hier bietet sich freilich auch die Substitution ζ = ξ 2 − 1 an:
Z
b
a
√
ξ
ξ2 − 1
dξ =
Z
=
q
1 b
2ξ
√ 2
dξ
2 a ξ −1
Z
1 b2 −1 1
√ dζ
=
2 a2 −1 ζ
2
1 q b −1
=
2 ζ
2
a2 −1
ξ2 − 1
b
a
Ebenso hier die Substitution ζ = 1 − ξ 2 :
Z
b
a
A.5
q
ξ 1−
ξ2
Z
q
−1 b
−2ξ 1 − ξ 2 d ξ
dξ =
2 a
Z
−1 1−b2 q
=
ζ dζ
2 1−a2
2
−1 3 3 1−b
=
ζ2
2 2
1−a2
Partialbruchzerlegung
Partialbruchzerlegung ist ein Verfahren zur Integration sogenannter
rationaler Funktionen, das sind Funktionen, die sich als Quotient zweier Polynome
schreiben lassen. Die Arbeit mit Polynomen vereinfacht sich konzeptuell stark über
algebraisch abgeschlossenen Körpern. Darum arbeiten wir zunächst über den
komplexen Zahlen, auch wenn unsere Funktionen bloß reelle Koeffizienten haben.
Sei also f eine rationale Funktion gegeben als Bruch zweier Polynome. Wir nehmen
an, daß Zähler und Nenner keine gemeinsamen Nullstellen haben: anderfalls könnten
wir in Zähler und Nenner denselben Linearfaktor abspalten und kürzen. Die
verbleibenden Nullstellen des Nenner heißen die Pole von f . Die Ordnung eines Pols
ist seine Vielfachheit als Nullstelle des Nenner.
(z)
eine rationale Funktion und λ ein Pol von q der
Fakt A.24. Sei q(z) = fg(z)
Ordnung m. Dann gibt es eine eindeutige Zerlegung
q(z) = Hλ (z) + q̃(z)
wobei gilt:
1. Die Abbildung q̃(z) ist eine rationale Funktion, die an der Stelle λ keinen Pol
hat.
2. Es gibt komplexe Koeffizienten a1 , . . . , am ∈ C, so daß
am
a1
.
Hλ (z) = (z−λ)
m + ··· +
(z−λ)1
Die Funktion Hλ (z) heißt Hauptteil der Funktion q(z) am Pol λ.
181
Diese Aussage läßt sich nun auf die Funktion q̃(z) erneut anwenden und auf diesem
Wege lassen sich alle Pole fortschaffen, bis nur noch eine polfreie rationale Funktion
übrig bleibt. Eine rationale Funktion ohne Pole ist ein Polynom, denn der Nenner
hat Grad 0. Also:
(z)
Fakt A.25 (Struktursatz über rationale Funktionen). Sei q(z) = fg(z)
eine
rationale Funktion mit Polen λ1 , . . . , λk der Ordnungen m1 , . . . , mk . Dann gibt es
eine eindeutige Zerlegung
q(z) = H1 (z) + · · · Hk (z) + h(z)
(11)
wobei gilt:
1. Die Abbildung h(z) ist ein Polynom.
2. Die Abbildung Hi (z) ist der Hauptteil von q(z) am Pol λi .
Man nennt die Darstellung (11) die Partialbruchzerlegung von q(z).
An dieser Stelle interessieren uns die Beweise nicht, sondern positive Antworten auf
folgende Fragen:
1. Läßt sich eine rationale Funktion integrieren, wenn sie als
Partialbruchzerlegung vorliegt? und wenn ja, wie?
2. Läßt sich die Partialbruchzerlegung einer gegebenen rationalen Funktion
bestimmen? und wenn ja, wie?
Damit wir einen Grund haben, die zweite Frage überhaupt anzugehen, sollten wir
zunächst das Integrationsproblem behandeln.
Beobachtung A.26. Der polynomiale Anteil einer rationalen Funktion ist ohne
Schwierigkeiten integrierbar.
Beispiel A.27. Für einen Hauptteil mit nur einem Summanden zu einem reellen
Pol ist die Integration leicht:
Z
b
a
1
dξ =
(ξ − 5)k


[ln(|ξ

 −
− 5|)]ba
1
(k−1)(ξ−5)k−1
k=1
b
k>1
a
Als Summen dieser Terme lassen sich Hauptteile zu reellen Polen einfach behandeln.
Beispiel A.28. Unsere Integrationsprobleme sind eigentlich reell. Den Weg über
die komplexen Zahlen gehen wir nicht, weil in der zu integrierenden rationalen
Funktion komplexe Koeffizienten vorkommen, sondern weil der Nenner komplexe
Nullstellen haben kann.
Die Integration rationaler Funktionen beruht auf folgendem:
182
Beispiel A.29. Grundlegend sind natürlich die Stammbrüche der Potenzen:
Z
b
a
Z
b
a
Z
b
a
Z
b
a
A.6
1.
3.
5.
7.
9.
11.
Z
#b
a
"
#b
"
#b
1 1
1
d
ξ
=
−
ξ3
2 ξ2
1
1 1
d
ξ
=
−
ξ4
3 ξ3
..
.
b
a
Z b
a
Z b
a
b
Z
a
Z b
a
b
Z
a
b
13.
b
17.
Z
ξ cos(ξ) d ξ
2.
sin(4ξ) exp(2ξ) d ξ
4.
sin(ξ)5 d ξ
6.
sinh(ξ) sin(ξ) d ξ
exp(−ξ) d ξ
q
ξ 2 ξ 3 + 10 d ξ
sin(2ξ)
2 dξ
a 1 + cos(ξ)
Z b
ξ
15.
dξ
a 1 + ξ4
a
Z
b
Z
b
a
exp
ξ2
1
ξ
dξ
1
dξ
exp(ξ) − 1
cos(ξ)
dξ
a 1 + sin(ξ)
Z b
ξ exp(2ξ)
23.
2 dξ
a (1 + 2ξ)
21.
"
1
1
dξ = −
2
ξ
ξ
a
a
Aufgaben
Z
19.
1
d ξ = [ln(|ξ|)]ba
ξ
8.
10.
Z
b
a
Z b
a
Z b
a
b
Z
a
Z b
a
b
12.
Z
Z
b
18.
b
20.
Z
Z
b
22.
Z
b
24.
sin(ξ) exp(2ξ) d ξ
sin(ξ)4 d ξ
sinh(ξ)2 d ξ
ξ 2 ln(ξ) d ξ
ξ3 2 + ξ4
115
dξ
1
12 d ξ
a (1 − 2ξ)
Z b
sin(ξ)
14.
2 dξ
a 1 + cos(ξ)
Z b 2
ξ sin(ξ)
16.
dξ
1 + ξ6
a
183
a
a
sin(ln(ξ)) d ξ
1
q
exp(ξ) − 1
a ξ2
a
ξ
dξ
−1
ξ exp(3ξ) d ξ
dξ
25.
Z
Z
b
28.
Z
sin(ξ)2
dξ
1 + cos(ξ)2
Z
b
34.
36.
Z
b
ξ arccos(ξ) d ξ
ξ 2 arsinh(ξ) d ξ
38.
sin(arccos(ξ)) d ξ
40.
a
Z b
42.
Z
b
a
b
2
2
sin(ξ) cos(ξ) d ξ
Z
1
√ 2
27.
dξ
a ξ ξ +1
Z b
ln(ξ)
dξ
29.
ξ
a
Z b
ln(ξ)
31.
dξ
ξ3
a
b
33.
Z
b
35.
Z
37.
a
a
Z b
39.
a
Z b
b
41.
Z
b
43.
Z
45.
47.
49.
51.
53.
55.
57.
59.
a
a
a
Z
b
a
Z
b
a
Z
b
a
Z
b
a
Z
b
a
b
Z
a
b
Z
a
Z b
a
tanh(5ξ) d ξ
26.
1
√ 2
dξ
a ξ ξ −1
Z b
ln(ξ)
30.
dξ
ξ2
a
Z b
ln(ξ)
32.
dξ
ξ4
a
q
ξ ξ + 1dξ
q
ξ2 ξ + 1 d ξ
ξ
3
q
ξ2
a
Z b
a
b
a
b
44.
b
46.
Z
48.
50.
52.
54.
56.
+ 1dξ
58.
ξ3 ξ2 − 1 d ξ
60.
q
a
Z
2
3ξ + 7ξ + 29
dξ
ξ 3 + 4ξ 2 + 29ξ
1
dξ
2
ξ +4
1
dξ
4
ξ +4
1
dξ
2
ξ −4
1
dξ
4
ξ −4
a
b
sin(ξ) cos(ξ)3 d ξ
184
a
a
Z
b
a
Z
b
a
Z
b
a
Z
b
a
b
Z
a
b
Z
a
Z b
a
arcsin(ξ)2 d ξ
ξ arsinh(ξ) d ξ
sinh(arcosh(ξ)) d ξ
16
dξ
(ξ − 2)2 (ξ 2 + 4)
ξ−1
dξ
2
ξ + 2ξ − 1
1
dξ
ξ+4
1
dξ
3
ξ +4
1
dξ
ξ−4
1
dξ
3
ξ −4
q
ξ ξdξ
q
ξ ξ2 + 1 d ξ
q
ξ2 ξ2 + 1 d ξ
ξ
2
q
ξ2 − 1 d ξ
q
ξ2 ξ3 − 1 d ξ
Herunterladen