Analysis

Werbung
Analysis
Carsten Schütt
February 1, 2015
2
Contents
1
Einführung . . . . . . . . . . . . . . . . .
Mathematische Logik . . . . . . . . . . . .
Das Axiomensystem von Zermelo-Fraenkel
Relation und Ordnung . . . . . . . . . . .
Die natürlichen Zahlen N . . . . . . . . . .
Die ganzen Zahlen Z . . . . . . . . . . . .
Die rationalen Zahlen Q . . . . . . . . . .
Körper . . . . . . . . . . . . . . . . . . . .
Supremum und Infimum . . . . . . . . . .
Mathematische Induktion . . . . . . . . .
Mächtigkeit . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
14
19
23
26
31
31
32
36
37
43
reellen Zahlen
Dedekind Schnitt . . . . . . . . . . . .
Folgen in R . . . . . . . . . . . . . . .
R ist vollständig . . . . . . . . . . . . .
Differenzengleichungen . . . . . . . . .
Limes Superior und Limes Inferior . . .
Reihen in R . . . . . . . . . . . . . . .
Reihen Produkt Satz von Cauchy . . .
Umordnungsatz von Riemann . . . . .
Das Problem von Basel . . . . . . . . .
p-adische Entwicklungen reeller Zahlen
Kettenbrüche . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
52
60
68
81
87
92
104
109
112
113
121
3 Funktionen einer reellen Veränderlichen
3.1 Stetigkeit . . . . . . . . . . . . . . . . . . . .
3.2 Gleichmäßige Stetigkeit . . . . . . . . . . . . .
3.3 Monotone Funktionen und Umkehrfunktionen
3.4 Potenz, Exponentialfunktion und Logarithmus
3.5 Differenzierbare Funktionen . . . . . . . . . .
3.6 Der Satz von Rolle und der Mittelwertsatz . .
3.7 Lokale Extrema . . . . . . . . . . . . . . . . .
3.8 Satz von Taylor und Taylorreihen . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
129
129
142
144
146
157
167
177
178
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
1.11
2 Die
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
CONTENTS
3.9
3.10
3.11
3.12
3.13
Potenzreihen . . . . . . . . . . . .
Die trigonometrischen Funktionen
Die Formel von L’Hôpital . . . .
Gleichmäßige Konvergenz . . . .
Unstetige Ableitungen . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Metrische Räume
4.1 Metrische Räume . . . . . . . . . . . . .
4.2 Vervollständigung metrischer Räume . .
4.3 Normierte Räume . . . . . . . . . . . . .
4.4 Stetige Abbildungen zwischen metrischen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . .
. . . . .
. . . . .
Räumen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Integralrechnung
5.1 Integralrechnung . . . . . . . . . . . . . . . . . . . .
5.2 Riemannsche Summen . . . . . . . . . . . . . . . . .
5.3 Riemann-messbare Mengen und die Cantor-Menge . .
5.4 Hauptsatz der Differential- und Integralrechnung . . .
5.5 Substitution und partielle Integration . . . . . . . . .
5.6 Mittelwertsatz der Integralrechnung . . . . . . . . . .
5.7 Uneigentliche Integrale . . . . . . . . . . . . . . . . .
5.8 Gammafunktion . . . . . . . . . . . . . . . . . . . . .
5.9 Bogenlänge . . . . . . . . . . . . . . . . . . . . . . .
5.10 Die trigonometrischen Funktionen . . . . . . . . . . .
5.11 Das Produkt von Wallis . . . . . . . . . . . . . . . .
5.12 Partialbruchzerlegung . . . . . . . . . . . . . . . . . .
5.13 Integralkriterium für Reihen . . . . . . . . . . . . . .
5.14 Unendliche Produkte . . . . . . . . . . . . . . . . . .
5.15 Die Formel von Stirling . . . . . . . . . . . . . . . . .
5.16 Der Satz von Taylor und Taylorreihen . . . . . . . . .
5.17 Gleichmäßige Konvergenz und Integral . . . . . . . .
5.18 Rationale, irrationale, algebraische und transzendente
6 Funktionen mehrerer reeller Variablen
6.1 Zusammenhängende Mengen im Rn . .
6.2 Richtungsstetigkeit, Richtungsableitung
6.3 Differenzierbarkeit im Rn . . . . . . . .
6.4 Partielle Ableitungen höherer Ordnung
6.5 Abbildungen vom Rn in den Rm . . . .
6.6 Kettenregel . . . . . . . . . . . . . . .
6.7 Mittelwertsatz . . . . . . . . . . . . . .
6.8 Der Satz von Taylor . . . . . . . . . .
6.9 Bogenlänge . . . . . . . . . . . . . . .
6.10 Extremwerte . . . . . . . . . . . . . . .
6.11 Umkehrabbildungen . . . . . . . . . . .
6.12 Implizite Funktionen . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Zahlen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . . . . . . . . .
und Partielle Ableitungen
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
183
194
200
208
217
.
.
.
.
219
. 219
. 226
. 226
. 233
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
239
. 239
. 251
. 252
. 264
. 270
. 271
. 272
. 274
. 277
. 281
. 287
. 290
. 290
. 294
. 295
. 301
. 303
. 312
.
.
.
.
.
.
.
.
.
.
.
.
321
. 321
. 329
. 331
. 339
. 343
. 345
. 347
. 349
. 352
. 357
. 371
. 380
CONTENTS
5
6.13 Lagrangesche Multiplikatoren . . . . . . . . . . . . . . . . . . . . . . 386
6.14 Differentiation in Banachräumen . . . . . . . . . . . . . . . . . . . . . 389
6.15 Equidistribution theorem . . . . . . . . . . . . . . . . . . . . . . . . . 391
7 Integration im Rn
7.1 Iterierte Integrale . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Riemann-Integral auf beschränkten Mengen . . . . . . . . .
7.3 Das Maß von Mengen . . . . . . . . . . . . . . . . . . . . . .
7.4 Berechnung von Integralen . . . . . . . . . . . . . . . . . . .
7.5 Transformationsformel für Integrale . . . . . . . . . . . . . .
7.6 Unstetigkeitsmengen von Funktionen und ihren Ableitungen
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
393
396
402
403
409
410
415
6
CONTENTS
Chapter 1
1.1
Einführung
Wie man studiert
Sie sollten nur ein Fach studieren, das Ihnen auch gefällt.
Wir wollen in der Vorlesung drei Dinge lernen:
1. Die mathematische Sprache
Hier lernen wir, was ein Beweis ist und wie er aufgeschrieben wird.
2. Methoden zur Lösung von Problemen
Hier lernen Sie Standardmethoden zum Bearbeiten von mathematischen Problemen
kennen. Sie lernen, Probleme zu analysieren.
3. Ergebnisse der Mathematik
Sie werden sehr bald feststellen, dass der Arbeitsumfang sehr groß ist. Dies
trifft für Ihr Studium im Allgemeinen wie auch insbesondere für diese Vorlesung
zu. Sie werden Ihr Studium nur dann bewältigen, wenn Sie kontinuierlich arbeiten.
Um sicher zu stellen, dass Sie auch kontinuierlich arbeiten, werden jede Woche
Übungsaufgaben ausgeben. Diese Übungsaufgaben werden in den Übungsgruppen
besprochen. Im Laufe der Wochen werden Sie so mit einer großen Zahl von Beispielen
vertraut. Das Verständnis vom Stoff hängt davon ab, ob man Beispiele kennt.
Es ist besser, in kleinen Gruppen zu arbeiten. Ich möchte stark davon abraten,
allein zu arbeiten. Wenn Sie mit anderen zusammen arbeiten, werden Sie anderen
Ihre Überlegungen und Ideen erläutern. Dies ist ein guter Weg, die die eigenen
Gedanken und Argumente zu überprüfen.
In der Vorlesung werden Beispiele vorgerechnet. Die Aufgaben sind häufig
ähnlich, manchmal dienen sie als Vorlage.
Jede Woche werden Übungsaufgaben ausgegeben, die innerhalb einer Woche zu
bearbeiten sind. Besprochen werden die Aufgaben in den Übungsgruppen.
Sie müssen sich selbst beim Studium einbringen, Sie müssen die Initiative ergreifen. Das Studium der Mathematik ist sicherlich schwer, es bringt aber auch viel
Spaß.
7
8
CHAPTER 1.
Neben Lehrbüchern steht auch Software zum Erarbeiten des Stoffes zur Verfügung. Mathematica und Maple sind sehr zu empfehlen, wobei ich Mathematica
den Vorzug gebe. Es ist aber nicht notwendig, einen Computer und diese Software zur Verfügung zu haben. Sie können den Vorlesungsstoff auch ohne diese
Dinge bewältigen. Außerdem möchte ich Sie auf das Textverarbeitungssysten TEX
aufmerksam machen. Mit diesem System können Sie mathematische, physikalische
und chemische Texte schreiben. Die Software ist frei im Internet erhältlich.
Wenn Sie sich mit mir unterhalten wollen, können Sie dies z.B. direkt im Anschluss an die Vorlesung tun, oder aber auch in meiner Sprechstunde. Wir können
auch einen Gesprächstermin vereinbaren. Falls Sie meinen, dass Sie im Studium
Probleme haben, sollten Sie mit mir sprechen.
Literatur
• G. Berendt und E. Weimar: Mathematik für Physiker, VCH
• J. Dieudonne: Grundlagen der modernen Analysis,
• K.Endl und W. Luh: Analysis I,II, Akademische Verlagsgesellschaft, Wiesbaden
• F. Erwe: Differential- und Integralrechnung I,II, BI Hochschultaschenbücher
• G.M. Fichtenholz: Differential- und Integralrechnung I,II,III, VEB Deutscher
Verlag der Wissenschaften, Berlin
• H. Fischer und H. Kaul: Mathematik für Physiker, B.G. Teubner, Stuttgart
• O. Forster: Analysis 1,2, vieweg studium, Braunschweig/Wiesbaden
• W. Grauert und I. Lieb: Differential- und Integralrechnung I, Springer-Verlag
• W. Grauert und W. Fischer: Differential- und Integralrechnung II, SpringerVerlag
• H. Heuser: Lehrbuch der Analysis, Teil 1 und 2, B.G. Teubner, Stuttgart
• S. Lang: Analysis I,II, Addison-Wesley
• von Mangoldt und Knopp: Einführung in die höhere Mathematik, S. Hirzel
Verlag, Stuttgart
• W. Smirnow: Lehrgang der höheren Mathematik, VEB Deutscher Verlag der
Wissenschaften, Berlin
• M. Spiegel: Advanced Calculus, Schaum’s Outline Series. McGraw Hill
• W. Walter: Analysis I,II,Springer-Verlag
1.1. EINFÜHRUNG
9
Prüfungen, Klausuren und Übungen
Am Ende des Semesters findet eine Klausur statt. Diese Klausur wird auch am
Beginn des darauffolgenden Semesters angeboten. Danach wird diese Klausur erst
ein Jahr später angeboten.
Sie erhalten die Zulassung zur Klausur, wenn Sie hinreichend viele Aufgaben der
Übungen richtig bearbeitet haben.
Jede Woche wird ein Übungszettel mit 3-5 Aufgaben herausgegeben. Die letzte
Aufgabe ist immer nur von den Studenten des 1-Fach-Bachelorstudiums zu bearbeiten. Die Teilnahme an den Übungen ist Pflicht. Die Aufgaben sollen zu zweit
schriftlich bearbeitet werden und am Mittwoch vor der Vorlesung um 8:15 abgegeben
werden. Jede zweite Woche findet für eine halbe Stunde eine Korrektur in Anwesenheit statt. Während dieser halben Stunde sollen Sie dem übungsleiter erklären,
was Sie aufgeschrieben haben. Während dieser halben Stunde kann man i.A. nicht
alle Aufgaben besprechen. Wenn Sie nicht erklären können, was Sie aufgeschrieben
haben, gilt dies als falsch.
Um zur Klausur zugelassen zu werden, müssen Sie 50% der Aufgaben richtig
bearbeitet haben und es müssen 50% der Aufgaben richtig sein, die Sie in der Korrektur in Anwesenheit besprechen.
Vorlesungsstoff
Ein großer Teil der Vorlesung befasst sich mit dem Aufbau des Zahlsystems.
Wir gehen von den natürlichen Zahlen N aus. Die Existenz der natürlichen Zahlen
kann man aus dem Axiomensystem von Zermelo-Fraenkel der Mengenlehre herleiten.
Aus den natürlichen Zahlen erhält man durch Hinzufügen von 0 und der negativen
Zahlen die ganzen Zahlen Z. Durch Quotientenbildung erhält man die rationalen
Zahlen Q. Daraus konstruieren wir schließlich die reellen Zahlen R. Diese letzte
Konstruktion ist nicht einfach. Anschaulich handelt es sich bei den reellen Zahlen
um den unendlichen Zahlenstrahl, so etwas wie ein unendlich langes Lineal. Dies
ist sicherlich eine gute Veranschaulichung, wir brauchen aber eine Darstellung der
reellen Zahlen, die es uns erlaubt mit ihnen zu rechnen.
Zunächst stellt sich die Frage, ob es überhaupt reelle Zahlen gibt, die keine
rationalen Zahlen sind.
√
Wir betrachten 2,
√ um die Probleme zu erklären. Aus der Anschauung sind wir
sicher, dass die Zahl 2 existiert: Sie ist die Länge der Diagonale des Quadrates
mit der Kantenlänge 1. Was aber ist dann eine reelle Zahl? Jede Länge, die wir in
einem geometrischen Objekt wie einem Quadrat messen können? Was ist dann mit
der Zahl e?
√
Nehmen wir einmal an, dass 2 eine wohldefinierte, reelle Zahl
√ ist. Es lässt sich
durch ein geschicktes, aber sehr kurzes Argument zeigen, dass 2 keine rationale
Zahl ist (Satz 2.0.2).
√
Nun eine historische Bemerkung zu der Tatsache, dass 2 irrational ist. Pythagoras war der Führer einer philosophischen Gemeinschaft, der Pythagoräer. Sie glaubten,
dass der Natur harmonische Prinzipien zu Grunde liegen. So beobachteten sie, dass
zwei Saiten harmonisch klingen, wenn der Quotient ihrer Längen als Quotient zweier
10
CHAPTER 1.
kleiner natürlicher Zahlen ausgedrückt werden kann. Sie glaubten, dass die in der
Natur vorkommenden
Zahlen rationale Zahlen sind. Sie waren erschüttert, als sie
√
feststellten, dass 2 eine irrationale Zahl ist. Sie beschlossen, dies geheim zu halten.
√
Ein Mitglied ihrer Gemeinde, Hippasus, beschloss, der Welt mitzu teilen, dass 2
eine irrationale Zahl ist. Daraufhin wurde er umgebracht [76, 91].
Außerdem sind π und e keine rationalen Zahlen, dies ist aber deutlich schwieriger
nachzuweisen.
Weiter ist in diesem Zusammenhang wichtig, eine Darstellung für reelle Zahlen
zu finden. Die übliche Darstellung ist die Dezimaldarstellung. Auf Taschenrechnern wird diese Darstellung benutzt, wobei nur ca. 10 Ziffern benutzt werden. Dem
unvoreingenommenen Benutzer von Taschenrechnern kommt der Verdacht, dass 10
Ziffern vielleicht nicht ausreichen. Vielleicht kommt man mit 20 Ziffern aus? Vielleicht macht man einen Fehler, aber der ist so klein, dass er in aller Regel keine Rolle
spielt? Können wir also unser Zahlsystem so einschränken, dass wir höchstens 20
Ziffern zu verwenden haben?
Bei der Umwandlung eines Bruches in eine Dezimalzahl treten Dezimalzahlen
mit unendlich vielen Stellen auf. So z.B.
1
= 0, 3333 . . .
3
Ist der rechte Ausdruck aber sinnvoll? Auf einem Taschenrechner haben nicht unendlich viele Zahlen Platz und wir sind auch nicht in der Lage, unendlich viele Ziffern
aufzuschreiben.
Multiplizieren wir nun beide Seiten mit 3, erhalten wir
1 = 0, 999 . . .
Ist das noch vernünftig? Wenn ja, dürfen wir eine Dezimalzahl in dieser Weise
multiplizieren? Sind die Zahlen
1
und
0, 9999 . . .
tatsächlich gleich? Wenn ja, warum?
Eine weitere wichtige Aufgabe ist die Bestimmung des Flächeninhaltes. Hierzu
entwickeln wir die Differential- und Integralrechnung. Wir gehen davon aus, dass
die Fläche eines Rechteckes das Produkt der Seitenlängen ist. Wir können dann die
Fläche zwischen Graphen von Funktionen bestimmen.
Es stellt sich die Frage, ob wir jeder Teilmenge des R2 einen Flächeninhalt zuordnen können?
Eine weitere Aufgabe ist die Bestimmung der Länge einer Kurve. Beispiele
hierfür sind der Umfang eines Rechteckes oder der Umfang eines Kreises.
Wir geben hier mathematische Probleme an, die von besonderem Interesse sind.
Einige werden wir in der Vorlesung behandeln.
Konvergenz von Folgen
Konvergieren die Folgen:
1.1. EINFÜHRUNG
11
(i)
s
r
r
q
q
q
√
√
√
√
1, 1 + 2, 1 + 2 + 3, 1 + 2 + 3 + 4, . . .
(ii)
2 3 4
1
1
1
(1 + 1) , 1 +
, 1+
, 1+
,...
2
3
4
1
Bewegungsgleichung eines Pendels und eines Doppelpendels
Brachistochronen Problem
Man konstruiere eine Bahn, auf der sich eine Kugel nur unter Wirkung der Schwerkraft am schnellsten von einem Punkt zu einem anderen bewegt.
Schwerkraft eines hohlen Planeten
Wir betrachten einen Planeten, der innen hohl ist. Wie groß ist die Schwerkraft
innnen und außen?
Schwingende Saite
Eine Saite wird angezupft. Wie lassen sich die Schwingungen, die die Saite vollführt,
ausrechnen?
12
CHAPTER 1.
Kann man die Form einer Trommel hören?
Kann man nur am Ton der Trommel hören, welche Form ihre Bespannung hat?
Temperaturverteilung in einer kreisrunden Metallscheibe
Eine kreisrunde Metallscheibe ist zu einem gegebenen Zeitpunkt unterschiedlich erhitzt. Wie entwickelt sich die Temperaturverteilung im Laufe der Zeit?
π ist eine irrationale Zahl
Wir zeigen, dass sich π nicht als Quotient zweier ganzen Zahlen schreiben lässt.
Dreiteilung eines Winkels
Kann man nur mit Hilfe von Zirkel und Lineal einen beliebigen Winkel in drei gleiche
Teile teilen?
Quadratur des Kreises
Kann man nur mit Hilfe von Zirkel und Lineal ein Quadrat konstruieren, das dieselbe
Fläche wie ein gegebener Kreis hat?
Banach-Tarski Paradoxon
Man kann eine Kugel so in endlich viele Teile zerlegen, dass man diese wiederum
zu zwei Kugeln derselben Größe zusammensetzen kann. Auf diese Weise verdoppelt
man das Volumen. Dies kann nicht sein. Wie erklärt sich dieser Widerspruch? Wir
zerlegen die Kugel in Teile, denen sämtlich kein Volumen zugeordnet werden kann,
also Mengen, die nicht messbar sind.
Kakeya Problem (1917)
Wir legen eine Nadel auf eine Ebene und bewegen sie nun so, dass sie wieder
in derselben Position zu liegen kommt, wobei allerdings die beiden Endpunkte der
Nadel vertauscht sind. Wir möchten die Nadel so bewegen, dass eine mglichst kleine
Fläche von der Nadel überstrichen wird. Wie klein kann diese Fläche sein? Gibt es
ein Minimum?
Vermutung von Fermat
Es sei n ∈ N. Für n ≥ 3 gibt es keine x, y, z ∈ N mit
xn + y n = z n .
Für n = 2 erfüllen x = 3, y = 4, z = 5 die Gleichung.
1.1. EINFÜHRUNG
13
Berechnung von Volumina, Schwerpunkten, Kurvenlängen, Oberflächen
Peano-Kurve
Es gibt eine stetige Kurve, die ein ganzes Quadrat ausfüllt.
Wir wollen uns noch ein Beispiel für einen mathematischen Beweis ansehen.
Satz 1.1.1 (Pythagoras)[76, 91] Es seien a und b die Längen der Katheten in einem
rechtwinkligen Dreieck und c die Länge der Hypothenuse. Dann gilt
a2 + b 2 = c 2 .
Beweis.
b
a
c
Wir betrachten ein Quadrat mit der Kantenlänge a + b. Einbeschrieben ist ein
Quadrat der Kantenlänge c.
a
b
c
Wir sehen nun, dass sich die Fläche des Quadrates mit der Kantenlänge a + b aus
einem Quadrat der Kantenlänge c und vier rechtwinkligen Dreiecken mit Katheten
a und b und Hypothenuse c zusammensetzt.
Es folgt
a·b
(a + b)2 = c2 + 4
= c2 + 2ab.
2
Deshalb gilt
a2 + 2ab + b2 = c2 + 2ab.
14
CHAPTER 1.
Also
a2 + b 2 = c 2 .
Alternativ können wir den Beweis auch geometrisch beenden. Wir arrangieren die
Dreiecke neu in dem Quadrat an. Es folgt, dass die Fläche, die nicht von den
Dreiecken überdeckt wird gleich c2 ist. Andererseits setzt sich die Fläche aus zwei
Quadraten der Kantenlänge a und b zusammen.
a
b
2
Pythagoras wurde um 570 v. Chr. auf Samos geboren und starb nach 510 v.
Chr. in Metapont in Süditalien. Er war Philosoph und Gründer einer religiösphilosophischen Bewegung. In seiner Jugend reiste er zu Studienzwecken u.a. nach
Ägypten und Babylon. Um 530 v. Chr. wanderte er nach Croton in Süditalien aus,
weil er sich mit dem Herrscher auf Samos überworfen hatte.
Der Satz von Pythagoras war sehr wahrscheinlich schon vor Pythagoras Zeit den
Ägyptern, Indern und Chinesen bekannt.
In China ist der Satz unter dem Namen GouGu-Dingi bekannt. Gou heißt Breite,
Gu heißt Länge und Dingi Lehrsatz.
Es gibt sehr viele Beweise des Satzes, die aber im Wesentlichen nicht allzu verschieden sind. Der amerikanische Präsident James A. Garfield (1831-1881) hat auch
einen Beweis geliefert.
1.2
Mathematische Logik
Die mathematische Logik bietet systematische und formale Entscheidungsmethoden
dafür an, ob eine Aussage wahr oder falsch ist (oder auch, ob eine Aussage weder
wahr noch falsch ist, also nicht entscheidbar ist). Da diese Methoden formal sind,
gehen sie nicht auf die Bedeutung und den Sinn der vorliegenden Aussage ein. Sie
liefern objektive Verfahrensweisen zur Entscheidung, ob eine Aussage wahr oder
1.2. MATHEMATISCHE LOGIK
15
falsch ist.
Wir können Aussagen zusammensetzen. Dazu stehen uns die folgenden Verknüpfungen
zur Verfügung.
Aussage
Verknüpfung
Aussage
Bedeutung
A
⇒
B
A folgt B
A
⇔
B
A gilt genau dann, wenn B gilt
A
∧
B
A und B gelten
A
∨
B
A oder B gelten (einschliessendes ”oder”)
Außerdem bedeutet ¬A die Verneinung der Aussage A. Wir ordnen Aussagen A
und B die Wahrheitszeichen W und F für wahr und falsch zu. Für zusammengesetzte Aussagen gelten die folgenden Regeln.
A
¬A
W
F
F
W
Wenn A wahr ist, dann ist die Verneinung ¬A natürlich falsch.
A
∧
B
W
W
W
W
F
F
F
F
W
F
F
F
A und B sind nur dann wahr, wenn beide Aussagen wahr sind.
A
∨
B
W
W
W
W
W
F
F
W
W
F
F
F
Da das Symbol ∨ das einschließende ”oder” ist, braucht nur eine der beiden
16
CHAPTER 1.
Aussagen wahr zu sein, damit die Gesamtaussage richtig ist. Als Beispiel hierfür die
Aussage: Das Haus ist rot oder das Haus ist nicht rot.
A
⇒
B
W
W
W
W
F
F
F
W
W
F
W
F
Falls A und B wahr sind, so ist auch die Gesamtaussage wahr. Falls A wahr ist
und B falsch, so ist die Gesamtaussage falsch, da aus einer wahren Aussage keine
falsche folgen kann. Andererseits kann aus einer falschen Aussage durchaus eine
wahre Aussage folgen. Wenn wir von der falschen Aussage 1 = 2 ausgehen so folgt
durch Addition
2+1=1+2
also die wahre Aussage 3 = 3.
A
⇔
B
W
W
W
W
F
F
F
F
W
F
W
F
A ist genau dann wahr, wenn B wahr ist. Ebenso ist A genau dann falsch, wenn
B falsch ist. Dies sind die beiden wahren Implikationen.
Wir sagen, dass zwei Aussagen A und B logisch äquivalent oder tautologisch
sind, falls A ⇔ B immer wahr ist.
Beispiel 1.2.1 (i) (A ⇒ B) und (¬B ⇒ ¬A) sind logisch äquivalent.
A
⇒
B
⇔
¬B
⇒
¬A
W
W
W
W
F
W
F
W
F
F
W
W
F
F
F
W
W
W
F
W
W
F
W
F
W
W
W
W
(ii) (A ⇔ B) und ((A ∧ B) ∨ (¬A ∧ ¬B)) sind logisch äquivalent.
1.2. MATHEMATISCHE LOGIK
17
(A
⇐⇒
B)
⇐⇒
((A
∧
B)
W
W
W
W
W
W
W
W
F
F
F
W
F
F
W
W
F
F
F
F
F
W
F
F
W
W
F
F
W
F
W
F
F
W
F
W
F
F
F
W
W
W
F
∨
(¬A
W
∧
¬B))
So lässt sich die Verknüpfung ⇔ durch ∨ und ∧ ausdrücken.
(iii) Die Aussagen ¬(A ∨ B) und ¬A ∧ ¬B sind logisch äquivalent.
Die Aussagen ¬(A ∧ B) und ¬A ∨ ¬B sind logisch äquivalent.
(iv) Die Aussage ”Entweder gilt A oder B” lässt sich formelmäßig durch
(A ∧ ¬B) ∨ (¬A ∧ B)
erfassen. Entweder gilt A oder B heißt ja gerade, dass A gilt und nicht B oder A gilt nicht und B
gilt. Die Wahrheitstafel ist
(A
∧
¬B)
∨
(¬A
∧
B)
W
F
F
F
F
F
W
W
W
W
W
F
F
F
F
F
F
W
W
W
W
F
F
W
F
W
F
F
Wenn wir die Wahrheitstafeln vergleichen, stellen wir fest, dass die Aussage (A ⇔ B) logisch
äquivalent zu ¬((A ∧ ¬B) ∨ (¬A ∧ B)), also der Verneinung der Entweder-Oder Aussage. Die
Aussage ¬((A ∧ ¬B) ∨ (¬A ∧ B)) ist logisch q̈uivalent zu (¬A ∨ B) ∧ (A ∨ ¬B).
Wir wollen uns nun einem komplizierteren Beispiel zuwenden.
Beispiel 1.2.2 Wenn Anton raucht, dann raucht auch Fridolin.
Christa oder Dora rauchen.
Entweder raucht Fridolin, oder es raucht Emil.
Christa und Emil rauchen beide, oder beide rauchen nicht.
Wenn Dora raucht, dann rauchen auch Christa und Anton.
Bruno raucht nur, wenn Fridolin nicht raucht.
Wer raucht und wer raucht nicht?
Wir haben die folgenden Aussagen.
A = Anton raucht
D = Dora raucht
B = Bruno raucht
E = Emil raucht
C = Christa raucht
F = Fridolin raucht
Wir übersetzen nun die Aussagen.
Wenn Anton raucht, dann raucht auch Fridolin :
Christa oder Dora rauchen :
Entweder raucht Fridolin, oder es raucht Emil :
Christa und Emil rauchen beide, oder beide rauchen nicht :
Wenn Dora raucht, dann rauchen auch Christa und Anton :
Bruno raucht nur, wenn Fridolin nicht raucht :
A⇒F
C ∨D
(E ∧ ¬F ) ∨ (¬E ∧ F )
(C ∧ E) ∨ (¬C ∧ ¬E)
D ⇒ (A ∧ C)
B ⇔ ¬F
18
CHAPTER 1.
A
B C D
E F
W
W
F
W
W
F
F
W
W
W
F
W
F
W
W
W
W
W
F
F
F
W
F
W
F
W
W
W
W
W
F
W
F
W
F
W
W
W
F
F
F
W
F
W
F
F
W
W
W
F
W
F
F
W
F
F
W
F
W
W
W
W
W
F
F
F
W
F
W
F
W
W
W
W
W
F
W
W
F
F
W
F
F
W
F
F
W
W
W
W
W
F
F
F
(E∧¬F )∨(¬E∧F ) (E∧C)∨(¬E∧¬C) D ⇒ (A∧C)
F
F
W
D∨C
W
F
F
W
W
A⇒F
F
F
W
F
F
W
F
W
W
W
F
F
F
W
F
W
F
W
F
F
F
F
W
F
F
F
W
F
F
Wir erstellen zwei Tabellen, mit der wir sämtliche Möglichkeiten überprüfen. Da wir 6 elementare Aussagen haben, aus denen sich die anderen Aussagen zusammensetzen, ergeben sich
insgesamt 26 = 64 Möglichkeiten.
Wir stellen fest, dass es nur eine Möglichkeit gibt, in der alle zusammengesetzten Aussagen
richtig sind: Anton raucht nicht, Bruno raucht, Christa raucht, Dora raucht nicht, Emil raucht,
Fridolin raucht nicht.
Darüberhinaus benötigen wir zwei Quantoren.
∀ heißt für alle
∃ heißt es existiert ein
Wenn wir eine zusammengesetzte Aussage haben, in der auch Quantoren vorkommen, und wir zur Verneinung dieser Aussage übergehen wollen, dann kehren sich
1.3. DAS AXIOMENSYSTEM VON ZERMELO-FRAENKEL
19
die logischen Symbole um.
Es gibt eine Stadt, in der alle Häuser rot oder grün sind.
∃ S ∀ H : (H ist rot) ∨ (H ist grün)
Als Verneinung erhalten wir
∀ S ∃ H : (H ist nicht rot) ∧ (H ist nicht grün)
In jeder Stadt gibt es ein Haus, das weder rot noch grün ist.
Über die Jahrhunderte gab es immer Versuche, die Existenz Gottes mit der Logik
nachzuweisen. Hier nun die Argumentation von Anselm von Canterbury (10331109). Er interpretiert Gott als etwas, worüber hinaus nichts Größeres gedacht
werden kann. Statt größer kann man auch vollkommener sagen.
Er nimmt an, dass es Gott nicht gibt. Es existiert also das, worüber hinaus
nichts Größeres gedacht werden kann, nicht in Wirklichkeit, sondern nur in unserer
Vorstellung. Hieraus folgt, dass es zu jeder Vorstellung eine größere gibt, die auch
existiert. Dies ist ein Widerspruch.
Andere Gottesbeweise stammen von René Descartes (1596-1650) und Kurt Gödel
(28.4.1906-14.1.1978).
1.3
Das Axiomensystem von Zermelo-Fraenkel
Georg Ferdinand Ludwig Philipp Cantor wurde am 19. Februar 1845 in Sankt Petersburg geboren
und er starb am 6. Januar 1918 in Halle an der Saale. Er ist der Begründer der Mengenlehre. Er
war auch an Philosohie und Literatur interessiert. So versuchte er nachzuweisen, dass die Werke
von Shakespeare von Francis Bacon geschrieben worden sind.
Seit 1884 war er wegen einer manisch-depressiven Erkrankung in psychiatrischer Behandlung.
Auf dem internationalen Mathematiker Kongress 1904 bewies Julius König, dass die Mächtigkeit
des Kontinuums nicht unter den von Cantor eingeführten Kardinalzahlen vorkommt, was die Mengenlehre in Frage stellen würde. Cantor fühlte sich gekränkt. Am darauffolgenden Tag zeigte Ernst
Zermelo, dass der Beweis von König falsch war. Dies half Cantor nicht, die Kränkung zu vergessen.
Ernst Friedrich Ferdinand Zermelo wurde am 27. Juli 1871 in Berlin geboren und starb am
21. Mai 1953 in Freiburg im Breisgau.
Adolf Abraham Halevi Fraenkel wurde am 17. Februar 1891 in München geboren und er
starb am 15. Oktober 1965 in Jerusalem. Er promovierte und habilitierte sich an der Universität
Marburg. Er bekam 1928 eine Ruf an die Universität Kiel. Er war 1929 und 1930 Gastprofessor
an der Hebräischen Universität in Jerusalem. 1933 wird er in Kiel beurlaubt, weil er Jude ist. Er
kehrt an die Hebräische Universität zurück, an der er 1938 Rektor wird.
Georg Cantor (1845-1918) hat Ende des 19. Jahrhunderts die Mengenlehre
begründet. Er definiert eine Menge als eine Gesamtheit von wohlunterschiedenen
Objekten des Denkens und der Wahrnehmung. Die Objekte werden als Elemente
und die Gesamtheit als Menge bezeichnet. Falls x ein Element einer Menge M ist,
so schreiben wir
x∈M
20
CHAPTER 1.
Cantor hat drei Axiome verwendet, ohne diese explizit aufzuführen:
Axiomensystem von Cantor
(i) Zwei Mengen sind gleich, wenn sie dieselben Elemente besitzen.
(ii) Für jede Eigenschaft gibt es eine Menge, deren Elemente genau diese Eigenschaft erfüllen.
Unter einer Eigenschaft verstehen wir eine Aussage der mathematischen Logik,
die die Elemente betrifft. Wir schreiben auch für die Menge
{x|φ(x)}
falls φ die fragliche Eigenschaft ist.
(iii) Auswahlaxiom (dies wird später definiert.)
Die Vereinigung von zwei Mengen A und B ist
A ∪ B = {x| x ∈ A ∨ x ∈ B}
und von einer Menge von Mengen A
[
A = {x|∃A ∈ A : x ∈ A}
A∈A
Der Durchschnitt von zwei Mengen A und B ist
A ∩ B = {x| x ∈ A ∧ x ∈ B}
und einer Menge von Mengen A
\
A = {x|∀A ∈ A : x ∈ A}
A∈A
Wir sagen, dass A Teilmenge von B ist, wenn für alle x ∈ A gilt, dass x ∈ B. Wir
schreiben dann A ⊆ B. Das Komplement einer Teilmenge A einer Menge M ist
Ac = {x ∈ M | ¬(x ∈ A)} = {x ∈ M | x ∈
/ A}.
Lemma 1.3.1 (Formel von De Morgan) (i) Es sei K eine Menge und M eine
Menge von Mengen mit M ⊆ K. Dann gilt
!c
\
[
M
=
M c,
M ∈M
M ∈M
c
wobei M das Komplement von M in K ist.
(ii) Es seien M ∈ M Teilmengen einer Menge K
!c
[
\
M
=
Mc
M ∈M
wobei M c das Komplement von M in K ist.
M ∈M
1.3. DAS AXIOMENSYSTEM VON ZERMELO-FRAENKEL
21
Beweis. (i)
!c
\
M ∈M
M
= ({x ∈ K|∀M ∈ M : x ∈ M })c
= {x ∈ K|¬(∀M ∈ M : x ∈ M )}
= {x ∈ K|∃M ∈ M : x ∈
/ M}
[
[
=
{x ∈ K|x ∈
/ M} =
Mc
M ∈M
M ∈M
2
Bertrand Russell (1872-1970, mit vollem Namen: Bertrand Arthur William Russell, 3rd Earl Russell of Kingston Russell, Viscount Amberley of Amberley and of
Ardsalla) wies mit einem einfachen Beispiel nach, dass das Axiom (ii) zu Widersprüchen führt. Er fand das folgende nach ihm benannte Paradoxon. Als Eigenschaft
einer Menge M betrachten wir
M ist nicht Element von sich selbst.
Gemäß (ii) müsste es also eine Menge A geben, deren Elemente aus denjenigen
Mengen M bestehen, die nicht Element von sich selbst sind. Dies führt sofort zu
einem Widerspruch: Ist A Element von sich selbst?
Falls A nicht Element von sich selbst ist, dann muss A gemäß der Eigenschaft
Element von sich selbst sein. Umgekehrt, falls A Element von sich selbst ist, dann
muss A die Eigenschaft erfüllen, dass A nicht Element von sich selbst ist. Man
kommt in jedem Fall zu einem Widerspruch.
Eine vergleichbare Paradoxie ist der folgende Satz: Ich lüge immer. Wenn ich
immer lüge, dann ist der Satz gelogen und ich sage manchmal die Wahrheit. Dies
widerspricht dem Satz.
Das Axiomensystem von Cantor ist weiterentwickelt worden, um solche Widersprüche auszuschließen. Es gibt heute mehrere Systeme, die man als vernünftig
erachtet. Wir wollen hier das System von Zermelo-Fraenkel benutzen.
Wie von Cantor eingeführt, haben wir zwei binäre Verknüpfungen ∈ und =.
x∈M
bedeutet, dass x ein Element, M eine Menge und x Element von M ist. Falls M
und K zwei Mengen sind, bedeutet
M =K
dieselbe Menge sind. Es gelten die folgenden Axiome:
Axiom 1.3.1 (Axiomensystem von Zermelo-Fraenkel)
(i) Falls zwei Mengen dieselben Elemente besitzen, dann sind sie gleich.
(∀x : x ∈ M ⇔ x ∈ K) ⇒ M = K
22
CHAPTER 1.
(ii) Es gibt eine Menge, die keine Elemente enthält. Wir bezeichnen diese Menge
als Nullmenge ∅.
(iii) Es gibt eine Menge M , so dass ∅ ∈ M und so dass für alle x ∈ M auch {x} ∈ M
gilt.
Hierbei bezeichnet {x} die Menge, die nur aus dem Element x besteht.
(iv) (Potenzmenge) Für jede Menge M existiert die Menge P(M ), die aus allen
Teilmengen von M besteht. Wir nennen P(M ) die Potenzmenge von M .
(v) Es sei M eine S
Menge, deren Elemente wiederum aus Mengen bestehen. Dann
gibt es eine Menge M , die aus allen Elementen der Elemente von M besteht. Wir
nennen diese Menge die Vereinigungsmenge.
(vi) (Regularität) Falls M eine nichtleere Menge ist, dann gibt es ein x ∈ M , so
dass
x∩M =∅
In Quantorenschreibweise
M 6= ∅ =⇒ ∃x : x ∈ M ∧ (∀y : y ∈ x ⇒ y ∈
/ M)
(vii) Falls φ eine Eigenschaft ist und M eine Menge, dann gibt es eine Menge, die
aus genau den x, x ∈ M , besteht, die die Eigenschaft φ erfüllen.
{x|x ∈ M ∧ φ(x)}
(viii) (Ersetzung )Es sei φ eine Eigenschaft, die von zwei Mengen M und K abhängt.
Wir nehmen an, dass es für jedes x ∈ M genau ein y ∈ K gibt, so dass φ(x, y) gilt.
Dann gibt es eine Menge
{y|∃x ∈ M : φ(x, y)}
(ix) (Auswahlaxiom) Es sei M eine Menge paarweise disjunkter, nichtleerer Mengen. Dann gibt es eine Menge A mit folgender Eigenschaft: Jedes Element von A
ist Element einer der Mengen M und für jedes M ∈ M gibt es genau ein x ∈ M
mit x ∈ A. Wir nennen A die Auswahlmenge.
In (iii) beachte man, dass immer ∅ ⊆ M gilt. Hier wird aber gefordert, dass
∅ ∈ M.
Einige Bemerkungen zum Axiom (vi). Die Bedingung x∩M ist nicht mit {x}∩M
zu verwechseln. Offenbar haben wir {x} ∩ M = {x}. Der Durchschnitt ist also nie
leer.
Falls es ein Element x ∈ M gibt, das selbst keine Menge ist, so folgt x ∩ M = ∅.
Die Menge M = {1, 2, {1, 2}} liefert ein Beispiel dafür, dass es ein x ∈ M geben
kann, so dass x ∩ M 6= ∅. Wir wählen x = {1, 2}. Wir erhalten dann
x ∩ M = {1, 2} ∩ {1, 2, {1, 2}} = {1, 2}
Mit Hilfe von Axiom (vi) können wir das folgende Lemma beweisen.
1.4. RELATION UND ORDNUNG
23
Lemma 1.3.2 Es sei M eine Menge. Dann gilt M ∈
/ M.
Beweis. Wir nehmen an, dass M ∈ M gilt. Da M ∈ {M } gilt, folgt, dass
M ∈ M ∩ {M }
Das Axiom der Regularität besagt, dass es ein x ∈ {M } gibt mit
x ∩ {M } = ∅
Da {M } nur ein Element enthält, nämlich M , folgt x = M . Somit gilt M ∩{M } = ∅,
was der Aussage M ∈ M ∩ {M } widerspricht. 2
Die Frage, ob man das Auswahlaxiom zum Axiomensystem hinzufügen soll oder
nicht, ist sehr kontrovers dikutiert worden. Die Annahme des Auswahlaxioms ist
sehr hilfreich und eine große Anzahl von mathematischen Aussagen beruht darauf.
Andererseits erzeugt man dadurch auch solche bizarren Resultate wie das BanachTarski Paradoxon.
Gödel zeigte 1938, dass das Auswahlaxiom mit dem Axiomensytem von ZermeloFraenkel konsistent ist. Er zeigte, dass man jedes Paradoxon, das man aus dem
Auswahlaxiom erhält, so modifizieren kann, dass man es auch ohne das Auswahlaxiom erhält. Cohen zeigte 1963, dass die Verneinung des Auswahlaxiomes ebenso
konsistent mit dem Axiomensystem von Zermelo-Fraenkel ist.
Um eine Auswahlmenge anzugeben, muss man durch eine Formel oder Vorschrift
festlegen, welches Element man aus welcher Menge entnimmt. Dass man aus jeder
einzelnen Menge jeweils ein Element auswählen kann, reicht dazu nicht aus.
In einigen Fällen braucht man das Auswahlaxiom nicht, um die Existenz einer
Auswahlmenge sicherzustellen.
(a) Falls jedes M ∈ M nur ein einziges Element enthält.
(b) Falls M nur endlich viele M enthält.
(c) Falls jedes M ∈ M eine endliche Menge reeller Zahlen ist. Dann wählen wir
als x ∈ M das maximale Element.
Andererseits kann man zeigen, dass es eine Menge M gibt, so dass alle M ∈ M
nur aus zwei Elementen bestehen, und so dass sich ohne das Auswahlaxiom nicht
die Existenz einer Auswahlmenge herleiten liesse.
1.4
Relation und Ordnung
Es seien M und K Mengen. Dann heißt die Menge der geordneten Paare
M × K = {(x, y)|x ∈ M ∧ y ∈ K}
das Cartesische Produkt von M und K.
24
CHAPTER 1.
Eine Relation R auf M ist eine Teilmenge von M × M . Wir sagen, dass x in
Relation zu y steht, wenn (x, y) ∈ R. Ein typisches Beispiel für eine Relation ist die
Relation ≤ auf den reellen Zahlen.
Die Relation x ≤ y
x
x=y
y
Wir sagen, dass
(i) R reflexiv ist, falls für alle x ∈ M gilt, dass xRx.
(ii) R symmetrisch ist, falls für alle x, y ∈ M mit xRy auch yRx gilt.
(iii) R transitiv ist, falls für alle x, y, z ∈ M mit xRy und yRz auch xRz gilt.
Eine Relation heißt Äquivalenzrelation, falls sie reflexiv, symmetrisch und transitiv ist. Es sei M eine Menge mit der Äquivalenzrelation ∼. Es sei y ∈ M . Dann
heißt
[y] = {x|x ∼ y}
Äquivalenzklasse.
Eine Relation R heißt antisymmetrisch, falls für alle (x, y) mit (x, y) ∈ R und
(y, x) ∈ R folgt, dass x = y.
Eine Funktion von einer Menge M in eine Menge K ist eine Teilmenge f von
M × K, so dass für alle x ∈ M genau ein y ∈ K existiert mit (x, y) ∈ f . Dafür
schreiben wir auch f : M → K und f (x) = y.
Wir sagen, dass eine Funktion surjektiv ist, falls für alle y ∈ K ein x ∈ M mit
f (x) = y existiert. Wir schreiben auch f (M ) = K.
f ist injektiv , falls für alle x, y ∈ M mit f (x) = f (y) gilt, dass x = y.
f ist bijektiv bzw. eine Bijektion, falls f injektiv und surjektiv ist.
Eine Relation R auf M ist eine Halbordnung, falls sie reflexiv, antisymmetrisch
und transitiv ist.
Eine Halbordnung R ist eine Ordnung, falls für alle x, y ∈ M gilt, dass
(x, y) ∈ R
oder
x=y
oder
(y, x) ∈ R
Wir schreiben für eine Menge mit einer Halbordnung oder Ordnung auch (M, ≤).
Wir schreiben x ≤ y, wenn der Gleichheitsfall x = y eingeschlossen ist, und wir
schreiben x < y, wenn der Gleichheitsfall ausgeschlossen ist.
1.4. RELATION UND ORDNUNG
25
Als Beispiel für eine Menge mit einer Halbordnung, die keine Ordnung ist, lässt
sich das folgende angeben. Wir betrachten die Menge aller Tupel reeller Zahlen
{(s, t)|s, t ∈ R} mit der Halbordnung
(s, t) ≤ (u, v)
falls s ≤ u und t ≤ v
Dies ist keine Ordnung, weil (1, 0) und (0, 1) nicht vergleichbar sind, d.h. das eine
ist nicht kleiner als das andere und umgekehrt.
Eine Wohlordnung ist eine Ordnung mit der Eigenschaft, dass jede nichtleere
Teilmenge K von M ein kleinstes Element besitzt, d.h.es gibt ein x ∈ K, so dass
für alle y ∈ K gilt, dass x ≤ y. Dieses Element ist eindeutig.
Die übliche ≤ Relation auf den reellen Zahlen ist eine Ordnung aber keine
Wohlordnung. Dies liegt daran, dass die Menge
{x ∈ R|0 < x}
kein minimales Element besitzt. K sei eine Teilmenge einer Menge mit einer Halbordnung. Wir sagen, dass x ∈ K ein minimales (maximales) Element von K ist,
falls x ∈ K und für alle y ∈ K gilt, dass y ≮ x (x ≮ y). Minimale und maximale Elemente sind nicht notwendig eindeutig. Ausserdem folgt aus x ≮ y nicht notwendig
y ≤ x.
x ist eine untere (obere) Schranke von K, falls für alle y ∈ K gilt, dass
x < y oder x = y
x > y oder x = y.
Falls M eine Teilmenge K enthält, die mit der Halbordnung von M eine geordnete
Menge ist, dann nennen wir K eine Kette.
Lemma 1.4.1 Die folgenden Aussagen sind äquivalent.
(i) (Auswahlaxiom) Es sei M eine Menge paarweise disjunkter, nichtleerer Mengen.
Dann gibt es eine Menge A mit folgender Eigenschaft: Jedes Element von A ist
Element einer der Mengen M ∈ M und für jedes M ∈ M gibt es genau ein x ∈ M
mit x ∈ A.
(ii) (Hausdorffs Maximum Prinzip) Jede Menge mit einer Halbordnung enthält eine
maximale Kette (d.h. eine Kette, die in keiner echten Teilmenge einer anderen
Kette enthalten ist).
(iii) (Zorns Lemma) Jede nichtleere Menge mit einer Halbordnung, in der jede Kette
eine obere Schranke hat, hat ein maximales Element.
(iv) Man kann jede Menge wohlordnen.
Die natürlichen Zahlen sind in ihrer natürlichen Ordnung wohlgeordnet, das gilt
jedoch nicht für die reellen Zahlen. Lemma 1.4.1 versichert nur, dass es auf den
reellen Zahlen eine Wohlordnung gibt, es liefert kein Konstruktionsverfahren für
eine solche Wohlordnung. Eine solche Wohlordnung ist sehr schwer vorstellbar.
Beweis. (ii) ⇒ (iii) : Nach (ii) gibt es eine maximale Kette K in M . Nach
Annahme von (iii) hat diese Kette eine obere Schranke s. Wir behaupten nun, dass
26
CHAPTER 1.
s ein maximales Element von M ist. Falls dem nicht so wäre, so gibt es ein s0 mit
s < s0 . Damit ist aber
K ∪ {s0 }
eine Kette, die K als echte Teilmenge enthält. Also ist K nicht maximal. Dies ist
ein Widerspruch.
(iv) ⇒ (i) : Wir betrachten die Vereinigungsmenge
[
M.
M ∈M
Diese
Menge enthält alle M ∈ M als Teilmengen. Nach (iv) können wir die Menge
S
M ∈M M wohlordnen. Da jede Teilmenge ein kleinstes Element hat, hat insbesondere auch jedes M ∈ M ein kleinstes Element xM . Als Auswahlmenge nehmen wir
nun
{xM |M ∈ M}.
2
1.5
Die natürlichen Zahlen N
Giuseppe Peano wurde am 27. August 1858 in Spinetta geboren und er starb am 20. April 1932
in Turin.
Wir wollen nun die natürlichen Zahlen so einführen, wie Zermelo dies getan hat.
Aus Axiom (ii) folgt, dass die leere Menge ∅ existiert und aus Axiom (iii) folgt, dass
es eine Menge M gibt, so dass ∅ ∈ M und so dass {x} ∈ M , falls x ∈ M . Dies
bedeutet, dass
(1.1)
∅, {∅}, {{∅}}, {{{∅}}}, . . .
Elemente von M sind. Diese Elemente kann man zur Definition der natürlichen
Zahlen N benutzen. Hierbei bezeichnen wir das Element ∅ mit 0, das Element {∅}
nennen wir 1, etc.
Dann definieren wir
N = {1, 2, 3, · · · }
N0 = {0, 1, 2, 3, · · · }.
Wir sagen, dass n der unmittelbare Nachfolger von m ist, falls {m} = n.
John von Neumann hat vorgeschlagen, die Mengen
(1.2)
{∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, . . .
zur Einführung der natürlichen Zahlen zu benutzen. In diesem Fall bezeichnen wir
{∅} mit 1, {∅, {∅}} mit 2, {∅, {∅}, {{∅}}} mit 3 u.s.w.. Die Menge
∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, . . .
1.5. DIE NATÜRLICHEN ZAHLEN N
27
bezeichnen wir als die um die 0 erweiterten natürlichen Zahlen N0 . Hierbei bezeichnen wir ∅ mit 0.
Wir sagen, dass m ∈ N0 unmittelbarer Nachfolger von n ∈ N0 ist, wenn m =
{0, . . . , n}. 1 ist der unmittelbare Nachfolger von 0, 2 von 1, 3 von 2, u.s.w..
Peano hatte ein Axiomensystem für die natürlichen Zahlen vorgeschlagen. Dieses
Axiomensystem sichert Existenz und elementare Eigenschaften der natürlichen Zahlen.
Diese Eigenschaften lassen sich auch aus dem Axiomensystem von Zermelo-Fraenkel
herleiten.
Lemma 1.5.1 (Axiomensystem von Peano) Die erweiterten, natürlichen Zahlen
haben die folgenden Eigenschaften.
(i) 0 ∈ N0
(ii) Jedes n ∈ N0 hat einen genau einen unmittelbaren Nachfolger n0 .
(iii) 0 ist kein unmittelbarer Nachfolger einer natürlichen Zahl.
(iv) Natürliche Zahlen mit demselben unmittelbaren Nachfolger sind gleich.
(v) Falls M eine Teilmenge von N0 ist, so dass 0 ∈ M und falls mit jedem m ∈ M
auch der unmittelbare Nachfolger in M ist, dann gilt M = N0 .
Hieraus lässt sich herleiten:
Lemma 1.5.2 Die erweiterten, natürlichen Zahlen haben die folgenden Eigenschaften.
(i) Jedes n ∈ N0 hat genau einen unmittelbaren Nachfolger.
(ii) Jedes n ∈ N ist unmittelbarer Nachfolger von genau einem m ∈ N0 .
(iii) Für alle m, n ∈ N0 , deren unmittelbare Nachfolger gleich sind, gilt n = m.
(iv) Für alle n ∈ N0 gilt, dass 0 nicht unmittelbarer Nachfolger von n ist.
(v) Falls M eine Teilmenge von N0 ist, so dass 0 ∈ M und falls mit jedem m ∈ M
auch der unmittelbare Nachfolger in M ist, dann gilt M = N0 .
Wir definieren Addition und Multiplikation natürlicher Zahlen. Es sei k ∈ N0 .
Dann bezeichnet k 0 den unmittelbaren Nachfolger von k. Wir setzen für alle n, m ∈
N0
0+n
m0 + n
=n
= (n + m)0
0·n=0
m0 · n = m · n + n
Es seien n, m ∈ N0 . Wir sagen, dass n ≤ m gilt, wenn ein k ∈ N0 mit n + k = m
existiert.
Lemma 1.5.3 (N0 , ≤) ist eine wohlgeordnete Menge.
Lemma 1.5.4 Die Addition in N0 erfüllt folgende Eigenschaften.
(i) (Assoziativität) Für alle m, n, p ∈ N0 gilt
m + (n + p) = (m + n) + p
28
CHAPTER 1.
(ii) (Kommutativität) Für alle m, n ∈ N0 gilt
m+n=n+m
(iii) Für alle m, n, p ∈ N0 gilt
p+m=p+n
⇔
m=n
⇔
m≤n
(iv) Für alle m, n, p ∈ N0 gilt
p+m≤p+n
(v) Für alle m, n ∈ N0 mit m ≤ n gibt es ein p ∈ N0 mit
m+p=n
(vi) Für alle m, n ∈ N0 mit m + n = 0 gilt m = 0 = n.
Beweis. (i) Es seien n, p ∈ N und
M = {m ∈ N0 |m + (n + p) = (m + n) + p}
Offensichtlich gilt, dass 0 ∈ M . Nun prüfen wir nach, dass mit m ∈ M auch der
Nachfolger m0 von m in M liegt. Da m ∈ M , folgt
m0 +(n+p) = (m+(n+p))0 = ((m+n)+p)0 = (m+n)0 +p = (m+n)0 +p = (m0 +n)+p
Nun wenden wir Lemma 1.5.1 auf M an und erhalten M = N0 .
(v) Es seien m, n ∈ N0 mit m ≤ n. Wir betrachten
M = {k ∈ N0 |k + m ≥ n}
M ist nicht leer, weil n ∈ M . Da N0 wohlgeordnet ist, hat M ein kleinstes Element
p. Falls p + m = n gilt, ist der Beweis beendet. Falls nicht, so gilt
p+m>n
Es folgt, dass p 6= 0. Nach Lemma 1.5.1 ist p Nachfolger eines Elementes q. Es gilt
also q 0 = p und
n < q 0 + m = (q + m)0
Hieraus folgt
n≤q+m
Somit gilt q < p und deshalb q ∈ M . Dies ist ein Widerspruch, also ist unsere
Annahme, dass p + m 6= n gilt, falsch. 2
1.5. DIE NATÜRLICHEN ZAHLEN N
29
Lemma 1.5.5 Die Multiplikation in N0 erfüllt die folgenden Eigenschaften.
(i) (Assoziativität) Für alle m, n, p ∈ N0 gilt
m(np) = (mn)p
(ii) (Kommutativität) Für alle m, n ∈ N0 gilt
mn = nm
(iii) (Distributivität) Für alle m, n, p ∈ N0 gilt
m(n + p) = mn + mp
und
(n + p)m = nm + pm
(iv) Für alle m, n, p ∈ N0 mit p 6= 0 gilt
⇐⇒
m<n
pm < pn
(vi) Für alle m, n ∈ N0 mit mn = 0 gilt
m=0
oder
n=0
Definition 1.5.1 Eine natürliche Zahl heißt Primzahl, wenn sie größer oder gleich
2 ist und nur durch 1 oder sich selbst ganzzahlig teilbar ist.
Beispiel 1.5.1 Es gibt unendlich viele Primzahlen.
Beweis. Wir nehmen an, es gäbe nur endlich viele Primzahlen
p1 , . . . , p n
Wir behaupten nun, dass
n
Y
!
pi
+1
i=1
auch eine Primzahl ist. Wenn dem so ist, dann sind wir fertig. Wir nehmen nun an, das es keine
Primzahl ist. Dann gibt es zwei Zahlen k und p mit
!
!
n
n
Y
Y
1 < k, p <
pi + 1 und kp =
pi + 1
i=1
Wir betrachten die Menge
( k 1 < k, p <
n
Y
i=1
i=1
!
pi
+ 1 ∧ ∃p : kp =
n
Y
!
pi
)
+1
i=1
Diese Menge hat ein kleinstes Element k0 . k0 ist eine Primzahl, anderfalls wäre sie nicht das
kleinste Element. Also gilt k0 = pi0 für ein i0 mit 1 ≤ i0 ≤ n und
!
n
Y
pi0 p =
pi + 1
i=1
30
CHAPTER 1.
Wir setzen nun
p̃ =
n
Y
pi
i=1
i6=i0
Dann gilt p̃ < p und
pi0 p = pi0 p̃ + 1
Da p̃ < p gibt es ein p̃˜ ≥ 1 mit
˜ = pi0 p̃ + 1
pi0 (p̃ + p̃)
Es folgt, dass
pi0 p̃˜ = 1
und damit
pi0 = 1
Dies ist ein Widerspruch. Satz 1.5.1 Es sei n ∈ N. Dann gibt es m ∈ N, paarweise verschiedene Primzahlen
p1 , . . . , pm und k1 , . . . , km ∈ N mit
n=
m
Y
k
pj j
j=1
Beispiel 1.5.2 Die Zahlen 2n − 1, n ∈ N, werden Marsenne-Zahlen genannt. Es ist eine offenes
Problem, ob es unendlich viele Marsenne-Primzahlen gibt. Man weiss, dass n eine Primzahl sein
muss, falls 2n − 1 eine Primzahl ist. Man weiss nicht, ob es unendlich viele Primzahlen n gibt, so
dass 2n − 1 keine Primzahl ist.
Wir definieren
0! = 1
n! = n · (n − 1)!
und
n
n!
=
k
k!(n − k)!
Falls n ∈ N0 und k ∈ N, dannn schreiben wir
nk := |n · n{z· · · n}
k
Für n ∈ N0 setzen wir n0 = 1. Es gilt also insbesondere 00 = 1.
Gegen Ende der der 1630er Jahre notierte Pierre de Fermat auf dem Rand einer
Buchseite, dass er einen wunderbaren Beweis für die folgende Behauptung gefunden
habe: Es sei n ∈ N mit n ≥ 3. Dann gilt für alle x, y, z ∈ N
xn + y n 6= z n
Mitte der 90er Jahre wurde dies von Andrew Wiles bewiesen.
1.6. DIE GANZEN ZAHLEN Z
1.6
31
Die ganzen Zahlen Z
Wir erhalten die ganzen Zahlen, wenn wir zu N0 die negativen Zahlen hinzunehmen.
1.7
Die rationalen Zahlen Q
Wir betrachten das Cartesische Produkt Z × {Z \ {0}}. Für (p, q) schreiben wir
auch pq . Wir führen auf dieser Menge eine Äquivalenzrelation ein. Wir sagen, dass
t
p
∼
q
r
gilt, wenn pr = qt gilt. Die rationalen Zahlen Q ist die Menge der Äquivalenzklassen
p
p
r r
=
.
∼
q
t t
q
Hiermit stellen 21 und 24 dieselbe rationale Zahl dar.
Wir definieren zwei Verknüpfungen, Addition und Multiplikation auf den rationalen Zahlen:
h i u
pw + qu
p
+
=
q
w
qw
h i pu
p u
=
q w
qw
Lemma 1.7.1 (i) Addition und Multiplikation auf den rationalen Zahlen sind wohldefiniert.
(ii) Addition und Multiplikation sind kommutativ.
Beweis. (i) Wir zeigen, dass die Addition wohldefiniert ist. Dazu müssen wir
zeigen, dass die Addition nicht von der Wahl des Repräsentanten abhängt.
Es seien x, y ∈ Q und pq11 , rt11 ∈ x und pq22 , rt22 ∈ y jeweils zwei Repräsentanten. Wir
müssen zeigen, dass
p1 q2 + p2 q 1
r1 t2 + r2 t1
∼
,
q1 q2
t1 t2
bzw.
(1.3)
(p1 q2 + p2 q1 )t1 t2 = (r1 t2 + r2 t1 )q1 q2 .
Da
r1 q1 = t1 p1
r2 q2 = t2 p2
folgt aus
p1 q2 t1 t2 + p2 q1 t1 t2 = p1 q2 t1 t2 + p2 q1 t1 t2
32
CHAPTER 1.
die Gleichung
p1 q2 t1 t2 + p2 q1 t1 t2 = r1 t2 q1 q2 + r2 t1 q1 q2 .
und damit (1.3).
(ii) Wir zeigen, dass die Addition kommutativ ist.
h i h i p
u
pw + qu
wp + uq
u
p
+
=
=
=
+
q
w
qw
wq
w
q
2
Wir führen auf Q eine Ordnung ein. Wir sagen, dass x ∈ Q die Ungleichung
0 ≤ x erfüllt, wenn es n ∈ N0 und m ∈ N mit
hni
x=
m
gibt. Wir sagen, dass x, y ∈ Q die Ungleichung x ≤ y erfüllen, wenn 0 ≤ y − x.
Lemma 1.7.2 Für alle rationalen Zahlen x, y ∈ Q mit x < y gibt es eine rationale
Zahl z ∈ Q mit x < z < y.
Beweis. Wir wählen z = 21 (x + y). Dann gilt
1
1
1
x = (x + x) < (x + y) < (y + y) = y.
2
2
2
2
1.8
Körper
Definition 1.8.1 Eine Menge K mit zwei Verknüpfungen +, · und mit mindestens
zwei Elementen bildet einen Körper (K, +, ·), wenn für alle x, y ∈ K die Verknüpfungen
x+y ∈K
x·y ∈K
eindeutig definiert sind und wenn für alle x, y, z ∈ K die folgenden Eigenschaften
gelten.
(i) x + y = y + x
(ii) (x + y) + z = x + (y + z)
(iii) Es gibt ein Element 0 ∈ K, so dass für alle x ∈ K die Gleichung x + 0 = x gilt.
(iv) Zu jedem Element x ∈ K gibt es ein Element −x ∈ K, so dass x + (−x) = 0
gilt.
(v) xy = yx
(vi) (xy)z = x(yz)
1.8. KÖRPER
33
(vii) Es gibt ein Element 1 ∈ K, so dass 1 6= 0 und so dass für alle x ∈ K gilt, dass
1 · x = x.
(viii) Für alle x ∈ K mit x 6= 0 gibt es ein Element
1
x
∈ K mit x ·
1
x
= 1.
(ix) (x + y)z = xz + yz
Beispiel 1.8.1 (i) N und Z bilden mit der üblichen Addition und Multiplikation keinen Körper.
Es gibt i.A. keine multiplikativen inversen Elemente.
(ii) (Q, +, ·) ist ein geordneter Körper.
(iii) K = {0, 1} ist mit den folgenden Verknüpfungen ein Körper.
0+0=0
0+1=1
1+1=0
0·0=0
0·1=0
1·1=1
Beweis. (ii) Die Addition ist kommutativ.
h i h i p
ps + qr
sp + rq
p
r
r
=
+
+
=
=
q
s
qs
sq
s
q
Die Addition ist assoziativ.
h i r
t
p
+
+
q
s
u
ps + qr
t
(ps + qr)u + qst
+
=
qs
u
qsu
h i psu + q(ru + st)
t
p
r
=
+
=
+
qsu
q
s
u
0
Als das neutrale additive Element wählen wir 1 . Es gilt
p
0
p
+
=
q
1
q
h i
h i
Als das inverse additive Element zu pq wählen wir −p
q . Dann gilt
=
−p
0
p
+
=
q
q
q·q
Die Multiplikation ist kommutativ.
h i h i p r
pr
rp
r p
=
=
=
q s
qs
sq
s q
Das neutrale, multiplikative Element ist [ 11 ]. 2
Lemma 1.8.1 Es sei (K, +, ·) ein Körper und x ∈ K. Dann sind die additiven und
multiplikativen, inversen Elemente zu x eindeutig. Weiter gelten x = −(−x) und
x = (x−1 )−1 .
Beweis. Wir nehmen an, dass es ein x ∈ K gibt, das zwei verschiedene, additive
Inverse y und z besitzt. Dann gilt
x + y = 0 = x + z.
34
CHAPTER 1.
Nun addieren wir y auf beiden Seiten der Gleichung
y+x+y =y+x+z
also
y = z.
Die Gleichung x = −(−x) folgt aus der Eindeutigkeit der additiven Inversen. 2
Wir erinnern daran, dass x < y bedeutet, dass x ≤ y und x 6= y gelten.
Definition 1.8.2 Ein Körper (K, +, ·) mit einer Ordnung ≤ heißt geordneter Körper,
falls gelten:
(i) Für alle x, y, z ∈ K mit x < y gilt x + z < y + z.
(ii) Für alle x, y, z ∈ K mit x < y und 0 < z gilt, dass x · z < y · z.
(Q, +, ·) ist mit der üblichen ≤-Ordnung ein geordneter Körper. Der Absolutbetrag von x ∈ K ist durch

falls x > 0

 x
0
falls x = 0
|x| =


−x
falls x < 0
definiert.
Lemma 1.8.2 Es sei (K, +, ·, ≤) eine geordneter Körper mit Ordnung ≤.
(i) Es gilt genau dann x > 0, wenn −x < 0.
(ii) Für alle x ∈ K gilt |x| = | − x|.
Beweis. (i) Es sei x > 0. Es folgt aus 0 < x
−x < (−x) + x = 0
Also gilt −x < 0.
(ii) Es gilt


−x
0
| − x| =

−(−x)
Wegen x = −(−x)
2

 −x
0
| − x| =

x
falls − x > 0
falls x = 0
falls − x < 0
falls − x > 0
falls x = 0
falls − x < 0
1.8. KÖRPER
35
Lemma 1.8.3 Es sei (K, +, ·, ≤) ein geordneter Körper. Für alle x, y ∈ K gelten
(i) x ≤ |x|
(ii) |x| = 0 genau dann, wenn x = 0.
(iii) (Dreiecksungleichung) |x + y| ≤ |x| + |y|
(iv) 0 · x = 0
(v) (Inverse Dreiecksungleichung) ||x| − |y|| ≤ |x + y|
Beweis. (i) Wir haben drei Fälle. Falls x > 0, dann gilt nach Definition x = |x|.
Falls x = 0, dann folgt |x| = 0 = x. Falls x < 0, dann gilt |x| = −x. Im letzten Fall
müssen wir zeigen, dass 0 < −x, falls x < 0. Dies gilt wegen Lemma 1.8.2.
(ii) folgt direkt aus der Definition des Absolutbetrages.
(iii) Wir haben wiederum drei Fälle. Falls x + y > 0, dann gilt
|x + y| = x + y
Wegen (i) folgt nun
|x + y| = x + y ≤ |x| + |y|
Falls x + y = 0, dann folgt wieder wegen (i)
|x + y| = 0 = x + y ≤ |x| + |y|
Falls x + y < 0, dann gilt
|x + y| = −(x + y) = (−x) + (−y) ≤ | − x| + | − y| = |x| + |y|
(iv) Mit −(x · 0) bezeichnen wir das additive inverse Element zu x · 0. Dann gilt
0 = x · 0 + (−(x · 0)) = x(0 + 0) + (−(x · 0)) = x · 0 + x · 0 + (−(x · 0)) = x · 0.
(v) Mit der Dreiecksungleichung folgt
|(x + y) − y| ≤ |x + y| + |y|.
Also gilt
|x| − |y| ≤ |x + y|.
Nun vertauschen wir die Rollen von x und y und erhalten
|y| − |x| ≤ |x + y|.
Aus beiden Ungleichungen folgt
||x| − |y|| ≤ |x + y|.
2
36
CHAPTER 1.
Definition 1.8.3 Ein geordneter Körper (K, +, ·, ≤) heißt archimedisch, wenn für
alle x, y ∈ K mit 0 < x < y ein n ∈ N existiert, so dass
y≤x
· · · + x} .
| + x{z
n
Lemma 1.8.4 (Archimedes, 287-212 v. Chr.) (Q, +, ·, ≤) ist ein archimedischer
Körper.
Beweis. Es seien x, y ∈ Q mit 0 < x < y. Dann gibt es p, q, k, ` ∈ N mit
p
k
x=
und
y=
.
q
`
Wegen x < y gilt pl < kq. Wir wählen n = kq. Dann gilt
p
kp
x
| +x+
{z· · · + x} = kq q = 1 .
n
Wegen kp` ≥ k folgt
x
| +x+
{z· · · + x} ≥ y.
n
2
1.9
Supremum und Infimum
Definition 1.9.1 Es sei X eine Menge mit einer Ordnung ≤ und A sei eine Teilmenge von X. Ein Element x ∈ A heißt Maximum von A, falls x ∈ A und falls für
alle y ∈ A gilt y ≤ x.
Ein Element x ∈ A heißt Minimum von A, falls x ∈ A und falls für alle y ∈ A
gilt y ≥ x.
Definition 1.9.2 Es sei X eine Menge mit einer Ordnung ≤. Eine Teilmenge A
von X heißt nach oben beschränkt, wenn es ein c ∈ X gibt, so dass für alle x ∈ A
gilt x ≤ c. c heißt obere Schranke von A.
Eine Teilmenge A heißt nach unten beschränkt, wenn es ein c ∈ X gibt, so dass
für alle x ∈ A gilt c ≤ x. c heißt untere Schranke von A.
Das Supremum c einer Teilmenge A ist die kleinste, obere Schranke dieser Menge,
d.h. c ist obere Schranke von A und für alle oberen Schranken c0 von A gilt c ≤ c0 .
Das Infimum c einer Teilmenge A ist die größte, untere Schranke dieser Menge,
d.h. c ist untere Schranke von A und für alle unteren Schranken c0 von A gilt c ≥ c0 .
Falls eine Menge ein Maximum besitzt, dann ist das Maximum auch Supremum
dieser Menge. Ebenso ist das Infimum gleich dem Minimum, falls es existiert.
1.10. MATHEMATISCHE INDUKTION
37
Beispiel 1.9.1 Im folgenden betrachten wir Teilmengen von Q mit der üblichen Ordnung ≤.
(i) Die Teilmenge A = {q ∈ Q|q ≤ 1} von Q hat 1 als Maximum und Supremum.
(ii) Die Menge B = {q ∈ Q|q < 1} besitzt die kleinste obere Schranke 1. Die Menge B besitzt kein
Maximum.
(iii) Die Teilmenge C = {q ∈ Q|q 2 < 2} von Q besitzt weder Maximum noch Supremum in Q.
Beweis. (i) 1 ist Maximum, weil 1 ∈ A und weil für alle x ∈ A gilt x ≤ 1.
(ii) 1 ist obere Schranke von B. Wir müssen noch zeigen, dass es die kleinste, obere Schranke
ist. Wir nehmen an, dass 1 nicht die kleinste, obere Schranke ist. Dann gibt es ein q ∈ Q mit
q < 1, so dass für alle s ∈ B gilt s ≤ q. Nach Lemma 1.7.2 gibt es zu q und 1 ein r ∈ Q mit
q < r < 1. Dies kann nicht sein.
√
(iii) Anschaulich ist die Aussage klar: Falls C ein Supremum besitzt, dann müsste dies 2
√
sein. 2 ist aber keine rationale Zahl. Der vollständige Beweis ist unter Beispiel 2.10.3 geführt.
2
1.10
Mathematische Induktion
Die vollständige Induktion ist ein Beweisverfahren. Wir nehmen an, dass wir für
jedes n ∈ N eine Aussage A(n) haben, und wir wollen zeigen, dass alle diese Aussagen
richtig sind.
Es reicht nicht aus, ein paar Fälle, z.B. für n = 1, . . . , 10 die Aussagen A(n)
nachzuweisen. Hierzu das folgende Beispiel, das bereits von Leonhard Euler betrachtet wurde.
Beispiel 1.10.1 (i) Ist für alle n ∈ N die Zahl
n2 − n + 41
eine Primzahl?
Für n = 1, . . . , 11 erhalten wir die Zahlen 41, 43, 47, 53, 61, 71, 83, 97, 113, 131, 151. Dies sind
alles Primzahlen. Allerdings erhalten wir für n = 41 die Zahl 412 , was keine Primzahl ist.
(ii) Ist die Zahl nk − n für alle n ∈ N und alle ungeraden k ∈ N durch k ganzzahlig teilbar?
Man weiss, dass n3 − n durch 3 teilbar ist, n5 − n durch 5 und n7 − n durch 7. Man könnte
nun schließen bzw. vermuten, dass dies für alle ungeraden natürlichen Zahlen gilt. Dies ist nicht
der Fall, weil 29 − 2 = 510 und diese Zahl ist nicht durch 9 teilbar. (Kleiner Satz von Fermat:
Dies gilt, falls k eine Primzahl ist.)
Mathematische Induktion
(i) (Induktionsanfang) Wir beweisen, dass A(1) gilt.
(ii) (Induktionsschritt) Wir beweisen, dass unter der Annahme, dass A(n) gilt, auch
A(n + 1) gilt.
Nach Lemma 1.5.1 (v) haben wir dann für alle n ∈ N die Aussagen gezeigt.
Dieses Beweisprinzip gleicht Dominosteinen, die wir in einer Reihe aufstellen.
Wenn wir den ersten Dominostein anstoßen, kippt er gegen den nächsten, der dann
umkippt. In einer Welle fällt die gesamte Reihe.
Beispiel 1.10.2 Für alle n ∈ N ist die Zahl 23n − 1 durch 11 teilbar.
38
CHAPTER 1.
Beweis. Für n = 1 erhalten wir die Zahl 231 − 1 = 22, die durch 11 teilbar ist. Falls 23k − 1 durch
11 teilbar ist, dann ist auch
23k+1 − 1 = 23 · 23k − 1 = 22 · 23k + (23k − 1)
durch 11 teilbar. 2
Beispiel 1.10.3 Für alle k, ` ∈ N mit k < ` und für alle n ∈ N gilt
k n < `n .
Beweis. Der Induktionsanfang n = 1: k < `. Nun der Induktionsschritt. Wir nehmen an, dass
k n < `n .
Mit den Rechenregeln für die natürlichen Zahlen folgt
k n+1 < k · `n < `n+1 .
2
Beispiel 1.10.4 (i) Für alle n ∈ N gilt
n
X
k=
k=1
(ii) Für alle n ∈ N gilt
n
X
k2 =
k=1
(iii) Für alle n ∈ N gilt
n(n + 1)
.
2
1
n(n + 1)(2n + 1).
6
n
X
1
1
=1− n
j
2
2
j=1
Beweis. (i) Wir überprüfen A(1).
1=
1(1 + 1)
2
Wir nehmen an, dass A(n) wahr ist, also
n
X
k=1
k=
n(n + 1)
2
Nun zeigen wir, dass dann auch A(n + 1) wahr ist.
n+1
X
k=1
k=
n
X
k + (n + 1) =
k=1
n(n + 1)
(n + 1)(n + 2)
+ (n + 1) =
2
2
(ii) Der Induktionsanfang:
1
X
k=1
k2 = 1 =
1
1 · 2 · 3.
6
1.10. MATHEMATISCHE INDUKTION
39
Der Induktionsschritt
n+1
X
k
2
n
X
=
k=1
!
k
2
+ (n + 1)2 =
k=1
1
n(n + 1)(2n + 1) + (n + 1)2
6
1
1
(n + 1) {n(2n + 1) + 6n + 6} = (n + 1) 2n2 + 7n + 6 .
6
6
=
Wir beobachten
2n2 + 7n + 6 = (n + 2)(2n + 3) = (n + 2)(2(n + 1) + 1).
Es folgt
n+1
X
k2 =
k=1
1
(n + 1)(n + 2)(2(n + 1) + 1).
6
2
Beispiel 1.10.5 Für alle n ∈ N gilt
n
X
1
1
≤2−
2
k
n
(1.4)
k=1
Beweis. Wir zeigen den Induktionsanfang.
1
X
1
1
=1≤2− .
k2
1
k=1
Nun der Induktionsschritt. Mit der Induktionsannahme folgt
!
n+1
n
X 1
X
1
1
1
1
=
+
≤2− +
.
2
2
2
k
k
(n + 1)
n (n + 1)2
k=1
k=1
Weiter gilt für alle n ∈ N
1
(n + 1)2 − n
n2 + n + 1
1
n2 + n + 1
1
1
−
=
=
=
·
<
.
n (n + 1)2
n(n + 1)2
n(n + 1)2
n+1
n2 + n
n+1
Es folgt (2.18). 2
Beispiel 1.10.6 Für alle n ∈ N gilt
2n
n X1
≤
.
2
k
k=1
Beweis. Die Ungleichung ist für n = 1 erfüllt:
2
1
3 X1
≤ =
2
2
k
k=1
Nun der Induktionsschritt
n+1
2X
k=1
2
n
n+1
2
2X
1 X1
=
+
k
k
n
k=1
k=2 +1
1
n
1
n+1
≥ + 2n n+1 =
k
2
2
2
40
CHAPTER 1.
Beispiel 1.10.7 (Bernoulli Ungleichung) Für alle x ∈ Q mit 1 + x > 0 und x 6= 0 und für alle
n = 2, 3, . . . gilt
1 + nx < (1 + x)n .
Wie man nachträglich verifizieren kann, gilt die Bernoulli Ungleichung auch für reelle Zahlen.
Beweis. Wir benutzen Induktion. Da x2 > 0 gilt, folgt
(1 + x)2 = 1 + 2x + x2 > 1 + 2x.
Wir nehmen an, diese Aussage sei für n richtig und schließen auf n + 1.
(1 + x)n+1
=
(1 + x)n (1 + x) > (1 + nx)(1 + x)
=
1 + (n + 1)x + nx2 > 1 + (n + 1)x.
2
Beispiel 1.10.8 (Binomische Formel) Für alle x, y ∈ Q und alle n ∈ N gilt
n X
n n−k k
n
(x + y) =
y ,
x
k
k=0
wobei die Binomialkoeffizienten durch
n
n!
=
k!(n − k)!
k
(1.5)
gegeben sind.
Insbesondere erhält man die Bernoulli Ungleichung
n
1 + nx ≤ (1 + x) .
Die binomische Formel wird hier für rationale Zahlen bewiesen, weil wir die reellen Zahlen noch
nicht eingeführt haben. Sie gilt natürlich auch für alle reellen Zahlen. Der Beweis für reelle Zahlen
ist derselbe.
Beweis. Wir benutzen Induktion. Für n = 1 ist die Aussage offensichtlich richtig. Nun machen
wir den Induktionsschritt von n auf n + 1. Es gilt
n X
n n−k k
x
y
(x + y)n =
k
k=0
Hieraus folgt
(x + y)n+1
(x + y)(a + y)n
n n X
n n+1−k k X n n−k k+1
=
x
y +
x
y
k
k
k=0
k=0
n n n n+1 X n n−k+1 k X
n
n n+1
=
x
+
x
y +
xn+1−k y k +
y
0
k
k−1
n
k=1
k=1
n n n+1 X
n
n
n n+1
=
x
+
+
xn+1−k y k +
y
.
0
k
k−1
n
=
k=1
Weiter gilt
n
n
n+1
+
=
k
k−1
k
1.10. MATHEMATISCHE INDUKTION
41
weil
n
n
+
=
k
k−1
=
n!
n!
+
k!(n − k)! (k − 1)!(n − k + 1)!
n!((n − k + 1) + k)
n+1
=
.
k!(n − k + 1)!
k
Somit
(x + y)n+1 =
n+1
X
k=0
Aus der binomischen Formel mit x = 1 und y =
1
1+
n
n
=
n X
n
k=0
k
n
−k
n + 1 n+1−k k
x
y .
k
1
n
folgt
1 X
n −k
≥
n =1+1=2
k
k=0
2
Mathematische Induktion, 1. Variation
(i) Wir beweisen, dass A(k0 ) gilt.
(ii) Wir beweisen, dass unter der Annahme, dass A(n) gilt, auch A(n+1) für k0 ≤ n
gilt.
Nach Lemma 1.5.1 (v) haben wir dann alle Aussagen gezeigt.
Beispiel 1.10.9 (i) Für alle n ∈ N gilt
(ii) Für alle n ∈ N mit 5 ≤ n gilt
n < 2n .
n2 < 2n
Beweis. (i) Für den Induktionsanfang n = 1 erhalten wir 1 < 2. Nun der Induktionsschritt.
2n+1 = 2 · 2n > 2 · n ≥ n + 1.
Die letzte Ungleichung gilt, weil 2n ≥ n + 1 äquivalent zu
n≥1
ist.
(ii) Für n = 5 erhalten wir 25 < 32. Nun der Induktionsschritt
2n+1 = 2 · 2n > 2 · n2 .
Für alle n ≥ 5 gilt
(n + 1)2 ≤ 2n2 .
In der Tat,
2n2 − (n + 1)2 = n2 − 2n − 1 = (n − 1)2 − 2
Der letzte Ausdruck ist für n ≥ 3 strikt positiv. 2
Beispiel 1.10.10 Für alle n ≥ 4 gilt
2n ≤ n!
42
CHAPTER 1.
Beweis. A(4) ist wahr:
24 = 16 < 24 = 4!
Wir nehmen an, dass 2n ≤ n! gilt. Mit dieser Ungleichung und der Ungleichung 2 < n + 1 folgt
2n+1 = 2 · 2n ≤ 2n! ≤ (n + 1)n! = (n + 1)!
2
Beispiel 1.10.11 Für alle n ∈ N mit n ≥ 6 gilt
2n ≤
nn
n!
Beweis. Wir sollen also 2n n! ≤ nn nachweisen. Für n = 6 erhalten wir
66 = 363 = 46656
und
26 · 6! = 64 · 720 = 46080
Nun der Induktionsschritt
(n + 1)!2n+1
(n + 1)n!2 · 2n ≤ 2(n + 1)nn
n n
(n + 1)n+1
= 2(n + 1)(
) (n + 1)n = 2
n+1
(1 + n1 )n
=
Mit der Bernoulli Ungleichung (Beispiel 1.10.7)
(1 +
1 n
) ≥ 2.
n
Weiter folgt
2
(n + 1)!2n+1 ≤ (n + 1)n+1 .
Mathematische Induktion, 2. Variation
(i) Wir beweisen, dass A(1) gilt.
(ii) Wir beweisen, dass unter der Annahme, dass A(1), . . . , A(n) gelten, auch A(n +
1) gilt.
Wiederum nach Lemma 1.5.1 (v) haben wir dann alle Aussagen gezeigt.
Das nächste Beispiel benutzt im Induktionsschritt nicht nur die Annahme A(n),
sondern A(1), . . . , A(n).
Beispiel 1.10.12 Jede natürliche Zahl n mit n ≥ 2 ist ein Produkt von Primzahlen.
Beweis. Der Induktionsanfang: n = 2. In diesem Fall ist 2 Primzahl und damit Produkt von
Primzahlen.
Es sei n ∈ N und es gelte für alle k ∈ N mit 2 ≤ k ≤ n, dass k ein Produkt von Primzahlen ist.
Wir betrachten nun n + 1. Falls n + 1 eine Primzahl ist, sind wir fertig. Falls n + 1 keine
Primzahl ist, dann gibt es k1 , k2 ∈ N mit k1 · k2 = n. Nach Induktionsannahme sind k1 und k2
Produkte von Primzahlen. 2
Beispiel 1.10.13 Alle Katzen haben dieselbe Augenfarbe.
Das folgende Argument ist falsch, wo liegt der Fehler? Eine Katze allein hat dieselbe Augenfarbe. Nun der Schritt von n auf n + 1. Es seien n + 1 Katzen gegeben. Nach Induktionsannahme
haben jeweils n davon dieselbe Augenfarbe, damit auch n + 1.
Der Fehler liegt beim Schluss von 1 auf 2.
1.11. MÄCHTIGKEIT
1.11
43
Mächtigkeit
Felix Bernstein wurde am 14. Februar 1878 in Halle an der Saale geboren, er starb am 3. Dezember
1956 in Zürich. Er lehrte in Göttingen. Er gründete 1918 in Göttingen das Institut für mathematische Statistik. 1919 wurde er zum Reichskommissar für Anleihen ernannt.1924 klärte er mittels
statistischer Analyse den AB0-Blutgruppen Erbgang. 1934 wurde ihm von den Nazis der Lehrstuhl
entzogen und er emigrierte in die USA.
Ernst Schröder wurde am 25. November 1841 in Mannheim geboren und er starb am 16. Juni
1902 in Karlsruhe. Er lehrte in Darmstadt und Karlsruhe.
Wir wollen den Begriff der Anzahl für endliche und unendliche Mengen definieren.
Definition 1.11.1 Es seien K und M zwei Mengen. Wir sagen, dass K eine
kleinere oder gleiche Mächtigkeit oder Kardinalität als M besitzt, wenn es eine injektive Abbildung von K nach M gibt. Symbolisch schreiben wir dies als
card(K) ≤ card(M ).
Falls sowohl card(K) ≤ card(M ) als auch card(M ) ≤ card(K) gelten, dann sagen
wir, dass K und M dieselbe Mächtigkeit besitzen und schreiben dafür
card(K) = card(M ).
Zwei endliche Mengen M und K haben genau dann dieselbe Kardinalität oder
Mächtigkeit, wenn sie dieselbe Anzahl von Elementen besitzen.
Man beachte, dass aus den Ungleichungen card(K) ≤ card(M ) und card(M ) ≤
card(K) nicht unmittelbar folgt, dass es eine Bijektion zwischen K und M gibt. Aus
den beiden Ungleichungen folgt nur, dass es eine injektive Abbildung von K nach
M und eine injektive Abbildung von M nach K gibt. Diese beiden müssen nichts
miteinander zu tun haben. Der Satz von Cantor-Bernstein-Schröder stellt allerdings
genau dies sicher.
Satz 1.11.1 (Cantor-Bernstein-Schröder) Es seien K und M Mengen. Dann gelten
(i) Es gibt eine injektive Abbildung von K nach M oder von M nach K.
(ii) Es gibt genau dann eine injektive Abbildung von K nach M , wenn es eine surjektive Abbildung von M nach K gibt.
(iii) Falls es eine injektive Abbildung von K nach M und eine surjektive Abbildung
von K nach M gibt, dann gibt es eine Bijektion zwischen K und M .
Korollar 1.11.1 Es seien K und M Mengen. Dann gelten
(i) Es gelten card(K) ≤ card(M ) oder card(M ) ≤ card(K).
(ii) Es gilt genau dann card(K) ≤ card(M ), wenn es eine surjektive Abbildung von
M nach K gibt.
(iii) Es gilt genau dann card(K) = card(M ), wenn es eine bijektive Abbildung von
K nach M gibt.
44
CHAPTER 1.
Wir sagen, dass eine Menge M abzählbar ist, falls card(M ) ≤ card(N). Falls
eine Menge nicht abzählbar ist, dann nennen wir sie überabzählbar.
Der Äquivalenzsatz wurde 1887 von Cantor formuliert. 1897 bewies der 19jährige Bernstein diesen Satz. Schröder bewies unabhängig ebenfalls diesen Satz.
Dedekind bewies diesen Satz bereits 1887, veröffentlichte den Beweis aber nicht. Der
Beweis wurde nach seinem Tod in seinen Aufzeichnungen gefunden.
Wir beweisen den Satz hier mit Hilfe des Auswahlaxioms. Man kann ihn auch
ohne das Auswahlaxiom beweisen.
Beweis. (i) Es sei I die Menge aller Injektionen von einer Teilmenge von X in eine
Teilmenge von Y . Wir führen auf I eine Halbordnung ein: Wir setzen I ≤ J, falls
Def(I) ⊆Def(J) und J|Def(I) = I.
Wir wenden das S
Lemma von Zorn an (Lemma 1.4.1). Jede Kette K in I hat eine
obere Schranke I0 : I∈K Def(I) → Y
I0 (x) = I(x)
falls
x ∈ Def(I)
Deshalb gibt es ein maximales Element Imax . Der Definitionsbereich Def(Imax ) ist
gleich X oder der Bildbereich Bild(Imax ) ist gleich Y . Falls nicht, so gibt es
x0 ∈ X \ Def(Imax )
y0 ∈ Y \ Bild(Imax )
Nun definieren wir
(
I˜max (x) =
Imax
y0
x ∈ Def(Imax )
x = x0
Also ist Imax kein maximales Element.
(ii) Es sei I : X → Y eine Injektion und x0 ∈ X. Dann ist S : Y → X mit
(
x
I(x) = y
S(y) =
x0
y∈
/ Bild(I)
eine Surjektion.
Es sei S : Y → X eine Surjektion. Wir betrachten das Mengensystem
{y|S(y) = x}
x∈X
Nach dem Auswahlaxiom gibt es eine Auswahlmenge
A = {yx |x ∈ X}
Wir definieren nun die Injektion I : X → Y durch I(x) = yx .
(iii) Es gibt zwei injektive Abbildungen φ : K → M und ψ : M → K. Wir
betrachten x0 ∈ K. Falls x ∈ {ψ(y)|y ∈ M }, dann existiert ψ −1 (x0 ). Falls ψ −1 (x0 ) ∈
{φ(x)|x ∈ K}, dann existiert φ−1 (ψ −1 (x0 )). Diesen Prozess können wir so fortsetzen.
Entweder der Prozess bricht nach endlich vielen Schritten ab, oder er lässt sich
unendlich oft wiederholen. Falls er nach endlich vielen Schritten abbricht, ergeben
1.11. MÄCHTIGKEIT
45
sich zwei Fälle: der Prozess endet mit einem Element aus K \ {ψ(y)|y ∈ M } oder
mit einem Element aus M \ {φ(x)|x ∈ K}. Damit zerlegt sich K in drei Mengen
K∞ , KK und KM . Ebenso zerlegt sich M in drei Mengen M∞ , MM und MK .
Nun konstruieren wir die Bijektion.φ bildet K∞ bijektiv auf M∞ und MM auf
KM ab. ψ bildet KK bijektiv auf XK . Nun setzen wir die beiden Abbildungen
zusammen. 2
Die Potenzmenge P(M ) einer Menge M ist die Menge aller Teilmengen von M
(Axiom 1.3.1).
Lemma 1.11.1 (Cantor) Es sei M eine Menge. Dann gilt
card(M ) < card(P(M )).
Die Potenzmenge der leeren Menge hat genau ein Element, nämlich die leere
Menge. Die Potenzmenge einer Menge mit n Elementen besitzt 2n Elemente.
Beweis. Wir zeigen zunächst
card(M ) ≤ card(P(M )).
Wir geben dazu eine Injektion von M nach P(M ) an. Die Abbildung j : M → P(M )
sei durch
j(x) = {x}
gegeben. Sie ist offensichtlich eine Injektion. Wir zeigen nun, dass
card(M ) 6= card(P(M )).
Wir nehmen an, dass es eine Bijektion i : M → P(M ) gibt. Wir betrachten die
Menge
f = {x ∈ M |x ∈
M
/ i(x)}.
f kann durchaus die leere Menge sein.) Da i eine Bijektion ist, gibt es ein x0 mit
(M
f. Dazu betrachten wir zwei Fälle. Falls x0 ∈ M̃ , dann
i(x0 ) = M
f = {x ∈ M |x ∈
x0 ∈ M
/ i(x)}.
f, was ein Widerspruch ist. Falls x0 ∈
f, dann
Es folgt, dass x0 ∈
/ i(x0 ) = M
/M
f = {x ∈ M |x ∈
x0 ∈
/M
/ i(x)}.
f erfüllt, also x0 ∈ M
f,
Dies bedeutet, dass x0 nicht die Bedingung x0 ∈
/ i(x0 ) = M
was wiederum ein Widerspruch ist. Also gibt es keine Bijektion. 2
Beispiel 1.11.1 (i) card(N) = card(N0 ).
(ii) card(N) = card(Z)
(iii) card(N × N) = card(N)
(iv) card(N) < card(P(N))
(v) card(N) = card(Q)
46
CHAPTER 1.
Wir geben eine geometrische Abzählung der Menge N × N an. Wir beginnen im Punkt (1, 1),
gehen dann zum Punkt (2, 1) und danach zum Punkt (1, 2).
(3,1)
(2,1)
(1,1)
(2,2)
(1,2)
(1,1)
(1,3)
Beweis. (i) Es sei ψ : N0 → N durch ψ(n) = n + 1 gegeben. Dann ist ψ bijektiv.
(ii) Es gibt eine bijektive Abbildung zwischen Z und N0 . Eine bijektive Abbildung ist φ : N0 →
Z mit
n
n ∈ {2m|m ∈ N0 }
2
φ(n) =
n+1
− 2
n ∈ {2m + 1|m ∈ N0 }
(iii) Wir betrachten die Abbildung φ : N × N → N mit
φ(k, `) = 2`−1 (2k − 1).
Die Abbildung ist eine Bijektion.
Wir zeigen, dass sie injektiv ist. Es seien `, `0 , k, k 0 ∈ N mit ` 6= `0 . Wir nehmen an, dass
φ(k, `) = φ(k 0 , `0 ), d.h.
0
2`−1 (2k − 1) = 2` −1 (2k 0 − 1)
Wir können annehmen, dass ` > `0 . Dann folgt
0
2`−` (2k − 1) = (2k 0 − 1)
Dann ist die Zahl auf der linken Seite gerade und die auf der rechten Seite ungerade. Also sind sie
nicht gleich.
Es bleibt der Fall ` = `0 und k 6= k 0 . Dann folgt aus
0
2`−1 (2k − 1) = 2` −1 (2k 0 − 1)
die Gleichung
2k − 1 = 2k 0 − 1
und damit k = k 0 . Damit ist die Abbildung injektiv.
Wir zeigen nun, dass die Abbildung surjektiv ist. Falls n eine ungerade Zahl ist, dann gilt für
k = n+1
2 und ` = 1
n = 2`−1 (2k − 1)
und s gilt φ(k, `) = n.
Nun der Fall, dass n eine gerade Zahl ist. Man kann jede natürliche Zahl als ein Produkt einer
ungeraden Zahl p und einer Potenz von 2 schreiben
n = 2m−1 p
m ∈ N.
Dies kann man direkt einsehen oder aus dem Primzahlzerlegungsatz herleiten (Satz 1.5.1). Entspechend
wählen wir ` = m und k = p+1
2 .
(iv) folgt aus Lemma 1.11.1.
(v) Es reicht zu zeigen, dass eine eine injektive Abbildung von N nach Q gibt und eine injektive
von Q nach N. Wir wenden dann (i) an. 2
1.11. MÄCHTIGKEIT
47
Wir bezeichnen card(N) auch mit ℵ0 . Falls eine Menge dieselbe Mächtigkeit wie
N hat, sagen wir, dass die Menge abzählbar ist. Wenn die Mächtigkeit der Menge
strikt größer als die von N ist, dann sagen wir, dass sie überabzählbar ist.
Axiom 1.11.1 (Kontinuumshypothese) Es gibt keine Menge M mit
card(N) < card(M ) < card(P(N)).
Der Name Kontinuumshypothese rührt daher, dass die Menge P(N) dieselbe Mächtigkeit
hat wie die reellen Zahlen R. Da man die reellen Zahlen mit der Zahlengeraden identifiziert spricht man hier vom Kontinuum.
Die Kontinuumshypothese kann als weiteres Axiom dem Zermelo-Fraenkel Axiomensystem hinzugefügt werden.
Gödel zeigte, dass die Kontinuumshypothese konsistent mit den Axiomen der
Mengenlehre ist. Cohen zeigte, dass auch die Verneinung der Kontinuumshypothese
konsistent mit den Axiomen der Mengenlehre ist.
Als Kardinalzahl einer Menge führt man die Äquivalenzklasse aller Mengen ein,
die dieselbe Mächtigkeit haben. Hierbei legen wir eine Universalmenge zugrunde.
Anderenfalls wäre dies Funktion auf der Menge aller Mengen definiert, also auf einer
Menge, die es nicht gibt.
Wenn wir überdies noch vorziehen, Kardinalzahlen als Mengen zu definieren, so
müssen die Äquivalenzklassen durch einen jeweiligen Repräsentanten ersetzen.
Beispiel 1.11.2 Die Dimension des Vektorraumes R über dem Körper Q ist unendlich.
Beweis. Falls der Raum keine Basis aus endlich vielen Vektoren besitzt, sagt man dass die
Dimension unendlich ist.
Wir nehmen an, dass die Dimension endlich ist. Dann gibt es eine Basis x1 , . . . , xn . Deshalb
gilt
( n
)
X
R=M =
ai xi |∀i = 1, . . . , n : ai ∈ Q
i=1
n
Es gibt eine surjektive Abbildung i : Q → M mit
i(a) =
n
X
a i xi
i=1
Wir wissen aber, dass Qn dieselbe Mächtigkeit wie N hat. Das kann nicht sein, weil die Mächtigkeit
von R strikt größer als die von N ist. 2
48
CHAPTER 1.
Chapter 2
Die reellen Zahlen
Mit Hilfe der Mengenlehre haben wir die natürlichen Zahlen N eingeführt. Hieraus
bilden wir die ganzen Zahlen Z durch Hinzunahme der negativen, ganzen Zahlen.
Dann erhalten wir die rationalen Zahlen Q durch Quotientenbildung.
Jede Messung und insbesondere Längenmessung verbinden wir mit einer reellen
Zahl. Dabei stellen wir fest, dass sich nicht jede Zahl durch einen Quotienten ganzer
Zahlen darstellen lässt. So ordnen wir dem Umfang eines Kreises mit Radius 1 die
Länge 2π zu und
in einem Quadrat mit Seitenlänge 1
√
√ die Länge der Diagonalen
ergibt sich zu 2. Beide Zahlen, π und 2, können wir nicht mit rationalen Zahlen
identifizieren. Diese Zahlen sind nicht rational oder, wie wir sagen irrational.
Die Forderung, dass wir jeder Messung eine Zahl zuordnen wollen, führt zu der
Anschauung, dass alle reelle Zahlen eine Zahlengerade bilden. Diese erhalten wir,
wenn wir eine Gerade mit einem Lineal zeichnen und uns diese Gerade bis ins Unendliche fortgesetzt vorstellen. Wir stellen uns vor, dass sich die Zahlengerade aus
unendlich kleinen Partikeln zusammensetzt, nämlich den Zahlen. Von einer mathematischen Definition sind wir hiermit aber weit entfernt. Es könnte ja sein, dass die
Gerade an einigen Stellen Lücken aufweist, die allerdings so klein sind, dass sie mit
bloßem Auge nicht zu sehen sind. Dass alle diese Überlegungen problematisch sind,
wird durch einen Beschluss der katholischen Kirche vom 10. August 1632 belegt. An
diesem Tag legte die Kirche fest, dass eine Gerade nicht aus verschiedenen, unendlich
kleinen Partikeln besteht. Eine solche These war damit Gotteslästerung und durfte
nicht gelehrt werden [1]. Die Grundlage der Infinitesimalrechnung wurde damit zur
Gotteslästerung.
Es gibt zwei verschiedene Zugänge, die reellen Zahlen mit Hilfe der rationalen
Zahlen zu definieren. Der eine Weg benutzt Cauchy Folgen rationaler Zahlen [108],
der andere Dedekind Schnitte [65].
Der Weg über die Cauchy Folgen orientiert sich an der Dezimalbruchentwicklung der reellen Zahlen. Die Dezimalbruchdarstellung einer reellen Zahl ist eine
unendliche Folge von Ziffern zwischen 0 und 9. Wenn wir die Dezimalbruchdarstellung an einer Stelle abbrechen, erhalten wir eine rationale Zahl. Diese rationale Zahl
stellt die reelle Zahl bis auf einen Fehler dar. Diesen Fehler können wir so klein wie
möglich halten, wenn wir die Folge entsprechend spät abbrechen.
49
50
CHAPTER 2. DIE REELLEN ZAHLEN
Der Dedekind Schnitt orientiert sich an dem geometrischen Bild der reellen
Zahlen als Gerade.
Wir wollen hier den zweiten Zugang benutzen. Dabei werden wir von unserer
Intuition geleitet, dass die reellen Zahlen durch eine Gerade unendlicher Länge
dargestellt werden können.
√
Wir wollen hier den eleganten und alten Beweis für die Irrationalität von 2
angeben.
Satz 2.0.2 Es gibt keine rationale Zahl q mit q 2 = 2.
Der Satz kann auch so formuliert werden:
Dazu benötigen wir das folgende Lemma.
√
2 ist eine irrationale Zahl.
Lemma 2.0.2 Eine natürliche Zahl n ist genau dann gerade, wenn deren Quadrat
n2 gerade ist.
Beweis. Es sei n eine gerade Zahl, dann gilt n = 2m. Also gilt n2 = 2(2m2 ). Dies
ist eine gerade Zahl.
Falls n eine ungerade Zahl ist, dann gibt es ein m ∈ N0 mit n = 2m + 1. Deshalb
ist n2 = (2m + 1)2 = 4m2 + 4m + 1 = 2(2m2 + 2m) + 1. Dies ist eine ungerade Zahl.
2
√
Beweis von Satz 2.0.2. Falls 2 = pq gilt, wobei p, q ∈ N und p und q keine
gemeinsamen Teiler besitzen, dann gelten
p2
2= 2
q
oder
2q 2 = p2 .
Deshalb ist p2 eine gerade Zahl und somit auch p. Also gilt p = 2k und
2q 2 = 4k 2
oder
q 2 = 2k 2 .
Damit sind auch q 2 und q gerade Zahlen. Somit gelten
p = 2k
und
q = 2l.
Also sind p und q nicht teilerfremd. Dies steht im Widerspruch zu unserer Wahl
von p und q. 2
Wir geben auch noch ein geometrisches Argument an [Apo].
Beweis von Satz 2.0.2. Wir betrachten ein rechtwinkliges Dreieck ABC, dessen
Seiten AC und BC die
√ Länge 1 haben. Nach dem
√ Satz von Pythagoras hat die
Seite AB die Länge 2. Wir nehmen an, dass 2 eine rationale Zahl ist. Dann
finden wir ein Dreieck derselben Form, dessen Seiten alle ganzzahlige Längen haben
(wir multiplizieren jede Seite mit einem entsprechenden Faktor). Unter allen solchen
Dreiecken gibt es ein kleinstes. Wir zeigen nun, dass auch das Dreieck ADE von
derselben Form ist und ganzzahlige Seitenlänge hat, im Widerspruch zu unser Wahl.
51
B
B
√
2
1
D
A
1
C
A
E
C
Die Länge der Seite AD ist gleich der Differenz der Seitenlängen von AB und
CB, also ganzzahlig. AD und DE haben dieselbe Länge. Außerdem sind DE und
CE gleich lang. 2
Dieser Beweis ist elementar und einfach. Um zu zeigen, dass π und die Eulersche
Zahl e irrational sind, muss man einige Hilfsmittel zur Verfügung stellen. Von der
Zahl γ, die auch nach Euler benannt ist, ist nicht bekannt, ob sie irrational ist. Sie
ist durch den Grenzwert
!
n
X
1
− ln n
γ = lim
n→∞
k
k=1
definiert.
Wir sagen, dass eine Zahl algebraisch ist, wenn sie Nullstelle eines Polynoms mit
ganzzahligen Koeffizienten ist. Offensichtlich sind alle rationalen Zahlen algebraisch.
Eine Zahl, die nicht algebraisch ist, heisst transzendent. e und π sind Beispiele für
transzendente Zahlen [EyL]. Auch die Zahl
0, 11000100 . . .
bei der an der k! Stelle hinter dem Komma eine 1 steht, ist transzendent (Liouville).
√
Beispiel 2.0.3 Es sei n ∈ N und n ≥ 2. n ist genau dann rational, wenn n eine Quadratzahl
ist, d.h. wenn es ein m ∈ N mit n = m2 gibt.
Beweis. Wir benutzen den Satz über die Eindeutigkeit der Primzahlzerlegungen. Dieser besagt,
dass es für jede natürliche Zahl n paarweise verschiedene Primzahlen ni , i = 1 . . . , k und natürliche
Zahlen si , i = 1, . . . , k, gibt, so dass
k
Y
n=
nsi i .
i=1
Diese Darstellung ist eindeutig bis auf die Reihenfolge der ni , si , i = 1, . . . , k.
Falls alle si , i = 1, . . . , k, gerade Zahlen sind, dann ist n eine Quadratzahl. Wir
√ betrachten nun
den Fall, dass es ein i0 gibt, so dass si0 ungerade ist. Wir nehmen nun an, dass n eine rationale
Zahl ist, d.h.
√
p
n=
p, q ∈ N
q
Es seien
`
m
Y
Y
p=
ptii
und
q=
qiri
i=1
i=1
52
CHAPTER 2. DIE REELLEN ZAHLEN
die Primzahlzerlegungen von p und q. Also gilt
n=
p2
q2
bzw.
k
Y
i=1
nsi i
m
Y
i=1
qi2ri =
`
Y
i
p2t
i .
i=1
Falls für alle i = 1, . . . , m gilt, dass qi 6= ni0 , dann gibt es wegen der Eindeutigkeit der Primzahlzerlegung ein i1 , so dass
ni0 = pi1
und
si0 = 2ti1 .
Dies kann nicht sein, da si0 ungerade ist. Falls es ein i1 mit ni0 = qi1 gibt, dann gibt es ein i2 , so
dass
ni0 = qi1 = pi2
und si0 + 2ri1 = 2ti2
Auch dies kann nicht sein, da si0 eine ungerade Zahl ist. Damit haben wir einen Widerspruch und
√
n ist keine rationale Zahl. 2.1
Dedekind Schnitt
Julius Wilhelm Richard Dedekind wurde am 6. Oktober 1831 in Braunschweig geboren. Er starb
am 12. Februar 1916 in Braunschweig. Er studierte in Berlin. Er lehrte in Göttingen, Zürich
und Braunschweig. Er arbeitete auf dem Gebiet der Algebra. Dedekind spielte sehr gut Cello und
Klavier und komponierte eine Kammeroper, zu der sein Bruder das Libretto schrieb.
Wir folgen hier der Darstellung in [65]. Wir konstruieren mit Hilfe der rationalen
Zahlen Q die reellen Zahlen R. [1],[108]
Definition 2.1.1 Eine Teilmenge M einer geordneten Menge X heißt Dedekind
Schnitt von X, wenn
(i) Sie nicht leer ist und nicht gleich X ist.
(ii) Jedes Element von M kleiner als jedes Element vom Komplement von M ist.
(iii) M besitzt kein Maximum, d.h. es gibt kein Element von M , das größer oder
gleich als alle Elemente in M ist
Wenn wir (ii) nachprüfen, werden wir zeigen, dass für alle ξ ∈ M und alle η < ξ
gilt η ∈ M .
Beispiel 2.1.1 (i) Es sei q eine rationale Zahl. Dann ist
(2.1)
Sq = {p ∈ Q|p < q}
ein Dedekind Schnitt in Q.
(ii) Die Menge
S√2 = {q ∈ Q|q 2 < 2} ∪ {q ∈ Q|q ≤ 0}
ist ein Dedekind Schnitt.
2.1. DEDEKIND SCHNITT
53
Beweis. (i) Es gelten q + 1 ∈
/ Sq und q − 1 ∈ Sq . Falls p ∈ Sq und r ≤ p, dann gilt r ≤ p < q und
damit r ∈ Sq .
Es bleibt zu zeigen, dass Sq kein Maximum besitzt. Wir nehmen an, dass Sq ein Maximum q0
besitzt. Dann gilt q0 < q und es gibt ein r ∈ Q mit q0 < r < q. Dann gilt aber r ∈ Sq und q0 ist
kein Maximum.
(ii) Wird in Beispiel 2.10.3 bewiesen. 2
Definition 2.1.2 Einen Dedekind Schnitt von Q bezeichnen wir als reelle Zahl. Die
Menge der reellen Zahlen bezeichnen wir mit R.
Definition 2.1.3 Es seien x, y ∈ R. Es gilt x < y, falls x ⊂ y.
Mit der Forderung, dass ein Dedekind Schnitt kein größtes Element enthält, verhindern wir, dass zwei verschiedene Dedekind Schnitte dieselbe reelle Zahl darstellen.
Falls sowohl {q ∈ Q|q < 1} als auch {q ∈ Q|q ≤ 1} Dedekind Schnitte wären, dann
würden beide die Zahl 1 darstellen.
Der Dedekind Schnitt
M = {q ∈ Q|q 2 < 2} ∪ {q ∈ Q|q ≤ 0}
√
stellt, wie wir sehen werden, die Zahl 2 dar.
Wir führen auf der Menge der Dedekind Schnitte von Q zwei Verknüpfungen ein,
Addition und Multiplikation.
Zunächst die Addition. Für x, y ∈ R setzen wir
x + y = {ξ + η|ξ ∈ x, η ∈ y}.
Lemma 2.1.1 Es seien x und y Dedekind Schnitte in Q. Dann ist auch
x + y = {ξ + η|ξ ∈ x, η ∈ y}
ein Dedekind Schnitt in Q.
Beweis. Es seien x, y ∈ R. Wir zeigen, dass x + y nicht leer ist. Da x und y
Dedekind Schnitte sind, sind sie nicht leer, also gibt es ξ0 ∈ x und η0 ∈ y. Dann gilt
aber ξ0 + η0 ∈ x + y.
Nun zeigen wir, dass x + y 6= Q. Da x und y Dedekind Schnitte sind, sind
beide von Q verschieden. Es gibt also ξ1 , η1 ∈ Q mit ξ1 ∈
/ x und η1 ∈
/ y. Dann gilt
ξ1 + η1 ∈
/ x + y. In der Tat, nehmen wir an, dass ξ1 + η1 ∈ x + y. Dann gibt es
ξ2 ∈ x und η2 ∈ y mit
ξ1 + η1 = ξ2 + η2 .
Da aber ξ1 ∈
/ x und η1 ∈
/ y, folgt
ξ2 + η2 < ξ1 + η1 ,
54
CHAPTER 2. DIE REELLEN ZAHLEN
was nicht sein kann, da beide Zahlen gleich sind.
Es seien ξ ∈ x und η ∈ y. Wir zeigen, dass für alle ζ < ξ + η gilt ζ ∈ x + y. Es
gilt ξ + η − ζ > 0. Dann gelten
ξ−
ξ+η−ζ
∈x
2
η−
ξ+η−ζ
∈ y.
2
Außerdem gilt
ξ+η−ζ
ξ+η−ζ
ξ−
+ η−
= ζ.
2
2
Es folgt ζ ∈ x + y.
Nun zeigen wir, dass x + y kein Maximum enthält. Wir nehmen an, dass x + y
ein Maximum besitzt. Es gibt also γ ∈ x und δ ∈ y, so dass für alle ξ ∈ x und alle
η∈y
ξ+η ≤γ+δ
gilt. Da x und y kein Maximum enthalten, gibt es ρ ∈ x und σ ∈ y mit
γ<ρ
δ < σ.
Es folgt
γ + δ < ρ + σ.
Dies ist ein Widerspruch. 2
Beispiel 2.1.2 Es seien p, q ∈ Q. Dann gilt für die Dedekind Schnitte (2.1)
Sp + Sq = Sp+q .
Beweis.
Sp + Sq
=
=
⊆
⊆
{r ∈ Q|r < p} + {s ∈ Q|s < q}
{r + s|r, s ∈ Q ∧ r < p ∧ s < q}
{r + s|r, s ∈ Q ∧ r + s < p + q}
{t ∈ Q|t < p + q} = Sp+q
Nun die inverse Inklusion. Es sei t ∈ Q mit t < p + q. Dann gelten p + q − t > 0 und
p+q−t
∈ Sq
2
p−
p+q−t
∈ Sp
2
t=
p+q−t
p+q−t
+ q−
∈ Sp + Sq
p−
2
2
q−
Weiter gilt
2
Definition 2.1.4 Es sei x ∈ R. Falls die Menge
(2.2)
{ξ ∈ Q|∀η ∈ x : ξ + η < 0}
kein Maximum besitzt, dann setzen wir
−x = {ξ ∈ Q|∀η ∈ x : ξ + η < 0}.
2.1. DEDEKIND SCHNITT
55
Falls die Menge (2.2) ein Maximum besitzt, dann definieren wir −x als diese Menge
ohne ihr Maximum.
Wir definieren
0 = {ξ ∈ Q|ξ < 0}.
Lemma 2.1.2 (i) 0 ist ein Dedekind Schnitt in Q.
(ii) Für alle x ∈ R gilt
x + 0 = x.
(iii) Für alle x ∈ R gilt −x ∈ R.
Weiter gilt für alle x ∈ R
(2.3)
x + (−x) = 0.
Beweis. (i) Nach Beispiel 2.1.1 ist 0 ein Dedekind Schnitt von Q.
(ii)
x + 0 = {ξ + η|ξ ∈ x, η < 0}
Es gilt für alle ξ ∈ x und η < 0
ξ + η < ξ ∈ x.
Da x ein Schnitt ist, gilt ξ + η ∈ x. Es folgt
x + 0 ⊆ x.
Nun die inverse Inklusion. Es sei ξ ∈ x. Dann gibt es ein η ∈ x mit ξ < η. Nun
wählen wir ζ = ξ − η ∈ 0 und erhalten
ξ = η + ζ ∈ x + 0.
Also gilt x ⊆ x + 0.
(iii) Wir zeigen, dass es ein ξ ∈
/ −x gibt. Es gilt
−x ⊆ {ξ ∈ Q|∀η ∈ x : ξ + η < 0}.
Es gibt ein ζ ∈ x, weil x ein Dedekind Schnitt ist. Dann gilt
−ζ ∈
/ {ξ ∈ Q|∀η ∈ x : ξ + η < 0}.
In der Tat, falls −ζ ∈ −x, dann gilt 0 = ζ + (−ζ) < 0. Das ist ein Widerspruch.
Insbesondere gilt −ζ ∈
/ −x. Also können wir ξ = −ζ wählen.
Wir zeigen nun, dass es ein ξ ∈ −x gibt. Wir wählen ein η ∈
/ x. Ein solches η
existiert, weil x ein Dedekind Schnitt ist. Dann gilt
(2.4)
−η − 1 ∈ {ξ ∈ Q|∀η ∈ x : ξ + η < 0}.
56
CHAPTER 2. DIE REELLEN ZAHLEN
Wir weisen dies nach. Es gilt
η + (−η − 1) = −1 < 0
und damit für alle ζ < η
Insbesondere gilt für alle ζ ∈ x
ζ + (−η − 1) < 0.
ζ + (−η − 1) < 0.
Also gilt (2.4). Falls −η − 1 nicht das Maximum von {ξ ∈ Q|∀η ∈ x : ξ + η < 0} ist,
gilt −η − 1 ∈ −x. Falls −η − 1 das Maximum dieser Menge ist, dann wählen wir
−η − 2.
Es sei nun ξ ∈ −x und η < ξ. Dann gilt für alle ζ ∈ x
ζ + η < ζ + ξ < 0.
Es folgt η ∈ −x. Nach Definition enthält −x kein Maximum. Damit ist −x ein
Dedekind Schnitt.
Wir zeigen nun die Gleichung (2.3).
x + (−x) = {ξ + η|ξ ∈ x ∧ η ∈ −x}
= {ξ + η|ξ ∈ x ∧ ∀ρ ∈ x : η + ρ < 0}
⊆ {ξ + η|ξ ∈ x ∧ η + ξ < 0} ⊆ {ζ ∈ Q|ζ < 0} = 0.
Wir zeigen nun die inverse Inklusion. Es sei nun ζ ∈ Q mit ζ < 0. Wir nehmen an,
dass
(2.5)
ζ∈
/ x + (−x).
Wir können annehmen, dass
(2.6)
2ζ ∈ x + (−x).
Wir überlegen uns dies. Nach (iii) ist x + (−x) ein Schnitt, also gibt es ein η ∈
x + (−x) mit η < 0. Nach Lemma 1.8.4 ist Q ein archimedischer Körper. Deshalb
gibt es ein n ∈ N mit nζ ≤ η. Da N wohlgeordnet ist, gibt es eine kleinste Zahl
n0 ∈ N mit n0 ζ ∈ x + (−x). Dann gilt (n0 − 1)ζ ∈
/ x + (−x). Wir nehmen nun
(n0 − 1)ζ als unser neues ζ.
Dann gilt für alle ρ ∈ −x
ρ − ζ ∈ −x.
Dies gilt, weil für alle ξ ∈ x und alle ρ ∈ −x nach (2.5)
ξ+ρ<ζ
und damit für alle ξ ∈ x
ξ + (ρ − ζ) < 0
2.1. DEDEKIND SCHNITT
57
gilt. Andererseits gibt es wegen (2.6) σ ∈ x und τ ∈ −x mit
σ + τ = 2ζ.
Es folgt mit σ ∈ x und τ ∈ −x
σ + (τ − ζ) = ζ.
Da aber τ − ζ ∈ −x, gilt
Das ist ein Widerspruch. 2
ζ ∈ x + (−x).
Beispiel 2.1.3 Es sei p ∈ Q. Sp = {q ∈ Q|q < p} ist ein Dedekind Schnitt in Q und für sein
additives Inverses gilt
−Sp = S−p .
Beweis. Wir zeigen
{ξ ∈ Q|∀η ∈ Sp : ξ + η < 0} = {ξ ∈ Q|ξ ≤ −p}.
Wir zeigen, dass die rechte Menge in der linken enthalten ist. Es sei ξ ≤ −p und η ∈ Sp , d.h.
η < p. Dann folgt ξ + η < −p + p = 0.
Nun die inverse Inklusion. Dazu nehmen wir an, dass es ein ξ > −p mit ξ ∈ {ξ ∈ Q|∀η ∈ Sp :
ξ + η < 0} gibt. Dann gilt ξ + p > 0 und
p−
ξ+p
∈ Sp .
2
Weiter gilt
ξ+p
ξ+p
=
>0
2
2
Also gilt ξ ∈
/ {ξ ∈ Q|∀η ∈ Sp : ξ + η < 0}. 2
ξ+p−
Korollar 2.1.1 R mit der Verknüpfung + ist eine abelsche Gruppe.
Definition 2.1.5 Es seien x, y ∈ R. Wir setzen
x x≥0
|x| =
−x x < 0
Da x und −x Schnitte sind, ist auch |x| ein Schnitt.
Wir definieren nun die Multiplikation für die reellen Zahlen.
Definition 2.1.6 Es seien x, y ∈ R mit x, y > 0. Wir setzen
x · y = {ξ · η|ξ ∈ x, ξ > 0, η ∈ y, η > 0} ∪ {τ ∈ Q|τ ≤ 0}.
Für alle x ∈ R definieren wir
x·0=0·x=0
Für x < 0 und y < 0 definieren wir
x · y = |x| · |y|
Für x < 0 und y > 0 definieren wir
x · y = y · x = −(|x| · y).
58
CHAPTER 2. DIE REELLEN ZAHLEN
Lemma 2.1.3 Es seien x und y Dedekind Schnitte in Q. Dann ist auch x · y ein
Dedekind Schnitt.
Beweis. Falls y = 0, dann gilt x · y = 0 und x · y ist nach Beispiel 2.1.1 ein Schnitt.
Wir betrachten den Fall x > 0 und y > 0. Wir zeigen zuerst, dass für alle
τ ∈ x · y und alle ρ < τ gilt ρ ∈ x · y. Gemäß Definition 2.1.6 müssen wir nur zeigen,
dass für alle ζ mit 0 < ζ < ξ · η und ξ ∈ x und η ∈ y gilt ζ ∈ x · y. Es sei ξ · η ∈ x · y
und ζ ∈ Q mit ζ < ξ · η. Wir zeigen, dass ζ ∈ x · y. Es gilt
ζ
< η.
ξ
Da y ein Schnitt und η ∈ y, folgt
ζ
ξ
∈ y. Damit ist
ξ
ζ
∈ x · y.
ξ
Wir zeigen nun, dass x · y kein Maximum enthält. Wir nehmen an, x · y enthält ein
Maximum. Dann gibt es also Elemente ξ0 ∈ x und η0 ∈ y, so dass für alle ξ ∈ x
und alle η ∈ y
ξ · η ≤ ξ0 · η0
gilt. Andererseits enthalten x und y keine Maxima. Also gibt es ρ ∈ x mit ξ < ρ
und τ ∈ y mit η < τ . Dann gilt
ξ · η < ρ · τ.
Wir müssen noch zeigen, dass x · y nicht leer ist und dass auch das Komplement
nicht leer ist. x · y ist nicht leer, weil {q ∈ Q|q ≤ 0} ⊆ x · y. Es seien ξ ∈
/ x und
η∈
/ y. Dann gilt ξ · η ∈
/ x · y. In der Tat, falls ξ · η ∈ x · y, dann gibt es ρ ∈ x und
τ ∈ y mit ξ · η = ρ · τ < ξ · η. Dies ist ein Widerspruch.
Damit haben wir den Fall x > 0 und y > 0 gezeigt.
Falls x < 0 und y < 0, dann gelten |x| > 0 und |y| > 0. Mit dem obigen Fall
folgt nun auch dieser. 2
Beispiel 2.1.4 (i) Es seien r, s ∈ Q. Dann gilt für das Produkt der Dedekind Schnitte {p|p < r}
und {q|q < s}
{p|p < r} · {q|q < s} = {w|w < r · s}.
(ii) Es sei
Dann gilt
S√2 = {q ∈ Q|q 2 < 2} ∪ {q ∈ Q|q ≤ 0}.
S√2 · S√2 = S2 = {q ∈ Q|q < 2}.
Wir wollen nun das multiplikative inverse Element für x ∈ R mit x 6= 0 definieren.
Definition 2.1.7 Es sei x > 0. Dann setzen wir
1
1 c
c
=
ξ ∈ x ∧ ξ ist nicht Minimum von x ∪ {q ∈ Q|q ≤ 0}.
x
ξ
Falls x < 0, dann setzen wir
1
x
1
= − |x|
. Wir schreiben auch x−1 für x1 .
2.1. DEDEKIND SCHNITT
59
Lemma 2.1.4 Es sei x ∈ R mit x 6= 0. Dann ist auch
dann gilt auch x1 > 0. Außerdem gilt
x·
1
x
ein Schnitt. Falls x > 0,
1
= {q ∈ Q|q < 1} = 1.
x
Beweis. Wir nehmen zunächst an, dass x > 0. Wir zeigen, dass x1 nicht leer ist.
Es gibt eine Zahl in xc , die nicht die kleinste in xc ist. Es gibt ein ξ ∈ xc mit ξ > 0.
1
Dann gilt auch ξ + ξ ∈ xc und ξ + ξ ist nicht die kleinste in xc . Also gilt ξ+ξ
∈ x1
und x1 ist nicht leer.
Wir zeigen nun, dass ( x1 )c nicht leer ist. Es gilt
1
1 c
c
=
ξ ∈ x , x ist nicht die kleinste Zahl in x ∪ {q ∈ Q|q ≤ 0}.
x
ξ
Also gilt ζ ∈
/ x1 für 0 < ζ, falls ζ1 ∈ x.
Nun zeigen wir, dass für alle ξ ∈ x1 und alle η < ξ gilt η ∈ x1 . Der Fall η ≤ 0
ist klar. Deshalb können wir annehmen, dass ξ > 0. Es gilt ξ ∈ x1 , falls 1ξ ∈ xc und
falls 1ξ nicht das Minimum von xc ist. Aus η < ξ folgt 1ξ < η1 . Damit gilt η1 ∈ xc
Schließlich zeigen wir noch, dass x1 kein Maximum enthält.
Wir zeigen nun, dass x · x−1 = 1. Zunächst der Fall x > 0. 2
Satz 2.1.1 (R, +, ·, ≤) ist ein geordneter, archimedischer Körper.
Beweis. Ein Körper mit einer Ordnung heißt geordneter Körper, falls gelten:
(i) Für alle x, y, z ∈ K mit x < y gilt x + z < y + z.
(ii) Für alle x, y, z ∈ K mit x < y und 0 < z gilt, dass xz < yz.
Es gelte A < C, d.h. A ⊂ C. Es folgt
A + B = {x + y|x ∈ A, y ∈ B} ⊂ {x + y|x ∈ C, y ∈ B} = A + C.
Ein geordneter Körper K heißt archimedisch, wenn für alle x, y ∈ K mit 0 < x <
y ein n ∈ N existiert, so dass
y≤x
· · · + x} .
| + x{z
n
2
Definition 2.1.8 Ein geordneter Körper, in dem jede nach oben beschränkte, nicht
leere Teilmenge ein Supremum besitzt, heißt Dedekind vollständig. Man sagt auch,
dass er die Supremumseigenschaft besitzt.
Satz 2.1.2 (i) Jede nach oben beschränkte, nicht leere Teilmenge von (R, +, ·, ≤)
besitzt ein Supremum.
(ii) Jede nach unten beschränkte, nicht leere Teilmenge von (R, +, ·, ≤) besitzt ein
Infimum.
60
CHAPTER 2. DIE REELLEN ZAHLEN
Die leere Menge besitzt in R kein Supremum, weil jede reelle Zahl obere Schranke
der leeren Menge ist.
Beweis. Es sei A ⊆ R und A sei nach oben beschränkt. Dann ist
[
y=
x
x∈A
ein Dedekind Schnitt in Q, also eine reelle Zahl, und y ist das Supremum von A.
Wir weisen dies nach.
Zuerst zeigen wir, dass y ein Dedekind Schnitt ist. Es gilt y 6= ∅, da A nicht leer
ist und alle x ∈ A nicht leere Teilmengen von Q sind.
Wir zeigen, dass y 6= Q. Nach Annahme ist A beschränkt. Es gibt also ein
z ∈ R, so dass für alle x ∈ A gilt x ≤ z. Das bedeutet, dass für alle x ∈ A gilt
x ⊆ z. Hieraus folgt
[
[
y=
x⊆
z = z.
x∈A
c
x∈A
c
Aus y ⊆ z folgt z ⊆ y . Da z ein Dedekind Schnitt ist, ist z c nichtleer und damit
ebenfalls y c .
Es sei ξ ∈ y und η < ξ. Wir wollen nun zeigen, dass η ∈ y. Aus ξ ∈ y folgt,
dass es ein x ∈ A mit ξ ∈ x gibt. Da x ein Schnitt ist und ξ ∈ x, so folgt η ∈ x und
damit η ∈ y.
Wir zeigen nun, dass y kein Maximum besitzt. Wir nehmen an, dass y ein
Maximum η0 enthält. Da η0 größtes Element von y ist, gilt
[
∀η ∈
x : η ≤ η0 .
x∈A
Es gibt ein x0 ∈ A mit η0 ∈ x0 . Es folgt
∀η ∈ x0 :
η ≤ η0 .
Also besitzt x0 ein Maximum, was nicht sein kann, weil x0 ein Dedekind Schnitt ist.
Deshalb hat y kein Maximum.
Wir zeigen nun, dass y Supremum von A ist. Es gilt für alle x ∈ A, dass x ⊆ y.
Somit ist y eine obere Schranke von A.
Wir zeigen nun, dass y die kleinste, obere Schranke von A ist. Es sei z eine obere
Schranke von A Dann gilt für alle x ∈ A, dass x ⊆ z und damit
[
y=
x ⊆ z.
x∈A
2
2.2
Folgen in R
Augustin-Louis Cauchy wurde am 21 August 1789 in Paris geboren, er starb am 23. Mai 1857 in
Sceaux.
2.2. FOLGEN IN R
61
Als Mitglied der Académie war eine von Cauchys Pflichten die Begutachtung von eingesandten
wissenschaftlichen Artikeln. Dieser Arbeit widmete er viel seiner Zeit, allerdings nicht unbedingt
zur Freude der Autoren. So schrieb Niels Henrik Abel: ”Cauchy ist verrückt, und man kann nichts
dagegen tun. Allerdings ist er zur Zeit der einzige, der weiß, wie man Mathematik machen sollte.”
Ähnliche schlechte Erfahrungen machten Galois und Poncelet. Es schien auch, dass Cauchy
teilweise die Papiere der jungen Wissenschaftler verloren hatte, was ihm heftig vorgeworfen wurde.
Michail Ostrogradski dagegen fand nur warme Worte für Cauchy, der den jungen Russen sogar
mehrmals aus dem Schuldturm freikaufte, wenn er mal wieder seine Miete nicht bezahlen konnte.
Definition 2.2.1 Es sei M eine Menge. Eine Folge in M ist eine Abbildung I :
N → M . Wir schreiben auch
{xn }∞
n=1
oder
{xn }n∈N .
Wir ordnen also jedem n ∈ N ein Element xn ∈ M zu:
x1 , x2 , x3 , . . .
Es kann vorkommen, dass die Indexmenge nicht N sondern N0 oder {n ∈ N|n ≥ n0 }
für ein geeignetes n0 ∈ N ist. Dann schreiben wir
{xn }n∈N0
bzw.
{xn }∞
n=n0 .
Definition 2.2.2 (i) Eine Folge {xn }n∈N in dem geordneten Körper (R, +, ·, ≤)
heißt konvergent zum Grenzwert x ∈ R, wenn für alle ∈ R mit > 0 ein N ∈ N
existiert, so dass für alle n > N
|xn − x| < gilt.
(Quantorenschreibweise: ∀ > 0 ∃N ∈ N ∀n > N : |xn − x| < .)
Wir schreiben hierfür auch
x = lim xn .
n→∞
(ii) Eine Folge {xn }n∈N in dem geordneten Körper (R, +, ·, ≤) heißt konvergent,
wenn es einen Grenzwert gibt, gegen den sie konvergiert.
(Quantorenschreibweise: ∃x ∀ > 0 ∃N ∈ N ∀n > N : |xn − x| < .) Falls eine
Folge nicht konvergiert, sagen wir auch, dass sie divergiert.
Dies bedeutet anschaulich, dass sich die Folge der Zahl a annähert. Wenn wir
N nur hinreichend groß wählen, dann haben sämtliche Folgenglieder an mit n > N
einen Abstand zu a, der kleiner als ist. Wenn man eine konkrete Folge vorliegen
hat und will deren Konvergenz beweisen, dann wird man N als Funktion von bestimmen.
62
CHAPTER 2. DIE REELLEN ZAHLEN
Beispiel 2.2.1 (i) Es gilt
lim
n→∞
1
=0
n
(ii) Es sei

1
xn = n

1000
für n ∈ N und n 6= 1000
für n = 1000
Dann gilt
lim xn = 0
n→∞
(iii) Es gilt
lim
n→∞
1
=0
n2
(iv) Es gilt
lim
n→∞
1
1+
n
=1
(v) Die Folge {(−1)n }n∈N konvergiert nicht.
Beweis. (i) Es sei ∈ R, > 0. Da R archimedisch ist, gilt:
∃N ∈ N : N > 1.
Hieraus folgt
1
.
N
∃N ∈ N : >
Damit folgt
∃N ∈ N∀n > N :
1
< .
n
Hieraus ergibt sich
1
∃N ∈ N∀n > N : − 0 < .
n
(ii) wird genauso bewiesen. Wir nehmen das N von (i) und setzen Ñ = max{1000, N }.
(iii) Dies ist offensichtlich, weil n12 ≤ n1 gilt und limn→∞ n1 = 0. Wir wollen aber noch einmal
durch die Argumente durchgehen.
Es sei ∈ R, > 0. Da R archimedisch ist, gilt:
∃N ∈ N : N > 1.
Hieraus folgt
1
.
N
∃N ∈ N : >
Damit folgt
∃N ∈ N∀n > N :
Es folgt
∃N ∈ N∀n > N :
Da n ≥ 1 gilt, folgt
Und schließlich
1
< .
n
1
1
< .
n2
n
1
< .
n2
1
∃N ∈ N∀n > N >: 2 − 0 < .
n
∃N ∈ N∀n > N :
2.2. FOLGEN IN R
63
(iv) Da R Archimedisch ist, gilt
∀ > 0∃N ∈ N∀n > N :
1
< .
n
Es folgt
1
∀ > 0∃N ∈ N∀n > N : 1 + − 1 < .
n
Also
1
= 1.
n
konvergiert, bedeutet
lim 1 +
n→∞
(v) Die Aussage, dass eine Folge {xn }n∈N
∃x ∈ R∀ > 0 ∃N ∈ N ∀n > N : |xn − x| < .
Die Verneinung dieser Aussage ist
∀x ∈ R ∃ > 0 ∀N ∈ N ∃n > N : |xn − x| ≥ .
x ist gegeben. Wir unterscheiden zwei Fälle x ≥ 0 und x < 0. Es sei zunächst x ≥ 0. Wir wählen
= 21 . N ist gegeben. Wir wählen n = 2N + 1. Dann gilt
|xn − x| = |(−1)n − x| = | − 1 − x| = 1 + x ≥ 1 >
1
.
2
Falls x < 0, dann wählen wir = 12 . N ist gegeben. Wir wählen n = 2N . Dann folgt
|xn − x| = |(−1)n − x| = |1 − x| = 1 + |x| ≥ 1 >
1
.
2
2
In der Definition der Konvergenz treten verschiedene Ungleichungen auf. Es stellt
sich die Frage, ob die strikte Ungleichung notwendig ist oder der Gleichheitsfall auch
zugelassen werden kann.
Bemerkung 2.2.1 Es sei {xn }n∈N eine Folge reeller Zahlen und x0 ∈ R. Die
folgenden Aussagen sind äquivalent:
(i)
∀ > 0 ∃N ∈ N ∀n > N :
|xn − x0 | < (ii)
∀ > 0 ∃N ∈ N ∀n ≥ N :
|xn − x0 | < (iii)
∀ > 0 ∃N ∈ N ∀n ≥ N :
|xn − x0 | ≤ (iv)
∃c > 0∀ > 0 ∃N ∈ N ∀n ≥ N :
|xn − x0 | ≤ c · Beweis. Es gelten offensichtlich (ii) ⇒ (iii) ⇒ (iv).
Wir zeigen (i) ⇒ (ii). Aus (i) folgt
∀ > 0 ∃N ∈ N ∀n ≥ N + 1 :
|xn − x0 | < .
Wir zeigen nun (iv) ⇒ (i). Zu δ > 0 wählen wir =
ein N δ , so dass für alle n ≥ N δ
2c
2c
|xn − x0 | ≤
δ
<δ
2c
δ
.
2c
Dann gibt es nach (iv)
64
CHAPTER 2. DIE REELLEN ZAHLEN
gilt. Wir setzen nun Ñδ = N δ . Dann gilt
2c
∀δ > 0∃Ñδ ∈ N∀n ≥ Ñδ :
2
|xn − x0 | < δ.
Definition 2.2.3 Eine Folge {xn }n∈N in dem geordneten Körper (R, +, ·, ≤) heißt
Cauchy Folge, falls für alle ∈ R mit > 0 ein N ∈ N existiert, so dass für alle
n, m > N
|xm − xn | < gilt. (Quantorenschreibweise: ∀ > 0 ∃N ∀n, m > N : |xn − xm | < .)
Bemerkung 2.2.2 Jede konvergente Folge in R ist eine Cauchy Folge.
Beweis. (i) Es sei {xn }n∈N eine konvergente Folge. Ihren Grenzwert bezeichnen wir
mit x. Also gilt
∀ > 0 ∃N ∈ N ∀n > N : |xn − x| < .
Es folgt
∀ > 0 ∃N ∈ N ∀m, n > N :
∀ > 0 ∃N ∈ N ∀m, n > N :
Mit der Dreiecksungleichung folgt
|xn − x| < und |xm − x| < |xn − x| + |xm − x| < 2
∀ > 0 ∃N ∈ N ∀m, n > N :
2
|xn − xm | < 2.
Bemerkung 2.2.3 (i) Es sei {xn }n∈N eine reelle, konvergente Folge. Dann konvergiert {xn+1 }n∈N und die Grenzwerte sind gleich.
(ii) Es sei {xn }n∈N0 eine reelle, konvergente Folge. Dann konvergiert {xn−1 }n∈N und
die Grenzwerte sind gleich.
Beweis. (i) Die Folge konvergiere gegen x
∀ > 0∃N ∈ N∀n ≥ N : |xn − x| < .
Es folgt sofort
∀ > 0∃N ∈ N∀n ≥ N : |xn+1 − x| < .
(ii) Die Folge konvergiere gegen x
∀ > 0∃N ∈ N∀n ≥ N : |xn − x| < .
Damit folgt
∀ > 0∃N ∈ N∀n ≥ N + 1 : |xn−1 − x| < .
Wir wählen als Ñ = N + 1. Dann gilt
2
∀ > 0∃Ñ ∈ N∀n ≥ Ñ : |xn−1 − x| < .
2.2. FOLGEN IN R
65
Definition 2.2.4 Eine Folge {xn }n∈N heißt nach oben (unten) beschränkt, wenn es
eine Konstante C ∈ R gibt, so dass für alle n ∈ N
xn ≤ C
(xn ≥ C)
gilt. Die Folge heißt beschränkt, wenn sie sowohl nach unten als auch nach oben
beschränkt ist.
Lemma 2.2.1 Eine Cauchy Folge in R ist beschränkt. Insbesondere ist eine konvergente Folge beschränkt.
Beweis. Es sei {xn }n∈N eine Cauchy Folge. Dann
∀ > 0∃N ∈ N∀n, m ≥ N :
|xm − xn | < .
Wir wählen = 1. Dann
∃N1 ∈ N∀n, m ≥ N1 :
|xm − xn | < 1.
Insbesondere gilt
∃N1 ∈ N∀n ≥ N1 :
|xN1 − xn | < 1.
Mit der inversen Dreiecksungleichung folgt für alle n ≥ N1
|xn | < 1 + |xN1 |.
Es folgt, dass für alle n ∈ N
2
|xn | ≤ max{1 + |xN1 |, max{|x1 |, . . . , |xN1 |}}.
Lemma 2.2.2 Eine konvergente Folge in R hat genau einen Grenzwert.
Beweis. Wir nehmen an, dass es eine Folge {xn }n∈N gibt, die zwei verschiedene
Grenzwerte x und x0 hat. Dann gilt
∀ > 0∃N ∈ N∀n > N :
∀ > 0∃N0 ∈ N∀n > N0 :
|xn − x| < |xn − x0 | < .
Es sei Ñ = max{N , N0 }. Dann folgt
∀ > 0∃Ñ ∈ N∀n > Ñ :
|xn − x| + |xn − x0 | < 2.
Mit der Dreiecksungleichung folgt
∀ > 0∃Ñ ∈ N∀n > Ñ :
|x − x0 | < 2
und schließlich
∀ > 0 :
|x − x0 | < 2.
Es folgt x = x0 . Wir überprüfen dies. Falls x 6= x0 , dann gilt |x − x0 | > 0. Wir
können dann = 14 |x − x0 | wählen und erhalten einen Widerspruch. 2
66
CHAPTER 2. DIE REELLEN ZAHLEN
Lemma 2.2.3 Die rellen Folgen {xn }n∈N und {yn }n∈N konvergieren in R gegen die
Grenzwerte x und y. Dann gelten:
(i) {xn + yn }n∈N konvergiert gegen den Grenzwert x + y.
(ii) {xn · yn }n∈N konvergiert gegen den Grenzwert x · y.
(iii) Falls für alle n ∈ N gilt, dass yn 6= 0, und falls y 6= 0, dann konvergiert { xynn }n∈N
gegen xy .
Beweis. (i) Da die Folge {xn }n∈N gegen x konvergiert, gibt es für alle > 0 ein
N ∈ N, so dass für alle n > N die Ungleichung |xn − x| < gilt. Ebenso gibt es
für alle > 0 ein N0 ∈ N, so dass für alle n > N0 die Ungleichung |yn − y| < gilt.
Also gelten
∀ > 0 ∃N ∈ N ∀n > N :
∀ > 0 ∃N0 ∈ N ∀n > N0 :
|xn − x| < |yn − y| < .
Wir gehen wieder zu Ñ = max{N , N0 } über. Damit gilt
∀ > 0 ∃Ñ ∈ N ∀n > Ñ :
∀ > 0 ∃Ñ ∈ N ∀n > Ñ :
|xn − x| < |yn − y| < .
Wir addieren die beiden Ungleichungen
∀ > 0 ∃Ñ ∈ N ∀n > Ñ :
|xn − x| + |yn − y| < 2.
Mit der Dreiecksungleichung folgt
∀ > 0 ∃Ñ ∈ N ∀n > Ñ :
|(xn + yn ) − (x + y)| < 2.
(ii) Nach Lemma 2.2.1 gilt
∃C∀n ∈ N :
|yn | < C.
Wir nehmen zunächst an, dass x 6= 0. Außerdem gilt
∀ > 0∃N ∈ N∀n > N : |xn − x| < 2C
∀ > 0∃N0 ∈ N∀n > N0 : |yn − y| < 2|x|
Wir setzen nun Ñ = max{N , N0 } und erhalten
|xn · yn − x · y| = |xn · yn − x · yn + x · yn − x · y|
= |(xn − x)yn + x(yn − y)|
≤ |(xn − x)yn | + |x(yn − y)|
= |yn ||xn − x| + |x||yn − y| < C
+ = .
2C 2
Nun der Fall x = 0. Dann gilt
|xn · yn − x · y| = |xn · yn | ≤ C|xn |.
(iii) Wir setzen z =
1
y
und zn =
1
yn
und wenden (ii) an. 2
2.2. FOLGEN IN R
67
Lemma 2.2.4 (i) Es seien {xn }n∈N und {yn }n∈N zwei reelle, konvergente Folgen.
Weiter gelte für alle n ∈ N die Ungleichung xn ≤ yn . Dann
lim xn ≤ lim yn .
n→∞
n→∞
(ii) Es seien {xn }n∈N und {zn }n∈N zwei reelle, konvergente Folgen mit limn→∞ xn =
limn→∞ zn . Weiter sei {yn }n∈N eine reelle Folge und es gelte für alle n ∈ N
xn ≤ yn ≤ zn .
Dann konvergiert die Folge {yn }n∈N und
lim xn = lim yn = lim zn .
n→∞
n→∞
n→∞
Beweis. (i) Die Folge {xn }n∈N konvergiere gegen x und die Folge {yn }n∈N konvergiere gegen y. Dann konvergiert die Folge {yn − xn }n∈N konvergiert gegen y − x.
∀ > 0∃N ∈ N∀n ≥ N :
|(yn − xn ) − (y − x)| < .
∀ > 0∃N ∈ N∀n ≥ N :
(yn − xn ) − (y − x) < .
Es folgt
Hiermit folgt
∀ > 0∃N ∈ N∀n ≥ N :
0 ≤ (yn − xn ) < + (y − x).
Also gilt für alle > 0
− < y − x.
Somit gilt x ≤ y.
(ii) Die Folge {zn − xn }n∈N ist eine Nullfolge. Also gilt
∀ > 0∃N ∈ N∀n ≥ N :
|zn − xn | < .
Wegen xn ≤ yn ≤ zn folgt für alle n ≥ N
|zn − yn | ≤ |zn − xn | < .
Also gilt
∀ > 0∃N ∈ N∀n ≥ N :
|zn − yn | < .
Dies bedeutet, dass die Folge {yn − zn }n∈N eine Nullfolge ist. Da die Folge {zn }n∈N
eine konvergente Folge ist, so ist die Folge
{yn − zn + zn }n∈N = {yn }n∈N
ebenfalls konvergent. 2
68
2.3
CHAPTER 2. DIE REELLEN ZAHLEN
R ist vollständig
Karl Theodor Wilhelm Weierstraß wurde am 31. Oktober 1815 in Ostenfelde im Münsterland
geboren und starb am 19. Februar 1897 in Berlin. Er unterrichtete als Lehrer an verschiedenen
Gymnasien. Eine dieser Stellen erhielt er, weil er auch Turnen unterrichten konnte. Nebenher
forschte er in der Mathematik und erhielt 1856 auf Grund seiner Forschungen eine Professur an
der Universität Berlin. Einer seiner Verdienste ist es, dass er eine Strenge im mathematischen
Argumentieren einführte. Georg Cantor und Sofia Kowalewskaja waren Studenten von ihm. Er
unterrichtete Sofia Kowalewskaja privat, weil sie als Frau nicht an einer Universität studieren
durfte. Der Mondkrater Weierstraß ist nach ihm benannt.
Bernardus Placidus Johann Nepomuk Bolzano wurde am 5. Oktober 1781 in Prag geboren
und starb dort am 18. Dezember 1848. Er studierte und lehrte an der Prager Karls Universität. Er arbeitete an den Grundlagen der Analysis. Er war vermutlich der erste, der eine überall
stetige, aber nirgends differenzierbare Funktion konstruierte. Er arbeitete auch auf dem Gebiet
der Philosophie. Sein philosophisches Werk hat große Bedeutung. Er wurde am 24. Dezember
1891 von Kaiser Franz I. seines Amtes enthoben, weil er in seinen Vorlesungen pazifistische und
sozialistische Ansichten vertrat.
Wir wollen in diesem Abschnitt zeigen, dass in (R, +, ·, ≤) jede Cauchy Folge
konvergiert. Wir sagen dazu auch: R ist vollständig.
Definition 2.3.1 Eine Folge {xn }n∈N heißt monoton wachsend (fallend), falls für
alle n ∈ N
xn ≤ xn+1
(xn+1 ≤ xn )
gilt.
Beispiel 2.3.1 (i) Die Folge { n1 }n∈N ist monoton fallend.
(ii) Die Folge {1 −
1
n2 }n∈N
ist monoton wachsend.
(iii) Die Folge {xn }n∈N mit xn = 1 für alle n ∈ N ist monoton wachsend und fallend.
Satz 2.3.1 Es sei {xi }i∈N eine monoton wachsende, nach oben beschränkte Folge
reeller Zahlen. Dann existiert das Supremum dieser Folge und
lim xi = sup xn .
i→∞
n∈N
Die entsprechende Aussage für monoton fallende Folgen, die nach unten beschränkt
sind, gilt auch:
lim xi = inf xn
i→∞
n∈N
Beweis. Nach Satz 2.1.2 besitzt die Menge {xi |i ∈ N} ein Supremum in R. Wir
bezeichnen x0 = supn∈N xn . Dann gibt es zu jedem > 0 ein N ∈ N mit
x0 − < xN .
2.3. R IST VOLLSTÄNDIG
69
Falls dem nicht so wäre, dann gäbe es ein > 0, so dass für alle n ∈ N
xn ≤ x0 − gilt. Damit wäre dann x0 − eine obere Schranke und x0 wäre nicht die kleinste,
obere Schranke.
Da die Folge monoton wächst, folgt für alle n mit n ≥ N
x0 − < x N ≤ xn
und damit
2
|x0 − xn | = x0 − xn < .
Definition 2.3.2 Es sei I : N → R eine reelle Folge und J : N → N eine strikt
wachsende Abbildung, d.h. für alle i ∈ N gilt J(i) < J(i + 1). Dann sagen wir,
dass die Folge I ◦ J eine Teilfolge der Folge I ist. Wie üblich bezeichnen wir auch
das Bild von I, also {xn }n∈N als Folge. Entsprechend bezeichnen wir {xJ(i) }i∈N als
Teilfolge. Wir schreiben dafür auch {xni }i∈N , wobei für alle i ∈ N die Gleichung
J(i) = ni gilt.
Anschaulich erhalten wir aus einer Folge eine Teilfolge, wenn wir Folgenglieder
streichen.
1
}n∈N , { n12 }n∈N und { 21n }n∈N
Beispiel 2.3.2 Wir betrachten die Folge { n1 }n∈N . Dann sind { 2n
Teilfolgen.
Lemma 2.3.1 Es sei J : N → N eine strikt wachsende Abbildung, d.h. für alle
k ∈ N gilt J(k) < J(k + 1). Dann gilt für alle k ∈ N, dass k ≤ J(k).
Beweis. Wir zeigen dies mit Induktion. Offensichtlich gilt J(1) ≥ 1. Falls k ≤ J(k)
gilt, dann gilt k ≤ J(k) < J(k + 1). Also k + 1 ≤ J(k + 1). 2
Lemma 2.3.2 Es sei {xn }n∈N eine reelle, konvergente Folge und {xki }i∈N sei eine
Teilfolge von {xn }n∈N . Dann konvergiert die Teilfolge und sie konvergiert gegen den
Grenzwert von {xn }n∈N .
Beweis. Nach Lemma 2.3.1 gilt für alle n ∈ N kn ≥ n. Der Grenzwert der Folge
{xn }n∈N sei x, d.h.
∀ > 0∃N ∀n ≥ N : |xn − x| < .
Da aber für alle n ∈ N die Ungleichung n ≤ kn gilt, folgt aus N ≤ n die Ungleichung
N ≤ kn . Somit
∀ > 0∃N ∈ N∀n ≥ N : |xkn − x| < .
2
70
CHAPTER 2. DIE REELLEN ZAHLEN
Lemma 2.3.3 Es sei {xn }n∈N eine reelle Cauchy Folge, die eine konvergente Teilfolge {xnk }k∈N besitzt. Dann konvergiert auch die Folge {xn }n∈N und die Grenzwerte
sind gleich.
Beweis. Es sei {xn }n∈N eine reelle Cauchy Folge und {xnk }k∈N eine Teilfolge mit
Grenzwert x0 . Dann gilt
∀ > 0∃N ∈ N∀n, m ≥ N :
|xn − xm | < .
Wegen
|x0 − xn | = |x0 − xm + xm − xn | ≤ |x0 − xm | + |xm − xn |
folgt
(2.7)
∀ > 0∃N ∈ N∀n, m ≥ N :
|x0 − xn | < |x0 − xm | + .
Da die Teilfolge {xnk }k∈N gegen den Grenzwert x0 konvergiert
∀ > 0∃K ∈ N∀k ≥ K :
|x0 − xnk | < Wir wählen nun m = nk0 , wobei k0 ≥ K und nk0 ≥ N . Dann folgt aus (2.7)
∀ > 0∃N ∈ N∀n ≥ N :
|x0 − xn | < 2.
2
Lemma 2.3.4 Es sei {xn }n∈N eine Folge reeller Zahlen. Dann besitzt diese Folge
eine Teilfolge, die monoton wachsend oder monoton fallend ist.
Beweis. Wir zeigen, dass es eine Teilfolge gibt, die entweder monoton fallend oder
monoton wachsend ist. Es sei
(2.8)
M = {n ∈ N|∀` ≥ n : x` ≤ xn }.
Wir betrachten den Fall, dass M eine unendliche Menge ist. Wir definieren J : N →
N induktiv. Wir setzen J(1) = min M . Das Minimum existiert, weil N wohlgeordnet
ist. Wenn wir J(1), . . . , J(k) definiert haben, setzen wir
J(k + 1) = min (M \ {J(1), . . . , J(k)}) .
Das Minimum existiert wiederum, weil N wohlgeordnet ist. Es gilt für alle k ∈ N,
dass J(k) ∈ M und J(k) < J(k+1). Wir wollen uns überlegen, dass J(k) < J(k+1).
Wir nehmen an, dies sei nicht so. Dann gilt J(k) ≥ J(k + 1). Es kann nicht
J(k) = J(k + 1) gelten, weil J(k) nicht in der Menge ist. Also muss J(k) > J(k + 1)
gelten. Es gilt aber
J(k) = min (M \ {J(1), . . . , J(k − 1)})
2.3. R IST VOLLSTÄNDIG
71
und J(k + 1) wäre ein Element der Menge
(M \ {J(1), . . . , J(k − 1)}) .
Dies widerspricht aber der Definition von J(k).
Aus J(k) < J(k + 1) folgt, dass die Teilfolge
{xJ(k) }k∈N
monoton fallend ist.
Wir nehmen nun an, dass M eine endliche Menge ist. Wir konstruieren nun
durch Induktion eine monoton strikt wachsende Teilfolge bzw. eine strikt wachsende
Funktion J : N → N, so dass für alle i ∈ N die Ungleichung xJ(i) < xJ(i+1) gilt.
Es sei m0 das Maximum von M . (Falls M die leere Menge ist, dann gibt es
natürlich kein Maximum, wir haben im Folgenden keinerlei Einschränkungen.) Als
m1 wählen wir eine natürliche Zahl, die strikt größer als m0 ist und setzen J(1) = m1 .
Wir nehmen an, dass wir bereits J(1), . . . , J(k) gewählt haben. Da J(k) > m0 , so
gilt
J(k) ∈
/ {n ∈ N|∀` ≥ n : x` ≤ xn }
bzw.
J(k) ∈ {n ∈ N|∃` ≥ n : x` > xn }.
Also gibt es ein J(k + 1) mit
xJ(k) < xJ(k+1) .
2
Wir wollen hier noch einmal das Argument vom Beweis beschreiben. Im Beweis
ordnen wir die Menge (2.8) der Größe nach an
n1 < n2 < n3 < · · ·
und erhalten so unsere monoton fallende Teilfolge
xn1 ≥ xn2 ≥ xn3 ≥ · · ·
Beispiel 2.3.3 (i) Die Folge {(−1)n }n∈N hat die konstanten Folgen {1}n∈N und {−1}n∈N als
Teilfolgen. Beide sind sowohl monoton fallend als auch monoton wachsend.
(ii) Jede Teilfolge der Folge { n1 }n∈N ist monoton fallend.
Satz 2.3.2 In (R, +, ·, ≤) konvergiert jede Cauchy Folge. Wir sagen dazu auch,
dass R vollständig ist.
Beweis. Es sei {xn }n∈N eine Cauchy Folge. Nach Lemma 2.2.1 ist eine Cauchy
Folge beschränkt. Nach Lemma 2.3.4 besitzt diese Cauchy Folge eine Teilfolge, die
entweder monoton wachsend oder monoton fallend ist. Nach Satz 2.3.1 konvergiert
diese Teilfolge. Mit Lemma 2.3.3 folgt, dass dann auch die Cauchy Folge konvergiert.
2
72
CHAPTER 2. DIE REELLEN ZAHLEN
Bemerkung 2.3.1 Man kann aus der Vollständigkeit von R folgern, dass R Dedekind
vollständig ist.
Der Beweis von Bemerkung 2.3.1 benutzt das Prinzip der Intervallschachtelung:
Ein Intervall wird in zwei gleiche Teilintervalle unterteilt. Je nachdem in welchem
Teilintervall sich noch ein Punkt der Menge befindet, wird mit dem entsprechenden
Teilintervall fortgefahren. Man teilt dieses wieder in zwei gleiche Intervalle. Auf
diese Weise wird ein gesuchter Punkt ”eingeschachtelt.”
Beweis. Es sei M eine nach oben beschränkte Menge. Es gibt also ein b1 ∈ R, so
dass für alle x ∈ M gilt, dass x ≤ b1 . Wir wählen nun a1 ∈ M und betrachten
a1 + b1
a1 + b 1
und
, b1
a1 ,
2
2
Wir setzen
a2 =



 a1
a1 + b 1
falls M ∩
, b1 = ∅
2


 a1 + b 1
2

 a1 + b 1
2
b2 =

b1
sonst
a1 + b 1
falls M ∩
, b1 = ∅
2
sonst
Für n = 2, 3, . . . definieren wir



 an
an+1 =


 an + b n
2
bn+1

 an + bn
2
=

bn
an + bn
, bn = ∅
falls M ∩
2
sonst
an + b n
falls M ∩
, bn = ∅
2
sonst
Wir erhalten:
(i) Für alle n ∈ N
a1 ≤ a2 ≤ · · · ≤ an ≤ bn ≤ · · · ≤ b2 ≤ b1
(ii)
b n − an =
b 1 − a1
2n−1
(iii) bn , n ∈ N, sind obere Schranken von M .
(iv) Für alle n ∈ N gilt: Es gibt ein xn ∈ M mit an ≤ xn ≤ bn .
2.3. R IST VOLLSTÄNDIG
73
Da {an }n∈N eine beschränkte, monoton wachsende Folge und {bn }n∈N eine beschränkte, monoton fallende Folge ist, so konvergieren diese Folgen (Satz 2.3.1).
Wegen (ii) gilt
b 1 − a1
= 0.
n→∞ 2n−1
lim bn − lim an = lim (bn − an ) = lim
n→∞
n→∞
n→∞
Also sind beide Grenzwerte gleich.
b = limn→∞ bn ist eine obere Schranke von M , weil alle bn , n ∈ N, obere
Schranken von M sind: Falls es ein x0 ∈ M mit b < x0 gäbe, dann gibt es ein
N mit
x0 − b
∀n > N : |bn − b| <
.
2
Wegen bn ≥ x0 folgt
x0 − b
x 0 − b ≤ bn − b <
.
2
Also
x0 < b
Falls b keine kleinste, obere Schranke ist, dann gibt es ein c mit c < b, so dass für
alle x ∈ M gilt x ≤ c. Wegen (iv) gibt es ein n ∈ N mit c < xn ≤ bn . Also ist c
keine obere Schranke. 2
Satz 2.3.3 (Bolzano-Weierstraß) Jede beschränkte Folge in R hat eine konvergente
Teilfolge.
Die Folge xn = (−1)n , n ∈ N, konvergiert nicht, aber die Teilfolge x2k , k ∈ N,
konvergiert.
Beweis. Wir geben hier zwei Beweise an, die formal etwas verschieden aussehen,
inhaltlich aber sehr ähnlich sind.
(i) Es sei {xn }n∈N eine Folge, die in einem Intervall [a, b] enthalten ist. Wir
betrachten
S = {s ∈ [a, b]|s ≤ xn für unendlich viele n}
S hat b als obere Schranke. Da a ∈ S, so ist S nicht leer. Also hat S ein Supremum
c. c ist Limes einer Teilfolge. Wir weisen dies nach.
Für alle ξ < c gibt es unendlich viele n ∈ N mit ξ ≤ xn und für alle η > c gibt
es nur endlich viele n ∈ N (oder keines) mit η ≤ xn . Somit gibt es für alle k ∈ N ein
xnk mit c − k1 ≤ xnk ≤ c + k1 bzw.
|c − xnk | ≤
1
.
k
(ii) Es sei {xn }n∈N eine beschränkte Folge. Nach Lemma 2.3.4 besitzt diese Folge
eine Teilfolge, die entweder monoton wächst oder monoton fällt. Nach Lemma 2.3.1
konvergiert diese Teilfolge. 2
74
CHAPTER 2. DIE REELLEN ZAHLEN
Beispiel 2.3.4 (i) (1 + n1 )n , n ∈ N, ist eine monoton wachsende Folge.
(ii) (1 + n1 )n+1 , n ∈ N, ist eine monoton fallende Folge.
(iii) Beide Folgen konvergieren gegen denselben Grenzwert. Wir nennen diesen Grenzwert die
Eulersche Zahl e.
Die Zahl e ist von großer Bedeutung in der Mathematik. Wir werden später eine Reihe von
Ergebnissen kennenlernen, die diese Zahl betreffen.
Beweis. (i) Mit der Bernoulli Ungleichung (Beispiel 1.10.7) folgt
n
n n 1
1
1
1
>1− .
= 1− 2
1−
1+
n
n
n
n
Also gilt
1+
1
n
n n
1
1
>1−
1−
n
n
bzw.
1
1+
n
n 1
1−
n
n−1
> 1.
Es folgt
1+
1
n
n
>
1
1−
=
1 n−1
n
n
n−1
n−1
=
1+
1
n−1
n−1
.
(ii) Es folgt mit der Bernoulli-Ungleichung
1
1+
1 n
n
1−
1
n
1 − n12
n n
1
1
1
1+ 2
> 1+ 2
>1+ .
n −1
n
n
=
1 n
n
=
Weiter folgt
n
n−1
n
und schließlich
1
1+
n−1
n+1
1
> 1+
n
n
n+1
1
> 1+
n
(iii) Die beiden Folgen (i) und (ii) sind beschränkt. Man sieht sofort, dass beide Folgen von unten
durch 1 beschränkt sind. Andererseits ist (1 + n1 )n+1 eine monoton fallende Folge. Deshalb gilt
für alle n ∈ N
n+1 n
1
1
4≥ 1+
≥ 1+
n
n
Nach Lemma ?? konvergieren sie beide. Wir definieren
n
1
e = lim 1 +
n→∞
n
Nach Lemma 2.2.3 konvergiert die Folge
1+
1
n
n+1
n
1
− 1+
n
n∈N
2.3. R IST VOLLSTÄNDIG
75
Wegen
n+1 n
n
1
1
1
1
− 1+
=
1+
1+
n
n
n
n
gilt
lim
n→∞
1
1+
n
Die letzte Gleichung gilt, weil n1
Wir wenden Lemma 2.2.3 an. 2
n !
n
1
1
1
− 1+
1+
=0
= lim
n→∞ n
n
n
n
1 + n1 , n ∈ N, das Produkt von zwei konvergenten Folgen ist.
n+1
Mit Beispiel 2.3.4 können wir für die Zahl e folgende Abschätzungen bekommen.
n=1:
n=2:
n=3:
n = 1000 :
2≤
2, 25 ≤
3
4
≤
2, 37... =
3
2, 716923... ≤
e ≤4
e ≤ 3, 375
4
4
e ≤
= 3, 16...
3
e ≤ 2, 71964...
Die Zahl e spielt in der Zinsrechnung eine Rolle. Ein Geldbetrag G sei pro Jahr mit
r Prozent verzinst. Nach einem Jahr erhält man also G(1 + r). Werden die Zinsen
r 12
jedoch monatlich ausgezahlt, so erhält man G(1 + 12
) am Ende des Jahres. Falls
r 365
eine Bank bereit ist, die Zinsen täglich auszuzahlen, so erhält man G(1 + 365
)
am Ende des Jahres. Werden also die Zinsen k mal im Jahr ausgezahlt, so erhält
man G(1 + kr )k am Ende des Jahres. Offensichtlich erhält man desto mehr Geld, je
häufiger die Zinsen während des Jahres ausgezahlt werden. Eine Verallgemeinerung
von Beispiel 2.3.4 besagt, dass man nie mehr als Ger am Ende des Jahres erhält.
Der Betrag Ger würde ausgezahlt, wenn die Zinsen stetig ausgezahlt würden.
√
Die Quadratwurzel x einer reellen, positiven Zahl x soll genau diejenige positive
Zahl sein, die, wenn man sie mit sich selbst multipliziert, x liefert. Die Existenz
einer solchen Zahl wird durch das nächste Beispiel geliefert. Die Eindeutigkeit ist
offensichtlich.
Beispiel 2.3.5 (Heron von Alexandrien) Es seien x, x1 ∈ R mit x, x1 > 0. Für n ∈ N setzen wir
x
1
xn +
.
(2.9)
xn+1 =
2
xn
Dann gilt
lim xn =
n→∞
√
x
und für alle n = 2, 3, . . . gilt
(2.10)
√
x
≤ x ≤ xn .
xn
Insbesondere existiert die Quadratwurzelfunktion, d.h. es gibt eine Funktion w : [0, ∞) → [0, ∞),
so dass für alle x ∈ [0, ∞)
(w(x))2 = x
gilt. Die Funktion w ist monoton wachsend.
76
CHAPTER 2. DIE REELLEN ZAHLEN
Die im Beispiel angegebene Folge stellt ein Iterationsverfahren dar, mit dem man die Wurzel
einer Zahl berechnen kann. Es stammt von dem griechischen Mathematiker Heron von Alexandrien
(ca. 60 n. Chr.). Das Iterationsverfahren besteht darin, dass der Mittelwert von zwei Zahlen
gebildet wird, deren Produkt x ist.
Das Verfahren konvergiert schnell, wenn man mit einem guten Anfangswert x1 beginnt. Dann
erhält man bei jeder Iteration zwei genaue Dezimalstellen. Wenn der Anfangswert nicht gut gewählt
wird, konvergiert das Verfahren langsam.
Die Iteration von Heron ist ein Spezialfall des Verfahrens von Newton zum Auffinden einer
n)
Nullstelle einer Funktion. Hierbei setzt man xn+1 = xn − ff0(x
(xn ) . In dem vorliegenden Beispiel
wählt man f (t) = t2 − x.
Bevor wir die Behauptungen beweisen,
√ wollen wir eine einfache Überlegung anstellen, die sofort
zeigt, warum der Grenzwert der Folge x ist. Wir nehmen an, dass der Grenzwert existiert und
verschieden von 0 ist. Dann folgt
(2.11)
lim xn+1 =
n→∞
1
x
1
lim xn + ·
n→∞
2
2 limn→∞ xn
Wir bezeichnen den Grenzwert der Folge mit x0 und erhalten
x0 =
x 1
1
x0 + · .
2
2 x0
Also gilt
x20 = x
Für den Beweis des Beispiels benötigen wir die folgende Abschätzung.
Lemma 2.3.5 Für alle s, t ∈ R gilt
Für s 6= t gilt
4st ≤ (s + t)2 .
4st < (s + t)2 .
Dies ist eigentlich die Abschätzung zwischen dem geometrischen und arithmetischen Mittel für
nichtnegative, reelle Zahlen s und t
√
s+t
st ≤
.
2
Da wir hier erst die Existenz der Wurzel nachweisen, haben wir die Ungleichung ohne die Wurzel
formuliert.
Beweis. Es gilt
0 ≤ (s − t)2 = s2 − 2st + t2 .
Es folgt
4st ≤ s2 + 2st + t2 = (s + t)2 .
2
Beweis von Beispiel 2.3.5. Wir überlegen uns zuerst, dass die Folge wohldefiniert ist. Dazu
müssen wir zeigen, dass kein xn , n ∈ N, gleich 0 ist. Wir zeigen, dass für alle n ∈ N die Ungleichung 0 < xn gilt. Dies zeigen wir durch Induktion. Der Induktionsanfang liefert x1 = 1. Im
Induktionsschritt nehmen wir an, dass xn > 0 und erhalten
xn+1 =
1
x 1
xn + ·
> 0.
2
2 xn
2.3. R IST VOLLSTÄNDIG
77
Wir zeigen, dass {xn }∞
n=2 eine monoton fallende Folge ist. Da wir bereits wissen, dass die Folge
nach unten beschränkt ist, konvergiert sie (Satz 2.3.1). Dazu zeigen wir, dass für alle n ∈ N mit
n≥2
x ≤ x2n
(2.12)
gilt. Mit Lemma 2.3.5 folgt für n ∈ N
x2n+1 =
x 1
1
xn + ·
2
2 xn
2
1 x 1
≥ 4 xn ·
= x.
2 2 xn
Wir zeigen nun, dass die Folge monoton fallend ist. Aus x2n ≥ 2 und xn > 0 folgt, dass für alle
n≥2
x
≤ xn .
xn
Wir addieren auf beiden Seiten xn
xn +
x
≤ 2xn .
xn
Also gilt für alle n = 2, 3, . . .
xn+1 ≤ xn .
Da wir bereits wissen, dass die Folge nach unten beschränkt ist, konvergiert sie (Satz 2.3.1).
Wir wollen nun zeigen, dass der Grenzwert verschieden von 0 ist. Falls x ≥ 1, dann gilt
limn→∞ xn ≥ 1. Wir zeigen dies. Falls limn→∞ xn < 1, dann folgt mit (2.12)
1 > ( lim xn )2 = lim x2n ≥ x ≥ 1.
n→∞
n→∞
Falls 0 < x < 1, dann gilt limn→∞ xn ≥ x. Wir zeigen dies. Falls limn→∞ xn < x, dann folgt mit
(2.12)
x2 > ( lim xn )n = lim x2n ≥ x.
n→∞
n→∞
2
Also x > x bzw. x > 1.
x ∞
{xn }∞
n=2 ist eine monoton fallende Folge und somit { xn }n=2 eine monoton wachsende Folge.
√
Beide Folgen konvergieren gegen x. Somit folgt (2.10).
Es bleibt noch zu zeigen,
strikt
√ dass√die Wurzelfunktion
√ monoton wachsend ist, d.h. für alle
√
x, y ∈ R mit 0 < x < y gilt x < y. Falls nämlich y ≤ x, dann
√ √
√ √
y = y · y ≤ x · x = x.
2
Für
√
2 wollen wir noch die numerischen Werte der ersten Folgenglieder festhalten.
√
4
2
=
≤
2
3
x2
√
24
2
1, 41176... =
=
≤
2
17
x3
√
816
2
1, 41421... =
=
≤
2
577
x4
1, 333... =
Für
√
3
= 1, 5
2
17
≤ a3 =
= 1, 41666...
12
577
≤ x4 =
= 1, 41421...
408
≤ a2 =
7 erhalten wir mit dem Heron Verfahren für x1 = 2.
x2 =
1
2
x1 +
7
x1
=
11
4
78
CHAPTER 2. DIE REELLEN ZAHLEN
1
x3 =
2
x4
=
=
7
x2 +
x2
1
=
2
11 4 · 7
+
4
11
=
233
88
1
7
1 233 7 · 88
x3 +
=
+
2
x3
2 88
233
2
2
233 + 7 · 88
54289 + 54208
108497
=
=
∼ 2, 64575205....
176 · 233
41008
41008
7
287056
=
= 2, 64575057...
x4
108497
Das Heron Verfahren lässt sich auf allgemeine, ganzzahlige Wurzeln verallgemeinern.
Beispiel 2.3.6 Es sei x eine positive, reelle Zahl und k ∈ N mit 2 ≤ k. Weiter seien a1 = 1 und
für n ≥ 1
(k − 1)(an )k + x
.
an+1 =
k(an )k−1
Dann gilt
lim (an )k = x.
n→∞
Der Grenzwert der Folge ist also die k-te Wurzel von x.
Beweis. Es gilt
an+1 k(an )k−1 = (k − 1)(an )k + x.
Deshalb
lim an+1 k(an )k−1 = lim (k − 1)(an )k + x.
n→∞
n→∞
und somit
k
lim an
k
n→∞
= (k − 1)
lim an
n→∞
k
+ x.
Wir erhalten schließlich
lim an
n→∞
k
= x.
2
Beispiel 2.3.7 (Schriftliches Wurzelziehen) Wir beschreiben hier ein Verfahren, um die Quadratwurzel
aus einer natürlichen Zahl zu ziehen.
Der Radikand wird in Gruppen von zwei Ziffern unterteilt, wobei wir rechts beginnen. Nun
betrachten wir die erste Zahlengruppe, die Gruppe, die ganz links steht. Sie kann aus einer oder
zwei Ziffern bestehen. Zu dieser ein- oder zweistelligen Zahle suchen wir die größte (einstellige)
Zahl, deren Quadrat kleiner oder gleich dieser Zahl ist. Diese Zahl ist die erste Ziffer der Quadrat
wurzel. Nun ziehen wir die Quadratzahl von der ersten Gruppe ab und ergänzen die Differenz mit
den folgenden beiden Ziffern.
Beispiel 2.3.8 Es sei a1 ∈ R und
an+1 = an + a2n
n∈N
Dann konvergiert diese Folge für alle a1 mit −1 ≤ a1 ≤ 0 gegen 0. Für alle anderen Werte
divergiert die Folge.
2.3. R IST VOLLSTÄNDIG
79
Beweis. Die Folge ist monoton wachsend
an+1 = an + a2n ≥ an
und für alle n ∈ N gilt −1 ≤ an ≤ 0, falls −1 ≤ a1 ≤ 0. Wir weisen dies mit Induktion nach.
Es gilt nach Voraussetzung −1 ≤ a1 ≤ 0. Wir nehmen nun an, dass −1 ≤ an ≤ 0. Dann gelten
0 ≤ 1 + an ≤ 1,
an+1 = an + a2n = an (1 + an ) ≤ 0
und
an+1 = an + a2n = an (1 + an ) ≥ −1.
Damit ist die Folge für −1 ≤ a1 ≤ 0 monoton wachsend und beschränkt und nach Lemma ??
konvergent. In diesem Fall folgt für den Grenzwert
2
lim an = lim an+1 = lim an + lim an
n→∞
n→∞
n→∞
n→∞
also
lim an = 0.
n→∞
Wir betrachten nun die anderen Fälle. Es sei 0 < a1 . Dann gilt für alle an , n ∈ N,
an ≥ a1 .
Falls die Folge konvergiert, dann gilt also
0 < a1 ≤ lim an .
n→∞
Wir hatten uns aber bereits überlegt, dass der Grenzwert 0 sein muss. Falls a1 < −1, dann
a2 = a1 + a21 = a1 (1 + a1 ) > 0.
Nun verfahren wir wie im Fall a1 > 0. 2
Beispiel 2.3.9 [51, 74] (i) Es sei {an }n∈N eine Folge positiver, reeller Zahlen. Die Folge
s
r
q
√
a1 + a2 + · · · + an−1 + an
n∈N
konvergiert genau dann, wenn es eine Zahl c > 0 gibt, so dass für alle n ∈ N die Ungleichung
n
an ≤ c(2 ) gilt.
(ii) Insbesondere konvergiert
s
r
q
√
x + x + ··· + x + x
für x > 0 und der Grenzwert ist
1
2
+
q
x + 14 .
Beweis. (i) Wir überlegen uns zunächst, dass für alle Folgen {an }n∈N und {bn }n∈N , so dass für
alle n ∈ N die Ungleichungen 0 ≤ an ≤ bn gelten,
s
s
r
r
q
q
p
√
a1 + a2 + · · · + an−1 + an ≤ b1 + b2 + · · · + bn−1 + bn
für alle n ∈ N gelten. Wir zeigen dies mit Induktion. Der Induktionsanfang folgt, weil die
Wurzelfunktion monoton wachsend ist (Beispiel 2.3.5(ii)). Nun der Induktionsschritt. Die Aussage
gilt für alle Folgen der Länge n. Wir wenden diese Aussage auf die Folgen
p
√
a1 , . . . , an−1 , ãn = an + an+1
und
b1 , . . . , bn−1 , b̃n = bn + bn+1
80
CHAPTER 2. DIE REELLEN ZAHLEN
an.
Wir zeigen, dass die Bedingung notwendig ist. Wenn wir a1 , . . . , an−1 durch 0 ersetzen, erhalten
wir für alle n ∈ N
r
q
q
√
√
a1 + a2 + · · · + an ≥ · · · an .
n
Falls es zu jedem c > 0 ein n ∈ N mit an > c(2 ) gibt, dann gilt
r
q
√
c ≤ a1 + a2 + · · · + an
und die Folge ist unbeschränkt, kann also nicht konvergieren.
Wir zeigen nun, dass die Bedingung hinreichend ist. Falls es eine Zahl c gibt, so dass für alle
n
n ∈ N die Ungleichung an ≤ c(2 ) gilt, dann folgt für alle n ∈ N
r
r
r
q
q
q
p
√
√
n)
2
4
(2
a1 + a2 + · · · + an ≤ c + c + · · · + c
= c 1 + 1 + · · · + 1.
Weiter gilt
2
=
=
√
2+
q
√
2 + 2 = ···
r
q
√
√
2 + · · · + 2 + 2 > 1 + 1 + · · · + 1.
2+2=
r
q
2+
Damit ist die Folge nach oben beschränkt. Außerdem ist sie monoton wachsend.
s
r
r
q
q
√
√
a1 + a2 + · · · + an < a1 + a2 + · · · + an + an+1
Mit Lemma ?? folgt, dass die Folge konvergiert.
(ii) Wir wenden (i) an, um festzustellen, dass die Folge konvergiert. Die Folge lässt sich auch
so schreiben:
p
√
b1 = x
bn+1 = x + bn .
Dies bedeutet, dass für alle n ∈ N
b2n+1 = x + bn
gilt. Mit Lemma 2.2.3 folgt
lim bn
2
n→∞
= lim b2n+1 = x + lim bn .
n→∞
n→∞
Es folgt für den Grenzwert b der Folge
also b =
1
2
b2 = x + b,
q
± x + 14 . Da der Grenzwert positiv sein muss, folgt b =
Beispiel 2.3.10 (i) Für alle x ∈ R mit |x| < 1 gilt
lim xn = 0.
n→∞
(ii)
lim
n→∞
(iii) Für alle x ∈ R gilt
n!
=0
nn
xn
= 0.
n→∞ n!
lim
1
2
+
q
x + 41 . 2
2.4. DIFFERENZENGLEICHUNGEN
81
Beweis. (i) Gegeben sei > 0. Nun wählen wir N , so dass für alle n > N gilt
1
1
<n
−1
|x|
1
Dies ist möglich, weil R Archimedisch ist und 1 < |x|
. Damit und mit der Bernoulli-Ungleichung
folgt, dass
n
1
1
1
1
1
= 1+
−1
≥1+n
−1 >n
−1 >
n
|x|
|x|
|x|
|x|
Also gilt für alle n > N
|xn − 0| < Wir geben noch einen alternativen Beweis an. Die Folge {xn }n∈N ist für x mit 0 ≤ x < 1 monoton
fallend und beschränkt. Es gilt für alle n ∈ N
0 ≤ xn < 1.
Da die Folge monoton fallend und beschränkt ist, konvergiert sie nach Lemma ??. Weiter gilt
lim xn = lim xn+1 = x lim xn .
n→∞
n→∞
n→∞
Es folgt
lim xn = 0.
n→∞
(ii) Es gilt
0≤
(iii) Die Folge
xn
n! ,
1
n!
≤
n
n
n
n ∈ N, ist für n > x monoton fallend: Es gilt für n > x
xn+1
xn
≥
n!
(n + 1)!
weil dies zu
n+1≥x
äquivalent ist. Damit ist die Folge nach oben beschränkt. Außerdem ist die Folge nach unten
durch 0 beschränkt. Mit Lemma ?? folgt, dass die Folge konvergiert. Da limn→∞ n1 = 0 folgt
xn
x
x
xn−1
xn
lim
= lim
lim
= lim
lim
= 0.
n→∞ n!
n→∞ n
n→∞ (n − 1)!
n→∞ n
n→∞ n!
2
2.4
Differenzengleichungen
Wir bezeichnen den Vektorraum aller reellen Folgen mit R∞ . Es seien a1 , . . . , ak ∈ R
und {xn }∞
n=0 eine reelle Folge. Falls für alle n mit n ≥ k die Gleichungen
xn + a1 xn−1 + · · · + ak xn−k = 0
gelten, dann sagen wir, dass die Folge die Differenzengleichung mit den Koeffizienten
a1 , . . . , ak erfüllt.
Man überlegt sich leicht, dass die Menge aller Lösungen ein linearer Teilraum
des Vektorraumes aller unendlichen Folgen ist.
82
CHAPTER 2. DIE REELLEN ZAHLEN
Differenzengleichungen liefern interessante Beispiele von Folgen, für die wir Konvergenz untersuchen. Das bekannteste Beispiel sind die Fibonacci Zahlen (Beispiel
2.4.2), die die Entwicklung einer Kaninchenpopulation beschreiben. Interessant ist
bei diesem Beispiel, dass der Goldene Schnitt auftaucht.
Darüber hinaus gibt es viele Beispiele aus Wirtschaftswissenschaften, Psychologie
und Soziologie in der der Goldene Schnitt erscheint.
Satz 2.4.1 (Differenzengleichung) Es seien a1 , . . . , ak ∈ R und wir nehmen an, dass
λ1 , . . . , λk ∈ R paarweise verschiedene Nullstellen des Polynoms
(2.13)
tk + a1 tk−1 + · · · + ak−1 t + ak = 0
sind. Dann ist
{(λni )∞
n=0 |i = 1, . . . , k}
eine Basis des Lösungsraumes der Differenzengleichung
xn + a1 xn−1 + · · · + ak xn−k = 0
n ≥ k.
Das Polynom tk + a1 tk−1 + · · · + ak−1 t + ak heißt das charakteristische Polynom
der Differenzengleichung.
Beweis. Falls λ eine Nullstelle des Polynoms
tk + a1 tk−1 + · · · + ak−1 t + ak
ist, so ist (λn )∞
n=0 eine Lösung. Dies ist offensichtlich: Aus
λk + a1 λk−1 + · · · + ak−1 λ + ak = 0
folgt für alle n ∈ N mit n ≥ k
λn−k (λk + a1 λk−1 + · · · + ak−1 λ + ak ) = 0
also für alle n ∈ N mit n ≥ k
λn + a1 λn−1 + · · · + ak−1 λn−k+1 + ak λn−k = 0.
Daraus folgt, dass das Erzeugnis von
{((λi )n )∞
n=0 |i = 1, . . . , k}
im Lösungsraum enthalten ist. Außerdem sind die Vektoren
((λi )ni )∞
n=0
i = 1, . . . , k
im Raum R∞ linear unabhängig. Dazu müssen wir zeigen, dass aus der Gleichung
k
X
i=1
ci ((λi )ni )∞
n=0 = 0
2.4. DIFFERENZENGLEICHUNGEN
83
folgt c1 = c2 = · · · = ck = 0. Es reicht also zu zeigen, dass aus
k
X
ci ((λi )ni )k−1
n=0 = 0
i=1
folgt c1 = c2 = · · · = ck = 0. Deshalb

 
1
 λ1  

 
 λ2  
 1 ,
 ..  
 .  
λk−1
1
reicht es aus nachzuweisen, dass die Vektoren



1
1
 λk 
λ2 



2 
2 
λ2  , . . . , 
 λk 
 .. 
.. 
 . 
. 
k−1
λ2
λkk−1
im Raum Rk linear unabhängig sind. Dazu zeigen wir, dass die Determinante dieser
Matrix von 0 verschieden ist. Es handelt sich um die Vandermondesche Determinante, die sich zu
Y
(λi − λj )
i>j
berechnet. Da alle λi paarweise verschieden sind, ist die Determinante von 0 verschieden.
Es bleibt noch zu zeigen, dass die Dimension des Raumes aller Lösungen kleiner
oder gleich k ist. Jede Lösung ist durch die ersten k Koordinaten x0 , . . . , xk−1
bestimmt. Dies folgt aus der Rekursionsformel. Also ist die Dimension des Raumes
gleich k. 2
Lemma 2.4.1 Es seien a1 , . . . , ak ∈ R und wir nehmen an, dass λ ∈ R eine reelle
Nullstelle der Vielfachheit ` des charakteristischen Polynoms
(2.14)
tk + a1 tk−1 + · · · + ak−1 t + ak = 0
ist. Dann sind
(nj λn )∞
n=0 |j = 0, . . . , ` − 1
Lösungen der Differenzengleichung
xn + a1 xn−1 + · · · + ak xn−k = 0
n ≥ k.
Lemma 2.4.2 Es seien a1 , . . . , ak ∈ R und wir nehmen an, dass r(cos θ + i sin θ)
eine komplexe Nullstelle der Vielfachheit ` des charakteristischen Polynoms
(2.15)
tk + a1 tk−1 + · · · + ak−1 t + ak = 0
ist. Dann sind für alle b ∈ R
{(rn cos(nθ + b))∞
n=0 |j = 0, . . . , ` − 1}
Lösungen der Differenzengleichung
xn + a1 xn−1 + · · · + ak xn−k = 0
n ≥ k.
84
CHAPTER 2. DIE REELLEN ZAHLEN
Man beachte, dass mit r(cos θ+i sin θ) auch r(cos θ−i sin θ) Nullstelle des charakteristischen Polynoms ist.
Beispiel 2.4.1 Es seien a, b ∈ R. Wir setzen x0 = a, x1 = b und für n = 2, 3, . . .
xn =
1
(xn−1 + xn−2 )
2
dann gilt
lim xn =
n→∞
2
1
a+ b
3
3
Beweis. Wir wenden Satz 2.4.1 an. Das charakteristische Polynom der Differenzengleichung ist
t2 − 21 t − 12 . Die Nullstellen sind 1 und − 12 . Deshalb ist
(1)∞
n=0
− 12
n ∞
n=0
eine Basis des Lösungsraumes. Wir bestimmen nun die Koeffizienten c1 und c2 , so dass
a = x0 = c1 + c2
b = x1 = c1 − 21 c2
Also
b = a − c2 − 12 c2
c2 = 23 (a − b)
c1 = a − c2 = a − 23 (a − b) = 31 a + 23 b.
Damit ist die Folge
2
1 n
( 13 a + 23 b)(1)∞
n=0 + 3 (a − b) (− 2 )
∞
n=0
die Lösung und
lim ( 31 a + 23 b) + 23 (a − b)(− 21 )n = 31 a + 23 b.
n→∞
2
Beispiel 2.4.2 Die Fibonacci Zahlen sind durch die Rekursion
xn+2 = xn+1 + xn
mit x0 = 0 und x1 = 1 gegeben. Dann gilt
√
xn+1
1+ 5
lim
=
= 1, 6180...
n→∞ xn
2
(2.16)
√
Die Zahl 1+2 5 bezeichnet man als den Goldenen Schnitt. Zwei Strecken a und b mit a < b stehen
im Verhältnis des Goldenen Schnittes, wenn sich die größere zur kleineren Strecke verhält wie die
Summe aus beiden zur größeren
a
b
=
.
b
a+b
Der Goldene Schnitt spielt in der Architektur eine Rolle.
2.4. DIFFERENZENGLEICHUNGEN
85
Mit Hilfe dieser Zahlenfolge hat Leonardo Fibonacci (1180-1241) das Wachstum einer Kaninchenpopulation beschrieben. Hierbei hat er folgende Annahmen gemacht:
(i) Jedes Paar Kaninchen wirft pro Monat ein weiteres Paar Kaninchen.
(ii) Ein neugeborenes Paar bekommt erst im zweiten Lebensmonat Nachwuchs.
(iii) Die Tiere sind isoliert.
Die Zahl der Kaninchen Paare in einem gegebenen Monat setzt aus den Paaren zusammen, die im
Vormonat gelebt haben und den neugeborenen Paaren. Die Anzahl der neugeborenen Paare ist
gleich der Anzahl der Paare, die im Vorvormonat gelebt haben.
Beweis. Wir benutzen den Satz über die Lösungen der Differenzengleichungen. Wir müssen die
Nullstellen des Polynoms
t2 − t − 1 = 0
bestimmen. Die Nullstellen sind
√
1+ 5
2
Somit ist
√
1− 5
.
2
und
√ !n !∞
1− 5
2
√ !n !∞
1+ 5
2
n=0
n=0
eine Basis des Lösungsraumes. Nun wählen wir die Koeffizienten c1 und c2 , so dass
√
√
1+ 5
1− 5
c1 + c2 = 0
und
c1
+ c2
= 1.
2
2
Es folgt c2 = −c1 und damit
√
√
1+ 5
1− 5
c1
− c1
= 1.
2
2
Also
1
c1 = √ .
5
Als Lösung erhalten wir
√ !n !∞
1+ 5
−
2
1
√
5
n=0
Damit erhalten wir
lim
n→∞
xn+1
= lim
n→∞
xn
√ n+1
1+ 5
2
√ n
1+ 5
2
Wegen
−
−
√ n+1
1− 5
2
√ n
1− 5
2
=
−
−
√ n+1
1− 5
2
√ n .
1− 5
2
√ n+1
1+ 5
2
√ n
1+ 5
2
1−
n
1−
1 − √5 1
√ ≤ .
1 + 5 2
gilt
lim
n→∞
Hiermit folgt nun (2.16). 2
n=0
√ n+1
1+ 5
2
√ n
1+ 5
2
Es gilt
√ !n !∞ !
1− 5
2
√ !n
1− 5
√
= 0.
1+ 5
√ n+1
1−√5
1+ 5
√ n o
1−√5
1+ 5
.
86
CHAPTER 2. DIE REELLEN ZAHLEN
Beispiel 2.4.3 ([45], S. 156) Wir betrachten ein Nachrichtenübertragungssysten, dem zwei Signale S1 und S2 zur Verfügung stehen. Die Nachrichten werden zunächst zu Folgen von S1 und S2
codiert. Das Signal S1 benötigt die Zeit t1 , um übertragen zu werden, und S2 die Zeit t2 . Es sei
Nt die Anzahl aller möglichen Nachrichten, die man in einer Zeit t übertragen kann.
Wir wollen nun die Zahl Nt bestimmen. Dazu stellen wir eine Differenzengleichung auf. Wir
betrachten alle jene Nachrichten, die mit einem S1 enden. Für alle jene Nachrichten, die mit S1
enden gibt es Nt−t1 Möglichkeiten, entsprechend Nt−t2 , wenn die Nachricht mit S2 endet. Wir
erhalten also
Nt = Nt−t1 + Nt−t2
Falls t1 = t2 = 1, dann handelt es sich um die Fibonacci Zahlen (Beispiel 2.4.2) und wir erhalten
Nt = C1
√ !t
1− 5
.
2
√ !t
1+ 5
+ C2
2
Die Konstanten C1 und C2 sind durch N0 und N1 festgelegt. Berücksichtigen wir die Bedeutung
von Nt wählen wir N0 = 0 und N1 = 1. Wir erhalten
1
C1 = √
5
1
C2 = − √ .
5
und
Die Kapazität eines Nachrichtenkanals wir von Shannon durch
C = lim
t→∞
log2 Nt
t
definiert. Wir wollen etwas auf diese Definition eingehen: Um ein Wort besteht aus einer Folge
von S1 und S2 . Jede Wahl von S1 oder S2 liefert die Information 2 insgesamt also Nt = 2k .
Wir erhalten
√
1+ 5
C = log2
∼ 0, 7.
2
Beispiel 2.4.4 Es sei die Differenzengleichung
xn − 23 xn−1 + 12 xn−2 = 0
n≥2
mit x0 = a und x1 = b gegeben. Die Folge konvergiert und der Grenzwert ist 2b − a.
Beweis. Die charakteristische Gleichung ist
t2 − 23 t +
1
2
=0
Die Nullstellen sind 1 und 21 . Damit ist
{1}∞
n=0
1
2n
∞
n=0
eine Basis des Lösungsraumes.
a = x0 = c1 + c2
1
b = x1 = c1 + c2
2
Also
Der Grenzwert ist 2b − a. 2
1
b = a − c2 + c2
2
c2 = 2(a − b)
c1 = 2b − a
2.5. LIMES SUPERIOR UND LIMES INFERIOR
2.5
87
Limes Superior und Limes Inferior
Definition 2.5.1 Es sei {xn }n∈N eine reelle Folge. Eine Zahl x0 ∈ R heißt Häufungswert
der Folge, falls für jedes > 0 die Menge
{n ∈ N||xn − x0 | < }
unendlich viele Elemente enthält. In Quantorenschreibweise:
∀ > 0∀N ∈ N∃n ≥ N :
|x0 − xn | < .
Lemma 2.5.1 Es sei {xn }n∈N eine reelle Folge. x0 ist genau dann Häufungswert
dieser Folge, wenn {xn }n∈N eine Teilfolge hat, die gegen x0 konvergiert.
Beweis. Wir nehmen an, dass x0 der Grenzwert einer Teilfolge {xnk }k∈N von
{xn }n∈N ist. Dann
∀ > 0∃K ∈ N∀k ≥ K :
|x0 − xnk | < Zu gegebenen > 0 und K ∈ N wählen wir nun k = max{K, K }. Es folgt
∀ > 0∀K ∈ N∃k ≥ K :
|x0 − xnk | < .
Wir nehmen nun an, dass x0 ein Häufungswert der Folge {xn }n∈N ist. Dann
∀ > 0∀N ∈ N∃n ≥ N :
|x0 − xn | < .
Es folgt
∀m ∈ N∀N ∈ N∃n ≥ N :
|x0 − xn | <
1
.
m
Wähle xn1 mit |x0 − xn1 | < 1. Nachdem wir xn1 , . . . , xnk gewählt haben, wählen wir
nk+1
= min n n > nk ∧ |x0 − xn | <
1
k+1
Dieses Minimum existiert, da N wohlgeordnet ist. Die Folge {xnk }k∈N erfüllt also
∀k ∈ N :
Also konvergiert sie gegen x0 . 2
|x0 − xnk | <
1
.
k
88
CHAPTER 2. DIE REELLEN ZAHLEN
Definition 2.5.2 Es sei {xn }n∈N eine Folge reeller Zahlen. Wir setzen für k ∈ N
yk = sup{xn |k ≤ n} = sup{xk , xk+1 , xk+2 , . . . }.
Der Limes Superior der Folge {xn }n∈N ist
lim sup xn = lim yk .
n→∞
k→∞
Analog setzen wir für k ∈ N
zk = inf{xn |k ≤ n} = inf{xk , xk+1 , xk+2 , . . . }.
Der Limes Inferior der Folge {xn }n∈N ist
lim inf xn = lim zk .
n→∞
k→∞
Lemma 2.5.2 Für jede beschränkte, reelle Folge existieren Limes Inferior und Limes
Superior.
Beweis. Nach Satz 2.1.2 besitzt jede nach oben beschränkte Menge in R ein Supremum. Die Folge {xn }n∈N ist nach oben beschränkt. Deshalb ist die Folge
yk = sup{xn |k ≤ n}
k∈N
wohldefiniert. Außerdem ist die Folge {yk }k∈N monoton fallend, weil für alle k ∈ N
{xn |k + 1 ≤ n} ⊆ {xn |k ≤ n}.
Da die Folge {xn }n∈N nach unten durch eine Konstante C beschränkt ist, gilt für
alle k ∈ N
yk = sup{xn |k ≤ n} ≥ C.
Also ist die Folge {yk }k∈N monoton fallend und nach unten beschränkt. Nach Satz
2.3.1 ist sie damit konvergent. Also existiert der Limes Superior. 2
Lemma 2.5.3 Limes Superior und Limes Inferior einer reellen Folge sind Häufungswerte
dieser Folge.
Beweis. Wir betrachten die Folge {xn }n∈N . Wir nehmen an, dass der Limes Superior existiert. Wir zeigen, dass es eine Teilfolge gibt, die gegen den Limes Superior
konvergiert. Wir setzen für alle n ∈ N
yn = sup{xk |k ≥ n}.
Dann gibt es für alle n ∈ N ein xkn mit kn ≥ n und
y n ≤ xk n +
1
.
n
2.5. LIMES SUPERIOR UND LIMES INFERIOR
89
Dies folgt aus der Definition des Supremums. Mit Lemma 2.2.4 folgt, dass
{yn − xkn }n∈N
eine Nullfolge ist. Deshalb konvergiert die Folge {xkn }n∈N gegen denselben Grenzwert wie die Folge {yn }n∈N . Die Folge {yn }n∈N konvergiert aber gegen den Limes
Superior der Folge {xn }n∈N . 2
Lemma 2.5.4 (i) Der Limes Superior einer beschränkten, reellen Folge ist der
größte Häufungswert dieser Folge.
(ii) Der Limes Inferior einer beschränkten, reellen Folge ist der kleinste Häufungswert
der Folge.
Beweis. (ii) Es sei x0 ein Häufungswert von {xn }n∈N . Dann gibt es eine Teilfolge
{xnk }k∈N , die gegen x0 konvergiert. Wegen Lemma 2.3.1 gilt k ≤ nk und somit
zk = inf{xn |k ≤ n} ≤ xnk .
Mit Lemma 2.2.4 folgt
lim inf xn = lim zk ≤ lim xnk = x0 .
n→∞
k→∞
k→∞
2
Lemma 2.5.5 Eine Folge konvergiert genau dann, wenn Limes Inferior und Limes
Superior existieren und gleich sind.
Beweis. Wir nehmen an, dass die Folge {xn }n∈N gegen den Grenzwert x0 konvergiert. Nach Lemma 2.2.1 ist die Folge dann beschränkt. Wegen Lemma 2.5.2
existieren dann Limes Superior und Limes Inferior. Limes Superior und Inferior
sind Häufungswerte der Folge. Nach Lemma 2.5.1 gibt es Teilfolgen, die gegen
Limes Superior und Limes Inferior konvergieren. Nach Lemma 2.3.2 konvergieren
alle Teilfolgen einer konvergenten Folge gegen den Grenzwert der Folge. Damit sind
Limes Superior und Limes Inferior gleich.
Wir nehmen nun an, dass Limes Superior und Limes Inferior existieren und gleich
sind. Wir bezeichnen den Limes Superior und Limes Inferior mit x0 . Dann gilt
∀ > 0∃N ∈ N∀n ≥ N : sup xk − x0 < k≥n
∀ > 0∃N ∈ N∀n ≥ N :
Ebenso
∀ > 0∃M ∈ N∀n ≥ M :
∀ > 0∃M ∈ N∀n ≥ M :
xn ≤ sup xk < + x0
k≥n
x0 − inf xk < k≥n
xn ≥ inf xk > − + x0
k≥n
90
CHAPTER 2. DIE REELLEN ZAHLEN
Wir setzen Ñ = max{N, M }. Dann gilt
∀ > 0∃Ñ ∈ N∀n ≥ Ñ :
x0 − < xn < x0 + .
Somit
∀ > 0∃Ñ ∈ N∀n ≥ Ñ :
|x0 − xn | < .
Korollar 2.5.1 Eine reelle, beschränkte Folge konvergiert genau dann, wenn sie
genau einen Häufungswert besitzt.
Beweis. Falls eine Folge konvergiert, dann sind nach Lemma 2.5.5 Limes Superior
und Limes Inferior gleich. Nach Lemma 2.5.4 gibt es dann nur einen Häufungswert.
2
Lemma 2.5.6 Es sei {xn }n∈N eine beschränkte Folge reeller Zahlen, die nicht konvergiert. Dann gibt es zwei konvergente Teilfolgen, die gegen verschiedene Grenzwerte konvergieren.
Beweis. Da die Folge beschränkt ist, existieren nach Lemma 2.5.2 Limes Inferior
und Limes Superior. Nach Lemma 2.5.5 konvergiert eine Folge genau dann, wenn
Limes Inferior und Limes Superior gleich sind. 2
Beispiel 2.5.1 (i) xn = (−1)n , n ∈ N. Dann gelten
lim sup xn = 1
und
n→∞
lim inf xn = −1.
n→∞
(ii) xn = n, n ∈ N. Dann existieren
lim sup xn
und
n→∞
lim inf xn
n→∞
nicht.
(iii) xn = n + (−1)n n, n ∈ N. Dann gilt
lim inf xn = 0
n→∞
und
lim sup xn existiert nicht.
n→∞
(iv) Es sei die Funktion φ : N → N durch
n
2
φ(n) =
n+1
2
falls n gerade ist
falls n ungerade ist
gegeben. Dann sind −2, 0, 2 die Häufungswerte der Folge
{(−1)n + (−1)φ(n) }n∈N .
Limes Superior dieser Folge ist 2 und Limes Inferior ist −2.
(v) Es sei I : N → Q eine bijektive Abbildung. I ist eine Folge, die wir auch durch {xn }n∈N
notieren. Jede reelle Zahl ist Häufungswert dieser Folge.
2.5. LIMES SUPERIOR UND LIMES INFERIOR
91
Beweis. (iv) Die Folge nimmt nur die Werte −2, 0, 2 an. Da es nur endlich viele Zahlen sind, kommen nur diese Zahlen als Häufungswerte in Frage. Tatsächlich sind alle drei Zahlen Häufungswerte
der Folge, der Limes Inferior ist −2 und der Limes Superior ist 2.
Wir weisen dies nach. Es gilt für alle k ∈ N
(−1)4k + (−1)φ(4k) = 2
(−1)4k+1 + (−1)φ(4k+1) = −2
(−1)4k+2 + (−1)φ(4k+2) = 0.
(v) Es sei x0 ∈ R. Wir zeigen, dass x0 Häufungswert ist. Wir definieren die Teilfolge induktiv.
Nach Korollar 2.10.1 gibt es zwischen x0 und x0 + 1 eine rationale Zahl qn1 . Wir nehmen an, dass
wir qn1 , . . . , qnk bereits gewählt haben. Nun wählen wir qnk+1 . Es gibt nach Korollar 2.10.1 eine
rationale Zahl qnk+1 mit x0 < qnk+1 < min{qi |x0 < qi und 1 ≤ i ≤ nk } und x0 < qnk+1 < x0 + k1 .
Diese Folge konvergiert gegen x0 . Sie ist eine Teilfolge von {xn }n∈N . 2
Beispiel 2.5.2 Limes Inferior und Limes Superior der Folge {sin n}n∈N sind −1 und 1. Alle
Punkte [−1, 1] sind Häufungswerte.
Equidistribution theorem
Wir werden dieses Beispiel später behandeln, wenn wir alle notwendigen Begriffe und Hilfsmittel eingführt haben.
Lemma 2.5.7 Es seien {an }n∈N und {bn }n∈N beschränkte Folgen. Dann gilt
lim sup(an + bn ) ≤ lim sup an + lim sup bn .
n→∞
n→∞
n→∞
Es seien {an }n∈N und {bn }n∈N beschränkte Folgen. Dann gilt
lim inf (an + bn ) ≥ lim inf an + lim inf bn .
n→∞
n→∞
n→∞
Beweis.
lim sup(an + bn ) = lim sup{ak + bk |n ≤ k}
n→∞
n→∞
Weiter gilt
sup{ak + bk |n ≤ k} ≤ sup{ak |n ≤ k} + sup{bk |n ≤ k}
Wir überlegen uns dies. Es seien ξ das Supremum von sup{ak |n ≤ k} und η das
Supremum von sup{kk |n ≤ k}. Dann gelten für alle k mit n ≤ k
ak ≤ ξ
Also gilt für alle k mit n ≤ k
2
und
bk ≤ η.
ak + bk ≤ ξ + η.
Beispiel 2.5.3 Für die Folgen an = 1 + (−1)n , n ∈ N und bn = 1 + (−1)n+1 , n ∈ N gilt
2 = lim sup(an + bn ) < lim sup an + lim sup bn = 4
n→∞
n→∞
n→∞
92
CHAPTER 2. DIE REELLEN ZAHLEN
Lemma 2.5.8 Seien {an }n∈N und {bn }n∈N nach oben beschränkte Folgen in [0, ∞).
Dann gilt
lim sup(an · bn ) ≤ (lim sup an ) · (lim sup bn ).
n→∞
n→∞
n→∞
Beweis. Es gilt für alle n ∈ N
sup{ak bk |n ≤ k} ≤ sup{ak |n ≤ k} sup{bk |n ≤ k}.
(2.17)
Wir weisen dies nach. Es gelten für alle j mit n ≤ j
aj ≤ sup{ak |n ≤ k}
und
bj ≤ sup{bk |n ≤ k}.
Da für alle j ∈ N die Ungleichungen 0 ≤ aj und 0 ≤ bj gelten, folgt für alle j ≥ n
aj bj ≤ sup{ak |n ≤ k} sup{bk |n ≤ k}
Hiermit folgt (2.17). Weiter folgt
lim sup{ak bk |n ≤ k} ≤
n→∞
lim (sup{ak |n ≤ k} sup{bk |n ≤ k})
=
lim sup{ak |n ≤ k}
lim sup{bk |n ≤ k} .
n→∞
n→∞
n→∞
2
Beispiel 2.5.4 Wir betrachten die Folgen an = 1 + (−1)n , n ∈ N, und bn = 1 + (−1)n+1 , n ∈ N.
Dann gilt
(1 + (−1)n ) · (1 + (−1)n+1 ) = 0
und damit
lim sup an bn = 0.
n→∞
Andererseits gilt
(lim sup an )(lim sup bn ) = 1.
n→∞
2.6
n→∞
Reihen in R
Wir stellen hier einige Kriterien zur Konvergenz von Reihen zusammen: Verdichtungssatz von Cauchy, Quotientenkriterium, Kriterium von Raabe und Majoranten
Kriterium. Ein weiteres Kriterium, das Wurzelkriterium, führen wir im Zusammenhang mit Potenzreihen ein. Es stellt sich heraus, dass der Verdichtungssatz
von Cauchy für positive Reihen das stärkste Hilfsmittel ist. Wir erklären P
die An1
wendung
der
Kriterien
an
einigen
Beispielen,
wie
die
harmonische
Reihe
n∈N n ,
P
P
1
n1
n∈N n2 und
n∈N (−1) n .
2.6. REIHEN IN R
93
Definition 2.6.1 Es sei {xk }k∈N eine Folge in R. Wir bezeichnen die von {xk }k∈N
erzeugte Folge {sn }n∈N
n
X
sn =
xk
n∈N
k=1
als die unendliche Reihe von {xk }k∈N . Wir bezeichnen sn als die n-te Partialsumme
der Reihe. Die Reihe von {xk }k∈N heißt konvergent, falls die Folge {sn }n∈N konvergiert. Wir schreiben dann für den Grenzwert
∞
X
xk .
k=1
Wir sagen, dass die Reihe divergiert, wenn sie nicht konvergiert.
Eine Folge konvergiert genau P
dann in R, falls sie eine Cauchy-Folge ist. Für
Reihen bedeutet dies: Eine Reihe ∞
n=1 xn konvergiert genau dann, wenn zu jedem
> 0 ein N ∈ N existiert, so dass für alle n, m ≥ N , n < m, die Ungleichung
m
X xk < k=n
gilt.
P
−n
ist ein klassisches Beispiel. Man kann sich mit Hilfe der
Die Reihe ∞
n=0 2
folgenden Anekdote überlegen, dass diese Reihe konvergiert und der Grenzwert 2
ist.
Herkules und eine Schildkröte laufen um die Wette. Die Schildkröte erhält einen
Vorsprung von 1 Kilometer. Herkules läuft doppelt so schnell wie die Schildkröte.
Offensichtlich wird die Schildkröte bei Kilometer 2 von Herkules eingeholt.
Andererseits hat die Schildkröte 1 + 21 Kilometer zurückgelegt, wenn Herkules 1
Kilometer gelaufen ist. Wenn Herkules 1 + 21 Kilometer gelaufen ist, dann ist die
Schildkröte 1 + 12 + 14 Kilometer gelaufen. Dieses setzt sich entsprechend fort und
man schließt, dass Herkules die Schildkröte
einholt.
P∞ nie
−n
2 gelaufen ist, so ist auch Herkules
Wenn die Schildkröte die Strecke n=0P
−n
diese Strecke gelaufen und man sieht, dass ∞
= 2.
n=0 2
Beispiel 2.6.1 (Geometrische Reihe) Eine Folge positiver reeller Zahlen {xn }n∈N heißt geometrische
Folge Wenn der Quotient zweier aufeinander folgender Folgenglieder konstant ist, d.h. es gibt ein
x > 0, so dass für alle n ∈ N gilt xxn+1
= x. Man nennt sie geometrisch, weil jedes Folgenglied das
n
geometrische Mittel seiner beiden Nachbarn ist, d.h. für alle n ∈ N mit n ≥ 2
√
xn = xn−1 xn+1 .
Für alle x ∈ R mit |x| < 1 gilt
∞
X
n=0
Diese Reihe heißt geometrische Reihe.
xn =
1
.
1−x
94
CHAPTER 2. DIE REELLEN ZAHLEN
Lemma 2.6.1 Für alle x ∈ R mit x 6= −1 und für alle n ∈ N gilt
n
X
xk =
k=0
Beweis.
(1 − x)
n
X
xk =
k=0
n
X
1 − xn+1
.
1−x
xk −
k=0
n
X
k=0
xk+1 = 1 − xn+1
2
Beweis von Beispiel 2.6.1. Nach Lemma 2.6.1 gilt
n
X
xk =
k=0
1 − xn+1
.
1−x
Nach Beispiel 2.3.10 gilt
1 − xn+1
1
1
1
=
−
lim xn+1 =
.
n→∞
1−x
1 − x 1 − x n→∞
1−x
lim
2
Lemma 2.6.2 (Verdichtungskriterium von Cauchy) Es sei {x
Pn }n∈N eine monoton
fallende Folge positiver Zahlen. Dann konvergiert die Reihe ∞
n=1 xn genau dann,
wenn
∞
X
2k x2k
k=0
konvergiert. Außerdem gilt
∞
X
k=0
k
2 x2k+1 ≤
∞
X
n=1
xn ≤
∞
X
2k x2k ,
k=0
falls eine der beiden Reihen konvergiert.
Man nennt dieses Lemma Verdichtungskriterium, weil in der zweiten Reihe sehr
viel weniger Summanden der ersten Reihe auftreten.
P
Beweis. Die Reihe ∞
n=1 xn konvergiert genau dann, wenn es ein C gibt, so dass
für alle N ∈ N
N
X
xn ≤ C
n=1
gilt. Dies gilt, weil die Folge der Partialsummen monoton
und beschränkt
P∞ wachsend
k
ist (Satz 2.3.1). Dieselbe Aussage gilt für die Reihe k=0 2 x2k .
Da die Folge monoton fallend ist, gelten für alle k = 0, 1, 2, . . . und alle n mit
2k ≤ n ≤ 2k+1 − 1 die Ungleichungen x2k+1 ≤ xn ≤ x2k . Deshalb gilt für alle
k = 0, 1, . . .
2k+1
X−1
k
2 x2k+1 ≤
xn ≤ 2k x2k .
n=2k
2.6. REIHEN IN R
95
Hieraus folgt
N
X
k=0
k+1
k
2 x2k+1 ≤
N 2X
−1
X
k=0 n=2k
xn ≤
N
X
2k x2k .
k=0
Wir überlegen uns jetzt, dass für alle N ∈ N0
k+1
N 2X
−1
X
k=0
+1 −1
2NX
xn =
xn
n=1
n=2k
gilt. Wri zeigen dies durch Induktion. Für N = 0 sind beide Seiten der Gleichung
gleich x1 . Nun der Induktionsschritt
N
+1 2k+1
X
X−1
k+1
xn =
k=0 n=2k
N 2X
−1
X
xn +
+2 −1
2NX
Somit erhalten wir
k=0
Falls
P∞
k=0
k
2 x2k+1 ≤
xn +
n=1
n=2N +1
k=0 n=2k
N
X
xn =
+1 −1
2NX
+1 −1
2NX
n=1
xn ≤
N
X
+2 −1
2NX
n=2N +1
xn =
+1 −1
2NX
xn .
n=1
2k x2k .
k=0
2k x2k konvergiert, dann folgt mit Lemma ??
∞
X
n=1
xn ≤
∞
X
2k x2k .
k=0
Die andere Ungleichung folgt genauso. 2
Beispiel 2.6.2 Die Reihe
∞
X
1
n
n=1
heißt harmonische Reihe. Sie konvergiert nicht.
Die Reihe heißt harmonisch, weil die Wellenlängen der Obertöne einer schwingenden Saite
jeweils 12 , 31 , 14 ... der Wellenlänge des Grundtons sind.
Es wurde zuerst im 14.ten Jahrhundert von Nicole Oresme beobachtet, dass die harmonische
Reihe divergiert. Dies geriet aber in Vergessenheit. Im 17.ten Jahrhundert wurde dies von Pietro
Mengoli, Johann und Jacob Bernoulli bewiesen.
Beweis. Wir geben hier mehrere Beweise.
(i) Wir erhalten das Ergebnis unmittelbar aus Lemma 2.6.2. Die Reihe
∞
X
k=0
∞
2k
X
1
=
1
k
2
k=0
konvergiert nicht.
(ii) Wir geben auch noch einen Beweis an, der nicht Lemma 2.6.2 benutzt. Wir zeigen, dass
die Folge der Partialsummen
n
X
1
n∈N
k
k=1
96
CHAPTER 2. DIE REELLEN ZAHLEN
keine Cauchy-Folge ist, d.h.
n
X
1 ≥ .
k
∃∀N ∈ N∃n, m ≥ N :
Wir wählen =
1
2,
k=m+1
m = N und n = 2N . Dann gilt
2N
X
1
1
1
>N·
= = .
k
2N
2
k=N +1
(iii) In Beispiel 1.10.6 hatten wir gezeigt: Für alle n ∈ N gilt
2n
n X1
≤
.
2
k
k=1
Also ist die Folge der Partialsummen unbeschränkt und damit nicht konvergent (Lemma 2.2.1). 2
Beispiel 2.6.3 Man stapelt Dominosteine übereinander und bildet einen halben Torbogen. Alle
Steine werden durch die Schwerkraft im Gleichgewicht gehalten. Welche Strecke kann dieser halbe
Torbogen maximal überspannen, ohne dass Steine aus dem Gleichgewicht geraten?
Tatsächlich kann der Torbogen eine beliebig große Strecke überspannen.
Beweis. Wir benutzen hier eine Formel der Physik. Der Schwerpunkt eines Objektes K wird mit
g(K) bezeichnet. Das Gewicht von K bezeichnen wir mit G(K). Der gemeinsame Schwerpunkt
von n Objekten K1 , . . . , Kn ist
n
X
1
G(Ki )g(Ki ).
i=1 G(Ki ) i=1
Pn
Wir nehmen an, dass das Gewicht eines Dominosteines 1 ist und seine Länge ebenfalls 1. Der Schwerpunkt hat 3 Koordinaten, uns interessiert hier aber nur die Koordinate parallel zur Erdoberfläche
und in Richtung des Torbogens.
Bei der Konstruktion des Torbogens können wir den obersten Stein so positionieren, dass
sich der Mittelpunkt des obersten Steins direkt über dem Endpunkt des darunterliegenden Steins
befindet. Entsprechend soll sich der gemeinsame Schwerpunkt der n obersten Steine direkt über
dem Endpunkt des darunteliegenden Steins befinden.
Wir berechnen nun die Länge der überspannten Strecke vom gemeinsamen Schwerpunkt aller
Steine bis zum Endpunkt des obersten Steines. Wir werden zeigen, dass diese Länge für n Steine
gleich
1
1
1 1
1 + + + ··· +
2
2 3
n
ist.
Wir zeigen dies durch Induktion. Der Induktionsanfang: Der oberste Stein kann zur Hälfte
über den darunterliegenden Stein herausragen, ohne das Gleichgewicht zu verlieren. Man gewinnt
also 21 .
Der gemeinsame Schwerpunkt der n obersten Steine liegt nach Induktionsannahme bei
1
1 1
1
1 + + + ··· +
2
2 3
n
Das
der n obersten Steine ist n. Der Schwerpunkt des n + 1-ten Steins liegt bei
PnGewicht
1
1
.
Der
gemeinsame Schwerpunkt der n + 1 obersten Steine liegt bei
k=1 k
2
!!
n
n
n+1
1
nX1
1 1X1
1X1
+
+
=
.
n+1 2
k
2 2
k
2
k
k=1
k=1
k=1
1
2
+
2.6. REIHEN IN R
97
Beispiel 2.6.4 Die Reihe
∞
X
1
n2
n=1
konvergiert. Der Grenzwert liegt zwischen 1 und 2.
Das Beispiel wird ausführlicher behandelt (Satz 2.3.4).
Beweis. Wir geben hier zwei Beweise an. Der erste Beweis benutzt das Verdichtungskriterium
von Cauchy (Lemma 2.6.2). Die Reihe
∞
X
2−k = 2
k=0
konvergiert nach Beispiel 2.6.1. Nach Lemma 2.6.2 gilt
∞
∞
∞
X
X
X
1
k 1
≤
=
2
2−k = 2.
2
2k
n
2
n=1
k=0
Andererseits gilt
1≤
k=0
∞
X
1
.
n2
n=1
Nun der zweite Beweis. Nach Beispiel 1.10.5 gilt für alle n ∈ N
(2.18)
n
X
1
1
≤2−
2
k
n
k=1
Deshalb ist die Folge der Partialsummen monoton wachsend und nach oben durch 2 beschränkt.
Nach Satz 2.3.1 konvergiert eine solche Folge. 2
Lemma 2.6.3 Es sei {xn }n∈N eine Folge reeller Zahlen. Falls die Reihe
konvergiert, dann gilt
lim xn = 0.
n→∞
Beweis. Die Folge
( n
X
k=1
)
xk
n∈N
ist konvergent, also insbesondere eine Cauchy-Folge. Es gilt also
n
X
∀ > 0 ∃N ∈ N∀n, m > N : xk < .
k=m+1
Insbesondere können wir n = m + 1 wählen. Damit erhalten wir
∀ > 0 ∃N ∈ N∀m > N :
2
|xm+1 | < .
P∞
n=1
xn
98
CHAPTER 2. DIE REELLEN ZAHLEN
Lemma 2.6.4 Es seien
r ∈ R. Dann gelten
(i)
P∞
n=1
∞
X
xn und
xn +
n=1
∞
X
P∞
n=1
yn =
n=1
yn Reihen, die in R konvergieren, und
∞
X
(xn + yn )
n=1
(ii)
r
∞
X
xn =
n=1
∞
X
rxn .
n=1
Beweis. (i)
∞
X
xn +
n=1
∞
X
yn = lim
N
X
N →∞
n=1
xn + lim
N →∞
n=1
N
X
yn
n=1
Mit Lemma 2.2.3 folgt
∞
X
xn +
∞
X
yn = lim
N →∞
n=1
n=1
N
X
(xn + yn ) =
∞
X
(xn + yn ).
n=1
n=1
Lemma 2.6.5 (Leibniz) Es sei {xn }n∈N eine Folge positiver, reeller Zahlen, die
monton fallend ist und gegen 0 konvergiert, d.h.
lim xn = 0
xn ≥ xn+1 für n ∈ N.
und
n→∞
Dann konvergiert
∞
X
(−1)n xn .
n=1
Beweis. Wir zeigen, dass
(2n−1
)
X
(−1)k xk
k=1
n∈N
eine monoton wachsende, beschränkte Folge ist und
( 2n
)
X
(−1)k xk
k=1
n∈N
eine monoton fallende, beschränkte Folge ist. Wir prüfen nach, dass die erste Folge
monoton wachsend ist. Da x2k ≥ x2k+1 gilt, folgt für alle n = 0, 1, . . .
2n−1
X
k=1
k
(−1) xk ≤
2n−1
X
k=1
k
(−1) xk + (x2k − x2k+1 ) =
2n+1
X
(−1)k xk .
k=1
2.6. REIHEN IN R
99
Genauso überprüft man, dass die zweite Folge monoton fallend ist. Außerdem gilt
für alle n, m = 1, 2, . . .
2n−1
2m
X
X
k
(−1) xk ≤
(−1)k xk .
k=1
k=1
Dazu wählen wir N = max{n, m}. Es gilt
2N
−1
X
k
(−1) xk ≤
k=1
2N
X
(−1)k xk .
k=1
Da die eine Folge monoton wächst und die andere monoton fällt, gelten
2n−1
X
k=1
k
(−1) xk ≤
2N
−1
X
k
(−1) xk
2N
X
und
k=1
k=1
k
(−1) xk ≤
2m
X
(−1)k xk .
k=1
Also gilt für alle n, m ∈ N
2n−1
X
k=1
k
(−1) xk ≤
2m
X
(−1)k xk .
k=1
Hieraus folgt
−x1 ≤
2n−1
X
2m
X
k=1
k=1
(−1)k xk ≤
(−1)k xk ≤ −x1 + x2 .
Also sind beide Folgen beschränkt. Damit sind beide Folgen konvergent. Es bleibt
zu zeigen, dass sie gegen denselben Grenzwert konvergieren. Mit Lemma 2.6.4 folgt
lim
2n
X
n→∞
k=1
k
(−1) xk − lim
n→∞
2n−1
X
(−1)k xk = lim x2n = 0.
k=1
n→∞
Es sei s der Grenzwert der Folge der Partialsummen {s2` }`∈N bzw. {s2`−1 }`∈N mit
2`
X
s2` =
(−1)k xk
bzw.
k=1
s2`−1 =
2`−1
X
(−1)k xk .
k=1
Wir haben also die Folge der Partialsummen in zwei Teilfolgen zerlegt, die Teilfolge mit den geraden Indices und die Teilfolge mit den ungeraden Indices. Wir
haben festgestellt, dass beide gegen denselben Grenzwert konvergieren. Es scheint
offensichtlich, dass damit die Folge der Partialsummen auch gegen diesen Grenzwert
konvergiert. Wir weisen dies noch formal nach. Es gelten
(2.19)
∀ > 0∃N1 ∈ N∀` ≥ N1 :
|s − s2` | < und
(2.20)
∀ > 0∃N2 ∈ N∀` ≥ N2 :
|s − s2`−1 | < .
100
CHAPTER 2. DIE REELLEN ZAHLEN
Wir wählen nun N = max{2N1 , 2N2 − 1} und erhalten
∀ > 0∃N ∈ N∀n ≥ N :
|s − sn | < .
In der Tat, falls n ≥ N und n gerade ist, dann gibt es ein ` ∈ N mit n = 2`. Weiter
gilt 2` = n ≥ N ≥ 2N1 und damit ` ≥ N1 . Nach (2.19) gilt nun
|s − sn | < .
Falls n ungerade ist, dann folgt diese Ungleichung genauso mit (2.20). 2
Beispiel 2.6.5 Die Reihen
∞
X
(−1)n
n
n=1
∞
X
(−1)n
√
n
n=1
und
sind konvergent.
Die erste Reihe heißt alternierende, harmonische Reihe. Man kann sogar ihren Grenzwert bestimmen, es gilt
∞
X
(−1)n
= ln 2.
n
n=1
Dies kann man aus der Taylorreihe des Logarithmus herleiten (Beispiel 5.16.1).
Definition
2.6.2 Wir sagen, dass eine Reihe
P∞
|x
|
konvergiert.
n
n=1
P∞
n=1
xn absolut konvergiert, falls
Es gibt Reihen, die konvergieren und die nicht absolut konvergieren. Ein Beispiel
dafür ist
∞
X
(−1)n
n=1
n
Lemma 2.6.6 Falls eine reelle Reihe absolut konvergent ist, so ist sie auch konvergent.
Beweis. Es sei
P∞
k=1
xk eine absolut konvergente Reihe. Wir zeigen, dass die Folge
( n
)∞
X
xk
k=1
n=1
eine Cauchy-Folge ist. Da die Reihe absolut konvergent ist, ist
( n
)∞
X
|xk |
k=1
n=1
eine Cauchy-Folge. Also
∀ > 0∃N ∈ N∀n, m > N :
n
X
k=m+1
|xk | < .
2.6. REIHEN IN R
101
Mit der Dreiecksungleichung folgt
n
X
xk < .
∀ > 0∃N ∈ N∀n, m > N :
k=m+1
2
Beispiel 2.6.6 Es gibt eine Reihe in Q, die nicht in Q konvergiert, aber absolut in Q konvergiert.
Beweis. Wir betrachten die Folge x2n =
1
n!
1
2n
+
∞
X
und x2n+1 =
1
n!
−
1
2n .
Dann gilt
xk = e
k=0
Aber für n ≥ 4 gilt n! ≥ 2n und somit
1
− 1 = 1 − 1
n! 2n 2n
n!
Deshalb
∞
X
k=8
|xk | =
∞
X
1
2n
n=8
2
Lemma 2.6.7 (Majorantenkriterium) P
Es seien {xn }n∈N und {yn }n∈N zwei Folgen
nichtnegativer Zahlen. Es konvergiere ∞
n=1 xn und für alle n ∈ N gelte yn ≤ xn .
Dann konvergiert auch
∞
X
yn .
n=1
Beweis. Wir zeigen, dass
( n
X
)∞
yk
k=1
n=1
P∞
xn konvergiert, gilt
n
X
∀ > 0∃N ∈ N∀n, m > N : xk < .
eine Cauchy-Folge ist. Da
n=1
k=m+1
Wegen
0≤
n
X
k=m+1
yk ≤
n
X
xk
k=m+1
folgt
∀ > 0∃N ∈ N∀n, m > N :
2
n
X
yk < .
k=m+1
102
CHAPTER 2. DIE REELLEN ZAHLEN
Lemma 2.6.8 (Quotientenkriterium) Es sei θ ∈ R mit 0 < θ < 1 und es sei
{xn }n∈N eine Folge reeller Zahlen, so dass für alle n ∈ N die Ungleichungen xn 6= 0
und
xn+1 xn ≤ θ
gelten. Dann konvergiert
∞
X
xn .
n=1
Man beachte, dass die Zahl θ nicht von n abhängt. Siehe dazu das Beispiel 2.6.7.
P
Beweis. Wegen Lemma 2.6.6 reicht es zu zeigen, dass ∞
n=1 |xn | konvergiert. Wir
zeigen durch Induktion, dass für alle n ∈ N
|xn | ≤ |x1 |θn−1
gilt.
Es gilt |x2 | ≤ |x1 |θ. Wir führen nun den Induktionsschritt durch. Falls |xn | ≤
|x1 |θn−1 , so folgt
|xn+1 | ≤ |xn |θ ≤ |x1 |θn
Damit istP{|x1 |θn−1 }n∈N eine Majorante von {|xn |}n∈N . Wegen Beispiel P
2.6.1 kon∞
n−1
|x
|θ
und
damit
nach
dem
Majorantenkriterium
auch
vergiert ∞
1
n=1 |xn |.
n=1
2
Beispiel 2.6.7 Man beachte, dass man das Quotientenkriterium nicht auf die Reihe
wenden kann. Zwar gilt für alle n ∈ N
1
n+1
1
n
=
P∞
1
n=1 n
n
< 1,
n+1
aber es gibt kein θ < 1, so dass für alle n ∈ N
n
≤θ
n+1
gilt. Ebenso kann man das Quotientenkriterium nicht auf die Reihe
P∞
1
n=1 n2
anwenden.
Beispiel 2.6.8 Die beiden Folgen
(i)
X 1
n!
(ii)
n∈N
X n!
nn
n∈N
konvergieren.
Beweis. (i) Wir verwenden das Quotientenkriterium.
1/(n + 1)!
1
=
1/n!
n+1
an-
2.6. REIHEN IN R
103
(ii) Wir verwenden das Quotientenkriterium.
n n
(n + 1)!/(n + 1)n+1
=(
)
n!/nn
n+1
Weiter gilt
lim (
n→∞
1
n n
) =
n+1
e
2
Joseph Ludwig Raabe (15.5.1801-22.1.1859) war schweizer Mathematiker.
Lemma 2.6.9 (Raabe-Kriterium) (i) Es sei {xn }n∈N eine Folge strikt positiver,
reeller Zahlen. Es gebe ein c > 1 und ein n0 ∈ N, so dass für alle n ≥ n0
c
xn+1
≤1−
(2.21)
xn
n
gilt. Dann konvergiert die Reihe
∞
X
xn .
n=1
(ii) Es sei {xn }n∈N eine Folge strikt positiver, reeller Zahlen. Falls es ein n0 gibt,
so dass für alle n ≥ n0
xn+1
1
≥1−
xn
n
(2.22)
gilt, dann divergiert die Reihe.
Beweis. (i) Aus (2.21) folgt sofort, dass für all n ≥ n0
(c − 1)xn ≤ (n − 1)xn − nxn+1
(2.23)
gilt. Da c > 1 gilt, so folgt
0 < (n − 1)xn − nxn+1
und damit
{nxn+1 }∞
n=n0
(n − 1)xn < nxn+1 .
Also ist die Folge
monoton fallend. Außerdem ist sie nach unten durch
0 beschränkt. Deshalb konvergiert die Folge {nxn+1 }∞
n=n0 . Wir bezeichnen den
Grenzwert mit α.
Wir zeigen nun, dass die Reihe
∞
X
(2.24)
n=n0
((n − 1)xn − nxn+1 )
kovergiert. Wir betrachten die Partialsummen
sN =
N
X
n=n0
((n − 1)xn − nxn+1 ) = (n0 − 1)xn0 − N xN +1
104
CHAPTER 2. DIE REELLEN ZAHLEN
Die letzte Gleichung gilt, weil die Partialsummen Teleskopsummen sind. Es folgt
∞
X
n=n0
((n − 1)xn − nxn+1 ) = lim sN = (n0 − 1)xn0 − α.
N →∞
Wegen (2.23) ist die Reihe (2.24) eine Majorante für die Reihe
(ii) Aus (2.22) folgt sofort für alle n ≥ n0
P∞
n=n0 (c
− 1)xn .
(n − 1)xn ≤ nxn+1 .
Deshalb ist die Folge {nxn+1 }∞
n=n0 monoton wachsend und für alle n mit n ≥ n0 gilt
n0 xn0 +1 ≤ nxn+1
und somit
Die Reihe
P∞
1
n=1 n
n0 xn0 +1
≤ xn+1 .
n
P
konvergiert nicht, also konvergiert die Reihe ∞
n=1 xn nicht. 2
Beispiel
P∞ 1 2.6.9 Man kann mit dem Raabe-Kriterium nachweisen, dass
n=1 n2 konvergiert.
Beweis. Statt der Reihe
P∞
1
n=1 n
betrachten wir die Reihe
1
n
1
n−1
und
1
(n+1)2
1
n2
=
1
n=2 n−1 .
divergiert und
Es gelten
3
3
3
2n + 1
n2
2n + 2
2
=
1
−
≤
1
−
=
1
−
.
(n + 1)2
(n + 1)2
(n + 1)2
n+1
3
2
n+1
Also gilt für alle n ≥ 5
1
(n+1)2
1
n2
2
≥
5
4
.
n
≤1−
5
4
n
.
Reihen Produkt Satz von Cauchy
Lemma 2.7.1 (Cauchy-Produkt) Es seien
vergente Reihen. Dann konvergiert auch
∞
n−1
X
X
(2.25)
n=2
k=1
∞
X
!
P∞
n=1
xn und
P∞
n=1
!
xk yn−k
und es gilt
(2.26)
1
n=1 n
n−1
1
=1−
n
n
=
Für n ≥ 5 gilt
2.7
P∞
P∞
∞
X
n=1
!
xn
n=1
yn
=
∞
n−1
X
X
n=2
k=1
!
xk yn−k
.
yn zwei absolut kon-
2.7. REIHEN PRODUKT SATZ VON CAUCHY
105
Dieser Satz gilt auch schon für den Fall, dass eine der Reihen absolut konvergiert
und die andere konvergiert, also nicht notwendig absolut konvergiert. Diese Verallgemeinerung geht auf Mertens zurück.
Den Ausdruck (2.25) bezeichnet man als Cauchy-Produkt. Man beachte, dass
sowohl auf der linken als auch auf der rechten Seite der Gleichung (2.26) sämtliche
Produkte xi yj , i, j ∈ N aufsummiert werden. Sie sind auf den verschiedenen Seiten
in verschiedener Reihenfolge aufsummiert.
P
P∞
Wenn man Reihen ∞
n=0 xn und
n=0 yn betrachtet, dann nimmt die Gleichung
(2.26) die Form
∞
X
(2.27)
!
xn
n=0
∞
X
!
yn
=
n=0
∞
n
X
X
n=o
!
xk yn−k
k=0
an.
Mit Lemma 2.7.1 kann man die Gleichung ex+y = ex ey beweisen.
Beweis. Wir zeigen, dass
(
n
X
!
xk
k=1
n
X
!
yk
k=1
−
n
k−1
X
X
k=2
!)
x` yk−`
`=1
n∈N
eine Nullfolge ist. Es gilt
n
!
!
!
n
k−1
n
X
X
X
X
x` yk−` xi
yk −
i=1
k=2
`=1
k=1
! n
k−1
n
n
X
X
X
X
xi yj x` yk−` = =
xi y j −
i,j=1
k=2
`=1
(i,j)∈I
wobei
I = {(i, j)|0 ≤ i, j ≤ n und n < i + j}.
Pn
Die letzte Gleichung ergibt sich wie folgt. In der Summe
i,j=1 xi yj treten alle
Produkte xi yj mit 1 ≤ i, j ≤ n auf. Von diesen müssen alle jene eliminiert werden,
die in der zweiten Summe auftreten. Dies sind alle Produkte xi yj mit i + j = k und
1 ≤ k ≤ n. Es gilt
o n
o
n
n
n
≤ j ≤ n ∪ (i, j) 1 ≤ j ≤ n und
≤i≤n .
I ⊆ (i, j) 1 ≤ i ≤ n und
2
2
106
CHAPTER 2. DIE REELLEN ZAHLEN
Dies ist richtig, weil aus i + j ≥ n folgt, dass i ≥ n2 oder j ≥
weiter
n
!
!
!
n
n
k−1
X
X
X
X
xk
yk −
x` yk−` k=1
k=1
k=2
`=1
X
X
X
|xk yj | +
|xk yj |
≤
|xk yj | ≤
=
n
X
k=1

!
|xk | 
X
n
≤j≤n
2
gilt. Hiermit folgt
1≤j≤n
n ≤k≤n
2
1≤k≤n
n ≤j≤n
2
(k,j)∈I
n
2
|yj | +
n
X
j=1
!
|yj | 

X
n
≤k≤n
2
|xk |
Da die beiden Reihen absolut konvergieren, folgt
!
!
!
n
n
n
k−1
X
X
X
X
xk
yk −
x` yk−` k=1
k=1
k=2
`=1



!
!
∞
∞
X
X
X
X
|yj | +
|xk |
|yj | 
≤
|xk | 
n
≤j≤n
2
k=1
n
≤k≤n
2
j=1
Außerdem gibt es zu jedem ein N , so dass für alle n, m ≥ N
n
X
k=m+1
|xk | < n
X
und
k=m+1
|xk | < gelten. Also gibt es ein N , so dass für alle n ≥ N
n
!
!
!
n
k−1
n
X
X
X
X
x` yk−` yk −
xk
k=2
`=1
k=1
k=1
!
!
∞
∞
X
X
≤
|xk | +
|yj | j=1
k=1
gilt. Also
lim
n→∞
n
X
!
xk
k=1
n
X
!
yk
k=1
−
n
k−1
X
X
k=2
!!
x` yk−`
`=1
Hiermit folgt nun (2.26). 2
Beispiel 2.7.1 Es sei
Dann konvergiert
divergiert.
P∞
n=1
(−1)n
xn = √
n
n∈N
xn , aber das Cauchy-Produkt
∞
X
n−1
X
n=2
k=1
!
xk xn−k
= 0.
2.7. REIHEN PRODUKT SATZ VON CAUCHY
107
Beweis. Es gilt
n−1
X
xk xn−k =
k=1
n−1
X
k=1
(−1)n
√ √
.
k n−k
Für alle k mit 1 ≤ k ≤ n − 1 gilt
√ √
√
√
√
√
k n − k ≤ n − 1 n − k ≤ n − 1 n − 1 = n − 1.
Daher folgt
n−1
n−1
n−1
X
X
X 1
1
√
=
≥
x
x
= 1.
√
k n−k n−1
k n−k
k=1
k=1
k=1
Nach Lemma 2.6.3 konvergieren die Summanden einer konvergenten Reihe gegen 0. Dies liegt hier
nicht vor. 2
Beispiel 2.7.2 Es gelten
∞
X
1
=
nxn−1
(1 − x)2
n=1
∞
X
1
(n + 1)(n + 2) n
=
x .
(1 − x)3
2
n=0
und
Weiter gilt
∞
X
n2
= 6.
2n
n=1
Wir wollen hier das Cauchy-Produkt verwenden, um die Reihen zu berechnen. Man kann dies
natürlich auch machen, indem man die Reihen differenziert.
Beweis. Es gilt nach Vorlesung
∞
X
1
=
xn
1 − x n=0
Es folgt
1
=
(1 − x)2
∞
X
!2
x
n
n=0
Wir setzen ak = xk und bn−k = xn−k . Mit dem Cauchy-Produkt folgt
n
X
k=0
ak bn−k =
n
X
xk xn−k = (n + 1)xn
k=0
Weiter folgt
∞
n
X
X
1
=
ak bn−k
(1 − x)2
n=0
!
k=0
Für x =
1
2
(n + 1)xn
n=0
ergibt sich
4=
∞
∞
∞
X
X
X
n+1
n+1
n
=
4
=
4
n
n+2
n+1
2
2
2
n=0
n=0
n=1
Also
(2.28)
=
∞
X
1=
∞
X
n
.
n+1
2
n=1
108
CHAPTER 2. DIE REELLEN ZAHLEN
∞
X
!
(k + 1)x
k
k=0
∞
X
∞ X
n
X
!
x
k
=
n=0 k=0
∞
n
X
X
n
k=0
=
x
n=0
Für x =
1
2
((k + 1)xk xn−k )
(k + 1) =
k=0
∞
X
(n + 1)(n + 2) n
x
2
n=0
folgt
8
=
∞
∞
X
1
(n + 1)(n + 2) X n2 + 3n + 2
=
=
2n+1
2n+1
(1 − 12 )3
n=0
n=0
=
∞
∞
∞
X
X
X
n2
3n
2
+
+
n+1
n+1
n+1
2
2
2
n=0
n=0
n=0
=
∞
X
n2
+3+2
n+1
2
n=0
Es folgt
∞
X
n2
= 3.
2n+1
n=0
Es folgt weiter
∞
X
n2
= 6.
2n
n=0
2
Wir haben bereits in Beispiel 1.5.1 gezeigt, dass es unendlich viele Primzahlen
gibt. Das P
folgende Beispiel liefert einen weiteren Beweis hierfür. Wir nutzen dabei
1
aus, dass ∞
n=1 n divergiert.
Beispiel 2.7.3 Es gibt unendlich viele Primzahlen
Beweis. Es gibt
P∞verschiedene Beweise, wir stellen hier einen Beweis von [98] dar, der benutzt,
dass die Reihe n=1 n1 nicht konvergiert.
Wir nehmen an, dass es nur endlich viele Primzahlen p1 , . . . , pk gibt. Dann gibt es zu jedem
n ∈ N natürliche Zahlen `1 , . . . , `k mit
n = p`11 · · · p`kk
Somit folgt
∞
∞
X
X
1
=
n m=1
n=1
Da 2 ≤ pi
Damit würde
∞
∞
X
X
1
≤
n m=1
n=1
P∞
1
n=1 n
X
1
p`1 · · · p`kk
`1 +···+`k =m 1
X
`1 +···+`k =m
∞
X
1
mk
=
<∞
2m
2m
m=1
konvergieren, was nicht richtig ist. 2
Beispiel 2.7.4 [67]
X
p
Primzahl
1
=∞
p
Aus diesem Ergebnis folgt auch, dass es unendlich viele Primzahlen gibt.
Wir werden dieses Beispiel später behandeln, wenn wir die notwendigen Hilfsmittel wie Logarithmus und Integral bereit gestellt haben (Beispiel 3.6.4).
2.8. UMORDNUNGSATZ VON RIEMANN
2.8
109
Umordnungsatz von Riemann
In diesem Abschnitt geht es darum, den Umordnungssatz von Riemann zu beweisen.
Der Umordnungssatz von Riemann ist spektakulär: Zu jeder reellen Zahl und jeder
bedingt konvergenten Reihe findet man eine neue Anordnung der Summanden, so
dass die Reihe gegen die vorgegebene Zahl konvergiert.
Eine Permutation von N ist eine bijektive Abbildung von N auf sich.
P
Satz 2.8.1 (Riemann) Es sei n∈N xn eine konvergente Reihe, die nicht absolut
konvergiert. Dann existiert für jedes x ∈ R eine Permutation π, so dass
X
x=
xπ(n) .
n∈N
Definition 2.8.1 Wir sagen, dass eine Reihe
für jede Permutation π von N die Reihe
∞
X
P∞
n=1
xn unbedingt konvergiert, falls
xπ(n)
n=1
konvergiert.
P
Lemma 2.8.1 Es sei
n∈N xn eine konvergente, aber nicht absolut konvergente
Reihe. {pk }k∈N sei die Folge natürlicher Zahlen, so dass xpk die k-te nichtnegative
Zahl der Folge {xn }n∈N ist. Entsprechend seien {nk }k∈N die Indices der negativen
Folgenglieder: xnk ist die k-te negative Zahl. Dann divergieren die Reihen
X
X
xnk
und
xp k .
k∈N
k∈N
Beweis.
Wir zeigen,
dass die Reihe absolut konvergiert, falls eine der beiden Reihen
P
P
x
und
x
konvergiert. Dazu überlegt man sich zunächst, dass beide
k
k
k∈N nP
k∈N pP
ReihenP k∈N xnk und k∈N xpk konvergieren, wenn nur eine konvergiert, weil die
Reihe n∈N xn konvergiert.
P
P
Wir können also annehmen, dass beide Reihen
k∈N xnk und
k∈N xpk konvergieren.
Nun betrachten wir die Reihen
X
X
x0n
und
x00n ,
n∈N
die durch
x0n
=
xn xn ≥ 0
0 xn < 0
n∈N
x00n
=
xn xn < 0
0 x≥0
110
CHAPTER 2. DIE REELLEN ZAHLEN
gegeben sind. Falls diese beiden Reihen konvergieren, dann konvergiert auch
X
X
X
X
xn =
x0n −
x00n =
|xn |.
n∈N
n∈N
n∈N
n∈N
P
P
Wir zeigen nun, dass n∈N x0n und n∈N x00n konvergieren,
falls
x
und
n
k
k∈N
k∈N xpk
P
0
konvergieren. Die Folge der Partialsummen m
x
,
m
∈
N,
ist
monoton
wachsend
n=1 n
und es gilt für alle m ∈ N
m
X
X
x0n ≤
xp k .
P
P
n=1
k∈N
Damit ist diePFolge der Partialsummen
auch beschränkt und somit konvergent. Also
P
0
00
konvergiert n∈N xn . Für n∈N xn wird der Beweis genauso geführt. 2
Lemma 2.8.2 Eine Reihe ist genau dann unbedingt konvergent, wenn sie absolut
konvergent ist.
P
Falls eine Reihe ∞
n=1 xn unbedingt konvergiert, dann gilt für alle Permutationen
π
∞
∞
X
X
xπ(n) .
xn =
n=1
n=1
Beweis. Wir nehmen an, dass die Reihe absolut konvergiert, also
∀ > 0∃N ∀n, m > N :
n
X
k=m
|xk | < .
Wir wählen nun N 0 so groß, dass
{k|1 ≤ k ≤ N } ⊆ {π(k)|1 ≤ k ≤ N 0 }.
Dann folgt
∀ > 0∃N 0 ∈ N∀n, m > N 0 :
n
n
X
X
xπ(k) ≤
|xπ(k) | < .
k=m
k=m
Also konvergiert die Reihe unbedingt.
Wir zeigen nun, dass die Reihe nicht unbedingt konvergiert, wenn sie nicht absolut konvergiert. Falls die Reihe nicht
dann divergieren nach
P absolut konvergiert,
P
Lemma 2.8.1 die beiden Teilreihen k∈N xnk und k∈N xpk .
Wir wählen mj ∈ N mit 1 = m1 < m2 < · · · und
mj+1 −1
X
i=mj
xpi ≥ 1.
Für j = 1, 2, 3, . . . wählen wir π(mj +j −1) = nj und für i = mj +j, . . . , mj+1 +j −1
(2.29)
π(i) = pi−j .
2.8. UMORDNUNGSATZ VON RIEMANN
111
Wir überzeugen uns davon, dass π eine Permutation ist. Wir zeigen, dass π surjektiv
ist. Dazu beachten wir, dass N = {nk |k ∈ N}∪{pk |k ∈ N}. Wegen π(mj +j−1) = nj
für j ∈ N werden alle Elemente in {nk |k ∈ N} getroffen. Wegen (2.29) werden für
festes j die Indices pmj , . . . , pmj+1 −1 getroffen.
Dann gilt
mj+1 +j−1
mj+1 +j−1
mj+1 −1
X
X
X
=
xpi ≥ 1.
x
=
x
p
π(i)
i−j
i=mj +j
i=mj
i=mj +j
P
Somit konvergiert die Reihe n∈N xπ(n) nicht.
Wir zeigen nun, dass für alle Permutationen π
∞
∞
X
X
xn =
xπ(n)
n=1
n=1
P∞
gilt. Wir
überlegen
uns,
dass
für
alle
π
die
Reihe
n=1 xπ(n) absolut konvergiert,
P∞
P∞
wenn
n=1 xn absolut konvergiert.
n=1
Pxπ(n) konvergiert genau dann absolut,
wenn für alle Permutationen σ die Reihe ∞
n=1 xσ◦π(n) konvergiert. Dies gilt aber,
weil σ ◦ π eine Permutation ist.
Wir zeigen, dass
∞
X
(xn − xπ(n) ) = 0
n=1
gilt. Für alle > 0 existiert ein N , so dass für alle k ≥ N
∞
X
|xn | < n=k
0
gilt. Nun wählen wir N so groß, dass {1, . . . , N } ⊆ {π(1), . . . , π(N 0 )}.
N0
N 0
X
X
X
xn −
xπ(n) (xn − xπ(n) ) = 0
n=1
≤
N0
X
n=N +1
n=N +1
|xn | +
X
{n|1≤n≤N 0 ,π(n)>N }
{n|1≤n≤N ,π(n)>N }
|xπ(n) | ≤
∞
X
n=N +1
|xn | +
∞
X
n=N +1
|xn | ≤ 2.
2
Beweis von Satz 2.8.1. Wir betrachten zuerst den Fall, dass x ≥ 0. Wir benutzen
Lemma 2.8.1. Wir wählen m1 , so dass
m
1 −1
X
k=1
xp k ≤ x <
m1
X
xp k .
k=1
Entsprechend sind die ersten m1 Indices unserer Folge p1 , . . . , pm1 . Nun wählen wir
`1 , so dass
m1
`1
m1
`1
X
X
X
X
xp k +
xn k < x ≤
xpk +
xnk −1 .
k=1
k=1
k=1
k=1
Die nächsten Indices `1 unserer Folge sind n1 , . . . , n`1 2
112
2.9
CHAPTER 2. DIE REELLEN ZAHLEN
Das Problem von Basel
”Ich wollte in meinem Garten einen Springbrunnen anlegen”, schrieb Friedrich der Große am 25.
Januar 1778 an Voltaire. Das Projekt endete jedoch in einem Fiasko. Der Preußenkönig blickte
von seinem Schloss Sanssouci auf Brunnenanlagen, aus denen keine Fontänen in die Höhe schossen.
Dabei sollte die Wasserkunst nach den neuesten Erkenntnissen der Hydraulik ausgeführt werden
und selbst Versailles an Pracht übertreffen. ”Euler berechnete die Leistung des Räderwerks, damit
das Wasser in ein Bassin hinaufgelänge, über Kanäle wieder abfließe, um in Sans-Souci aufzusteigen.
Meine Mühle wurde nach allen Regeln der Mathematik gebaut, und sie konnte keinen einzigen
Wassertropfen weiter als fünfzig Schritt unter das Bassin hinaufpumpen. Eitelkeit der Eitelkeiten!
Eitelkeit der Mathematik!”
Nach allem was man über diesen Vorfall weiß, ist es nicht Eulers Schuld gewesen [32]. Das
Verhältnis von Friedrich dem Großen und Euler war kein gutes. Friedrich der Große nannte Euler,
der zur Zeit am Berliner Hof nur noch ein Auge besaß, charmanterweise meinen Zyklopen.
Pietro Mengoli (1625-1686) stellte das Problem im Jahr 1644, den Grenzwert der
Reihe
∞
X
1
n2
n=1
zu finden. Das Problem wurde bekannt, als Jakob Bernoulli im Jahr 1689 darüber
berichtete. Es stellte sich heraus, dass es ein sehr schwieriges Problem ist. Bis in
die 1730er Jahre hatten die besten Mathematiker der Zeit versucht, es zu lösen.
Euler hat zunächst den Grenzwert der Reihe auf 6 Stellen hinter dem Komma
genau berechnet. Später war erin der Lage, die Zahl auf 17 Stellen genau zu berechnen. Da Euler sehr gut rechnen konnte, vermutet man, dass er erkannt hat, dass die
2
Zahl π6 sein sollte. Im Jahr 1735 fand er einen Beweis dafür.
Satz 2.9.1 [37]
∞
X
1
π2
=
n2
6
n=1
Beweise hierfür findet man in [20], [22], [56], [50], [60], [92] [111], [116] und [38],
p.87. Man kann dieses Ergebnis mit Hilfe des Residuenkalküls beweisen. Jakob
Bernoulli (1654- 1705) leitete im Jahr 1689 die Aufmerksamkeit auf dieses Problem.
Leibniz behauptete bei einem Besuch in London, dass er den Grenzwert jeder Reihe
berechnen könne. Daraufhin zeigte man ihm diese Reihe und er konnte den Grenzwert nicht berechnen. Euler löste das Problem im Jahr 1735 [Dun]. Eulers Methode
funktioniert für geradzahlige Exponenten. So lässt sich zeigen, dass
∞
∞
X
X
1
π4
1
π6
=
und
=
.
4
6
n
90
n
945
n=1
n=1
Der Grenzwert der Reihe
∞
X
1
n3
n=1
ist nicht bekannt. 1978 zeigte Roger Apéry, dass der Grenzwert eine irrationale Zahl
ist [30].
2.10. P-ADISCHE ENTWICKLUNGEN REELLER ZAHLEN
2.10
113
p-adische Entwicklungen reeller Zahlen
Unter der Dezimalbruchdarstellung einer reellen Zahl versteht man eine Folge von
natürlichen Zahlen zwischen 0 und 9, z.B.
154, 14879...
Diese Folge kann abbrechen. Wir wollen hier eine Definition für diese Dezimalbruchdarstellung geben. Die Dezimalbruchdarstellung entspricht der unendlichen
Reihe
4
8
1
+
+
+ ···
1 · 100 + 5 · 10 + 4 +
10 100 1000
Allgemein entspricht der Zahl
nk nk+1 . . . n0 , n1 n2 n3 . . .
mit ni ∈ {0, 1, . . . , 9} für alle i = k, k + 1, . . . die Reihe
∞
X
ni
10i
i=k
wobei k ∈ Z gilt. k kann also durchaus negative Werte annehmen, wie dies bei dem
Beispiel der Fall ist.
Zunächst ist nicht klar, dass jede reelle Zahl eine Dezimalbruchdarstellung besitzt. Das wird in diesem Abschnitt bewiesen. Wir beschränken uns allerdings nicht
nur auf Dezimalbruchdarstellungen, sondern wir behandeln hier allgemeine p-adische
Darstellungen.
Satz 2.10.1 Es sei p ∈ N mit p ≥ 2 und k ∈ Z. {xn }∞
n=k sei eine Folge von
natürlichen Zahlen zwischen 0 und p − 1. Dann konvergiert
∞
X
xn
n=k
pn
in R. Umgekehrt gibt es für jede reelle, positive Zahl x eine solche Folge {xn }∞
n=k ,
so dass
∞
X
xn
x=
pn
n=k
p bezeichnen wir als Basis oder Grundzahl der Entwicklung.
P∞ `
Beweis. Nach Beispiel 2.6.1 (geometrische Reihe) wissen wir,
dass
die
Reihe
`=0 p
P∞ `
konvergiert. Deshalb konvergiert für alle k ∈ Z die Reihe `=k p . Also gilt
n
X
−`+1 ∀ > 0∃N ∈ N ∀n, m ≥ N : p
< .
`=m+1
114
CHAPTER 2. DIE REELLEN ZAHLEN
Somit folgt wegen x` < p für alle n, m ≥ N
n
n
m
n
n
X
X
X
x` X x` X x` x`
1
−
<
< .
=
=
`
`
`
`
`−1
p
p
p
p
p
`=m+1
`=k
`=k
`=m+1
`=m+1
Damit ist
)
( n
X x`
`=k
p`
n∈N
eine Cauchy-Folge und konvergent.
Wir zeigen nun, dass jede positive, reelle Zahl eine solche Darstellung besitzt.
Mit [x] bezeichnen wir die größte ganze Zahl, die kleiner oder gleich x ist. Falls
x = 0, dann können wir als Darstellung die Nullfolge wählen.
Wir nehmen nun an, dass 0 < x gilt. Wir bestimmen k ∈ Z, so dass
1
1
≤ x < k−1
k
p
p
(2.30)
gilt und setzen
xk = [x · pk ]
(2.31)
Restk (x) = x −
xk
.
pk
Eine solche Zahl k existiert: Da die Folge p1j , j ∈ N, gegen 0 konvergiert, gibt es
ein j mit p1j ≤ x. Nun nehmen wir als k das Minimum von allen Zahlen j ∈ Z mit
1
≤ x.
pj
Weiter setzen wir für n = k, k + 1, . . .
xn+1 = [Restn (x) · pn+1 ]
Restn+1 (x) = Restn (x) −
Wir zeigen nun, dass
x=
∞
X
x`
`=k
p`
xn+1
.
pn+1
.
Wir stellen fest, dass für alle n = k, k + 1, k + 2, . . .
(2.32)
(2.33)
0 ≤ Restn (x) <
1
pn
xn ∈ {0, 1, . . . , p − 1}
gelten. Tatsächlich folgt (2.33) aus (2.30) und (2.32): Aus (2.30) folgt
0 ≤ x · pk < p
und damit
0 ≤ [x · pk ] < p.
2.10. P-ADISCHE ENTWICKLUNGEN REELLER ZAHLEN
115
Da aber xk = [x · pk ], folgt (2.33) für n = k. Nun die anderen Fälle. Aus (2.32) folgt
0 ≤ Restn (x) · pn+1 < p
und damit
0 ≤ [Restn (x) · pn+1 ] < p.
Wir weisen nun (2.32) nach. Wir zeigen dies für n = k. Es gilt
Restk (x) = x −
[x · pk ]
1
xk
=
x
−
= k x · pk − [x · pk ] .
k
k
p
p
p
Da 0 ≤ x · pk − [x · pk ] < 1, folgt
0 ≤ Restk (x) <
1
.
pk
Nun für n > k. Es gilt
xn+1
[Restn (x) · pn+1 ]
=
Rest
(x)
−
n
pn+1
pn+1
Restn (x) · pn+1 − [Restn (x) · pn+1 ] .
Restn+1 (x) = Restn (x) −
=
1
pn+1
Da 0 ≤ Restn (x) · pn+1 − [Restn (x) · pn+1 ] < 1, folgt
0 ≤ Restn+1 (x) <
1
pn+1
.
Wir zeigen nun mit Induktion, dass für alle n ∈ Z mit n ≥ k
x=
n
X
x`
`=k
p`
+ Restn (x)
gilt. Wegen (2.31)
xk
+ Restk (x).
pk
Wir führen nun den Induktionsschritt durch.
x=
x=
n
X
x`
`=k
p`
+ Restn (x) =
n
X
x`
`=k
p`
+
xn+1
+ Restn+1 (x)
pn+1
Hieraus folgt nun mit (2.32)
n
X
x` 1
x −
= |Restn (x)| < n .
`
p p
`=k
Deshalb gilt
n
X
x` lim x −
=0
n→∞ p` `=k
116
CHAPTER 2. DIE REELLEN ZAHLEN
und schließlich
x=
∞
X
x`
`=k
2
p`
.
Für p = 10 ist die unendliche Summe gerade die Dezimalbruchdarstellung von
x. Für p = 2 erhält man die dyadische Darstellung. Man beachte, dass diese
Darstellungen nicht eindeutig sind.
∞
X
p−1
pn
n=0
= (p − 1)
∞
X
1
1
= (p − 1)
n
p
1−
n=0
1
p
=p
Wir erhalten z.B. für p = 10, dass 9, 999 · · · = 10, und für p = 2, dass 1, 111 · · · = 10.
2 in der dyadischen Darstellung geschrieben ist 10. Allgemeiner lässt sich sagen, dass
sich eine reelle Zahl durch genau eine p-adischen Entwicklung darstellen lässt, bei
der nicht fast alle Ziffern gleich p − 1 sind. ”Fast alle” bedeutet ”bis auf endlich
viele”.
Bemerkung 2.10.1 (i) Jede reelle Zahl lässt sich durch genau einen p-adischen
Bruch darstellen, bei dem nicht fast alle Ziffern gleich p − 1 sind.
(ii) Eine reelle Zahl ist genau dann rational, wenn ihre p-adische Entwicklung periodisch ist, d.h. es gibt ein m ∈ N und ein `0 ∈ N, so dass für alle ` ≥ `0
xm+` = x`
gilt.
Beispiel hierfür sind die folgenden Dezimalbruchdarstellungen: 31 = .3, 61 = .16,
= .142857. Der Strich über den Ziffern legt die Periode fest.
Wenn eine reelle Zahl in der Dezimalbruchdarstellung gegeben ist und die Dezimalbruchdarstellung ist periodisch, dann kann man auf die folgende Weise die rationale Zahl finden, die dargestellt wird. Wir benutzen dazu, dass
1
7
0.1 =
1
9
0.01 =
1
99
Für 0.5 und 0.736 erhalten wir dann
5
0.5 = 5 × 0.1 =
9
0.001 =
1
999
u.s.w.
0.736 = 736 × 0.001 =
736
.
999
Beweis. (i) Wir überlegen uns zuerst, dass es eine solche Darstellung gibt. Wir
können eine Darstellung, bei der fast alle Koeffizienten gleich p − 1, in eine Darstellung verwandeln, bei der fast alle Koeffizienten 0 sind.
Wir nehmen dazu an, es gäbe eine reelle Zahl x, die sich durch zwei verschiedene
p-adische Brüche darstellen lässt, deren Koeffizienten nicht bis auf endlich viele
gleich p − 1 sind. Es seien also
x=
∞
X
v`
`=k
p`
und
x=
∞
X
w`
`=k
p`
.
2.10. P-ADISCHE ENTWICKLUNGEN REELLER ZAHLEN
117
Es sei `0 die kleinste Zahl, so dass v`0 6= w`0 . Wir können annehmen, dass v`0 > w`0 .
Dann gilt
`X
∞
∞
0 −1
X
X
w` w`0
w`
w`
=
+ `0 +
x=
`
`
p
p
p
p`
`=k
`=` +1
`=k
0
Nach Voraussetzung gibt es ein ` > `0 mit w` < p − 1. Deshalb folgt
x
`X
0 −1
<
`=k
`X
0 −1
=
`=k
`0 −1
∞
X
w` w`0
p−1 X
1
w` w`0
+
+
+
=
+
p`
p`0 `=` +1 p`
p`
p`0
p`0
`=k
0
∞
w` w`0 + 1 X v`
≤
+
= x.
p`
p`0
p`
`=k
Dies ist ein Widerspruch.
(ii) Wir überprüfen nun,S
dass x rational ist, falls die p-adische Entwicklung von
x periodisch ist. Weil N0 = ∞
j=0 {jm, jm + 1, . . . , (j + 1)m − 1}, gilt
x=
∞
X
x`
`=k
p`
=
`X
0 −1
`=k
`X
∞
∞ (j+1)m−1
0 −1
x` X x`
x` X X x`0 +`
+
=
+
.
p` `=` p`
p` j=0 `=jm p`0 +`
`=k
0
Hieraus folgt
x=
`X
0 −1
`=k
`X
∞ m−1
m−1 ∞
0 −1
x` X X x`0 +jm+`
x` X X x`0 +jm+`
+
=
+
.
`
`0 +jm+`
p` j=0 `=0 p`0 +jm+`
p
p
`=k
`=0 j=0
Weil die p-adische Entwicklung periodisch mit der Periode m für ` ≥ `0 ist, erhalten
wir
x =
`X
0 −1
`=k
=
`X
0 −1
`=k
m−1 ∞
x` X X x`0 +`
+
p`
p`0 +jm+`
`=0 j=0
`X
m−1
m
∞
0 −1
x` X x`0 +` X 1
x` X x`0 +` pm
+
=
+
.
p`
p`0 +` j=0 pjm
p`
p`0 +` pm − 1
`=0
`=k
`=1
Der letzte Ausdruck ist eine endliche Summe rationaler Zahlen, also wiederum eine
rationale Zahl.
Umgekehrt, falls x rational ist, dann ist die p-adische Entwicklung periodisch:
Dies gilt, weil als Rest bei der Division nur endlich viele verschiedene Zahlen auftreten
können. 2
Beispiel 2.10.1 Die folgende Zahl ist in Dezimalbruchdarstellung.
0, n1 n2 n3 . . .
wobei ni = 1 gilt, wenn i eine Quadratzahl ist, für alle anderen i gilt ni = 0. Diese Zahl ist
irrational.
118
CHAPTER 2. DIE REELLEN ZAHLEN
Beweis. Diese Zahl ist nicht rational, weil ihre Dezimalbruchentwicklung nicht periodisch ist. Wir
weisen nach, dass sie nicht periodisch ist. Dazu nehmen wir an, dass sie periodisch ist. Also gibt
es ein m ∈ N und ein `0 , so dass für alle ` ≥ `0
n` = n`+m
gilt. Zu `0 gibt es eine Quadratzahl j mit j ≥ `0 und m2 < j. Es folgt nj = nj+m = 1 und damit,
dass j + m eine Quadratzahl ist. Es gibt also ein k ∈ N mit k 2 = j und (k + 1)2 ≤ j + m. Es folgt
k 2 + 2k + 1 ≤ j + m.
Wegen k 2 = j
2
2k + 1 ≤ m
und wegen m < j
Wegen k 2 = j
4k 2 + 4k + 1 ≤ m2 < j.
3j + 4k + 1 < 0.
Das kann nicht sein. Also ist j + m keine Quadratzahl. 2
Satz 2.10.2 Es gilt
card(R) = card(P(N)).
Insbesondere gilt
card(Q) < card(R).
Lemma 2.10.1 Die reellen Zahlen R und das Intervall (0, 1) = {x ∈ R|0 < x < 1}
haben dieselbe Mächtigkeit.
Beweis. Wir zeigen zuerst, dass das Intervall (−1, 1) = {x ∈ R||x| < 1} und R
dieselbe Mächtigkeit haben. Die Abbildung f : (−1, 1) → R mit
 x
 1+x x ∈ (−1, 0]
f (x) =
 x
x ∈ (0, 1)
1−x
ist bijektiv.
Wir überlegen uns, dass die Abbildung f surjektiv ist. Wir zeigen, dass es für
x
alle y > 0 ein x ∈ (0, 1) mit y = 1−x
gibt. In der Tat, diese Gleichung ist äquivalent
y
zu x = 1+y . Ebenso verfahren wir für y < 0.
Nun zeigen wir, dass die Abildung f injektiv ist. Der erste Fall ist 0 ≤ x, y < 1
y
x
und f (x) = f (y). Dann gilt 1−x
= 1−y
, woraus x = y folgt.
Der Fall 1− < x, y < 0 wird genauso behandelt. Falls −1 < x < 0 < y < 1,
dann folgt
x
y
<0<
.
1+x
1−y
Nun zeigen wir, dass (−1, 1) und (0, 1) dieselbe Mächtigkeit haben. Die Abbildung g : (−1, 1) → (0, 1) mit
x+1
g(x) =
2
2.10. P-ADISCHE ENTWICKLUNGEN REELLER ZAHLEN
119
ist bijektiv. 2
Beweis von Satz 2.10.2. Wir zeigen zuerst, dass card(R) ≥ card(P(N)). Nach
Definition 1.11.1 müssen wir zeigen, dass es eine injektive Abbildung von P(N) nach
R gibt.
Es sei I : P(N) → {{xi }i∈N |xi ∈ {0, 1}} durch
(
1 falls i ∈ M
I(M ) = {xi }i∈N mit xi =
0 falls i ∈
/M
definiert. Offensichtlich ist I eine bijektive Abbildung. Nun betrachten wir die
Abbildung J : {{xi }i∈N |xi ∈ {0, 1}} → R, die durch
∞
X
xi
J({xi }i∈N ) =
10i
i=1
gegeben ist. Nach Bemerkung 2.10.1 ist die Abbildung J injektiv, weil hier kein
Dezimalbruch auftritt, in dem fast alle Koeffizienten gleich 9 sind. Die Zahl 9 tritt
überhaupt nicht auf, es treten nur 0 und 1 auf. J ist natürlich nicht surjektiv, dies
ist für das Argument unerheblich. Die Abbildung J ◦ I ist eine injektive Abbildung
von P(N) nach R, also gilt
card(P(N)) ≤ card(R).
Wir zeigen die Umkehrung. Nach Lemma 2.10.1 haben (0, 1) und R dieselbe Mächtigkeit.
Wir zeigen card((0, 1)) ≤ card(P(N)). Nach Definition 1.11.1 müssen wir zeigen,
dass es eine injektive Abbildung von (0, 1) nach P(N). Wir definieren h : (0, 1) →
P(N) auf die folgende Weise. Es sei x ∈ (0, 1). Dann hat x genau eine dyadische
Darstellung, in der nicht fast alle Koeffizienten gleich 1 sind
x=
∞
X
xn
n=1
2n
.
Wir setzen
h(x) = {n ∈ N|xn = 1}.
Die Abbildung h ist injektiv. 2
Korollar 2.10.1 Zwischen je zwei reellen, verschiedenen Zahlen gibt es sowohl eine
rationale als auch eine irrationale Zahl, d.h. für alle reellen Zahlen x und y mit
x < y gibt es eine rationale Zahl q mit x < q < y und eine irrationale Zahl w mit
x < w < y.
Die Aussage dieses Korollars mag dazu verleiten anzunehmen, dass es genauso
viele rationale Zahlen wie irrationale Zahlen gibt, bzw. etwas formaler, dass die
Menge der rationalen Zahlen und die der irrationalen Zahlen dieselbe Mächtigkeit
120
CHAPTER 2. DIE REELLEN ZAHLEN
besitzen. Dies ist nach Satz 2.10.2 falsch. Tatsächlich ist die Mächtigkeit der rationalen Zahlen gleich der von den natürlichen Zahlen und die der irrationalen Zahlen
gleich der der reellen Zahlen. Die Menge der rationalen Zahlen ist also abzählbar
und die der irrationalen Zahlen überabzählbar. Es gibt sehr viel mehr irrationale
Zahlen als rationale.
Beweis. Wir zeigen, dass zwischen zwei reellen Zahlen x und y mit x < y immer
eine rationale Zahl liegt. Dabei können wir annehmen, dass 0 ≤ x < y. Falls
nämlich x < 0, dann gibt es ein n ∈ N mit x + n > 0 und wir betrachten die Zahlen
x + n < y + n. Man beachte, dass x + n genau dann rational ist, wenn x rational
ist. Dasselbe gilt für y.
. Falls x rational ist und y
Falls beide Zahlen rational sind, dann wählen wir x+y
2
1
irrational, dann gibt es ein n ∈ N mit x+ n < y und wir wählen x+ n1 . Entsprechend
falls x irrational und y rational.
Wir nehmen nun an, dass beide Zahlen irrational sind. O.E.d.A. gilt 0 < x < y.
Wir betrachten die Dezimalbruchentwicklungen von y
∞
X
yi
,
y=
i
10
i=n
0
wobei n0 ∈ Z. Es gibt ein n1 ∈ Z mit
∞
X
i=n1
yi
y−x
<
.
i
10
2
+1
Es folgt, dass
n1
X
yi
∈Q
10i
i=n
0
und
n1
X
x+y
yi
x<
<
< y.
2
10i
i=n
0
Wir zeigen nun, dass zwischen zwei reellen Zahlen x und y mit x < y eine
irrationale Zahl liegt.
√
Wir betrachten den Fall, dass x ∈ Q und y ∈ R. Die Zahl 2 ist irrational und
somit sind für alle n ∈ N
√
2
x+
n
irrational. Wegen
√
2
lim
=0
n→∞ n
gibt es ein n0 mit
√
2
x<x+
< y.
n0
Falls x ∈ R und y ∈ Q, verfahren wir entsprechend.
Falls beide Zahlen x und y irrational sind, dann finden wir zunächst eine rationale
Zahl q mit x < q < y und verfahren, wie bereits dargelegt. 2
2.11. KETTENBRÜCHE
121
Beispiel 2.10.2 Die Mengen R und R \ Q haben dieselbe Mächtigkeit.
Beweis. Da R \ Q ⊆ R, so gilt card(R \ Q) ≤ card(R).
Wir geben nun eine injektive Abbildung von R nach R \ Q an. Wir wissen, dass (0, 1) dieselbe
Mächtigkeit wie R besitzt. Also gibt es eine bijektive Abbildung g von R nach (0, 1). Wir definieren
f : (0, 1) → R \ Q durch
x√
x ∈ (0, 1) \ Q
f (x) =
(0, 1) ∩ Q
x+ 2
f ist injektiv und bildet in die irrationalen Zahlen ab. Damit ist f ◦ g eine injektive Abbildung
von R nach R \ Q. 2
Beispiel 2.10.3 (i) Die √
Teilmenge M = {q ∈ Q|q 2 < 2} von Q hat in Q kein Supremum. Als
Teilmenge von R hat sie 2 als Supremum.
(ii) Die Teilmenge
M√2 = {q ∈ Q|q 2 < 2} ∪ {q ∈ Q|q ≤ 0}
von Q ist ein Dedekind Schnitt in Q.
Beweis. (i) Wir√nehmen an, dass M ein Supremum
√ in Q besitzt. Wir nennen es s. Wir wollen
zeigen, dass s = 2 gilt, was nicht
sein
kann,
weil
2 nach Satz 2.0.2 irrational ist. √
√
Wir nehmen an, dass s > 2 gilt. Nach Satz ?? gibt es eine rationale Zahl q1 mit 2 < q1 < s
und damit 2 < q12 < s2 . Damit ist s aber
√ nicht die kleinste, obere Schranke von M .
Nun √
nehmen wir an, dass s < 2 gilt. Dann gibt es aber nach Satz ?? ein q2 ∈ Q mit
s < q2 < 2. Also ist s nicht das Supremum von M .
Insgesamt erhalten wir s2 = 2. Dies kann nicht sein, da s eine rationale Zahl ist und nach Satz
2.0.2 keine rationale Zahl sein kann.
√
Wir zeigen nun, dass M als Teilmenge von R 2 als Supremum hat. Es gilt
√
√
M = {q ∈ Q| − 2 < q < 2}.
√
Also√ist 2 eine obere Schranke von M in R. Wir nehmen an, dass das Supremum √
s strikt kleiner
als 2 ist. Dann gibt es aber nach Satz eine rationale√ Zahl q3 mit s < q3 < 2 und damit
s2 < q32 < 2. Deshalb gilt q3 ∈ M und s < q3 . Somit ist 2 die kleinste obere Schranke von M in
R.
(ii) 0 ∈ M√2 und 2 ∈
/ M √2 .
Es sei ξ ∈ M√2 und η ≤ ξ. Dann gilt auch η ∈ M√2 . In der Tat, falls η ≤ 0, dann gilt
η ∈ M√2 . Falls 0 < η ≤ ξ, dann gilt η 2 ≤ ξ 2 < 2 und η ∈ M√2 .
Wir zeigen nun, dass M√2 kein Maximum besitzt. Es sei q0 ∈ M√2 und und wir zeigen, dass
es eine größere, rationale Zahl gibt, die Element von M√2 ist. Falls q0 ≤ 0 gilt, dann können wir 1
√
als das größere Element wählen. Es sei nun 0 < q0 . Da q0 ∈ M√2 , gilt q0 < 2. Es gibt ein n ∈ N
√
mit q0 + n1 < 2. Damit gilt (q0 + n1 )2 < 2 und q0 + n1 ∈ M√2 . 2
2.11
Kettenbrüche
Es sei x1 eine ganze Zahl und x2 , x3 , . . . seien positive, ganze Zahlen. Dann bezeichnen wir die Folge
1
x1 +
1
x2 +
1
x3 +
..
. + x1
n
122
CHAPTER 2. DIE REELLEN ZAHLEN
als Kettenbruch. Dies führt auf eine weitere Darstellung der reellen Zahlen durch
natürliche Zahlen. Häufig wird der Begriff eines Kettenbruches etwas allgemeiner
gefasst, man lässt nicht nur positive, ganze Zahlen zu.
Der holländische Astronom und Physiker Christian Huygens hat Kettenbrüche
dazu benutzt reelle Zahlen durch rationale Zahlen möglichst gut zu approximieren.
Er hat ca. 1680 ein Modell des Sonnensystems gebaut, das durch Zahnräder angetrieben
35
Tagen besteht und berechnete
wurde. Er legte zu Grunde, dass das Jahr aus 365 144
die Umlaufperioden der Planeten bezogen auf ein Erdjahr:
Merkur
25335
105190
Venus
64725
105190
Erde
1
Mars
Jupiter
197836
105190
1247057
105190
Saturn
3095277
105190
Er entwickelte diese Zahlen in Kettenbrüche und benutzte diese dann, um die
Zahnradverhältnisse zu bestimmen.
Lemma 2.11.1 Es seien x1 eine ganze Zahl und xn , n ≥ 2, natürliche Zahlen und
es seien p−1 = 0, p0 = 1, q−1 = 1, q0 = 0 und
pn = xn pn−1 + pn−2
qn = xn qn−1 + qn−2
n∈N
Dann gelten für alle n ∈ N und alle
(2.34)
1
cn = x 1 +
1
x2 +
x3 +
dass
(i)
cn =
1
..
. + x1
n
pn
qn
(ii)
pn+1 qn − pn qn+1
pn+2 qn − pn qn+2
= (−1)n+1
= xn+2 (−1)n+1
(iii)
(−1)n+1
cn+1 − cn =
qn+1 qn
und
xn+2 (−1)n+1
cn+2 − cn =
qn+2 qn
(iv)
c1 < c3 < · · · < c2n−1 < c2n < c2n−2 < · · · < c4 < c2
(v) Die Folge {cn }n∈N konvergiert.
2.11. KETTENBRÜCHE
123
Die Zahlen qn sind für n ≥ 1 positiv, die Zahlen pn können jedoch negativ sein.
Wenn auch x1 positiv ist, dann sind auch die pn positiv.
Beweis. Wir benutzen vollständige Induktion.
(i) Wir zeigen hier, dass die Behauptung nicht nur für positive, ganze Zahlen xn ,
n ≥ 2, sondern für positive, reelle Zahlen gilt. (Der Induktionsschritt verlangt auch,
dass wir den Beweis für den allgemeineren Fall führen.) Es gilt
c1 = x 1
p1 = x1 p0 + p−1 = a1
q1 = x1 q0 + q−1 = 1
Also gilt
p1
q1
Wir nehmen an, dass die Aussage für n richtig ist. Wir wenden dies auf die Folge

k = 1, . . . , n − 1
 xk
x̃k =
1
 xn +
k=n
xn+1
c1 =
an. Es seien p̃k und q̃k die zu x̃ gehörigen Koeffizienten. Dann gilt für k = 1, . . . , n −
1, dass p̃k = pk . Außerdem gilt nach Induktionsannahme, dass
cn+1
1
(xn + xn+1
)pn−1 + pn−2
x̃n p̃n−1 + p̃n−2
p̃n
=
=
= c̃n =
1
q̃n
x̃n q̃n−1 + q̃n−2
(xn + xn+1 )qn−1 + qn−2
=
xn+1 (xn pn−1 + pn−2 ) + pn−1
xn+1 pn + pn−1
pn+1
=
=
xn+1 (xn qn−1 + qn−2 ) + qn−1
xn+1 qn + qn−1
qn+1
(ii) Es gilt p1 = x1 , p0 = 1, q0 = 0 und q1 = 1. Hieraus ergibt sich sofort
p1 q0 − p0 q1 = −1
Wir nehmen an, dass die Behauptung für n richtig ist und schließen auf n + 1.
pn+1 qn − pn qn+1
= (xn+1 pn + pn−1 )qn − pn (xn+1 qn + qn−1 )
= pn−1 qn − pn qn−1 = (−1)n+1
Nun leiten wir die zweite Gleichung her. Es gilt
p2 q0 − p0 q2 = −q2 = −x2
pn+2 qn − pn qn+2 = (xn+2 pn+1 + pn )qn − pn (xn+2 qn+1 + qn )
= xn+2 (pn+1 qn − qn+1 pn ) = xn+2 (−1)n+1
(iii) Wir benutzen (ii).
cn+1 − cn =
pn+1 pn
qn pn+1 − pn qn+1
(−1)n+1
−
=
=
qn+1
qn
qn+1 qn
qn+1 qn
124
CHAPTER 2. DIE REELLEN ZAHLEN
qn pn+2 − pn qn+2
xn+2 (−1)n+1
pn+2 pn
−
=
=
qn+2
qn
qn+2 qn
qn+2 qn
(iv) Wir stellen fest, dass alle qn , n ∈ N, positive, ganze Zahlen sind. Wir überprüfen
dies. Es gilt q−1 = 1, q0 = 0 und q1 = 1. Weiter gilt
cn+2 − cn =
q 2 = x2 q 1 + q 0 = x2
Nun machen wir den Induktionsschritt
qn+1 = xn+1 qn + qn−1
Da xn+1 , qn und qn−1 positive, ganze Zahlen sind, so ist auch qn+1 eine positive,
ganze Zahl.
Für n = 2k folgt aus (iii)
c2k+2 − c2k =
x2k+2 (−1)2k−1
<0
q2k+2 q2k
Also gilt c2k+2 < c2k . Genauso verfahren wir für c2k+1 > c2k−1 .
(v) Nach (iv) sind {c2k }k∈N und {c2k+1 }k∈N zwei monotone, beschränkte Folgen.
Somit sind es konvergente Folgen. Es gilt für alle n ∈ N
qn ≥ n − 1
Wir haben q−1 = 1, q0 = 0, q1 = x1 q0 + q1 = q−1 = 1. Da xn natürliche Zahlen sind,
gilt insbesondere, dass 1 ≤ xn , und es folgt für n = 2, 3, . . .
qn = xn qn−1 + qn−2 ≥ qn−1 + qn−2 ≥ n − 1
Aus qn ≥ n − 1, n ∈ N, folgt
1
=0
n→∞ qn
lim
Deshalb gilt wegen (iii)
lim c2k = lim c2k+1
k→∞
2
k→∞
Falls eine reelle Zahl x gegeben ist, dann berechnen wir die Kettenbruchentwicklung von x so: Zu x wählen wir x1 als die größte, ganze Zahl, die kleiner oder gleich
x ist. Falls x = x1 , dann bricht der Kettenbruch ab. Falls x > x1 , dann setzen wir
x = x1 +
1
r2
wobei
0<
1
<1
r2
(r1 tritt nicht auf, wir beginnen mit r2 .) Allgemein wählen wir xn als die größte,
ganze Zahl, die kleiner als rn ist, und definieren rn+1 durch
r n = xn +
1
rn+1
wobei
0<
1
rn+1
<1
Also gilt für alle n = 2, 3, . . . , dass 1 < rn und 1 ≤ xn .
Falls x eine rationale Zahl ist, so bricht die Kettenbruchentwicklung ab. Der
nächste Satz stellt die Konvergenz dieses Verfahrens für irrationale Zahlen sicher.
2.11. KETTENBRÜCHE
125
Satz 2.11.1 Es sei x eine irrationale Zahl und pn , qn , n ∈ N, wie in Lemma 2.11.1
definiert. Dann gilt für alle n ∈ N
pn 1
1
< x − <
2qn qn+1
qn
qn qn+1
und die Kettenbruchentwicklung von x konvergiert gegen x.
Man kann auch zeigen, dass die Kettenbruchentwicklung eindeutig ist.
Beweis. Es gilt für alle n ∈ N
1
x = x1 +
1
x2 +
x3 +
1
...
+ r1n
Außerdem folgt aus der Iteration
r n = xn +
dass
1
1
<
rn
xn
Hieraus erhalten wir
1
rn+1
und
xn < rn
rn ≤ xn +
und
1
xn+1
1
1
1
>
≥
1
xn
rn
xn + xn+1
Es folgt
xn−1 +
1
1
> xn−1 +
≥ xn−1 +
xn
rn
1
1
xn +
xn+1
Hiervon bilden wir nun die Kehrwerte
1
xn−1 +
1
xn
<
1
xn−1 +
1
rn
≤
1
xn−1 +
1
xn +
1
xn+1
Dieses Argument kann so oft wiederholen, bis wir x1 erreicht haben. Man beachte,
dass sich beim Anwenden des Argumentes die Ungleichheitszeichen umkehren. Wir
setzen
1
cn = x 1 +
1
x2 +
1
x3 +
..
. + x1
n
126
CHAPTER 2. DIE REELLEN ZAHLEN
und erhalten für ungerades n
cn ≤ x ≤ cn+1 .
(Für gerades n gelten die umgekehrten Ungleichungen.) Mit Lemma (iii) folgt
|x − cn | ≤
1
|x −
oder
qn+1 qn
pn
1
|≤
.
qn
qn+1 qn
2
Lemma 2.11.2 ([4] p.47) Es sei Θ eine irrationale Zahl und pn und qn seien die
ganzen Zahlen wie in Satz 2.11.1 gegeben. Dann sind die Zahlen pn und qn beste
Approximationen in dem folgenden Sinne: Es seien p, q ganze Zahlen mit 0 < q <
qn+1 . Dann gilt
|qn Θ − pn | ≤ |qΘ − p|.
Beweis. Es seien u, v ganze Zahlen mit
p = upn + vpn+1
q = uqn + vqn+1
Dann gilt u 6= 0. Außerdem haben u und v verschiedene Vorzeichen, falls v 6= 0. Da
qn Θ − pn
qn+1 Θ − pn+1
verschiedene Vorzeichen haben, folgt
|qΘ − p| = |u(qn Θ − pn ) + v(qn+1 Θ − pn+1 )| ≥ |qn Θ − pn |
2
Beispiel 2.11.1 Es gilt
(i)
√
1
2=1+
1
2+
1
2+
2+
(ii)
bzw.
1
.
2 + ..
√
1
1
2 − 47321 ≤
=
33461 33461 · 80782
2703046502
√
2 = 1, 41421356237 ± 10−9
Beweis. (i) Wir berechnen x1 und r2 :
√
2 = x1 +
wobei x1 die größte, ganze Zahl kleiner oder gleich
√
1
= 2−1
r1
oder
√
1
r2
2 ist. Also gilt x1 = 1. Daraus ergibt sich
r2 = √
√
1
= 2+1
2−1
2.11. KETTENBRÜCHE
127
√
x2 ist die größte, ganze Zahl, die kleiner oder gleich r2 = 2 + 1 ist, also x2 = 2. r3 wird aus der
Gleichung
1
r2 = x2 +
r3
√
Wir erhalten wieder r3 = 2 + 1. Mit Induktion erhalten wir, dass für alle n ≥ 2 gilt
√
xn = 2 und rn = 2 + 1
(ii) Es gilt p−1 = 0, p0 = 1, q−1 = 1, q0 = 0 und für n = 2, 3 . . .
pn = xn pn−1 + pn−2
qn = xn qn−1 + qn−2
n
pn
qn
−1
0
1
0 1 2 3
1 1 3 7
0 1 2 5
4
17
12
5
41
29
6
99
70
7
239
169
8
577
408
9
1393
985
10
11
12
13
14
3363 8119 19601 47321 114243
2378 5741 13860 33461 80782
Damit erhalten wir
47321 : 33461 = 1, 414213562
33461
13860
133844
4756
33461
14099
133844
7146
66922
4538
33461
11919
100383
18807
167305
20765
200766
6884
66922
1918
2
Satz 2.11.2 ([10],p. 399 ) Falls p und q positive, ganze Zahlen mit q ≥ 2 sind,
dann gilt
p −42
q
< π − q
128
CHAPTER 2. DIE REELLEN ZAHLEN
Kettenbruchentwicklungen haben Anwendungen in der Elektrotechnik. Die Impedanzfunktion Z(s), s ∈ C, des Netzwerkes
lässt sich als Kettenbruch schreiben
1
Z(s) = L1 +
1
C2 +
1
L3 +
1
C4 +
..
. +
1
Ln
Der Vorteil eines solchen Leiternetzwerkes ist seine große Stabilität. So kann man
Kosten sparen, indem man billigere Bauteile mit größeren Toleranzen verwendet.
Ebenso kann man solche Netzwerke in Apparaten verwenden, in denen große Hitze
entsteht.
Beispiel 2.11.2
1
e=2+
1
1+
1
2+
1
1+
1
1+
1
4+
1
1+
1+
1
6 + ···
Die Folge der Koeffizienten weist eine gewisse Regelmäßigkeit auf.
2, 1, 2, 1, 1, 4, 1, 1, 6, 1, 1, 8, 1, 1, 10, . . .
Beweis.[24, 85] 2
Satz 2.11.3 (Euler) Ein periodischer, regelmäßiger Kettenbruch stellt eine irrationale Zahl dar, die einer quadratischen Gleichung mit rationalen Koeffizienten
genügt.
Chapter 3
Funktionen einer reellen
Veränderlichen
3.1
Stetigkeit
Johann Peter Gustav Lejeune Dirichlet wurde am 13. Februar 1805 in Düren geboren und starb
am 5. Mai 1859 in Göttingen. Er studierte in Paris. Seine erste wissenschaftliche Arbeit betraf
die Vermutung von Fermat. Er wurde als 20jähriger Student eingeladen, an der Französischen
Akademie der Wissenschaften über diese Arbeit einen Vortrag zu halten. Er lehrte in Berlin und
Göttingen.
Vereinfachend lässt sich sagen, dass eine Funktion stetig ist, wenn sie sich nicht
sprunghaft ändert. Dies lässt sich auch so formulieren: Man kann den Graphen
einer stetigen Funktion zeichnen, ohne den Bleistift vom Blatt abzuheben. Wenn
man im Argumentbereich kleine Ausschläge um einen Wert betrachtet, so kann man
die Ausschläge im Bildbereich kontrollieren.
Wir beweisen hier die grundlegenden Eigenschaften von stetigen Funktionen, wie
den Zwischenwertsatz
Wir geben hier verschiedene Beispiele stetiger bzw. unstetiger Funktionen an.
Definition 3.1.1 Es sei X eine Teilmenge von R und f : X → R eine Funktion
von X nach R. f heißt stetig in x0 ∈ X, wenn es zu jedem > 0 ein δ > 0 gibt, so
dass für alle x ∈ X mit |x − x0 | < δ
|f (x) − f (x0 )| < gilt.
In Quantorenschreibweise sieht das so aus:
∀ > 0 ∃δ > 0 ∀x ∈ X, |x − x0 | < δ :
|f (x) − f (x0 )| < .
f heißt stetig auf X, wenn f in allen Punkten von X stetig ist.
129
130
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beispiel 3.1.1 (i) f : R → R, f (x) = c, ist auf R stetig.
(ii) f : R → R, f (x) = x, ist auf R stetig.
(iii) f : (0, ∞) → R, f (x) = x1 , ist auf (0, ∞) stetig.
(iv) f : R → R
(
f (x) =
für x ≤ 0
0
1
für x > 0
ist nicht in 0 stetig, aber in allen anderen reellen Punkten stetig.
(v) f : R \ {0} → R
(
f (x) =
0
für x < 0
1
für x > 0
ist eine stetige Funktion.
(vi) (Dirichlet) D : R → R
(
D(x) =
0
falls x irrational ist
1
falls x rational ist
ist in allen Punkten unstetig.
Wir werden später (Beispiel 5.1.1) feststellen, dass die Einschränkung dieser Funktion auf das
Intervall [0, 1] nicht Riemann integrierbar ist. Diese Funktion wurde von Peter Gustav Lejeune
Dirichlet eingeführt.
(vii) Die Funktion f : R → R mit f (x) = x2 ist in allen Punkten stetig.
(Den Graphen dieser Funktion bezeichnet man als Parabel. Ein springender Ball beschreibt eine
Parabel, ebenso das Wasser in einem Springbrunnen.)
√
(viii) f : [0, ∞) → R mit f (x) = x ist in allen Punkten stetig.
Beweis. (i) Zu gegebenem x0 und müssen wir ein entsprechendes δ angeben. Da f konstant ist,
ist dies besonders einfach. Wir können irgendeine Zahl für δ wählen, z.B. 100. Für alle x ∈ R mit
|x − x0 | < 100 gilt
|f (x) − f (x0 )| = 0 < .
In diesem Beispiel hängt δ weder von noch von x0 ab.
(ii) Zu gegebenen x0 und wählen wir δ = . Für alle x mit |x − x0 | < δ gilt
|f (x) − f (x0 )| = |x − x0 | < δ = .
In diesem Beispiel hängt δ zwar nicht von x0 , aber von ab.
(iii) Zu gegebenen x0 und wählen wir
x0 x20 δ = min
,
.
2 2
Für alle x mit |x − x0 | < δ gilt
1
1 |x − x0 |
δ
x2 x0
|f (x) − f (x0 )| = − =
<
≤ 0 =
.
x x0
xx0
xx0
2xx0
2x
Wegen |x − x0 | < δ ≤
x0
2
gilt x0 − x <
x0
2
und deshalb
x0
2
< x. Damit folgt nun
|f (x) − f (x0 )| < .
3.1. STETIGKEIT
131
(iv) Die Stetigkeit in einem Punkt x0 bedeutet
∀ > 0∃δ > 0∀x ∈ X, |x − x0 | < δ :
|f (x) − f (x0 )| < .
Die Negation dieser Aussage ist
∃ > 0∀δ > 0∃x ∈ X, |x − x0 | < δ :
|f (x) − f (x0 )| ≥ .
In diesem Beispiel ist x0 = 0. Wir wählen = 12 . Die Zahl δ ist gegeben. Wir wählen x = 12 δ. Es
gilt
|x − x0 | = |x| = 12 δ < δ.
Weiter gilt
|f (x) − f (0)| = |f ( 12 δ) − f (0)| = 1 − 0 >
1
2
= .
(vi) Wir verwenden hier, dass es zwischen zwei reellen Zahlen sowohl eine rationale, als auch
eine irrationale Zahl gibt. Wir wählen in jedem Fall = 12 .
Falls x0 rational ist, dann wählen wir ein irrationales x mit |x − x0 | < δ. Dann gilt
|D(x) − D(x0 )| = 1 >
1
= .
2
Falls x0 irrational ist, wählen wir ein rationales x.
(vii) Wir wählen
p
δ = + |x0 |2 − |x0 | .
Man beachte, dass δ > 0. Dann gilt
= δ 2 + 2δ|x0 |
und wir erhalten
|f (x) − f (x0 )| = |x2 − x20 | = |x − x0 ||x + x0 | = |x − x0 ||x − x0 + 2x0 |.
Mit der Dreiecksungleichung folgt
|f (x) − f (x0 )| ≤ |x − x0 |(|x − x0 | + 2|x0 |) < δ(2|x0 | + δ) = .
(viii) Wir hatten in Beispiel 2.3.5 nachgewiesen, dass die Quadratwurzelfunktion existiert und
monoton wachsend ist.
Wir weisen zuerst nach, dass f in x0 mit x0 > 0 stetig ist. Wir wählen
nx
√ o
0
δ = min
, · x0 .
2
Dann gilt für alle x mit |x − x0 | < δ
√
√
√
√
√
| x − x0 || x + x0 |
√
|x − x0 |
δ
√
|f (x) − f (x0 )| = | x − x0 | =
= √
< √
√
√
√ .
| x + x0 |
| x + x0 |
| x + x0 |
Aus |x − x0 | < δ ≤
x0
2
folgt
x0
2
< x und damit
p x0
2
<
√
x. Weiter folgt
δ
δ
δ
|f (x) − f (x0 )| < p x0 √
=
< √
≤ .
√
1
| x0 |
|(1 + √2 ) x0 |
| 2 + x0 |
Nun der Fall x0 = 0. Wir wählen δ = 2 . Dann gilt für alle x mit |x − x0 | < δ bzw. x < δ
√
√
|f (x) − f (x0 )| = x < δ = .
2
132
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Satz 3.1.1 Es sei X eine Teilmenge von R und f : X → R eine Funktion. f ist
genau dann in x0 ∈ X stetig, wenn für jede Folge {xn }n∈N ⊆ X mit limn→∞ xn = x0
lim f (xn ) = f (x0 )
n→∞
gilt.
Beweis. f sei stetig in x0 , d.h.
(3.1)
∀ > 0 ∃δ > 0 ∀x, |x − x0 | < δ :
|f (x) − f (x0 )| < .
Weiter gelte limn→∞ xn = x0 , also
(3.2)
∀δ > 0 ∃N ∈ N ∀n ≥ N :
|xn − x0 | < δ .
Aus (3.1) und (3.2) folgt
∃N ∈ N ∀n > N :
|f (xn ) − f (x0 )| < .
Also
lim f (xn ) = f (x0 ) .
n→∞
Wir zeigen nun die Umkehrung, d.h.
∀{xn }n∈N , lim xn = x0 : lim f (xn ) = f (x0 ) =⇒ f ist in x0 stetig.
n→∞
n→∞
Wir zeigen die äquivalente Implikation:
f ist nicht in x0 stetig
=⇒ ∃{xn }n∈N , lim xn = x0 :
n→∞
f (x0 ) ist nicht Grenzwert der Folge {f (xn )}n∈N
f ist nicht in x0 stetig:
∃ > 0 ∀δ > 0 ∃x, |x − x0 | < δ :
|f (x) − f (x0 )| ≥ .
Wir wählen nun für δ die Werte n1 , n ∈ N. Damit erhalten wir
∃ > 0 ∀n ∈ N ∃xn , |xn − x0 | <
1
:
n
|f (xn ) − f (x0 )| ≥ .
Also gilt
lim xn = x0
n→∞
und f (x0 ) ist nicht Grenzwert der Folge {f (xn )}n∈N . 2
3.1. STETIGKEIT
133
Bemerkung 3.1.1 Es sei X eine Teilmenge von R, es sei x0 ∈ X und f : X → R.
Wir sagen, dass f in x0 linksseitig stetig ist, wenn g : X ∩ (−∞, x0 ] → R mit
g(x) = f (x) in x0 stetig ist. Entsprechend definiert man die rechtsseitige Stetigkeit.
(i) f ist genau dann in x0 linksseitig stetig ist, wenn für alle Folgen {xn }n∈N mit
{xn }n∈N ⊆ X ∩ (−∞, x0 ] und limn→∞ xn = x0
lim f (xn ) = f (x0 )
n→∞
gilt.
(ii) f ist genau dann stetig in x0 , wenn sie links- und rechtsseitig stetig in x0 ist.
Lemma 3.1.1 Es seien X und Y Teilmengen von R und f : X → Y und g : Y → R
seien Funktionen, die in x0 bzw. f (x0 ) stetig sind. Dann ist auch g ◦ f : X → R
mit
(g ◦ f )(x) = g(f (x))
in x0 stetig.
Beweis. Nach Satz 3.1.1 gelten
f ist in x0 stetig ⇐⇒ ∀{xn }n∈N , lim xn = x0 :
n→∞
lim f (xn ) = f (x0 )
n→∞
und
g ist in f (x0 ) stetig ⇐⇒ ∀{yn }n∈N , lim yn = f (x0 ) :
n→∞
lim g(yn ) = g(f (x0 )) .
n→∞
Wir setzen nun yn = f (xn ) und erhalten
∀{xn }n∈N , lim xn = x0 :
n→∞
lim g(f (xn )) = g(f (x0 ))
n→∞
Damit ist g ◦ f in x0 stetig. 2
Lemma 3.1.2 Es seien X eine Teilmenge von R und f, g : X → R Funktionen,
die in x0 stetig sind. Dann gelten
(i) f + g ist in x0 stetig.
(ii) f · g ist in x0 stetig.
(iii) Wenn überdies g 6= 0 auf X gilt, dann ist
f
g
in x0 stetig.
Beweis. Wir benutzen wieder Satz 3.1.1 und Lemma 2.2.3. Wir zeigen (i). Es
gelten
∀{xn }n∈N , lim xn = x0 :
n→∞
∀{xn }n∈N , lim xn = x0 :
n→∞
n→∞
n→∞
lim f (xn ) = f (x0 )
lim g(xn ) = g(x0 )
Es folgt
∀{xn }n∈N , lim xn = x0 :
n→∞
2
lim (f (xn ) + g(xn )) = f (x0 ) + g(x0 ).
n→∞
134
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beispiel 3.1.2 (i) Es sei n ∈ N und f : R → R mit f (x) = xn . f ist auf R stetig.
(ii) Alle Polynome p : R → R
p(x) =
n
X
ak xk
k=0
sind auf R stetig.
(iii) Alle rationalen Funktionen
p
q
sind auf R \ {x|q(x) = 0} stetig.
Beweis. (i) folgt, weil f (x) = x nach Beispiel 3.1.1 stetig ist und weil Produkte von stetigen
Funktionen nach Lemma 3.1.2 stetig sind.
(ii) folgt aus (i) und Lemma 3.1.2 (i).
(iii) folgt aus (ii) und Lemma 3.1.2 (iii). Definition 3.1.2 Wenn es ein ξ ∈ R gibt, so dass für alle Folgen {xn }n∈N mit
limn→∞ xn = x0 der Grenzwert
lim f (xn ) = ξ.
n→∞
angenommen wird, so schreiben wir auch dafür
lim f (x) = ξ.
x→x0
Dies ist äquivalent zu
(3.3)
∀ > 0 ∃δ > 0 ∀x, |x − x0 | < δ :
|f (x) − ξ| < .
Hierbei muss es nicht so sein, dass x0 im Definitionsgebiet von f liegt.
Obwohl man i.A. ∞ bzw. −∞ nicht als Grenzwerte zulässt, schreibt man symbolisch
(3.4)
lim f (x) = ∞
x→x0
und
lim f (xn ) = ∞,
n→∞
falls
∀K > 0 ∃N ∈ N ∀n > N :
f (xn ) > K.
Entsprechend für −∞.
Satz 3.1.2 Es seien a, b ∈ R mit a < b und f : [a, b] → R eine stetige Funktion.
Dann hat f auf [a, b] ein Minimum und ein Maximum, d.h. es gibt xmin , xmax ∈ [a, b],
so dass für alle x ∈ [a, b]
f (xmin ) ≤ f (x) ≤ f (xmax )
gilt.
Wichtig bei diesem Satz ist neben der Stetigkeit der Funktion, dass das Intervall
beschränkt und abgeschlossen ist, d.h. die Endpunkte gehören zum Intervall.
3.1. STETIGKEIT
135
Beispiel 3.1.3 (i) f : (0, 1] → R mit f (x) = x1 ist in allen Punkten stetig, besitzt aber kein
Maximum. Man beachte, dass die Voraussetzung, dass [a, b] ein abgeschlossenes Intervall sein soll,
nicht gegeben ist.
(ii) f : [−1, 1] → R mit f (x) = x2 ist stetig und hat Minimum und Maximum. Das Minimum ist
gleich 0 und wird in 0 angenommen. Das Maximum ist gleich 1 und wird in −1 und 1 angenommen.
Beweis von Satz 3.1.2. Wir beweisen, dass f auf [a, b] sein Maximum annimmt.
Der Beweis für das Minimum wird genauso geführt.
Wir zeigen, dass die Menge
{f (x)|x ∈ [a, b]}
nach oben beschränkt ist, also nach Satz 2.1.2 ein Supremum besitzt. Dann zeigen
wir, dass das Supremum angenommen wird, also tatsächlich ein Maximum ist.
Wir nehmen an, dass f nicht nach oben beschränkt ist:
(3.5)
∀n ∈ N ∃xn :
n ≤ f (xn ) .
Da die Folge {xn }n∈N in [a, b] enthalten ist, ist sie beschränkt. Nach Satz 2.3.3 besitzt
sie deshalb eine konvergente Teilfolge {xnk }k∈N . Wir bezeichnen diesen Grenzwert
mit x0 .
Nach Lemma 2.2.4 (i) gilt x0 ∈ [a, b]. Also gelten x0 ∈ [a, b] und
lim xnk = x0 .
k→∞
Da f stetig ist, folgt
lim f (xnk ) = f (x0 ) .
k→∞
Hieraus folgt
∃K ∈ N ∀k > K :
|f (xnk ) − f (x0 )| < 1
∃K ∈ N ∀k > K :
f (xnk ) < 1 + f (x0 ) .
und damit
Mit (3.5) folgt
∃K ∈ N ∀k > K :
nk < 1 + f (x0 ) .
Da n1 < n2 < · · · , kann dies nicht sein. Also ist die Menge
{f (x)|x ∈ [a, b]}
nach oben beschränkt und hat nach Satz 2.1.2 ein Supremum, das wir mit ξ bezeichnen.
Nun wählen wir eine neue Folge {xn }n∈N : Da ξ das Supremum der Menge
{f (x)|x ∈ [a, b]} ist, gibt es zu jedem > 0 ein x mit ξ ≤ f (x) + . Wäre
dies nicht so, dann würde es ein > 0 geben, so dass für alle x ∈ [a, b] die Abschätzung ξ > f (x) + gilt. Dann wäre aber ξ − eine obere Schranke der Menge
{f (x)|x ∈ [a, b]}.
136
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Also gilt
1
.
n
Wiederum folgt mit Satz 2.3.3, dass {xn }n∈N eine konvergente Teilfolge {xnk }k∈N
besitzt. Wiederum mit Lemma 2.2.4 folgt, dass es ein x0 ∈ [a, b] mit
∀n ∈ N ∃xn ∈ [a, b] :
ξ ≤ f (xn ) +
lim xnk = x0
k→∞
gibt. Da f stetig ist, folgt
lim f (xnk ) = f (x0 ) .
k→∞
Da für alle k ∈ N gilt, dass ξ ≤ f (xnk ) +
1
,
nk
folgt
1
ξ ≤ lim f (xnk ) +
= f (x0 ) ≤ ξ .
k→∞
nk
Also erhalten wir f (x0 ) = ξ. 2
Lemma 3.1.3 Es seien a, b ∈ R mit a < b und f : [a, b] → R sei eine stetige
Funktion. Es gelte f (a) < 0 < f (b) oder f (b) < 0 < f (a). Dann gibt es mindestens
ein x0 ∈ (a, b) mit f (x0 ) = 0.
Da f stetig ist, kann man den Graphen von f zeichnen, ohne den Bleistift vom
Papier zu heben. Der Punkt (a, f (a)) befindet sich unter der x-Achse, weil f (a) < 0,
und der Punkt (b, f (b)) befindet sich über der x-Achse, weil f (b) > 0. Wenn man
also den Graphen zeichnet, muss an zumindest an einer Stelle die x-Achse kreuzen.
Beispiel 3.1.4 Die Funktion f (x) = x3 ist auf [−1, 1] stetig und es gilt f (−1)f (1) = −1. An der
Stelle θ = 0 gilt f (0) = 0.
Beweis von Lemma 3.1.3. Wir können annehmen, dass f (a) < 0 und f (b) > 0.
Wir betrachten die Menge
A = {x|x ∈ [a, b] und f (x) ≤ 0}.
A ist nicht leer, weil a ∈ A und A hat ein Supremum, weil A nach oben durch b
beschränkt ist. Wir setzen ξ = sup A und behaupten, dass f (ξ) = 0. Es gibt eine
Folge {xn }n∈N ⊆ A mit
lim xn = ξ,
n→∞
weil ξ das Supremum von A ist. Wegen der Stetigkeit von f folgt
lim f (xn ) = f (ξ).
n→∞
Wegen {xn }n∈N ⊆ A gilt für alle n ∈ N, dass f (xn ) ≤ 0. Also folgt
f (ξ) ≤ 0.
3.1. STETIGKEIT
137
Wir zeigen nun, dass auch f (ξ) ≥ 0 gilt. Wir nehmen an, dass f (ξ) < 0 gilt. Da f
stetig ist, gilt
∀ > 0 ∃δ > 0 ∀x, |x − ξ| < δ :
|f (x) − f (ξ)| < .
Wir wählen = 12 |f (ξ)|. Es folgt
∃δ > 0∀x, |x − ξ| < δ :
|f (x) − f (ξ)| < 12 |f (ξ)|.
Da f (ξ) < 0, folgt
∃δ > 0∀x, |x − ξ| < δ :
f (x) − f (ξ) < − 21 f (ξ)
und
∃δ > 0∀x, |x − ξ| < δ :
f (x) < 12 f (ξ) < 0.
Nun wählen wir x = ξ + 12 δ und erhalten
f (ξ + 21 δ) < 0.
Damit folgt
ξ + 12 δ ≤ sup A = ξ.
Dies ist ein Widerspruch. Also gilt f (ξ) = 0. 2
Satz 3.1.3 (Zwischenwertsatz) Es seien a, b ∈ R mit a < b und f : [a, b] → R eine
stetige Funktion. Dann existiert für alle η mit
inf{f (x)|x ∈ [a, b]} ≤ η ≤ sup{f (x)|x ∈ [a, b]}
mindestens ein ξ ∈ [a, b] mit f (ξ) = η.
Beweis. Nach Satz 3.1.2 gibt es xmin und xmax mit
f (xmin ) = inf{f (x)|x ∈ [a, b]}
f (xmax ) = sup{f (x)|x ∈ [a, b]}
Wir können also annehmen, dass
f (xmin ) < η < f (xmax ).
Wir setzen
F (x) = f (x) − η.
Dann gelten
F (xmin ) < 0
und
F (xmax ) > 0.
Nach Lemma 3.1.3 gibt es ein ξ ∈ (xmin , xmax ) mit F (ξ) = 0. Also gilt f (ξ) = η. 2
138
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beispiel 3.1.5 Es sei p : R → R ein Polynom
p(x) =
n
X
ak xk ,
k=0
bei dem der höchste Exponent n ungerade ist und der Koeffizient an 6= 0. Dann hat p mindestens
eine reelle Nullstelle.
Beweis. Es gibt zwei Punkte x1 und x2 mit p(x1 ) < 0 und p(x2 ) > 0. Mit dem Zwischenwertsatz
folgt dann, dass es ein ξ ∈ (x1 , x2 ) mit p(ξ) = 0 gibt. Wir zeigen nun, dass es solche Punkte x1
und x2 gibt.
n
n−1
X
X
p(x) =
ak xk ≥ xn −
|ak ||x|k
k=0
Für x ≥ 1 folgt
p(x) ≥ xn − xn−1
k=0
n−1
X
k=0
|ak | = xn−1
x−
n−1
X
k=0
!
|ak |
Pn−1
Für x ≥ 1 und x > k=0 |ak | gilt p(x) > 0.
Umgekehrt gilt für alle x mit x ≤ −1
p(x)
=
n
X
k=0
=
ak xk ≤ xn +
−|x|n + |x|n−1
Somit gilt für x mit x ≤ −1 und |x| >
n−1
X
k=0
n−1
X
k=0
Pn−1
k=0
|ak ||x|k ≤ xn + |x|n−1
|ak | = −|x|n−1
|x| −
n−1
X
k=0
n−1
X
k=0
|ak |
!
|ak |
|ak |
p(x) < 0.
2
Beispiel 3.1.6 (i) Es sei f : [0, 1] → [0, 1] eine stetige Abbildung. Dann hat f einen Fixpunkt,
d.h. es gibt ein x ∈ [0, 1] mit f (x) = x.
(ii) Es sei f : [0, 2] → R eine stetige Funktion derart, dass f (0) = f (2) ist. Dann existiert ein
x ∈ [0, 1], für das f (x) = f (x + 1) gilt.
Beweis. (i) Wir betrachten die Funktion g : [0, 1] → R mit g(x) = f (x) − x. Es gelten g(0) =
f (0) − 0 ≥ 0 und g(1) = f (1) − 1 ≤ 0. Nach dem Zwischenwertsatz nimmt die stetige Funktion g
alle Werte zwischen g(0) und g(1) an, also auch 0.
(ii) Wir betrachten die Funktion g : [0, 1] → R mit g(x) = f (x) − f (x + 1). Dann gelten
g(0) = f (0) − f (1)
g(1) = f (1) − f (2) = f (1) − f (0)
Also
g(0) = −g(1)
Nun wenden wir den Zwischenwertsatz an. 2
Beispiel 3.1.7 Es sei f : (0, ∞) → R

falls x irrational
0
f (x) =
m
1
falls x =
und m und n teilerfremd sind
n
n
Dann ist f in allen irrationalen Punkten stetig und in allen rationalen Punkten unstetig.
3.1. STETIGKEIT
139
Beweis. Wir zeigen, dass f in allen rationalen Punkten, die von 0 verschieden sind, unstetig ist.
1
m
Es gilt f ( m
n ) = n , aber in jeder Umgebung von n findet man einen irrationalen Punkt.
Wir zeigen nun, dass f in allen irrationalen Punkten x stetig ist. Wir nehmen an, dass es
einen irrationalen Punkt x0 gibt, in dem f nicht stetig ist Dann gibt es eine Folge {xn }n∈N mit
limn→∞ xn = x0 , so dass die Folge {f (xn )}n∈N nicht gegen f (x0 ) = 0 konvergiert.
Dies bedeutet, dass es eine Teilfolge {xnk }k∈N rationaler Zahlen gibt, die gegen x0 konvergiert.
n
Wir können also annehmen, dass es eine Folge rationaler Zahlen { m
kn }n∈N gibt, so dass
lim
n→∞
mn
= x0
kn
und so dass die Folge { k1n }n∈N nicht gegen 0 konvergiert.
Dann gibt es eine Teilfolge knj , j ∈ N, die beschränkt ist: Da die Folge { k1n }n∈N nicht gegen
0 konvergiert, gilt
1
∃ > 0∀N ∃n ≥ N :
≥
kn
Wir wählen zu N = 1 ein n1 mit 1 ≤ n1 und
1
≥ .
k n1
Nachdem wir n1 < · · · < nj gewählt haben, wählen wir nj+1 . Zu N = nj + 1 gibt es ein nj+1 ≥ N
mit
1
≥ .
knj+1
Damit gilt für alle j ∈ N
1
mn
und die Folge ist beschränkt. Insgesamt erhalten wir also eine Folge { kn j }j∈N mit
knj ≤
j
mnj
lim
= x0
n→∞ knj
und so dass die Folge {knj }j∈N beschränkt ist. Dann gibt es in der Menge {knj |j ∈ N} nur endlich
viele verschiedene Zahlen. Außerdem ist die Folge mnj , j ∈ N, beschränkt, weil anderenfalls die
mn
konvergente Folge kn j , j ∈ N, nicht beschränkt wäre, was nach Lemma 2.2.1 nicht sein kann.
j
Somit nimmt auch die Folge {mnj }j∈N nur endlich viele Werte an. Somit nimmt
mnj
knj j∈N
nur endlich viele Werte {α1 , . . . , αr } an. Dann gilt
mnj
∈ {α1 , . . . , αr }
lim
j∈N knj
und damit rational. Der Grenzwert ist aber gleich der irrationalen Zahl x0 . 2
P
Beispiel 3.1.8 Es sei {an }n∈N eine Folge positiver, reeller Zahlen, so dass n∈N an konvergiert.
Außerdem sei q : N → Q eine Bijektion. Für x ∈ R definieren wir
(
an
falls q(n) ≤ x
x
an =
0
falls q(n) > x
und
f (x) =
X
axn
n∈N
f ist eine positive, beschränkte, strikt monoton wachsende Funktion, die in den rationalen Punkten
unstetig und in den irrationalen Punkten stetig ist.
140
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beweis. Etwas kürzer und prägnanter lässt sich f so definieren
X
aq
f (x) =
q≤x
Wir zeigen
(i) Für alle x, y ∈ R mit x < y gilt f (x) < f (y).
P
(ii) Für alle x ∈ R gilt 0 < f (x) < n∈N an .
(iii) f ist in allen rationalen Punkten unstetig.
(iv) f ist in allen irrationalen Punkten stetig.
(i) Für alle x, y ∈ R mitx < y existiert ein z ∈ Q mit x < z < y. Für alle n ∈ N gilt
axn ≤ ayn
und
f (y) − f (x) =
X
n∈N
ayn −
X
axn =
n∈N
X
n∈N
(ayn − axn ) ≥ ayq−1 (z) − ayq−1 (z) = aq−1 (z) > 0
(iii) Es sei x0 ∈ Q. Wir haben zu zeigen
∃ > 0∀δ > 0∃x, |x − x0 | < δ : |f (x) − f (x0 )| ≥ .
Wir wählen = aq−1 (x0 ) und x < x0 . Dann gilt
X
x0
x
0
f (x0 ) − f (x) =
(axn0 − axn ) ≥ axq−1
(x0 ) − aq −1 (x0 ) = aq −1 (x0 ) = .
n∈N
(iv) Wir zeigen
∀x0 ∀ > 0∃δ > 0∀x, |x − x0 | < δ : |f (x) − f (x0 )| < Wir wählen zu gegebenen x0 und das δ. Es gilt
∀ > 0∃N ∀n > N :
∞
X
ak <
k=n
2
Wir setzen
δ = min{|x0 − q(n)| |n = 1, 2, . . . , N }
Dann gilt für alle x mit |x − x0 | < δ und alle n = 1, 2, . . . , N , dass axn = axn0 . Wir prüfen dies nach.
Falls x0 < q(n), dann gilt axn0 = 0. Es gilt für alle n = 1, . . . , N
δ ≤ q(n) − x0
oder
x0 + δ ≤ q n .
Also gilt für alle n = 1, . . . , N und alle x mit |x − x0 | < δ
x < q(n).
Damit gilt für alle n = 1, . . . , N und alle x mit |x − x0 | < δ
axn = 0.
Nun betrachten wir den Fall q(n) < x0 . Es gilt axn0 = an . Es gilt für alle n = 1, . . . , N
δ ≤ x0 − q(n)
oder
qn ≤ x0 − δ.
Deshalb folgt für alle n = 1, . . . , N und alle x mit |x − x0 | < δ
q(n) < x.
3.1. STETIGKEIT
141
Also gilt für alle n = 1, . . . , N und alle x mit |x − x0 | < δ
axn = an .
Damit folgt für alle x mit |x − x0 | < δ
|f (x) − f (x0 )| =
≤
∞
X
X
x
x0 x
x0 an − an an − an = n∈N
∞
X
n=N
n=N
|axn | +
∞
X
n=N
|axn0 | ≤ 2
∞
X
n=N
|an | < .
2
Beispiel 3.1.9 (i) Eine Funktion f : R → R heißt Lipschitz stetig, falls es eine Konstante L gibt,
so dass für alle x, y ∈ R
|f (x) − f (y)| ≤ L|x − y|
gilt. Jede Lipschitz stetige Funktion ist stetig.
(ii) Eine Funktion f : R → R heißt konvex, falls für alle x, y ∈ R und alle t mit 0 ≤ t ≤ 1
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)
gilt. Dann ist f in allen reellen Punkten stetig.
Beweis. (ii) Wir zeigen, dass f Lipschitz stetig ist. Es seien x1 < x0 < x2 . Wir betrachten die
beiden Geraden
f (x2 ) − f (x0 )
(x − x0 ) + f (x0 )
x2 − x0
und
Es gilt für alle x mit x0 ≤ x ≤ x2
f (x0 ) − f (x1 )
(x − x0 ) + f (x0 ).
x0 − x1
f (x0 ) − f (x1 )
f (x2 ) − f (x0 )
(x − x0 ) + f (x0 ) ≤ f (x) ≤
(x − x0 ) + f (x0 )
x0 − x1
x2 − x0
und für alle x mit x1 ≤ x ≤ x0
f (x0 ) − f (x1 )
f (x2 ) − f (x0 )
(x − x0 ) + f (x0 ) ≤ f (x) ≤
(x − x0 ) + f (x0 ).
x2 − x0
x0 − x1
Es folgt für alle x mit x0 ≤ x ≤ x2
f (x0 ) − f (x1 )
f (x2 ) − f (x0 )
(x − x0 ) ≤ f (x) − f (x0 ) ≤
(x − x0 )
x0 − x1
x2 − x0
und für alle x mit x1 ≤ x ≤ x0
f (x2 ) − f (x0 )
f (x0 ) − f (x1 )
(x − x0 ) ≤ f (x) − f (x0 ) ≤
(x − x0 )
x2 − x0
x0 − x1
Es folgt für alle x mit x0 ≤ x ≤ x2
|f (x) − f (x0 )| ≤ (x − x0 ) max
2
|f (x2 ) − f (x0 )| |f (x0 ) − f (x1 )|
,
x2 − x0
x0 − x1
.
142
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
3.2
Gleichmäßige Stetigkeit
Definition 3.2.1 Es sei X eine Teilmenge von R. Eine Funktion f : X → R heißt
gleichmäßig stetig auf X, wenn es zu jedem > 0 ein δ > 0 gibt, so dass für alle
x1 , x2 ∈ X mit |x1 − x2 | < δ
|f (x1 ) − f (x2 )| < gilt. In Quantorenschreibweise
∀ > 0 ∃δ > 0 ∀x1 , x2 ∈ X, |x1 − x2 | < δ :
|f (x1 ) − f (x2 )| < .
Mit dieser Eigenschaft werden wir zeigen, dass jede stetige Funktion Riemann
integrierbar ist. dem Riemann-Integral.
Beispiel 3.2.1 (i) Es sei f : X → R gleichmäßig stetig ist. Dann ist f auf X stetig.
(ii) f : R → R mit f (x) = x ist gleichmäßig stetig.
(iii) f : (0, ∞) → R mit f (x) =
(iv) f : [0, ∞) → R mit f (x) =
1
x
√
ist nicht gleichmäßig stetig.
x ist gleichmäßig stetig.
2
(v) f : R → R mit f (x) = x ist nicht gleichmäßig stetig.
Beweis. (i) Da f gleichmäßig stetig ist, gilt
∀ > 0∃δ > 0∀x1 , x2 ∈ X, |x1 − x2 | < δ :
|f (x1 ) − f (x2 )| < .
Für festes x0 = x1 gilt damit
∀ > 0∃δ > 0∀x2 ∈ X, |x0 − x2 | < δ :
|f (x0 ) − f (x2 )| < .
(ii) ist gegeben. Wir wählen δ = . Dann gilt für alle x1 , x2 ∈ R mit |x1 − x2 | < δ
|f (x1 ) − f (x2 )| = |x1 − x2 | < δ = .
(iii) Die Verneinung der gleichmäßigen Stetigkeit bedeutet
∃ > 0∀δ > 0 ∃x1 , x2 ∈ X, |x1 − x2 | < δ :
Wir wählen = 1. δ ist gegeben. Wir wählen
1
x1 = min δ,
2
|f (x1 ) − f (x2 )| ≥ .
und
x2 =
1
x1 .
2
Dann gelten
|x1 − x2 | = |x1 − 21 x1 | = | 21 x1 | < δ
und
1
1 1
2 1 |f (x1 ) − f (x2 )| = − = − = ≥ 2 > 1 = .
x1
x2
x1
x1
x1
(iv) Wir benötigen die folgende Abschätzung. Für alle x, y ∈ [0, ∞) mit y ≤ x gilt
√
√
√
x − y ≤ x − y.
3.2. GLEICHMÄSSIGE STETIGKEIT
143
Wir nehmen an, dass dies falsch ist. Dann gibt es x, y mit y ≤ x, so dass
Dann gilt
√
√ √
√
√
x − y = ( x − y)2 < ( x − y)2 = x − 2 x y + y.
Hieraus folgt
√ √
2 x y < 2y
und somit
√
x−
√
y >
√
x − y.
x < y.
Dies ist ein Widerspruch, da y < x.
Zu gegebenem wählen wir δ = 2 . Dann gilt für alle x, y ∈ [0, ∞) mit y < x und |x − y| < δ
√
√
√
√
|f (x) − f (y)| = | x − y| ≤ x − y < δ = .
(v) Wir müssen zeigen
∃ > 0∀δ > 0∃x1 , x2 , |x1 − x2 | < δ :
1
δ
|f (x1 ) − f (x2 )| ≥ .
1
δ
+ 2δ . Dann gelten |x1 − x2 | = 2δ < δ und
δ2
δ 2 δ
+
=2+
> 2 > 1 = .
|f (x1 ) − f (x2 )| = |x21 − x22 | = |x1 − x2 ||x1 + x2 | =
2 δ
2
4
Wir wählen = 1 und x1 =
und x2 =
2
Satz 3.2.1 Es seien a, b ∈ R mit a < b und f : [a, b] → R sei eine stetige Funktion.
Dann ist f auf [a, b] gleichmäßig stetig.
Beweis. Wir nehmen an, dass f nicht gleichmäßig stetig ist. Dann existiert ein
> 0, so dass für alle δ > 0 Punkte x und y mit |x − y| ≤ δ und
|f (x) − f (y)| ≥ existieren. Somit gibt es ein > 0, so dass für alle n ∈ N Punkte xn und yn mit
|xn − yn | ≤ n1 und
|f (xn ) − f (yn )| ≥ existieren. Nach dem Satz von Bolzano-Weierstraß (Satz 2.3.3) besitzt die Folge xn ,
n ∈ N, eine konvergente Teilfolge xnk , k ∈ N. Wir setzen
ξ = lim xnk .
k→∞
Es gilt ξ ∈ [a, b], weil xnk ∈ [a, b] für alle k ∈ N. Wegen |xnk − ynk | ≤
−xnk + ynk , k ∈ N, eine Nullfolge und somit konvergiert ynk , k ∈ N, gegen ξ.
ξ = lim ynk .
k→∞
Da f stetig ist, folgt
lim (f (xnk ) − f (ynk )) = f (ξ) − f (ξ) = 0.
k→∞
Dies steht aber im Widerspruch zu
∀k ∈ N :
2
|f (xnk ) − f (ynk )| ≥ .
1
nk
ist
144
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
3.3
Monotone Funktionen und Umkehrfunktionen
Definition 3.3.1 Es sei X eine Teilmenge von R. Eine Funktion f : X → R heißt
(streng) monoton wachsend, falls für alle x, y ∈ X mit x < y
f (x) ≤ f (y)
(f (x) < f (y))
gilt. Eine Funktion f : X → R heißt (streng) monoton fallend, falls für alle x, y ∈ X
mit x < y
f (x) ≥ f (y)
(f (x) > f (y))
gilt.
Definition 3.3.2 Es sei X eine Teilmenge von R und f : X → R. Wir bezeichnen
die Menge
f (X) = {f (x)|x ∈ X}
als Bild von f . Wir sagen, dass f eine Umkehrabbildung oder Inverse f −1 besitzt,
falls es eine Funktion f −1 : f (X) → X gibt, so dass für alle x ∈ X
f −1 (f (x)) = x .
Man erhält den Graphen von f −1 , indem man den Graphen von f an der Geraden
y = x spiegelt.
Lemma 3.3.1 Es sei X eine Teilmenge von R und f : X → R sei streng monoton
wachsend oder streng monoton fallend. Dann gelten
(i) Die Umkehrabbildung f −1 : f (X) → R existiert.
(ii) f −1 ist auf f (X) streng monoton wachsend, falls f streng monoton wachsend
ist.
(iii) f −1 ist auf f (X) streng monoton fallend, falls f streng monoton fallend ist.
Beweis. Es reicht zu zeigen, dass die Abbildung f injektiv ist. Dazu ist zu zeigen:
Falls x 6= y, dann gilt f (x) 6= f (y).
Falls x 6= y, dann gilt x < y oder y < x. Also gilt f (x) < f (y) oder f (y) < f (x)
und damit f (x) 6= f (y). 2
Satz 3.3.1 Es seien a, b ∈ R mit a < b und f : [a, b] → R sei eine stetige, streng
monoton wachsende Funktion. Dann gilt
f ([a, b]) = [f (a), f (b)]
und f −1 : [f (a), f (b)] → [a, b] existiert, ist stetig und streng monoton wachsend.
Für stetige, streng monoton fallende Funktionen gilt eine entsprechende Aussage.
3.3. MONOTONE FUNKTIONEN UND UMKEHRFUNKTIONEN
145
Beweis. Da f streng monoton wachsend ist, gilt für alle x ∈ [a, b]
f (a) ≤ f (x) ≤ f (b)
und somit gilt
f ([a, b]) ⊆ [f (a), f (b)].
Mit dem Zwischenwertsatz (Satz 3.1.3) folgt
"
f ([a, b]) =
#
inf f (x), sup f (x) ⊇ [f (a), f (b)].
x∈[a,b]
x∈[a,b]
Insgesamt erhalten wir
f ([a, b]) = [f (a), f (b)].
Mit Lemma 3.3.1 folgt, dass f −1 existiert und streng monoton wächst. Es bleibt zu
zeigen, dass f −1 stetig ist.
Es sei {yn }n∈N eine Folge in [f (a), f (b)] mit limn→∞ yn = y0 . Wir müssen zeigen,
dass
lim f −1 (yn ) = f −1 (y0 ) .
n→∞
Wir zeigen zunächst, dass {f −1 (yn )}n∈N konvergiert. Falls die Folge nicht konvergiert, so gibt es nach Lemma 2.5.6 zwei konvergente Teilfolgen {f −1 (ynk )}k∈N
und {f −1 (ymj )}j∈N , deren Grenzwerte x0 und x̄0 verschieden sind. Da f stetig ist,
folgen
lim f (f −1 (ynk )) = f (x0 )
und
k→∞
lim f (f −1 (ymj )) = f (x̄0 ).
j→∞
Hieraus folgen
f (x0 ) = lim f (f −1 (ynk )) = lim ynk = y0
k→∞
k→∞
f (x̄0 ) = lim f (f
−1
j→∞
(ymj )) = lim ymj = y0 .
j→∞
Also gilt f (x0 ) = f (x̄0 ). Da f streng monoton wachsend ist, so ist f injektiv und es
folgt x0 = x̄0 im Widerspruch zu unserer Annahme. Also konvergiert {f −1 (yn )}n∈N .
Wir bezeichnen den Grenzwert mit x0 . Es folgt wegen der Stetigkeit von f
y0 = lim yn = lim f (f −1 (yn )) = f (x0 ) .
n→∞
n→∞
Also gilt x0 = f −1 (y0 ). Nun folgt
f −1 (y0 ) = x0 = lim f −1 (yn ) .
n→∞
2
146
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
3.4
Potenz, Exponentialfunktion und Logarithmus
Wir führen hier die Potenzfunktion, Exponentialfunktion und Logarithmus ein.
Wir definieren für alle x ∈ R und alle n ∈ N
xn = x
| · x{z· · · x}
n
und x0 = 1. Dies bedeutet, dass wir auch 00 = 1 setzen. Dies ist eine willkürliche
Definition. Ein Argument dafür ist, dass limx→0 xx = 1 gilt (Beispiel 3.11.5). Andererseits gilt für alle x 6= 0, dass 0x = 0. Dies könnte man als ein Argument gegen
diese Definition ansehen.
Falls x 6= 0, dann setzen wir
1
x−n = n .
x
Definition 3.4.1 (i) Für n ∈ N nennen wir pn : R → R mit pn (x) = xn die n-te
Potenzfunktion. xn heißt die n-te Potenz von x.
(ii) Die n-te Wurzel oder die n1 -te Potenzfunktion p 1 : (0, ∞) → R definieren wir
n
1
als die Umkehrfunktion der n-ten Potenzfunktion. p 1 (x) = x n nennen wir die n-te
n
Wurzel von x.
n
(iii) Für m
, m, n ∈ N und n und m teilerfremd, definieren wir die m
-te Potenzfunkn
m
tion p n : (0, ∞) → R durch
1
p mn (x) = (x n )m .
(iv) Für m
, n, m ∈ N und n und m teilerfremd, definieren wir die − m
-te Potenzn
n
funktion p− mn : (0, ∞) → R durch
p− mn (x) =
1
n1 !m
1
.
x
m
Wir schreiben für (x n )m auch x n . Man beachte, dass p und q eindeutig sind,
weil sie als teilerfremd angenommen werden. Dies folgt aus der Eindeutigkeit der
Primzahlzerlegung. Damit haben wir die Potenz xs für strikt positive, reelle Zahlen
x und rationale Zahlen s definiert.
Tatsächlich werden wir zeigen, dass für alle k, `, m, n ∈ N mit k` = m
n
1
1
1
1
(xk ) ` = (x ` )k = (x n )m = (xm ) n
gilt. Also müssen wir nicht fordern, dass m und n teilerfremd sind. Außerdem
wollen wir zeigen, dass wir mit dieser Definition gut rechnen können.
Lemma 3.4.1 Es seien p, q ∈ N teilerfremd. Dann gilt für alle x ∈ (0, ∞)
1
1
(x q )p = (xp ) q .
3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS
147
Beweis. Es gilt
1
1
xp = ((x q )q )p = ((x q )p )q .
Deshalb
1
1
(xp ) q = (x q )p .
2
Lemma 3.4.2 (i) Es seien n, m ∈ N und x ∈ (0, ∞). Dann gilt
1
1
1
x n·m = (x m ) n .
(ii) Es sei x ∈ (0, ∞). Es seien n, m, p, q ∈ N mit pq =
Dann gilt
1
1
1
(xn ) m = (x q )p = (x m )n .
n
m
und p und q teilerfremd.
Aus Lemma 3.4.2 (ii) folgt, dass für alle x > 0 und alle p, q ∈ N gilt
p
1
1
x q = (x q )p = (xp ) q .
p und q müssen nicht teilerfremd sein.
Beweis. (i) Es gilt
1
y = x n·m
genau dann, wenn
y n·m = x.
Weiter gilt
x = y n·m = (y n )m .
Hieraus folgt
1
1
(x m ) n = y.
(ii) Es gibt ein k ∈ N mit kp = n und kq = m. Dann gelten wegen (i)
1
1
1
1
(x kq )kp = (((x q ) k )k )p = (x q )p
und
1
1
1
(xkp ) kq = (((xp )k ) k ) q .
2
Lemma 3.4.3 Es sei s ∈ Q und s 6= 0. Die Potenzfunktion ps : (0, ∞) → R mit
ps (x) = xs ist auf (0, ∞) stetig. Die Funktion ist streng monoton wachsend für s > 0
und sie ist streng monoton fallend für s < 0.
Beweis. Für jedes n ∈ N ist die Potenzfunktion pn stetig und streng monoton
wachsend. Mit Satz 3.3.1 folgt, dass für jedes m ∈ N die Potenzfunktion p 1 stetig
m
und streng monoton wachsend ist. Damit ist für alle n, m ∈ N die Potenzfunktion
p mn = pn ◦ p 1 stetig und streng monoton wachsend. 2
m
148
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Lemma 3.4.4 Es seien p, q, n, m ∈ N und x, y ∈ (0, ∞). Dann gelten
(i)
p
p
n
n
xq · xm = xq+m .
(ii)
p
p
p
x q · y q = (x · y) q .
(iii)
p
p n
n
(x q ) m = x q · m .
Beweis. (i) Wegen Lemma 3.4.2 (ii) gilt
p
n
pm
nq
1
1
1
p
n
x q x m = x qm x mq = (x qm )pm (x mq )nq = (x qm )pm+nq = x q + m .
2
Lemma 3.4.5 Es seien r, s ∈ Q und x, y ∈ (0, ∞). Dann gelten
(i)
xr · xs = xr+s
(ii)
xr · y r = (x · y)r
(iii)
(xr )s = xr·s
Beweis. (i) Für r, s ≥ 0 folgt die Gleichung aus Lemma 3.4.4. Es sei nun r < 0 < s.
Wir betrachten zuerst den Fall |r| ≤ s
−r
1
r
s
· xs+r · x−r = xs+r .
x ·x =
x
Falls |r| > s
−r −s
1
1
x ·x =
x
x
r
s
Nun verfahren wir wie im Fall |r| ≤ s. Falls r, s < 0, dann
−r −s −r−s
1
1
1
r
s
x ·x =
=
= xr+s .
x
x
x
(ii) Falls r < 0
−r −r −r −r
1 1
1
1
1
x ·y =
=
·
=
= (x · y)r .
x
y
x y
x·y
r
2
r
3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS
149
Lemma 3.4.6 (i) Es seien x ∈ R mit x > 1 und r, s ∈ Q mit r < s. Dann gilt
xr < xs .
(ii) Es seien x ∈ R mit 0 < x < 1 und r, s ∈ Q mit r < s. Dann gilt xs < xr .
Beweis. (i) Es seien r, s ∈ Q mit r < s und x > 1. Mit Lemma 3.4.3 folgt aus
1<x
1 = 1s−r < xs−r = xs · x−r .
Es folgt
xr < xs .
2
Beispiel 3.4.1 (i) Für alle x ∈ R mit x > 0 gilt
1
lim x n = 1.
n→∞
(ii) Für alle x ∈ R mit x > 0 und alle Folgen rationaler Zahlen {rn }n∈N mit limn→∞ rn = 0 gilt
lim xrn = 1.
n→∞
Beweis. (i) Wir betrachten den Fall x > 1. Mit der Bernoulli-Ungleichung (Lemma 1.10.7)
x n
≥ 1 + x > x.
1+
n
Es folgt
1
x
≥ xn
n
und damit
x
1
n
x − 1 ≤ .
n
1
−n
Falls x < 1, dann betrachten wir die Folge {x }n∈N .
(ii) Wegen (i) gilt
1+
∀ > 0∃N ∈ N∀n ≥ N :
1
|x n − 1| < Wegen limn→∞ rn = 0
∀n ∈ N∃K ∈ N∀k ≥ K :
Es folgt für alle k ≥ K
und damit
Insgesamt erhalten wir
2
1
−
und
1
|x− n − 1| < .
1
1
≤ rk ≤ .
n
n
1
x − n ≤ x rk ≤ x n
1
1
x− n − 1 ≤ xrk − 1 ≤ x n − 1.
|xrk − 1| < .
Definition 3.4.2 Es seien x ∈ R mit x > 0, r ∈ R und rn ∈ Q, n ∈ N, mit
r = limn→∞ rn . Dann definieren wir
(3.6)
xr = lim xrn .
n→∞
Die Potenzfunktion pr : (0, ∞) → R ist durch pr (x) = xr definiert. Weiter gilt
p−r (x) = x1r .
150
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Man muss die Wohldefiniertheit überprüfen. Hierzu müssen wir zeigen:
Der Grenzwert
lim xrn
n→∞
existiert und er hängt nur von r, aber nicht von der speziellen Folge {rn }n∈N ab.
Wir bemerken auch noch, dass es zu jeder reellen Zahl r eine Folge rationaler Zahlen
{rn }n∈N mit
r = lim rn
n→∞
gibt.
Lemma 3.4.7 (i) Es sei x ∈ (0, ∞) und {rn }n∈N eine konvergente Folge rationaler
Zahlen. Dann konvergiert die Folge {xrn }n∈N .
(ii) Es sei x ∈ (0, ∞) und {rn }n∈N und {tn }n∈N seien zwei Folgen rationaler Zahlen
mit
lim rn = lim tn .
n→∞
n→∞
Dann gilt
lim xrn = lim xtn .
n→∞
n→∞
Beweis. (i) Der Fall x = 1 ist uninteressant. Nun der Fall x > 1. Da die Folge
{rn }n∈N konvergiert, ist sie nach Lemma ?? beschränkt. Deshalb gibt es ein C ∈ Q,
so dass für alle n ∈ N
rn ≤ C
gilt. Wegen Lemma 3.4.6 gilt für alle n ∈ N
xr n ≤ xC .
Wir zeigen, dass die Folge {xrn }n∈N eine Cauchy Folge ist. O.E.d.A. sei rn ≥ rm .
Es gilt
|xrn − xrm | = |xrm ||xrn −rm − 1| ≤ xC |xrn −rm − 1|.
Zu jedem k ∈ N gibt es ein N ∈ N, so dass für alle n, m ≥ N gilt |rn − rm | < k1 . Es
folgt für alle n, m ≥ N
1
n
|xr − xrm | ≤ xC |x k − 1|.
Mit Beispiel 3.4.1 folgt, dass {xrn }n∈N eine Cauchy Folge ist.
Der Fall 0 < x < 1 wird ähnlich behandelt.
(ii) Wegen (i) wissen wir, dass
lim xrn
und
n→∞
existieren. Außerdem gilt
lim (rn − tn ) = 0.
n→∞
Nach Beispiel 3.4.1 gilt
lim x(rn −tn ) = 1.
n→∞
lim xtn
n→∞
3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS
151
Mit Lemma 3.4.5
1 = lim (xrn · x−tn ) = lim xrn · lim x−tn .
n→∞
n→∞
Also
lim xrn =
n→∞
2
1
limn→∞
x−tn
n→∞
1
= lim
n→∞ x−tn
= lim xtn .
n→∞
Lemma 3.4.8 Es seien x ∈ R mit x > 0 und tn , t ∈ Q, n ∈ N, mit limn→∞ tn = t.
Dann gilt
lim xtn = xt .
n→∞
Beweis. Mit Beispiel 3.4.1 folgt der Fall t = 0. Es sei nun t beliebig. Dann gilt
limn→∞ (tn − t) = 0. Mit Lemma 3.4.4
xtn = x(tn −t)+t = xtn −t · xt
und somit
2
lim xtn = lim (xtn −t · xt ) = xt lim xtn −t = xt .
n→∞
n→∞
n→∞
Satz 3.4.1 (i) Es seien x > 0 und r, s ∈ R. Dann gilt
xr · xs = xr+s .
(ii) Es seien r ∈ R und x, y > 0. Dann gilt
xr · y r = (x · y)r .
(iii) Es seien r, s ∈ R und x > 0. Dann gilt
(xr )s = xr·s .
Beweis. (i) Es seien {rn }n∈N und {sn }n∈N Folgen rationaler Zahlen mit
r = lim rn
s = lim sn .
n→∞
n→∞
Nach Definition 3.4.2 gilt
xr · xs = lim xrn lim xsn .
n→∞
n→∞
Nach Lemma 2.2.3 gilt
xr · xs = lim (xrn · xsn ).
n→∞
Da die Zahlen rn , sn rational sind, folgt mit Lemma 3.4.4
xr · xs = lim xrn +sn .
n→∞
Die Folge {rn + sn }n∈N konvergiert gegen r + s. Deshalb
2
xr · xs = xr+s .
152
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Lemma 3.4.9 (i) Es seien x ∈ R mit x > 1 und r, s ∈ R mit r < s. Dann gilt
xr < xs .
(ii) Es seien x ∈ R mit 0 < x < 1 und r, s ∈ R mit r < s. Dann gilt xs < xr .
(iii) Es seien x, y ∈ R mit 0 < x < y und r ∈ R mit r > 0. Dann gilt xr < y r .
(iv) Es seien x, y ∈ R mit 0 < x < y und r ∈ R mit r < 0. Dann gilt xr > y r .
Beweis. (i) Es gibt zwei Folgen rationaler Zahlen {rn }n∈N und {sn }n∈N mit
r = lim rn
s = lim sn .
n→∞
n→∞
Außerdem gibt es rationale Zahlen c1 , c2 mit r < c1 < c2 < s. Es gibt ein N ∈ N, so
dass für alle n ≥ N
rn < c1
sn > c2
Mit Lemma 3.4.6 folgt für alle n ∈ N mit n ≥ N
xrn < xc1 < xc2 < xsn .
Somit
xr = lim xrn ≤ xc1 < xc2 ≤ lim xsn = xs .
n→∞
(iii) Es gilt 1 <
y
.
x
n→∞
Mit (i) folgt für die Exponenten 0 und r
y 0 y r
<
,
1=
x
x
also
xr < y r .
2
Lemma 3.4.10 Es sei x ∈ R mit x > 0 und {rn }n∈N reeller Zahlen mit limn→∞ rn =
0. Dann gilt
lim xrn = 1.
n→∞
Beweis. Wegen Beispiel 3.4.1 (i) gilt
1
∀ > 0∃N ∈ N∀n ≥ N :
|x n − 1| < und
1
|x− n − 1| < .
Wegen limn→∞ rn = 0
∀n ∈ N∃K ∈ N∀k ≥ K :
Mit Lemma 3.4.9 folgt für alle k ≥ K
1
−
1
1
≤ rk ≤ .
n
n
1
x− n ≤ xrk ≤ x n
und damit
Insgesamt erhalten wir
2
1
1
x− n − 1 ≤ xrk − 1 ≤ x n − 1.
|xrk − 1| < .
3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS
153
Definition 3.4.3 Es sei a > 0. Die Exponentialfunktion expa : R → R zur Basis a
ist durch
expa (x) = ax
definiert.
Lemma 3.4.11 (i) Es sei a ∈ R mit a > 0 und a 6= 1. Die Exponentialfunktion
expa : R → R mit expa (x) = ax ist auf R streng monoton und stetig.
(ii) Es sei r ∈ R mit r 6= 0. Die Potenzfunktion pr : (0, ∞) → R mit pr (x) = xr ist
auf (0, ∞) streng monoton und stetig.
Beweis. (i) Wir weisen die Stetigkeit nach. Mit Lemma 3.4.10 folgt der Fall t = 0.
Es sei nun t beliebig. Dann gilt limn→∞ (tn − t) = 0. Mit Satz 3.4.1
atn = a(tn −t)+t = atn −t · at
und somit
lim atn = lim (atn −t · at ) = at lim xtn −t = at .
n→∞
n→∞
n→∞
Die strenge Monotonie der Exponentialfunktion folgt aus Lemma 3.4.9.
(ii) Die strikte Monotonie folgt aus Lemma 3.4.9. Weiter gilt
xr = er ln x .
Da die Exponentialfunktion und Logarithmus stetig sind, ist auch eine Zusammensetzung dieser Funktionen stetig. 2
Lemma 3.4.12 Die Umkehrfunktion von expa existiert und ist auf (0, ∞) definiert
und stetig. Wir nennen die Umkehrfunktion den Logarithmus zur Basis a und
schreiben loga .
Wir nennen den Logarithmus zur Basis e = limn→∞ (1 + n1 )n den natürlichen
Logarithmus und schreiben für loge den Ausdruck ln.
Korollar 3.4.1 (i) Für alle x, y > 0 gilt
loga (x · y) = loga x + loga y.
(ii) Für alle x > 0 und alle y ∈ R gilt
loga xy = y loga x.
(iii)
loga (a) = 1.
154
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beweis. (i) Wir setzen x = av und y = aw . Dann gilt
loga (x · y) = loga (av · aw ) = loga (av+w ) = v + w = loga x + loga y.
2
Lemma 3.4.13 Es sei {xn }n∈N eine Folge mit limn→∞ xn = 0 und 1 + xn > 0, xn 6=
0 für alle n ∈ N. Dann gilt
1
lim (1 + xn ) xn = e
n→∞
Beweis. Wir benutzen die Definition
n
1
e = lim 1 +
n→∞
n
und
1
.
N
O.E.d.A. können wir annehmen, dass für alle n ∈ N die Ungleichung 0 < |xn | < 1
gilt. Dann gibt es zu jedem n ∈ N ein kn ∈ N mit
∀N ∈ N ∃M ∈ N ∀n ≥ M :
|xn | <
1
1
≤ |xn | < .
kn + 1
kn
Dann gilt für xn > 0
1+
1
kn + 1
kn
≤ (1 + xn )
1
xn
k +1
1 n
≤ 1+
.
kn
2
Korollar 3.4.2 Für alle x ∈ R gilt
lim
n→∞
1+
x n
= ex
n
Beweis. Falls x = 0, dann gelten
n
0
1+
=1
n
Falls x 6= 0, so gilt für fast alle n
x
<1
n
1 = e0 .
und
bzw.
1+
x
> 0.
n
Außerdem ist xn = nx , n ∈ N, eine gegen 0 konvergente Folge. Mit Lemma 3.4.13
folgt
1
x nx x n x
e = lim 1 +
= lim 1 +
.
n→∞
n→∞
n
n
2
3.4. POTENZ, EXPONENTIALFUNKTION UND LOGARITHMUS
155
Beispiel 3.4.2
(i)
(iv)
1
lim n n = 1
n→∞
lim n
1
ln n
n→∞
n1
1
=1
n→∞ n
(ii)
=e
(iii)
lim
n
o
1
n (ln n)2
(v)
1
lim (n2 ) n = 1
n→∞
(vi)
n∈N
ln n
n
Beweis. (i) Es gilt wegen Beispiel 1.10.8
n X
k
n 2
2
n
2
n(n − 1) 4
√
√
1+
=
> 1 + n√ +
> 2 + 2(n − 1) = 2n.
k
2
n
n
n
n
k=0
Somit gilt für alle n ∈ N
Also gilt für alle n ∈ N
1
2
nn ≤ 1 + √ .
n
1
1
2
|n n − 1| = n n − 1 ≤ √
n
Es folgt
1
lim n n = 1.
n→∞
(ii) und (iii) folgen aus (i).
(iv) gilt, weil für alle n ∈ N gilt n = eln n .
(v) Es gilt
1
1
n (ln n)2 = e ln n .
Weiter gilt limn→∞
1
ln n
= 0. Mit der Stetigkeit der e-Funktion folgt
1
lim n (ln n)2 = 1.
n→∞
(vi) Es gilt für alle n ∈ N
1
nn = e
ln n
n
und somit wegen (i)
1
1 = lim n n = lim e
n→∞
ln n
n
n→∞
.
Da der Logarithmus eine stetige Funktion ist, folgt
ln n
ln n
0 = ln 1 = ln lim e n = lim
.
n→∞
n→∞ n
2
Beispiel 3.4.3 (i) Die Reihe
∞
X
1
n(ln
n)
n=2
divergiert.
(ii) Die Reihe
∞
X
1
n(ln n)2
n=2
konvergiert.
(iii) Die Reihe
∞
X
1
n(ln
n)(ln(ln
n))
n=3
n∈N
156
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
divergiert.
(iv) Die Reihe
∞
X
1
n(ln
n)(ln(ln
n))2
n=3
konvergiert.
Beweis.
(i) Nach dem Verdichtungskriterium von Cauchy (Lemma 2.6.2) konvergiert die Reihe
P∞
1
n=2 n ln(n) genau dann, wenn die Reihe
∞
X
k=1
∞
∞
k=1
k=1
X 1
1 X1
2k
=
=
2k ln(2k )
k ln 2
ln 2
k
P∞
konvergiert. Die Reihe k=1 k1 divergiert.
P∞
1
(ii) Nach dem Verdichtungssatz konvergiert die Reihe
n=2 n(ln n)2 genau dann, wenn die
Reihe
∞
∞
∞
X
X
1 X 1
1
2k
=
=
2k (ln(2k ))2
k 2 (ln 2)2
(ln 2)2
k2
k=1
k=1
k=1
P∞
1
k=1 k2
konvergiert. Die Reihe
konvergiert.
P∞
(iii) Nach dem Verdichtungssatz konvergiert die Reihe n=3
die Reihe
∞
X
k=2
1
n(ln n)(ln(ln n))
∞
∞
k=2
k=2
genau dann, wenn
X
1
1 X
2k
1
=
=
k
k
k
2 (ln 2 )(ln(ln 2 ))
k(ln 2)(ln k(ln 2))
ln 2
k(ln k + ln(ln 2))
konvergiert. Die letzte Reihe konvergiert genau dann, wenn die Reihe
∞
X
k=2
1
k(ln k)
konvergiert. Nach (i) divergiert diese Reihe.
(iv)
∞
X
k=3
∞
∞
k=3
k=3
2k
1 X
1
1 X
1
=
=
k
k
k
2
2
2 (ln 2 )(ln(ln 2 ))
(ln 2)
k(ln k(ln 2))
(ln 2)
k(ln k + ln(ln 2))2
Diese Reihe konvergiert genau dann, wenn die Reihe
∞
X
k=3
1
k(ln k)2
konvergiert. Nach (ii) konvergiert diese Reihe. 2
Beispiel 3.4.4 Die Folge
s r
q
√
xn = 1! 2! 3! · · · n!
konvergiert.
n∈N
3.5. DIFFERENZIERBARE FUNKTIONEN
157
Beweis. Wir zeigen, dass die Folge {xn }n∈N monoton wachsend und nach oben beschränkt ist.
xn =
n
Y
1
(k!) 2k <
n+1
Y
1
(k!) 2k = xn+1
k=1
k=1
Damit ist die Folge monoton wachsend.
xn =
n
Y
(k!)
1
2k
k=1
≤
n
Y
(k)
k=1
k
2k
=
n
Y
k=1
!
n
X
k ln k
k
exp (ln k) k = exp
2
2k
k=1
Es bleibt zu zeigen, dass
∞
X
k ln k
k=1
2k
konvergiert. Dazu verwenden wir das Quotientenkriterium.
(k+1) ln(k+1)
2k+1
k ln k
2k
1 (k + 1) ln(k + 1)
1
=
=
2
k ln k
2
ln(1 + k1 )
1
1+
1+
k
ln k
Für hinreichend großes k gilt
(k+1) ln(k+1)
2k+1
k ln k
2k
≤
3
.
4
2
3.5
Differenzierbare Funktionen
Wir wollen hier Funktionen betrachten, deren Graph eindeutige Tangenten besitzen.
Wir wollen die Steigung dieser Tangente berechnen, d.h. die Steigung der Kurve in
dem Punkt der Tangente berechnen. Diese Steigung werden wir als Ableitung der
Funktion bezeichnen.
Anschaulich ist eine Funktion in einem Punkt differenzierbar, wenn ihr Graph
eine eindeutige Tangente besitzt. So ist eine Funktion, deren Graph eine Ecke
besitzt, nicht differenzierbar. Ebenso ist eine Funktion nicht differenzierbar, wenn
sie einen Sprung besitzt.
Intuitiv mag man annehmen, dass jede stetige Funktion ”fast überall” differenzierbar ist. Dazu lassen sich aber Beispiel konstruieren, die dies widerlegen. Zuallererst
eine stetige Funktion, die in keinem Punkt differenzierbar ist (Beispiel 3.12.3, Beispiel
5.10.1). Darüber hinaus kann man sich die Frage stellen, inwieweit man vorschreiben
kann, wo eine stetige Funktion differenzierbar ist und wo nicht? Dazu das Beispiel
einer stetigen Funktion, die in allen irrationalen Punkten differenzierbar ist und in
allen rationalen Punkten nicht differenzierbar ist (Beispiel 5.4.2). Die Cantor Funktion (Beispiel 5.3.2) ist eine wachsende, stetige Funktion, die in allen Punkten der
Cantor Menge nicht differenzierbar ist und in allen anderen Punkten differenzierbar.
158
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Definition 3.5.1 Es sei I ein Intervall in R und f : I → R eine Funktion. f heißt
in x0 ∈ I differenzierbar, falls der Grenzwert
(3.7)
lim
x→x0
existiert.
f (x) − f (x0 )
x − x0
In dieser Form erscheint die Definition durchgängig in der Literatur. Wir wollen
noch limx→x0 entsprechend interpretieren und die Definition genauer aufschreiben.
Definition 3.5.2 Es sei I ein Intervall in R und f : I → R eine Funktion. f
heißt in x0 ∈ I differenzierbar, falls ein η ∈ R existiert, so dass für alle Folgen
{xn }n∈N ⊂ I mit limn→∞ xn = x0 und xn 6= x0 für alle n ∈ N
f (xn ) − f (x0 )
=η
n→∞
xn − x0
(3.8)
lim
gilt.
Die Differenzierbarkeit von f in x0 in Quantorenschreibweise ist
f (xn ) − f (x0 )
lim
∃η ∈ R∀{xn }n∈N , lim xn = x0 ∧ ∀n ∈ N : xn 6= x0 :
=η
n→∞
n→∞
xn − x0
bzw.
∃η ∈ R∀{hn }n∈N ,
lim hn = 0 ∧ ∀n ∈ N : hn 6= 0 :
n→∞
f (x0 + hn ) − f (x0 )
= η.
n→∞
hn
lim
Bemerkung 3.5.1 (i) Es sei I ein Intervall und f : I → R eine Funktion. f ist
genau dann in x0 ∈ I differenzierbar, wenn es ein η ∈ R gibt, so dass die Funktion
g : I → R mit
f (x)−f (x0 )
x 6= x0
x−x0
(3.9)
g(x) =
η
x = x0
in x0 stetig ist.
(ii) Es sei I ein Intervall und f : I → R eine Funktion. f ist genau dann in x0 ∈ I
differenzierbar, wenn es ein η ∈ R gibt, so dass für alle > 0 ein δ > 0 gibt, so dass
für alle x mit |x − x0 | < δ gilt
f (x) − f (x0 )
< .
−
η
x − x0
In Quantorenschreibweise:
∃η ∈ R∀ > 0∃δ > 0∀x, |x − x0 | < δ :
f (x) − f (x0 )
< .
−
η
x − x0
(iii) Es sei I ein Intervall, x0 ∈ I, und δ > 0 mit (x0 − δ, x0 + δ) ⊆ I. Eine
Funktion f : I → R ist genau dann in x0 differenzierbar, wenn die Einschränkung
f|(x0 −δ,x0 +δ) : (x0 − δ, x0 + δ) → R von f in x0 differenzierbar ist. Wenn die beiden
Ableitungen existieren, dann sind sie gleich.
3.5. DIFFERENZIERBARE FUNKTIONEN
159
Beweis. (i) Falls f in x0 differenzierbar ist, dann gibt es ein η ∈ R mit
lim
x→x0
f (x) − f (x0 )
= η.
x − x0
Damit ist g in x0 stetig.
Wenn andererseits g in x0 stetig ist, dann gilt (3.8) und f ist differenzierbar.
(ii) Nach (i) ist die Stetigkeit von g in x0 äquivalent zur Differenzierbarkeit von
f in x0 . Die Stetigkeit von g in x0 ist die Annahme in (ii).
(iii) Falls f in x0 differenzierbar ist, dann gibt es ein η ∈ R, so dass für alle
Folgen {xn }n∈N ⊂ I mit limn→∞ xn = x0 und xn 6= x0 für alle n ∈ N
f (xn ) − f (x0 )
=η
n→∞
xn − x0
lim
gilt. Insbesondere gilt dies für alle Folgen, die in (x0 − δ, x0 + δ) enthalten sind.
Damit ist f|(x0 −δ,x0 +δ) in x0 differenzierbar und die Ableitung gleich η.
Falls f|(x0 −δ,x0 +δ) in x0 differenzierbar ist, dann gibt es ein η ∈ R, so dass für alle
Folgen {xn }n∈N ⊂ (x0 − δ, x0 + δ) mit limn→∞ xn = x0 und xn 6= x0 für alle n ∈ N
f (xn ) − f (x0 )
=η
n→∞
xn − x0
lim
gilt. Wenn wir nun eine Folge {xn }n∈N ⊂ I mit limn→∞ xn = x0 und xn 6= x0 für
alle n ∈ N betrachten, dann gibt es ein n0 ∈ N, so dass {xn }∞
n=n0 ⊂ (x0 − δ, x0 + δ).
Nach Annahme gilt
f (xn ) − f (x0 )
= η.
lim
n→∞
xn − x0
2
Wir bezeichnen den Grenzwert (3.7) mit
df
(x0 )
dx
und
f 0 (x0 ).
Wir nennen diesen Grenzwert die Ableitung von f im Punkt x0 . Falls x0 linker
bzw. rechter Endpunkt von I ist, so heißt f in x0 rechtsseitig bzw. linksseitig
differenzierbar.
Falls f auf I differenzierbar ist, so heißt die Funktion f 0 : I → R, die jedem
x ∈ I die Ableitung von f in diesem Punkt zuordnet die Ableitung von f . Falls f 0
auf I stetig ist, so heißt f auf I stetig differenzierbar. Die höheren Ableitungen sind
durch
f 00 = (f 0 )0
und
f (n) = (f (n−1) )0 n ∈ N
definiert.
Beispiel 3.5.1 (i) f : R → R, f (x) = c. Dann gilt f 0 (x) = 0.
(ii) f : R → R, f (x) = xm , m ∈ N. Dann gilt f 0 (x) = mxm−1 .
160
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
(iii) f : (0, ∞) → R, f (x) = ln x. Dann gilt
f 0 (x) =
1
.
x
(iv) f : (0, ∞) → R, f (x) = loga x. Dann gilt
f 0 (x) =
1
1
= loga e .
x ln a
x
(v) f : R → R, f (x) = |x|. Dann ist f nicht in 0 differenzierbar.
Beweis. (i)
f 0 (x0 ) = lim
x→x0
f (x) − f (x0 )
0
= lim
=0
x→x0 x − x0
x − x0
(ii) Wir setzen x = x0 + h. Mit der binomischen Formel (Beispiel 1.10.8) folgt
f 0 (x0 )
=
=
=
f (x0 + h) − f (x0 )
f (x) − f (x0 )
= lim
h→0
x − x0
h
(m )
1 X m m−k k
1
m
m
m
x0 h − x0
lim {(x0 + h) − x0 } = lim
h→0 h
h→0 h
k
k=0
m m X
1 X m m−k k
m m−k k−1
lim
x0 h = lim
x0 h
= mxm−1
0
h→0 h
h→0
k
k
lim
x→x0
k=1
k=1
(iii) Wir setzen x = x0 + h.
f 0 (x0 )
f (x) − f (x0 )
f (x0 + h) − f (x0 )
= lim
h→0
x − x0
h
1
= lim {ln(x0 + h) − ln x0 }
h→0 h
=
lim
x→x0
D.h. dass für alle Folgen {hn }n∈N mit limn→∞ hn = 0 und mit hn 6= 0 für alle n ∈ N
f 0 (x0 ) = lim
n→∞
1
{ln(x0 + hn ) − ln x0 }
hn
gelten muss. Wir führen die Rechnung fort
0
f (x0 ) = lim
n→∞
ln(1 +
hn
hn
x0 )
x0 !
1 x0
hn
1
hn hn
= lim
ln 1 +
= lim
ln
1+
.
n→∞ x0 hn
n→∞ x0
x0
x0
Da der Logarithmus eine stetige Funktion ist, gilt weiter
1
f (x0 ) =
ln
x0
0
x0 !
hn hn
lim 1 +
.
n→∞
x0
Nach Lemma 3.4.13 und Korollar 3.4.1
f 0 (x0 ) =
Insgesamt erhalten wir ln0 (x0 ) =
(iv) Wir benutzen
1
1
ln e =
.
x0
x0
1
x0 .
loga x =
ln x
.
ln a
3.5. DIFFERENZIERBARE FUNKTIONEN
161
Diese Gleichung folgt aus
x = aloga x .
(v) f differenzierbar in x0 bedeutet
∃η ∈ R ∀{hn }n∈N , lim hn = 0 :
n→∞
f (x0 + hn ) − f (x0 )
= η.
n→∞
hn
lim
f ist nicht in x0 differenzierbar heißt
∀η ∈ R ∃{hn }n∈N , lim hn = 0 :
n→∞
lim
n→∞
f (x0 + hn ) − f (x0 )
6= η.
hn
In dem vorliegenden Beispiel ist x0 = 0. Wir betrachten zuerst den Fall, dass η ≤ 0. Wir wählen
hn = n1 , n ∈ N. Dann gilt
1
−0
f (x0 + n1 ) − f (x0 )
= n 1 = 1.
1
n
n
Für η ≥ 0 wählen wir hn = − n1 . Dann erhalten wir
1
f (x0 − n1 ) − f (x0 )
n −0
=
= −1.
− n1
− n1
2
Satz 3.5.1 Es sei I ein Intervall und f : I → R sei differenzierbar in x0 . Dann ist
f stetig in x0 .
Beweis. Es sei {xn }n∈N eine Folge mit limn→∞ xn = x0 und mit xn 6= x0 für fast
alle n ∈ N. Da f in x0 differenzierbar ist, folgt
f (xn ) − f (x0 )
= f 0 (x0 ).
n→∞
xn − x0
lim
Hieraus folgt
lim (xn − x0 )
n→∞
Es folgt
f (xn ) − f (x0 )
= lim f 0 (x0 )(xn − x0 ) = 0.
n→∞
xn − x0
lim (f (xn ) − f (x0 )) = 0.
n→∞
und damit
lim f (xn ) = f (x0 ).
n→∞
für alle Folgen mit limn→∞ xn = x0 und mit xn 6= x0 für alle n ∈ N. Es bleibt
zu zeigen, dass wir auf die Einschränkung xn 6= x0 für fast alle n ∈ N verzichten
können.
Falls für fast alle n ∈ N die Gleichung xn = x0 gilt, gilt offensichtlich limn→∞ f (xn ) =
f (x0 ). Wir betrachten nun die Teilfolge {xnk }k∈N mit xnk 6= x0 für alle k ∈ N (für
alle anderen xn gelte xn = x0 ). Nach obigem Argument gilt
lim f (xnk ) = f (x0 ).
k→∞
Deshalb hat die Folge {f (xnk )}k∈N genau einen Häufungswert, nämlich f (x0 ). Folglich hat die Folge {f (xn )}n∈N auch nur den Häufungswert f (x0 ) Nach Lemma 2.5.1
konvergiert die Folge gegen f (x0 ). 2
162
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Bemerkung 3.5.2 (i) Aus der Stetigkeit folgt nicht die Differenzierbarkeit. Ein
Beispiel dafür ist die Funktion f (x) = |x| im Punkt 0 (Beispiel 3.5.1).
(ii) Es gibt Funktionen, die auf einem Intervall stetig sind, aber in keinem Punkt
differenzierbar (Beispiel 5.10.1).
(iii) Falls eine Funktion auf einem Intervall differenzierbar ist, so muss die Ableitung
nicht stetig sein (Beispiel 3.5.3).
Lemma 3.5.1 Es seien f, g : I → R Funktionen, die in x0 differenzierbar sind.
Dann gelten
(i) f + g ist in x0 differenzierbar und
(f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ).
(ii) (Produktregel) f · g ist in x0 differenzierbar und
(f · g)0 (x0 ) = f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ).
(iii) (Quotientenregel) Ist g 6= 0 auf dem Intervall I, so existiert
in x0 differenzierbar. Es gilt
0
f 0 (x0 ) · g(x0 ) − f (x0 ) · g 0 (x0 )
f
(x0 ) =
.
g
(g(x0 ))2
f
g
auf I und
f
g
ist
Beweis. (ii) Es sei {xn }n∈R eine reelle Folge mit limn→∞ xn = x0 und xn 6= x0 für
alle n ∈ N. Es gilt
f (xn ) · g(xn ) − f (x0 ) · g(x0 )
xn − x0
f (xn ) · g(xn ) − f (xn ) · g(x0 ) f (xn ) · g(x0 ) − f (x0 ) · g(x0 )
=
+
xn − x0
x n − x0
f (xn ) − f (x0 )
g(xn ) − g(x0 )
+ g(x0 )
.
= f (xn )
xn − x0
xn − x 0
Da f differenzierbar ist, ist f insbesondere stetig (Satz 3.5.1). Somit folgt aus der
Differenzierbarkeit von f und g
lim f (xn )
n→∞
lim g(x0 )
n→∞
Also gilt
lim
n→∞
2
g(xn ) − g(x0 )
= f (x0 )g 0 (x0 )
xn − x0
f (xn ) − f (x0 )
= f 0 (x0 )g(x0 )
xn − x0
f (xn ) · g(xn ) − f (x0 ) · g(x0 )
= f (x0 ) · g 0 (x0 ) + f 0 (x0 ) · g(x0 ).
xn − x0
3.5. DIFFERENZIERBARE FUNKTIONEN
163
Beispiel 3.5.2 (i) Es sei pn : R → R die n-te Potenzfunktion, die durch pn (x) = xn definiert ist.
Dann gilt
(pn )0 (x) = nxn−1 .
(ii) Alle Polynome p : R → R mit
p(x) =
n
X
ak xk
k=0
sind auf R differenzierbar.
(iii) Alle rationalen Funktionen
p
q
sind auf R \ {x|q(x) = 0} differenzierbar.
Beweis. (i) Wir haben diese Aussage in Beispiel 3.5.1 bereits bewiesen. Dabei haben wir die
binomische Formel benutzt. Wir wollen hier die Aussage beweisen, ohne die binomische Formel zu
benutzen. Wir verwenden Induktion.
Wir zeigen die Aussage für n = 1:
lim
x→x0
p1 (x) − p1 (x0 )
x − x0
= lim
= 1.
x→x0 x − x0
x − x0
Wir nehmen an, wir haben bereits (pn )0 (x) = nxn−1 gezeigt. Mit der Produktregel (Lemma 3.5.1)
folgt
(pn+1 )0 (x) = (pn · p1 )0 (x) = (pn )0 (x)p1 (x) + pn (x)(p1 )0 (x) = nxn−1 · x + xn = (n + 1)xn .
(ii) Nach (i) sind alle Monome bzw. Potenzfunktionen auf R differenzierbar. Nach Lemma 3.5.1
auch Summen von Monomen.
(iii) Es sei x0 ein Punkt mit q(x0 ) 6= 0. Da q stetig ist, gibt es ein Intervall [x0 − , x0 + ] auf
dem q von 0 verschieden ist. Nun wenden wir (ii) und die Quotientenregel an (Lemma 3.5.1). 2
Satz 3.5.2 (Kettenregel) Es seien I und J Intervalle und f : I → J und g : J →
R Funktionen, die in x0 bzw. f (x0 ) differenzierbar sind. Dann ist g ◦ f in x0
differenzierbar und es gilt
(g ◦ f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ).
Beweis. Es sei {xn }n∈R eine reelle Folge mit limn→∞ xn = x0 und mit xn =
6 x0 für
alle n ∈ N. Da f in x0 differenzierbar ist, so ist f auch in x0 stetig und es gilt
lim f (xn ) = f (x0 ).
n→∞
Wir betrachten drei Fälle. Falls für fast alle n ∈ N gilt, dass f (xn ) 6= f (x0 ), dann
gibt es ein N , so dass für alle n > N
g(f (xn )) − g(f (x0 )) f (xn ) − f (x0 )
(g ◦ f )(xn ) − (g ◦ f )x0
=
xn − x0
f (xn ) − f (x0 )
xn − x0
gilt. Da g differenzierbar und f stetig ist, gilt
g(f (xn )) − g(f (x0 ))
= g 0 (f (x0 )).
n→∞
f (xn ) − f (x0 )
lim
164
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Insgesamt erhalten wir
(g ◦ f )(xn ) − (g ◦ f )(x0 )
= g 0 (f (x0 ))f 0 (x0 ) .
n→∞
xn − x0
lim
Der zweite Fall ist, dass für fast alle n ∈ N gilt f (xn ) = f (x0 ). Dann gibt es ein
N ∈ N, so dass für alle n ≥ N gilt f (xn ) = f (x0 ). Deshalb
(g ◦ f )(xn ) − (g ◦ f )(x0 )
= 0.
n→∞
xn − x0
lim
Andererseits gilt auch
f (xn ) − f (x0 )
= 0.
n→∞
xn − x0
f 0 (x0 ) = lim
Es folgt
(g ◦ f )(xn ) − (g ◦ f )(x0 )
= 0 = g 0 (f (x0 ))f 0 (x0 ) .
n→∞
x n − x0
Nun der dritte Fall: Es gibt unendlich viele n ∈ N mit f (xn ) = f (x0 ) und unendlich
viele n ∈ N mit f (xn ) 6= f (x0 ). Also gibt es eine Teilfolge {xnk }k∈N mit f (xnk ) =
f (x0 ) für alle k ∈ N. Es folgt
lim
f (xnk ) − f (x0 )
= 0.
k→∞
xnk − x0
f 0 (x0 ) = lim
(3.10)
Ebenso erhalten wir
(3.11)
lim
k→∞
(g ◦ f )(xnk ) − (g ◦ f )(x0 )
= 0.
xnk − x0
Wir wollen uns nun überlegen, dass
(g ◦ f )(xn ) − (g ◦ f )(x0 )
n→∞
xn − x0
lim
existiert. Wir nehmen dazu an, dass die Folge
(g ◦ f )(xn ) − (g ◦ f )(x0 )
(3.12)
xn − x0
n∈N
nicht konvergiert. Falls sie beschränkt ist, dann hat sie nach Lemma 2.5.6 zwei
Häufungswerte. Wegen (3.11) ist einer der Häufungswerte 0. Also gibt es wegen
Lemma 2.5.1 eine Teilfolge
(g ◦ f )(xmj ) − (g ◦ f )(x0 )
xmj − x0
j∈N
die gegen eine Häufungswert η konvergiert, der verschieden von 0 ist. Dies bedeutet
aber, dass fast alle Folgenglieder verschieden von 0 sind und wir können wie im
ersten Fall schließen, dass
(g ◦ f )(xmj ) − (g ◦ f )(x0 )
= g 0 (f (x0 ))f 0 (x0 ) .
j→∞
xmj − x0
lim
3.5. DIFFERENZIERBARE FUNKTIONEN
165
Wegen (3.10) folgt
(g ◦ f )(xmj ) − (g ◦ f )(x0 )
= 0,
j→∞
xm j − x0
lim
was nicht sein kann, da der Grenzwert nicht 0 ist.
Es bleibt der Fall, dass die Folge (3.12) unbeschränkt ist. Dann gibt es eine
Teilfolge
(g ◦ f )(xk` ) − (g ◦ f )(x0 )
,
xk ` − x0
`∈N
so dass für alle ` ∈ N
1≤
(g ◦ f )(xk` ) − (g ◦ f )(x0 )
xk` − x0
`∈N
gilt. Nun können wir wieder wie im ersten Fall argumentieren und erhalten
(g ◦ f )(xk` ) − (g ◦ f )(x0 )
= g 0 (f (x0 ))f 0 (x0 ) .
`→∞
xk ` − x0
lim
Damit konvergiert diese Teilfolge und ist nicht unbeschränkt. 2
Satz 3.5.3 Es seien I und J Intervalle und f : I → J sei eine Funktion, die in x0
differenzierbar sei und für die f (I) = J gilt. Es gelte f 0 (x0 ) 6= 0 und es existiere die
Umkehrfunktion f −1 : J → I. Dann ist f −1 in f (x0 ) differenzierbar und es gilt
(f −1 )0 (f (x0 )) =
1
f 0 (x
0)
.
Beweis. Es sei {yn }n∈N eine Folge in J mit limn→∞ yn = y0 und yn 6= y0 für n ∈ N.
Wir setzen xn = f −1 (yn ) für n = 0, 1, 2, . . . . Dann gilt für alle n ∈ N mit xn 6= x0 ,
weil f und f −1 injektiv sind. Weiter gilt
f −1 (yn ) − f −1 (y0 )
f −1 (f (xn )) − f −1 (f (x0 ))
xn − x0
=
=
=
yn − y0
f (xn ) − f (x0 )
f (xn ) − f (x0 )
1
f (xn )−f (x0 )
xn −x0
.
Deswegen erhalten wir
f −1 (yn ) − f −1 (y0 )
= lim
n→∞
n→∞
yn − y0
lim
2
1
f (xn )−f (x0 )
xn −x0
=
1
.
f 0 (x0 )
Bemerkung 3.5.3 Es sei I ein Intervall R, es sei x0 ∈ I, wobei x0 kein Randpunkt
des Intervalls sei, und f : I → R. Wir sagen, dass f in x0 linksseitig differenzierbar
ist, wenn g : I ∩ (−∞, x0 ] → R mit g(x) = f (x) in x0 differenzierbar ist. Wir bezeichnen die Ableitung von g in x0 als die linksseitige Ableitung von f . Entsprechend
definiert man die rechtsseitige Differenzierbarkeitkeit .
Eine Funktion ist genau dann in x0 differenzierbar ist, wenn sie in x0 links- und
rechtsseitig differenzierbar ist und die linksseitige Ableitung gleich der rechtsseitigen
ist.
166
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beweis. Es sei f in x0 differenzierbar. Dann gilt für alle Folgen {xn }n∈N ⊂ I
f (xn ) − f (x0 )
= f 0 (x0 ).
n→∞
xn − x0
lim
Insbesondere gilt diese Gleichung für alle Folgen {xn }n∈N ⊂ I ∩ (−∞, x0 ]. Deshalb
existiert die linksseitige Ableitung von f in x0 und ist gleich f 0 (x0 ). Genauso verfahren wir bei der rechtsseitigen Ableitung.
Wir nehmen nun an, dass f links- und rechtsseitig in x0 differenzierbar ist und
die Ableitungen gleich sind. Wir bezeichnen die links- bzw. rechtsseitige Ableitung
in x0 mit η. Deshalb ist die Funktion g : I → R mit
(3.13)
g(x) =
f (x)−f (x0 )
x−x0
η
x 6= x0
x = x0
sowohl links- wie auch rechtsseitig stetig. Nach Aufgabe ist die Funktion dann in x0
stetig. Damit ist f in x0 differenzierbar. 2
Das nächste Beispiel zeigt, dass die Ableitung einer differenzierbaren Funktion
nicht stetig sein muss.
Beispiel 3.5.3 Es sei f : [−1, 1] → R durch
f (x) =


x2 cos
π
x2
falls x ∈ [−1, 1] und x 6= 0
0

falls x = 0
gegeben. Dann ist f auf [−1, 1] differenzierbar und f 0 ist in 0 unstetig.
Wir werden dieses Beispiel beweisen, wenn wir Sinus und Cosinus eingeführt haben. Dies
geschieht als Beispiel 3.10.2.
Beispiel 3.5.4 (i) exp : R → R mit exp(x) = ex ist auf R differenzierbar und exp0 = exp.
(ii) Es sei a > 0. Dann ist expa : R → R mit expa (x) = ax auf R differenzierbar und exp0a =
(ln a) expa .
(iii) Es seien α ∈ R und f : (0, ∞) → R, f (x) = xα . Die Funktion f ist auf (0, ∞) differenzierbar
und es gilt (xα )0 = αxα−1 .
(iv) Es sei f : [0, ∞) → R
(
f (x) =
1
x
falls x = 0
x
falls x > 0
f ist differenzierbar auf (0, ∞) und f 0 (x) = xx (1 + ln x).
3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ
167
2
1.8
1.6
1.4
1.2
0.5
1
1.5
2
0.8
Beweis. (i) ln ist auf (0, ∞) differenzierbar und exp ist die Umkehrfunktion. Nach Satz 3.5.3 gilt
(f −1 )0 (f (x)) =
1
.
f 0 (x)
Also gilt für f mit f (x) = ln x
(f −1 )0 (ln x) =
1
= x.
f 0 (x)
Mit y = ln x folgt
(f −1 )0 (y) = ey .
(ii) Es gilt
x
ax = eln(a
)
= ex ln a .
(iii) Da der Logarithmus ln und die e-Funktion differenzierbar sind, ist auch die zusammengesetzte
Funktion
α
xα = eln(x ) = eα ln x
nach der Kettenregel differenzierbar und es gilt
(xα )0 = (eα ln x )0 = eα ln x (α ln x)0 =
α α ln x
xe
=
α α
xx
= αxα−1 .
(iv) Wir verwenden die Gleichung
x
xx = eln x = ex ln x .
2
3.6
Der Satz von Rolle und der Mittelwertsatz
Michel Rolle (ausgesprochen: Roll) wurde am 21.4.1652 in Ambert in der Auvergne geboren. Er
war Sohn eines Krämers und erhielt nur eine elementare Ausbildung und arbeitete zunächst als
Schreiber. Er ging 1675 nach Paris und wurde Hauslehrer. Ab 1699 erhielt er als Mitglied der
Pariser Akademie ein reguläres Gehalt. Er arbeitete vorwiegend auf dem Gebiet der Algebra. Er
starb am 8.11.1719 in Paris.
168
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Definition 3.6.1 Es sei X ⊆ R und f : X → R. Wir sagen, dass f in x0 ein
lokales Maximum (Minimum) hat, wenn es ein δ > 0 gibt, so dass für alle x ∈ X
mit |x − x0 | < δ
f (x) ≤ f (x0 )
(f (x) ≥ f (x0 ))
gilt. Wir sagen, dass f ein lokales Extremum besitzt, falls es ein lokales Minimum
oder Maximum besitzt.
Wir bezeichnen ein lokales Extremum auch als relatives Extremum.
Lemma 3.6.1 Es sei f : [a, b] → R in x0 ∈ (a, b) differenzierbar. Hat f in x0 ein
lokales Extremum, so gilt
f 0 (x0 ) = 0 .
Beweis. f habe in x0 ein lokales Maximum. Dann gilt
∃N ∈ N ∀n > N :
f (x0 + n1 ) ≤ f (x0 ) und f (x0 − n1 ) ≤ f (x0 ).
Hieraus folgen
0
f (x0 ) =
f 0 (x0 ) =
lim
n→∞
f (x0 + n1 ) − f (x0 ))
1
n
≤0
f (x0 − n1 ) − f (x0 ))
≥ 0.
n→∞
− n1
lim
Also gilt
f 0 (x0 ) = 0.
Für ein lokales Minimum wird genauso argumentiert. 2
Satz 3.6.1 (Rolle) Es sei f : [a, b] → R auf [a, b] stetig und auf (a, b) differenzierbar.
Es gelte f (a) = f (b). Dann gibt es mindestens ein ξ ∈ (a, b) mit
f 0 (ξ) = 0.
Ein Beispiel für den Satz von Rolle ist f : [−1, 1] → R mit f (x) = x2 . Es gilt
f (−1) = f (1) = 1 und f 0 (0) = 0.
Beweis. Falls f auf [a, b] konstant ist, dann gilt für alle x ∈ (a, b), dass f 0 (x) = 0.
Wir können also annehmen, dass es mindestens einen Punkt gibt, an dem der
Wert von f nicht gleich f (a) = f (b) ist. Da f stetig ist, nimmt f auf [a, b] das
Minimum in xmin und das Maximum in xmax an. Da f nicht konstant ist, gilt
f (xmin ) < f (a) = f (b)
oder
f (xmax ) > f (a) = f (b).
Also gilt xmin ∈ (a, b) oder xmax ∈ (a, b) und wir können Lemma 3.6.1 anwenden. 2
3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ
169
Satz 3.6.2 (Mittelwertsatz) Es sei f : [a, b] → R auf [a, b] stetig und auf (a, b)
differenzierbar. Dann gibt es mindestens ein ξ ∈ (a, b) mit
f 0 (ξ) =
f (b) − f (a)
.
b−a
Beweis. Wir definieren F : [a, b] → R durch
F (x) = f (x) − f (a) −
f (b) − f (a)
(x − a).
b−a
Dann ist F auf [a, b] stetig, auf (a, b) differenzierbar und es gilt F (a) = F (b) = 0.
Damit können wir den Satz von Rolle anwenden und es gibt ein ξ ∈ (a, b) mit
F 0 (ξ) = 0. Also gilt
f (b) − f (a)
0 = F 0 (ξ) = f 0 (ξ) −
.
b−a
2
0.6
0.4
0.2
-2
-1
1
2
-0.2
-0.4
-0.6
Beispiel 3.6.1 Es sei f : [−1, 1] → R mit f (x) = x3 . Es gilt
f (1) − f (−1)
= 1.
1 − (−1)
Es gibt zwei Punkte ξ =
√1
3
und ξ = − √13 mit f 0 (ξ) = 1.
Satz 3.6.3 Es sei f : [a, b] → R auf [a, b] stetig und auf (a, b) differenzierbar. Es
gelte für alle x ∈ (a, b), dass f 0 (x) = 0. Dann ist f eine konstante Funktion.
Beweis. Es sei x ∈ (a, b]. Nach dem Mittelwertsatz (Satz 3.6.2) gibt es ein ξ ∈ (a, x)
mit
f (x) − f (a)
f 0 (ξ) =
.
x−a
Da f 0 (ξ) = 0 gilt, folgt
f (x) = f (a).
2
170
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Korollar 3.6.1 Es seien f, g : [a, b] → R auf [a, b] stetig und auf (a, b) differenzierbar. Außerdem gelte für alle x ∈ (a, b), dass f 0 (x) = g 0 (x). Dann gibt es eine
Konstante c ∈ R, so dass für alle x ∈ [a, b]
f (x) − g(x) = c
gilt.
Beweis. Wir wenden Satz 3.6.3 auf die Funktion f − g an. 2
Satz 3.6.4 (Verallgemeinerter Mittelwertsatz) Es seien f, g : [a, b] → R auf [a, b]
stetig und auf (a, b) differenzierbar. Außerdem gelte für alle x ∈ (a, b), dass g 0 (x) 6=
0. Dann gelten
(i) g(a) 6= g(b)
(ii) Es gibt ein ξ ∈ (a, b) mit
f (b) − f (a)
f 0 (ξ)
=
.
0
g (ξ)
g(b) − g(a)
Dieser verallgemeinerte Mittelwersatz hat auch eine geometrische Interpretation.
Die Kurve φ : [a, b] → R2 mit
φ(t) = (f (t), g(t))
besitzt eine Tangente, die parallel zu der Geraden durch die Punkte φ(a) und φ(b)
ist.
Beweis. (i) Falls g(a) = g(b), dann gibt es nach dem Mittelwertsatz (Satz 3.6.2)
ein ξ ∈ (a, b) mit
g(b) − g(a)
g 0 (ξ) =
= 0.
b−a
(ii) Wir wenden den Satz von Rolle auf die Funktion F : [a, b] → R mit
F (x) = f (x) − f (a) −
f (b) − f (a)
(g(x) − g(a))
g(b) − g(a)
an. Die Voraussetzungen des Satzes von Rolle sind erfüllt, weil F (a) = F (b) = 0
gilt. Also gibt es ein ξ ∈ (a, b) mit F 0 (ξ) = 0. Hiermit folgt
0 = F 0 (ξ) = f 0 (ξ) −
und damit
2
f (b) − f (a) 0
g (ξ)
g(b) − g(a)
f 0 (ξ)
f (b) − f (a)
=
.
0
g (ξ)
g(b) − g(a)
3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ
171
Lemma 3.6.2 Die Funktion f : [a, b] → R sei auf [a, b] stetig und auf (a, b) differenzierbar.
(i) Gilt für alle x ∈ (a, b), dass f 0 (x) ≥ 0 (f (x) > 0), dann ist f (strikt) monoton
wachsend auf [a, b].
(ii) Gilt für alle x ∈ (a, b), dass f 0 (x) ≤ 0 (f (x) < 0), dann ist f (strikt) monoton
fallend auf [a, b].
Beweis. (i) Es sei a ≤ x < y ≤ b. Wir zeigen nun, dass f (x) ≤ f (y).
Nach dem Mittelwertsatz gibt es ein ξ ∈ (x, y) mit
Also gilt f (y) − f (x) ≥ 0. 2
f (y) − f (x)
= f 0 (ξ) ≥ 0.
y−x
Beispiel 3.6.2 (i) Die Funktion f : [0, 1] → R, f (x) = x2 , ist auf [0, 1] strikt monoton wachsend.
(ii) Die Funktion f : [−1, 1] → R, f (x) = x3 , ist auf [−1, 1] strikt monoton wachsend.
(iii) exp ist auf R strikt monoton wachsend.
(iv) ln ist auf (0, ∞) strikt monoton wachsend.
Beweis. (i), (iii) und (iv) folgen unmittelbar aus Lemma 3.6.2.
(ii) können wir nicht unmittelbar aus Lemma 3.6.2 folgern, weil f 0 (0) = 0 gilt. Wenn wir
jedoch, das Intervall [−1, 1] in zwei Teilintervalle [−1, 0] und [0, 1] zerlegen, können wir Lemma
3.6.2 anwenden. 2
Lemma 3.6.3 (i) Für alle x mit x ∈ (0, 1) gilt
ex <
1
.
1−x
(ii) Für alle x mit x ∈ (0, ∞) gilt
1 + x < ex .
(iii) Für alle x ∈ (0, ∞) gilt
x
< ln(1 + x) < x.
1+x
Beweis. (i) Wir wenden den Mittelwertsatz auf die Funktion f : [0, x] → R,
f (t) = et an. Dann gibt es ein ξ ∈ (0, x), so dass
f (x) − f (0)
= f 0 (ξ)
x
bzw.
ex − 1
= eξ
x
gilt. Nach Beispiel 3.6.2 ist die e-Funktion streng monoton wachsend. Also gilt
eξ < ex . Wir erhalten
ex − 1
= eξ < ex .
x
172
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Hieraus folgt für alle x ∈ (0, 1)
1
.
1−x
(ii) Wir wenden den Mittelwertsatz auf die Funktion f : [0, x] → R, f (t) = et an.
Dann gibt es ein ξ ∈ (0, x), so dass
ex <
f (x) − f (0)
= f 0 (ξ)
x
bzw.
ex − 1
= eξ
x
gilt. Nach Beispiel 3.6.2 ist die e-Funktion streng monoton wachsend. Deshalb gilt
eξ > e0 . Wir erhalten
ex − 1
= eξ > e0 = 1.
x
x
Es folgt 1 + x < e .
(iii) Nach (ii) gilt 1 + x < ex . Wir nehmen auf beiden Seiten den Logarithmus
und erhalten ln(1 + x) < x.
y
1
. Wir setzen x = 1+y
und erhalten
Nach (i) gilt ex < 1−x
y
e 1+y < 1 + y.
Nun nehmen wir auf beiden Seiten den Logarithmus. Da der Logarithmus streng
monoton wachsend ist, bleibt die Ungleichung erhalten. 2
Beispiel 3.6.3 (Euler-Mascheroni Konstante) [101] Die Folge
( n
)
X1
− ln n
k
k=1
n∈N
konvergiert. (Der Grenzwert wird als Euler-Mascheroni Konstante γ bezeichnet und ist verschieden
von der Zahl e.)
Insbesondere gilt
n
X
1
1 − ln 2 + ln n ≤
≤ 1 + ln(n + 1).
k
k=1
Pn
Wir erhalten hier die Größenordnung der Partialsumme k=1 k1 . Dies kann man auch mit Hilfe
des Integralkriteriums bekommen (Beispiel 5.13.1). Es ist nicht bekannt, ob die Euler-Mascheroni
Konstante rational oder irrational ist. Die Dezimalbruchentwicklung ist
γ = 0, 577215664901532......
Lorenzo Mascheroni (Sein Name spricht sich Maskeroni aus) wurde am 13. Mai 1750 bei
Bergamo geboren und er starb am 14. Juli 1800 in Paris. Er war Professor an der Universität
Pavia und wurde dort Rektor der Universität.
Beweis. Wir setzen
xn =
yn =
n
X
1
− ln(n + 1)
k
k=1
n
X
k=1
1
− ln n
k
n∈N
3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ
173
Wir zeigen, dass die Folge {xn }n∈N monoton wachsend und nach oben beschränkt ist, die Folge
{yn }n∈N monoton fallend und nach unten beschränkt ist.
Wir zeigen, dass {xn }n∈N monoton wächst. Es gilt genau dann xn ≤ xn+1 , wenn
n+1
n
X1
X
1
− ln(n + 1) ≤
− ln(n + 2).
k
k
k=1
k=1
Dies äquivalent zu
ln(n + 2) − ln(n + 1) ≤
1
.
n+1
Dies wiederum ist äquivalent zu
ln
n+2
n+1
≤
1
.
n+1
Wegen Lemma 3.6.3 (iii) gilt aber ln(1 + n1 ) ≤ n1 und die letzte Ungleichung ist wahr.
Wir zeigen nun, dass {yn }n∈N monoton fallend ist. Es gilt genau dann yn ≥ yn+1 , wenn
n
n+1
X
X1
1
− ln(n) ≥
− ln(n + 1).
k
k
k=1
k=1
Dies ist äquivalent zu
ln
n+1
n
≥
1
.
n+1
Diese Ungleichung gilt aber nach Lemma 3.6.3 (iii).
Wir zeigen, dass {xn }n∈N nach oben beschränkt ist. Für alle n ∈ N gilt xn < yn . Hiermit folgt
für alle n ∈ N, dass xn < yn ≤ y1 = 1. Genauso zeigt man, dass {yn }n∈N nach unten beschränkt
ist. Nach Satz 2.3.1 konvergiert eine reelle, nach oben beschränkte, monoton wachsende Folge in
R.
Wir wollen noch anmerken, dass die beiden Folgen {xn }n∈N und {yn }n∈N gegen denselben
Grenzwert konvergieren. Dazu zeigen wir, dass die Folge {xn − yn }n∈N eine Nullfolge ist. Es gilt
xn − yn = ln n − ln(n + 1) = − ln(1 + n1 ).
Mit Lemma 3.6.3 (iii) folgt
1
1
≤ ln(1 + n1 ) ≤ .
n+1
n
Damit ist {ln(1 + n1 )}n∈N eine Nullfolge. 2
Beispiel 3.6.4 [67] Es sei P die Menge der Primzahlen und für alle n ∈ N sei Pn die Menge aller
Primzahlen, die kleiner oder gleich n sind. Dann gilt
X 1
n
ln 1 + ln
<2
.
2
p
p∈Pn
Insbesondere divergiert die Reihe
X1
p∈P
p
.
Aus diesem Ergebnis folgt auch, dass es unendlich viele Primzahlen gibt. Beachte auch den
Primzahlsatz [102].
Beweis. Mit Beispiel 2.6.1
Y
p∈Pn
Y
p
1
=
p−1
1−
p∈P
n
1
p
=
∞
Y X
1
.
pk
p∈Pn k=0
174
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Wir wollen nun einsehen, dass
n
∞
X
Y X
1
1
≥
.
k
p
k
p∈Pn k=0
k=1
Dazu schreiben wir die Primzahlen, die kleiner oder gleich n sind, als Produkt von allen Primzahlen
p1 , . . . , pjn , die kleiner oder gleich n sind. Es sei k ∈ N mit 1 ≤ k ≤ n. Nach dem Primzahlzerlegungssatz lässt sich k als Produkt von Primzahlen schreiben. Keine dieser Primzahlen kann
strikt größer als k sein. Also gibt es Zahlen k1 , . . . , kjn ∈ N0 mit
k=
jn
Y
pki i
i=1
Wir beobachten, dass alle Zahlen k1 , . . . , kjn kleiner oder gleich n sind. Dies gilt, weil 2 die kleinste
Primzahl ist und k ≤ n < 2n gilt. Also gilt


jn

Y
k
{1, . . . , n} ⊆
pj j 0 ≤ k1 , . . . , kjn ≤ n


j=1
Hiermit folgt
−1

jn
jn X
jn X
∞
∞
n
n
Y X
Y
Y
Y
X
1
1
1
k

pj j  .
=
≥
=
kj
kj
pk
p
p
j=1 kj =0 j
j=1 kj =0 j
p∈Pn k=0
k1 ,...,kjn =0 j=1
Also
n
Y
p∈Pn
X1
p
>
.
p−1
k
k=1
Weiter folgt

ln 
Y
p∈Pn

!
n
X
1
p 
> ln
.
p−1
k
k=1
Mit Lemma 3.6.3 folgt
!
n
X
X p X 2
X X 1
1
1
ln
<
ln
=
ln 1 +
≤
≤
.
k
p−1
p−1
p−1
p
k=1
p∈Pn
Mit Beispiel 3.6.3
p∈Pn
p∈Pn
X 2
n
ln 1 + ln
.
<
2
p
p∈Pn
2
π(n) ist die Anzahl der Primzahlen, die kleiner oder gleich n sind.
Beispiel 3.6.5 [117] Es gibt ein n0 ∈ N, so dass für alle n ≥ n0
2 n
n
≤ π(n) ≤ 1, 7
3 ln n
ln n
gilt.
Tatsächlich kann man zeigen, dass
lim
n
π(n)
n
ln n
= 1.
p∈Pn
3.6. DER SATZ VON ROLLE UND DER MITTELWERTSATZ
175
2n
n
Beweis. Wir zeigen die rechte Ungleichung durch Induktion. Wir betrachten
. Wegen
2n
2n
2n
2n
2n
= (1 + 1)2n =
+
+ ···
+ ··· +
n
0
1
n
2n
gilt
2n
n
≤ 22n . Weiter gilt
Es folgt, dass
2n
n
2n
n
=
(2n) · (2n − 1) · · · 2 · 1
(2n)!
=
(n!)2
n · (n − 1) · · · 2 · 1
durch jede Primzahl teilbar ist, die zwischen n und 2n liegt.
Y
nπ(2n)−π(n) <
n<p≤2n
p≤
2n
n
< 22n
Es folgt
(π(2n) − π(n)) ln n < 2n ln 2 < 1, 39n.
Nach Induktionsannahme gilt π(n) < 1, 7 lnnn . Es folgt für alle n > 1200
π(2n) = (π(2n) − π(n)) + π(n) ≤ 1, 39
n
n
n
2n
+ 1, 7
= 3, 09
≤ 1, 7
.
ln n
ln n
ln n
ln 2n
Damit gilt der Satz auch für 2n. Wegen
π(2n + 1) ≤ π(2n) + 1 < 3, 09
n
2n + 1
+ 1 < 1, 7
ln n
ln(2n + 1)
Nun die linke Ungleichung.
Lemma 3.6.4 Es sei p eine Primzahl und pνp die größte Potenz von p, die
pνp ≤ n.
Beweis. Die größte Potenz von p, die n! teilt, ist
p
n
[n
p ]+[ p2 ]+···
,
wobei [x] der ganzzahlige Teil von x ist. Deshalb ist
X n k n − k νp =
− r −
pr
p
pr
r≥1
In dieser Summe ist jeder Summand gleich 0 oder 1, und gleich 0 für
r>
weil dann
ln n
,
ln p
n
= 0.
pr
Es folgt
νp ≤
und damit die Behauptung. 2
ln n
ln p
n
k
teilt. Dann gilt
176
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Korollar 3.6.2 Für jeden Binomialkoeffizienten nk gilt
Y
n
≤
pνp ≤ nπ(n) .
k
p≤n
Mit dem Korollar folgt
n
n X
n
n
2 = (1 + 1) =
k
k=0
≤ (n + 1)nπ(n)
Deshalb
n ln 2 ≤ ln(n + 1) + π(n) ln n
n ln 2 ln(n + 1)
−
≤ π(n)
ln n
ln n
Für n > 200 folgt
2 n
≤ π(n)
3 ln n
2
Beispiel 3.6.6 (i) Die Folge
1
1+ √
n
n divergiert.
(ii) Es gilt
lim
n→∞
1+
1
n2
n∈N
n
= 1.
(iii) Es gilt
lim
n→∞
1
0.999 +
n
n
= 0.
Um einen Eindruck zu erhalten, um welche Größenordnungen es sich handelt, macht man in
(i) die folgende Beobachtung
(3.14)
√n
1
lim 1 + √
= e.
n→∞
n
Hieraus folgt heuristisch mit etwas Mut und Vertrauen
n
√
1
1+ √
∼ e n.
n
Dieser Schluss führt hier zu einem richtigen Ergebnis, obwohl man i.A. durch einen solchen Schluss
auch falsche Ergebnisse bekommen kann. Für (ii) kann man ähnlich argumentieren.
Beweis. (i) Mit der Bernoulli Ungleichung (Lemma 1.10.7)
n
√
1
1+ √
≥ 1 + n.
n
Die Folge ist unbeschränkt und divergiert deshalb.
Wir wollen noch einen Beweis liefern, der unsere Beobachtung (3.14) benutzt. Da e > 2, so
gibt es ein N ∈ N, so dass für alle n ≥ N
2<
1
1+ √
n
√n
.
3.7. LOKALE EXTREMA
177
Somit
√
(ii) Mit 1 + x ≤ ex
<
1+
1
n2
1≤
n
2
Da die e-Funktion stetig ist, gilt
1
1+ √
n
n
n
.
1
1
≤ (e n2 )n = e n .
1
lim e n = e0 = 1.
n→∞
Auch hier finden wir ein alternatives Argument mit der Beobachtung
n2
1
lim 1 + 2
= e.
n→∞
n
Wegen e < 3 gibt es ein N ∈ N, so dass für alle n ≥ N
n2
1
3> 1+ 2
n
gilt. Es folgt
3
1
n
>
1
1+ 2
n
n
.
Da 3x eine stetige Funktion ist, folgt
1
lim 3 n = 30 = 1.
n→∞
(iii) Für alle n ≥ 104 gilt 0.999 +
1
n
≤ 0.9991 < 1. Also gilt für alle n ≥ 104
n
1
≤ 0.9991n .
0.999 +
n
Weiter gilt
lim 0.9991n = 0.
n→∞
2
3.7
Lokale Extrema
Satz 3.7.1 (i) Es sei f : (a, b) → R eine differenzierbare Funktion mit einem
lokalen Extremum in x0 . Dann gilt
f 0 (x0 ) = 0.
(ii) Es gebe ein δ > 0 mit (x0 − δ, x0 + δ) ⊆ (a, b), so dass für alle x ∈ (x0 − δ, x0 )
gilt f 0 (x) ≥ 0 und für alle x ∈ (x0 , x0 + δ) gilt f 0 (x) ≤ 0. Dann besitzt f in x0 ein
lokales Maximum.
Falls entsprechend f 0 (x) ≤ 0 auf (x0 − δ, x0 ) und f 0 (x) ≥ 0 auf (x0 , x0 + δ) gelten,
dann besitzt f in x0 ein lokales Minimum.
(iii) Es sei f : (a, b) → R eine zweimal differenzierbare Funktion. Es sei x0 ∈ (a, b)
mit f 0 (x0 ) = 0 und f 00 (x0 ) > 0. Dann besitzt f in x0 ein lokales Minimum.
Falls f 0 (x0 ) = 0 und f 00 (x0 ) < 0 gelten, dann hat f in x0 ein lokales Maximum.
178
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beweis. (i) wurde bereits als Lemma 3.6.1 bewiesen.
(ii) Lemma 3.6.2
(iii) Wir nehmen an, dass f 00 (x0 ) > 0.
f 0 (x0 + h)
f 0 (x0 + h) − f 0 (x0 )
= lim
h→∞
h→∞
h
h
0 < f 00 (x0 ) = lim
Da f 0 differenzierbar ist, ist f 0 auch stetig. Deshalb gilt für hinreichend kleines h
f 0 (x0 + h)
> 0.
h
Deshalb gilt f 0 (x0 + h) < 0 für h < 0 und f 0 (x0 + h) > 0 für h > 0. 2
Beispiel 3.7.1 (i) Welches Rechteck mit dem Flächeninhalt 1 besitzt den kleinsten Umfang? Das
Quadrat.
(ii) Es sei f : R → R durch f (x) = x4 gegeben. Dann hat f in 0 ein relatives und globales
Minimum. Man kann die zweite Ableitung aber nicht benutzen, um dies zu entscheiden.
Beweis. (i) Die Länge einer Seite des Rechtecks sei x. Dann ist die Länge der anderen Seite
Der Umfang ist x + x1 . Dann
1
1
(x + )0 = 1 − 2
x
x
Also gilt für den Extremalwert
1 = x2 .
1
x.
2
3.8
Satz von Taylor und Taylorreihen
Brook Taylor (18.8.1685-29.12.1731) studierte in Cambridge. Er arbeitete auf dem Gebiet der
Differentialgleichungen. Auf dem Gebiet der Kunst schrieb er über die Grundlagen der Perspektive
und beschrieb als erster das Prinzip des Fluchtpunktes [39].
Satz 3.8.1 Es sei f : (a, b) → R (n + 1)-mal stetig differenzierbar und x0 ∈ (a, b).
Dann gilt für alle x, x0 ∈ (a, b)
f (x) =
n
X
f (k) (x0 )
k=0
k!
(x − x0 )k + Rn (x, x0 ) ,
wobei es ein ξ ∈ (x, x0 ) mit
Rn (x, x0 ) =
f (n+1) (ξ)
(x − x0 )n+1
(n + 1)!
gibt. Man nennt dieses die Lagrangesche Form des Restglieds Rn . Weiter gibt es
ein η ∈ (x, x0 ) mit
f (n+1) (η)
(x − η)n (x − x0 ) .
n!
Dies nennen wir die Cauchy Form des Restglieds .
Rn (x, x0 ) =
3.8. SATZ VON TAYLOR UND TAYLORREIHEN
179
Es gibt Beispiele, bei denen man erfolgreich mit der einen Form des Restgliedes
rechnen kann, aber nicht mit der anderen (Beispiel 5.16.1 iv).
Beweis. Es sei F : (a, b) → R durch
n
X f (k) (t)
f (n) (t)
f 0 (t)
(x − t) + · · · +
(x − t)n =
(x − t)k
F (t) = f (t) +
1!
n!
k!
k=0
gegeben. Man beachte, dass
Rn (x, x0 ) = F (x) − F (x0 ).
Es sei G : (a, b) → R eine Funktion, die auf [x0 , x] stetig und auf (x0 , x) differenzierbar ist. Die Ableitung G0 sei nicht 0 auf (x0 , x). Die Funktion G werden wir später
spezifizieren. Nach dem Mittelwertsatz (Satz 3.6.4) gibt es ein ξ ∈ (x0 , x) mit
F 0 (ξ)
F (x) − F (x0 )
=
.
0
G (ξ)
G(x) − G(x0 )
Weiter gilt für alle t ∈ (a, b)
n
X
f (k) (t)
d
F 0 (t) =
dt
=
=
n
X
k=0
n
X
k=0
k=0
k!
!
(x − t)k
n
X
f (k+1) (t)
f (k) (t)
k
(x − t) −
(x − t)k−1
k!
(k − 1)!
k=1
n−1 (k+1)
X
f
(t)
f (n+1) (t)
f (k+1) (t)
k
(x − t) −
(x − t)k =
(x − t)n .
k!
k!
n!
k=0
Also gilt
F 0 (t) =
f (n+1) (t)
(x − t)n .
n!
Es folgt
Rn (x, x0 ) =
F 0 (ξ)
f (n+1) (ξ)
G(x) − G(x0 )
(G(x)
−
G(x
))
=
(x − ξ)n
0
0
G (ξ)
n!
G0 (ξ)
Wenn wir G(t) = (x − t)n+1 wählen erhalten wir die Lagrange Form des Restgliedes
Rn (x, x0 ) =
f (n+1) (ξ)
(x − x0 )n+1
f (n+1) (ξ)
(x − ξ)n
=
(x − x0 )n+1 .
n!
(n + 1)(x − ξ)n
(n + 1)!
Wenn wir G(t) = t − x0 wählen, erhalten wir die Cauchy Form des Restgliedes
f (n+1) (η)
G(x) − G(x0 )
(x − η)n
n!
G0 (η)
f (n+1) (ξ)
f (n+1) (η)
n x − x0
=
(x − η)
=
(x − η)n (x − x0 ).
n!
1
n!
Rn (x, x0 ) =
180
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
2
Falls das Restglied Rn (x, x0 ) für n gegen ∞ gegen 0 konvergiert, so gilt
f (x) =
∞
X
f (k) (x0 )
k=0
k!
(x − x0 )k
Man nennt diese Reihe die Taylorrreihe von f .
Für eine reelle Zahl r und 0 wird der Binomialkoeffizient durch
und für k ∈ N durch als
r
r(r − 1) · · · (r − k + 1)
.
=
k!
k
r
0
= 1 definiert
Beispiel 3.8.1 (i) Für alle x ∈ R gilt
ex =
Insbesondere gilt
e=
∞
X
xn
.
n!
n=0
∞
X
1
n!
n=0
und wir erhalten
e = 2, 71828182846.....
(ii) Für alle x ∈ R gilt
∞
X
e
e =
(x − 1)n .
n!
n=0
x
(iii) Es sei a > 0. Für alle x ∈ R gilt
ax =
∞
X
(x · ln a)n
.
n!
n=0
(iv) Für alle x mit |x| < 1 gilt
ln(1 − x) = −
∞
X
xn
.
n
n=1
Hier ist interessant, dass wir mit der Cauchy Form des Restgliedes rechnen müssen, während wir
mit der Lagrange Form nicht zum Ziel kommen.
Für x = −1 erhält man mit dem Grenzwertsatz von Abel (Lemma 3.9.3)
∞
X
(−1)n
= ln 2.
n
n=1
(v) Für alle x mit |x| < 1 gilt
∞
X
1
=
xn .
1 − x n=0
(vi) Für alle x mit |x| ≤ 1 gilt
√
1+x
1
1·1 2 1·1·3 3 1·1·3·5 4
1+ x−
x +
x −
x + ···
2
2·4
2·4·6
2·4·6·8
∞
∞
X 2n
X 1
(−1)n
2 xn .
xn =
=
n
n
(1
−
2n)4
n
n=0
n=0
=
3.8. SATZ VON TAYLOR UND TAYLORREIHEN
181
(vii) Für alle r ∈ R und x mit |x| < 1 gilt
r
(1 + x) =
∞ X
r
n=0
n
xn
(viii) Um eine Funktion in eine Taylorreihe entwickeln zu können, muss sie unendlich oft differenzierbar sein. Andererseits gibt es Funktionen, die auf ganz R unendlich oft differenzierbar
sind, aber in einem bestimmten Punkt nicht in eine Taylorreihe zu entwickeln sind. Das klassische
Beispiel hierzu ist die folgende Funktion, die man in 0 nicht in eine Taylorreihe entwickeln kann.
Es sei f : R → R durch


 exp − 1
falls x 6= 0
x2
f (x) =

0
falls x = 0
gegeben. Dann gilt für alle n = 0, 1, 2, . . .
f (n) (0) = 0
Rn (x, 0) = f (x)
und
Es gibt auch Funktionen, die auf einem Intervall unendlich oft differenzierbar sind, aber in
keinem Punkt in eine Taylorreihe zu entwickeln (Beispiel 5.17.3).
Beweis. (i) Es gilt für alle n ∈ N, dass f (n) (x) = ex . Deshalb gilt für alle n ∈ N, dass f (n) (0) = 1.
Das Restglied konvergiert gegen 0. Es gibt ein ξ ∈ (0, x) mit
Rn (x, 0) =
f (n+1) (ξ) n+1
ex
x
=
xn+1
(n + 1)!
(n + 1)!
Wegen ξ ∈ (0, x) folgt
|Rn (x, 0)| =
Wegen 0 < ex ≤ e|x| ≤ e|x| folgt
eξ
e|x|
|x|n+1 ≤
|x|n+1 .
(n + 1)!
(n + 1)!
|Rn (x, 0)| ≤ e|x|
|x|n+1
.
n!
Mit Beispiel (2.3.10) folgt
|x|n+1
= 0.
n→∞
n!
lim
Deshalb gilt
lim |Rn (x, 0)| = 0.
n→∞
f
(n)
(ii) Für alle n = 0, 1, 2, . . . gilt, dass f (n) (x) = ex . Also gilt für alle n = 0, 1, 2, . . . , dass
(1) = e.
(iii) Dies ergibt sich sofort aus
ax = ex ln a .
(iv) Für f (x) = ln(1 − x) gilt
f 0 (x) = −
Allgemein gilt für n ≥ 1
1
1−x
f 00 (x) = −
1
(1 − x)2
f (n) (x) = −
(n − 1)!
.
(1 − x)n
f 000 (x) = −
2
(1 − x)3
182
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Wir zeigen dies durch Induktion.
f (n+1) (x) =
n!
d (n − 1)!
d (n)
=−
f (x) = −
dx
dx (1 − x)n
(1 − x)n+1
Wir schätzen das Restglied ab. Wir benutzen dazu die Cauchy Form des Restglieds. Die Lagrange
Form ist hier nur für x < 0 erfolgreich zu verwenden.
(n+1)
f
(x − ξ)n (ξ)
n |Rn (x, 0)| = (x − ξ) x = x
n!
(1 − ξ)n+1 Falls x > 0, dann 0 < ξ < x < 1 und damit x − ξ < 1 − ξ. Deshalb
x − ξ 1 − ξ < 1
und
lim |Rn (x, 0)| = 0.
n→∞
Falls x < 0, dann −1 < x < ξ < 0 und 0 < ξ − x < ξ − 1 und damit |x − ξ| < |1 − ξ. Also gilt auch
hier
x − ξ 1 − ξ < 1.
Wir erhalten ebenfalls
lim |Rn (x, 0)| = 0.
n→∞
(viii) Wir zeigen zunächst, dass für jedes n ∈ N ein Polynom pn existiert, so dass für alle x mit
x 6= 0
1
1
f (n) (x) = exp − 2 pn
x
x
gilt. Wir zeigen dies mit Induktion. Für n = 0 gilt
1
f (0) (x) = f (x) = exp − 2 .
x
Wir machen nun den Induktionsschritt. Wir nehmen an, dass die Aussage für n − 1 wahr ist, es
gilt also
1
1
f (n−1) (x) = exp − 2 pn−1
.
x
x
Es folgt
f
(n)
1
(x) = exp − 2
x
2
pn−1
x3
1
−1
1
1
0
+ exp − 2 pn−1
.
x
x
x
x2
Wir setzen
pn (t) = 2t3 pn−1 (t) − t2 p0n−1 (t).
Nun zeigen wir, dass für alle Polynome p
1
1
lim p
exp − 2 = 0
x→0
x
x
gilt. Es reicht zu zeigen, dass für alle n = 0, 1, 2, . . .
1
1
lim n exp − 2 = 0
x→0 x
x
gilt. Wir zeigen dies durch Induktion. Es gelten
1
lim exp − 2 = 0
und
x→0
x
1
lim x exp − 2 = 0.
x→0
x
3.9. POTENZREIHEN
183
Wir wenden die Formel von L’Hôpital an
1
x−n
1
= lim
lim n exp − 2
x→0 exp 12
x→0 x
x
x
−nx−n−1
1
n 1
= lim
exp − 2 .
= lim
x→0 − 23 exp 12
x→0 2 xn−2
x
x
x
Nun zeigen wir, dass für alle n = 0, 1, 2, . . . gilt, dass f (n) (0) = 0. Wir wenden Induktion an. Es
gilt f (0) = 0 und damit f 0 (0) = 0. Nun der Induktionsschritt.
f (n) (0)
f (n−1) (x) − f (n−1) (0)
x→0
x
f (n−1) (x)
1
1
1
= lim
= lim pn−1
exp − 2 = 0
x→0
x→0 x
x
x
x
=
lim
2
Beispiel 3.8.2 [12] Zu jeder Folge reeller Zahlen {an }n∈N gibt es eine unendlich oft differenzierbare Funktion f : R → R, so dass für alle n = 0, 1, 2, . . .
f (n) (0) = an
gilt.
Wir werden dieses als Beispiel 5.17.5 beweisen.
3.9
Potenzreihen
Es sei an , n = 0, 1, 2 . . . , eine Folge reeller Zahlen und x0 ∈ R. Die Reihe
∞
X
n=0
an (x − x0 )n
heißt Potenzreihe in x ∈ R mit Entwicklungsmitte oder Mittelpunkt x0 .
Wir lernen hier, dass man eine Potenzreihe und damit jede Taylorreihe summandenwiese differenzieren kann. Außerdem stellen wir fest, dass die Taylorreihe einer
Potenzreihe die Potenzreihe selbst ist.
Es gibt unendlich oft differenzierbare Funktionen, die in keinem Punkt durch
ihre Taylorreihe darstellbar sind.
Wir sagen, dass eine Funktion in einem Punkt analytisch ist, wenn sie in einer
Umgebung dieses Punktes durch ihre Taylorreihe darstellbar ist.
Lemma 3.9.1 Es sei an , n = 0, 1, 2 . . . , eine Folge reeller Zahlen und x0 ∈ R. Falls
die Potenzreihe
∞
X
an (x − x0 )n
n=0
184
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
für ein x1 mit x1 6= x0 konvergiert, so konvergiert sie für alle x mit |x−x0 | < |x1 −x0 |
absolut, d.h.
∞
X
|an ||x − x0 |n
n=0
konvergiert.
Divergiert die Reihe an einer Stelle x2 , so divergiert sie für alle x mit |x − x0 | >
|x2 − x0 |.
Beweis. Da
∞
X
n=0
an (x1 − x0 )n
konvergiert, gilt nach Lemma 2.6.3
lim an (x1 − x0 )n = 0.
n→∞
Nach Lemma 2.2.1 ist eine konvergente Folge beschränkt. Deshalb gibt es ein C > 0,
so dass für alle n ∈ N
|an (x1 − x0 )n | ≤ C
gilt. Hiermit folgt
∞ X
x − x0 n
x − x0 n
.
≤C
|an (x − x0 ) | =
|an (x1 − x0 ) | x
−
x
x
−
x
1
0
1
0
n=0
n=0
n=0
∞
X
Da
n
∞
X
n
x − x0 x1 − x0 < 1
gilt, konvergiert die Reihe.
P∞
n
Wir betrachten nun den Fall,
n=0 an (x2 − x0 ) divergiert. Wir
P∞ dass die Reihe
n
nehmen an, dass die Reihe n=0 an (x − x0 ) für ein x mit |x − x0 | > |x2 − x0 |
konvergiert. Dies kann
aus dem ersten Teil dieses Lemmas folgt,
P∞nicht sein, weil
n
dass dann die Reihe n=0 an (x2 − x0 ) konvergiert. 2
Aus Lemma 3.9.1 ergibt sich, dass es drei Fälle geben kann. Der erste Fall
ist, dass die Potenzreihe nur für x = x0 konvergiert. Dann sagen wir, dass der
Konvergenzradius der Potenzreihe 0 ist. Der zweite Fall ist, dass die Potenzreihe
für alle x ∈ R konvergiert. Dann sagen wir, dass der Konvergenzradius unendlich
ist. Der dritte Fall ist, dass es ein R > 0 gibt, so dass die Potenzreihe für alle x mit
|x| < R konvergiert und für alle x mit |x| > R divergiert. Dann sagen wir, dass der
Konvergenzradius R ist.
Das Konvergenzgebiet ist also immer ein Intervall. Im Komplexen stellt man
fest, dass das Konvergenzgebiet ein Kreis ist. Deswegen spricht man auch vom
Konvergenzradius.
Ob auf dem Rand des Konvergenzgebietes Konvergenz oder Divergenz vorliegt,
interessiert uns hier nicht.
3.9. POTENZREIHEN
185
P
Lemma 3.9.2 (Wurzelkriterium) Die Reihe ∞
n=1 xn konvergiert absolut, falls der
1
Limes Superior der Folge {|xn | n }n∈N existiert und
1
lim sup |xn | n < 1.
n→∞
1
Die Reihe divergiert, falls der Limes Superior der Folge {|xn | n }n∈N nicht existiert
oder falls er existiert und
1
lim sup |xn | n > 1
n→∞
gilt. (Falls der Limes Superior gleich 1 ist, so können beide Fälle auftreten.)
P
n
Das Wurzelkriterium ist eine Verallgemeinerung der Aussage, dass ∞
n=1 q konvergiert, falls |q| < 1 gilt, und die Reihe divergiert, falls |q| > 1. Falls nämlich
1
|xn | < q n bzw. |xn | n < q gilt, so erhalten wir
∞
X
|xn | ≤
n=1
∞
X
n=1
q n < ∞.
Das Wurzelkriterium ist ein relativ grobes Kriterium, das in komplizierteren Fällen
wie z.B.
∞
X
1
n(ln n)2
n=2
versagt. Das Integralkriterium ist ein feineres Mittel. Für die Zwecke, die wir hier
betrachten, reicht uns das Wurzelkriterium.
Beweis. Wir betrachten den Fall
1
k
lim sup |xn | = lim sup |xk |
= c < 1.
1
n
n→∞
n→∞
n≤k
Dann gilt
∀ > 0 ∃N ∈ N ∀n > N :
Wir wählen nun =
1
(1
2
1
|c − sup |xk | k | < .
k≥n
− c) und setzen q = c + =
∃N ∈ N ∀n > N :
1+c
2
< 1. Es folgt
1
|c − sup |xk | k | < = 21 (1 − c).
k≥n
Hieraus folgt
∃N ∈ N ∀n > N :
Somit erhalten wir
1
sup |xk | k < c + 12 (1 − c) =
k≥n
1
∃N ∈ N ∀n > N : |xn | n ≤ q
und somit
∃N ∈ N ∀n > N : |xn | ≤ q n .
1+c
= q.
2
186
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
P
P
n
Also ist die Reihe ∞
für die Reihe ∞
n=1 q eine MajoranteP
n=1 |xn |. Nach Beispiel
∞
n
2.6.1 konvergiert die geometrische Reihe
n=1 q . Es bleibt das Majorantenkriterium anzuwenden (Lemma 2.6.7).
1
Falls der Limes Superior der Folge {|xn | n }n∈N nicht existiert, dann ist die Folge
unbeschränkt und es gibt eine Teilfolge von {xn }n∈N , die nicht gegen 0 konvergiert.
Nach Lemma 2.6.3 divergiert die Reihe.
1
Wir betrachten nun den Fall, dass der Limes Superior der Folge {|xn | n }n∈N
existiert und dass
1
lim sup |xn | n = c > 1.
n→∞
Dann gilt
c − sup |xk | k1 < .
k≥n
∀ > 0 ∃N ∈ N ∀n > N :
Wir wählen = 21 (c − 1) und q = c − = 12 c + 12 > 1. Damit gilt
1
∃N ∈ N ∀n > N : c − sup |xk | k < 12 (c − 1)
k≥n
und
∃N ∈ N ∀n > N :
1
1 < q < sup |xk | k .
k≥n
Weiter folgt
∃N ∈ N ∀n > N ∃k > n :
1
1 < q ≤ |xk | k .
Deshalb gibt es eine Teilfolge von xn , n ∈ N, die nicht gegen 0 konvergiert.
P∞ Somit
konvergiert die Folge xn , n ∈ N, selbst nicht gegen 0 und die Reihe n=1 xn divergiert. 2
Wir sagen, dass eine reelle Folge {xn }n∈N gegen ∞ konvergiert, wenn
∀C ∈ R∃N ∈ N∀n ≥ N :
C ≤ xn .
Satz 3.9.1 (Formel
von Cauchy-Hadamard) Für den Konvergenzradius R einer
P∞
Potenzreihe n=0 an (x − x0 )n gilt

1
0
falls lim sup |an | n = ∞



n→∞



1
falls lim sup |an | n = 0
R= ∞
n→∞



1


sonst

1
lim supn→∞ |an | n
Beweis. Mit Lemma 3.9.2 folgt, dass die Reihe
∞
X
n=0
an (x − x0 )n
3.9. POTENZREIHEN
187
absolut konvergiert, falls
1
1
1 > lim sup(|an ||x − x0 |n ) n = |x − x0 | lim sup |an | n .
n→∞
n→∞
Also konvergiert die Reihe absolut, falls
|x − x0 | <
1
1
lim supn→∞ |an | n
.
Also gilt
1
R≥
1
lim supn→∞ |an | n
Mit Lemma 3.9.2 folgt, dass die Reihe
∞
X
n=0
.
an (x − x0 )n
nicht konvergiert, falls
1
1
1 < lim sup(|an ||x − x0 |n ) n = |x − x0 | lim sup |an | n .
n→∞
n→∞
Also divergiert die Reihe, falls
1
1
2
lim supn→∞ (|an ||x − x0 |n ) n
< |x − x0 |.
P∞
Beispiel 3.9.1 (i) Der Konvergenzradius der Reihe n=0 xn ist 1.
P∞
(ii) Der Konvergenzradius der Reihe n=0 nxn ist 1.
P∞
(iii) Der Konvergenzradius der Reihe n=0 n2 xn ist 1.
P∞ 1 n
(iv) Der Konvergenzradius der Reihe n=0 n2 x ist 1.
P∞
(v) Der Konvergenzradius der Reihe n=0 21n xn ist 2.
P∞
(vi) Der Konvergenzradius der Reihe n=0 x2n ist 1.
P∞
(vi) Der Konvergenzradius der Reihe n=0 xn! ist 1.
Beweis. (i)
1
lim sup |an | n = lim 1 = 1
n→∞
n→∞
(ii) Mit Beispiel 3.4.2
1
1
lim sup n n = lim n n = 1
n→∞
n→∞
(iii) Mit Beispiel 3.4.2
1
1
1
lim sup(n2 ) n = lim (n2 ) n = ( lim n n )2 = 1
n→∞
n→∞
n→∞
(v)
1
lim sup(2−n ) n = lim
n→∞
1
n→∞ 2
=
1
2
2
In dem folgenden Beispiel ist es nicht einfach, den Konvergenzradius zu berechnen. Man braucht hier das richtige Hilfsmittel.
188
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beispiel 3.9.2 (i) Der Konvergenzradius von
∞
X
1 n
x
sin n
n=1
ist 1.
(ii) Der Konvergenzradius von
∞
X
tan(n)xn
n=1
ist
Wir werden dieses Beispiel später als Beispiel 3.10.4 behandeln.
P
n
Satz 3.9.2 Es sei f (x) = ∞
n=0 an (x − x0 ) eine Potenzreihe mit Konvergenzradius
R (Wir lassen auch R = ∞ zu). Die Potenzreihe f ist unendlich oft differenzierbar
und für alle k ∈ N gilt
f
(k)
∞
∞
X
X
n
n−k
(x) =
k!
an (x − x0 )
=
n · (n − 1) · · · (n − k + 1)an (x − x0 )n−k .
k
n=k
n=k
Diese Potenzreihen haben denselben Konvergenzradius wie f .
Dieser Satz stellt sicher, dass wir eine Potenzreihe summandenweise differenzieren können.
Beweis. Wir zeigen zuerst, dass für alle k = 0, 1, 2, . . . die Reihen
∞
X
n
k!
an (x − x0 )n−k
k
n=k
denselben Konvergenzradius haben wie
sind
R=
Die Reihe
1
lim supn→∞
p
n
|an |
P∞
k=0
ak (x − x0 )k . Die Konvergenzradien
1
Rk =
lim supn→∞
∞
X
n
k!
an (x − x0 )n−k
k
n=k
konvergiert genau dann, wenn die Reihe
(3.15)
∞
X
n
k!
an (x − x0 )n
k
n=k
q
.
k! nk |an |
n−k
3.9. POTENZREIHEN
189
konvergiert, weil sich beide Reihen nur um den Faktor (x − x0 )k unterscheiden. Wir
bezeichnen den Konvergenzradius von (3.15) mit R̃k . Also gilt Rk = R̃k . Wir zeigen
nun, dass R = R̃k gilt. Es gilt
k−1
Y
n
1 ≤ k!
= n(n − 1)(n − 2) . . . (n − k + 1) =
(n − j) ≤ nk .
k
j=0
k
1
Wegen limn→∞ n n = 1 folgt für alle k ∈ N, dass limn→∞ n n = 1. Somit
n1
n
lim k!
= 1.
n→∞
k
Mit Lemma 2.5.8
1
n1
n
1
1
n
n
lim sup k!
an ≤ lim k!
lim sup |an | n = lim sup |an | n .
n→∞
k
k
n→∞
n→∞
n→∞
Weiter gilt
1
n
n
an .
lim sup |an | ≤ lim sup k!
k
n→∞
n→∞
1
n
Damit erhalten wir
1
n1
n
1
1
n
n
lim sup |an | n = lim sup |an | n .
lim sup k!
an = lim k!
n→∞
k
k
n→∞
n→∞
n→∞
Also gilt R = Rk .
Wir zeigen nun, dass f in dem Konvergenzintervall differenzierbar ist. O.E.d.A.
können wir annehmen, dass x0 = 0. Der Konvergenzradius ist R. Weiter nehmen
wir zunächst an, dass x 6= 0.
f (x + h) − f (x) =
∞
X
n=0
n
an (x + h) −
Da (x + h)0 − x0 = 0 und (x + h)n − xn =
∞
X
n
an x =
n=0
Pn
∞
X
n=0
an ((x + h)n − xn )
n
k=1 k
xn−k hk für n ≥ 1, folgt
n ∞
X
X
n n−k k
f (x + h) − f (x) =
an
x h .
k
n=1
k=1
Damit erhalten wir für den Differenzenquotienten
∞
n f (x + h) − f (x) X X n n−k k−1
=
an
x h
h
k
n=1
k=1
und damit
∞
∞
n ∞
X
X
n n−k k−1 X
f (x + h) − f (x) X
n−1
−
nan x
=
an
x h
−
nan xn−1
h
k
n=1
n=1
n=1
k=1
!
∞
n
X n
X
=
an
xn−k hk−1 − nxn−1
k
n=1
k=1
190
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Da
1 X
1
k=1
k
x
1−k k−1
h
n X
n
0
−nx = 0
k=1
k
x
n−k k−1
h
n−1
−nx
n X
n n−k k−1
=
x h
k
k=2
für n ≥ 2, folgt
(3.16)
∞
∞
n X
X
n n−k k−1
f (x + h) − f (x) X
n−1
−
nan x
=
an
x h .
h
k
n=1
n=2
k=2
Weiter gilt
n n X n
X
n n−k k−1 n−k k−1 x h ≤
x h
k
k
k=2
k=2
n−1 n−1 X
n−k k n−k−1 k n
n
1 X
x h .
=
x
h =
|x|
k
+
1
k
+
1
k=1
k=1
Mit
n
k+1
n−k n
n
=
≤n
k+1 k
k
folgt
(3.17)
n−1 n X
n
n n−k k−1 n X n n−k k (|x| + |h|)n .
x h ≤
x h ≤
|x|
|x|
k
k
k=1
k=2
Wir können h0 so klein wählen, dass |x| + |h0 | < R. Deshalb konvergiert
∞
X
n=0
an (|x| + |h0 |)n
absolut und damit auch, wie wir oben gezeigt haben,
∞
1 X
nan (|x| + |h0 |)n .
|x| n=0
Deshalb gibt es zu jedem > 0 ein n0 ∈ N, so dass
∞
1 X
n|an |(|x| + |h0 |)n < .
|x| n=n
0
Es folgt, dass es zu jedem > 0 ein n0 ∈ N gibt, so dass für alle h mit |h| ≤ |h0 |
∞
1 X
n|an |(|x| + |h|)n < .
|x| n=n
0
3.9. POTENZREIHEN
191
Also gibt wegen (3.17) es zu jedem > 0 ein n0 ∈ N, so dass für alle h ∈ R mit
|h| ≤ |h0 | gilt
∞
n X
X
n
an
xn−k hk−1 < .
(3.18)
n=n
k
0
Der Ausdruck
k=2
n0
X
n X
n n−k k−1
an
x h
k
n=2
k=2
ist als Funktion von h stetig und nimmt für h = 0 den Wert 0 an. Deshalb gibt es
zu jedem > 0 ein δ > 0, so dass für alle h mit |h| < δ
∞
n X
X
n n−k k−1 an
x h <
n=2
k
k=2
gilt. Mit (3.16) erhalten wir, dass zu jedem > 0 ein δ > 0 existiert, so dass für alle
h mit |h| < δ
∞
n ∞
X X
f (x + h) − f (x) X
n
nan xn = an
xn−k hk−1 −
k
h
n=1
n=2
k=2
n
n n ∞
0
X
X
X
n n−k k−1 X
n n−k k−1 ≤
an
x h +
an
x h < 2.
k
k
n=2
n=n0 +1
k=2
k=2
gilt.
Es bleibt noch der Fall x = 0. In diesem Fall gilt
∞
∞
X
f (x + h) − f (x)
f (h) − f (0)
1X
=
=
an hn =
an hn−1 .
h
h
h n=1
n=1
Somit
f (x + h) − f (x)
= a1 .
h
Damit haben wir gezeigt, dass f differenzeirbar ist. Die Aussagen für die höheren
Ableitungen folgen mit Induktion. 2
P
n
Satz 3.9.3 (i) Es sei f (x) = ∞
n=0 an (x − x0 ) eine Potenzreihe mit einem Konvergenzradius R, 0 < R ≤ ∞. Dann gilt für alle n = 0, 1, 2, . . .
lim
h→0
an =
f (n) (x0 )
.
n!
P
P∞
n
n
(ii) Es seien f (x) = ∞
a
(x
−
x
)
und
g(x)
=
n
0
n=0
n=0 bn (x − x0 ) Potenzreihen,
deren Konvergenzradien strikt größer als 0 sind. Es gebe ein r > 0, so dass für alle
x ∈ (x0 − r, x0 + r)
∞
∞
X
X
n
an (x − x0 ) =
bn (x − x0 )n ,
n=0
n=0
192
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
gilt. Dann gilt für alle n = 0, 1, 2, . . .
an = b n .
Der Satz sagt aus, dass die Taylorreihe einer Potenzreihe die Potenzreihe selbst
ist.
Beweis. (i) folgt sofort aus Satz 3.9.2: Für alle x ∈ (x0 − R, x0 + R) gilt
f
(k)
∞
X
n
(x) =
k!
an (x − x0 )n−k .
k
n=k
Deshalb erhalten wir
f
(k)
k
(x0 ) = k!
ak = k!ak .
k
(ii) Für alle x ∈ (x0 − r, x0 + r) gilt
f (x) = g(x).
Nach Satz 3.9.2 sind f und g unendlich oft differenzierbar. Es folgt für alle x ∈
(x0 − r, x0 + r) und alle n ∈ N0
f (n) (x) = g (n) (x)
Nach (i) gilt
g (n) (x0 )
f (n) (x0 )
=
= bn .
an =
n!
n!
2
P∞
n
Lemma 3.9.3 (Grenzwertsatz von Abel)
Die
Potenzreihe
n=0 an x besitze den
P∞
Konvergenzradius R mit R < ∞ und n=0 an Rn konvergiere. Dann gilt
lim
x→R
∞
X
n
an x =
∞
X
an R n .
n=0
n=0
Beweis. Wir können annehmen, dass R = 1. Mit dem Produktsatz von Cauchy
(Lemma 2.7.1) folgt
∞
∞
∞
∞
X
X
X
1 X
n
n
n
an x =
x
an x =
(a0 + · · · + an )xn .
1 − x n=0
n=0
n=0
n=0
Also gilt
∞
X
n=0
n
an x = (1 − x)
∞
X
n=0
(a0 + · · · + an )xn .
3.9. POTENZREIHEN
193
Hiermit folgt für alle x mit |x| < 1
∞
X
n=0
an −
∞
X
n=0
an x
n
=
∞
X
n=0
an − (1 − x)
= (1 − x)
= (1 − x)
= (1 − x)
∞
X
n=0
∞
X
∞
X
n=0
∞
X
k=0
∞
X
n=0
∞
X
k=0
∞
X
n=0
k=n+1
(a0 + · · · + an )xn
!
ak
∞
X
xn − (1 − x)
(a0 + · · · + an )xn
n=0
!
!
− (a0 + · · · + an ) xn
ak
!
ak
xn .
P
Wir wählen N so groß, dass für alle n ≥ N die Ungleichung | ∞
k=n+1 ak | < gilt.
Es gilt
!
!
∞
∞
N
∞
∞
∞
X
X
X
X
X
X
an −
an xn = (1 − x)
ak xn + (1 − x)
ak x n
n=0
n=0
n=0
n=N +1
k=n+1
k=n+1
Es folgt für alle x mit 0 < x < 1
∞
∞
∞
N X
∞
X
X
X
X
n
n
ak x + (1 − x)
xn
an x ≤ (1 − x)
an −
n=0 k=n+1
n=0
n=0
n=N +1
N
∞
X X
= (1 − x)
ak xn + xN +1
n=0
k=n+1
Wegen |x| < 1 folgt weiter
∞
∞
N X
∞
X
X
X
n
an −
an x ≤ (1 − x)
ak + .
n=0
n=0
n=0 k=n+1
P∞
P
Da die Reihe ∞
n=k an }k∈N beschränkt. Also gibt
n=0 an konvergiert, ist die Folge {
es eine Konstante C mit
∞
∞
X
X
n
a
−
a
x
≤ (1 − x)C + .
n
n
n=0
n=0
Deshalb gilt für alle x mit x > 1 − C
∞
∞
X
X
n
an −
an x ≤ 2.
n=0
n=0
2
Beispiel 3.9.3 Für x = −1 erhält man mit dem Grenzwertsatz von Abel (Lemma 3.9.3)
∞
X
(−1)n
= ln 2.
n
n=1
194
3.10
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Die trigonometrischen Funktionen
Mit trigonometrischen Funktionen bezeichnet man Funktionen, die Zusammenhänge
von Winkeln und Seitenlängen in Dreiecken beschreiben. Der Sinus eines Winkels
α, der kleiner als 90◦ ist, wird mit Hilfe eines rechtwinkligen Dreiecks definiert, in
dem α als Winkel vertreten ist.
Die Hypotenuse ist die längste Seite in einem Dreieck, in dem ein Winkel ein
rechter Winkel ist, also ein Winkel von 90◦ . Die Hypotenuse liegt dem rechten
Winkel gegenüber. Die anderen beiden Seiten werden als Katheten bezeichnet. Es
sei α ein weiterer Winkel in diesem Dreieck. Dann bezeichnet man die Kathete,
die diesem Winkel gegenüber liegt, als Gegenkathete, die andere als Ankathete.
Der Sinus von α ist der Quotient der Längen von Hypotenuse und Gegenkathete.
Der Cosinus ist der Quotient der Längen von Hypotenuse und Ankathete. Wir
messen den Winkel im Bogenmaß, d.h. Länge des zum Winkel gehörigen Kreisbogens
dividiert durch den Radius des Kreises.
Hypotenuse
Gegenkathete
Ankathete
Der Cosinus des Winkels, der durch den Kreisbogen über dem Intervall [t, 1]
gegeben ist, ist t.
Wir führen hier die trigonometrischen Funktionen durch Potenzreihen ein. Das
hat den Vorteil, dass wir nicht auf die Bogenlänge eines Kreisstückes zurückgreifen
müssen. Die Bogenlänge führen wir später mit Hilfe des Integrals ein und klären
dann den Zusammenhang mit den trigonometrischen Funktionen.
Die Zahl π ist der halbe Umfang eines Kreises mit Radius 1. Euler gab der Zahl
den Namen π in Anlehnung an das griechische Wort peripheria.
In der Bibel wird die Zahl π als 3 angegeben: König Salomon ließ durch den
Kupferschmied Hiram von Tyrus für den Tempel in Jerusalem ein rundes Wasserbecken herstellen. Dann machte er das Meer. Es wurde aus Bronze gegossen und
maß 10 Ellen von einem Rand zum anderen. Es war völlig rund und 5 Ellen hoch.
Eine Schnur von 30 Ellen konnte es rings umspannen. (1. Könige 7,23)
Es ist möglich, dass in der Dezimalbruchentwicklung jede endliche Folge von
natürlichen Zahlen zwischen 0 und 9 auftritt (man weiss es nicht). Wenn das so
ist, dann findet man alles, was es im Universum gibt und geben wird, codiert in der
Zahl π. Insbesondere ist jedes Buch, das jemals geschrieben wurde, und jedes Buch,
3.10. DIE TRIGONOMETRISCHEN FUNKTIONEN
195
das jemals geschrieben wird, bereits in der Zahl π codiert.
Formal nennt man eine Zahl normal zur Basis 10, wenn jede endliche Ziffernfolge
von Ziffern zwischen 0 und 9 in der Dezimalbruchentwicklung dieser Zahl auftritt
und mit derselben Häufigkeit auftritt.
Definition 3.10.1 (i) Der Sinus sin : R → R ist durch
∞
X
(−1)n 2n+1
x
sin x =
(2n + 1)!
n=0
gegeben.
(ii) Der Cosinus cos : R → R ist durch
cos x =
∞
X
(−1)n
n=0
(2n)!
x2n
gegeben.
4
x − 16 x3 +
1
5
120 x
2
1
2
3
4
5
6
sin x
-2
x − 16 x3
-4
Bemerkung 3.10.1 Die Konvergenzradien der Sinusreihe und der Cosinusreihe
sind ∞.
Beweis. Wir zeigen, dass die Sinusreihe für alle x ∈ R absolut konvergiert.
∞ ∞
∞
X
X
(−1)n 2n+1 X
1
1 n
2n+1
=
x
|x|
≤
x = e|x|
(2n + 1)!
(2n
+
1)!
n!
n=0
n=0
n=0
2
Die Kreiszahl π können wir als die kleinste Zahl definieren, die strikt größer als 0
ist und die sin π = 0 erfüllt. Dies verstellt allerdings den Blick auf den geometrischen
Charakter der Zahl π. Später werden wir π als den halben Umfang eines Kreises
mit Radius 1 einführen.
196
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Lemma 3.10.1 Die Funktionen sin und cos sind unendlich oft differenzierbar. Weiter
gelten
sin0 = cos
cos0 = − sin .
Beweis. Nach Satz 3.9.2 sind Potenzreihen unendlich oft differenzierbar und wir
können summandenweise differenzieren
∞
∞
X
(−1)n 2n X (−1)n 2n
x =
x = cos x.
sin x =
(2n + 1)
(2n + 1)!
(2n)!
n=0
n=0
0
2
Lemma 3.10.2 (i) Für alle x ∈ R gelten
sin(−x) = − sin x
cos(−x) = cos x.
(ii)
sin 0 = 0
cos 0 = 1
Beweis. Für alle x ∈ R gilt
∞
∞
X
X
(−1)n
(−1)n 2n+1
2n+1
sin(−x) =
(−x)
=−
x
= − sin x.
(2n + 1)!
(2n + 1)!
n=0
n=0
2
Lemma 3.10.3 Für alle x, y ∈ R gelten
sin(x + y)
cos(x + y)
2
sin x + cos2 x
sin2 x
cos2 x
sin(2x)
=
=
=
=
=
=
sin x cos y + cos x sin y
cos x cos y − sin x sin y
1
1
(1 − cos 2x)
2
1
(1 + cos 2x)
2
2 sin x cos x
Beweis. Wir definieren die Funktionen f, g : R → R durch
f (x) = sin(x + y) − sin x cos y − cos x sin y
g(x) = cos(x + y) − cos x cos y + sin x sin y.
Man beachte, dass zu jedem y Funktionen f und g erhält. Wir werden zeigen, dass
f und g die Nullfunktion sind. Es gilt f (0) = g(0) = 0. Weiter gilt f 0 = g und
g 0 = −f . Wir erhalten
(f 2 + g 2 )0 = 2f f 0 + 2gg 0 = 2f g − 2gf = 0
3.10. DIE TRIGONOMETRISCHEN FUNKTIONEN
197
Nach Satz 3.6.3 ist die Funktion f 2 + g 2 konstant. Also gibt es ein c ≥ 0, so dass
für alle x ∈ R
f 2 (x) + g 2 (x) = c
Die Konstante c könnte von y abhängen. Da aber f (0) = g(0) = 0, gilt c = 0.
Damit gelten f = g = 0 und wir haben wir die ersten beiden Gleichungen bewiesen.
Nun die dritte Formel. Wir setzen y = −x in der Formel
cos(x + y) = cos x cos y − sin x sin y
und erhalten 1 = cos2 x + sin2 x.
Nun die vierte Formel. Mit y = x folgt aus Formel zwei
cos 2x = cos2 x − sin2 x = 1 − 2 sin2 x
Die fünfte Formel folgt aus der dritten und vierten Formel. Die sechste Formel folgt
aus der ersten Formel mit y = x. 2
Definition 3.10.2
π
= inf{x|x > 0 und cos x = 0}
2
Wir überlegen uns, dass π wohldefiniert ist. Es gilt
cos 0 = 1
und
1
3
Nach dem Zwischenwertsatz gibt es eine Nullstelle des Cosinus zwischen 0 und 2.
Da der Cosinus stetig ist, ist auch das Infimum eine Nullstelle.
cos 2 < −
Lemma 3.10.4 (i)
sin π2 = 1
(ii) Für alle x ∈ R gilt
sin π = 0
sin(x + π2 ) = cos x
(iii) Für alle x ∈ R gelten
sin(x + 2π) = sin x
cos(x + 2π) = cos x
Beweis. (i) Wegen cos 0 = 1 und sin2 0 + cos2 0 = 1 gilt sin2 0 = 1. Also gelten
sin 0 = 1 oder sin 0 = −1. Da cos 0 = 1, so gilt für alle x ∈ [0, π2 ), dass cos x > 0.
Mit sin0 = cos folgt, dass sin auf [0, π2 ] strikt monoton wachsend ist. Also sin π2 > 0
und wir können auf sin π2 = 1 schließen.
Mit
sin(2x) = 2 sin x cos x
198
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
folgt für x =
π
2
π
π
cos = 0.
2
2
(ii) Nach Lemma 3.10.3 gilt für alle x, y ∈ R
sin π = 2 sin
sin(x + y) = sin x cos y + cos x sin y.
Für y =
π
2
erhalten wir
sin(x + π2 ) = sin x cos π2 + cos x sin π2 .
Wegen sin π2 = 1 und cos π2 = 0 folgt
sin(x + π2 ) = cos x.
(iii) Aus
sin x +
π
2
= cos x.
erhalten wir für x = −t
sin −t +
Für t = y +
π
2
π
2
= cos(−t) = cos t = sin t +
π
2
.
erhalten wir
sin(−y) = sin(y + π)
und für y = z + π
sin(z + 2π) = sin(−z − π) = − sin(z + π) = sin z.
2
Wir setzen
sin t
cos t
cos t
cot t =
sin t
für cos t 6= 0
tan t =
Beispiel 3.10.1 Für alle x ∈ R mit |x| <
für sin t 6= 0
π
2
gilt
∞
X
1
2
17 7
(−1)n−1 22n (22n − 1)B2n 2n−1
tan x = x + x3 + x5 +
x + ··· =
x
3
15
315
(2n)!
n=1
wobei Bm die Bernoulli Zahlen sind, die durch B1 = − 12 und rekursiv für m = 2, 3, . . .
Bm
m−1 1 X m+1
=−
Bk
m+1
k
k=0
definiert sind.
3.10. DIE TRIGONOMETRISCHEN FUNKTIONEN
Beispiel 3.10.2 Es sei f : R → R durch

 x2 cos xπ2
f (x) =

0
199
falls x ∈ [−1, 1] und x 6= 0
falls x = 0
gegeben. Dann ist f auf R differenzierbar und f 0 ist in 0 unstetig.
Beweis. Falls 0 6= x gilt, dann kann man die Kettenregel anwenden und erhält
π 2π
π
f 0 (x) = 2x cos 2 +
sin 2 .
x
x
x
Für x = 0 rechnet man aus
π
x2 cos xπ2
0
f (0) = lim
= lim x cos 2 = 0
x→0
x→0
x
x
f ist also auf ganz R differenzierbar. Wir weisen nun nach, dass f 0 in 0 nicht stetig ist.
Wir betrachten die Punkte
1
n ∈ N.
xn = q
2n + 12
Dann gelten
lim xn = 0
n→∞
und
0
1
f (xn ) = 2 q
2n +
1
2
r
r
1
1
1
1
cos π 2n +
+ 2π 2n + sin π 2n +
= 2π 2n + .
2
2
2
2
Also konvergiert die Folge {f 0 (xn )}n∈N nicht. 2
Beispiel 3.10.3 Für alle x mit x ≥ 0
sin x ≤ x
Beispiel 3.10.4 (i) Der Konvergenzradius von
∞
X
1 n
x
sin
n
n=1
ist 1.
(ii) Der Konvergenzradius von
∞
X
tan(n)xn
n=1
ist
Beweis. (i) Für t mit 0 ≤ t ≤
Ungleichung sin t ≥ 12 t.
π
3
gilt
1
2
≤ cos t ≤ 1. Deshalb gilt für alle t mit 0 ≤ t ≤
1
m n
|n − mπ| =
− π .
2
2 m
Mit Satz 2.11.2 erhalten wir für alle m mit m ≥ 2
n
m−42 < | − π|.
m
n
Außerdem gilt m
∼ π. Damit folgt
1
| sin n| ≥ 42 .
n
2
| sin n| = | sin(n − mπ)| ≥
π
3
die
200
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
3.11
Die Formel von L’Hôpital
Guillaume Francois Antoine Hôpital, Marquis de Sainte-Mesme wurde 1661 in Paris geboren.
1696 veröffentlichte L’Hôpital das erste französische Lehrbuch der Analysis überhaupt Analyse des
infiniment petits. Tatsächlich geht es auf Johann I. Bernoulli zurück. L’Hôpital bezahlte Bernoulli
für wissenschaftliche Ergebnisse und deren Publikationsrechte. So stammt die Formel bzw. Regel
von L’Hôpital tatsächlich von Bernoulli. L’Hôpital starb am 3.2.1704 in Paris. Nach dem Tod von
L’Hôpital ging Bernoulli damit an die Öffentlichkeit.
Satz 3.11.1 (L’Hôpital) Es seien f, g : (a, b) → R stetig differenzierbare Funktionen. Es sei x0 ∈ (a, b) und g und g 0 seien für alle x ∈ (a, b) mit x 6= x0 von 0
verschieden. Es gelte
f (x0 ) = g(x0 ) = 0
und
Dann gilt
lim
x→x0
lim
x→x0
f 0 (x)
g 0 (x)
existiere.
f (x)
f 0 (x)
= lim 0
.
g(x) x→x0 g (x)
Insbesondere gilt
lim
x→x0
f 0 (x0 )
f (x)
= 0
,
g(x)
g (x0 )
falls g 0 (x0 ) 6= 0.
Beweis. Es sei {xn }n∈N eine Folge mit limn→∞ xn = x0 . Nach Satz 3.6.4 gibt es
dann zu jedem n ∈ N ein ξn mit ξn ∈ (xn , x0 ) oder ξn ∈ (x0 , xn ), so dass
f 0 (ξn )
f (xn ) − f (x0 )
=
.
0
g (ξn )
g(xn ) − g(x0 )
Wegen f (x0 ) = g(x0 ) = 0 folgt
f 0 (ξn )
f (xn )
=
.
0
g (ξn )
g(xn )
Da ξn ∈ (xn , x0 ) bzw. ξn ∈ (x0 , xn ) gilt, folgt limn→∞ ξn = x0 . Nach Voraussetzung
existiert
f 0 (x)
lim 0
.
x→x0 g (x)
Deshalb folgt
f 0 (x)
f 0 (ξn )
f (xn )
= lim 0
= lim
.
lim 0
x→x0 g (x)
n→∞ g (ξn )
n→∞ g(xn )
Wir betrachten nun den Fall, dass g 0 (x0 ) 6= 0. Da f 0 und g 0 nach Voraussetzung
stetig sind, gilt
f 0 (x)
limx→x0 f 0 (x)
f 0 (x0 )
lim 0
=
=
.
x→x0 g (x)
limx→x0 g 0 (x)
g 0 (x0 )
2
3.11. DIE FORMEL VON L’HÔPITAL
Beispiel 3.11.1
201
1
ex − 1 − x
=
2
x→0
x
2
lim
Beweis. Wir müssen zweimal differenzieren. Es gilt
ex
1
= .
x→0 2
2
lim
Deshalb gilt
1
ex − 1
= .
x→0
2x
2
lim
Hieraus folgt
1
ex − 1 − x
= .
2
x→0
x
2
lim
Satz 3.11.1 kann dahingehend verallgemeinert werden, dass auch x0 = a oder
x0 = b zugelassen wird.
Wir hatten bereits in (3.4) definiert, wann eine Folge gegen ∞ konvergiert. Eine
Folge xn , n ∈ N, konvergiert gegen ∞, wenn
∀C > 0∃N ∀n ≥ N :
xn ≥ C.
Satz 3.11.2 Es seien f, g : (a, b) → R stetig differenzierbar. Es sei g(x) 6= 0 für
alle x ∈ (a, b).
(i) Es gelte
lim f (x) = lim g(x) = 0
x→a
x→a
Dann gilt
f 0 (x)
x→a g 0 (x)
und
lim
existiere.
f (x)
f 0 (x)
= lim 0
.
x→a g(x)
x→a g (x)
lim
(ii) Es gelte
lim g(x) = ∞
und
x→a
Dann gilt
f 0 (x)
x→a g 0 (x)
lim
existiere.
f (x)
f 0 (x)
= lim 0
.
x→a g(x)
x→a g (x)
lim
Beweis. Es sei > 0. Wir bestimmen ein δ > 0, so dass für alle y ∈ (a, a + δ)
f 0 (y)
f 0 (x)
<
lim
+
g 0 (y) x→a g 0 (x)
gilt. Nach dem Mittelwertsatz (Satz 3.6.4) gibt es für alle v, w ∈ (a, a+δ) mit v < w
ein ξ ∈ (v, w) mit
f 0 (ξ)
f (w) − f (v)
=
.
0
g (ξ)
g(w) − g(v)
202
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
existiert. Es folgt
f 0 (x)
f (w) − f (v)
< lim 0
+ .
x→a g (x)
g(w) − g(v)
Wir können v so nahe bei a wählen, dass
f 0 (x)
f (w)
< lim 0
+ 2.
g(w) x→a g (x)
2
Satz 3.11.3 Es seien f, g : [a, ∞) → R differenzierbare Funktionen mit limx→∞ f (x) =
0 und limx→∞ g(x) = 0. Weiter existiere
f 0 (x)
.
x→∞ g 0 (x)
lim
Dann gilt
f (x)
f 0 (x)
= lim 0
.
x→∞ g(x)
x→∞ g (x)
lim
Beispiel 3.11.2 (i) Es gilt
lim
x→0
ln(1 + x)
= 1.
x
(ii) Es gilt
lim x ln x = 0.
x→0
(iii) Es sei α > 0. Dann
lim xα ln x = 0.
x→0
(iv) Es sei α > 0. Dann gilt
lim
x→∞
ln x
= 0.
xα
Beweis. Mit der Formel von L’Hospital folgt
(i) Mit Satz 3.11.1
1
ln(1 + x)
= lim
= 1.
lim
x→0 1 + x
x→0
x
(ii) Mit Satz 3.11.2
ln x
lim x ln x = lim 1 = lim (−x) = 0.
x→0
x→0
x
x→0
(iii) Mit Satz 3.11.2
1
ln x
1
x
=
lim
= lim
= 0.
x→0 x−α
x→0 (−α)x−α−1
x→0 (−α)x−α
lim xα ln x = lim
x→0
(iv)
1
ln x
1
x
=
lim
= lim
= 0.
x→∞ xα
x→∞ αxα−1
x→∞ αxα
lim
2
Manchmal kann die Regel von L’Hôpital nicht erfolgreich angewendet werden,
weil sich die Ausdrücke nicht entscheidend ändern. In dem Fall muss eine geschickte
Substitution durchgeführt werden.
3.11. DIE FORMEL VON L’HÔPITAL
203
Beispiel 3.11.3 (i)
ex + e−x
=1
x→∞ ex − e−x
lim
Beweis. Wenn wir L’Hôpital zweimal anwenden erhalten wir
ex + e−x
ex − e−x
ex + e−x
= lim x
= lim x
.
x
−x
−x
x→∞ e − e
x→∞ e + e
x→∞ e − e−x
lim
Wir erhalten also immer dieselben Ausdrücke, was zu keiner Lösung führt. Wir substituieren
y = ex .
y + y1
1 + y12
ex + e−x
=
lim
=
lim
=1
lim x
x→∞ y − 1
x→∞ 1 − 12
x→∞ e − e−x
y
y
2
Beispiel 3.11.4
(i)
ln(1 + x)
√
lim
=0
5
x→0
x
(ii)
x − ln(1 + x)
1
=
lim
2
x→0
x
2
(iii)
√
lim
x→0
1 − x − 1 + 21 x
1
=−
2
x
8
Beweis. (i)
1
4
ln(1 + x)
5x 5
√
= lim 11+x
=0
4 = lim
5
x→0
x→0 x− 5
x→0 1 + x
x
5
lim
(ii)
1
1 − 1+x
x − ln(1 + x)
= lim
= lim
x→0
x→0
x→0
x2
2x
lim
(iii)
lim
x→0
√
1+x−1
1+x
2x
1
= lim
x→0
− 1 (1 − x)− 2 +
1 − x − 1 + 12 x
= lim 2
2
x→0
x
2x
1
2
x
1+x
2x
= lim
x→0
1
1
=
2(1 + x)
2
3
− 41 (1 − x)− 2
1
=−
x→0
2
8
= lim
2
Beispiel 3.11.5 Es sei f : [0, ∞) → R
(
f (x) =
1
falls x = 0
xx
falls x > 0
(i) f ist differenzierbar auf (0, ∞) und f 0 (x) = xx (1 + ln x).
(ii) f ist auf [0, ∞) stetig.
(iii) Die rechtseitige Ableitung von f in 0 existiert nicht (sie ist −∞).
(iv) f besitzt in 0 ein lokales Maximum und in
ist.
1
e
ein lokales Minimum, das auch globales Minimum
(v) Man kann die obigen Ergebnisse benutzen, um zu entscheiden, welche der beiden Zahlen 100101
und 101100 die größere ist.
Beweis. (i) Da ln und e-Funktion differenzierbare Funktionen sind, ist auch die zusammengesetzte
Funktion xx = ex ln x differenzierbar.
204
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
2
1.8
1.6
1.4
1.2
0.5
1
1.5
2
0.8
(ii) f ist in 0 stetig.
Mit der Formel von L‘Hôpital folgt
lim (x ln x) = 0.
x→0
Also gilt
lim xx = lim ex ln x = exp( lim x ln x) = e0 = 1.
x→0
t
(iii) Für alle t ∈ (0, 1) gilt e ≤
x→0
1
1−t .
x→0
Hiermit erhalten wir
xx − 1
ex ln x − 1
=
≤
x
x
Falls
1
1−x ln x
x
−1
=
ln x
.
1 − x ln x
xx − 1
x→0
x
lim
existieren würde, so wäre die Folge
ln n1
1 − n1 ln n1
n∈N
nach unten beschränkt. Dies ist nicht der Fall, da
lim x ln x = 0
x→0
und ln n1 , n ∈ N, nicht nach unten beschränkt ist.
(iv) Die lokalen Extrema sind in 0 und 1e .
(xx )0 = (ex ln x )0 = ex ln x (1 + ln x) = xx (1 + ln x)
Wir erhalten, dass genau dann (xx )0 = 0 gilt, wenn 1 + ln x = 0 bzw. x = 1e . Genauer gilt
(xx )0 < 0
⇔
0<x<
(xx )0 = 0
⇔
x=
(xx )0 > 0
⇔
1
e
1
e
1
x>
e
Deshalb ist xx nach Lemma 3.6.2 auf [0, 1e ] streng monoton fallend und auf [ 1e , ∞) streng monoton
wachsend. Also hat xx in 0 ein lokales Maximum und in 1e ein lokales Minimum, das tatsächlich
ein globales Minimum ist.
3.11. DIE FORMEL VON L’HÔPITAL
205
(v) Da xx auf [0, 1e ] streng monoton fallend ist, gilt
1
100
1
100
Es folgen
1
100
<
101
1
101
<
1
101
1
101
.
100
und
101100 < 100101 .
2
Wir wollen nun die Folge betrachten, die durch iteriertes Potenzieren entsteht. Es sei x eine
positive Zahl. Wir betrachten die Folge
xx
x
x(x
x
)
x(x
(xx )
)
......
Beispiel 3.11.6 [2] Es sei x eine positive, reelle Zahl. Wir setzen
xn+1 = xxn
x1 = x
n∈N
Die Folge {xn }n∈N , konvergiert genau dann, wenn e−e ≤ x ≤ e1/e .
1
Falls die Folge konvergiert, dann ist der Grenzwert gleich y mit x = y y .
Falls x ≥ 1, dann ist die Folge {xn }n∈N monoton wachsend. Falls x < 1, dann ist die Folge
{x2n−1 }n∈N monoton wachsend und die Folge {x2n }n∈N monoton fallend.
Für x = e1/e konvergiert die Folge gegen e und für x = e−e gegen 1e .
1
Beweis. Wir überlegen uns, dass der Grenzwert der Folge {xn }n∈N gleich y mit x = y y ist, falls
sie konvergiert. In der Tat,
y = lim xn = lim xn+1 = lim xxn = xlimn→∞ xn = xy .
n→∞
n→∞
n→∞
Wir betrachten den Fall 1 ≤ x. Dann gilt für alle n ∈ N
xn ≤ xn+1 .
Wir zeigen dies durch Induktion. Wegen ln x < x ln x gilt x < xx .
xn−1 ≤ xn folgt mit Lemma 3.4.11, dass xxn−1 ≤ xxn also xn ≤ xn+1 .
wachsend.
Wir zeigen, dass die Folge für x mit 1 ≤ x ≤ e1/e beschränkt ist.
dass für alle n ∈ N gilt xn < e. Offensichtlich gilt x1 = x ≤ e1/e < e.
Hieraus folgt x1 ≤ x2 . Aus
Damit ist die Folge monoton
Wir zeigen durch Induktion,
Nun der Induktionsschritt.
xn+1 = xxn ≤ (e1/e )xn ≤ (e1/e )e = e.
1
Somit haben wir gezeigt, dass die Folge {xn }n∈N für 1 ≤ x ≤ e1/e gegen y mit x = y y konvergiert.
Wir wollen nun einsehen, dass die Folge nicht für x > e1/e konvergiert. Falls die Folge nämlich
1
konvergiert, dann muss x im Bild der Funktion y y liegen. Das Bild dieser Funktion ist aber
1
(0, e1/e ]. Dies folgt aus Beispiel 3.11.5: Das Bild von xx ist [e− e , ∞). Deshalb ist das Bild von
1
1
x−x gleich (0, e e ] und somit auch das Bild von y y (wir substituieren x = y1 ).
Nun der Fall 0 < x < 1. Es gilt für alle n ∈ N
(3.19)
x1 < x3 < x5 < · · · < x2n−1 < x2n < · · · < x4 < x2 .
Wir weisen dies nach. Nach Lemma 3.4.11 gilt für x mit 0 < x < 1 und 0 < s < t die Ungleichung
xt < xs . Deshalb gilt
x1 = x < xx = x2 .
206
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Nun der Induktionsschritt. Es gelte (3.19). Dann gelten x2n−1 < x2n < x2n−2 und 0 < x < 1.
Deshalb
xx2n−2 < xx2n < xx2n−1 ,
d.h.
x2n−1 < x2n+1 < x2n .
Hieraus folgt wiederum
xx2n < xx2n+1 < xx2n−1 ,
d.h.
x2n+1 < x2n+2 < x2n .
Insgesamt haben wir
x2n−1 < x2n+1 < x2n+2 < x2n
und haben damit (3.19) für alle n ∈ N gezeigt.
Somit ist die Folge {x2n }n∈N monoton fallend und beschränkt und die Folge {x2n−1 }n∈N monoton wachsend und beschränkt. Nach Satz 2.3.1 konvergieren beide Folge. Die Folge {xn }n∈N , konvergiert demnach genau dann, wenn wenn die Grenzwerte von {x2n }n∈N und {x2n−1 }n∈N gleich
sind.
Es bezeichne nun
u = lim x2n−1
und
n→∞
g = lim x2n .
n→∞
Also konvergiert {xn }n∈N , genau dann, wenn u = g gilt. Es gelten
xu = g
xg = u.
und
In der Tat, es gilt
g = lim x2n = lim xx2n−1 = xlimn→∞ x2n−1 = xu .
n→∞
n→∞
g
Ebenso folgt u = x . Somit gelten
1
1
x = gu = ug
und
x(x
g
)
u
xx = u.
=g
Wir zeigen nun, dass u = g, wenn x ∈ [e−e , 1). Dazu reicht es zu zeigen, dass es genau ein t
t
t
mit x(x ) = t gibt. Die Gleichung x(x ) = t ist äquivalent zu
xt ln x = ln t
und weiter äquivalent zu
t ln x + ln ln
1
1
= ln ln .
x
t
Wir betrachten zunächst den Fall x ∈ (e−e , 1). Falls es zwei Punkte t1 und t2 gibt, die die Gleichung
lösen, dann muss es nach dem Mittelwertsatz einen Punkt t0 geben, in dem die Funktion ln ln 1t
dieselbe Steigung wie die Gerade t ln x+ln ln x1 besitzt, nämlich ln x. Wegen e−e < x gilt −e < ln x.
Andererseits werden wir zeigen, dass die Ableitung von ln ln 1t immer kleiner oder gleich −e
ist.
d
1
1
ln ln
=−
dt
t
t ln 1t
Wir bestimmen die Extrema von der Ableitung.
d
dt
1
−
t ln 1t
=−
ln 1t − 1
(t ln 1t )2
3.11. DIE FORMEL VON L’HÔPITAL
207
Es liegt also für t = 1e ein Maximum vor. Damit ist die Ableitung von ln ln 1t immer kleiner oder
gleich −e.
Nun der Fall x = e−e . Damit ist die Gleichung
1
t
−et + 1 = ln ln
Der Punkt t = 1/e ist eine Lösung. Wir zeigen nun, dass es keine weiteren Lösungen gibt. Falls
es eine weitere Lösung gibt, dann muss es nach dem Mittelwertsatz neben t = 1/e einen weiteren
Punkt geben, in dem die Ableitung von ln ln 1t gleich −e ist. Dies ist aber nicht der Fall.
Nun zeigen wir, dass für 0 < x < e−e die Ungleichung g 6= u gilt. Dazu zeigen wir zunächst,
dass es zu x zwei Zahlen c und d mit 0 < c < 1e < d < 1, cc = dd und
1
1
x = cd = dc
(3.20)
c = xd
bzw.
d = xc
und
gibt. Zwei Zahlen c und d mit cc = dd heißen Euler Paar und zwei Zahlen a und b heißen Bernoulli
Paar, falls ab = ba . Wir benutzen nun Goldbachs Parametrisierung von Bernoulli Paaren. Wir
setzen für s ∈ (1, ∞)
s
1
1
c(s) = s 1−s
x(s) = c(s) d(s) .
d(s) = s 1−s
Dann ist das Bild von x(s) gleich (0, e−e ) und c(s)c(s) = d(s)d(s) und c(s) <
lim c(s) = lim d(s) =
s→1
s→1
1
e
lim c(s) = 0
1
e
< d(s). Es gelten
lim d(s) = 1.
s→∞
s→∞
Hieraus folgen
1
1
lim x(s) = lim c(s) d(s) = e−e
s→1
lim x(s) = lim c(s) d(s) = 0.
s→∞
s→1
s→∞
Mit dem Zwischenwertsatz für stetige Funktionen folgt, dass das Bild von x(s) gleich (0, e−e ) ist.
s
c(s)c(s) = (s 1−s )(s
s
1−s
1
)
1
= s( 1−s s
d(s)d(s) = (s 1−s )(s
1
1−s
1
1−s
)
)
Wir zeigen nun, dass aus (3.20) für alle n ∈ N
x2n−1 < c <
1
< d < x2n
e
folgt. Dies ergibt sich durch Induktion. Wir überlegen uns zunächst, dass x < c gilt. Wenn dem
1
1
nicht so wäre, dann gilt x ≥ c und somit x1 = x = c d ≤ x d < x, weil d < 1. Somit folgt auch
d = xc < xx = x2 . Damit haben wir den Induktionsanfang
x1 = x < c <
1
< d < x x = x2
e
gezeigt. Nun kommen wir zum Induktionsschritt. Wir nehmen an, dass wir
x2n−1 < c <
1
< d < x2n
e
gezeigt haben. Es gilt
x2n+1 = xx2n < xd = c
und deshalb
x2n+2 = xx2n+1 > xc = d.
2
208
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
3.12
Gleichmäßige Konvergenz
Die gleichmäßige Konvergenz ist ein wichtiger Begriff der Analysis. Wir beweisen
hier, dass die Grenzfunktion einer Folge stetiger Funktion, die gleichmäßig konvergiert, wieder stetig ist.
In Satz 5.17.1 zeigen wir, dass die Integrale einer Folge von gleichmäßig konvergierenden Funktionen gegen das Integral der Grenzfunktion konvergiert.
Definition 3.12.1 Es sei I ein Intervall in R und fn : I → R, n ∈ N, sei eine
Folge von Funktionen und f : I → R sei eine Funktion.
(i) Die Folge {fn }n∈N konvergiert punktweise gegen f , wenn für alle x ∈ I
lim fn (x) = f (x)
n→∞
gilt.
(ii) Die Folge fn , n ∈ N, konvergiert gleichmäßig gegen f , falls für alle > 0 ein
N ∈ N existiert, so dass für alle n > N und alle x ∈ I
|fn (x) − f (x)| < gilt.
In Quantorenschreibweise nimmt die gleichmäßige Konvergenz die folgende Form
an:
∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I :
|fn (x) − f (x)| < oder auch
∀ > 0 ∃N ∈ N ∀n > N :
sup |fn (x) − f (x)| < .
x∈I
Offensichtlich konvergiert eine Folge punktweise, falls sie gleichmäßig konvergiert.
Die Umkehrung gilt nicht, wie Beispiele zeigen werden. Formal besteht der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz im Vertauschen von
Quantoren
Punktweise:
Gleichmäßig:
∀x ∈ I ∀ > 0 ∃N ∈ N ∀n > N :
∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I :
|fn (x) − f (x)| < |fn (x) − f (x)| < Bei der punktweisen Konvergenz kann N von x und abhängen, bei der gleichmäßigen
Konvergenz hängt N nur von ab, N kann also gleichmäßig für alle x ∈ I gewählt
werden.
Falls eine Folge punktweise und gleichmäßig konvergiert, dann sind offensichtlich
die Grenzfunktionen für die punktweise und gleichmäßige Konvergenz gleich. Dies
kann man sich zu Nutze machen, wenn man nachweisen will, dass eine Folge, die
punktweise konvergiert, nicht gleichmäßig konvergiert. Man nimmt an, dass sie auch
gleichmäßig konvergiert. Unter dieser Annahme kennt man auch die Grenzfunktion,
dies ist nämlich der punktweise Grenzwert.
3.12. GLEICHMÄSSIGE KONVERGENZ
Die Reihe
Teilsummen
P∞
n=1
209
fn heißt gleichmäßig konvergent, falls die zugeordnete Folge der
( n
)
X
fk
k=1
n∈N
gleichmäßig konvergiert.
Man kann die gleichmäßige Konvergenz gut veranschaulichen. Man legt um die
Grenzfunktion f einen -Schlauch. Ab einem N müssen alle fn innerhalb dieses
Schlauches liegen.
f+
f
f-
f+
fn
f
f-
Lemma 3.12.1 (Cauchy-Kriterium) Es sei I ein Intervall in R und fn : I → R,
n ∈ N, sei eine Folge von Funktionen. Die Funktionenfolge {fn }n∈N , konvergiert
genau dann gleichmäßig auf einem Intervall I, falls es zu jedem > 0 ein N ∈ N
gibt, so dass für alle n, m ∈ N mit n, m > N und alle x ∈ I
|fn (x) − fm (x)| < gilt.
Beweis. Die Folge {fn }n∈N konvergiere gleichmäßig gegen eine Funktion f .
∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I : |fn (x) − f (x)| <
2
210
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Hieraus folgt
∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I :
und
|fn (x) − f (x)| <
2
|fm (x) − f (x)| < .
2
Weiter folgt
∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I :
|fn (x) − f (x)| + |fm (x) − f (x)| < .
Mit der Dreiecksungleichung folgt
∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I :
|fn (x) − fm (x)| < .
Nun die andere Richtung. Wir nehmen nun an, dass
∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I :
|fn (x) − fm (x)| < .
Dann gilt für alle x ∈ I, dass {fn (x)}n∈N , eine Cauchy-Folge ist. Da R vollständig ist,
konvergiert diese Cauchy-Folge gegen einen Grenzwert, den wir mit f (x) bezeichnen
wollen. Hierdurch definieren wir eine Funktion f : I → R mit
f (x) = lim fn (x) = f (x).
n→∞
Es gilt also
∀x ∈ I ∀ > 0 ∃Mx, ∈ N ∀m > Mx, :
|fm (x) − f (x)| < .
Wir zeigen nun, dass die Folge fn , n ∈ N, gleichmäßig gegen die Funktion f konvergiert. Es gilt
∀ > 0 ∃N ∈ N ∀n, m > N ∀x ∈ I :
|fn (x) − fm (x)| < .
Hieraus folgt mit der Dreiecksungleichung
∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I ∀m > N :
||fn (x) − f (x)| − |fm (x) − f (x)|| < und somit
∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I ∀m > N :
|fn (x) − f (x)| < + |fm (x) − f (x)|.
Zu jedem x ∈ I gibt es ein mx , so dass
|fmx (x) − f (x)| < .
Es folgt
2
∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I :
|fn (x) − f (x)| < 2.
Man kann sich leicht von dem folgenden überzeugen: Falls fn : I → R, n ∈ N,
beschränkte Funktionen sind, die gleichmäßig gegen eine Funktion f konvergieren,
dann ist auch f beschränkt.
3.12. GLEICHMÄSSIGE KONVERGENZ
211
Satz 3.12.1 Es sei I ein Intervall und fn : I → R, n ∈ N, sei eine Folge stetiger
Funktionen, die gleichmäßig gegen eine Funktion f konvergiert. Dann ist f eine
stetige Funktion.
Beweis. Da {fn }n∈N , gleichmäßig gegen f konvergiert, gilt
∀ > 0 ∃N ∈ N ∀n > N ∀x ∈ I :
|fn (x) − f (x)| < .
Da fN +1 stetig ist, gilt
∀x0 ∈ I ∀ > 0 ∃δ > 0 ∀x, |x − x0 | < δ :
|fN +1 (x) − fN +1 (x0 )| < .
Mit der Dreiecksungleichung folgt
∀x0 ∈ I ∀ > 0 ∃δ > 0 ∀x, |x − x0 | < δ :
|f (x) − f (x0 )|
≤ |f (x) − fN +1 (x)| + |fN +1 (x) − fN +1 (x0 )| + |fN +1 (x0 ) − f (x0 )| < 3.
Damit ist f stetig. 2
P
n
Lemma 3.12.2 Es sei f (x) = ∞
n=0 an (x − x0 ) eine Potenzreihe mit Konvergenzradius R (Wir lassen auch R = ∞ zu). Die Potenzreihe ist auf jedem beschränkten,
abgeschlossenen Intervall [a, b] mit [a, b] ⊂ (x0 − R, x0 + R) gleichmäßig konvergent.
Beweis. Wir zeigen, dass
∀ > 0∃N ∈ N∀n > N ∀x ∈ [a, b] :
n
∞
X
X
k
k
ak (x − x0 ) −
ak (x − x0 ) < .
k=0
k=0
Wir wählen r = max{b − x0 , x0 − a}. Dann gelten 0 < r < R und [a, b] ⊂ [x0 −
r, x0 + r]. Die Potenzreihe konvergiert absolut in x0 + r. Es gilt also
∀ > 0∃N ∀n > N :
∞
X
k=n
|ak |rk < .
Hiermit folgt für alle x mit |x − x0 | ≤ r
n
∞
∞
∞
X
X
X
X
k
k
k
ak (x − x0 ) −
ak (x − x0 ) = ak (x − x0 ) ≤
|ak |rk < .
k=0
2
k=0
k=n+1
k=n+1
212
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beispiel 3.12.1 (i) Für n ∈ N sei fn : R → R durch fn (x) = n1 gegeben. Die Folge {fn }n∈N
konvergiert gleichmäßig gegen die Funktion f = 0.
(ii) Für n ∈ N sei fn : [0, 1] → R durch fn (x) = xn gegeben. Die Folge {fn }n∈N konvergiert
punktweise gegen die Funktion f mit
(
0
für x ∈ [0, 1)
f (x) =
1
für x = 1
Die Folge konvergiert aber nicht gleichmäßig gegen f .
(iii) Für n ∈ N sei fn : [0, 1] → R durch
 2

n x
fn (x) =
− n2 x + 2n


0
x ∈ [0, n1 )
x ∈ [ n1 , n2 )
x ∈ [ n2 , 1]
Die Funktionen fn , n ∈ N, sind stetig. Die Folge konvergiert punktweise gegen f = 0, aber die
Folge konvergiert nicht gleichmäßig.
Beweis. (i) Wir wählen N so groß, dass N > 1 , bzw. N1 < . Dann gilt für alle n mit n > N und
alle x ∈ R
1
|fn (x) − f (x)| = |fn (x)| = < .
n
(ii) Für x = 0 gilt limn→∞ fn (x) = 0 und für x = 1 gilt limn→∞ fn (x) = 1. Wir betrachten nun
x mit 0 < x < 1. Die Folge xn , n ∈ N, ist eine positive, monoton fallende Folge. Somit ist sie
konvergent. Es folgt
lim xn = x lim xn−1 = x lim xn .
n→∞
n→∞
n→∞
n
Mit Beispiel 2.3.10 folgt limn→∞ x = 0.
Wir nehmen an, dass die Folge {fn }n∈N gleichmäßig gegen eine Funktion f konvergiert. Diese
Funktion muss gleich der Funktion sein, gegen die diese Folge punktweise konvergiert. Diese
Funktion ist im Punkt x = 1 nicht stetig. Dies widerspricht dem Satz 3.12.1.
Wir wollen hier auch den Nachweis führen, ohne Satz 3.12.1 zu benutzen. Wir benutzen nun
das Cauchy-Kriterium (Lemma 3.12.1). Die Negation des Cauchy-Kriteriums für die gleichmäßige
Konvergenz ist
∃ > 0∀N ∃m, n > N ∃x ∈ [0, 1] :
|fn (x) − fm (x)| ≥ .
1
Wir wählen = 41 . Zu gegebenem N wählen wir n > N , m = 2n und x = 2− n . Dann gilt
|fn (x) − fm (x)| = |xn − xm | = |xn − x2n | = | 21 − 41 | =
1
4
= .
(iii) Die Folge fn , n ∈ N, konvergiert punktweise gegen f = 0. Wir benutzen nun das CauchyKriterium (Lemma 3.12.1). Die Negation des Cauchy-Kriteriums für die gleichmäßige Konvergenz
ist
∃ > 0 ∀N ∈ N ∃m, n > N ∃x ∈ [0, 1] :
|fn (x) − fm (x)| ≥ .
Wir wählen = 1. Zu gegebenem N wählen wir n > N , m = 2n und x = n1 . Dann gilt
|fn (x) − fm (x)| = fn ( n1 ) − f2n ( n1 ) = |n − 0| = n ≥ 1 = .
2
Beispiel 3.12.2 (i) Die Folge fn : [0, ∞) → R, n ∈ N, mit
fn (x) =
x −x
e n
n2
3.12. GLEICHMÄSSIGE KONVERGENZ
213
konvergiert gleichmäßig gegen 0.
(ii) Die Folge gn : [0, ∞) → R, n ∈ N mit
gn (x) =
x −x
e n
n
konvergiert punktweise gegen 0, aber nicht gleichmäßig gegen 0.
Beweis. (i) Die Ableitung von fn ist
fn0 (x) =
x
x
1 −x
e n − 3 e− n .
n2
n
Deshalb gilt genau dann fn0 (x) > 0, wenn x < n und fn0 (x) < 0, wenn x > n. Nach Lemma 3.6.2
ist fn auf [0, n] monoton wachsend und auf [n, ∞) monoton fallend. Deshalb hat fn in x = n ein
absolutes Maximum und es gilt
1
0 ≤ fn (x) ≤ fn (n) =
.
en
(ii) Wir zeigen, dass die Folge {gn }n∈N punktweise gegen 0 konvergiert.
x
x
x −x
e n = ( lim )( lim e− n ) = 0
n→∞ n n→∞
n→∞ n
lim gn (x) = lim
n→∞
Wir beobachten, dass für alle n ∈ N die Gleichung gn (n) =
Kriterium (Lemma 3.12.1). Wir zeigen, dass
∃ > 0 ∀N ∈ N ∃m, n > N ∃x ∈ [0, 1] :
1
e
gilt. Wir benutzen nun das Cauchy-
|gn (x) − gm (x)| ≥ .
Wir wählen = 19 , n > N , m = 9n und x = n. Dann gilt
1 1 1 1 1 1
1 1
2
1
1 1
|gn (x) − gm (x)| = − e− 9 ≥ − e− 9 ≥ − ≥ − = > = .
e 9
e 9
e 9
3 9
9
9
2
Im Teil (ii) findet man wie im Teil (i) das absolute Maximum. Für unser Argument brauchen wir
aber nicht zu wissen, dass es sich um ein absolutes Maximum handelt.
Beispiel 3.12.3 [107] Die Funktion von Takagi T : R → R ist durch
T (x) =
∞
∞
X
X
1
1
k
d(2
x,
Z)
=
inf |2k x − m|
2k
2k m∈Z
k=0
k=0
gegeben. T ist stetig, aber nirgendwo differenzierbar.
Wir beschreiben, weshalb das Ergebnis wahr ist. Die Funktionen x 7→ 2−k inf m∈Z |2k x − m|
ist eine Sägezahnfunktion mit Amplitude 2−k−1 und Periode 2−k . Da die einzelnen Funktionen
stetig sind und die Reihe wegen der rasch fallenden Amplituden gleichmäßig konvergiert, ist die
Grenzfunktion stetig. Andererseits ist die Ableitung der Funktionen in einem gegebenem Punkt
entweder 1 oder −1. Die Summe dieser Ableitungen konvergiert nicht.
Lemma 3.12.3 Es seien a, b, x, an , bn reelle Zahlen, n ∈ N, so dass für alle n ∈ N die Ungleichungen a < an < x < bn < b gelten, limn→∞ an = x und limn→∞ bn = x. Es sei f : [a, b] → R
eine stetige Funktion, die in x differenzierbar ist. Dann gilt
lim
n→∞
f (bn ) − f (an )
= f 0 (x).
bn − a n
214
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Beweis. Mit
bn − x bn − an
bn − an ≤ bn − an = 1
folgt
f (bn ) − f (an )
0
− f (x)
bn − a n
bn − x f (bn ) − f (x)
x − an f (an ) − f (x)
0
0
=
− f (x) +
− f (x) bn − an
bn − x
bn − an
an − x
bn − x f (bn ) − f (x)
x
−
a
f
(a
n n ) − f (x)
0
0
≤
− f (x) + − f (x)
bn − an
bn − x
bn − an
an − x
f (bn ) − f (x)
f
(a
)
−
f
(x)
n
≤ − f 0 (x) + − f 0 (x) .
bn − x
an − x
Wegen
f (bn ) − f (x)
f (an ) − f (x)
lim − f 0 (x) + − f 0 (x) = 0
n→∞
bn − x
an − x
folgt
f (bn ) − f (an )
0
lim
− f (x) = 0.
n→∞ bn − an
2
Beweis von Beispiel 3.12.3. Wir zeigen, dass T stetig ist. Die Funktion φ : R → R mit
φ(x) = inf m∈Z |x − m| ist stetig. Wir weisen dies nach. Wir zeigen, dass für alle x ∈ R und alle
x0 ∈ R
(3.21)
|φ(x + x0 ) − φ(x0 )| = inf |x + x0 − m| − inf |x0 − m| ≤ |x|
m∈Z
m∈Z
gilt. Wir unterscheiden zwei Fälle: Der erste Fall ist
inf |x + x0 − m| − inf |x0 − m| ≥ 0.
m∈Z
m∈Z
Dann gilt
inf |x + x0 − m| − inf |x0 − m|
m∈Z
m∈Z
=
≤
inf |x + x0 − m| − inf |x0 − m|
m∈Z
m∈Z
inf (|x| + |x0 − m|) − inf |x0 − m|
m∈Z
m∈Z
= |x| + inf |x0 − m| − inf |x0 − m| = |x|.
m∈Z
m∈Z
Der zweite Fall ist
inf |x + x0 − m| − inf |x0 − m| < 0.
m∈Z
m∈Z
Dann gilt
inf |x + x0 − m| − inf |x0 − m| = − inf |x + x0 − m| + inf |x0 − m|.
m∈Z
m∈Z
m∈Z
m∈Z
Wegen
inf |x + x0 − m| ≥ inf (|x0 − m| − |x|) = −|x| + inf |x0 − m|
m∈Z
m∈Z
m∈Z
gilt
− inf |x + x0 − m| ≤ |x| − inf |x0 − m|.
m∈Z
m∈Z
3.12. GLEICHMÄSSIGE KONVERGENZ
215
Hiermit folgt
inf |x + x0 − m| − inf |x0 − m| ≤ |x|.
m∈Z
m∈Z
Damit sind auch die Funktionen φk : R → R mit φk (x) = 2−k φ(2k x) stetig. Mit dem Cauchy Kriterium für gleichmäßige
Konvergenz von Reihen (Lemma 3.12.1) folgt, dass die Reihe der stetigen
P∞
Funktionen k=0 φk gleichmäßig konvergiert.
n
n
n
m
n
X
X
X
X
X
≤
φ
(x)
−
=
φ
(x)
|φ
(x)|
≤
φ
(x)
2−k ≤ 2−m
k
k
k
k
k=0
k=m+1
k=0
k=m+1
k=m+1
Mit Satz 3.12.1 folgt, dass die Grenzfunktion stetig ist.
Wir zeigen, dass T nirgendwo differenzierbar ist. Es sei x ∈ R und wir nehmen an, dass T in
x differenzierbar ist.
Zuerst betrachten wir den Fall, dass x kein Element der Menge der dyadischen Brüche D =
{i2−n |i, n ∈ Z} ist. Dazu zählen alle irrationalen Zahlen, aber auch rationale wie 13 .
Nach Lemma 3.12.3 folgt für alle Folgen un , vn , n ∈ N, mit un < x < vn und limn→∞ vn −un =
0
T (vn ) − T (un )
lim
= T 0 (x).
n→∞
vn − un
Mit φ(x) = inf m∈Z |x − m| folgt
T (x) =
∞
∞
X
X
1
1
k
inf
|2
x
−
m|
=
φ(2k x).
k
2 m∈Z
2k
k=0
k=0
Falls u ∈ D von der Ordnung n ist, d.h. u = 2in , dann gilt für alle k ≥ n, dass 2k u ∈ Z. Da
φ(p) = 0 für p ∈ Z gilt, folgt
n−1
X 1
T (u) =
φ(2k u).
2k
k=0
Es seien un , vn aufeinander folgende Zahlen der Ordnung n in D mit un ≤ x < vn , also un = 2inn
und vn = in2+1
n . Da x nicht Element von D ist, gilt sogar un < x < vn . Weiter gelten vn − un =
(in + 1)2−n − in 2−n = 2−n und
n−1
n−1
T (vn ) − T (un ) X 1 φ(2k vn ) − φ(2k un ) X n−k
2
(φ(2k vn ) − φ(2k un )).
=
=
vn − un
2k
vn − u n
k=0
k=0
Wir zeigen nun, dass für alle 0 ≤ k < n
1 φ(2k vn ) − φ(2k un )
±2k−n
= 2n−k (φ(2k vn ) − φ(2k un )) = k−n = ±1
k
2
vn − un
2
gilt. Es gibt ein kn ∈ Z mit
(3.22)
in in + 1
,
∈ [kn , kn + 1].
2n−k 2n−k
in
Wir überlegen uns dies. Es sei kn die größte, ganze Zahl, die kleiner oder gleich 2n−k
ist. Falls
in
in +1
in
1
1
≤
(k
+1)−
gilt,
dann
gilt
≤
(k
+1)
und
es
gilt
(3.22).
Falls
>
(k
+1)−
n
n
n
2n−k
2n−k
2n−k
2n−k
2n−k
gelten würde, dann
in + 1
in
< kn + 1 < n−k .
2n−k
2
Hieraus folgt
in < 2n−k (kn + 1) < in + 1
bzw.
0 < 2n−k (kn + 1) − in < 1.
216
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Dies kann nicht sein, weil 2n−k (kn + 1) − in ∈ N. Deshalb gibt es ein jn mit 0 ≤ jn < 2n−k und
jn
in
= kn + n−k
2n−k
2
in + 1
jn + 1
= kn + n−k .
2n−k
2
Hiermit folgen
jn + 1
jn + 1
φ(2k vn ) = φ kn + n−k = φ
2
2n−k
und
k
φ(2 un ) = φ kn +
jn
2n−k
jn
=φ
2n−k
.
Es ergeben sich drei Fälle:
0≤
jn + 1
1
jn
< n−k ≤
2n−k
2
2
jn + 1
1
jn
≤ n−k < n−k ≤ 1
2
2
2
0≤
jn
1
jn + 1
< < n−k ≤ 1
2n−k
2
2
Im ersten Fall erhalten wir
φ
jn
2n−k
=
jn
φ
2n−k
und damit
=
jn + 1
2n−k
jn
1
jn + 1
− n−k = n−k .
n−k
2
2
2
φ(2k vn ) − φ(2k un ) =
Im zweiten Fall
jn
jn
= 1 − n−k
φ
2n−k
2
jn + 1
2n−k
und
und damit
φ(2k vn ) − φ(2k un ) = −
φ
jn + 1
2n−k
=1−
jn + 1
2n−k
jn + 1
jn
1
+ n−k = − n−k .
n−k
2
2
2
Der dritte Fall kann nicht eintreten: Es würde
jn < 2n−k−1 < jn + 1
0 < 2n−k−1 − jn < 1
bzw.
folgen. Dies kann nicht sein, weil k ≤ n − 1 und damit 2n−k−1 − jn ∈ N. Somit gilt für alle n ∈ N
n−1
T (vn ) − T (un ) X
=
±1.
vn − un
k=0
Wir zeigen nun,
Pn−1dass dieser Ausdruck nicht für n → ∞ konvergiert. Dazu beobachten wir, dass
die Summe k=0 ±1 für gerades n eine gerade Zahl ist und für ungerades n eine ungerade Zahl.
Es sei p die Anzahl der Summanden, die gleich 1 sind. Dann sind n − p Summanden gleich -1 und
es gilt
n−1
X
±1 = p − (n − p) = 2p − n.
k=0
Falls also n gerade ist, so ist auch 2p − n gerade und 2p − n ist ungerade, falls n ungerade ist.
Nun betrachten wir den Fall, dass x ∈ D, also x = 2jm . Wir wählen vn = x + 21n . Dann gilt
für alle n ≥ m
T (vn ) − T (x)
vn − x
=
n−1
X
k=0
=
m−1
X
k=0
n−1
1 φ(2k vn ) − φ(2k x) X n−k
=
2
(φ(2k vn ) − φ(2k x))
2k
vn − x
k=0
2n−k (φ(2k vn ) − φ(2k x)) +
n−1
X
k=m
2n−k (φ(2k vn ) − φ(2k x)).
3.13. UNSTETIGE ABLEITUNGEN
217
Es gelten für alle k mit m ≤ k ≤ n − 1, dass φ(2k x) = 0 und
1
= φ 2k−n = 2k−n .
φ(2k vn ) = φ 2k x + n
2
Hiermit folgt
m−1
X
T (vn ) − T (x)
=
2n−k (φ(2k vn ) − φ(2k x)) + (n − m).
vn − x
k=0
Wegen (3.21) gilt
|φ(2k vn ) − φ(2k x)| ≤ 2k−n .
Hiermit und der Dreiecksungleichung folgt
T (vn ) − T (x) ≥ (n − m) − m = n − 2m.
vn − x
Damit konvergiert der Differenzenquotient nicht für n gegen ∞. 2
3.13
Unstetige Ableitungen
Satz 3.13.1 Es sei f : R → R eine differenzierbare Funktion. Dann ist die Menge
der Punkte, in denen f 0 stetig ist, nicht leer. Die Menge ist eine dichte Gδ -Teilmenge
von R.
siehe Munkres, Topology.
Satz 3.13.2 Eine Funktion g : R → R hat genau dann eine Stammfunktion, wenn
die Menge ihrer Unstetigkeitsstellen eine magere Fσ -Teilmenge von R ist.
Beispiel 3.13.1 (Volterra Funktion)
218
CHAPTER 3. FUNKTIONEN EINER REELLEN VERÄNDERLICHEN
Chapter 4
Metrische Räume
Wir führen hier metrische Räume ein und besprechen deren elementare Eigenschaften. Wir untersuchen ofene, abgechlossene und kompakte Mengen. Weiter
betrachten wir stetige Abbildungen zwischen metrischen Räumen.
Normierte Räume können als metrische Räume aufgefasst werden. Insbesondere
ist der Rn mit der Euklidischen Norm für uns von Bedeutung.
4.1
Metrische Räume
Definition 4.1.1 Es sei M eine Menge. Eine Funktion d : M × M → R heißt
Metrik auf M , falls
(i) ∀x, y ∈ M : d(x, y) ≥ 0
(ii) ∀x, y ∈ M : d(x, y) = 0 ⇔ x = y
(iii) ∀x, y ∈ M : d(x, y) = d(y, x)
(iv) ∀x, y, z ∈ M : d(x, z) ≤ d(x, y) + d(y, z)
Eine Menge mit einer Metrik (M, d) heißt metrischer Raum. Die Abschätzung (iv)
nennt man Dreiecksungleichung.
In einem metrischen Raum gilt die inverse Dreiecksungleichung, d.h. für alle x, y, z ∈
M gilt
d(x, y) ≥ |d(x, z) − d(z, y)|.
Definition 4.1.2 Es sei (M, d) ein metrischer Raum, x0 ∈ M und r ≥ 0. Die
Teilmenge
B(x0 , r) = {x ∈ M |d(x, x0 ) ≤ r}
heißt (abgeschlossene) Kugel um x0 mit Radius r. Die Menge
{x ∈ M |d(x, x0 ) < r}
219
220
CHAPTER 4. METRISCHE RÄUME
nennen wir die offene Kugel um x0 mit Radius r.
Eine Teilmenge U (x0 ) von M heißt Umgebung von x0 , falls es ein r > 0 gibt, so
dass
B(x0 , r) ⊆ U (x0 ).
Definition 4.1.3 Ein Punkt x einer Menge A heißt innerer Punkt von A, wenn es
eine Umgebung U (x) gibt, so dass U (x) ⊆ A.
Eine Menge A heißt offen, wenn alle Punkte von A innere Punkte von A sind.
Eine Menge A heißt abgeschlossen, falls das Komplement Ac offen ist.
Definition 4.1.4 Der offene Kern einer Menge A ist
◦
A= {x ∈ A|x ist innerer Punkt von A}.
Definition 4.1.5 (i) Ein Punkt x0 ∈ M heißt Häufungspunkt der Menge A, falls
in jeder Umgebung U (x0 ) ein Punkt x ∈ A mit x 6= x0 liegt.
(ii) Ein Punkt x0 ∈ M heißt Häufungspunkt der Folge xn , n ∈ N, falls in jeder
Umgebung U (x0 ) unendlich viele Elemente der Folge liegen.
Beispiel 4.1.1 Es sei (M, d) ein metrischer Raum. Dann gelten
(i) ∅ und M sind offene Mengen.
(ii) ∅ und M sind abgeschlossene Mengen.
(iii) Für alle r > 0 und alle x0 ∈ M ist B(x0 , r) = {x|d(x0 , x) ≤ r} eine abgeschlossene Menge.
(iv) Für alle r > 0 und alle x0 ∈ M ist {x|d(x0 , x) < r} eine offene Menge.
Beweis. (i) Die leere Menge besitzt keine Punkte. Deshalb ist jeder Punkt der leeren Menge ein
innerer Punkt.
M ist Umgebung aller ihrer Punkte und damit offen.
(ii) Da ∅ und M offen sind, sind deren Komplemente abgeschlossen.
(iii) Wir müssen zeigen, dass
B(x0 , r)c = {x|d(x0 , x) > r}
eine offene Menge ist. Es sei y ∈ B(x0 , r)c , also d(y, x0 ) > r. Wir zeigen, dass y innerer Punkt der
Menge B(x0 , r)c ist. Dazu weisen wir nach, dass
d(y, x0 ) − r
⊆ B(x0 , r)c
B y,
2
gilt. Es sei
d(y, x0 ) − r
x ∈ B y,
.
2
Falls x = y, dann gilt y ∈ B(x0 , r)c . Nun der Fall x 6= y. Dann gelten 0 < d(x, y) und
d(x, y) ≤
d(y, x0 ) − r
.
2
Somit
r < r + d(x, y) ≤ d(y, x0 ) − d(x, y) ≤ d(x0 , x).
2
4.1. METRISCHE RÄUME
221
Beispiel 4.1.2 (i) (R, d) mit d(x, y) = |x − y| ist ein metrischer Raum.
(ii) Es sei M eine Menge und
(
d(x, y) =
0
falls x = y
1
falls x 6= y
Dann ist (M, d) ein metrischer Raum. Weiter gelten
◦
B(x0 , 1) = R
B (x0 , 1) = R
{x|d(x0 , x) < 1} = {x0 }
Die Metrik (ii) heißt diskrete Metrik. Sie wird manchmal auch als Metrik des
öffentlichen Nahverkehrs bezeichnet. Als Abstand zwischen zwei Punkten wird der
Fahrpreis genommen. In manchen Städten wird ein Einheitspreis erhoben.
Man könnte vermuten, dass
◦
B (x0 , r) = {x|d(x0 , x) < r}
gilt. Dies ist i.A. falsch. Dazu das nächste Beispiel.
Offene Kugeln sind offene Mengen und abgeschlossene Kugeln sind abgeschlossene
Mengen. Man beachte, dass der Abschluss einer offenen Kugel {x|d(x, y) < r} in
der abgeschlossenen Kugel {x|d(x, y) ≤ r} enthalten ist, i.A. aber keine Gleichheit
herrscht. Wir geben dazu ein Beispiel an.
Beispiel 4.1.3 Es sei M = {−1, 0} ∪ (−∞, −2] ∪ ( 12 , 1) ∪ (1, ∞) und d sei die Metrik, die durch
d(x, y) = |x − y| definiert ist. Dann gelten
(i) {x|d(0, x) < 1} =
6 {x|d(0, x) ≤ 1}.
(ii) {x|d(0, x) < 1} ist offen. Diese Menge ist keine offene Kugel, d.h. für alle y und r > 0 gilt
{x|d(0, x) < 1} =
6 {x|d(y, x) ≤ r}.
(iii) {x|d(0, x) < 1} ist abgeschlossen, aber keine abgeschlossene Kugel, d.h. für alle y and r > 0
gilt {x|d(0, x) < 1} =
6 {x|d(y, x) ≤ r}.
Beweis. Es gelten {x|d(0, x) < 1} = {0} ∪ ( 12 , 1),
1
{x|d(0, x) < 1} = {−1, 0} ∪ ( , 1)
2
und
{x|d(0, x) < 1} = B(0, 1).
Beispiel 4.1.4 Die reellen Zahlen R seien mit den Metriken d1 (s, t) = |s − t| und
s
t d2 (s, t) = −
.
1 + |s| 1 + |t| ausgestattet. Die offenen Mengen in (R, d1 ) und (R, d2 ) sind dieselben, (R, d1 ) ist vollständig,
aber (R, d2 ) ist nicht vollständig. Die Folge n, n ∈ N, ist eine Cauchy Folge in (R, d2 ), die nicht
konvergiert.
222
CHAPTER 4. METRISCHE RÄUME
Lemma 4.1.1 Es sei (M, d) ein metrischer Raum.
(i) Die Vereinigung von offenen Mengen ist offen.
(ii) Der Durchschnitt abgeschlossener Mengen ist abgeschlossen.
(iii) Der Durchschnitt endlich vieler offener Mengen ist offen.
(iv) Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen.
Beweis. (i) Oι , ι ∈ I, seien offene Mengen. Wir zeigen, dass auch
[
Oι
ι∈I
S
offen ist. Es sei x ∈ ι∈I Oι . Dann gibt es ein ι0 mit x ∈ Oι0 . Da Oι0 eine offene
Menge
S ist, gibt es eine Umgebung U (x) mit U (x) ⊆ Oι0 . Also ist x innerer Punkt
von ι∈I Oι .
T
(ii) Aι , ι ∈ I seien abgeschlossene Mengen. Wir zeigen, dass ι∈I Aι abgeschlossen
ist. Da Aι abgeschlossen ist, ist Acι offen. Nach (i) ist
[
Acι
ι∈I
offen. Mit der Regel von deMorgan folgt
!c
[
\
c
Aι
=
Aι
ι∈I
ι∈I
abgeschlossen. 2
Definition 4.1.6 Der Abschluss Ā einer Teilmenge A eines metrischen Raumes ist
der Durchschnitt aller abgeschlossenen Mengen, die A enthalten.
Nach Lemma ?? ist der Abschluss einer Menge abgeschlossen. Der Abschluss einer
Menge A ist die kleinste abgeschlossene Menge, die die Menge A umfasst.
Definition 4.1.7 Es sei (M, d) ein metrischer Raum. Eine Teilmenge A von M
heißt dicht in M , wenn Ā = M .
Der Rand einer Menge A ist
◦
∂A = A\ A .
Lemma 4.1.2 Es sei A eine Teilmenge eines metrischen Raumes (M, d). Dann
sind äquivalent:
(i) A ist abgeschlossen.
(ii) A = Ā
(iii) A enthält alle ihre Häufungspunkte.
4.1. METRISCHE RÄUME
223
Beweis. (i) ⇒ (ii) Offenbar gilt immer A ⊆ Ā. Der Abschluss der Menge A ist der
Durchschnitt aller abgeschlossenen Mengen, die A als Teilmenge enthalten. Da aber
A selbst abgeschlossen ist und sich als Teilmenge enthält ist sie selbst eine solche
Menge, über die der Durchschnitt gebildet wird. Also gilt Ā = A.
(ii) ⇒ (i) Ā ist der Durchschnitt aller abgeschlossenen Mengen, die A enthalten.
Nach Lemma 4.1.1 ist der Durchschnitt abgeschlossener Mengen abgeschlossen, also
ist Ā abgeschlossen. Da A = Ā gilt, ist also A abgeschlossen.
(i) ⇒ (iii) Wir zeigen, dass x ∈ A, falls x Häufungspunkt von A ist, bzw. dass
x kein Häufungspunkt von A ist, falls x ∈
/ A.
c
c
Falls x ∈
/ A, dann x ∈ A . A ist eine offene Menge, weil A eine abgeschlossene
Menge ist. Also gibt es eine Umgebung U (x) mit U (x) ⊆ Ac und x ist kein
Häufungspunkt von A.
(iii) ⇒ (i) Wir zeigen, dass A nicht alle ihre Häufungspunkte enthält, falls A
nicht abgeschlossen ist. Es sei also A nicht abgeschlossen. Dann ist Ac nicht offen.
Dann gibt es einen Punkt x ∈ Ac , der nicht innerer Punkt von Ac ist. Somit gilt
∀U (x) : U (x) * Ac .
Also
∃x ∈ Ac ∀U (x) : U (x) ∩ A 6= ∅
Also ist x ein Häufungspunkt von A, der nicht in A enthalten ist. 2
Beispiel 4.1.5 Es seien die reellen Zahlen R mit der Metrik d(x, y) = |x − y| ausgestattet. Dann
gilt Q = R.
Definition 4.1.8 (i) Eine Folge {xn }n∈N in einem metrischen Raum (M, d) heißt
konvergent gegen x, falls es für alle > 0 ein N ∈ N gibt, so dass für alle n > N
d(x, xn ) < gilt.
(ii) Eine Folge {xn }n∈N in einem metrischen Raum (M, d) heißt Cauchy Folge, falls
es für alle > 0 ein N ∈ N existiert, so dass für alle n, m > N
d(xn , xm ) < gilt.
(iii) Eine Teilmenge eines metrischen Raumes heißt vollständig, falls jede Cauchy
Folge dieser Menge in ihr konvergiert.
Lemma 4.1.3 (i) Eine vollständige Teilmenge eines metrischen Raumes ist abgeschlossen.
(ii) Eine abgeschlossene Teilmenge eines vollständigen, metrischen Raumes ist vollständig.
224
CHAPTER 4. METRISCHE RÄUME
Beweis. (i) Es sei (M, d) ein metrischer Raum. Wir zeigen, dass eine Teilmenge A
nicht vollständig ist, wenn sie nicht abgeschlossen ist. Wir nehmen also an, dass die
Menge A nicht abgeschlossen ist. Dann gilt A 6= M und Ac ist nicht offen. Es gibt
folglich ein x ∈ Ac , das nicht innerer Punkt von Ac ist.
Deshalb gilt für alle n ∈ N
B(x, n1 ) ∩ A 6= ∅.
Also gibt es für jedes n ∈ N ein xn ∈ B(x, n1 ) ∩ A. Somit
lim xn = x,
n→∞
aber der (eindeutige) Grenzwert liegt nicht in A.
(ii) Es sei (M, d) ein vollständiger, metrischer Raum und A eine abgeschlossene
Teilmenge. Weiter sei {xn }n∈N eine Cauchy Folge in A. Da (M, d) vollständig ist,
konvergiert die Folge in M .
x0 = lim xn
n→∞
Wir zeigen nun, dass x0 ∈ A. Falls x0 ∈ Ac , dann gibt es eine Umgebung U (x0 ) von
x0 mit U (x0 ) ⊆ Ac und die Folge kann nicht gegen x0 konvergieren. 2
Definition 4.1.9 Eine Familie von offenen Mengen Oi , i ∈ I, heißt offene Überdeckung
einer Menge K, falls
[
K⊆
Oi .
i∈I
Eine endliche Teilüberdeckung einer offenen Überdeckung Oi , i ∈ I, von K ist eine
endliche Teilfamilie Oi1 , . . . , Oin mit
K ⊆ Oi1 ∪ · · · ∪ Oin .
Eine Teilmenge K eines metrischen Raumes heißt kompakt, falls jede offene Überdeckung
eine endliche Teilüberdeckung besitzt, d.h.
[
K⊆
Oi
=⇒
∃n ∈ N∃i1 , . . . , in : K ⊆ Oi1 ∪ Oi2 ∪ · · · ∪ Oin .
i∈I
Beispiel 4.1.6 (i) Die Teilmenge { n1 |n ∈ N} von R ist nicht kompakt.
(ii) Die Teilmenge {0} ∪ { n1 |n ∈ N} von R ist kompakt.
Beweis. (i) Wir wählen
1
1
Mn = x d x,
< 2
n
4n
Dann ist Mn , n ∈ N, eine offene Überdeckung, aber es gibt keine endliche Teilüberdeckung. Dies
gilt, weil für alle m 6= n
m∈
/ Mn
4.1. METRISCHE RÄUME
225
gilt. Wir prüfen dies nach.
d
1 1
,
n m
1
1
= − n m
Das Minimum wird hier für m = n + 1 angenommen. Also gilt
1 1
1
1
d
,
≥
> 2
n m
n(n + 1)
4n
(ii) Es sei Oi , i ∈ I, eine offene Überdeckung. Dann gibt es ein Oi0 mit 0 ∈ Oi0 . Dann gibt es ein
> 0 mit
B(0, ) ⊆ Oi0
Dann gilt weiter
Weiter gibt es für n ∈ N mit
1
n
1 1
< ⊆ Oi0
n n
≥ eine Menge Oin mit
1
∈ Oin
n
Damit ist die Familie
Oi0 , Oi1 , . . . , Oi[ 1 ]
eine endliche Teilüberdeckung. 2
Definition 4.1.10 Eine Teilmenge K eines metrischen Raumes heißt total beschränkt,
falls es zu jedem > 0 endlich viele Kugeln B(x1 , ), . . . , B(xn , ) mit demselben Radius gibt, so dass
n
[
K⊆
B(xi , )
i=1
gilt.
Man beachte, dass wir in der Definition der totalen Beschränktheit nicht gefordert
wird, dass die Mittelpunkte der Kugeln Elemente der Menge K sind. In der Literatur
findet man auch diese Definition. Tatsächlich sind beide Definitionen äquivalent.
Satz 4.1.1 Es sei (M, d) ein metrischer Raum und K eine Teilmenge dieses metrischen
Raumes. Dann sind äquivalent:
(i) K ist kompakt.
(ii) (Bolzano-Weierstraß) Jede Folge in K hat eine Teilfolge, die in K konvergiert.
(iii) K ist vollständig und total beschränkt.
Beweis. (i) ⇒ (ii). Tatsächlich zeigen wir ¬(ii) ⇒ ¬(i). Es sei {xn }n∈N eine Folge
in K, die keine Teilfolge hat, die in K konvergiert. Dann gibt es zu jedem x ∈ K eine
Kugel B(x, x ), in der höchstens endlich viele Elemente der Folge {xn }n∈N liegen.
Wir prüfen dies nach.
Dazu nehmen wir an, dass es ein x ∈ K gibt, so dass für alle > 0 unendlich viele
Elemente der Folge in B(x, ) liegen. Wir konstruieren nun eine Teilfolge, die gegen
x konvergiert. Wir finden eine Teilfolge xnk , k ∈ N, mit d(x, xnk ) < k1 . Wir wählen
226
CHAPTER 4. METRISCHE RÄUME
als xn1 ein Element der Folge, das in B(x, 1) liegt. Wenn die ersten k Elemente
1
) mit
xn1 , . . . , xnk der Teilfolge gewählt sind, dann wählen wir ein xnk+1 ∈ B(x, k+1
1
nk < nk+1 . Dies ist möglich, weil in B(x, k+1 ) unendlich viele Elemente der Folge
liegen. Die so konstruierte Teilfolge konvergiert gegen x. Dies ist ein Widerspruch.
Die Familie
◦
x∈K
B (x, x )
ist eine offene Überdeckung von K. Sie besitzt keine endliche Teilüberdeckung, weil
in jeder der Mengen nur endlich viele Elemente der Folge enthalten sind.
(ii) ⇒ (iii) Wir zeigen: Falls K nicht vollständig ist oder nicht total beschränkt
ist, dann gibt es in K eine Folge, die keine in K konvergente Teilfolge besitzt.
Wir nehmen zunächst an, dass K nicht vollständig ist. Dann gibt es eine CauchyFolge in K, die nicht in K konvergiert. Diese Cauchy-Folge besitzt auch keine
Teilfolge, die in K konvergiert, weil sonst bereits die Cauchy-Folge selbst in K
konvergieren würde.
Wir nehmen nun an, dass K nicht total beschränkt ist. Dann gibt es ein > 0,
so dass für alle k ∈ N und alle xn1 , . . . , xnk ∈ K
K*
k
[
B(xni , )
i=1
gilt. Nun wählen wir eine Folge xn ∈ K, n ∈ N, so dass für alle n, m ∈ N
d(xn , xm ) > gilt. Wir wählen x1 ∈ K. Wenn x1 , . . . , xn gewählt sind, dann wählen wir xn+1 in
der Menge
n
[
K\
B(xj , )
j=1
Diese Menge ist nicht leer. 2
Korollar 4.1.1 Eine kompakte Menge ist abgeschlossen.
Beweis. Wegen Satz 4.1.1 ist eine kompakte Menge vollständig. Nach Lemma 4.1.3
ist eine vollständige Menge abgeschlossen. 2
4.2
Vervollständigung metrischer Räume
4.3
Normierte Räume
Definition 4.3.1 Es sei X ein Vektorraum über R oder C. Eine Norm auf X ist
eine Funktion
k k : X → [0, ∞)
4.3. NORMIERTE RÄUME
227
so dass
(i) für alle x ∈ X und alle t ∈ K (R, C)
ktxk = |t| kxk
(ii) x = 0 genau dann, wenn kxk = 0.
(iii) für alle x, y ∈ X
kx + yk ≤ kxk + kyk
gilt. (X, k k) heißt normierter Raum.
In normierten Räumen gilt die umgekehrte Dreiecksungleichung
∀x, y ∈ X :
|kxk − kyk| ≤ kxk + kyk.
Wir beobachten, dass d : X × X → [0, ∞)
d(x, y) = kx − yk
eine Metrik auf X ist. Damit übertragen sich Begriffe und Eigenschaften metrischer
Vektorräume auf normierte Vektorräume. Ein normierter Raum ist vollständig,
wenn jede Cauchy Folge konvergiert. Ein vollständiger, normierter Raum heißt
Banachraum.
Die Kugel um x0 ∈ X mit Radius r ≥ 0 ist die Menge
B(x0 , r) = {x|kx − x0 k ≤ r}.
Eine Menge A in einem normierten Raum heißt beschränkt, wenn es ein r > 0 mit
A ⊆ B(0, r)
gibt.
Lemma 4.3.1 Es sei X ein normierter Raum und es gelte
x = lim xn .
n→∞
Dann gilt
kxk = lim kxn k.
n→∞
Beweis. Es gilt
∀ > 0∃N ∈ N∀n > N :
kx − xn k < .
Hieraus folgt sofort mit der umgekehrten Dreiecksungleichung
∀ > 0∃N ∈ N∀n > N :
|kxk − kxn k| < .
Auf dem Rn betrachten wir die Norm
kxk =
n
X
i=1
! 21
|xi |2
=
√
< x, x >.
Diese Norm bezeichnet man als Euklidische Norm .
228
CHAPTER 4. METRISCHE RÄUME
Lemma 4.3.2 k · k ist eine Norm auf dem Rn und es gilt für alle x, y ∈ Rn
| < x, y > | ≤ kxkkyk.
Die Ungleichung wird als Ungleichung von Cauchy-Schwarz bezeichnet.
Beweis. Offensichtlich gilt kxk ≥ 0 und falls x 6= 0, dann gilt kxk > 0. Für alle
t ∈ R und alle x ∈ Rn gilt
ktxk =
n
X
i=1
! 12
|txi |2
= |t|
n
X
i=1
! 12
|xi |2
= |t|kxk.
Wir zeigen nun, dass für alle x, y ∈ Rn die Ungleichung | < x, y > | ≤ kxkkyk gilt.
Die Behauptung ist offensichtlich, falls y = 0. Wir können also annehmen, dass
y 6= 0.
< x, y >
< x, y >
y, x −
y
0
≤ x−
< y, y >
< y, y >
< x, y >2 < x, y >2
< x, y >2
=< x, x > −2
+
=< x, x > −
< y, y >
< y, y >
< y, y >
Damit folgt für alle x, y ∈ Rn
< x, y >2 ≤< x, >< y, y >= kxk2 kyk2 .
Nun weisen wir die Dreiecksungleichung nach. Für alle x, y ∈ Rn gilt
kx + yk2 =< x + y, x + y >=< x, x > +2 < x, y > + < y, y > .
Mit der Cauchy-Schwarz Ungleichung folgt
kx + yk2 ≤ kxk2 + 2kxkyk + kyk2 = (kxk + kyk)2 .
2
Beispiel 4.3.1 Es werden auch durch
kxk1 =
n
X
i=1
|xi |
kxk∞ = max |xi |
1≤i≤n
Normen auf dem Rn definiert.
Lemma 4.3.3 Eine Folge {xk }k∈N im Rn ist genau dann konvergent, wenn alle
Folgen der Koordinaten {xk (i)}k∈N , i = 1, . . . , n, konvergieren.
Außerdem ist eine Folge {xk }k∈N im Rn ist genau dann eine Cauchy Folge, wenn
alle Folgen der Koordinaten {xk (i)}k∈N , i = 1, . . . , n, Cauchy Folgen sind.
4.3. NORMIERTE RÄUME
229
Beweis. Wir nehmen an, dass die Folge {xk }k∈N konvergiert. Also gibt es ein x0 ,
so dass für alle ein N existiert, so dass für alle k mit k > N gilt
kx0 − xk k < .
Also gilt für alle i = 1, . . . , n
> kx0 − xk k =
n
X
i=1
! 21
|x0 (i) − xk (i)|2
≥ |x0 (i) − xk (i)|.
Wir nehmen nun umgekehrt an, dass für alle i = 1, . . . , n gilt:
∀∃Ni ∈ N∀k > Ni :
|x0 (i) − xk (i)| < .
Wir wählen nun N = max1≤i≤n Ni . Dann gilt
∀∃N ∈ N∀k > N :
n
X
i=1
|x0 (i) − xk (i)|2 < n2 .
Hieraus folgt
∀∃N ∈ N∀k > N :
v
u n
uX
√
t
|x0 (i) − xk (i)|2 < n.
i=1
2
Korollar 4.3.1 Der Rn mit der Euklidischen Norm ist vollständig.
Beweis. Nach Lemma 4.3.3 reicht es zu zeigen, dass die Koordinatenfolgen konvergieren. Dies gilt aber, weil R vollständig ist (Satz 2.3.2). 2
Definition 4.3.2 Wir sagen, dass zwei Normen k k1 und k k2 auf einem Vektorraum X äquivalent sind, wenn es Konstanten c1 und c2 gibt, sa dass für alle x ∈ X
c1 kxk1 ≤ kxk2 ≤ c2 kxk1
gilt.
Beispiel 4.3.2 Wir betrachten auf dem Rn die Normen
kxk1 =
n
X
i=1
|xi |
Dann gilt für alle x ∈ Rn
kx||2 =
n
X
i=1
! 21
|xi |
2
1
√ kxk1 ≤ kxk2 ≤ kxk1
n
√
kxk∞ ≤ kxk2 ≤ nkxk∞
kxk∞ = max |xi |.
1≤i≤n
230
CHAPTER 4. METRISCHE RÄUME
Beweis. Es sei
ei = (0, . . . , 0, 1, 0, . . . , 0)
i = 1, 2, . . . , n
n
die Standardbasis im R . Dann folgt mit der Dreieckungleichung
n
n
X
X
kxk = xi ei ≤
|xi |kei k = kxk1 .
i=1
i=1
Mit der Cauchy-Schwarz Ungleichung
n
X
i=1
|xi | ≤ k(1, . . . , 1)k2 kxk2 =
√
nkxk2 .
Für alle x ∈ Rn und j = 1, . . . , n gilt
n
X
kxk2 =
i=1
! 21
|xi |
2
≥ |xj |.
Also
kxk2 ≥ kxk∞ .
Weiter
kxk2 =
n
X
i=1
! 21
|xi |2
≤
n
X
i=1
! 12
| max |xj ||2
≤
1≤j≤n
√
nkxk∞ .
2
Lemma 4.3.4 Eine Teilmenge des Rn mit der Euklidischen Norm ist genau dann
beschränkt, wenn sie total beschränkt ist.
Satz 4.3.1 Eine Teilmenge des Rn mit der Euklidischen Norm ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist.
Beweis. Nach Satz 4.1.1 ist eine kompakte Menge vollständig und total beschränkt.
Wegen Korollar 4.1.1 ist sie also abgeschlossen. Außerdem ist eine total beschränkte
Menge nach Lemma 4.3.4 beschränkt.
Nach Lemma 4.3.4 ist eine beschränkte Menge total beschränkt. Nach Lemma
4.1.3 ist eine abgeschlossene Teilmenge eines vollständigen, metrischen Raumes vollständig.
Nun wenden wir wieder Satz 4.1.1 an. 2
Beispiel 4.3.3 Es sei der Rn ausgestattet mit der Euklidischen Norm. Dann ist die abgeschlossene
Einheitskugel kompakt.
Beispiel 4.3.4 Wir bezeichnen
(
`2 =
x=
{x(i)}∞
i=1
)
∞
X
2
|x(i)| < ∞
∀i ∈ N : x(i) ∈ R ∧
i=1
Dann gelten
(i) `2 ist ein Vektorraum über dem Körper R.
(ii) Es sei die Abbildung k k2 : `2 → R für x ∈ `2 durch
kxk2 =
∞
X
i=1
! 21
2
|x(i)|
4.3. NORMIERTE RÄUME
231
definiert. k k2 ist eine Norm auf `2 .
(iii) Die Einheitskugel in `2
B2 (0, 1) = {x ∈ `2 |kxk2 ≤ 1}
ist beschränkt, nicht total beschränkt und nicht kompakt.
Beweis. (i) Wir zeigen, dass mit x, y ∈ `2 auch x + y ∈ `2 : Für alle n ∈ N gilt
! 12
! 12
! 21
n
n
n
X
X
X
2
2
2
≤
+
|x(i) + y(i)|
|x(i)|
|y(i)|
i=1
i=1
∞
X
≤
i=1
i=1
! 21
|x(i)|2
∞
X
+
i=1
! 21
|y(i)|2
<∞
Es folgt
∞
X
i=1
! 21
2
<∞
|x(i) + y(i)|
(ii) Wir zeigen die Dreiecksungleichung. Für alle n ∈ N gilt
! 12
! 12
n
n
X
X
2
2
≤
|x(i)|
+
|x(i) + y(i)|
n
X
i=1
i=1
∞
X
≤
i=1
i=1
! 12
|x(i)|
2
∞
X
+
i=1
! 21
2
|y(i)|
! 12
|y(i)|
2
Es folgt
∞
X
i=1
! 12
|x(i) + y(i)|
2
≤
(iii) Wir betrachten die Folge {en }n∈N mit
∞
X
i=1
en (i) =
Dann gilt für n 6= m
! 21
|x(i)|
0
1
2
+
∞
X
i=1
! 21
|y(i)|
2
i 6= n
i=n
ken − em k2 =
√
2.
Wir nehmen an, dass die abgeschlossene Einheitskugel total beschränkt ist. Dann gibt es endlich
viele Kugeln B(x1 , 14 ), . . . , B(xN , 14 ) mit
B(0, 1) ⊆
N
[
B(xi , 41 )
i=1
1
4 ),
Also gibt es eine Kugel B(xi0 ,
die mindestens zwei verschiedene Vektoren en und em enthält.
Mit der Dreiecksungleichung folgt
√
1
2 = ken − em k ≤ ken − xi0 k + kxi0 − em k ≤
2
Dies ist ein Widerspruch. 2
Wir sagen, dass die Menge M die Konvergenzmenge der Reihe
(
)
∞
X
M = x ∈ Rn ∃π : x =
xπ(k) .
k=1
Einen Beweis für den folgenden Satz findet man in [48].
P∞
k=1
xk ist, wobei
232
CHAPTER 4. METRISCHE RÄUME
Satz 4.3.2 (E. Steinitz) Die Konvergenzmenge einer Reihe ist die leere Menge oder
sie ist von der Form x0 + L, wobei x0 ∈ Rn und L ein Teilraum von Rn ist.
Dies ist eine Verallgemeinerung des Umordnungssatzes von Riemann.
Beispiel 4.3.5 (i) Der Raum der stetigen Funktionen C[a, b] mit der Norm
kf k = max |f (x)|
x∈[a,b]
ist ein Banachraum. Die abgeschlossene Einheitskugel ist nicht kompakt.
(ii) Der Raum der beschränkten Folgen
∞ `∞ = (x(i))i=1 sup |x(i)| < ∞
i∈N
mit der Norm
kxk∞ = sup |x(i)|
i∈N
ist ein Banachraum.
(iii) Der Raum aller konvergenten Folgen
n
o
c = (x(i))∞
i=1 lim xi existiert
i→∞
mit der Norm
kxk∞ = sup |x(i)|
i∈N
ist ein Banachraum. c ist ein abgeschlossener Teilraum von `∞ .
(iv) Der Raum aller gegen 0 konvergenten Folgen
o
n
c0 = (x(i))∞
lim
x(i)
=
0
i=1
i→∞
mit der Norm
kxk∞ = sup |x(i)|
i∈N
ist ein Banachraum. c0 ist ein abgeschlossener Teilraum von c und `∞ .
Beweis. (i) Wir zeigen, dass die abgeschlossene Einheitskugel von C[a, b] nicht kompakt ist.
Dazu geben wir eine Folge {hn }n∈N in C[a, b] an, die keine Teilfolge besitzt, die konvergiert. Um
die Notationen einfacher zu halten, machen wir dies für a = 0 und b = 1. Wir definieren hn ,
1
so dass hn auf den Intervallen [0, n+1
] und [ n1 , 1] den Wert 0 annimmt. Außerdem setzen wir
1
1
1
hn ( 2 ( n+1 + n )) = 1 und alle übrigen Funktionswerte sind zwischen 0 und 1. Dann gilt für alle
n ∈ N, dass khn k∞ = 1 und für alle n 6= m
khn − hm k∞ = 1.
Wir weisen die Vollständigkeit nach. Es sei {fn }n∈N eine Cauchy Folge in C[a, b]. Dann gilt
∀ > 0∃N ∈ N∀n, m ≥ N : sup |fn (x) − fm (x)| < x∈[a,b]
Es folgt
∀ > 0∃N ∈ N∀n, m ≥ N ∀x ∈ [a, b] : |fn (x) − fm (x)| < 4.4. STETIGE ABBILDUNGEN ZWISCHEN METRISCHEN RÄUMEN
233
Insbesondere ist für alle x ∈ [a, b] die Folge {fn (x)}n∈N eine Cauchy Folge. Da R vollständig ist,
konvergiert diese Folge. Wir setzen
f (x) = lim fn (x).
n→∞
Wir zeigen, dass die Folge {fn }n∈N gleichmässig gegen f konvergiert. Es gilt
∀ > 0∃N ∈ N∀n ≥ N ∀x ∈ [a, b]∀m ∈ N :
|fn (x) − fm (x)| < Es folgt
∀ > 0∃N ∈ N∀n ≥ N ∀x ∈ [a, b] :
|fn (x) − f (x)| < .
Nach Analysis I ist die Grenzfunktion einer Folge von stetigen Funktionen, die gleichmässig konvergiert, stetig.
(ii) Es sei xn , n ∈ N, eine Cauchy Folge in `∞ . Dann ist für jedes i ∈ N die Folge der
Koordinaten xn (i), n ∈ N, eine Cauchy Folge in R. Somit existieren
x(i) = lim xn (i).
n→∞
Weil xn , n ∈ N, eine Cauchy Folge ist, ist x eine beschränkte Folge, also in `∞ . Wir zeigen nun,
dass xn , n ∈ N, in `∞ gegen x konvergiert. Für alle > 0 existiert ein N , so dass für alle n, m mit
n, m ≥ n
kxn − xm k∞ < Somit gibt es zu jedem > 0 ein N , so dass für alle n, m ≥ N und alle i ∈ N
|xn (i) − xm (i)| < gilt, bzw. zu jedem > 0 ein N , so dass für alle n ≥ N , alle i ∈ N und alle m ≥ N
|xn (i) − xm (i)| < gilt. Nun können wir zu jedem i die Zahl m so groß wählen, dass |xm (i) − xi | < . (Die Zahl m
hängt also von i ab.) Es folgt, dass zu jedem > 0 ein N existiert, so dass für alle n ≥ N und alle
i∈N
|xn (i) − x(i)| < 2.
4.4
Stetige Abbildungen zwischen metrischen Räumen
Definition 4.4.1 Es seien (X, dX ) und (Y, dY ) zwei metrische Räume. Eine Funktion f : X → Y ist in einem Punkt x0 ∈ X stetig, falls
∀ > 0∃δ > 0∀x ∈ X, dX (x, x0 ) < δ :
dY (f (x), f (x0 ) < .
Wir sagen, dass die Funktion stetig ist, wenn sie in allen Punkten stetig ist.
Satz 4.4.1 Es seien (X, dX ) und (Y, dY ) zwei metrische Räume. Eine Funktion
f : X → Y ist genau dann in einem Punkt x0 ∈ X stetig, falls für alle Folgen
{xn }n∈N , mit limn→∞ xn = x0
lim f (xn ) = f (x0 )
n→∞
gilt.
234
CHAPTER 4. METRISCHE RÄUME
Lemma 4.4.1 (i) Es sei (X, d) ein metrischer Raum und x0 ∈ X. Es seien f, g :
X → R Funktionen, die in x0 stetig sind. Dann sind auch f + g und f · g in x0
stetig.
(ii) Es seien (X, dX ), (Y, dY ) und (Z, dZ ) metrische Räume. Die Funktion f : X →
Y, d sei in x0 stetig und g : Y → Z sei in f (x0 ) stetig. Dann ist g ◦ f in x0 stetig.
Das Urbild f −1 (U ) einer Menge U ist {x|f (x) ∈ U }.
Satz 4.4.2 Es seien (X, dX ) und (Y, dY ) zwei metrische Räume und f : X → Y .
Dann sind äquivalent.
(i) f ist stetig.
(ii) Das Urbild jeder offenen Menge ist eine offene Menge.
(iii) Das Urbild jeder abgeschlossenen Menge ist abgeschlossen.
Beweis. (i) ⇒ (ii). Es sei U eine offene Teilmenge von Y . Falls f −1 (U ) die leere
Menge ist, so ist f −1 (U ) = ∅ auch offen. Wir können also annehmen, dass f −1 (U )
nicht die leere Menge ist. Wir zeigen nun, dass f −1 (U ) offen ist.
Es sei x0 ∈ f −1 (U ). Dann gilt f (x0 ) ∈ U . Da U offen ist, existiert ein > 0, so
dass
{y|dY (y, f (x0 )) < } ⊆ U.
Weil f stetig ist, existiert ein δ > 0, so dass
{f (x)|dX (x, x0 ) < δ} ⊆ {y|dY (y, f (x0 )) < }.
Also gilt
{x|dX (x, x0 ) < δ} ⊆ f −1 ({f (x)|dX (x, x0 ) < δ})
⊆ f −1 ({y|dY (y, f (x0 )) < }) ⊆ f −1 (U )
und x0 ist ein innerer Punkt. Also ist f −1 (U ) eine offene Menge.
(i) ⇐ (ii). Es sei x0 ∈ X und > 0. Die Menge
{y|d2 (y, f (x0 )) < }
ist offen. Da das Urbild einer offenen Menge offen ist, so ist auch
f −1 ({y|d2 (y, f (x0 )) < })
offen. Insbesondere ist x0 innerer Punkt dieser Menge. Also gibt es ein δ > 0, so
dass
{x|d1 (x, x0 ) < δ} ⊆ f −1 ({y|d2 (y, f (x0 )) < }).
Hieraus folgt
{f (x)|d1 (x, x0 ) < δ} ⊆ {y|d2 (y, f (x0 )) < }.
Damit ist f in x0 stetig.
4.4. STETIGE ABBILDUNGEN ZWISCHEN METRISCHEN RÄUMEN
235
(ii) ⇒ (iii). Es sei A eine abgeschlossene Teilmenge von Y . Dann ist Ac offen
und somit ist auch f −1 (Ac ) auch offen. Weiter gilt
(f −1 (Ac ))c = ({x|f (x) ∈
/ A})c = {x|f (x) ∈ A} = f −1 ({y|y ∈ A}).
Damit ist (f −1 (Ac ))c = f −1 (A) abgeschlossen.
(iii) ⇒ (ii) wird genauso gezeigt. 2
Satz 4.4.3 Es seien (X, dX ) und (Y, dY ) zwei metrische Räume und f : X → Y
eine stetige Funktion. Dann ist das Bild einer kompakten Menge kompakt.
Beweis. Es sei K eine kompakte Menge in X . Es sei weiter Oι , ι ∈ I, eine offene
Überdeckung von f (K). Wegen der Stetigkeit von f sind die Mengen
f −1 (Oι )
ι∈I
offen. Wegen
!
K ⊆ f −1
[
ι∈I
Oι
=
[
f −1 (Oι )
ι∈I
ist diese Familie von Mengen eine offene Überdeckung von K. Da K aber kompakt
ist, gibt es eine endliche Teilüberdeckung f −1 (Oι1 ), . . . , f −1 (Oιn )
K⊆
n
[
f −1 (Oιk )
k=1
Hieraus folgt
f (K) ⊆ f
n
[
!
f
−1
k=1
(Oιk )
⊆
n
[
k=1
Oιk
Also ist Oι1 , . . . , Oιn eine endliche Teilüberdeckung für f (K). 2
Satz 4.4.4 Es sei (X, d) ein metrischer Raum und K ein kompakte Teilmenge von
X. R sei mit der Standardmetrik d ausgestattet. Eine stetige Funktion f : X → R
nimmt auf K Minimum und Maximum an.
Umgekehrt kann man sich fragen, ob eine Menge, auf der jede stetige Funktion
sowohl Minimum und Maximum annimmt, kompakt sein muss. Für Teilmengen vom
Rn lässt sich dies leicht nachweisen. Wir zeigen, dass es zu jeder nicht kompakten
Menge, eine Funktion gibt, die auf dieser Menge unbeschränkt ist. Falls die Menge
unbeschränkt ist, so ist die Funktion f (x) = x21 + · · · + x2n stetig und unbeschränkt.
Falls die Menge nicht abgeschlossen ist, dann gibt es einen Punkt z, der im Abschluss
dieser Menge liegt, aber nicht in dieser Menge. Dann ist
f (x) =
|z1 − x1
|2
1
+ · · · + |zn − xn |2
236
CHAPTER 4. METRISCHE RÄUME
stetig und unbeschränkt.
Beweis. Nach Satz 4.4.3 ist f (K) eine kompakte Menge von R. Nach Satz 4.3.1 ist
f (K) beschränkt und abgeschlossen. Da f (K) beschränkt ist, existieren Infimum
und Supremum von f (K). Wir zeigen, dass das Supremum von f (K) angenommen
wird. Es gilt
∀ > 0∃y ∈ f (K) : sup f (K) ≤ y + .
Wenn sup f (K) nicht angenommen wird, d.h. sup f (K) ∈
/ f (K), dann ist sup f (K)
ein Häufungspunkt von f (K). Da aber f (K) abgeschlossen ist, muss dann sup f (K) ∈
f (K).
Genauso wird gezeigt, dass inf f (K) ∈ f (K). 2
Korollar 4.4.1 Es seien a, b ∈ R mit a < b und f : [a, b] → R eine stetige Funktion.
Dann nimmt f auf [a, b] Minimum und Maximum an.
Beweis. [a, b] ist eine kompakte Menge. Wir wenden Satz 4.4.4 an. 2
Lemma 4.4.2 Auf einem endlich-dimensionalen, reellen oder komplexen, normierten
Raum sind alle Normen äquivalent.
Beweis. Es reicht, Rn und Cn zu betrachten. Mit k k2 bezeichnen wir die Euklidische Norm. Wir zeigen, dass alle Normen auf Rn stetige Abbildungen bzgl. der
Euklidischen Norm sind. Es seien
ei = (0, . . . , 0, 1, 0, . . . , 0)
i = 1, 2, . . . , n
die Standardbasis des Rn . Es gilt
X
n
n
n
X
X
kxk = xi ei ≤
|xi |kei k ≤ max kei k
|xi |.
1≤i≤n
i=1
i=1
i=1
Wegen Beispiel 4.3.2 gilt
n
X
i=1
|xi | ≤
√
nkxk2 .
Deshalb
(4.1)
kxk ≤
! 12 n
X
√
√
2
max kei k
n
|xi |
≤ max kei k
n kxk2 .
1≤i≤n
i=1
1≤i≤n
Stetigkeit in x0 bedeutet
∀ > 0∃δ > 0∀x, kx − x0 k2 < δ :
Wir wählen δ =
c
|kxk − kx0 k| < .
und erhalten
|kxk − kx0 k| ≤ kx − x0 k ≤ ckx − x0 k2 < cδ = .
4.4. STETIGE ABBILDUNGEN ZWISCHEN METRISCHEN RÄUMEN
237
Damit ist die Norm eine stetige Abbildung. Die Menge
∂B2n = {x| kxk2 = 1}
ist kompakt. Deshalb wird
inf kxk
kxk2 =1
angenommen. Es gilt
c1 = min kxk > 0,
(4.2)
kxk2 =1
weil das Minimum nicht in x = 0 angenommen wird. Aus (4.1) und (4.2) folgt für
alle x mit kxk2 = 1
√
nkxk2 .
c1 ≤ kxk ≤ max kei k
1≤i≤n
Es folgt für alle x mit x 6= 0
x c1 ≤ kxk2 ≤ c2 .
Deshalb gilt für alle x
c1 kxk2 ≤ kxk ≤ c2 kxk2 .
2
Lemma 4.4.3 Es sei (M, d) ein metrischer Raum und K eine kompakte Teilmenge.
Es sei f : K → R eine stetige Abbildung. Dann ist f auf K gleichmäßig stetig, d.h.
∀ > 0∃δ > 0∀x, y ∈ K, d(x, y) < δ :
|f (x) − f (y)| < .
Beweis. Da f stetig ist, gilt:
∀ > 0∀x ∈ K∃δ = δ(x, )∀y ∈ K, d(x, y) < δ :
Die Familie
◦
B (x, δ(x, ))
ist eine offene Überdeckung von K. 2
Es seien πj : Rk → R durch
|f (x) − f (y)| < .
x∈K
πj (x) = xj
gegeben. Diese Abbildungen sind stetig. Wir bezeichnen πj ◦ f , j = 1, . . . , k als die
Koordinatenabbildungen.
Lemma 4.4.4 Es sei U eine offene Teilmenge des Rn und f : U → Rk . Die
Funktion f ist genau dann stetig, wenn alle Koordinatenfunktionen fi , i = 1, . . . , k
stetig sind.
238
CHAPTER 4. METRISCHE RÄUME
Beweis. Wir zeigen zunächst, dass die Abbildungen πj stetig sind.
|πj (x0 ) − πj (x)| = |x0 (j) − xj | ≤ kx0 − xk
Damit sind f und πj stetige Funktionen. Hintereinanderausführungen von stetigen
Funktionen sind auch stetig. Also ist πj ◦ f stetig. Beispiel 4.4.1 Es sei U eine offene Teilmenge des Rn und f : U → R. f heißt in x0 Lipschitzstetig, falls es eine Umgebung V(x0 ) und ein L > 0 gibt, so dass für alle x ∈ V(x0 )
d(f (x), f (x0 )) ≤ Ld(x, x0 )
bzw.
|f (x) − f (x0 )| ≤ Lkx − x0 k
gilt.
Chapter 5
Integralrechnung
Georg Friedrich Bernhard Riemann wurde am 17. September 1826 in Breselenz bei Dannenberg
geboren und er starb am 20. Juli 1866 in Selasca bei Verbania am Lago Maggiore. Er starb an
Tuberkulose.
Riemann war introvertiert und sehr schüchtern. Er hatte Schwierigkeiten im Umgang mit
Menschen, insbesondere hatte er Schwierigkeiten, Vorträge zu halten. Viele seiner Mitmenschen
hielten ihn für einen Hypochonder.
Er promovierte 1851 bei Gauß in Göttingen. Zu Riemanns Zeiten verdienten Dozenten sehr
wenig, sie erhielten nur Kolleggelder, also die Gelder, die Studenten für die Vorlesung zahlten. Erst
eine Professur war mit einem wesentlichen Gehalt verbunden. Es gab auch keine Altersversorgung,
so dass Professoren bis zu ihrem Lebensende unterrichteten. Riemann wurde 1857 in Göttingen
zum außerordentlichen Professor ernannt. Der Zeitpunkt war insofern glücklich, als er seit 1857
für drei Schwestern sorgen musste. 1859 wurde er zum ordentlichen Professor ernannt.
Wegen seiner angegriffenen Gesundheit reiste er nach er Italien.
Das wohl berühmteste, offene, mathematische Problem ist die Riemannsche Vermutung: Liegen
alle nichttrivialen Nullstellen der Riemannschen Zetafunktion
ζ(s) =
∞
X
1
s
n
n=1
auf der Geraden <s = 21 ? Man beachte, dass die Zetafunktion für alle komplexen Zahlen erklärt
ist.
5.1
Integralrechnung
In diesem Abschnitt beginnen wir mit der Integralrechnung. Sie wird uns in die Lage
versetzen, einen Flächeninhalt oder die Länge einer Kurve zu berechnen. Ebenso
die Arbeit, die verrichtet wird, wenn sich ein Partikel durch ein Kraftfeld bewegt.
Mittels der Kurvenlänge werden wir dann die trigonometrischen Funktionen
einführen.
Wir stellen fest, dass alle stetigen Funktionen, wie auch alle monotonen Funktionen Riemann-integrierbar sind. Wir geben Beispiele von Funktionen an, die nicht
Riemann integrierbar sind. Auch geben wir Beispiele an, die an sehr vielen Stellen
unstetig sind, aber trotzdem Riemann integrierbar.
239
240
CHAPTER 5. INTEGRALRECHNUNG
Das Hauptergebnis der Integralrechnung ist der Hauptsatz der Differential- und
Integralrechnung. Er besagt, dass die Integration die inverse Operation zur Differentiation ist. Hiermit lassen sich dann viele Integrale einfach berechnen.
Riemann integrierbare Funktionen sind beschränkt. Wir erweitern den Begriff
der Riemann Integrierbarkeit auf unbeschränkte Funktionen und sprechen dann von
Funktionen, die uneigentlich Riemann integrierbar sind. In diesem Zusammenhang
führen wir die Gamma Funktion ein.
Eine Partition eines Intervalls [a, b] ist eine endliche Teilmenge P = {x0 , x1 , . . . , xn }
mit
a = x0 < x1 < · · · < xn = b.
Ik = [xk−1 , xk ] heißt das k-te Teilintervall und ∆k = xk − xk−1 ist die Länge des
Intervalls Ik . Die Feinheit der Partition ist durch
kPk = max ∆k
1≤k≤n
gegeben. Es sei f : [a, b] → R beschränkt auf [a, b] und P = {x0 , x1 , . . . , xn } sei eine
Partition von [a, b]. Wir setzen
mk (f ) = inf{f (x)|x ∈ Ik }
Mk (f ) = sup{f (x)|x ∈ Ik }
Die Untersumme von f bzgl. P ist
US P (f ) =
Die Obersumme von f bzgl. P ist
OS P (f ) =
m(f ) = inf{f (x)|x ∈ [a, b]}
M (f ) = sup{f (x)|x ∈ [a, b]}
n
X
mk (f )∆k .
k=1
n
X
Mk (f )∆k .
k=1
Lemma 5.1.1 Es sei f : [a, b] → R eine beschränkte Funktion. Dann gilt für alle
Partitionen P
m(f )(b − a) ≤ US P (f ) ≤ OS P (f ) ≤ M (f )(b − a).
Beweis.
US P (f ) =
2
n
X
k=1
mk (f )∆k ≤
n
X
k=1
Mk (f )∆k = OS P (f )
Eine Partition P 0 = {x00 , . . . , x0n } eines Intervalls [a, b] heißt Verfeinerung der
Partition P = {x0 , . . . , xm } von [a, b], falls
P = {x0 , . . . , xm } ⊆ {x00 , . . . , x0n } = P 0 .
5.1. INTEGRALRECHNUNG
241
Lemma 5.1.2 Es sei f : [a, b] → R eine beschränkte Funktion. Es sei P 0 eine
Verfeinerung der Partition P. Dann gelten
(i)
US P (f ) ≤ US P 0 (f )
(ii)
OS P (f ) ≥ OS P 0 (f )
Insbesondere gilt, dass
sup{US P (f )|P ist Partition} ≤ inf{OS P (f )|P ist Partition}
Beweis. (i) Falls P 0 = {x00 , . . . , x0n } Verfeinerung von P = {x0 , . . . , xm } ist. Wir
setzen für k = 1, . . . , m und j = 1, . . . , n
Ij0 = [x0j−1 , x0j ]
Ik = [xk−1 , xk ]
∆0j = x0j − x0j−1
∆k = xk − xk−1
und
mk (f ) = inf{f (x)|x ∈ Ik }
Mk (f ) = sup{f (x)|x ∈ Ik }
m0j (f ) = inf{f (x)|x ∈ Ij0 }
Mj0 (f ) = sup{f (x)|x ∈ Ij0 }.
Es gibt es j1 , . . . , jm , so dass für alle i = 1, . . . , m gilt xi = x0ji . Dann gilt für alle
i = 1, . . . , m
ji
[
0
0
[x0`−1 , x0` ].
[xi−1 , xi ] = [xji−1 , xji ] =
`=ji−1 +1
Hiermit folgt
US P (f ) =
=
n
X
m
X
i=1
≤
=
=



ji
ji
 X
[
0
0
inf f (x) x ∈
[xk−1 , xk ]
(x0` − x0`−1 )


`=ji−1 +1
k=ji−1 +1
i=1 `=ji−1 +1
n
X
`=1
k=1
inf{f (x)|x ∈ [xi−1 , xi ]}(xi − xi−1 )
inf{f (x)|x ∈ [x0ji−1 , x0ji ]}(x0ji − x0ji−1 )
ji
m
X
X
n
X
m
X
i=1
k=1
m
X
i=1
=
mk (f )∆k =
inf f (x) x ∈ [x0`−1 , x0` ] (x0` − x0`−1 )
inf f (x) x ∈ [x0`−1 , x0` ] (x0` − x0`−1 )
m0k (f )∆0k = US P 0 (f ).
(ii) wird genauso gezeigt.
242
Q
CHAPTER 5. INTEGRALRECHNUNG
Wir zeigen nun den Zusatz. Zunächst zeigen wir, dass für alle Partitionen P und
US P (f ) ≤ OS Q (f )
gilt. P ∪ Q ist Verfeinerung von P und Q. Deshalb gilt nach Lemma 5.1.2 für alle
P und Q
US P (f ) ≤ US P∪Q (f ) ≤ OS P∪Q (f ) ≤ OS Q (f ).
Hieraus folgt für all Q
sup US P (f ) ≤ OS Q (f )
P
und schließlich
sup US P (f ) ≤ inf OS Q (f ).
Q
P
2
Definition 5.1.1 Es sei f : [a, b] → R eine beschränkte Funktion. Es gelte
sup US P (f ) = inf OS P (f ).
P
P
Dann heißt f Riemann integrierbar und das Integral von f ist
Z
a
b
f (x)dx = sup US P (f ) = inf OS P (f ).
P
P
Um nachzu weisen, dass eine Funktion f Riemann integrierbar ist, reicht es zu
zeigen, dass es für alle > 0 Partitionen P, Q mit
OS P (f ) ≤ US P (f ) + gibt.
Wir setzen
Z
a
b
f (x)dx = −
Z
a
f (x)dx.
b
Beispiel 5.1.1 (i) Es sei f : [a, b] → R durch f (x) = c definiert. f ist integrierbar und
Z
a
b
f (x)dx = c(b − a).
(ii) Es sei f : [0, 1] → R durch f (x) = x definiert. f ist integrierbar und
Z
1
f (x)dx =
0
(iii) (Dirichlet) Es sei D : [0, 1] → R durch
(
0
D(x) =
1
1
.
2
falls x irrational
falls x rational
5.1. INTEGRALRECHNUNG
243
definiert. f ist nicht Riemann integrierbar (f ist aber Lebesgue integrierbar). Weiter gilt
D(x) = lim lim cos2n (m!πx).
m→∞ n→∞
(iv) (Thomae) Es sei f : [0, 1] → R durch

falls x irrational ist oder x = 0
0
f (x) =
m
1
falls x =
und m und n teilerfremd sind
n
n
definiert. f ist in allen irrationalen Punkten stetig und unstetig in allen rationalen Punkten. f ist
in keinem Punkt differenzierbar. f ist Riemann integrierbar und
Z
1
f (x)dx = 0.
0
Diese Funktion wurde 1875 von C.J. Thomae eingeführt. Sie hat viele Spitznamen: Popcorn
Funktion, Regentropfen Funktion, Lineal Funktion, Sterne über Babylon.
Carl Johannes Tomae wurde am 11.12.1840 in Laucha an der Unstrut geboren. Er promovierte
1864 in Göttingen bei Ernst Schering. 1879 wurde er Professor in Jena.
An der Graphik erkennt man, warum die Funktion auch Lineal Funktion genannt wird: Die
Striche, die die Funktionswerte angeben, sehen aus wie die Markierungen auf einem Lineal. Auch
der Ausdruck Regentropfen Funktion ist klar. Sie heißt auch Popcorn Funktion, weil die Striche
Popcorn andeuten, das aus einer heissen Pfanne aufspringt.
Beweis. (i)
m(f ) = inf{f (x)|x ∈ [a, b]} = c
M (f ) = sup{f (x)|x ∈ [a, b]} = c
Wir wählen als Partition P = {a, b}. Dann erhalten wir
US P (f ) = m(f )(b − a)
OS P (f ) = m(f )(b − a)
(ii) Wir wählen als Partitionen
Pn = {0, n1 , n2 , . . . , 1}
Es gelten ∆k =
1
n
n∈N
und
mk (f ) = inf f (x) =
x∈Ik
k−1
n
Mk (f ) = sup f (x) =
x∈Ik
k
n
244
CHAPTER 5. INTEGRALRECHNUNG
Hiermit erhalten wir
US Pn (f )
n
X
=
mk (f )∆k =
k=1
n
X
k−1 1
n
k=1
n
n
1 X
1 n(n − 1)
1
1
(k
−
1)
=
=
1
−
n2
n2
2
2
n
=
k=1
und
OS Pn (f )
=
n
X
Mk (f )∆k =
k=1
=
n
X
k1
nn
k=1
n
1 X
1 n(n + 1)
1
1
k= 2
=
1+
.
n2
n
2
2
n
k=1
Deshalb gilt für alle n ∈ N
1
1
1
1
1−
≤ sup US P (f ) ≤ inf OS P (f ) ≤
1+
.
P
2
n
2
n
P
Also gilt
1
= sup US P (f ) = inf OS P (f ).
P
2
P
(iii) Wir zeigen, dass für alle Partitionen P
US P (D) = 0
OS P (D) = 1
gilt. Hierzu benutzen wir, dass es zwischen je zwei reellen Zahlen sowohl eine rationale als auch
eine irrationale Zahl gibt (Korollar 2.10.1). Es folgen
mk (D)
=
Mk (D)
=
inf{D(x)|x ∈ Ik } = 0
sup{D(x)|x ∈ Ik } = 1.
Es folgt
US P (D)
=
OS P (D)
=
n
X
k=1
n
X
mk (D)∆k = 0
Mk (D)∆k =
k=1
n
X
∆k = 1.
k=1
(iv) Wir zeigen, dass f in allen rationalen Punkten, die von 0 verschieden sind, unstetig ist.
1
m
Es gilt f ( m
n ) = n , aber in jeder Umgebung von n findet man einen irrationalen Punkt.
Wir zeigen nun, dass f in allen irrationalen Punkten x stetig ist. Wir zeigen, dass für alle
Folgen {xn }n∈N mit limn→∞ xn = x
lim f (xn ) 6= f (x) = 0
n→∞
gilt. Wir können annehmen, dass alle xn , n ∈ N, rationale Zahlen sind, weil f auf irrationalen
n
Zahlen den Wert 0 annimmt. Es sei { m
kn }n∈N eine Folge rationaler Zahlen mit
mn
= x.
n→∞ kn
lim
Wir müssen zeigen, dass
lim
n→∞
1
= 0.
kn
5.1. INTEGRALRECHNUNG
245
Wir nehmen an, dies sei nicht so. Dann gibt es eine Teilfolge {knj }j∈N , die beschränkt ist. Deshalb
ist auch {mnj }j∈N beschränkt. Somit nimmt
nur endlich viele Werte an. Deshalb ist
mnj
k nj
j∈N
mnj
j∈N knj
lim
rational. Der Grenzwert ist aber gleich der irrationalen Zahl x.
Wir zeigen nun, dass f Riemann integrierbar ist und dass das Integral von f gleich 0 ist.
Dazu zeigen wir dass für alle Partitionen P gilt, dass US P (f ) = 0. Ausserdem zeigen wir, dass es
Partitionen Pn , n ∈ N, gibt, so dass
r
2
OS P (f ) ≤
n
gilt. Hieraus ergibt sich unmittelbar die Behauptung.
Es gilt
n
X
US P (f ) =
mk (f )∆k = 0.
k=1
Wir beweisen nun die Abschätzung für die Obersummen. Als Partitionen wählen wir
Pn = {0,
1 2
, , . . . , 1}
n n
n ∈ N.
k
Es gelten ∆k = n1 und Ik = [ k−1
n , n ].
Um OS P (f ) zu bestimmen, müssten wir nun Mk (f ) berechnen. Dies kann sich wegen der
Funktion f kompliziert gestalten. Deshalb gehen wir einer anderen Frage nach, die leichter zu
beantworten ist: Die Funktion f nimmt die Werte 1q , q ∈ N, an. Wir fragen, auf wievielen
Intervallen Ik der Wert von Mk (f ) gleich 1q ist? Es gilt
OS Pn (f ) =
wobei
n
X
k=1
n
∞
1
1X1
1X
Mk (f ) =
card k Mk (f ) = ,
Mk (f )∆k =
n
n q=1 q
q
k=1
∞
X
1
card k Mk (f ) =
= n.
q
q=1
k
Da in jedem Intervall Ik = [ k−1
n , n ] eine Zahl
k
n
enthalten ist, gilt
Mk (f ) = sup f (x) ≥ f ( nk ) ≥
x∈Ik
1
.
n
Deshalb gilt
n
X
1
card k Mk (f ) =
= n.
q
q=1
Weiter gilt
1
card k Mk (f ) =
≤ q.
q
Dies gilt, weil es q + 1 rationale Zahlen in [0, 1] gibt, deren Nenner q ist:
0 1 2
q−1 q
, , ,...,
, .
q q q
q
q
246
CHAPTER 5. INTEGRALRECHNUNG
Diese q + 1 Zahlen können in höchstens q + 1 verschiedenen Intervallen Ik auftreten. Also gilt
Mk (f ) = 1q in höchstens q + 1 verschiedenen Intervallen. Da qq = 1, haben wir es tatsächlich
höchstens mit q Intervallen zu tun.
Somit erhalten wir
n
1X1
N (q),
OS Pn (f ) =
n q=1 q
wobei N (q) ganze Zahlen mit 0 ≤ N (q) ≤ q und
n
X
N (q) = n
q=1
ist (Es kann sein, dass einige der N (q) gleich 0 sind.). Wir behaupten, dass
n
1X1
N (q)
n q=1 q
für die folgende Wahl der Zahlen N (q) maximal ist. Es sei ` ∈ N die kleinste Zahl, so dass
`
X
q=1
q ≥ n.
Wir setzen
N (q) =



falls q = 1, 2, . . . , ` − 1
q
n−
P`−1
p=1
p
falls q = `
Wir nehmen an, dies sei nicht so. Dann gibt es eine Zahl q0 ∈ N mit q0 ≤ ` − 1 und N (q0 ) < q0
oder
`−1
X
N (`) < n −
p.
p=1
Wir betrachten den ersten Fall. Wir beobachten, dass es ein q1 > q0 mit N (q1 ) ≥ 1 gibt. Dann
gilt
n
1X1
N (q)
n q=1 q
(q −1
0
1 X 1
=
N (q) +
n q=1 q
(q −1
0
1 X 1
<
N (q) +
n q=1 q
qX
n
1 −1
X
1
1
1
1
N (q0 ) +
N (q) + N (q1 ) +
N (q)
q0
q
q1
q
q=q +1
q=q +1
0
)
1
qX
1 −1
1
(N (q0 ) + 1) +
q0
q=q
0
n
X
1
1
1
N (q) + (N (q1 ) − 1) +
N (q)
q
q1
q
+1
q=q +1
1
Der zweite Fall wird genauso behandelt. Damit folgt
`
OS Pn (f ) ≤
`
1X1
q= ,
n q=1 q
n
wobei ` die kleinste Zahl ist, für die
`
X
q=1
q≥n
)
5.1. INTEGRALRECHNUNG
gilt. Wir behaupten, dass ` ≤
√
247
2n gilt. Es gilt
n≤
`
X
q=
q=1
Also gilt
√
1
`(` + 1)
≤ (` + 1)2 .
2
2
2n ≤ ` + 1.
Da ` die kleinste ganze Zahl ist, die diese Ungleichung erfüllt, gilt ` ≤
r
√
2n
2
=
.
OS Pn (f ) ≤
n
n
√
2n. Damit erhalten wir
2
Wir definieren
Z a
f (x)dx = 0
Z
a
f (x)dx = −
und
b
a
b
Z
f (x)dx.
a
Lemma 5.1.3 Es seien f, g : [a, b] → R integrierbare Funktionen und c ∈ R. Dann
gelten
(i) f + g ist integrierbar und
Z b
Z b
Z b
gdx
f dx +
f + gdx =
a
a
a
(ii) f g ist integrierbar.
(iii) cf ist integrierbar und
Z
b
Z
b
f dx
cf dx = c
a
a
Lemma 5.1.4 Es seien f, g : [a, b] → R integrierbare Funktionen und es gelte
f (x) ≤ g(x) für alle x ∈ [a, b]. Dann gilt
Z b
Z b
gdx.
f dx ≤
a
Beweis.
OS P (f ) =
n
X
k=1
Mk (f )∆k ≤
a
n
X
k=1
Mk (g)∆k = OS P (g)
Also gilt für alle Partitionen P
OS P (f ) ≤ OS P (g).
Hieraus folgt
Z
a
2
b
f (x)dx = inf OS P (f ) ≤ inf OS P (g) =
P
P
Z
b
g(x)dx.
a
248
CHAPTER 5. INTEGRALRECHNUNG
Lemma 5.1.5 Es sei f : [a, b] → R eine integrierbare Funktion. Dann ist auch |f |
eine integrierbare Funktion und es gilt
Z b
Z b
f (x)dx ≤
|f (x)|dx.
a
a
Beweis. Wir zeigen, dass |f | integrierbar ist. Dazu zeigen wir, dass die Funktionen
f + und f − mit
f − (x) = max{−f (x), 0}
f + (x) = max{f (x), 0}
integrierbar sind. Es folgt dann, dass |f | = f + + f − integrierbar ist. Weiter gilt
f = f + − f − . Wir zeigen hier, dass f + integrierbar ist.
Es sei P = {x0 , . . . , xn } eine Partition. Dann gilt für alle k = 1, . . . , n
Mk (f + ) − mk (f + ) ≤ Mk (f ) − mk (f ).
(5.1)
Wir prüfen dies nach. Da f ≤ f + gilt, folgen
Mk (f ) = sup f (x) ≤ sup f + (x) = Mk (f + )
(5.2)
x∈Ik
x∈Ik
mk (f ) = inf f (x) ≤ inf f + (x) = mk (f + )
(5.3)
x∈Ik
x∈Ik
Wir betrachten nun zwei Fälle. Der erste Fall ist: Es gibt ein x0 ∈ Ik mit f (x0 ) ≥ 0.
Wir zeigen, dass in diesem Fall Mk (f ) = Mk (f + ). Es gilt für alle y ∈ Ik
f (y) ≤ sup f (x).
x∈Ik
Da f (x0 ) ≥ 0, so
0 ≤ f (x0 ) ≤ sup f (x).
x∈Ik
Deshalb gilt für alle y ∈ Ik
f + (y) = max{f (y), 0} ≤ sup f (x).
x∈Ik
Es folgt
Mk (f + ) = sup f + (x) ≤ sup f (x) = Mk (f )
x∈Ik
x∈Ik
+
und damit Mk (f ) = Mk (f ). Hiermit und mit (5.3) folgt (5.1) in diesem Fall.
Der zweite Fall ist: Für alle x ∈ Ik gilt f (x) < 0. In diesem Fall gilt f + = 0 und
(5.1) folgt sofort.
Aus (5.1) folgt
+
+
OS P (f ) − US P (f ) =
≤
n
X
k=1
n
X
k=1
Mk (f + ) − mk (f + ) ∆k
(Mk (f ) − mk (f )) ∆k = OS P (f ) − US P (f ).
5.1. INTEGRALRECHNUNG
249
Für jedes > 0 existieren Partitionen P0 und P1 , so dass
OS P0 (f ) ≤ inf OS P (f ) + US P1 (f ) ≥ sup US P (f ) − und
P
P
gelten. Somit folgt für P = P0 ∪ P1
OS P (f + ) − US P (f + ) ≤ 2.
Wegen
US P (f + ) ≤ sup US Q (f + ) ≤ inf OS Q (f + ) ≤ OS P (f + )
Q
Q
folgt
sup US Q (f + ) = inf OS Q (f + ).
Q
Q
Damit ist f + integrierbar. Ebenso zeigen wir, dass f − integrierbar ist.
Z
a
b
Z
b
Z
b
Z
b
f − (x)dx
f (x)dx +
f (x) + f (x)dx =
a
a
a
Z b
Z b
Z b
Z b
+
−
+
−
≥
f (x)dx −
f (x)dx =
f (x) − f (x)dx =
f (x)dx
|f (x)|dx =
−
+
a
+
a
a
a
Genauso zeigen wir, dass
b
Z
|f (x)|dx ≥ −
a
Z
b
f (x)dx.
a
Insgesamt erhalten wir also
Z
a
b
Z b
|f (x)|dx ≥ f (x)dx .
a
2
Lemma 5.1.6 Es sei f : [a, b] → R integrierbar und c ∈ [a, b]. Dann gilt
Z
b
Z
f (x)dx =
a
c
Z
f (x)dx +
a
b
f (x)dx
c
Satz 5.1.1 Die Funktion f : [a, b] → R sei auf [a, b] monoton fallend oder monoton
wachsend. Dann ist f Riemann integrierbar.
Beweis. Es sei f monoton wachsend. Wir wählen als Partitionen
b−a
b−a
b−a
Pn = a, a +
,a + 2
, . . . , a + (n − 1)
,b
n
n
n
n ∈ N.
250
CHAPTER 5. INTEGRALRECHNUNG
Weil f monoton wachsend ist, gelten für k = 1, 2, . . . , n
b−a
b−a
und
Mk (f ) = f a + k
.
mk (f ) = f a + (k − 1)
n
n
Damit folgt
OS Pn (f ) − US Pn (f )
n
n
X
X
=
Mk (f )∆k −
mk (f )∆k
k=1
k=1
n
n
X
b−a b−a
b−a b−a X
−
f a + (k − 1)
=
f a+k
n
n
n
n
k=1
k=1
n−1 n
X
b−a b−a
b−a b−a X
f a+k
=
−
f a+k
n
n
n
n
k=0
k=1
=
b−a
(f (b) − f (a)).
n
Es gilt also
OS Pn (f ) − US Pn (f ) ≤
b−a
(f (b) − f (a)).
n
Wegen
US Pn (f ) ≤ sup US P (f ) ≤ inf OS P (f ) ≤ OS Pn (f )
P
P
folgt
inf OS P (f ) = sup US P (f ).
P
P
Damit ist f integrierbar. 2
Satz 5.1.2 Es sei f : [a, b] → R stetig. Dann ist f Riemann integrierbar.
Beweis. Wir benutzen den Satz 3.2.1: Falls f auf [a, b] stetig ist, dann ist f auf
[a, b] auch gleichmäßig stetig. Es gilt also
∀ > 0∃δ > 0∀x, y ∈ [a, b], |x − y| < δ :
|f (x) − f (y)| < .
Als Partition wählen wir
b−a
b−a
b−a
Pn = a, a +
,a + 2
, . . . , a + (n − 1)
,b
n
n
n
wobei wir n so groß wählen, dass ∆k =
b−a
n
∀k = 1, . . . , n ∀x, y ∈ Ik :
n ∈ N,
< δ gilt und damit
|f (x) − f (y)| < .
Hieraus folgt
Mk (f ) − mk (f ) = sup f (x) − inf f (x) = max f (x) − min f (x) < .
x∈Ik
x∈Ik
x∈Ik
x∈Ik
5.2. RIEMANNSCHE SUMMEN
251
Damit erhalten wir
OS Pn (f ) − US Pn (f ) =
n
X
k=1
Mk (f )∆k −
n
X
k=1
mk (f )∆k < (b − a).
Wegen
US Pn (f ) ≤ sup US P (f ) ≤ inf OS P (f ) ≤ OS Pn (f )
P
P
folgt
inf OS P (f ) = sup US P (f ).
P
P
Damit ist f integrierbar. 2
5.2
Riemannsche Summen
Die Funktion f : [a, b] → R sei beschränkt. P = {x0 , . . . , xn } sei eine Partition von
[a, b]. Es sei ξ = {ξk }nk=1 mit ξk ∈ Ik , k = 1, . . . , n. Dann heisst
SP =
n
X
f (ξk )∆k
k=1
Riemannsche Summe zur Partition P.
Insbesondere gilt für jede Partition P und alle ξ
US P (f ) ≤ SP (f, ξ) ≤ OS P (f )
Wir setzen
lim SP (f, ξ) = I
kPk→0
falls für alle > 0 ein δ > 0 existiert, so dass für alle Partitionen P mit kPk < δ
und alle ξ
|SP (f, ξ) − I| < gilt.
Lemma 5.2.1 (i) Falls f : [a, b] → R Riemann integrierbar ist, so existiert
lim SP (f, ξ)
kPk→0
und es gilt
lim SP (f, ξ) =
kPk→0
Z
b
f (x)dx
a
(ii) Existiert
lim SP (f, ξ)
kPk→0
so ist f Riemann integrierbar und es gilt
lim SP (f, ξ) =
kPk→0
Z
b
f (x)dx
a
252
CHAPTER 5. INTEGRALRECHNUNG
Satz 5.2.1 (i) Es sei f : [a, b] → R eine zweimal stetig differenzierbare Funktion,
a0 < · · · < an sei eine Partition des Intervalls [a, b] in Teilintervalle gleicher Länge
und x1 , . . . , xn seien die Mittelpunkte dieser Teilintervalle. Dann gilt
Z b
(b − a)3
≤
f
(x)dx
−
(f
(x
)
+
·
·
·
+
f
(x
))∆x
max |f 00 (x)|
1
n
2 x∈[a,b]
24n
a
Z b
(b − a)3
≤
f
(x)dx
−
(f
(a
)
+
2f
(a
)
·
·
·
+
2f
(a
)
+
f
(a
))∆x
max |f 00 (x)|
0
1
n−1
n
2 x∈[a,b]
12n
a
(ii)
Z b
f (x)dx − (f (a0 ) + 4f (x1 ) + 2f (a1 ) · · · + 2f (an−1 ) + 4f (xn ) + f (an ))∆x
a
≤
(b − a)5
max |f 0000 (x)|
2880n4 x∈[a,b]
Die erste Approximation bezeichnet man als Mittelpunktsregel, die zweite als
Trapezregel und die dritte als Simpsonregel. Bei der Simpsonregel approximiert
man die Funktion durch Parabeln.
5.3
Riemann-messbare Mengen und die CantorMenge
Wir sagen, dass eine Teilmenge A der reellen Zahlen R Riemann-messbar ist, falls
sie beschränkt ist und die charakteristische Funktion
1
falls x ∈ A
χA =
0
falls x ∈
/A
integrierbar ist. Das Maß µ(A) der Menge A ist durch
Z b
χA dx
µ(A) =
a
definiert, wobei [a, b] ein Intervall ist, das die Menge A enthält.
Lemma 5.3.1 Es sei A eine Riemann messbare Teilmenge von R und s, t ∈ R.
Dann ist auch s + tA Riemann messbar und
µ(s + tA) = tµ(A)
Beweis. Es seien a, b ∈ R mit A ⊆ [a, b] und P = {x0 , x1 , . . . , xn } eine Partition
mit
OS P (χA ) ≤ + US P (χA )
5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE
253
Dann gilt s + tA ⊆ [s + ta, s + tb] und
s + tP = {s + tx0 , . . . , s + txn }
ist eine Partition mit
OS s+tP (χs+tA ) ≤ t + US s+tP (χs+tA )
Wir prüfen dies nach. Es gilt
(
mk (χA ) = inf χA (x) =
x∈Ik
falls Ik ⊆ A
falls Ik ∩ Ac 6= ∅
1
0
(
Mk (χA ) = sup χA (x) =
x∈Ik
falls Ik ∩ A 6= ∅
falls Ik ∩ A = ∅
1
0
Ebenso gilt
(
mk (χs+tA ) = inf χs+tA (x) =
x∈Ik
1
0
(
Mk (χs+tA ) = sup χs+tA (x) =
x∈s+tIk
1
0
falls s + tIk ⊆ s + tA
falls s + tIk ∩ (s + tA)c 6= ∅
falls (s + tIk ) ∩ (s + tA) 6= ∅
falls (s + tIk ) ∩ (s + tA) = ∅
Es folgt mk (χs+tA ) = mk (χA ) und Mk (χs+tA ) = Mk (χA ). Damit folgt
US s+tP (χs+tA ) =
n
X
mk (χs+tA )∆s+tP
k
k=1
=
n
X
k=1
mk (χA )t∆Pk = t US P (χA )
Dasselbe Ergebnis erhalten wir für die Obersummen. 2
Beispiel 5.3.1 (Cantor Menge) Die Cantor Menge C ist die Menge aller Zahlen
∞
X
aj
j=1
3j
aj ∈ {0, 2}
Es gelten
(i) C ⊂ [0, 1]
(ii) C ist eine kompakte Menge.
(iii) Es gilt C = 31 C ∪ ( 23 + 12 C)
(iv) Wir setzen C1 = [0, 1] und für n ∈ N
Cn+1 = 13 Cn ∪ ( 32 + 12 Cn )
254
CHAPTER 5. INTEGRALRECHNUNG
Dann gilt
C=
∞
\
Cn
n=1
(v) Das Riemannsche Mass von C ist 0.
(vi) Die Mächtigkeit der Cantor Menge ist gleich der des Kontinuums.
(vii) C hat keine isolierten Punkte.
(viii) Für alle x, y ∈ C existiert ein z ∈
/ C, so dass x < z < y.
(ix) Für die Menge C + C = {x + y|x, y ∈ C} gilt
C + C = [0, 2]
(x) Für die Differenzmenge C − C = {x − y|x, y ∈ C} gilt
C − C = [−1, 1]
Wir sagen, dass eine Menge nirgends dicht ist, falls das Innere des Abschlusses
die leere Menge ist. Die Cantor Menge ist nirgends dicht. Eigenschaft (ix) zeigt,
dass das Mass einer Differenzmenge von Nullmengen nicht notwendig 0 ist.
Geometrisch lässt sich die Cantor Menge wie folgt veranschaulichen. Das Intervall [0, 1] wird gedrittelt und das mittlere Drittel ( 13 , 23 ) entfernt. Die verbleibenden
Intervalle [0, 13 ] und [ 32 , 1] werden wiederum gedrittelt und die mittleren Intervalle
( 19 , 91 ) und ( 79 , 89 ) werden entfernt. Dieses Verfahren wird so fortgesetzt. So entsteht
bei jedem Schritt eine Menge Cn , n = 1, . . . , die Vereinigung von 2n−1 abgeschlosse−n+1
nen Intervallen der Länge
ist. Die Cantor Menge ist dann der Durchschnitt
T∞ 3
dieser Mengen C = n=1 Cn .
0
1
1
3
0
0
1
9
2
9
1
3
2
3
2
3
1
7
9
8
9
1
Konstruktion der Cantor Menge
Der
Q zweielementige Raum {0, 1} sei mit der diskreten Topologie ausgestattet
und n∈N {0, 1} = {0, 1}N mit der Produkttopologie. Dann sind C und {0, 1}N
homöomorph.
Ein Satz von Alexandrov und Hausdorff besagt, dass jeder kompakte, metrische
Raum stetiges Bild der Cantor-Menge ist [Ben]. Dieser Satz hat eine Reihe von
überraschenden Anwendungen.
5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE
255
Beweis. (i) Offensichtlich sind alle Zahlen in der Cantor Menge grösser oder gleich
0. Ausserdem sind alle Zahlen kleiner als
∞
X
1
2
=1
=2
1 −1
j
3
1
−
3
j=1
(ii) Wir müssen zeigen, dass die Cantor Menge abgeschlossen ist. Es sei
xk =
∞
X
j=1
akj 3−j
akj ∈ {0, 2} k = 1, 2, . . .
eine Folge in C, die in R konvergiert. (Da alle xk ∈ [0, 1], gilt dasselbe für den
Grenzwert x.) Dann gibt es Zahlen aj , so dass für alle j ∈ N
lim akj = aj
k→∞
Deshalb gilt für alle j ∈ N, dass aj ∈ {0, 2}. Damit ist die Zahl
∞
X
aj 3−j
j=1
ein Element der Cantor Menge. Wir zeigen nun, dass für alle j ∈ N die Folge {akj }k∈N
eine Cauchy Folge ist.
Wir nehmen an, dass es ein j gibt, so dass {akj }k∈N keine Cauchy Folge ist. Es
sei j0 die kleinste Zahl, für die dies nicht wahr ist. Dann gibt es ein N , so dass für
alle k, m > N
∞
∞
X
ak − am ak − am m
k
X
−
a
a
j
j
j j j j
|xk − xm |
=
≥ 0 j 0−
j
j
3
3
3
j=j0
j=j0 +1
∞
ak − am ak − am X
2
1
j0
j0
j0 j0 ≥
=
−
− j0
j
j
j
3
3
3
3
j=j +1
0
Da {a`j0 }`∈N keine Cauchy Folge ist, gibt es zu jedem N Zahlen k, m ∈ N mit
k, m > N und
|akj0 − am
j0 | = 2
Damit folgt aber |xk − xm | ≥ 3−j0 und die Folge {xn }n∈N ist keine Cauchy Folge.
Damit folgt, dass für alle j ∈ N die Folge {akj }k∈N eine Cauchy Folge ist und damit
eine konvergente Folge. Es gibt also Zahlen aj ∈ {0, 2}, so dass
lim akj = aj
k→∞
Wir behaupten, dass die Folge xk gegen das Element
x=
∞
X
aj
j=1
3j
256
CHAPTER 5. INTEGRALRECHNUNG
konvergiert. Es gibt zu jedem J ∈ N ein kJ , so dass für alle j mit 1 ≤ j ≤ J und
alle k mit k ≥ kJ gilt, dass akj = aj . Weiter folgt für alle k mit k ≥ kJ
∞
∞
∞
X
X
k
k
X
a
−
a
a
−
a
2
j
j
j
j
|x − xk | = =
≤
= 3−J
j
j
3
3
3j
j=1
j=J
j=J
(iii) Wir zeigen zuerst, dass
C ⊇ 31 C ∪
Es sei x ∈ C, also x =
P∞
aj
j=1 3j
2
3
+ 12 C
mit aj ∈ {0, 2}. Dann gilt
∞
x X aj
=
3
3j+1
j=1
Also gilt
x
3
∈ C. Weiter gilt
∞
∞
X bj
2 X aj
2 x
+ = +
=
3 3
3 j=1 3j+1
3j
j=1
mit b1 = 2 und bj = aj−1 für j = 2, 3, . . . . Also gilt auch 32 + x3 ∈ C.
Wir zeigen nun, dass
C ⊆ 31 C ∪ 23 + 12 C
P
aj
Es sei x ∈ C, also x = ∞
j=1 3j mit aj ∈ {0, 2}. Falls a1 = 0, dann
x=
∞
X
aj
j=2
∞
1 X aj
1
=
∈ C
j
j−1
3
3 j=2 3
3
Falls a1 = 2, dann gilt
x=
∞
X
aj
j=1
∞
∞
2 X aj
2 1 X aj
2 1
=
+
=
+
∈ + C
j
j
j−1
3
3 j=2 3
3 3 j=2 3
3 3
(iv) Wir zeigen hier zunächst, dass Cn+1 ⊆ Cn . Dies zeigen wir durch Induktion.
Für n = 1 gilt
C1 = [0, 1] ⊃ [0, 13 ] ∪ [ 32 , 1] = 13 C1 ∪ ( 32 + 13 C1 ) = C2
Wir nehmen nun an, dass Cn−1 ⊃ Cn . Nach Definition gilt
Cn+1 = 31 Cn ∪ ( 23 + 31 Cn )
Aus der Induktionsannahme Cn−1 ⊃ Cn folgt
1
C
3 n−1
⊃ 13 Cn
2
3
+ 13 Cn−1 ⊃
2
3
+ 13 Cn
5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE
257
Hieraus folgt
Cn = 13 Cn−1 ∪ ( 23 + 13 Cn−1 ) ⊃ 31 Cn ∪ ( 23 + 13 Cn ) = Cn+1
Nun zeigen wir, dass
∞
\
C⊆
Cn
n=1
Hierzu zeigen wir durch Induktion, dass für alle n ∈ N gilt, dass C ⊆ Cn . Es gilt
C1 = [0, 1] ⊃ C
Wir nehmen nun an, dass C ⊂ Cn . Dann folgt
Cn+1 = 13 Cn ∪ ( 23 + 13 Cn ) ⊃ 31 C ∪ ( 23 + 31 C) = C
Wir zeigen, dass
∞
\
C⊇
Cn
n=1
Dazu zeigen wir zuerst, dass
∞
\
Cn =
1
3
n=1
∞
\
n=1
Cn ∪
2
3
+
1
3
∞
\
!
Cn
n=1
Es gilt
∞
\
Cn
∞
\
=
n=1
⊇
∞
\
Cn+1 =
n=1
∞
\
1
C
3 n
n=1
∪ ( 32 + 13 Cn )
1
C ∪ ( 32 + 13 Cj ) =
3 i
i,j=1
1
3
∞
\
!
Ci
i=1
∪
2
3
+
1
3
∞
\
!
Cj
j=1
Andererseits gilt
1
3
∞
\
!
∪
Ci
i=1
⊇
=
Es sei nun x ∈
Darstellung
∞
\
2
3
+
1
3
∞
\
1
C
3 max{i,j}
∞
\
n=1
n=1
Cn+1 =
n=1
Cj
=
j=1
i,j=1
∞
\
T∞
!
∪
∞
\
∪ ( 23 + 13 Cj )
1
C
3 i
i,j=1
( 32
+
1
C
)
3 max{i,j}
=
∞
\
n=1
1
C
3 n
∪ ( 32 + 13 Cn )
Cn
Cn aber x ∈
/ C. Da x ∈ [0, 1] gilt, gibt es eine 3-adische
x=
∞
X
aj
j=1
3j
aj ∈ {0, 1, 2}
258
CHAPTER 5. INTEGRALRECHNUNG
wobei es i0 , j0 ∈ N mit i0 < j0 und ai0 = 1 und aj0 6= 2 gibt. Wir wollen uns dies
überlegen. Falls es mindestens zwei i mit ai = 1 gibt, dann können wir ai0 = aj0 = 1
mit i0 < j0 wählen. Wenn es nur ein einziges i0 mit ai0 = 1 gibt und es gibt ein
j0 mit i0 < j0 und aj0 = 0, dann sind wir auch fertig. Falls es aber nur ein i0 mit
ai0 = 1 gibt und für alle i > i0 gilt, dass ai = 2, dann gilt weiter
x=
∞
X
aj
j=1
3j
=
iX
0 −1
j=1
iX
∞
0 −1
X
aj
aj
1
2
2
+ i0 +
=
+ i0 ∈ C
j
j
j
3
3
3
3
3
j=1
j=i +1
0
Wir betrachten der kleinste Index i0 , für den der Koeffizient gleich 1 ist.
Wir betrachten den Fall, dass i0 = 1, also a1 = 1. Dann folgt x ∈ [ 13 , 23 ]. Es kann
nicht sein, dass x = 32 , weil 23 ∈ C. Es kann auch nicht sein, dass x = 31 , weil
∞
1 X 2
x= =
∈C
3
3j
j=2
Wir hatten aber angenommen, dass x ∈
/ C. Insgesamt erhalten wir, dass x ∈ ( 31 , 32 ).
Damit gilt x ∈
/ C2 , im Widerspruch zu unserer Annahme.
Nun betrachten wir den Fall, dass i0 > 1. Wir konstuieren ein
∞
∞
\
X
bj
∈
Cn
y=
3j n=1
j=1
y∈
/C
und
mit bi0 −1 = 1. Wir können also i0 um 1 reduzieren. Dasselbe Argument wenden wir
i0 − 1 mal an, so dass wir den Fall i0 = 1 erhalten Wegen
!
!
∞
∞
∞
\
\
\
1
2
1
Cn = 3
Cn ∪ 2 + 3
Cn
n=1
gilt
x∈
1
3
bzw.
3x ∈
n=1
∞
\
Cn
oder
n=1
∞
\
n=1
Cn
oder
n=1
x∈
2
3
+
1
3
3x − 2 ∈
∞
\
Cn
n=1
∞
\
Cn
n=1
Wir betrachten den ersten Fall. Dann gilt 3x ∈
/ C, weil sonst x ∈ C folgen würde,
im Gegensatz zu unserer Annahme. Dann wählen wir y = 3x und es gilt bi0 −1 = 1.
(v) Da χC eine nichtnegative Funktion ist, gilt für alle Partitionen P und alle
Untersummen US P (χC )
0 ≤ US P (χC )
Die Menge Cn ist eine disjunkte Vereinigung von 2n−1 abgeschlossenen Intervallen
der Länge 3n−1 , die alle in [0, 1] enthalten sind. Dies folgt mit Induktion aus
(iv). C1 = [0, 1] erfüllt die Aussage. Falls Cn die Aussage erfüllt, dann ist 31 Cn
5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE
259
eine disjunkte Vereinigung von 2n−1 abgeschlossenen Intervallen der Länge 3n , die
in [0, 13 ] enthalten sind. Ausserdem ist 23 + 13 Cn eine disjunkte Vereinigung von
2n−1 abgeschlossenen Intervallen der Länge 3n , die in [ 23 , 1] enthalten sind. Deshalb
besteht Cn+1 = ( 13 Cn ) ∪ ( 23 + 31 Cn ) aus 2n disjunkten, abgeschlossenen Intervallen
der Länge 3n .
Somit gibt es Zahlen ak , bk , k = 1, . . . , 2n−1 , mit 0 = a1 < b1 < a2 < b2 < a3 <
· · · < a2n−1 < b2n−1 = 1 und
n−1
2[
Cn =
[ak , bk ]
k=1
Nun wählen wir als Partition
P = {a1 , b1 + , a2 − , b2 + , a3 − , . . . , b2n−1 −1 + , a2n−1 − , b2n−1 }
Weil C ⊆ Cn gilt, folgt
sup
x∈[ak −,bk +]
χC (x) ≤ 1
sup
χC (x) = 0
x∈[bk +,ak −]
Damit folgt für die Obersumme
OS P (χC ) ≤ 2n−1 (3−n+1 + 2)
Da wir < 12 3−n+1 wählen können, folgt
n−1
2
OS P (χC ) ≤ 2
3
(vi) Die Abbildung f : C → [0, 1]
f
∞
X
aj
j=1
3j
!
=
∞
X
j=1
aj
2
2j
ist surjektiv.
Wir überlegen uns zuerst, dass diese Abbildung wohldefiniert ist. Ein Element
x ∈ R hat entweder genau eine 3-adische Darstellung oder genau zwei 3-adische
Darstellungen. Wir müssen den Fall betrachten, dass x genau zwei 3-adische Darstellungen hat. Falls x genau zwei 3-adische Darstellungen hat und x ist ein Element der
Cantor Menge, dann hat nur eine Darstellung die Eigenschaft, dass die Koeffizienten
entweder 0 oder 2 sind. Wir überlegen uns dies.
Wenn eine Zahl zwei 3-adische Darstellungen besitzt, dann sind in einer der
Darstellungen fast alle Koeffizienten gleich 2. Wenn sämtliche Koeffizienten gleich 2
sind, dann handelt es sich um die Zahl 1, deren andere 3-adische Darstellung 310 ist.
Falls es einen Koeffizienten gibt, der von 2 verschieden ist, so muss es 0 sein.
Deshalb hat die andere 3-adische Darstellung dieser Zahl eine 1 als Koeffizienten.
Nun überlegen wir uns, dass die Abbildung surjektiv ist. Da wir sämtliche Koa
effizientenfolgen {aj }j∈N mit aj ∈ {0, 2} zulassen, handelt es sich bei { 2j }j∈N um
260
CHAPTER 5. INTEGRALRECHNUNG
sämtliche Folgen, der Glieder aus 0 oder 1 bestehen. Deshalb erhalten wir im Bild
alle dyadischen Darstellungen von Zahlen aus dem Intervall [0, 1].
(ix) [Nym] Wir verwenden die Darstellung
(
C=
)
∞
X
2cn cn ∈ {0, 1}
3n n=1
Die
Gleichung
C + C= [0, 2] ist äquivalent zu 21 C + 12 C = [0, 1]. Es gilt 12 C =
P∞
cn n=1 3n cn ∈ {0, 1} . Deshalb
)
∞
X
cn + dn =
cn , dn ∈ {0, 1}
3n n=1
( ∞
)
X bn =
bn ∈ {0, 1, 2} = [0, 1]
3n n=1
(
1
C
2
+ 21 C
In [87] wird eine geometrische Konstruktion verwendet, um dieses Ergebnis zu erzielen. Außerdem wird sowohl in [83] als auch [87] berechnet, auf wie viele verschiedene
Weisen man ein Element aus dem Intervall [0, 2] als Summe von zwei Elementen aus
C darstellen kann. Die Formel in [87] ist leider falsch, sie wurde in [83] korrigiert.
(x) Man kann das Ergebnis (ix) benutzen, um (x) P
zu beweisen. Es gilt C =
2
1 − C = {1 − x|x ∈ C}. Hierzu beachte man, dass 1 = ∞
n=1 3n . Somit gilt
)
∞
X
an = 1−
a ∈ {0, 2}
n n
3
) ( ∞
)
( ∞ n=1 X an X 2 − an =
an ∈ {0, 2} =
a ∈ {0, 2}
n
n n
3
3
n=1
n=1
(
1−C
Deshalb gilt weiter C + C = C + (1 − C) = 1 + (C − C), also C − C = 1 − (C + C) =
[−1, 1].
Wir wollen aber noch ein geometrische Argument angeben. Wir wollen zeigen,
dass es zu jedem a ∈ [−1, 1] Elemente x, y ∈ C gibt so dass a = y − x. Dies kann
man auch so formulieren: Hat die Gerade y = x + a mit C × C einen nichtleeren
Schnitt.
Wir wollen hier die
T∞Darstellung der Cantor Menge als Schnitt der Mengen Cn
verwenden, also C = n=1 Cn . Deshalb
C ×C =
∞
\
n=1
!
Cn
×
∞
\
n=1
!
Cn
=
∞
\
n,k=1
Cn × Ck =
In den Skizzen sind zwei dieser Mengen dargestellt.
∞
\
n=1
Cn × Cn
5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE
Konstruktion des Produktes der
Cantor Menge mit sich selbst
261
Konstruktion des Produktes der
Cantor Menge mit sich selbst
Wir betrachten nun den Schnitt einer Geraden y = x + a, a ∈ [−1, 1], mit den
Mengen Cn × Cn , n = 0, 1, . . . . Eine solche Gerade hat mit jeder Menge Cn × Cn
einen nichtleeren Schnitt. Wegen Kompaktheit hat damit auch C × C mit einer
solchen Geraden einen nichtleeren Schnitt.
y=x+a
2
Die Cantor Menge ist ein Fraktal. Benoit Mandelbrot hat 1975 den Begriff
”Fraktal” eingeführt. Er schrieb dazu:”Wolken sind keine Kugeln, Berge keine Kegel,
Küsten keine Kreise und die Baumrinde ist nicht glatt, noch wählt der Blitz eine
gerade Linie.”[Man, p.1] Fraktale haben im Vergleich zu Flächen und Körpern der
klassischen Geometrie eine irreguläre Struktur.Und wenn man diese Mengen durch
ein Vergrößerungsglas ansieht, dann treten weitere Irregularitäten hervor.
Mandelbrot hat folgende Definition gegeben: Ein Fraktal ist eine Menge, deren
Hausdorff-Besicovitch Dimension strikt größer als die topologische Dimension ist
262
CHAPTER 5. INTEGRALRECHNUNG
[Man, p.15]. Man kann zeigen, dass die Hausdorff-Besicovitch Dimension der Cantor
2
ist. Die topologische Dimension ist 0 [Edg].
Menge gleich ln
ln 3
Beispiel 5.3.2 Die Cantor Funktion φ : [0, 1] → [0, 1] ist durch
(∞ a )
∞
X j X
a
j
2
φ(x) = sup
und für alle j ∈ N gilt aj ∈ {0, 2}
x≥
j j
2
3
j=1
j=1
definiert. Es gelten
(i) Die Cantor Funktion ist eine stetige, wachsende Funktion.
(ii) Die Cantor Funktion ist in allen Punkten von C nicht differenzierbar und sie
ist in allen Punkten, die nicht in C liegen differenzierbar. Die Ableitung ist in allen
diesen Punkten gleich 0.
(iii) Für alle x, y ∈ [0, 1] gilt
ln 2
|φ(x) − φ(y)| ≤ 2|x − y| ln 3 .
Die Cantor Funktion wird auch Teufelstreppe genannt.
Beweis. (i) Es ist offensichtlich, dass φ wachsend ist.
Wir weisen die Stetigkeit von φ nach. Wir betrachten zwei Fälle, x ∈ C und
x∈
/ C. Zunächst der Fall x ∈
/ C. Da C kompakt ist ist das Komplement von C
offen. Also gibt es ein Intervall (x − , x + ), das im Komplement von C enthalten
ist. Da in diesem Intervall kein Element aus C enthalten ist, folgt
)
( ∞ a ∞
X
X j aj
2
und für alle j ∈ N gilt aj ∈ {0, 2}
φ(x + )
= sup
x+≥
j
2 3j
j=1
j=1
( ∞ a )
∞
X j X
a
j
2
= sup
und für alle j ∈ N gilt aj ∈ {0, 2}
x−≥
j
2
3j
j=1
j=1
= φ(x − )
Damit ist φ in einer Umgebung von x konstant, also stetig.
Wir nehmen nun an, dass x ∈ C. Damit gibt es Koeffizienten aj , so dass
x=
∞
X
aj
j=1
3j
mit
aj ∈ {0, 2}.
Zu gegebenen wählen wir j0 so groß, dass
2−j0 +1 < und wir wählen δ < 3−j0 . Für ein y ∈ C mit |x − y| < δ gibt es eine Darstellung
y=
∞
X
bj
3j
j=1
mit
bj ∈ {0, 2}
5.3. RIEMANN-MESSBARE MENGEN UND DIE CANTOR-MENGE
263
und es gilt
∞
X a − b j
j
< δ.
j
3 j=1
Es sei j1 die kleinste Zahl, so dass aj 6= bj . Dann gilt |aj1 − bj1 | und somit
δ>
∞
∞
X
X
|aj − bj |
2
|aj1 − bj1 |
−
≥
−
2
3−j = 3−j1 .
j
j1
3j1
3
3
j=j +1
j=j +1
1
1
Deshalb gilt j0 ≤ j1 und für alle z mit |z − x| < δ gilt
(∞ b )
∞
X j X
b
j
2
φ(z) = sup
und für alle j ∈ N gilt bj ∈ {0, 2}
z≥
2j 3j
j=1
j0
≤
j=1
∞
X
X aj
+
2j+1 j=j
j=1
0 +1
2−j ≤ φ(x) + 2−j0 < φ(x) + .
Die Ungleichung φ(x) ≤ φ(z) + wird ähnlich bewiesen.
(ii) Die Differenzierbarkeit in den Punkten x ∈
/ C wird genauso wie die Stetigkeit
nachgewiesen: f ist auf einer Umgebung konstant. Damit ist die Ableitung dort 0.
Nun zeigen wir, dass φ in den Punkten x ∈ C nicht differenzierbar ist. Es sei
also x ∈ C
∞
X
ai
x=
ai ∈ {0, 2}
i
3
i=1
und wir betrachten zuerst den Fall, dass die 3-adische Entwicklung von x unendlich
viele Koeffizienten besitzt, die gleich 2 sind. Es sei io so gewählt, dass ai0 = 2 gilt.
Dann wählen wir
(
∞
X
ai
falls i 6= i0
bi
mit
b
=
y=
i
3i
0
falls i = i0
i=1
Für den Differenzenquotienten erhalten wir
φ(x) − φ(y)
=
x−y
1
2i0
2
3i0
=
3i0
.
2i0 +1
Da wir i0 beliebig großwählen können, ist der Differenzquotient nicht beschränkt.
(Die linksseitige Steigung in x ist unendlich.)
Nun betrachten wir den Fall, dass die 3-adische Entwicklung von x unendlich
viele Koeffizienten besitzt, die gleich 0 sind. Es sei i0 so gewählt, dass ai0 = 0. Nun
wählen wir
(
∞
X
ai
falls i 6= i0
ci
z=
mit ci =
.
i
3
2
falls i = i0
i=1
Wir erhalten hier das analoge Ergebnis, die rechtsseitige Steigung ist unendlich. 2
264
CHAPTER 5. INTEGRALRECHNUNG
Beispiel 5.3.3 Es gibt halbstetige, beschränkte Funktionen auf [0, 1], die nicht Riemann integrierbar sind.
Tatsächlich gibt es eine charakteristische Funktion auf einer abgeschlossenen Menge, die nicht
Riemann integrierbar ist.
Beweis. Wir konstruieren eine Menge vom Cantortyp. Wir entnehmen dem Intervall [0, 1] das Intervall ( 21 −q, 12 +q). Den beiden übriggebliebenen Intervallen entnehmen wir wieder entsprechende
Intervalle. Die Vereinigung A über alle entnommenen Intervalle ist eine offene, dichte Menge in
[0, 1]. Die Funktion χAc ist nach oben halbstetig, aber nicht Riemann integrierbar. 2
5.4
Hauptsatz der Differential- und Integralrechnung
Es sei I ein Intervall und f : I → R eine Funktion, die auf jedem abgeschlossenen
Teilintervall von I Riemann integrierbar ist. Die Funktion F : I → R
Z x
F (x) =
f (t)dt
x0
heißt Integral von f .
Lemma 5.4.1 Es sei I ein Intervall und f : I → R eine Funktion, die auf jedem
abgeschlossenen Teilintervall von I Riemann integrierbar ist. Dann ist jedes Integral
F : I → R von f eine stetige Funktion.
Beweis. Es sei x ∈ I. Wir wollen die Stetigkeit von F in x nachprüfen. Es sei
{xn }n∈N eine Folge mit limn→∞ xn = x. Dann gibt es ein Intervall [a, b] ⊆ I mit
{xn }n∈N ⊂ [a, b]. Da f auf [a, b] Riemann integrierbar ist, ist f auf [a, b] beschränkt.
Damit gilt
Z xn
Z x
|F (xn ) − F (x)| = f (t)dt −
f (t)dt
Zx0x
Zx0 x
= f (t)dt ≤ |f (t)|dt ≤ |x − xn | sup |f (t)|.
xn
xn
t∈[a,b]
2
Lemma 5.4.2 Es sei I ein Intervall und f : I → R eine Funktion, die auf jedem
abgeschlossenen Teilintervall von I Riemann integrierbar ist. Außerdem sei f in
x ∈ I stetig. Dann ist jedes Integral F von f in x differenzierbar und es gilt
F 0 (x) = f (x).
5.4. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG
265
Beweis. Es sei {xn }n∈N eine Folge, die gegen x konvergiert. Wir zeigen, dass
F (xn ) − F (x)
= f (x).
n→∞
xn − x
lim
Es gilt
Z xn
Z x
1
F (xn ) − F (x)
f (t)dt − f (x)
− f (x) = f (t)dt −
xn − x
x −x
x0
x
n
Z xn0
1
= f (t)dt − f (x)
xn − x x
Z xn
1
=
f
(t)dt
−
(x
−
x)f
(x)
n
|xn − x| x
Z xn
Z xn
1
f
(x)dt
f
(t)dt
−
=
|xn − x| x
x
Z xn
1
=
f
(t)
−
f
(x)dt
|xn − x| x
Z xn
1
≤
|f (t) − f (x)|dt
|xn − x| x
≤ sup |f (x) − f (t)|.
t∈[x,xn ]
Also gilt
(5.4)
F (xn ) − F (x)
− f (x) ≤ sup |f (x) − f (t)|.
xn − x
t∈[x,xn ]
Wir zeigen nun, das man zu jedem > 0 ein N findet, so dass für alle n mit n > N
sup |f (x) − f (t)| < (5.5)
t∈[x,xn ]
gilt. Da f in x stetig ist
∀ > 0∃δ > 0∀t, |x − t| < δ :
|f (x) − f (t)| < .
Wegen limn→∞ xn = x
∀δ > 0∃N ∈ N∀n ≥ N :
|xn − x| < δ
Insgesamt erhalten wir
∀ > 0∃N ∈ N∀n ≥ N ∀t ∈ [x, xn ] :
|f (x) − f (t)| < .
Damit haben wir (5.5) gezeigt. Aus (5.4) und (5.5) folgt nun die Differenzierbarkeit
in x 2
Definition 5.4.1 Es sei I ein Intervall, f : I → R und F : I → R eine differenzierbare Funktion mit F 0 = f . Dann heißt F Stammfunktion von f .
266
CHAPTER 5. INTEGRALRECHNUNG
Da mit F auch F + c eine Stammfunktion ist, gibt es zu einer Funktion f , die
eine Stammfunktion besitzt, immer unendlich viele Stammfunktionen.
Andererseits unterscheiden sich zwei Stammfunktionen F1 und F2 immer nur um
eine Konstante. Dies gilt, weil
(F1 − F2 )0 = 0
Wir müssen Satz 3.6.3 anwenden.
Satz 5.4.1 (Hauptsatz der Differential- und Integralrechnung) Es sei f : [a, b] → R
eine stetige Funktion. Dann besitzt f eine Stammfunktion und für alle Stammfunktionen F gilt
Z
b
a
f (x)dx = F (b) − F (a).
Obwohl der Satz sicherstellt, dass es zu einer stetigen Funktion immer eine
Stammfunktion gibt, kann es sehr schwierig sein, eine solche Stammfunktion als
Zusammensetzung elementarer Funktionen explizit anzugeben.
2
Für die Funktion e−x lässt sich zeigen, dass dies unmöglich ist.
Beweis. Wir betrachten das Integral
Z
x
f (t)dt.
F (x) =
a
Nach Lemma 5.4.2 gilt F 0 (x) = f (x). Weiter gilt
Z b
f (x)dx = F (b) = F (b) − F (a).
a
Da sich zwei Stammfunktionen nur bis auf eine Konstante unterscheiden, folgt die
Gleichung auch für beliebige Stammfunktionen. 2
Wir wollen nun eine etwas allgemeinere Version vom Hauptsatz der Differentialund Integralrechnung angeben.
Satz 5.4.2 Es sei f : [a, b] → R Riemann integrierbar und F : [a, b] → R eine
Stammfunktion von f . Dann gilt
Z b
f (t)dt = F (b) − F (a).
a
Die Voraussetzung, dass f Riemann-integrierbar ist und eine Stammfunktion
besitzt ist etwas schwächer als die Stetigkeit, weil es differenzierbare Funktionen
gibt, deren Ableitung nicht stetig ist.
Es gibt unbeschränkte Funktionen f , die eine Stammfunktion besitzen. Umgekehrt
gibt es Riemann-integrierbare Funktionen, die keine Stammfunktion besitzen.
5.4. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG
267
Beweis. Es sei P = {x0 , x1 , . . . , xn } eine Partition von [a, b]. Dann gilt
F (b) − F (a) =
n
X
k=1
(F (xk ) − F (xk−1 )).
Mit dem Mittelwertsatz folgt, dass es ξk ∈ (xk−1 , xk ) gibt, so dass
F (b) − F (a) =
n
X
k=1
0
F (ξk )(xk − xk−1 ) =
n
X
k=1
f (ξk )(xk − xk−1 ).
Außerdem gilt
n
X
k=1
mk (f )(xk − xk−1 ) ≤
n
X
k=1
f (ξk )(xk − xk−1 ) ≤
n
X
k=1
Mk (f )(xk − xk−1 ).
Hieraus folgt
US P (f ) ≤ F (b) − F (a) ≤ OS P (f ).
Da f integrierbar ist, folgt
F (b) − F (a) = inf OS P (f ) = sup US P (f ) =
P
P
Z
b
f (t)dt.
a
2
Falls eine Funktion f : I → R eine Stammfunktion besitzt, so bezeichnen wir die
Menge {F | F ist Stammfunktion von f } mit
Z
f (x)dx
und nennen dies das unbestimmte Integral von f .
Falls f Riemann integrierbar ist, so muss f nicht notwendig eine Stammfunktion
besitzen. Umgekehrt muss eine Funktion, die eine Stammfunktion besitzt, nicht
notwendig Riemann integrierbar sein.
Beispiel 5.4.1 (i) Die Funktion f : [−1, 1] → R
(
−1
falls x ∈ [−1, 0]
f (x) =
1
falls x ∈ (0, 1]
ist Riemann integrierbar, sie besitzt aber keine Stammfunktion.
(ii) Die Funktion f : [0, 1] → R

falls x irrational ist oder x = 0
0
f (x) =
m
1
falls x =
und m und n teilerfremd sind
n
n
ist Riemann integrierbar, besitzt aber keine Stammfunktion.
(iii) Es sei
 2
falls x ∈ [−1, 1] und x 6= 0
 x cos xπ2
f (x) =

0
falls x = 0
Dann ist f 0 unbeschränkt, also insbesondere nicht Riemann-integrierbar.
268
CHAPTER 5. INTEGRALRECHNUNG
Beweis. (i) Wir betrachten die Partition
Pn =
−1, 0,
Wir erhalten
US Pn (f ) = 0 · 1 + 0 ·
1
,1
n
1
1
1
+1· 1−
=1− .
n
n
n
Es folgt
sup US Pn (f ) = 1.
n
Es gilt
OS Pn (f ) = 0 · 1 + 1 ·
1
1
+1· 1−
= 1.
n
n
Also ist f Riemann integrierbar.
Wir nehmen an, dass f eine Stammfunktion F hat. Dann gilt nach Satz 5.4.2 für alle x ∈ [−1, 1]
Z x
f (t)dt = F (x) − F (−1)
−1
Wir berechnen das Integral und erhalten
|x| − 1 = F (x) − F (−1)
oder
F (x) = |x| − 1 + F (−1)
Dies kann nicht sein, weil die linke Seite in 0 differenzierbar ist, die rechte Seite jedoch nicht.
(ii) Wir hatten in Beispiel ?? bereits gezeigt, dass f eine integrierbare Funktion ist, und dass
Z 1
f (t)dt = 0
0
gilt. Hieraus kann man folgern, dass für alle x ∈ [0, 1]
Z x
f (t)dt = 0
0
gilt. Wenn es also eine Stammfunktion geben würde, dann müsste diese eine konstante Funktion
sein. Diese ist aber sicherlich nicht die Stammfunktion von f .
(iii) Falls 0 6= x gilt, dann kann man die Kettenregel anwenden und erhält
π 2π
π
sin 2
f 0 (x) = 2x cos 2 +
x
x
x
Für x = 0 rechnet man aus
π
x2 cos xπ2
f 0 (0) = lim
= lim x cos 2 = 0
x→0
x→0
x
x
f ist also auf ganz [−1, 1] differenzierbar. Wir weisen nun nach, dass f 0 unbeschränkt ist. Eine
unbeschränkte Funktion ist nicht Riemann integrierbar.
Wir betrachten die Punkte
1
xn = q
n∈N
2n + 12
Dann gilt
0
f (xn ) = 2 q
2
r
1
2n +
1
2
cos π(2n +
1
2)
+ 2π
1
2n + sin π(2n + 12 ) = 2π
2
r
1
2n + .
2
5.4. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG
Beispiel 5.4.2 Es seien aq , q ∈ Q, positive reelle Zahlen, so dass
durch
X
f (x) =
aq
P
q∈Q
269
aq < ∞. Es sei f : R → R
q<x
gegeben. Dann ist f Riemann integrierbar und F : R → R
Z x
f (t)dt
F (x) =
0
ist auf R stetig, in allen irrationalen Punkten differenzierbar und in allen rationalen Punkten nicht
differenzierbar.
Beweis. In Satz 5.1.1 hatten wir gezeigt, dass eine monoton wachsende Funktion integrierbar ist.
Lemma 5.4.1 sagte aus, dass F auf R stetig ist.
In Beispiel 3.1.8 hatten wir gezeigt, dass f in den irrationalen Punkten stetig und in den
rationalen Punkten unstetig ist. Mit Lemma 5.4.2 folgt, dass F in den irrationalen Punkten
differenzierbar ist.
Es bleibt zu zeigen, dass F in den rationalen Punkten nicht differenzierbar ist. Es sei x0 ∈ Q.
Dann gilt
X
f (x) ≤
aq
für alle x ≤ x0
q<x0
X
f (x) ≥
aq
für alle x > x0
q≤x0
Wir nehmen an, F sei differenzierbar in x0 .
Z x
Z x
Z x0
1
1
F (x) − F (x0 )
=
f (t)dt
f (t)dt −
f (t)dt =
x − x0
x − x0
x − x0 x0
0
0
Für x < x0 erhalten wir
F (x) − F (x0 )
1
=
x − x0
x0 − x
Es folgt, dass F 0 (x0 ) ≤
P
q<x0
P
q≤x0
x
1
f (t)dt ≤
x0 − x
Z
x0
x
X
aq dt =
X
q<x0
q<x0
X
X
aq
aq . Andererseits gilt für x > x0
1
F (x) − F (x0 )
=
x − x0
x − x0
Es folgt, dass F 0 (x0 ) ≥
x0
Z
Z
x
x0
f (t)dt ≥
1
x − x0
Z
x
aq dt =
x0 q≤x
0
aq
q≤x0
aq . Dies kann nicht sein, weil ax0 > 0. 2
Beispiel 5.4.3 Es seien f, g : [a, b] → R zwei Riemann-integrierbare Funktionen, die auf einer
dichten Menge übereinstimmen. Zeigen Sie, dass die Integrale gleich sind.
Beweis. Wir zeigen zuerst: Es sei h : [a, b] → R eine Riemann-integrierbare Funktion, die auf
Rb
einer dichten Menge 0 ist. Dann gilt a hdx = 0. Da h Riemann-integrierbar ist, gilt
Z
a
b
h(x)dx = sup US P (h) = inf OS P (h).
P
P
Da h auf einer dichten Menge 0 ist, gilt für alle Partitionen P
US P (h) ≤ 0 ≤ OS P (h)
270
CHAPTER 5. INTEGRALRECHNUNG
und somit
sup US P (h) ≤ 0 ≤ inf OS P (h).
P
P
Wegen supP US P (h) = inf P OS P (h) folgt
b
Z
h(x)dx = 0.
a
Wenn nun zwei Riemann-integrierbare Funkktionen f und g auf einer dichten Menge übereinstimmen,
dann ist h = f − g auf einer dichten Menge 0. 2
5.5
Substitution und partielle Integration
Satz 5.5.1 Es sei φ : [α, β] → [a, b] stetig differenzierbar und es gelte φ([α, β]) =
[a, b]. Die Funktion f : [a, b] → R sei stetig auf [a, b]. Dann gilt
Z
φ(β)
Z
β
f (φ(ξ))φ0 (ξ)dξ.
f (x)dx =
φ(α)
α
Beweis. f hat eine Stammfunktion F , weil f stetig ist. Somit gilt
Z
φ(β)
φ(α)
f (x)dx = F (φ(β)) − F (φ(α)).
Andererseits folgt mit der Kettenregel, dass F ◦ φ eine Stammfunktion von (f ◦ φ)φ0
ist. Deshalb gilt
Z
β
f (φ(ξ))φ0 (ξ)dξ = F (φ(β)) − F (φ(α)).
α
2
Satz 5.5.2 Es seien f, g : [a, b] → R stetig differenzierbare Funktionen. Dann gilt
Z
a
b
0
f (x)g (x)dx = [f (b)g(b) − f (a)g(a)] −
b
Z
f 0 (x)g(x)dx.
a
Beweis. Die Produktregel besagt (f g)0 = f g 0 + f 0 g. Es folgt
Z
b
0
Z
(f g) (x)dx =
a
b
Z
0
b
f (x)g (x)dx +
a
f 0 (x)g(x)dx.
a
Hieraus folgt
f (b)g(b) − f (a)g(a) =
2
Z
b
0
Z
f (x)g (x)dx +
a
a
b
f 0 (x)g(x)dx.
5.6. MITTELWERTSATZ DER INTEGRALRECHNUNG
271
Beispiel 5.5.1 Man benutze partielle Integration, um eine Stammfunktion von ln zu finden.
Lösung. Wir setzen f = ln und g(x) = x. Dann folgt mit partieller Integration
Z x
Z x
Z x
ln(t)dt
=
f (t)g 0 (t)dt = [f (x)g(x) − f (1)g(1)] −
f 0 (t)g(t)dt
1
1
1
Z x
dt = x ln x − (x − 1)
= [x ln x − ln 1] −
1
Also ist x ln x − x eine Stammfunktion von ln. 2
5.6
Mittelwertsatz der Integralrechnung
Satz 5.6.1 (Mittelwertsatz der Integralrechnung) Es sei f : [a, b] → R eine stetige
Funktion. Dann existiert ein ξ ∈ (a, b) mit
Z
a
b
f (x)dx = f (ξ)(b − a).
Beweis. Da f stetig ist besitzt f eine Stammfunktion F . Nach dem Mittelwertsatz
gibt es ein ξ ∈ (a, b) mit
F (b) − F (a)
= F 0 (ξ) = f (ξ)
b−a
Das bedeutet
f (ξ)(b − a) = F (b) − F (a) =
Z
b
f (x)dx
a
2
Satz 5.6.2 Es seien f, g : [a, b] → R stetige Funktionen und g ≥ 0. Dann existiert
ein ξ ∈ (a, b) mit
Z b
Z b
f (x)g(x)dx = f (ξ)
g(x)dx
a
a
Beweis. Da f stetig ist, nimmt f auf [a, b] Minimum und Maximum an. Es gilt für
alle x ∈ [a, b]
min f (t) g(x) ≤ f (x)g(x) ≤ max f (t) g(x).
t∈[a,b]
t∈[a,b]
Damit folgt
Z b
Z b
Z b
(5.6)
min f (t)
g(x)dx ≤
f (x)g(x)dx ≤ max f (t)
g(x)dx.
t∈[a,b]
a
a
t∈[a,b]
a
272
CHAPTER 5. INTEGRALRECHNUNG
Deshalb gibt es ein c mit
min f (t) ≤ c ≤ max f (t)
t∈[a,b]
und
t∈[a,b]
b
Z
b
Z
f (x)g(x)dx = c
g(x)dx
a
Falls
Rb
a
a
gdx > 0, dann wählen wir
Rb
f (x)g(x)dx
.
Rb
gdx
a
Rb
Rb
Falls a gdx = 0, dann gilt wegen (5.6) auch a f (x)g(x)dx = 0. Dann können wir
ein beliebiges c wählen.
Da f aber stetig ist gibt es nach dem Zwischenwertsatz ein ξ ∈ [a, b] mit c = f (ξ).
2
c=
5.7
a
Uneigentliche Integrale
Es sei f : [a, ∞) → R eine Funktion, die auf jedem Intervall [a, b] mit b > a Riemann
integrierbar ist und für die der Grenzwert
Z b
f (x)dx
lim
b→∞
a
existiert. Dann heißt f uneigentlich Riemann integrierbar auf [a, ∞) und wir schreiben
Z b
Z ∞
f (x)dx.
f (x)dx = lim
b→∞
a
a
Ebenso wird für f : (−∞, b] → R das uneigentliche Integral
Z b
Z b
f (x)dx = lim
f (x)dx
a→−∞
−∞
a
definiert.
Eine Funktion f : (a, b] → R heißt uneigentlich Riemann integrierbar auf (a, b],
falls für alle mit 0 < < b − a die Funktion f auf [a + , b] integrierbar ist und der
Grenzwert
Z
b
lim
→0
f (x)dx
a+
existiert. Wir setzen dann
Z
b
Z
b
f (x)dx = lim
a
Ebenso für Funktionen f : [a, b) → R.
→0
f (x)dx.
a+
5.7. UNEIGENTLICHE INTEGRALE
273
Beispiel 5.7.1 (i) Es sei −1 < α < 0. Dann gilt
1
Z
1
α+1
xα dx =
0
(ii) Es sei β < −1. Dann gilt
∞
Z
xβ dx = −
1
1
β+1
(iii)
∞
Z
e−x dx = 1
0
(iv)
1
Z
0
(v)
1
x
ln xdx = −1
ist weder auf [0, 1] noch auf [1, ∞) uneigentlich Riemann integrierbar.
Beweis. (i)
1
Z
1
Z
α
xα dx = lim
h
xβ dx = lim
h
x dx = lim
→0
0
→0
α+1
1
α+1 x
i1
= lim
→0
1
α+1
−
α+1
1
α+1 =
1
α+1
(ii)
Z
∞
Z
β
x dx = lim
b→∞
1
b
b→∞
1
β+1
1
β+1 x
ib
1
= lim
b→∞
β+1
1
β+1 b
−
1
β+1
1
= − β+1
(iii)
Z
∞
−x
e
b
Z
dx = lim
b→∞
0
b
e−x dx = lim −e−x 0 = lim −e−b + 1 = 1
b→∞
0
b→∞
(iv)
Z
1
1
Z
ln xdx
=
0
=
→0
1
ln xdx = lim [x ln x − x]
lim
→0
lim (−1 − ( ln − )) = −1 − lim ( ln − ) = −1
→0
→0
(v)
1
Z
0
Z
1
∞
1
dx = lim
→0
x
Z
1
1
dx = lim
b→∞
x
1
1
dx = lim [ln x] = lim (− ln ) = ∞
→0
→0
x
b
Z
1
1
1
dx = lim [ln x] = lim (ln b) = ∞
b→∞
b→∞
x
2
Lemma 5.7.1 Die Funktion g : [a, ∞) → R sei uneigentlich Riemann integrierbar
und f : [a, ∞) → R sei für alle b mit a < b auf [a, b] Riemann integrierbar. Für alle
x ∈ [a, ∞) gelte 0 ≤ f (x) ≤ g(x). Dann ist auch f auf [a, ∞) uneigentlich Riemann
integrierbar und es gilt
Z
Z
∞
a
∞
f (x)dx ≤
g(x)dx
a
Dasselbe Ergebnis gilt auch für uneigentliche Integrale auf (a, b].
274
CHAPTER 5. INTEGRALRECHNUNG
Beweis. Wegen Lemma 5.1.4 gilt für alle b und c mit b < c
Z c
Z b
Z b
g(x)dx.
g(x)dx ≤
f (x)dx ≤
a
a
a
Es folgt, dass
Z
a
b
f (x)dx ≤
Z
∞
g(x)dx.
a
Somit ist das linke Integral eine beschränkte Funktion in b. Außerdem ist dieses
Integral eine monoton wachsende Funktion in b, weil f (x) ≥ 0. Damit existiert
Z b
lim
f (x)dx.
b→∞
a
2
5.8
Gammafunktion
Die Fakultätsfunktion bildet eine natürliche Zahl n auf n! ab. Die Gammafunktion
Γ erweitert die Fakultätsfunktion auf reelle und schließlich komplexe Zahlen. Sie
erfüllt die Funktionalgleichung (Satz 5.8.2)
∀x > 0 :
Γ(x + 1) = xΓ(x),
woraus mit Γ(1) = 1
Γ(n + 1) = n!
folgt. Tatsächlich legt diese Funktionalgleichung die Gammafunktion im Wesentlichen
fest. Wenn man zusätzlich fordert, dass Γ logarithmisch konvex ist, d.h. dass ln Γ
konvex ist, dann gibt es nur eine solche Funktion.
Satz 5.8.1 Für alle x > 0 existiert das Integral
Z ∞
e−t tx−1 dt.
Γ(x) =
0
Wir bezeichnen die durch das Integral definierte Funktion Γ : (0, ∞) → R als Eulersche Gammafunktion.
Beweis. Es sei x > 0 gegeben. Wir zeigen zunächst, dass es eine Konstante b ∈ R
gibt, so dass für alle t ∈ [b, ∞)
(5.7)
e−t tx−1 ≤
1
t2
gilt. Um dies zu zeigen, reicht es nachzuweisen, dass für alle x > 0
(5.8)
lim e−t tx+1 = 0
t→∞
5.8. GAMMAFUNKTION
275
gilt. In der Tat, falls (5.8) gilt, dann gilt für alle x > 0
∀ > 0∃b ∈ R∀t ≥ b :
e−t tx+1 < .
Wir wählen = 1 und erhalten (5.7). Wir zeigen nun (5.8). Diese Gleichung folgt mit
der Formel von L’Hôpital (Satz 3.11.3). Wir wählen n ∈ N mit x−n ≤ 0 < x−n+1.
Es folgt für alle x > 0
lim e−t tx−n = 0
t→∞
und damit
(x + 1)tx
tx−n
tx+1
=
lim
=
·
·
·
=
(x
+
1)x(x
−
1)
·
·
·
(x
−
n
+
1)
lim
= 0.
t→∞
t→∞ et
t→∞ et
et
lim
Die Funktion t−2 ist auf [b, ∞) nach Beispiel 5.7.1 uneigentlich Riemann integrierbar,
also ist mit Lemma 5.7.1 und (5.7) auch e−t tx−1 auf [b, ∞) uneigentlich Riemann
integrierbar.
Für x ≥ 1 ist die Funktion e−t tx−1 auf [0, b] stetig und damit Riemann integrierbar. Falls 0 < x < 1 dann gilt auf (0, b]
0 ≤ e−t tx−1 ≤ tx−1 .
Nach Beispiel 5.7.1 ist die Funktion tx−1 auf (0, 1] uneigentlich Riemann integrierbar.
Deshalb gilt
Z b
Z b
Z b
x−1
−t x−1
t dt = lim
tx−1 dt = lim( x1 bx − x1 x ) = x1 bx .
e t dt ≤
→0
0
0
→0
Satz 5.8.2 (i) Für alle x > 0 gilt
Γ(x + 1) = xΓ(x).
(ii) Für alle n = 0, 1, 2, . . . gilt
Γ(n + 1) = n! .
Beweis. (i) Wir verwenden partielle Integration mit f (t) = −e−t und g(t) = tx .
Z b
Z b
Z b
−t x
−t x b
−t x−1
−b x
−1
e t dt = [−e t ]1 +
e xt dt = (−e b + e ) +
e−t xtx−1 dt
1
1
Z
1
∞
1
Z b
−b x
−1
−t x−1
e t dt = lim (−e b + e ) +
e xt dt
−t x
b→∞
1
Mit (5.8) folgt
lim −e−b bx = 0.
b→∞
276
CHAPTER 5. INTEGRALRECHNUNG
Also
∞
Z
1
e t dt = + x
e
−t x
1
Genauso erhalten wir
Z 1
Z
−t x
−t x 1
e t dt = [−e t ]a +
∞
Z
e−t tx−1 dt.
1
1
−t
e xt
x−1
dt = (−e
−1
−a x
1
+e a )+
a
a
Z
e−t xtx−1 dt
a
Wegen Stetigkeit und x > 0 gilt
lim e−a ax = 0.
a→0
Also
1
Z
1
e t dt = − + x
e
−t x
0
Insgesamt
Z
∞
Z
−t x
e t dt = x
0
1
Z
e−t tx−1 dt.
0
∞
e−t tx−1 dt.
0
(ii) Wir zeigen die Aussage mit Induktion. Wegen Beispiel 5.7.1 gilt
Z ∞
Γ(1) =
e−t dt = 1.
0
Mit (i) und der Induktionsannahme folgt
Γ(n + 1) = nΓ(n) = n(n − 1)! = n!.
2
Satz 5.8.3 (Betafunktion) Für alle x, y ∈ R mit x, y > 0 gilt
Z 1
Γ(x)Γ(y)
tx−1 (1 − t)y−1 =
B(x, y) =
Γ(x + y)
0
Lemma 5.8.1
dΓ
=
dx
Z
∞
tx−1 (ln t)e−t dt
0
Satz 5.8.4 (Bohr-Mollerup) Eine Funktion G : (0, ∞) → (0, ∞) ist auf (0, ∞)
genau dann gleich der Gammafunktion, wenn G(1) = 1, für alle x > 0 G(x + 1) =
xG(x) gilt und G logarithmisch konvex ist, d.h. ln G konvex ist.
Für x < 0 und x ∈
/ Z definieren wir
Γ(x) =
Γ(x + n)
x(x + 1) . . . (x + n − 1)
wobei 0 < x + n < 1.
Die Gammafunktion tritt z.B. bei der Berechnung des Volumens der n-dimensionalen
Euklidischen Kugel auf:
n
π2
n
R
.
Γ( n2 + 1)
5.9. BOGENLÄNGE
5.9
277
Bogenlänge
Es sei f : [a, b] → R. Wir bezeichnen
Graph(f ) = {(x, f (x))|x ∈ [a, b]}
als den Graphen der Funktion f . Der Abstand von zwei Punkten (x0 , y0 ) und (x1 , y1 )
in R2 ist
p
|x0 − x1 |2 + |y0 − y1 |2 .
(Dies folgt aus dem Satz von Pythagoras.) Deshalb sagen wir auch, dass dies die
Länge der Verbindungsgeraden zwischen diesen Punkten ist. Deshalb setzen wir die
Kurvenlänge für eine Funktion f (x) = cx + d von (x0 , f (x0 )) bis (x1 , f (x1 )) als
p
|x0 − x1 |2 + |f (x0 ) − f (x1 )|2
fest. Für einen Polygonzug f , d.h. f : [a, b] → R, a = x0 < x1 < · · · < xn = b und
für alle i = 1, . . . , n
für x ∈ [xi−1 , xi ]
f (x) = ci x + di
und für alle i = 1, . . . , n − 1
ci xi + di = ci+1 xi + di+1
Als Länge eines Polygonzuges definieren wir
L(Graph(f )) =
n
X
p
|xi−1 − xi |2 + |f (xi−1 ) − f (xi )|2 .
i=1
Wir wollen nun den Graphen einer beliebigen Funktion f durch Polygonzüge approximieren und die Länge des Graphen von f als den Grenzwert der Längen der
Polygonzüge definieren. Für eine beliebige Funktion f und eine Partition P von
[a, b] setzen wir
LP (Graph(f )) =
n
X
p
i=1
|xi−1 − xi |2 + |f (xi−1 ) − f (xi )|2 .
Lemma 5.9.1 Es sei f : [a, b] → R eine Funktion. Falls P 0 eine Verfeinerung von
P ist, so gilt
LP (Graph(f )) ≤ LP 0 (Graph(f )).
Definition 5.9.1 Wir sagen, dass der Graph der Funktion f rektifizierbar ist, wenn
sup LP (Graph(f )) < ∞
P
und wir setzen dann
L(Graph(f )) = sup LP (Graph(f )).
P
278
CHAPTER 5. INTEGRALRECHNUNG
Satz 5.9.1 Falls f : [a, b] → R stetig differenzierbar ist, so ist Graph(f ) rektifizierbar und es gilt
Z bp
1 + |f 0 (x)|2 dx.
L(Graph(f )) =
a
Man beachte, dass in der Voraussetzung gefordert wird, dass f auf dem abgeschlossenen Intervall [a, b] stetig differenzierbar ist, es reicht nicht zu fordern, dass f auf dem
abgeschlossenen Intervall [a, b] differenzierbar und auf dem offenen (a, b) stetig differenzierbar ist (Beispiel 5.9.2).
In den Punkten a und b ist f einseitig differenzierbar.
Beweis. Es sei P eine Partition von [a, b].
n
X
p
|xi−1 − xi |2 + |f (xi−1 ) − f (xi )|2
LP (Graph(f )) =
i=1
s
n
X
f (xi−1 ) − f (xi ) 2
=
(xi − xi−1 ) 1 + x
−
x
i−1
i
i=1
Nach dem Mittelwertsatz gibt es zu jedem i = 1, . . . , n ein ξi ∈ (xi−1 , xi ) mit
f 0 (ξi ) =
f (xi ) − f (xi−1 )
xi − xi−1
Damit erhalten wir
LP (Graph(f )) =
n
X
p
i=1
1 + |f 0 (ξi )|2 (xi − xi−1 ).
Da f stetig differenzierbar ist, ist die Funktion
integrierbar. Deshalb gilt
n
X
p
sup US P ( 1 + |f 0 |2 ) = sup
P
P
= inf
P
n
X
sup
i=1 t∈[xi−1 ,xi ]
i=1
p
1 + |f 0 |2 stetig und damit Riemann-
inf
t∈[xi−1 ,xi ]
p
1 + |f 0 (t)|2 (xi − xi−1 )
p
p
1 + |f 0 (t)|2 (xi − xi−1 ) = inf OS P ( 1 + |f 0 |2 ).
P
Nach Definition des Integrals sind alle diese Ausdrücke gleich dem Integral
Z bp
a
1 + |f 0 (x)|2 dx.
5.9. BOGENLÄNGE
279
Weiter gilt für alle P
n
X
p
0
2
US P ( 1 + |f | ) =
≤
i=1
n
X
i=1
inf
t∈[xi−1 ,xi ]
p
1 + |f 0 (t)|2 (xi − xi−1 )
p
1 + |f 0 (ξi )|2 (xi − xi−1 )
= LP (Graph(f ))
n
X
p
sup
1 + |f 0 (t)|2 (xi − xi−1 )
≤
i=1 t∈[xi−1 ,xi ]
p
= OS P ( 1 + |f 0 |2 ).
Wir erhalten also
p
p
US P ( 1 + |f 0 |2 ) ≤ LP (Graph(f )) ≤ OS P ( 1 + |f 0 |2 ).
Es folgt für alle Partitionen P und Q
LP (Graph(f )) ≤ LP∪Q (Graph(f ))
p
p
≤ OS P∪Q ( 1 + |f 0 |2 ) ≤ OS Q ( 1 + |f 0 |2 ).
Hieraus folgt für alle Partitionen P
LP (Graph(f )) ≤ inf OS Q (
Q
p
1 + |f 0 |2 )
und weiter
p
sup LP (Graph(f )) ≤ inf OS Q ( 1 + |f 0 |2 ).
Q
P
Es folgt
Z bp
L(Graph(f )) ≤
1 + |f 0 (x)|2 dx.
a
Andererseits folgt sofort, dass
Z bp
p
1 + |f 0 (x)|2 dx = sup US P ( 1 + |f 0 |2 ) ≤ sup LP (Graph(f )) = L(Graph(f )).
a
P
P
2
Beispiel 5.9.1 (i) (Kettenlinie) Es sei f : [a, b] → R mit f (x) = cosh(x) = 21 (ex + e−x ). Dann
gilt
L(Graph(f )) = sinh(b) − sinh(a)
3
(ii) Es sei f : [0, 1] → R mit f (x) = x 2 . Dann gilt
L(Graph(f )) =
8
13 23
27 (( 4 )
− 1) = 1.44 . . .
280
CHAPTER 5. INTEGRALRECHNUNG
Beweis. (i) Wir benutzen cosh0 = sinh, sinh0 = cosh und 1 + sinh2 x = cosh2 x.
b
Z
L(Graph(f )) =
Z
a
b
=
a
Z
q
1 + | cosh0 (x)|2 dx =
b
p
1 + | sinh(x)|2 dx
a
cosh(x)dx = sinh(b) − sinh(a)
(ii)
1
Z
L(Graph(f )) =
p
0
1 + |f 0 (x)|2 dx =
Z
0
1
q
1 + 94 xdx
Wir führen nun die Substitution t = 1 + 49 x bzw. x = 49 (t − 1) durch.
Z
13
4
L(Graph(f )) =
1
4
9
√
tdt =
4
9
h
2 32
3t
i 13
4
1
=
8
13 23
27 (( 4 )
− 1) = 1.44 . . .
2
Lemma 5.9.2 Es sei f : [a, b] → R eine stetige, wachsende oder fallende Funktion.
Dann ist der Graph von f rektifizierbar und es gilt
p
|b − a|2 + |f (b) − f (a)|2 ≤ L(Graph(f )) ≤ |b − a| + |f (b) − f (a)|.
Beweis. Wir nehmen an, dass f monoton wachsend ist. Wir zeigen die linke
Ungleichung. Wir wählen als Partition P = {a, b}. Dann erhalten wir
p
|b − a|2 + |f (b) − f (a)|2 = LP (Graph(f )) ≤ L(Graph(f ))
Nun die rechte Abschätzung. Es sei P = {x0 , . . . , xn }. Es gilt
LP (Graph(f )) =
n
X
p
|xi−1 − xi |2 + |f (xi−1 ) − f (xi )|2
i=1
n
X
≤
(|xi−1 − xi | + |f (xi−1 ) − f (xi )|)
i=1
Da f monoton wachsend ist
LP (Graph(f )) ≤
n
X
i=1
(xi − xi−1 ) +
n
X
i=1
(f (xi ) − f (xi−1 )) = b − a + f (b) − f (a).
2
Beispiel 5.9.2 Es sei f : [0, 1] → R durch
 2
 x cos xπ2
f (x) =

0
falls x ∈ [−1, 1] und x 6= 0
falls x = 0
f ist differenzierbar auf [0, 1] und auf (0, 1) stetig differenzierbar. Der Graph von f ist nicht
rektifizierbar.
5.10. DIE TRIGONOMETRISCHEN FUNKTIONEN
281
Beweis.
1
Z
p
1 + |f 0 (x)|2 dx
Wir substituieren t =
Z
1
p
1+
π
x2
≥
1
Z
Z
0
1
2x cos π + 2π sin π dx
x2
x
x2 |f (x)|dx =
Z 1
π 2π
≥
x sin x2 dx − 2.
. Wir erhalten für alle n mit 2πn + π ≤
|f 0 (x)|2 dx
π
2
π
2
Z 2πn+π √
√
t |sin t| dt ≥ 2 π
t |sin t| dt
π
2πn
Z
π
√ √
√ √
sin tdt = 4 π 2πn.
≥ 2 π 2πn
√
≥ 2 π
Z
√
0
2
Beispiel 5.9.3 Es sei φ : [0, 1] → [0, 1] die Cantorfunktion. Dann gilt
L(Graph(f )) = 2
Beweis. Aus Lemma 5.9.2 folgt sofort, dass
L(Graph(f )) ≤ 2
2
5.10
Die trigonometrischen Funktionen
√
1 − t2
t
Der Cosinus des Winkels, der durch den Kreisbogen über dem Intervall [t, 1] gegeben
ist, ist t. Wir werden zeigen, dass die Länge dieses Kreisbogens gleich
Z 1
1
√
dx
1 − x2
t
282
CHAPTER 5. INTEGRALRECHNUNG
ist. Damit erhalten wir
1
1
√
dx = t
cos
1 − x2
t
bzw. wenn arccos die zu cos inverse Funktion bezeichnet
Z 1
1
√
arccos t =
dx.
1 − x2
t
Z
Diese Formel ermöglicht es uns, Ableitungen und weitere Formeln trigonometrischer
Funktionen zu berechnen.
Lemma 5.10.1 (i) Das uneigentliche Riemann Integral
Z 1
1
√
dx
1 − x2
0
existiert.
√
(ii) Es sei x ∈ [0, 1] und f : [0, x] → R mit f (t) = 1 − t2 . Dann gilt
Z x
1
√
dt.
L(Graph(f )) =
1 − t2
0
Beweis. (i) Es gilt für alle x ∈ [0, 1)
√
Hieraus folgt
Z 1−
0
√
1
1
1
√
≤√
=√
.
2
1−x
1−x 1+x
1−x
1
dx ≤
1 − x2
Z
1−
0
und damit
Z
√
√
1
√
dx = [−2 1 − t]01− = 2 − 2 1−x
1
1
dx ≤ 2.
1 − x2
0
(ii) Wir betrachten zuerst den Fall x < 1. Mit Satz 5.9.1
Z xp
Z xr
Z x
2
t
1
√
L(Graph(f )) =
1 + |f 0 (t)|2 dt =
1+
dt
=
dt.
1 − t2
1 − t2
0
0
0
√
Nun der Fall x = 1. Mit Lemma 5.9.2 folgt, dass der Graph von f rektifizierbar
ist. Wir setzen fn1 : [0, 1 − n1 ] → R mit fn1 (x) = f (x) und fn2 : [1 − n1 , 1] → R mit
fn2 (x) = f (x). Dann gilt für alle n ∈ N
L(Graph(f )) = L(Graph(fn1 )) + L(Graph(fn2 )).
Nach Satz 5.9.1 gilt
L(Graph(fn1 ))
Z
=
0
1
1− n
1
√
dt.
1 − t2
5.10. DIE TRIGONOMETRISCHEN FUNKTIONEN
283
Deshalb gilt für alle n ∈ N
L(Graph(f )) ≥
1
1− n
Z
0
und somit
L(Graph(f )) ≥
√
1
Z
√
0
Wegen Lemma ?? gilt
1
L(Graph(fn2 )) ≤ +
n
s
1
dt
1 − t2
1
dt.
1 − t2
1
1− 1−
n
2
1
≤ +
n
r
2
.
n
Hiermit folgt für alle n ∈ N
L(Graph(f )) ≤
1
Z
0
√
1
dt.
1 − t2
Also gilt
L(Graph(f )) ≤
2
Z
0
1
1− n
1
1
√
dt + +
n
1 − t2
r
2
≤
n
Z
0
1
1
1
√
dt + +
n
1 − t2
r
2
.
n
Definition 5.10.1 Die Zahl π ist der halbe Umfang eines Kreises mit Radius 1.
Da der Graph der Funktion f : [0, 1] → R mit f (t) =
beschreibt, gilt
Z 1
1
π
√
=
dx.
2
1 − x2
0
√
1 − t2 einen Viertelkreis
Weiter definieren wir ` : [−1, 1] → R
Z 1
1
√
dt
`(x) =
1 − t2
x
√
Anschaulich ist `(x) die Länge des Kreisbogens zwischen den Punkten (x, 1 − x2 )
und (1, 0).
Lemma 5.10.2 (i) `(1) = 0 und `(−1) = π.
(ii) ` ist eine stetige, strikt fallende, beschränkte Funktion.
(iii) ` ist auf (−1, 1) differenzierbar und es gilt
`0 (x) = − √
Beweis. 2
1
.
1 − x2
284
CHAPTER 5. INTEGRALRECHNUNG
Definition 5.10.2 Wir definieren nun
arccos s = `(s)
cos t = `−1 (t)
√
sin t =
1 − cos2 t
s ∈ [−1, 1]
t ∈ [0, π]
t ∈ [0, π]
Lemma 5.10.3 (i) arccos ist auf [−1, 1] stetig und auf (−1, 1) differenzierbar. Es
gilt
1
arccos0 s = − √
1 − s2
(ii) sin und cos sind auf [0, π] stetig.
(iii) sin und cos sind auf (0, π) differenzierbar und es gilt
sin0 = cos
cos0 = − sin
Beweis. (i) Nach Lemma ?? ist ` auf [−1, 1] stetig und auf (−1, 1) differenzierbar.
(ii) ` ist auf [−1, 1] stetig und strikt monoton fallend. Deshalb existiert die
Umkehrfunktion `−1 und sie ist stetig.
(iii) Da ` differenzierbar auf (−1, 1) ist, so ist `−1 auf (0, π) differenzierbar.
Außerdem gilt
d −1
1
1
d
cos t =
` (t) = d` −1
=
dt
dt
− √ 1−1 2
(` (t))
ds
1−|` (t)|
p
p
−1
2
= − 1 − |` (t)| = − 1 − cos2 (t) = − sin t.
Mit der Kettenregel folgt
d
dp
cos t sin t
sin t =
1 − cos2 (t) = √
= cos t
dt
dt
1 − cos2
2
Nun definieren wir die Funktionen für alle reellen Zahlen.
cos t = cos(−t)
sin t = − sin(−t)
t ∈ [−π, 0)
und
cos(2π + t) = cos t
sin(2π + t) = sin t
t∈R
Auch die fortgesetzten Funktionen sin und cos sind auf ganz R differenzierbar und
es gilt sin0 = cos und cos0 = − sin.
5.10. DIE TRIGONOMETRISCHEN FUNKTIONEN
285
Wir setzen
arcsin t
= sin−1 t
arctan t
= tan−1 t
π
π
< arcsin t <
2
2
π
π
t ∈ (−∞, ∞) und − < arctan t <
2
2
t ∈ (−∞, ∞) und −
Es gelten
1
arcsin0 (t) = √
1 − t2
und
arctan0 (t) =
1
.
1 + t2
Beispiel 5.10.1 (Weierstraß) [31, 49, 114] Es seien 0 < a < 1 und 1 ≤ a · b. Dann ist die
Funktion f : R → R mit
∞
X
f (x) =
an cos(bn πx)
n=0
überall stetig und nirgendwo differenzierbar
Weierstraß zeigte die Aussage in seiner Arbeit [114] für alle a mit 0 < a < 1 und alle ungeraden,
natürlichen Zahlen b mit 1 + 23 π < a · b. Hardy verbesserte dies Ergebnis [49] zu der obigen
Formulierung.
Lemma 5.10.4 Für alle s ∈ R und alle t > 0 gilt
1
| cos(π(s + t) − cos(πs))| ≤ π.
t
Beweis. Wir betrachten die Funktion g : [s, s + t] → R mit g(x) = cos(πx). Nach dem Mittelwertsatz gibt es ein x0 ∈ (s, s + t), so dass
g 0 (x0 ) =
Also
−π sin(πx0 ) =
1
(cos(π(s + t) − cos(πs)))
t
Es folgt
π ≥ |π sin(πx0 )| =
2
g(s + t) − g(s)
.
t
1
| cos(π(s + t) − cos(πs))|.
t
Beweis von Beispiel 5.10.1. Die Stetigkeit von f folgt mit dem Satz 3.12.1. In der Tat, die
Reihe konvergiert gleichmäßig.
Für alle m ∈ N existiert ein `m ∈ N, so dass
`m −
1
1
< bm r ≤ `m +
2
2
Wir setzen
`m + m = bm r
Es folgt
0<
Für hm =
(5.9)
1−m
bm
1 −m
1 − m
3
b
≤
< b−m
m
2
b
2
erhalten wir
0<
3
1 −m
b
≤ hm < b−m
2
2
286
CHAPTER 5. INTEGRALRECHNUNG
und es gilt
lim hm = 0.
m→∞
Es gilt
1
f (r + hm ) − f (r)
=
hm
hm
=
m−1
X
n=0
∞
X
n=0
n
n
a cos(b π(r + hm )) −
∞
X
!
n
n
b cos(b πr)
n=0
∞
X
an
an
(cos(bn π(r + hm )) − cos(bn πr)) +
(cos(bn π(r + hm )) − cos(bn πr))
hm
h
n=m m
Wir schätzen den ersten Summanden ab. Wegen Lemma 5.10.4 gilt
| cos(bn π(r + hm )) − cos(bn πr)| ≤ πhm bn
Hiermit folgt
(5.10)
m−1
m−1
X an
X
am bm − 1
n
n
(cos(b π(r + hm )) − cos(b πr)) ≤ π
an bn = π
hm
ab − 1
n=0
k=0
Nun schätzen wir den zweiten Summanden nach unten ab. Dazu zeigen wir, dass für alle n mit
n≥m
(5.11)
cos(bn π(r + hm )) = (−1)`m +1
Es gilt
bn π(r + hm ) = bn−m π(bm r + bm hm ) = bn−m π(`m + m + 1 − m ) = bn−m π(`m + 1)
Da bn−m ∈ N und ungerade und `m + 1 ∈ N, so ist bn−m (`m + 1) gerade, wenn `m ungerade ist,
und umgekehrt. Es folgt (5.11).
Es gilt für alle n mit n ≥ m
cos(bn πr) = (−1)`m cos(bn−m πm ).
Wir zeigen dies. Wegen bn πr = bn−m πbm r = bn−m π(`m + m )
cos(bn πr) = cos(bn−m π(`m + m )) = cos(bn−m π`m ) cos(bn−m πm ) − sin(bn−m π`m ) sin(bn−m πm )
Da bn−m `m ∈ N, gilt sin(bn−m π`m ) = 0. bn−m ist eine ungerade, natürliche Zahl. Deshalb ist
bn−m `m eine gerade Zahl, wenn `m gerade ist, und eine ungerade Zahl, wenn `m ungerade ist. Es
folgt
cos(bn πr) = (−1)`m cos(bn−m πm ).
Es gilt
∞
X an
n
n
(cos(b π(r + hm )) − cos(b πr))
h
m
n=m
∞
X an
`m +1
`m
n−m
=
(−1)
− (−1) cos(b
πm ) h
n=m m
∞
X
an
=
(−1)`m +1 1 + cos(bn−m πm ) n=m hm
∞
(−1)`m +1 X an
n−m
1 + cos(b
πm ) = hm
h
n=m m
5.11. DAS PRODUKT VON WALLIS
287
Da 1 + cos(bn−m πm ) ≥ 0, an > 0 und hm > 0
∞
∞
X
am
an
1 X n
n
n
=
(cos(b
π(r
+
h
))
−
cos(b
πr))
(1 + cos(πm ))
a 1 + cos(bn−m πm ) ≥
m
n=m hm
hm n=m
hm
Da − 12 ≤ m ≤ 12 , so gilt − π2 ≤ πm ≤ π2 . Mit (5.9)
∞
X
am
an
2
(cos(bn π(r + hm )) − cos(bn πr)) ≥
= am bm
n=m hm
hm
3
Hiermit folgt
2 m m
a b
3
∞
X
an
n
n
≤ (cos(b π(r + hm )) − cos(b πr))
n=m hm
!
m−1
f (r + h ) − f (r)
X
1
m
= an cos(bn π(r + hm )) −
hm
hm n=0
!
X
f (r + hm ) − f (r) 1 m−1
n
n
+
≤ a
cos(b
π(r
+
h
))
.
m
hm
hm
n=0
Mit (5.10)
2 m m
am bm − 1 f (r + hm ) − f (r) a b −π
≤
.
3
ab − 1
hm
2
5.11
Das Produkt von Wallis
John Wallis (1616-1703) studierte in Cambridge Theologie und war als Kaplan tätig. Nachdem
es ihm im Bürgerkrieg gelungen war, verschlüsselte Botschaften zu entschlüsseln, wurde er von
Cromwell auf den Savilian Chair of Geometry in Oxford berufen.
Wallis konnte umfangreiche Rechnungen im Kopf ausführen, wie z.B. die Berechnung der
Wurzel einer 50-stelligen Zahl.
Satz 5.11.1
n
∞
Y
Y
4k 2
4k 2
π
= lim
=
2 n→∞ k=1 4k 2 − 1 k=1 4k 2 − 1
Eine weitere Schreibweise für die Formel von Wallis ist
π
2 2 4 4 6 6
= · · · · · ···
2
1 3 3 5 5 7
(5.12)
Beweis. Wir setzen für m = 0, 1, 2, . . .
Z
Am =
π
2
sinm xdx
0
Es gilt
Z
A0 =
0
π
2
π
dx =
2
Z
A1 =
π
2
sin xdx = 1
0
288
CHAPTER 5. INTEGRALRECHNUNG
Wir erhalten für m ≥ 2 die folgende Rekursionsformel
Am =
m−1
Am−2
m
Wir weisen dies nach. Dazu benutzen wir partielle Integration.
Z
Z
m
m−1
sin xdx = − cos x sin
x + (m − 1) cos2 x sinm−2 xdx
Wir nutzen aus, dass cos2 x = 1 − sin2 x.
Z
Z
m
m−1
sin xdx = − cos x sin
x + (m − 1) sinm−2 x − sinm xdx
Hieraus erhalten wir
Z
Z
m
m−1
m sin xdx = − cos x sin
x + (m − 1) sinm−2 xdx
Wir setzen nun Integrationsgrenzen ein.
Z π
Z
π
2
m
m−1
2
m
sin xdx = [− cos x sin
x]0 + (m − 1)
0
π
2
sinm−2 xdx
0
Es ergibt sich
Z
π
2
m
0
m
sin xdx = (m − 1)
Z
π
2
sinm−2 xdx
0
Wir erhalten weiter
n
(2n − 1)(2n − 3) · · · 3 · 1 π
π Y 2k − 1
=
=
2n(2n − 2) · · · 4 · 2 2
2 k=1 2k
A2n
n
Y 2k
2n(2n − 2) · · · 4 · 2
=
=
(2n + 1)(2n − 1) · · · 5 · 3 k=1 2k + 1
A2n+1
Hieraus erhalten wir
n
n
A2n+1
2Y
(2k)2
2 Y 4k 2
=
=
A2n
π k=1 (2k + 1)(2k − 1)
π k=1 4k 2 − 1
Wir zeigen nun, dass
A2n+1
=1
n→∞ A2n
Für alle x ∈ [0, π2 ] gilt 0 ≤ sin x ≤ 1. Deshalb gilt für alle x ∈ [0, π2 ]
lim
sin2n+2 x ≤ sin2n+1 x ≤ sin2n x
Hieraus folgt
Z
π
2
2n+2
sin
0
xdx ≤
Z
π
2
sin
0
2n+1
xdx ≤
Z
0
π
2
sin2n xdx.
5.11. DAS PRODUKT VON WALLIS
289
Also gilt A2n+2 ≤ A2n+1 ≤ A2n . Mit A2n+2 =
2n+1
A
2n+2 2n
erhalten wir
A2n+2
A2n+1
2n + 1
=
≤
≤ 1.
2n + 2
A2n
A2n
Somit bekommen wir
2n + 1
A2n+2
A2n+1
= lim
= lim
.
n→∞ 2n + 2
n→∞ A2n
n→∞ A2n
1 = lim
Wir erhalten
n
2 Y 4k 2
.
2−1
n→∞ π
4k
k=1
1 = lim
2
Beispiel 5.11.1 (Formel von Vieta)
v
s
r s
r u
r
u
2
1 1 1 1t1 1 1 1 1
=
+
+
+
······
π
2 2 2 2 2 2 2 2 2
Beweis. Es sei Pm ein regelmäßiges Polygon mit m Ecken auf dem Kreis mit Radius 1. Mit Am
bezeichnen wir die Fäche des Polygons Pm . Das Polygon ist Vereinigung von m gleichschenkligen
Dreiecken, deren Ecken jeweils der Mittelpunkt des Kreises und zwei nebeneinanderliegende Ecken
des Polygons sind. Die Höhe eines solchen Dreiecks vom Mittelpunkt zu der Seite, die die beiden
Ecken enthält, die auf dem Kreis liegen, bezeichnen wir mit hm . Dann gilt für alle m = 3, 4, . . .
Am
= hm .
A2m
Es gilt
k−1
Y
2
=
h2j
A2k
j=2
und
lim Am = π.
m→∞
Außerdem gilt
hm = cos
Wir zeigen nun, dass h4 =
q
1
2
h2k =
Wir benutzen die Formel cos x2 =
2
m
.
und für alle k = 3, 4, . . .
r
h2k
π
q
1 1
+ h k−1
2 2 2
1+cos x
2
π
= cos k =
2
r
π 1 1
+ cos k−1 =
2 2
2
r
1 1
+ h k−1
2 2 2
290
CHAPTER 5. INTEGRALRECHNUNG
5.12
Partialbruchzerlegung
5.13
Integralkriterium für Reihen
Satz 5.13.1 Es sei f : [1, ∞) → R eine stetige, positive, monoton fallende Funktion. Dann gelten
Z n+1
Z n
n
n
X
X
f (x)dx ≤
f (k)
und
f (k) ≤
f (x)dx.
1
k=1
1
k=2
P∞
Insbesondere
n=1 an genau dann, wenn das uneigentliche RiemannR ∞ konvergiert
Integral 1 f (x)dx existiert und
Z ∞
∞
∞
X
X
f (n).
f (x)dx ≤
f (n) ≤
1
n=2
n=1
Beweis. Wir definieren g : [1, n + 1) → R durch
für x ∈ [k, k + 1) und k = 1, . . . , n
g(x) = f (k)
Dann gilt 0 ≤ f ≤ g und f und g sind auf [1, n + 1) Riemann-integrierbar. Es folgt
Z n+1
Z n+1
n
n Z k+1
X
X
f (k)
g(x)dx =
f (x)dx ≤
g(x)dx =
1
1
k=1
k
k=1
Für die Abschätzung von unten setzen wir h : [0, n) → R für x ∈ [k, k + 1) und
k = 1, . . . , n
h(x) = f (k + 1).
Dann gilt auf [1, n + 1), dass 0 ≤ h ≤ f und f und h sind Riemann integrierbar.
Also
Z n+1
Z n+1
n Z k+1
n
n+1
X
X
X
h(x)dx =
f (k + 1) =
f (k).
f (x)dx ≥
h(x)dx =
1
Falls
1
R∞
1
k=1
k=1
f (x)dx < ∞, dann
Z
1
∞
f (x)dx ≥
und somit
Z
1
2
k
Z
1
n+1
f (x)dx ≥
∞
f (x)dx ≥
∞
X
k=2
n+1
X
k=2
f (k).
f (k)
k=2
5.13. INTEGRALKRITERIUM FÜR REIHEN
Beispiel 5.13.1 (i) Falls 1 < p < ∞, dann konvergiert die Reihe
∞
X
n−p
n=1
und es gilt
∞
X
p
1
≤
.
n−p ≤
p − 1 n=1
p−1
(ii) Es gilt für alle n ∈ N
ln(n + 1) ≤
Die Reihe
n
X
1
≤ 1 + ln n
k
k=1
∞
X
1
n
n=1
divergiert.
(iii) Für alle n ∈ N mit n ≥ 2 gilt
ln ln(n + 1) − ln ln 2 ≤
Die Reihe
n
X
1
1
≤ ln ln n − ln ln 2 +
.
k ln k
2 ln 2
n=2
∞
X
1
n
ln
n
n=2
divergiert.
(iv) Die Reihe
∞
X
1
n(ln
n)2
n=2
konvergiert und
1.442 · · · =
∞
X
1
1
1
1
≤
≤
+
= 2.48 . . .
2
2
ln 2 n=2 n(ln n)
2(ln 2)
ln 2
(v) Die Reihe
∞
X
1
n
ln(n)
ln(ln(n))
n=3
divergiert.
(vi) Die Reihe
∞
X
1
n ln(n)(ln(ln(n)))2
n=3
konvergiert.
Beweis. (i) Es sei f : [1, ∞) → R durch f (x) = x−p gegeben.
Z ∞
Z ∞
1
f (x)dx =
x−p dx =
p−1
1
1
Es folgt
∞
X
n=2
n−p ≤
∞
X
1
≤
n−p
p − 1 n=1
291
292
CHAPTER 5. INTEGRALRECHNUNG
und somit
∞
X
1
p
1
≤
n−p ≤ 1 +
=
.
p − 1 n=1
p−1
p−1
(ii) Es gilt für alle n ∈ N
n+1
Z
ln(n + 1) =
1
n
X1
1
dx ≤
≤1+
x
k
k=1
Z
n
1
1
dx = 1 + ln n.
x
Wir nehmen an, dass die Reihe konvergiert. Dann existiert das uneigentliche Riemann Integral.
Z ∞
Z n
1
1
dx = lim
dx = lim [ln x]n1 = lim ln n = ∞
n→∞
n→∞
n→∞
x
x
1
1
P∞
Also existiert das uneigentliche Integral nicht und die Reihe n=1 n1 divergiert.
1
(iii) Es sei f : [1, ∞) durch f (x) = x ln x gegeben. Eine Stammfunktion von f ist F : [1, ∞) → R
mit F (x) = ln ln x. Es folgt
Z n
n
X
1
1
≤
dx = [ln(ln x)]n2 = ln(ln n) − ln(ln 2)
k ln k
x
ln
x
2
k=3
und damit
n
X
k=2
1
1
≤ ln(ln n) − ln(ln 2) +
.
k ln k
2 ln 2
Ebenso
ln ln(n + 1) − ln ln 2 ≤
Z
n+1
2
n
X 1
1
dx ≤
x ln x
k ln k
k=2
(iv) Es sei f : [1, ∞) durch f (x) = x(ln1x)2 gegeben. Eine Stammfunktion von f ist F : [1, ∞) → R
mit F (x) = − ln1x . Es folgt
n
Z n
1
1
1
1
dx
=
−
=
−
.
2
x(ln
x)
ln
x
ln
2
ln
n
2
2
Wir erhalten
∞
X
1
1
1
1
≤
≤
+
.
2
ln 2 n=2 n(ln n)
ln 2 2(ln 2)2
(v) Die Stammfunktion von
f (x) =
1
x(ln x)(ln ln x)
ist F (x) = ln ln ln x. Falls die Reihe konvergiert, dann existiert das uneigentliche Integral
Z ∞
Z ∞
1
1
dx = lim
dx = lim (ln ln ln n − ln ln ln 3).
n→n 3
n→∞
x(ln x)(ln ln x)
x(ln x)(ln ln x)
3
Der letzte Ausdruck divergiert. Die Reihe konvergiert also nicht.
(vi) Die Stammfunktion von
1
f (x) =
x(ln x)(ln ln x)2
ist
F (x) = −
Es folgen
∞
X
1
≤
n(ln
n)(ln
ln n)2
n=4
Z
3
1
.
ln ln x
∞
f (x)dx ≤
∞
X
1
n(ln
n)(ln
ln n)2
n=3
5.13. INTEGRALKRITERIUM FÜR REIHEN
und
293
∞
X
1
1
1
1
≤
.
≤
+
ln ln 3 n=3 n(ln n)(ln ln n)2
ln ln 3 3(ln 3)(ln ln 3)2
2
Beispiel 5.13.2 Entscheiden Sie, welche der folgenden Reihen konvergieren und welche divergieren.
Benutzen Sie dazu das Integralkriterium für Reihen. Es sei j ∈ N und {aj }j∈N mit a1 = e und
aj+1 = eaj .
(i)
X
1
n(ln n)(ln ln n)(ln ln ln n) · · · (ln
· · ln} n)
| ·{z
n≥aj
j
(ii)
∞
X
n≥aj
1
n(ln n)(ln ln n)(ln ln ln n) · · · (ln
· · ln} n)2
| ·{z
j
(iii) Zeigen Sie mit (iv), dass die Reihe
∞
X
n≥aj
1
n(ln n)(ln ln n)(ln ln ln n) · · · (ln
· · ln} n)p
| ·{z
j
für alle p > 1 konvergiert.
Beweis. (i) Eine Stammfunktion von
f (x) =
1
x(ln x)(ln ln x)(ln ln ln x) · · · (ln
· · ln} x)
| ·{z
j
ist
F (x) = ln
· · ln} x
| ·{z
j+1
(ii) Eine Stammfunktion von
f (x) =
1
x(ln x)(ln ln x)(ln ln ln x) · · · (ln
· · ln} x)2
| ·{z
j
ist
F (x) = −
1
ln
· · ln} x
| ·{z
j
(iii) Wegen (ii) wissen wir, dass
∞
X
n≥aj
1
n(ln n)(ln ln n)(ln ln ln n) · · · (ln
· · ln} n)2
| ·{z
j+1
konvergiert. Wir zeigen nun, dass es zu jedem r > 0 ein nr ∈ N gibt, so dass für alle n ∈ N mit
n ≥ nr
(ln
· · ln} n)2 ≤ (ln
· · ln} n)r
| ·{z
| ·{z
j+1
j
294
CHAPTER 5. INTEGRALRECHNUNG
gilt. Dazu reicht es zu zeigen, dass es zu jedem r > 0 ein x0 gibt, so dass für alle x ≥ x0
(ln x)2 ≤ xr
gilt. Dies ist aber äquivalent dazu, dass es zu jedem s > 0 ein x0 gibt, so dass für alle x ≥ x0
ln x ≤ xs
gilt. Dies gilt, da wir r = 2s setzen können. Die letztere Ungleichung folgt aber z.B. aus der
Formel von L’Hopital.
1
1
ln x
x
= lim
= 0.
lim s = lim
s−1
x→∞ sx
x→∞ sxs
x→∞ x
2
5.14
Unendliche Produkte
Es sei an , n ∈ N, eine Folge reeller Zahlen. Als das unendliche Produkt bezeichnen
wir den Grenzwert
∞
n
Y
Y
(1 + an ) = lim
(1 + ak ).
n→∞
n=1
k=1
Wir sagen, dass das unendliche Produkt konvergiert, falls der Grenzwert existiert
und von 0 verschieden ist.
Satz 5.14.1 Es sei an , n ∈ N, eine Folge positiver,
reeller Zahlen. Das Produkt
P∞
Q
∞
n=1 an konvergiert und es gilt
n=1 (1 + an ) konvergiert genau dann, wenn
!
∞
∞
∞
X
Y
X
an .
(1 + an ) ≤ exp
an ≤
1+
n=1
n=1
n=1
Beweis. Nach Satz gilt für alle t > 0, dass 1 + t ≤ et . Deshalb gilt
!
n
n
n
Y
Y
X
(1 + ak ) ≤
eak = exp
ak .
k=1
k=1
k=1
Da die Zahlen ak positiv sind und die Exponentialfunktion stetig ist, erhalten wir
!
!
n
n
n
Y
X
X
(1 + ak ) ≤ lim exp
ak = exp lim
ak .
k=1
n→∞
n→∞
k=1
k=1
Q
Deshalb ist die Folge nk=1 (1 + ak ), n ∈ N, monoton wachsend und beschränkt. Also
konvergiert diese Folge und es gilt
!
∞
∞
Y
X
(1 + an ) ≤ exp
an
n=1
n=1
5.15. DIE FORMEL VON STIRLING
295
Für alle s, t > 0 gilt (1 + s)(1 + t) ≥ 1 + s + t. Hieraus erhalten wir
n
Y
(1 + ak ) ≥ 1 +
n
X
k=1
k=1
∞
Y
n
X
ak
Es folgt
(1 + ak ) ≥ 1 +
k=1
ak
k=1
2
Beispiel 5.14.1 (i)
∞ Y
1+
n=1
konvergiert, weil
(ii)
P∞
1
n=1 n2
1
n2
konvergiert.
∞ Y
1
1+
n
n=1
divergiert, weil
5.15
P∞
1
n=1 n
divergiert.
Die Formel von Stirling
Satz 5.15.1 Für alle n ∈ N mit n ≥ 2 gilt
√
√
1
2πn nn e−n < n! < 2πn nn e−n e 12(n−1) .
Insbesondere gilt
lim
n→∞
√
2πn nn e−n
= 1.
n!
Lemma 5.15.1 (Trapez-Regel) Es sei f : [0, 1] → R eine zweimal stetig differenzierbare Funktion. Dann existiert ein ξ ∈ [0, 1] mit
Z
0
1
1
1
f (x)dx = (f (0) + f (1)) − f 00 (ξ).
2
12
Diese Formel heißt Trapez-Regel, weil die schraffierte Fläche den Flächeninhalt
+ f (1)) besitzt.
1
(f (0)
2
296
CHAPTER 5. INTEGRALRECHNUNG
Beweis. Wir benutzen partielle Integration.
Z 1
Z 1
1
1
(x − 12 )f 0 (x)dx
f (x)dx
= [(x − 2 )f (x)]0 −
0
Z0 1
(x − 21 )f 0 (x)dx
= 21 (f (0) + f (1)) −
0
Z 1
0
1
00
1 2
1
1 2
1
1
( 2 x − 2 x)f (x)dx
= 2 (f (0) + f (1)) − [( 2 x − 2 x)f (x)]0 −
0
Z 1
1
= 2 (f (0) + f (1)) +
( 12 x2 − 12 x)f 00 (x)dx
0
Mit dem Mittelwertsatz der Integralrechnung folgt für ein ξ ∈ (0, 1)
Z 1
R1
f (x)dx = 21 (f (0) + f (1)) + f 00 (ξ) 0 21 x2 − 12 xdx
0
= 12 (f (0) + f (1)) + f 00 (ξ)[ 16 x3 − 41 x2 ]10
1 00
= 12 (f (0) + f (1)) − 12
f (ξ).
2
Beweis. Wir zeigen zunächst, dass es zu jedem k ∈ N, eine Zahl ξk ∈ [k, k + 1] gibt,
so dass für alle n ∈ N
!
n−1
n
X
X
1
1
ln k = (n + 21 ) ln n − n + 1 − 12
ξ2
k=1 k
k=1
gilt. Mit der Trapez-Regel folgt: Es gibt ein ξk ∈ [k, k + 1], so dass
k+1
Z
k
ln xdx = 12 (ln k + ln(k + 1)) +
1
.
12ξk2
Hieraus folgt
n−1 Z
X
k=1
k+1
ln xdx =
k
1
2
n−1
X
(ln k + ln(k + 1)) +
k=1
1
12
n−1
X
1
.
ξ2
k=1 k
Da ln 1 = 0 gilt, erhalten wir
Z
n
ln xdx =
1
− 12
ln n +
n
X
ln k +
1
12
k=1
n−1
X
1
.
ξ2
k=1 k
Die Stammfunktion von ln x ist x ln x − x.
n ln n − n + 1 =
− 21
ln n +
n
X
k=1
ln k +
1
12
n−1
X
1
.
ξ2
k=1 k
5.15. DIE FORMEL VON STIRLING
297
Somit erhalten wir
n
X
ln k = (n +
1
) ln n
2
−n+1−
k=1
1
12
n−1
X
1
.
2
ξ
k
k=1
Wir wenden auf beiden Seiten die Exponentialfunktion an.
!
!
n
n−1
X
X
1
1
exp
ln k = exp (n + 21 ) ln n − n + 1 − 12
ξ2
k=1
k=1 k
Es folgt weiter
exp (ln(n!)) = exp (n +
1
) ln n
2
exp (−n) exp 1 −
1
12
n−1
X
1
ξ2
k=1 k
!
.
Also gilt
n! =
1
nn+ 2 e−n
n−1
X
1
1
exp 1 − 12
ξ2
k=1 k
!
.
Wir zeigen jetzt, dass
√
2π < exp 1 −
n−1
X
1
1
12
ξ2
k=1 k
!
√
< 2π exp
1
12(n − 1)
.
Hiermit folgt dann das Ergebnis. Da ξk ∈ [k, k + 1] gilt, haben wir ξ12 ≤ k12 . Außerk
P
P∞ 1
1
konvergent.
Damit
existiert
dem ist ∞
konvergent.
Also
ist
auch
2
k=1 k2
k=1 ξ
k
lim exp 1 −
n→∞
Wir zeigen, dass dieser Limes gleich
1
12
n−1
X
1
ξ2
k=1 k
!
= c.
√
2π ist. Wir setzen
!
n−1
X
1
1
cn = exp 1 − 12
.
ξ2
k=1 k
Man erkennt hieraus sofort, dass cn , n ∈ N, eine monoton fallende Folge ist. Weiter
gilt
n!
cn = n −n √ .
n e
n
Außerdem gelten
c2
limn→∞ c2n
c2
lim n =
=
=c
n→∞ c2n
limn→∞ c2n
c
und
2
√
√
n! √
2
nn e−n n
cn
(n!)2 22n n2n e−2n 2n
(n!)2 22n 2
√ .
=
=
=
(2n)!
2n e−2n n(2n)!
c2n
n
(2n)!
n
√
2n −2n
(2n)
e
2n
298
CHAPTER 5. INTEGRALRECHNUNG
Das Produkt von Wallis liefert
n
Y
4k 2
π
= lim
2 n→∞ k=1 4k 2 − 1
und
r
! 21
(2k)(2k)
= lim
lim
n→∞
n→∞
(2k − 1)(2k + 1)
k=1
12
(2 · 2)(4 · 4)(6 · 6)(8 · 8) · · · (2n)(2n)
= lim
n→∞
(1 · 3)(3 · 5)(5 · 7)(7 · 9) · · · (2n − 1)(2n + 1)
2n n!
√
= lim
n→∞ 1 · 3 · 5 · 7 · · · (2n − 1) 2n + 1
(2n n!)2
(2n n!)2
√
√ .
= lim
= lim
n→∞ (2n)! 2n + 1
n→∞ (2n)! 2n
π
=
2
n
Y
4k 2
4k 2 − 1
k=1
! 12
n
Y
√
√
Es folgt c = 2π. Da cn , n ∈ N, eine monoton fallende Folge ist, die gegen 2π
konvergiert, gilt für alle n ∈ N mit n ≥ 2
!
n−1
X
√
1
1
.
2π < cn = exp 1 − 12
ξ2
k=1 k
Andererseits gilt
∞
X
1
1
c = exp 1 − 12
ξ2
k=1 k
!
n−1
X
1
1
= exp 1 − 12
ξ2
k=1 k
!
∞
X
1
1
exp − 12
ξ2
k=n k
Mit dem Integralkriterium für Reihen folgt
1
12
∞
X
1
≤
2
ξ
k
k=n
1
12
∞
X
1
≤
2
k
k=n
1
12
Z
∞
n−1
1
1
dx =
.
2
x
12(n − 1)
Deshalb gilt
c ≥ cn exp −
Es folgt
cn ≤
√
1
12(n − 1)
2π exp
1
12(n − 1)
.
.
Beispiel 5.15.1 (i) Für n ∈ N mit n ≥ 2 gilt
2n
2n
2
2n
1
2
1
√
√ .
≤
≤ exp
exp −
6(n − 1)
n
12(2n − 1)
πn
πn
!
.
5.15. DIE FORMEL VON STIRLING
Insbesondere gilt
lim
299
√
2n
n
n→∞
n
22n
1
=√ .
π
(ii)
√
en
2πn e
1
12(n−1)
≤
nn
en
≤√
n!
2πn
In der Wahrscheinlichkeitstheorie und Kombinatorik muss man die Größenordnung von Binomialkoeffizienten kennen. Insbesondere ist der größte Binomialkoeffizient von Interesse. Das
2n
2
√ ist. Wegen
Beispiel stellt sicher, dass 2n
n von der Größenordnung
n
n
n
2 = (1 + 1) =
n X
n
k=0
ist der größte Summand kleiner als 2n und größer als
2n
Binomialkoeffizient von der Größenordnung √
ist.
n
k
2n
n+1 .
Das Beispiel zeigt, dass der größte
Beweis. Die Formel von Stirling liefert
√
2πn nn e−n < n! <
√
1
2πn nn e−n e 12(n−1) .
Damit folgt
√
1
1
√
1
4πn (2n)2n e−2n e 12(2n−1)
2 πn22n n2n e−2n e 12(2n−1)
22n
2n
(2n)!
√
≤
=
= √ e 12(2n−1) .
=
2
2n
−2n
(n!)
2π n n e
n
πn
( 2πn nn e−n )2
Damit haben wir die rechte Ungleichung bewiesen. Die linke Ungleichung wird genauso bewiesen.
2
Das nächste Beispiel untersucht, wie häufig beim Werfen einer Münze ”Kopf”
oder ”Zahl” erscheint. Wir erwarten, dass ungefähr genauso häufig ”Kopf” wie
”Zahl” das Ergebnis ist. Wir berechnen hier die zu erwartende Abweichung. Wenn
wir eine Münze n-mal werfen, dann erhalten wir 2n mögliche Ergebnisse. Es gibt
genau nk Ergebnisse, wo ”Kopf” k-mal fällt und ”Zahl” n − k-mal. Die Abweichung
vom Mittelwert ist |n − 2k|. Die mittlere Abweichung ist also
n 1 X n
|n − 2k| .
2n k=0 k
Beispiel 5.15.2 Es gibt positive Konstante c1 und c2 , so dass für alle n ∈ N
c1
√
n √
1 X n
n≤ n
|n − 2k| ≤ c2 n
2
k
k=0
gilt.
Der folgende Beweis benutzt nur die Stirling Formel. Es gibt sehr viel elegantere Beweise.
300
CHAPTER 5. INTEGRALRECHNUNG
Beweis. Mit Stirlings Formel folgt
n
n!
=
k!(n − k)!
k
√ n
1
1
1
nn
√
√
≥ exp −
+
.
√
k
12 k − 1 n − k − 1
2πk k(n − k)n−k n − k
Für k =
n
2
Für k =
− j erhalten wir
n
n
2 −j
n
2
1
≥ exp −
12
− j und 0 ≤ j ≤
n
2
1√
3 n
2
1
+
−j−1
n
2
1
+j−1
√
√
22n
πn 1 −
4j 2
n2
n+1
2
1−
1+
2j
n
2j
n
!j
.
erhalten wir
n
2n
√
.
≥
n
4πn
2 −j
Beispiel 5.15.3 Die Folge
s r
q
√
xn = 1! 2! 3! · · · n!
n∈N
konvergiert.
Beweis. Wir zeigen, dass die Folge {xn }n∈N monoton wachsend und nach oben beschränkt ist.
xn =
n
Y
1
(k!) 2k <
k=1
n+1
Y
1
(k!) 2k = xn+1
k=1
Damit ist die Folge monoton wachsend.
xn =
n
Y
(k!)
k=1
Es bleibt zu zeigen, dass
1
2k
≤
n
Y
(k)
k=1
k
2k
=
n
Y
k=1
!
n
X
k
k ln k
exp (ln k) k = exp
2
2k
k=1
∞
X
k ln k
k=1
2k
konvergiert. Dazu verwenden wir das Quotientenkriterium.
(k+1) ln(k+1)
ln(1 + k1 )
1 (k + 1) ln(k + 1)
1
1
2k+1
=
=
1+
1+
k ln k
2
k ln k
2
k
ln k
2k
2
Beispiel 5.15.4 (Satz von Chebychev, [TeMe, p. 19]) Für eine Zahl x > 0 bezeichnet π(x) die
Anzahl aller Primzahlen, die kleiner oder gleich x sind. Dann gibt es zwei Konstanten a und b, so
dass für alle x > 0
x
x
a
≤ π(x) ≤ b
ln x
ln x
gilt.
Beweis. 2
5.16. DER SATZ VON TAYLOR UND TAYLORREIHEN
5.16
301
Der Satz von Taylor und Taylorreihen
Satz 5.16.1 Es sei I ein Intervall und f : I → R sei (n + 1)-mal stetig differenzierbar auf I. Es sei x0 innerer Punkt des Intervalls I. Dann gilt für alle inneren
Punkte x ∈ I
n
X
f (k) (x0 )
(x − x0 )k + Rn (x, x0 )
f (x) =
k!
k=0
wobei
1
Rn (x, x0 ) =
n!
Z
x
x0
(x − t)n f (n+1) (t)dt.
Man bezeichnet Rn als Restglied.
Beweis. Der Beweis wird mit Induktion geführt. Für n = 0 gilt
Z x
f (x) = f (x0 ) +
f 0 (t)dt.
x0
Dies folgt aus dem RHauptsatz der Differential- und Integralrechnung (Satz 5.4.1).
x
Es gilt R0 (x, x0 ) = x0 f 0 (t)dt.
Nun der Induktionsschritt. Wir nehmen an, dass die Aussage für n − 1 bewiesen
ist, d.h. wir haben
f (x) =
n−1 (k)
X
f (x0 )
k=0
wobei
k!
(x − x0 )k + Rn−1 (x, x0 ),
1
Rn−1 (x, x0 ) =
(n − 1)!
Z
x
x0
(x − t)n−1 f (n) (t)dt.
Durch partielle Integration erhalten wir
(
)
x
Z x
(x − t)n (n)
(x − t)n (n+1)
1
−
f (t)
+
f
(t)dt
Rn−1 (x, x0 ) =
(n − 1)!
n
n
x0
x0
Z x
(x − t)n (n+1)
1
(x − x0 )n (n)
=
f (x0 ) +
f
(t)dt
(n − 1)!
n
n
x0
(x − x0 )n (n)
=
f (x0 ) + Rn (x, x0 ).
n!
Hieraus folgt
f (x) −
2
n−1 (k)
X
f (x0 )
k=0
k!
(x − x0 )n (n)
(x − x0 ) =
f (x0 ) + Rn (x, x0 ).
n!
k
302
CHAPTER 5. INTEGRALRECHNUNG
Satz 5.16.2 Es sei I ein Intervall und f : I → R sei (n + 1)-mal stetig differenzierbar auf I. Es sei x0 ein innerer Punkt des Intervalls I.
(i) (Lagrange Form des Restglieds) Für alle x ∈ I gibt es ein Θ ∈ (0, 1) mit
Rn (x, x0 ) =
f (n+1) (x0 + Θ(x − x0 ))
(x − x0 )n+1 .
(n + 1)!
(ii) (Cauchy Form des Restglieds) Für alle x ∈ I gibt es ein Θ ∈ (0, 1) mit
Rn (x, x0 ) =
f (n+1) (x0 + Θ(x − x0 ))
(1 − Θ)n (x − x0 )n+1 .
n!
Man beachte, dass die Zahl Θ von f , n und x0 abhängt.
Beweis. (i) Nach dem Mittelwertsatz der Integralrechnung (Satz 5.6.2) gibt es ein
ξ ∈ (x0 , x) bzw. ξ ∈ (x, x0 ), so dass
Z
Z
1 x
f (n+1) (ξ) x
n (n+1)
Rn (x, x0 ) =
(t)dt =
(x − t) f
(x − t)n dt
n! x0
n!
x0
x
(n+1)
(n+1)
f
(ξ)
1
f
(ξ)
−
(x − t)n+1
=
(x − x0 )n+1 .
=
n!
n+1
(n
+
1)!
x0
Wir wählen nun Θ, so dass ξ = x0 + Θ(x − x0 ).
(ii) Mit dem Mittelwertsatz der Integralrechnung (Satz 5.6.2) erhalten wir
Z
1 x
1
Rn (x, x0 ) =
(x − t)n f (n+1) (t)dt = (x − ξ)n f (n+1) (ξ)(x − x0 ).
n! x0
n!
Wir wählen nun Θ, so dass ξ = x0 + Θ(x − x0 ). Damit erhalten wir
1
(x − x0 − Θ(x − x0 ))n f (n+1) (x0 + Θ(x − x0 ))(x − x0 )
n!
f (n+1) (x0 + Θ(x − x0 ))
=
(1 − Θ)n (x − x0 )n+1 .
n!
Rn (x, x0 ) =
2
Beispiel 5.16.1 Für alle x mit |x| < 1 gilt
arctan x =
∞
X
(−1)n+1
n=1
x2n−1
.
2n − 1
Mit Hilfe des Grenzwertsatzes von Abel (Lemma 3.9.3) kann man weiter folgern
∞
(5.13)
X (−1)n+1
π
= arctan(1) =
=1−
4
2n − 1
k=1
1
3
+
1
5
−
1
7
+
1
9
− ···
Diese Reihe wird auch als Leibniz Reihe bezeichnet. Leibniz hatte ein geometrisches Argument
gefunden um zu zeigen, dass sich die Reihe zu π4 aufsummiert.
Dieses Beispiel zeigt auch, dass eine Taylorrreihe eine Funktion nicht notwendig auf dem
gesamten Definitionsgebiet darstellen muss, arctan ist auf ganz R definiert, ihre Taylorreihe mit
Entwicklungsmitte 0 stellt die Funktion nur auf (−1, 1) dar.
5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL
303
Beweis. Wir benutzen die Formel für die geometrische Reihe
∞
X
1
d
=
arctan x =
(−1)n x2n .
dx
1 + x2
n=0
Wir integrieren die rechte Seite summandenweise
arctan x = c +
∞
X
(−1)n
n=0
x2n+1
.
2n + 1
Für x = 0 erhalten wir c = 0 und
arctan x =
∞
X
(−1)n
n=0
x2n+1
.
2n + 1
Also haben wir arctan durch eine Potenzreihe dargestellt. Diese Potenzreihe ist nach Satz 3.9.3
mit ihrer Taylorreihe identisch. 2
5.17
Gleichmäßige Konvergenz und Integral
Satz 5.17.1 (i) Es sei fn : [a, b] → R, n ∈ N, eine Folge Riemann-integrierbarer
Funktionen, die gleichmäßig gegen eine Funktion f konvergiert. Dann ist auch f
Riemann-integrierbar und
Z b
Z b
lim
f (x)dx.
fn (x)dx =
n→∞
a
a
(ii) Es sei gnP: [a, b] → R, n ∈ N, eine Folge Riemann-integrierbarer Funktionen,
deren Reihe ∞
n=1 gn gleichmäßig gegen die Funktion g konvergiert. Dann ist auch
g Riemann-integrierbar und es gilt
∞ Z
X
n=1
b
b
Z
gn (x)dx =
a
g(x)dx.
a
Die entscheidende Voraussetzung ist die gleichmäßige Konvergenz. Es gibt eine
Folge von Funktionen, die punktweise konvergiert, man aber Limes und Integral
nicht vertauschen kann (Beispiel 5.17.1).
Für das Lebesgue Integral steht ein komfortablerer Satz zur Verfügung, der Satz
von der dominierten Konvergenz.
Ebenso wichtig ist bei den Voraussetzungen des Satzes, dass das Intervall beschränkt
ist. Es gibt Beispiele von Folgen, die auf R gleichmäßig konvergieren, bei denen man
aber nicht Limes und (uneigentliches) Integral vertauschen kann (Beispiel 5.17.2).
Beweis. (i) Wir zeigen zunächst, dass f Riemann-integrierbar ist. Da fn , n ∈ N,
integrierbar sind, gilt
∀n ∈ N∀δ > 0∃P = {x0 , . . . , xK } :
|OS P (fn ) − US P (fn )| < δ,
304
CHAPTER 5. INTEGRALRECHNUNG
wobei
OS P (fn ) =
US P (fn ) =
K
X
Mk (fn )∆k
Mk (fn ) =
sup
f (x)
x∈[xk−1 ,xk ]
k=1
K
X
mk (fn )∆k
mk (fn ) =
k=1
inf
f (x).
x∈[xk−1 ,xk ]
Wegen der gleichmäßigen Konvergenz gilt
∀ > 0∃N ∈ N∀n > N ∀x ∈ [a, b] :
|fn (x) − f (x)| < .
δ
und ein n ∈ N, so dass für alle x ∈ [a, b]
Zu gegebenem δ > 0 wählen wir = 2(b−a)
die Ungleichung |fn (x) − f (x)| < gilt. Nun wählen wir eine Partition P mit
|OS P (fn ) − US P (fn )| < δ.
Dann gilt für alle k = 1, . . . , K
mk (fn ) =
inf
x∈[xk−1 ,xk ]
fn (x) ≤
inf
x∈[xk−1 ,xk ]
f (x) + = mk (f ) + .
Also erhalten wir für alle k = 1, . . . , K
mk (fn ) ≤ mk (f ) + .
Genauso erhalten wir für alle k = 1, . . . , K
Mk (fn ) ≥ Mk (f ) − .
Damit erhalten wir
δ > |OS P (fn ) − US P (fn )| =
K
X
k=1
(Mk (fn ) − mk (fn ))∆k
K
K
X
X
≥
(Mk (f ) − mk (f ) − 2)∆k =
(Mk (f ) − mk (f ))∆k − 2(b − a)
k=1
k=1
= |OS P (f ) − US P (f )| − δ.
Also gilt
|OS P (f ) − US P (f )| < 2δ.
Damit haben wir nachgeprüft, dass f Riemann integrierbar ist. Wir zeigen nun,
dass
Z b
Z b
lim
fn (x)dx =
f (x)dx.
n→∞
a
a
Es gilt
∀ > 0∃N ∈ N∀n > N ∀x ∈ [a, b] :
|f (x) − fn (x)| < .
Wir erhalten für alle n mit n > N
Z b
Z b
Z b
f (x)dx ≤
fn (x) + dx =
fn (x)dx + (b − a)
a
a
a
5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL
305
und ebenso
b
Z
fn (x)dx ≤
a
Z
a
b
b
Z
f (x) + dx ≤
a
f (x)dx + (b − a).
Hieraus folgt für alle > 0
Z b
Z b
≤ (b − a).
f
(x)dx
−
f
(x)dx
n
a
a
Wir erhalten also
Z
b
Z
b
f (x)dx = lim
a
n→∞
fn (x)dx.
a
2
Beispiel 5.17.1 (i) Für n ∈ N sei fn : [0, 1] → R durch fn (x) = xn gegeben. Die Folge fn , n ∈ N,
konvergiert punktweise gegen die Funktion f mit
(
0
für x ∈ [0, 1)
f (x) =
1
für x = 1
Die Folge fn , n ∈ N, konvergiert nicht gleichmäßig. Obwohl keine gleichmäßige Konvergenz vorliegt, gilt doch
Z 1
Z 1
lim fn (x)dx = lim
fn (x)dx.
0 n→∞
n→∞
0
(ii) Für n ∈ N sei fn : [0, 1] → R durch
 2

n x
fn (x) =
− n2 x + 2n


0
x ∈ [0, n1 )
x ∈ [ n1 , n2 )
x ∈ [ n2 , 1]
Die Funktionen fn , n ∈ N, sind stetig, also insbesondere Riemann-integrierbar. Die Folge konvergiert punktweise gegen f = 0, aber die Folge konvergiert nicht gleichmäßig. Weiter gelten
Z
1
Z
lim fn (x)dx = 0
0 n→∞
und
lim
n→∞
1
fn (x)dx = 1.
0
Beweis. (i) Für x = 0 gilt limn→∞ fn (x) = 0 und für x = 1 gilt limn→∞ fn (x) = 1. Wir
betrachten nun x mit 0 < x < 1. Die Folge xn , n ∈ N, ist eine positive, monoton fallende Folge.
Somit ist sie konvergent. Es folgt
lim xn = x lim xn−1 = x lim xn
n→∞
n→∞
n→∞
Mit Beispiel 2.3.10 folgt limn→∞ xn = 0.
Wir nehmen an, dass die Folge fn , n ∈ N, gleichmäßig gegen eine Funktion f konvergiert.
Diese Funktion muss gleich der Funktion sein, gegen die diese Folge punktweise konvergiert. Diese
Funktion ist im Punkt x = 1 nicht stetig. Dies widerspricht dem Satz 3.12.1.
Wir wollen hier auch den Nachweis führen, ohne Satz 3.12.1 zu benutzen. Die Negation der
gleichmäßigen Konvergenz ist
∃ > 0∀N ∈ N∃m, n > N ∃x ∈ [0, 1] :
|fn (x) − fm (x)| ≥ 306
CHAPTER 5. INTEGRALRECHNUNG
Wir wählen = 14 . Zu gegebenem N wählen wir n > N und m = 2n. Außerdem wählen wir
1
x = 2− n . Dann gilt
|fn (x) − fm (x)| = |xn − xm | = |xn − x2n | = | 21 − 41 | =
Weiter gilt
1
Z
fn (x)dx = lim
lim
n→∞
Z
n→∞
0
1
xn dx = lim
n→∞
0
1
4
= .
1
= 0.
n+1
(ii)
Z
1
1
n
Z
fn (x)dx =
1
n
0
1
2n
−n2 x + 2ndx
n xdx +
0
=
2
n
Z
2
2 2
x
n1
0
2
+ − 12 n2 x2 + 2nx n1 = 1
n
Die Folge fn , n ∈ N, konvergiert punktweise gegen f = 0. Somit gilt
Z 1
Z 1
fn (x)dx = 1 6= 0 =
f (x)dx.
0
0
Hiermit und mit Satz 5.17.1 folgt, dass die Folge nicht gleichmäßig konvergiert.
Der direkte Nachweis ist nicht viel schwerer: Die Negation der gleichmäßigen Konvergenz ist
∃ > 0∀N ∈ N∃m, n > N ∃x ∈ [0, 1] :
|fn (x) − fm (x)| ≥ Wir wählen = 1. Zu gegebenem N wählen wir n = 4N und m = 2N . Außerdem wählen wir
1
x = 2N
. Dann gilt
1
1
|fn (x) − fm (x)| = |f4N ( 2N
) − f2N ( 2N
)| = 2N ≥ 1 = .
2
Beispiel 5.17.2 (i) Die Folge fn : [0, ∞) → R, n ∈ N, mit
fn (x) =
x −x
e n
n2
konvergiert gleichmäßig gegen 0, es gilt aber
Z ∞
lim
fn (x)dx = 1
und
n→∞
Z
lim fn (x)dx = 0
0
0
(ii) Für n ∈ N sei gn : [0, ∞) → R durch
gn (x) =
∞
n→∞
x −x
e n
n
gegeben. Die Folge gn , n ∈ N, konvergiert gleichmäßig gegen 0, aber
Z ∞
lim
gn (x)dx = ∞.
n→∞
Beweis. (i) Es gilt
Z ∞
fn (x)dx
=
=
∞
Z R
x −x
x −x
n
e dx = lim
e n dx
2
2
R→∞
n
n
0
0
Z Rn
R
lim
te−t dt = lim [−te−t − e−t ]0n = 1.
Z
0
0
R→∞
0
R→∞
5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL
307
Die Ableitung von fn ist
x
x
1 −x
e n − 3 e− n .
2
n
n
Deshalb gilt genau dann fn0 (x) > 0, wenn x < n und fn0 (x) < 0, wenn x > n. Deshalb hat fn in
x = n ein absolutes Maximum und es gilt
fn0 (x) =
0 ≤ fn (x) ≤ fn (n) =
1
.
en
(ii)
Z
∞
∞
Z R
x −x
x −x
e n dx = lim
e n dx
R→∞
n
n
0
0
Z Rn
R
n lim
te−t dt = lim n[−te−t − e−t ]0n = ∞
Z
gn (x)dx
=
0
=
R→∞
R→∞
0
Die Folge gn , n ∈ N, konvergiert gleichmäßig gegen 0. Dazu bestimmen wir das absolute Maximum
von gn .
1 x
x
gn0 (x) = e− n 1 − 2
n
n
Das absolute Maximum liegt im Punkt x = n2 . Somit gilt
0 ≤ gn (x) ≤ g(n2 ) = ne−n .
2
Satz 5.17.2 Es sei I ein Intervall und gn : I → R, n ∈ N, eine Folge stetig
differenzierbarer Funktionen. Die Folge {gn }n∈N , konvergiere punktweise gegen eine
Funktion g und die Folge der Ableitungen {gn0 }n∈N , konvergiere gleichmäßig gegen
eine Funktion h. Dann ist g differenzierbar und g 0 = h.
Beweis. gn0 , n ∈ N, ist eine Folge stetiger Funktionen, die gleichmäßig gegen h
konvergiert. Mit Satz 5.17.1 folgt, dass für alle x0 , x ∈ I
Z x
Z x
0
lim
gn (t)dt =
h(t)dt
n→∞
x0
x0
gilt. Wir wenden nun den Hauptsatz der Differential- und Integralrechnung an (Satz
5.4.1). Für alle x0 , x ∈ I gilt
Z x
lim (gn (x) − gn (x0 )) =
h(t)dt.
n→∞
Für alle x0 , x ∈ I gilt
x0
g(x) − g(x0 ) =
Z
x
h(t)dt
x0
h ist stetig, weil die Folge gn0 aus stetigen Funktionen besteht und gleichmäßig
gegen h konvergiert (Satz 3.12.1). Nun können wir noch einmal den Hauptsatz
der Differential- und Integralrechnung (Satz 5.4.1) anwenden und erhalten g 0 = h.
2
308
CHAPTER 5. INTEGRALRECHNUNG
Es gibt C ∞ -Funktionen, die in keinem Punkt in eine Potenzreihe entwickelbar sind [62]. Es
sei φ : R → R durch
(
1
− x12 − (x−1)2
für 0 < x < 1
e
e
(5.14)
φ(x) =
0
sonst
gegeben. [x] ist die Abrundungsfunktion oder Gaußklammer. [x] ist die größte, ganze Zahl, die
kleiner oder gleich x ist.
Beispiel 5.17.3 Die Funktion ψ : R → R mit
ψ(x) =
∞
X
1
φ(2k (x − [x]))
k!
k=1
ist überall unendlich oft differenzierbar, aber nirgends analytisch.
Beweis. Für j = 1, 2, . . . definieren wir φj : R → R durch
φj (x) =
1
φ(2j (x − [x])).
j!
φj ist für alle j ∈ N unendlich oft differenzierbar. Es gibt für alle k ∈ N eine Konstante C, so dass
für alle x ∈ R
∞
X
(k)
|φj (x)| ≤ C
j=1
Hiermit und mit Satz 5.17.2 folgt, dass ψ unendlich oft differenzierbar ist.
Wir zeigen, dass ψ in keinem der Punkte
n m
o
n ∈ N, m ∈ Z, m ungerade
n
2
in eine Taylorreihe zu entwickeln ist. Da die Menge dicht in R ist, folgt dann, dass die Funktion
in keinem Punkt analytisch ist. Es gilt
∞
n−1
∞
X
X 1
X
1
1
k
k
ψ(x) =
φ(2 (x − [x])) =
φ(2 (x − [x])) +
φ(2k (x − [x])).
k!
k!
k!
k=1
k=1
k=n
Wir zeigen, dass
n−1
X
(5.15)
k=1
1
φ(2k (x − [x]))
k!
in den Punkten { 2mn |m ∈ Z, m
/ Z} analytisch ist. Es gilt für alle k = 1, . . . , n − 1
2 ∈
n−1
X
k=1
n−1
X 1
1
m
m
m
φ(2k ( n − [ n ])) =
φ(2k−n (m − 2n [ n ]))
k!
2
2
k!
2
k=1
m ist ungerade und 2n [ 2mn ] ist gerade. Außerdem gilt k − n < 0. Hieraus folgt, dass für alle
k = 1, . . . , n − 1
m
2k−n (m − 2n [ n ]) ∈
/ {0, 1}.
2
Da φ in allen Punkten außer 0 und 1 analytisch ist, ist die Funktion (5.15) in { 2mn |m ∈ Z, m
/ Z}
2 ∈
analytisch.
5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL
Wir zeigen nun, dass
309
∞
X
1
φ(2k (x − [x]))
k!
k=n
nicht in den Punkten
{ 2mn |m
∈ Z,
φ(2k (
m
2
∈
/ Z} analytisch ist. Für alle k ∈ N mit k ≥ n gilt
m
m
m
− [ n ])) = φ(2k−n (m − 2n [ n ])).
2n
2
2
Es gilt 2k−n (m − 2n [ 2mn ]) ∈ Z und somit gilt für die Funktion φ nach Definition (5.14), dass für
alle p ∈ N0
m φ(p) 2k−n (m − 2n [ n ]) = 0.
2
Es ergibt sich für alle p ∈ N0
∞
X
1
φ
k!
!(p)
2k
m
2n
k=n
−
h m i
2n
= 0.
Falls diese Funktion analytisch in 2k ( 2mn − [ 2mn ]) wäre, dann wäre sie in einer Umgebung dieses
Punktes identisch 0, was nicht der Fall ist. 2
Beispiel 5.17.4 Es gibt auf R eine wachsende, unendlich oft differenzierbare Funktion, die nirgendwo analytisch ist.
Beweis. Die Stammfunktion von ψ (Beispiel 5.17.3) ist monoton wachsend, weil ψ positiv ist und
sie ist nirgendwo analytisch. 2
Beispiel 5.17.5 [12] Zu jeder Folge reeller Zahlen {an }n∈N gibt es eine unendlich oft differenzierbare Funktion f : R → R, so dass für alle n = 0, 1, 2, . . .
f (n) (0) = an
gilt.
Beweis. Es seien ak , k ∈ N, reelle Zahlen und bk , k ∈ N, positive Zahlen. Tatsächlich wählen wir
später bk = (k!)2 |ak |. Wir betrachten die Funktion
f (x) =
∞
X
k=0
ak xk
.
1 + bk x2
Wir nehmen an, dass f unendlich oft differenzierbar ist und dass die Ableitung gleich der Summe
der Ableitungen ist. Dann gelten
f (0) = a0
und für n ≥ 2
und
f 0 (0) = a1
n
[2]
X
f (n) (0)
= an +
(−1)j an−2j bjn−2j .
n!
j=1
Mit bk = (k!)2 |ak | erhalten wir für diese Bedingung
n
[2]
X
f (n) (0)
(−1)j an−2j (((n − 2j)!)2 |an−2j |)j .
= an +
n!
j=1
310
CHAPTER 5. INTEGRALRECHNUNG
Wir setzen a0 = c0 und a1 = c1 . Weiter setzen wir
n
an = cn −
[2]
X
j=1
(−1)j an−2j (((n − 2j)!)2 |an−2j |)j .
Wir definieren hk : R → R durch
hk (x) =
ak xk
.
1 + bk x2
In der Tat, die geometrische Reihe liefert für |bk x2 | < 1
hk (x) =
∞
∞
X
X
a k xk
k
j j 2j
=
a
x
(−1)
b
x
=
(−1)j ak bjk x2j+k .
k
k
1 + bk x2
j=0
j=0
Es folgt
∞
X
(n)
hk (x) =
2j≥n−k
(−1)j ak bjk (2j + k) · · · (2j + k − n + 1)x2j+k−n
und damit
(n)
(hk )
(0) =

j
 n!(−1)j an−2j bn−2j
0

k = n − 2j
sonst
Wir zeigen nun, dass f unendlich oft differenzierbar ist, falls die Folge abnn hinreichend schnell gegen
0 konvergiert. Wir benutzen Satz 5.17.2. Wir zeigen, dass die Reihe f punktweise und die Reihe
P∞ (n)
gleichmäßig konvergiert. Es gilt für k ≥ n + 2
k=1 hk
|ak |k! k−n−2
(n)
|x|
.
(hk ) (x) ≤ (n + 1)!
bk
Mit bk = (k!)2 |ak | folgt
∞ ∞
X
X
|x|k−n−2
(n)
.
)
(x)
≤
(n
+
1)!
(hk
k!
k=n+2
k=n+2
Diese Reihe konvergiert gleichmäßig auf allen beschränkten Intervallen. 2
Beispiel 5.17.6 (Zetafunktion von Riemann) (i) Die Reihe
ζ(x) =
∞
X
1
nx
n=1
konvergiert auf (1, ∞) punktweise und heißt Riemannsche Zetafunktion. Sie konvergiert auf jedem
Intervall [a, b] ⊂ (1, ∞) gleichmäßig. Sie ist differenzierbar und die Ableitung ist
ζ 0 (x) = −
∞
X
ln n
nx
n=1
(Tatsächlich ist die Riemannsche Zetafunktion für alle komplexen Zahlen erklärt. Die Bestimmung
der Nullstellen ist eines der berühmtesten und schwierigsten, offenen Probleme der Mathematik.
Die Riemannsche Vermutung besagt, dass alle Nullstellen der Zetafunktion auf der Geraden { 21 +
iy|y ∈ R} liegen.)
(ii) Für n ∈ N sei fn : R → R durch fn (x) = n1 sin(n2 x) gegeben. Die Folge fn , n ∈ N, konvergiert
gleichmäßig gegen f = 0. Die Folge fn0 , n ∈ N, divergiert in jedem Punkt x ∈ R.
5.17. GLEICHMÄSSIGE KONVERGENZ UND INTEGRAL
311
Beweis. (i) Nach Beispiel 5.13.1 konvergiert die Reihe für jedes x ∈ (1, ∞). Dies wurde mit dem
Integralkriterium gezeigt. Wir zeigen, dass die Reihe gleichmäßig auf jedem Intervall [a, b] ⊂ (1, ∞)
konvergiert.
Zu gegebenem > 0 wählen wir N so groß, dass für alle n mit n > N gilt, dass
P∞
1
<
. Dies ist möglich, weil die Reihe konvergiert. Deshalb gilt für alle x ∈ [a, b]
a
k=n+1 k
n
∞
∞
∞
X
X
X
X
1
1
1 1
=
−
≤
<
kx
kx kx
ka
k=1
Die Ableitung von
Pn
k=1
k=n+1
k=1
k=n+1
k −x ist
−
n
X
ln k
k=1
kx
Dies folgt mit der Kettenregel.
(k −x )0 = (e−(ln k)x )0 = (− ln k)k −x
Wir weisen nun nach, dass die Reihe
∞
X
ln k
k=1
kx
auf jedem Intervall [a, b] ⊂ (1, ∞) gleichmäßig konvergiert. Zunächst beobachten wir, dass
∞
X
ln k
k=1
kx
konvergiert. Wir wählen η > 0 so klein, dass x − η > 1 gilt. Dann gibt es ein k0 , so dass für alle
k > k0
ln k
1
≤ x−η
ka
k
gilt. Es reicht nachzuprüfen, dass es ein k0 gibt, so dass für alle k > k0 gilt, dass ln k ≤ k η . Man
kann dies mit der Formel von L’Hospital nachprüfen.
Es gibt also für alle > 0 ein N , so dass für alle n mit n > N
∞
X
ln k
<
ka
k=n
gilt. Hiermit erhalten wir für alle x ∈ [a, b]
n
∞
∞
∞
X ln k X
X
X
ln k ln k
ln k
−
=
≤
< .
x
x
x
k
k k
ka
k=1
k=1
k=n+1
k=n+1
Mit Satz 5.17.2 folgt, dass
∞
X
1
kx
!0
k=1
=−
(ii) Zu gegebenem wählen wir N so groß, dass >
∞
X
ln k
k=1
1
N.
kx
.
Dann gilt für alle n > N und alle x ∈ R
|fn (x) − f (x)| = | n1 sin(n2 x)| ≤
Wir zeigen nun, dass in jedem x ∈ R die Folge
fn0 (x) = n cos(n2 x)
1
n
< .
312
CHAPTER 5. INTEGRALRECHNUNG
divergiert. Wir nehmen an, es gebe einen Punkt x ∈ R, so dass limn→∞ n cos(n2 x) existiert.
Dann gilt limn→∞ cos(n2 x) = 0. Wir zeigen, dass dies nicht sein kann. Für alle t ∈ R gilt
cos 2t = 2 cos2 t − 1. Also
cos((2n)2 x) = 2 cos2 (2n2 x) − 1 = 2(2 cos2 (n2 x) − 1)2 − 1
= 8 cos4 (n2 x) − 8 cos2 (n2 x) + 1.
Es folgt
0
=
=
=
lim cos((2n)2 x)
n→∞
lim (8 cos4 (n2 x) − 8 cos2 (n2 x) + 1)
4
2
8 lim cos(n2 x) − 8 lim cos(n2 x) + 1 = 1.
n→∞
n→∞
n→∞
2
5.18
Rationale, irrationale, algebraische und transzendente Zahlen
Eine Zahl heißt rational, falls sie Quotient zweier ganzer Zahlen ist, sie heißt irrational, falls sie nicht rational ist.
Definition 5.18.1 Eine reelle Zahl heißt algebraisch, falls sie Nullstelle eines Polynoms ist, das nur ganze Zahlen als Koeffizienten hat.
Eine Zahl heißt transzendent, falls sie nicht algebraisch ist.
Definition 5.18.2 Der Grad einer algebraischen Zahl ist der kleinste Grad eines
Polynoms mit ganzzahligen Koeffizienten, das diese Zahl zur Nullstelle hat.
Offenbar ist jede rationale Zahl algebraisch. Zu einer rationalen Zahl pq wählen
wir das Polynom p − qx. Die Zahl pq ist Nullstelle des Polynoms p − qx.
Jede transzendente Zahl irrational. Andererseits
√ gibt es irrationale Zahlen, die
nicht√transzendent sind. Ein Beispiel hierfür
ist 2. Wir haben bereits gesehen,
√
dass 2 nicht rational ist (Satz 2.0.2). 2 ist aber Nullstelle des Polynoms
x2 − 2
√
und damit ist 2 algebraisch. Genauso findet man, dass jede Quadratwurzel einer
natürlichen Zahl algebraisch ist.
Bei der Einführung der reellen Zahlen hatten wir gezeigt, dass eine reelle Zahl
genau dann rational ist, wenn ihre Dezimalbruchdarstellung letztendlich periodisch
ist. Mit dieser Beobachtung kann man leicht irrationale Zahlen angeben. So ist
die Zahl, deren n2 -te Koeffizienten ihrer Dezimalbruchentwicklung gleich 1 sind und
deren übrige Koeffizienten gleich 0 sind, irrational, weil die Dezimalbruchdarstellung
nicht letztendlich periodisch ist (Beispiel 2.10.1).
5.18. RATIONALE, IRRATIONALE, ALGEBRAISCHE UND TRANSZENDENTE ZAHLEN313
Euler zeigte 1737, dass e eine irrationale Zahl ist. Lambert zeigte ca. 1770, dass
e und tan x irrational sind, falls x eine rationale Zahl ist, die von 0 verschieden ist.
Hieraus folgt, dass π eine irrationale Zahl sein muss, weil
x
arctan( π4 ) = 1.
1873 zeigte Hermite, dass e transzendent ist. Lindemann zeigte 1882, dass π transzendent ist.
Man konnte bisher nicht beweisen, dass die Eulersche Zahl γ irrational ist. Auch
ist nicht bekannt, ob πe irrational ist oder nicht.
Wichtig sind Darstellungen für Zahlen, wenn man mit ihnen rechnen will. Wir
hatten e als Limes eingeführt
n
1
e = lim 1 +
.
n→∞
n
Als weitere Darstellung für die Zahl e haben wir
∞
X
1
e=
n!
n=0
gefunden. Diese Reihe konvergiert schnell und man kann leicht die Dezimalbruchdarstellung mit vorgegebener Genauigkeit ausrechnen.
Für die Zahl π hatten wir die Leibniz Reihe (5.13) angegeben
π
= 1 − 31 + 51 − 71 + 19 − · · ·
4
Diese Reihe konvergiert allerdings sehr langsam. Die Formel von Wallis (Satz 5.11.1)
ist
∞
π Y 4k 2
=
.
2 k=1 4k 2 − 1
Die Formel von Vieta ist (Beispiel 5.11.1)
v
s
r u
r
r s
u
2
1 1 1 1 t1 1 1 1 1
=
+
+
+
······
π
2 2 2 2 2 2 2 2 2
Satz 5.18.1 e ist irrational.
Beweis. Wir nehmen an, dass e rational ist, es gibt also p, q ∈ N mit e = pq . Es gilt
nach dem Satz von Taylor (Satz 5.16.1) für alle n ∈ N, x ∈ R und x0 ∈ R
x
e =
n
X
ex0
k=0
k!
(x − x0 )k + Rn (x, x0 ).
314
CHAPTER 5. INTEGRALRECHNUNG
Wir verwenden die Lagrange Form des Restglieds (Satz 5.16.2). Für alle n ∈ N,
x ∈ R und x0 ∈ R existiert ein Θ ∈ (0, 1) mit
Rn (x, x0 ) =
1
ex0 +Θ(x−x0 ) (x − x0 )n+1 .
(n + 1)!
Für x = 1 und x0 = 0 folgt, dass für alle n ein Θ ∈ (0, 1) existiert, so dass
n
X
1
eΘ
e=
+
k! (n + 1)!
k=0
gilt. Weil
eΘ
(n+1)!
> 0, folgt, dass für alle n ∈ N ein Θ ∈ (0, 1) mit
n
eΘ
p X 1
eΘ
e
0<
= −
=
<
(n + 1)!
q k=0 k!
(n + 1)!
(n + 1)!
existiert. Deshalb gilt für alle n ∈ N
n
e
p X 1
<
.
0< −
q k=0 k!
(n + 1)!
Wir wählen nun n = q + 1. Damit
q+1
p X 1
e
0< −
<
q k=0 k!
(q + 2)!
und somit
0 < (q + 1)(q − 1)!p −
q+1
X
(q + 1)!
k=0
k!
<
e
.
q+2
Dies kann nicht sein, weil
(q + 1)(q − 1)!p −
q+1
X
(q + 1)!
k=0
k!
eine ganze Zahl ist, die strikt größer als 0 und strikt kleiner als
e
gilt q+2
≤ 3e < 1. 2
e
q+2
ist. Da q ∈ N,
Satz 5.18.2 π ist irrational.
Beweis. [82] Wir nehmen an, dass π rational ist, dass also p, q ∈ N mit π =
existieren. Wir wählen n ∈ N so groß, dass
π n+1 pn
< 1.
n!
p
q
5.18. RATIONALE, IRRATIONALE, ALGEBRAISCHE UND TRANSZENDENTE ZAHLEN315
Dass dies möglich ist, folgt z.B. aus der Formel von Stirling. Es seien fn : R → R
für alle x ∈ R durch
xn (p − qx)n
fn (x) =
n!
gegeben und Fn : R → R durch
F n = fn −
fn(2)
+
fn(4)
− ··· +
(−1)n fn(2n)
=
n
X
(−1)j fn(2j) .
j=0
Wir wollen nun zeigen, dass
(5.16)
Fn (0)
und
Fn (π)
ganze Zahlen sind. Dazu zeigen wir, dass für alle j = 0, 1, . . . , 2n
fn(j) (0) ∈ Z.
Es gilt
n xn (p − qx)n
xn X n k
fn (x) =
=
p (−qx)n−k
n!
n! k=0 k
n 1 X n
=
(−1)n−k pk q n−k x2n−k .
n! k=0 k
Für j = 0, 1, . . . , n − 1 erhalten wir
n 1 X n
(j)
(−1)n−k pk q n−k ((2n − k)(2n − k − 1) · · · (2n − k − j + 1))x2n−k−j
fn (x) =
n! k=0 k
(j)
und es folgt sofort fn (0) = 0. Für j = n, . . . , 2n gilt
fn(j) (x) =
n
1 X n
(−1)n−k pk q n−k ((2n − k)(2n − k − 1) · · · (2n − k − j + 1))x2n−k−j
n! k=2n−j k
Wenn wir x = 0 einsetzen, bleibt nur der Summand für k = 2n − j übrig, alle
anderen sind 0. Wir erhalten also
n
j!
(j)
(−1)j−n p2n−j q j−n .
fn (0) =
n! 2n − j
Dies ist eine ganze Zahl, weil j ≥ n. Also ist auch Fn (0) eine ganze Zahl.
Nun zeigen wir, dass Fn (π) = Fn ( pq ) eine ganze Zahl ist. Dazu überlegen wir
uns, dass für alle x ∈ R
(5.17)
fn (x) = fn ( pq − x)
316
CHAPTER 5. INTEGRALRECHNUNG
gilt. In der Tat
fn ( pq
− x) =
( pq − x)n (p − q( pq − x))n
( pq − x)n (qx))n
=
n!
n!
Aus (5.17) erhalten wir für alle x ∈ R und alle j = 0, 1, . . . , 2n
= fn (x).
fn(j) ( pq − x) = (−1)j fn(j) (x)
(j)
(j)
und damit, dass fn ( pq ) = (−1)j fn (0) ∈ Z. Schließlich erhalten wir Fn ( pq ) ∈ Z.
Nun zeigen wir, dass
d
(F 0 (x) sin x − Fn (x) cos x) = Fn00 (x) sin x + Fn (x) sin x = fn (x) sin x.
dx n
Wir müssen hierzu zeigen, dass Fn00 + Fn = fn gilt. Es gilt
(5.18)
Fn00
+ Fn =
=
n
X
(−1)k fn(2k+2)
k=0
k=0
n+1
X
n
X
(−1)k−1 fn(2k) +
k=1
Da
(2n+2)
fn
+
n
X
(−1)k fn(2k)
(−1)k fn(2k) = fn + (−1)n fn(2n+2) .
k=0
=0
Fn00 + Fn = fn .
Mit dem Hauptsatz der Differential- und Integralrechnung und (5.18)
Z π
π
(5.19)
fn (x) sin xdx = [Fn0 (x) sin x − Fn (x) cos x]0 = Fn (π) − Fn (0).
0
Andererseits gilt für alle x ∈ (0, π)
π n pn
.
n!
Die linke Ungleichung gilt, weil sin auf (0, π) strikt positiv ist und weil π = pq und
fn auf (0, pq ) strikt positiv ist. Wir weisen die rechte Ungleichung nach. Wegen
0 < x < π = pq gelten xn ≤ π n und (p − qx)n ≤ pn . Deshalb
0 < fn (x) sin x ≤
xn (p − qx)n
π n pn
≤
.
n!
n!
Da fn · sin eine stetige Funktion ist, die auf dem Integrationsintervall mit Ausnahme
der Intervallendpunkte strikt positiv ist, folgt
Z π
π n+1 pn
0<
fn (x) sin xdx ≤
.
n!
0
fn (x) =
Mit (5.19)
π n+1 pn
< 1.
n!
Dies kann nicht sein, weil Fn (π) − Fn (0) nach (5.16) eine ganze Zahl ist. 2
0 < Fn (π) + Fn (0) ≤
Cantor bewies 1874, dass die meisten Zahlen transzendent sind.
5.18. RATIONALE, IRRATIONALE, ALGEBRAISCHE UND TRANSZENDENTE ZAHLEN317
Satz 5.18.3 (i) Die Menge der rationalen Zahlen und die Menge der algebraischen
Zahlen sind abzählbar.
(ii) Die Menge der irrationalen Zahlen und die Menge der transzendenten Zahlen
haben die Mächtigkeit der reellen Zahlen.
Lemma 5.18.1 [5] Für jede algebraische Zahl x mit Grad n > 1 existiert eine Zahl
c > 0, so dass für alle p ∈ Z und alle q ∈ N
x − p > c
q qn
gilt.
Beweis. Es sei P ein irreduzibles Polynom mit P (x) = 0. Aus dem Mittelwertsatz
folgt
−P ( pq ) = P (x) − P ( pq ) = (x − pq )P 0 (ξ).
Man kann annehmen, dass |x− pq | < 1, sonst wäre das Ergebnis trivialerweise richtig.
Wegen ξ ∈ [x, pq ], folgt weiter |ξ| < 1 + |x|. Hiermit folgt
1
|P 0 (ξ)| < .
c
Deshalb erhalten wir
|x − pq | > c|P ( pq )|.
Da P irreduzibel ist, gilt P ( pq ) 6= 0 und q n P ( pq ) ist eine ganze Zahl, die dem Absolutbetrag nach größer oder gleich 1 ist. 2
Satz 5.18.4 Die Zahl
x=
∞
X
10−k!
k=1
ist transzendent.
Beweis. Wir wählen
pj = 10j!
j
X
10−k!
und
qj = 10j! .
k=1
Dann gilt
∞
∞
X
X
p
10
j
−k!
−(j+1)!
x − =
10
<
10
10−k! = qj−j−1 < qj−j .
qj
9
k=j+1
k=0
2
318
CHAPTER 5. INTEGRALRECHNUNG
Satz 5.18.5 e ist transzendent.
Beweisidee: Wir konstruieren r, s ∈ R mit |s| < 1 und p ∈ Z \ {0}, so dass
r(an en + · · · + a1 e + a0 ) = s + p
gilt. Da dann s + p 6= 0, so folgt
an en + · · · + a1 e + a0 6= 0.
Beweis. Es seien k ∈ N und g, h : R → R mit
g(x) = x(x − 1) · · · (x − n)
h(x) = e−x (x − 1) · · · (x − n).
Weiter definieren wir f : R → R durch f (x) = g(x)k h(x). Damit gilt
!k+1
n
X
f (x) = xk ((x − 1) · · · (x − n))k+1 e−x = xk
aj x j
e−x
j=0
wobei a0 = (−1)n n! und an = 1. Mit neuen Koeffizienten gilt


k+n(k+1)
X
f (x) = 
bj xj  e−x
j=k
wobei bk = ((−1)n n!)k+1 . Wir setzen
∞
Z
f (x)dx
w0 =
0
Wegen
|f (x)| = |xk ((x − 1) · · · (x − n))k+1 e−x | ≤ xk+n(k+1) e−x
gilt
Z
0
∞
f (x)dx ≤
∞
Z
w0 =

Z
∞
xk+n(k+1) e−x dx = (k + n(k + 1))!
0

k+n(k+1)
X

0
bj x
k+n(k+1)
j  −x
e dx =
j=k
=
j=k
Z
∞
bj
j=k
k+n(k+1)
X
X
xj e−x dx
0
k+n(k+1)
n
k+1
bj j! = ((−1) n!)
k! +
X
bj j!
j=k+1
Da alle Summanden von j = k + 1 bis k + n(k + 1) durch (k + 1)! teilbar sind, gibt
es ein c0 ∈ Z mit
(5.20)
w0 = ((−1)n n!)k+1 k! + c0 (k + 1)!
5.18. RATIONALE, IRRATIONALE, ALGEBRAISCHE UND TRANSZENDENTE ZAHLEN319
Wir setzen
r=
w0
= ((−1)n n!)k+1 + c0 (k + 1)
k!
und für i = 0, . . . , n
i
Z
f (x)dx
vi =
∞
Z
wi =
0
f (x)dx.
i
Es gelten für alle i = 0, . . . , n, dass w0 = vi + wi und
!
n
X
w
1
0
r(an en + · · · + a1 e + a0 ) =
ai ei =
k! i=0
k!
=
n
X
!
w 0 ai e i
i=0
1
1
(vn an en + · · · + v1 a1 e) + (wn an en + · · · w1 a1 e + w0 a0 )
k!
k!
Wir setzen
s=
1
(vn an en + · · · + v1 a1 e)
k!
p=
1
(wn an en + · · · w1 a1 e + w0 a0 )
k!
Wir betrachten
∞
Z
wi =
∞
Z
f (x)dx =
i
i
xk ((x − 1) · · · (x − n))k+1 e−x dx
Wir substituieren x − i = t
Z ∞
wi =
(t + i)k ((t + i − 1) · · · t · · · (t + i − n))k+1 e−t−i dt
0
= e
−i
Z
0
∞ k+n(k+1)
X
k+n(k+1)
j −t
−i
αj t e dt = e
j=k+1
X
αj j!,
j=k+1
wobei αj ∈ Z für alle j = k + 1, . . . , k + n(k + 1). Da j ≥ k + 1, gibt es ci ∈ Z mit
wi = ci (k + 1)!e−i
Es folgt mit (5.20)
1
(wn an en + · · · w1 a1 e + w0 a0 )
k!
1
1
=
(k + 1)!(cn an + · · · + c1 a1 ) + a0 (((−1)n n!)k+1 k! + c0 (k + 1)!)
k!
k!
= (k + 1)(cn an + · · · + c1 a1 ) + a0 ((−1)n n!)k+1 + (k + 1)c0 a0
p =
Da a0 , . . . , an ∈ Z und c0 , . . . , cn ∈ Z, gibt es ein α ∈ Z mit
p = (k + 1)α + a0 ((−1)n n!)k+1 .
Also gilt p ∈ Z. Wir überlegen uns nun, dass wir k so wählen können, dass p 6= 0.
Es gilt genau dann p = 0, wenn
(k + 1)α + a0 ((−1)n n!)k+1 = 0.
320
CHAPTER 5. INTEGRALRECHNUNG
Wir wählen für k + 1 eine Primzahl, die strikt größer als n und a0 ist. Dann ist
der erste Summand durch k + 1 teilbar, der zweite Summand aber nicht. Also gilt
p 6= 0.
Wir zeigen nun, dass |s| < 1. Da g und h stetige Funktionen sind, gibt es
Konstanten Cg , Ch , so dass für alle x ∈ [0, n]
|g(x)| ≤ Cg
|h(x)| ≤ Ch
gelten. Somit gilt |f (x)| ≤ Cgk Ch für alle x ∈ [0, n]. Hieraus folgt
Z i
|vi | = f (x)dx ≤ iCgk Ch
0
Es folgt weiter
n
n
n
1 X 1 X
1 k X
i
i
vi ai e ≤
|s| = v i ai e ≤ C g C h
iai ei
k!
k! i=1
k!
i=1
i=1
Es gilt
n
lim
k→∞
1 k X
C Ch
iai ei
k! g
i=1
!
=0
Also gibt es ein hinreichend großes k ∈ Z mit |s| < 1. 2
Unter Quadratur des Kreise versteht man die folgende Aufgabe. Zu einem
gegebenen Kreis soll man nur mit Zirkel und Lineal ein Quadrat konstruieren, das
denselben Flächeninhalt wie der Kreis hat.
Wenn wir annehmen, dass der Kreis den Radius 1 hat, dann bedeutet diese Aufgabe, dass man
√ zu einem gegebenen Geradenstück der Länge 1 ein Geradenstück
der Länge π konstruiert. Diese Konstruktion soll nur mit Zirkel und Lineal
durchgeführt werden. Man kann zeigen, dass eine Konstruktion mit Zirkel und
Lineal auf ein Geradenstück mit einer Länge führt, die eine algebraische Zahl ist,
wenn man von einem Geradenstück
der Länge 1 ausgeht. Ein Beispiel hierfür ist die
√
Konstruktion der Länge 2, wobei man von der Länge 1 ausgeht.√Man konstruiert
ein Quadrat mit der Seitenlänge
1. Die Diagonale hat die Länge 2.
√
Hat man
die
Länge
2
konstruiert,
dann kann man das Rechteck
mit den Seit√
√
enlängen 2 und 1 konstruieren.
Die Diagonale hat die Länge 3.
√
√ Weil π und damit π transzendent ist, kann man kein Streckenstück der Länge
π konstruieren.
Satz 5.18.6 Die Quadratur des Kreises ist nicht möglich.
Chapter 6
Funktionen mehrerer reeller
Variablen
6.1
Zusammenhängende Mengen im Rn
Die Verbindungsstrecke [x, y] zwischen zwei Punkten x, y ∈ Rn ist die Menge
{z|∃t ∈ [0, 1] : z = tx + (1 − t)y}
Eine Teilmenge M des Rn heißt polygonzusammenhängend , falls es für alle x, y ∈ M
endlich viele Punkte x1 , . . . , xm ∈ M gibt, so dass x = x1 , y = xm und
P=
m−1
[
i=1
[xi , xi+1 ] ⊆ M
gilt. Man nennt P einen Polygonzug und sagt, dass x und y durch einen Polygonzug
verbunden werden können.
M heißt bogenzusammenhängend , falls für alle x, y ∈ M eine stetige Funktion
f : [0, 1] → Rn existiert, so dass f (0) = x, f (1) = y und f ([0, 1]) ⊆ M gelten.
Eine Teilmenge M eines metrischen Raumes (X, d) heißt nicht zusammenhängend
, falls es zwei offene Mengen U und V von X mit
M ∩ U 6= ∅
M ∩ V 6= ∅
(M ∩ U) ∪ (M ∩ V) = M
(M ∩ U) ∩ (M ∩ V) = ∅
gibt. Eine Menge M ist also zusammenhängend, wenn man solche Mengen U und
V nicht finden kann.
Satz 6.1.1 Es seien (X, dX ) und (Y, dY ) metrische Räume und f : X → Y eine
stetige Funktion mit f (X) = Y . Falls X eine zusammenhängende Menge ist, dann
ist auch Y eine zusammenhängende Menge.
321
322
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Beweis. Es seien (X, dX ) und (Y, dY ) metrische Räume und f : X → Y eine
stetige Funktion. Wir zeigen, dass X nicht zusammenhängend ist, falls Y nicht
zusammenhängend ist.
Falls Y nicht zusammenhängend ist, dann gibt es zwei nichtleere, offene Mengen
A und B mit
A∩B =∅
A∪B =Y
Da f stetig ist, sind auch f −1 (A) und f −1 (B) offen. Wegen A ∩ B = ∅ folgt
f −1 (A) ∩ f −1 (B) = ∅
und wegen A ∪ B = Y gilt
f −1 (A) ∪ f −1 (B) = X
Also ist X nicht zusammenhängend. 2
Beispiel 6.1.1 (i) R ist zusammenhängend.
(ii) [0, 1] ist zusammenhängend.
Beweis. (i) Wir nehmen an, dass R nicht zusammenhängend ist. Dann gibt es zwei offene,
nichtleere Mengen A und B mit
A∩B =∅
A∪B =R
Wir können annehmen, dass es ein a0 ∈ A und ein b0 ∈ B mit a0 < b0 gibt. Wir betrachten
c = sup{a ∈ A|a < b0 }
Dann gilt c ∈
/ A. Falls nämlich c ∈ A, dann gäbe es eine Umgebung von c, die ganz in A liegt
und c kann nicht das Supremum sein. Wegen c ∈
/ A folgt c ∈ B. Da B offen ist, muss eine ganze
Umgebung von c in B enthalten sein. Also kann c nicht Supremum sein.
(ii) [0, 1] ist das stetige Bild von R, z.B. ist [0, 1] das Bild der stetigen Abbildung |sin|. 2
Satz 6.1.2 Es sei M eine Teilmenge des Rn .
(i) Falls M polygonzusammenhängend ist, so ist M auch bogenzusammenhängend.
(ii) Falls M bogenzusammenhängend ist, so ist M auch zusammenhängend.
Beweis. (i) Ein Polygonzug ist der Graph einer stetigen Funktion.
(ii) Da M bogenzusammenhängend ist, gibt es für alle x, y ∈ M einen Weg
Φ : [0, 1] → Rn mit
Φ(0) = x
Φ(1) = y
Φ([0, 1]) ⊆ M
Wir nehmen an, dass M nicht zusammenhängend ist. Es gibt also offene Mengen A
und B mit
A∩B∩M =∅
M ⊆A∪B
A ∩ M 6= ∅
B ∩ M 6= ∅
6.1. ZUSAMMENHÄNGENDE MENGEN IM RN
323
Wir wählen nun x ∈ A ∩ M und y ∈ B ∩ M . Es gibt einen Weg Φ, der die beiden
Punkte verbindet. Die Menge Φ([0, 1]) ist das stetige Bild einer zusammenhängenden
Menge also selbst zusammenhängend. Andererseits gelten
A ∩ Φ([0, 1]) 6= ∅
A ∩ B ∩ Φ([0, 1]) = ∅
B ∩ Φ([0, 1]) 6= ∅
A ∩ Φ([0, 1])) ∪ (B ∩ Φ([0, 1])) = Φ([0, 1])
Also ist Φ([0, 1]) nicht zusammenhängend, was ein Widerspruch ist. 2
Satz 6.1.3 Es sei M eine offene Teilmenge vom Rn . Dann sind äquivalent:
(i) M ist zusammenhängend.
(ii) M ist bogenzusammenhängend.
(iii) M ist polygonzusammenhängend.
Beweis. Die Implikationen (iii) ⇒ (ii) ⇒ (i) folgen aus Satz 6.1.2.
(i) ⇒ (iii): Wir wählen einen beliebigen Punkt x0 ∈ M . Es sei Mx0 die Menge
aller Punkte, die mit x0 durch einen Polygonzug verbunden werden können. Falls
M = Mx0 , dann ist M polygonzusammenhängend.
Wir betrachten nun den Fall, dass Mx0 6= M . Wir zeigen, dass Mx0 offen ist.
Dazu müssen wir zeigen, dass wir zu jedem x ∈ Mx0 eine Umgebung finden, die
ganz in Mx0 liegt. Zu x ∈ Mx0 wählen wir eine offene Kugel B(x, ), die ganz in M
liegt und deren Mittelpunkt x ist. Es sei
N
[
[x`−1 , x` ]
`=1
ein Polygonzug, der x0 und x verbindet und der in M liegt. Weiter sei y ∈ B(x, ).
Dann ist
N
[
[x`−1 , x` ] ∪ [x, y]
`=1
ein Polygonzug, der x0 mit y verbindet und der in M liegt.
Ebenso zeigen wir, dass die Menge Nx0 aller x ∈ M , die man nicht mit x0 durch
einen Polygonzug verbinden kann, offen ist. Wir betrachten einen Punkt y dieser
Menge und eine Kugel B(y, ) mit Mittelpunkt y, die ganz in M liegt. Dann müssen
alle Elemente dieser Kugel ebenfalls in Nx0 liegen. Falls nicht, so gibt es ein x ∈ Mx0 ,
das in der Kugel B(y, ) liegt und damit einen Polygonzug
N
[
[y`−1 , y` ]
`=1
der x mit x0 verbindet (y0 = x0 und yN = x). Diesen Polygonzug können wir bis y
verlängern:
N
[
[y`−1 , y` ] ∪ [x, y].
`=1
324
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Somit liegt y in Mx0 , was falsch ist.
Also gibt es zwei offene Teilmengen Mx0 und Nx0 , die disjunkt sind und deren
Vereinigung gleich M ist. Damit ist M nicht zusammenhängend. 2
Eine Menge, die offen und zusammenhängend ist, heißt Gebiet.
Beispiel 6.1.2 (i) Die Teilmenge
{(x, y)|x2 + y 2 = 1}
des R2 ist bogenzusammenhängend, aber nicht polygonzusammenhängend.
(ii) Die Teilmenge
{(x, y)|x = 0, y ∈ R} ∪ {(x, y)|x ∈ (0, 1] und y = sin x1 }
des R2 ist zusammenhängend, aber nicht bogenzusammenhängend.
Beweis. (ii) Wir bezeichnen
S = (x, y)|y = sin x1 und x ∈ (0, 1]
L = {(0, y)|y ∈ R}
Wir nehmen an, dass M = L ∪ S nicht zusammenhängend ist. Dann gibt es offene Teilmengen A
und B mit
A∩B∩M =∅
A∪B ⊇M
A ∩ M 6= ∅
B ∩ M 6= ∅
Wir betrachten zunächst den Fall
A∩M =L
B∩M =S
Da A offen ist, gibt es ein > 0, so dass
B((0, 0), ) ⊆ A
Hieraus folgt
B((0, 0), ) ∩ M ⊆ A ∩ M = L
1
Andererseits gilt für alle n ∈ N, dass ( 2πn
, 0) ∈ S. Wir können n hinreichend groß wählen, so dass
(
1
, 0) ∈ B((0, 0), )
2πn
Das ist ein Widerspruch.
Wir wenden uns nun dem Fall zu, dass
A ∩ M 6= L
B ∩ M 6= S
Dann muss einer der folgenden Fälle gelten.
A ∩ L 6= ∅
und
B ∩ L 6= ∅
A ∩ S 6= ∅
und
B ∩ S 6= ∅
oder
Deshalb ist L oder S nicht zusammenhängend. Dies ist aber falsch.
Wir zeigen nun, dass M nicht bogenzusammenhängend ist. Wir nehmen an, dass M bogenzusammenhängend ist. Insbesondere gibt es eine stetige Funktion φ : [0, 1] → M mit φ(0) = (0, 0)
und φ(1) = (1, sin 1). Dann sind die beiden Koordinatenfunktionen φ1 und φ2 von φ stetig. Es
gilt φ1 (0) = 0 und φ1 (1) = 1. Da φ1 stetig ist, nimmt φ1 nach dem Zwischenwertsatz alle Werte
6.1. ZUSAMMENHÄNGENDE MENGEN IM RN
325
1
, k ∈ N. Da tk , k ∈ N, eine
des Intervalls [0, 1] an. Also gibt es Zahlen tk ∈ [0, 1] mit φ1 (tk ) = 2πk
beschränkte Folge ist, gibt es eine Teilfolge tki , i ∈ N, die in [0, 1] konvergiert also
t0 = lim tki
i→∞
Es folgt
lim φ(tki ) = lim (φ1 (tki ), φ2 (tki )) = lim
i→∞
i→∞
i→∞
1
,0
2πki
= (0, 0)
1
und φ1 (tki+1 ) = 2πk1i+1 , gibt es nach dem Zwischenwertsatz ein
Da φ1 stetig ist und φ1 (tki ) = 2πk
i
si ∈ (tki , tki+1 ) mit φ1 (si ) = π(2k1+ 1 ) . Die Folge si , i ∈ N, konvergiert und
i
2
lim φ(si ) = lim
i→∞
i→∞
1
π(2ki + 12 )
, 1 = (0, 1)
Dies ist ein Widerspruch, weil limi→∞ φ(si ) = limi→∞ φ(tki ). 2
Beispiel 6.1.3 [110] Es seien a, b ∈ R mit a, b > 0 und a0 = a, b0 = b
an+1 =
p
an bn
an + bn
2
bn+1 =
2
für n = 0, 1, 2, . . . . Zeige: Die Folge {(an , bn )}∞
n=0 konvergiert in R gegen den Punkt (agm, agm)
wobei
!−1
Z π2
π
1
p
agm =
dt
.
2
0
a2 cos2 t + b2 sin2 t
Man nennt agm das arithmetisch-geometrische Mittel von a und b.
Beweis. Es reicht zu zeigen,
√ dass an , n ∈ N, und bn , n ∈ N, in R gegen agm konvergieren.
Für alle s, t ≥ 0 gilt st ≤ s+t
2 . Wir zeigen, dass für alle n = 1, 2, . . .
an ≤ bn
bn+1 ≤ bn
√
gelten. Die Ungleichung an ≤ bn folgt sofort aus der Ungleichung st ≤
Ungleichung an ≤ bn
an+1 =
p
an ≤ an+1
an bn ≥
p
a2n = an
bn+1 =
s+t
2 .
Weiter folgt aus der
an + bn
≤ bn
2
Hieraus folgt, dass an , n ∈ N eine beschränkte, monoton wachsende Folge ist, also eine konvergente
Folge ist. bn , n ∈ N, ist eine beschränkte, monoton fallende Folge, also konvergent. Wir zeigen,
dass die Grenzwerte gleich sind.
lim bn+1 = lim
n→∞
n→∞
a n + bn
1
1
=
lim an + lim bn
2
2 n→∞
2 n→∞
Also gilt
lim an = lim bn
n→∞
n→∞
Damit konvergiert die Folge (an , bn ), n ∈ N, in R2 . Wir weisen jetzt nach, dass der Grenzwert
(agm, agm ist. Dazu weisen wir zunächst nach, dass
Z
0
gilt.
π
2
1
p
dt =
2
2
a cos t + b2 sin2 t
Z
0
π
2
1
q
2
( a+b
2 )
cos2 t + ab sin2 t
dt
326
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Es gilt
Z
0
π
√
1
dΘ
c2 + 2cd cos Θ + d2
Rπ
=
0
=
Mit der Transformation φ = Θ
2 erhalten wir
Z π
1
√
dΘ
2
c + 2cd cos Θ + d2
0
Rπ
=2
=2
R
π
2
0
√
√
0
π
2
R
1
dΘ
(c+d)2 −2cd(1−cos Θ)
0
√
1
(c+d)2 −4cd sin2
√
Θ
2
dΘ
1
dφ
(c+d)2 −4cd sin2 φ
1
dφ
(c+d)2 cos2 φ+(c−d)2 sin2 φ
Andererseits gilt für c > d
Z π
Z π2
1
1
√
q
dΘ = 2
dφ
2
2
c + 2cd cos Θ + d
0
0
c2 cos2 φ + (c2 − d2 ) sin2 φ
ψ−Θ
r
c
c sin Θ
ψ
Θ
c cos Θ
Halbkreis mit Radius c
Es gilt
r2 = (c sin Θ)2 + (d + c cos Θ)2 = c2 + cd cos Θ + d2
tan ψ =
c sin Θ
c cos Θ+d
r=
sin(Θ − ψ) =
Damit folgt
und
d
c
c cos Θ+d
cos ψ
sin ψ
d
d
c sin Θ
tan ψ =
dΘ
dΘ c cos Θ + d
1 dψ
c2 cos2 Θ + cd cos Θ + c2 sin2 Θ
=
2
cos ψ dΘ
(c cos Θ + d)2
6.1. ZUSAMMENHÄNGENDE MENGEN IM RN
327
c2 sin2 Θ
c cos Θ + d dψ
=
c
cos
Θ
+
= c cos Θ + c sin Θ tan ψ
cos2 ψ dΘ
c cos Θ + d
c cos Θ + d dψ
= c cos Θ cos ψ + c sin Θ sin ψ = c cos(ψ − Θ)
cos ψ dΘ
p
dψ
dψ
= c2 + 2cd cos Θ + d2
c cos(ψ − Θ) = r
dΘ
dΘ
Hiermit folgt
Z π
0
√
1
dΘ =
2
c + 2cd cos Θ + d2
π
Z
0
1
dψ
dΘ =
c cos(ψ − Θ) dΘ
Z
π
0
1
dψ
c cos(ψ − Θ)
wobei Θ = Θ(ψ). Aus der Skizze ist |ψ −Θ| < π2 und damit cos(ψ −Θ) > 0 zu entnehmen. Deshalb
ist das letzte Integral gleich
Z
Z
1 π
1 π
1
1
q
q
dψ =
dψ
2
c 0
c
0
1 − dc2 sin2 ψ
1 − sin2 (ψ − Θ)
Z π2
1
p
= 2
dψ
0
c2 − d2 sin2 ψ
Z π2
1
q
dψ
= 2
0
(c2 − d2 ) sin2 ψ + c2 cos2 ψ
Es folgt
π
2
Z
1
q
0
Z
(c + d)2 cos2 φ + (c − d)2 sin2 φ
π
2
dφ =
1
q
0
(c2 − d2 ) sin2 ψ + c2 cos2 ψ
dψ
Nun setzen wir a = c + d und b = c − d. Damit gilt
c2 − d2 = (c + d)(c − d) = ab
Also gilt
π
2
Z
0
c=
1
p
dt =
2
2
a cos t + b2 sin2 t
(c + d) + (c − d)
a+b
=
2
2
π
2
Z
1
q
0
2
( a+b
2 )
cos2 t + ab sin2 t
dt
Hiermit können wir nun zeigen, dass die Grenzwerte von an , n ∈ N, und bn , n ∈ N, gleich agm
sind. Mit Induktion folgt für n = 1, 2, . . .
Z
π
2
0
1
Z
p
dt =
a2 cos2 t + b2 sin2 t
0
π
2
1
q
a2n cos2 t + b2n sin2 t
dt
Es folgt weiter
Z
0
π
2
1
p
a2
cos2
t+
π
2
Z
b2
2
sin t
dt =
lim
n→∞
Z
lim q
n→∞
0
Z
0
a2n cos2 t + b2n sin2 t
π
2
=
=
0
1
q
1
a2n cos2 t + b2n sin2 t
π
2
dt
dt
1
q
limn→∞ a2n
cos2
t + limn→∞ b2n sin2 t
dt
328
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Da die Grenzwerte der Folgen gleich sind, folgt weiter
Z π2
Z π2
1
1
1
1
π
p
p
dt =
dt =
.
2
2
2
2
2
2
lim
a
lim
a
n→∞ n 0
n→∞ n 2
0
a cos t + b sin t
cos t + sin t
2
Zum Schluss noch ein Auszug aus dem Buch ”Einführung in die informationstheoretische Ästhetik” von M. Bense [Ben, p.88-89]. In dem Abschnitt ”Texttopologie”
schreibt er:
Wie die mathematische Disziplin der Topologie sich mit Mengen von Elementen,
etwa Punkten, befaßt, deren Gesamtheiten als Räume bezeichnet werden, versucht
die Texttopologie in entsprechender Weise von Texten als Worträumen zu sprechen,
deren Elemente Wörter oder andere linguistische Elemente wie etwa Buchstaben des
Alphabets oder Morpheme sind......
Die topologische Struktur eines Textes - die texttopologische Struktur - kann
allgemein als das System der Umgebungen seiner Wörter und damit natürlich auch
als ein System der Teilmengen des allgemeinen zugrundeliegenden Wortraumes, also
des Textes aller Texte, aufgefaßt werden.
Ich sagte bereits, dass Texte Zusammenhänge von Wörtern formulieren. Die
Frage nach der Struktur eines Zusammenhangs ist eine ausgesprochen topologische
Frage. Doch setzt der Sinn dieser Frage einen anderen, ebenso wichtigen Begriff
der Topologie voraus, den Begriff der offenen bzw. abgeschlossenen Menge. Der
Begriff <abgeschlossen> fungiert in der Topologie einfach als Komplement zum
Begriff <offen>, aber man sollte beide nicht allzu eng mit bildlichen Vorstellungen
verbinden. Vielleicht ist es gut, daran zu erinnern, daß der Begriff offene Menge etwa
in dem Sinne verwendet wird, wie man <offenes Meer> sagt und daran denkt, daß
sich sein Horizont in einem gewissen Sinne immer weiter hinausschiebt. Jedenfalls
soll der Begriff Offenheit einer Menge oder eines Raumes zum Ausdruck bringen,
daß noch eine Ergänzung möglich ist, die erst die Abgeschlossenheit erzeugt.
Die topologische Definition des Zusammenhangs besagt nun, daß eine Menge
zusammenhängend genannt werden darf, wenn sie nicht in zwei offene oder, was
damit gleichbedeutend wäre, in zwei abgeschlossene Teilmengen zerlegbar ist. Überträgt
man diesen Aspekt auf Texte, so muß von zwei Wörtern oder sprachlichen Ausdrücken,
die einen Text bilden sollen, der eine Teil als offen bezeichnet werden können und
der der andere als abgeschlossen, damit von einem Zusammenhang die Rede sein
kann. Daß das möglich ist, erkennt man am Beispiel eines elementaren Satzes wie
<Das Meer ist grün>.
Der Subjektteil des Satzes,<Das Meer>, kannn als abgeschlossener Ausdruck
angesehen werden; er ist keiner Ergänzung bedürftig, um sinnvoll zu sein; er hat
eine klaren Objektbezug. Der Prädikatteil des Satzes hingegen <ist grün> muß als
offener Ausdruck betrachtet werden; der Logiker Frege bezeichnete das Prädikat
als <ungesättigten Ausdruck>; tatsächlich fungiert ein Prädikat erst im Hinblick
auf das Subjekt sinnvoll.
Der Satz <Das Meer is grün> bildet daher im texttopologischen Sinne einen
Zusammenhang, weil er nicht in zwei offene oder abgeschlossene Teilmengen zerlegbar ist, sondern in eine abgeschlossene und in eine offene.
6.2. RICHTUNGSSTETIGKEIT, RICHTUNGSABLEITUNG UND PARTIELLE ABLEITUNGEN329
6.2
Richtungsstetigkeit, Richtungsableitung und
Partielle Ableitungen
Eine Richtung im Rn ist durch einen Vektor ξ ∈ Rn mit
kξk2 =
n
X
i=1
! 21
|ξi |2
=1
gegeben.
Definition 6.2.1 Es sei U eine offene Teilmenge vom Rn . Eine Funktion f : U →
R heißt in x0 ∈ U in Richtung ξ stetig, falls es ein η > 0 gibt, so dass die Funktion
g : (−η, η) → R mit g(t) = f (x0 + tξ) in 0 stetig ist.
gilt
Äquivalent kann man sagen: Für alle reelle Folgen hk , k ∈ N, mit limk→∞ hk = 0
lim f (x0 + hk ξ) = f (x0 ).
k→∞
Falls f in x0 stetig ist, so ist f auch in jede Richtung stetig. Die Umkehrung gilt
nicht, wie das erste Beispiel belegt.
Beispiel 6.2.1 Es sei f : R2 → R durch
(
1
f (x, y) =
0
falls y = x2 und x > 0
sonst
gegeben. f ist in (0, 0) nicht stetig, aber f ist in (0, 0) in jede Richtung stetig.
Beweis. Für die Folge ( k1 , k12 ), k ∈ N, gilt
f ( k1 , k12 ) = 1.
Es folgt
lim f ( k1 , k12 ) = 1 6= 0 = f (0, 0).
k→∞
Damit ist f in (0, 0) nicht stetig. 2
Definition 6.2.2 Es sei U eine offene Teilmenge des Rn . Eine Funktion f : U → R
heißt in x0 ∈ U in Richtung ξ differenzierbar, falls
∂f
f (x0 + hξ) − f (x0 )
(x0 ) = lim
h→0
∂ξ
h
existiert. Wir nennen diesen Wert die Richtungsableitung von f in Richtung ξ.
330
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Es seien
ei = (0, . . . , 0, 1, 0 . . . , 0)
i = 1, . . . , n
die Einheitsvektoren. Die Richtungsableitung von f in Richtung ei wird als die i-te
partielle Ableitung bezeichnet und mit
∂f
(x0 )
∂xi
i = 1, . . . , n
notiert. Dies ist also gleich der Ableitung der Funktion g : (x0 (i) − η, x0 (i) + η) → R
mit
g(t) = f (x0 (1), . . . , x0 (i − 1), t, x0 (i + 1), . . . , x0 (n))
im Punkt t = x0 (i).
Beispiel 6.2.2 (i) Es sei f : R2 → R mit f (x, y) = exy . Dann gilt
∂f
= yexy
∂x
∂f
= xexy
∂y
(ii) Es sei f : R2 → R mit f (x, y) = sin(xy). Dann gilt
∂f
= x cos(xy)
∂y
∂f
= y cos(xy)
∂x
sin(xy)
1
0.5
2
0
1
-0.5
-1
-2
0
-1
-1
0
1
2 -2
(iii) Es sei f : R2 → R mit f (x, y) = x2 y 3 . Dann gilt
∂f
= 2xy 3
∂x
∂f
= 3x2 y 2
∂y
6.3. DIFFERENZIERBARKEIT IM RN
331
(iv) Es sei f : R2 → R mit
(
f (x, y) =
1
falls x = 0 oder y = 0
0
sonst
Dann ist f nicht in (0, 0) stetig, aber die partiellen Ableitungen existieren in (0, 0) und es gelten
∂f
(0, 0) = 0
∂x
und
∂f
(0, 0) = 0.
∂y
Beweis. (iv) Wir zeigen, dass f nicht in (0, 0) stetig ist. Es gelten f (0, 0) = 1 und
lim f ( k1 , k1 ) = 0.
k→∞
2
Es sei U eine offene Teilmenge vom Rn und x0 ∈ U. Die Funktion f : U → R sei
in x0 partiell differenzierbar, d.h. die partiellen Ableitungen existieren. Der Vektor
∂f
∂f
(x0 ), . . . ,
(x0 )
grad f (x0 ) =
∂x1
∂xn
heißt Gradient von f . Wir schreiben auch ∇f (x0 ) für grad f (x0 ). Der Ausdruck ∇
wird Nabla genannt, weil er die Form eines harfenähnlichen jüdischen Saiteninstrumentes hat.
6.3
Differenzierbarkeit im Rn
Wir führen hier die Differenzierbarkeit von Funktionen mehrerer Veränderlicher ein.
Dabei zeigen wir, dass sich die Ableitung einer Funktion die Matrix ihrer partiellen Ableitungen ist. Eine wichtige Frage ist, wie man leicht nachweist, dass eine
gegebene Funktion differenzierbar ist. Satz 6.3.4 stellt sicher, dass eine Funktion
differenzierbar ist, wenn ihre partiellen Ableitungen stetig sind.
Definition 6.3.1 Es sei U eine offene Teilmenge des Rn und x0 ∈ U. Eine Funktion f : U → R heißt differenzierbar (oder auch total differenzierbar) in x0 , falls es
eine lineare Abbildung T : Rn → R gibt, so dass
(6.1)
f (x0 + h) − f (x0 ) − T h
=0
h→0
khk
lim
gilt. Die lineare Abbildung T heißt das Differential oder auch totales Differential
von f . Wir schreiben für T auch df (x0 ).
Die Bedingung (6.1) lässt sich auch anders schreiben: Es gibt eine lineare Abbildung T : Rn → R, eine Umgebung V(x0 ) von x0 und eine Abbildung R : V(x0 ) → R,
so dass für alle h mit x0 + h ∈ V(x0 )
f (x0 + h) − f (x0 ) = T h + R(h),
332
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
und
lim
h→0
R(h)
=0
khk
gelten. Die Äquivalenz zur Definition der Differenzierbarkeit ergibt sich, indem man
R(h) = f (x0 + h) − f (x0 ) − T h
wählt.
Die Matrixdarstellung (T (e1 ), . . . , T (en )) von T bzgl. der Standardbasis e1 , . . . , en
des Rn bezeichnen wir als die Ableitung von f im Punkt x0 . Wir schreiben dafür
auch (df (x0 )(e1 ), . . . , df (x0 )(en )). Wir schreiben für die Ableitung an der Stelle x0
auch
df
df (x0 )
(x0 )
bzw.
dx
dx
df
.
und für die Funktion, die einem Punkt die Ableitung zuordnet dx
Wenn wir T in der Matrixdarstellung bzgl. der Standardbasis e1 , . . . , en betrachten, dann nimmt die Definition der Differenzierbarkeit die folgende Form an: Es
sei U eine offene Teilmenge des Rn und x0 ∈ U. Eine Funktion f : U → R heißt
differenzierbar in x0 , falls es einen Vektor c = (c1 , . . . , cn ) ∈ Rn , eine Umgebung
V(x0 ) und eine Funktion φ : V(x0 ) → R gibt, so dass für alle x ∈ V(x0 )
f (x) = f (x0 )+ < c, x − x0 > +φ(x)kx − x0 k
und
φ(x0 ) = lim φ(x) = 0
x→x0
gelten. Der Vektor c ist Ableitung von f in x0 .
Als geometrische Interpretation für die Ableitung einer Funktion f : R → R
hatten wir angegeben, dass f durch eine Gerade approximiert werden kann. Für
eine Funktion f : Rn → R kann man sagen, dass der Graph von f durch eine Ebene
approximiert werden kann.
Satz 6.3.1 Es sei U eine offene Teilmenge des Rn und x0 ∈ U. Die Funktion
f : U → R sei in x0 differenzierbar. Dann existieren alle partiellen Ableitungen und
die Ableitung von f in x0 ist
∂f
∂f
(x0 ), . . . ,
(x0 )
∂x1
∂xn
Beweis. Es sei V(x0 ) eine Umgebung von x0 , so dass für alle x ∈ V(x0 )
f (x) = f (x0 )+ < c, x − x0 > +φ(x)kx − x0 k
gilt. Wir setzen x = x0 + hek . Dann gilt
f (x0 + hek ) = f (x0 )+ < c, hek > +φ(x0 + hek )khek k
= f (x0 ) + hck + |h|φ(x0 + hek ).
6.3. DIFFERENZIERBARKEIT IM RN
333
Es folgt
|h|
f (x0 + hek ) − f (x0 )
= ck +
φ(x0 + hek ).
h
h
Wegen limx→x0 φ(x) = 0 folgt
f (x0 + hek ) − f (x0 )
|h|
∂f
(x0 ) = lim
= ck + lim
φ(x0 + hek ) = ck .
h→0
h→0 h
∂xk
h
Bemerkung 6.3.1 Es sei U eine offene Teilmenge des Rn und x0 ∈ U. Die Funktion f : U → R sei in x0 differenzierbar. Dann ist f in jede Richtung ξ, kξk2 = 1,
differenzierbar und die Richtungsableitung erfüllt
∂f
(x0 ) =< ∇f (x0 ), ξ >
∂ξ
und
∂f
(x0 ) ≤ k∇f (x0 )k2 =
∂ξ
2 ! 21
n X
∂f
.
(x
)
0
∂xi
i=1
Beweis. Mit Satz 6.3.1 folgt
f (x) = f (x0 )+ < ∇f (x0 ), x − x0 > +φ(x)kx − x0 k.
Mit x = x0 + hξ erhalten wir
f (x0 + hξ) = f (x0 )+ < ∇f (x0 ), hξ > +φ(x0 + hξ)khξk
= f (x0 ) + h < ∇f (x0 ), ξ > +|h|φ(x0 + hξ).
Es folgt
f (x0 + hξ) − f (x0 )
|h|
=< ∇f (x0 ), ξ > + φ(x0 + hξ).
h
h
Damit erhalten wir
f (x0 + hξ) − f (x0 )
∂f
(x0 ) = lim
=< ∇f (x0 ), ξ > .
h→0
∂ξ
h
Die Abschätzung folgt mit der Abschätzung von Cauchy-Schwarz,
∂f
(x0 ) = |< ∇f (x0 ), ξ >| ≤ k∇f (x0 )k2 kξk2 = k∇f (x0 )k2
∂ξ
2
Falls eine Funktion in einem Punkt in jede Richtung differenzierbar ist, so muss
sie nicht notwendig in diesem Punkt differenzierbar sein. Die Funktion von Beispiel
6.2.1 ist in (0, 0) in jede Richtung differenzierbar, aber nicht in (0, 0) differenzierbar.
334
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Die Bemerkung zeigt, dass die Richtung
ξ=
∇f (x0 )
k∇f (x0 )k
∇f (x0 )
gilt
die Richtung des größten Anstiegs ist. Für ξ = k∇f
(x0 )k
∂f
∇f (x0 )
(x0 ) = ∇f (x0 ),
= k∇f (x0 )k
∂ξ
k∇f (x0 )k
während für beliebige ξ
∂f
(x0 ) ≤ k∇f (x0 )k
∂ξ
gilt.
Satz 6.3.2 Es sei U eine offene Teilmenge des Rn und f : U → R sei in x0 differenzierbar. Dann existiert zu jedem > 0 ein δ > 0, so dass für alle x ∈ U mit
kx − x0 k2 < δ
|f (x) − f (x0 )| ≤ (k∇f (x0 )k2 + )kx − x0 k2 .
Beweis. Es gilt
f (x) = f (x0 )+ < ∇f (x0 ), x − x0 > +φ(x)kx − x0 k2 .
Da limx→x0 φ(x) = 0 gilt, gibt es ein δ > 0, so dass für alle x mit kx − x0 k2 < δ die
Abschätzung |φ(x)| < gilt. Es ergibt sich
|f (x) − f (x0 )| ≤ | < ∇f (x0 ), x − x0 > | + kx − x0 k2
≤ k∇f (x0 )k2 kx − x0 k2 + kx − x0 k2 .
2
Satz 6.3.3 Es sei U eine offene Teilmenge des Rn und f : U → R sei in x0 differenzierbar. Dann ist f in x0 stetig.
Beweis. Nach Satz 6.3.2 gibt es ein δ0 , so dass für alle x mit kx − x0 k2 < δ0
|f (x) − f (x0 )| ≤ (k∇f (x0 )k2 + 1)kx − x0 k2
gilt. Zu gegebenem wählen wir
δ = min δ0 ,
k∇f (x0 )k2 + 1
.
Dann gilt für alle x mit kx − x0 k2 < δ
|f (x) − f (x0 )| ≤ (k∇f (x0 )k2 + 1)kx − x0 k2 < (k∇f (x0 )k2 + 1)δ = .
2
6.3. DIFFERENZIERBARKEIT IM RN
335
Satz 6.3.4 Es sei U eine offene Teilmenge des Rn und f : U → R. Es existiere
eine Umgebung V(x0 ) mit V(x0 ) ⊂ U, so dass die partiellen Ableitungen
∂f
: V(x0 ) → R
∂xi
i = 1, . . . , n
existieren und in x0 stetig sind. Dann ist f in x0 differenzierbar.
Mit Satz 6.3.4 kann man in den meisten Fällen nachweisen, dass eine Funktion
differenzierbar ist. Zum richtigen Verständnis sei hier noch einmal betont: Man
∂f
muss nachweisen, dass ∂x
als Funktion von V(x0 ) nach R, also als Funktion von n
i
∂f
wird als Funktion von n Variablen aufgefasst.
Veränderlichen in x0 stetig ist. ∂x
i
Beweis. Es sei t ∈ Rn . Dann gilt
f (x0 + t) = f (x0 )
+f (x0 (1) + t(1), x0 (2), . . . , x0 (n)) − f (x0 )
..
.
+f (x0 (1) + t(1), . . . , x0 (k) + t(k), x0 (k + 1), . . . , x0 (n))
−f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), x0 (k), . . . , x0 (n))
..
.
f (x0 (1) + t(1), . . . , x0 (n) + t(n))
−f (x0 (1) + t(1), . . . , x0 (n − 1) + t(n − 1), x0 (n)).
Also
f (x0 + t) = f (x0 ) +
n
X
(f (x0 (1) + t(1), . . . , x0 (k) + t(k), x0 (k + 1), . . . , x0 (n))
k=1
−f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), x0 (k), . . . , x0 (n)))
Dies nennt man eine Teleskopsumme. Wir wenden nun den Mittelwertsatz der
Differentialrechnung (Satz 3.6.2) auf die Funktionen gk : [x0 (k), x0 (k) + t(k)] → R,
k = 1, . . . , n mit
gk (s) = f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), s, x0 (k + 1), . . . , x0 (n))
an. Nach dem Mittelwertsatz gibt es für alle k = 1, . . . , n
ξk ∈ (x0 (k), x0 (k) + t(k))
mit
gk (x0 (k) + t(k)) − gk (x0 (k))
t(k)
1
=
(f (x0 (1) + t(1), . . . , x0 (k) + t(k), x0 (k + 1), . . . , x0 (n))
t(k)
−f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), x0 (k), . . . , x0 (n))).
gk0 (ξk ) =
336
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Hieraus folgt sofort für alle k = 1, . . . , n
f (x0 (1) + t(1), . . . , x0 (k) + t(k), x0 (k + 1), . . . , x0 (n))
−f (x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), x0 (k), . . . , x0 (n))
∂f
(x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), ξk , x0 (k + 1), . . . , x0 (n)).
= t(k)
∂xk
Damit folgt
f (x0 + t) = f (x0 )
n
X
∂f
(x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), ξk , x0 (k + 1), . . . , x0 (n)).
+
t(k)
∂x
k
k=1
Also gilt
f (x0 + t) − f (x0 ) −
=
n
X
t(k)
k=1
n
X
k=1
t(k)
∂f
(x0 )
∂xk
∂f
(x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), ξk , x0 (k + 1), . . . , x0 (n))
∂xk
∂f
(x0 ) .
−
∂xk
Wir setzen nun
φ(x0 + t)
n
X
t(k) ∂f
=
(x0 (1) + t(1), . . . , x0 (k − 1) + t(k − 1), ξk , x0 (k + 1), . . . , x0 (n))
ktk ∂xk
k=1
∂f
−
(x0 ) .
∂xk
Wegen der Stetigkeit der partiellen Ableitungen gilt
lim φ(x0 + t) = 0
t→0
und es folgt
f (x0 + t) − f (x0 ) −
n
X
k=1
t(k)
∂f
(x0 ) = ktkφ(x0 + t).
∂xk
2
Beispiel 6.3.1 (i) Es sei f : R2 → R mit f (x, y) = exy . Dann ist f auf R2 differenzierbar und
die Ableitung ist
∂f ∂f
,
= (yexy , xexy ).
∂x ∂y
6.3. DIFFERENZIERBARKEIT IM RN
337
(ii) Es sei f : R2 → R mit f (x, y) = sin(xy). Dann ist f auf R2 differenzierbar und die Ableitung
ist
∂f ∂f
,
= (y cos(xy), x cos(xy)).
∂x ∂y
(iii) Es sei f : (0, ∞) × R → R durch f (x, y) = xy gegeben. Dann ist f differenzierbar und die
Ableitung ist
∂f ∂f
,
= (yxy−1 , (ln x)xy ).
∂x ∂y
In allen Fällen reicht es die Stetigkeit der partiellen Ableitungen nachzuprüfen und Satz 6.3.4
anzuwenden.
Beweis. (i) Wir zeigen, dass die partiellen Ableitungen stetig sind. Die Abbildungen p, q : R2 → R
mit p(x, y) = x und q(x, y) = y sind stetig. Produkte von stetigen Funktionen sind stetig, also ist
p · q mit p · q(x, y) = x · y stetig. Hintereinanderausführungen von stetigen Funktionen sind stetig.
Deshalb ist ep·q stetig. 2
Ein Beispiel einer Funktion, die in einem Punkt differenzierbar ist, die partiellen
Ableitungen aber unstetig sind, ist das folgende. Es ist eine Variation eines Beispiels
für Funktionen von R nach R (Beispiel 3.5.3).
Beispiel 6.3.2 Es sei f : R2 → R durch
 2
1
 (x + y 2 ) sin x2 +y2
f (x, y) =

0
(x, y) 6= (0, 0)
(x, y) = (0, 0)
gegeben. Die Funktion ist überall differenzierbar, die partiellen Ableitungen sind nur in (0, 0)
unstetig.
Beweis. Die Funktion ist überall differenzierbar. Die partiellen Ableitungen existieren überall
und sind bis auf (0, 0) überall stetig. Die partiellen Ableitungen für (x, y) 6= (0, 0) sind
1
2x
1
∂f
= 2x sin 2
− 2
cos 2
∂x
x + y2
x + y2
x + y2
∂f
1
2y
1
= 2y sin 2
− 2
cos 2
2
2
∂y
x +y
x +y
x + y2
Die partiellen Ableitungen sind stetig in allen (x, y) 6= (0, 0). Damit ist f für (x, y) 6= (0, 0)
differenzierbar.
Wir zeigen nun, dass f in (0, 0) differenzierbar ist und die Ableitung (0, 0).
1
1
f (x, y) − f (0, 0)
p
= (x2 + y 2 ) 2 sin 2
2
2
x + y2
x +y
Nun benutzen wir
| sin t| ≤ 1
Also
f (x, y) − f (0, 0) p
p
≤ x2 + y 2
x2 + y 2
Insbesondere folgt, dass die partiellen Ableitungen in (0, 0) gleich 0 sind.
338
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Im Nullpunkt sind die partiellen Ableitungen nicht stetig. Wir zeigen, dass
stetig ist. Dazu betrachten wir die Folge
1
0, √
.
2πk
k∈N
Es gilt
∂f
∂y
0, √
1
2πk
=√
∂f
∂y
in (0, 0) nicht
√
√
2
sin(2πk) − 2 2πk cos(2πk) = −2 2πk
2πk
Diese Folge konvergiert nicht gegen 0.
Die Unstetigkeit von ∂f
∂y in (0, 0) wird genau so bewiesen, wir betrachten dazu die Folge
√
1
,0
.
2πk
k∈N
2
Beispiel 6.3.3 Es sei f : R2 → R mit

0


f (x, y) =
q

y2
 y
x2 +y 2
x=y=0
falls
sonst
Dann ist f überall stetig und bis auf den Punkt (0, 0) differenzierbar. Die partiellen Ableitungen
existieren überall.
Beweis. f ist überall stetig. f ist überall, bis auf den Punkt (0, 0) differenzierbar. Die partiellen
Ableitungen existieren überall.
Wir berechnen die partiellen Ableitungen. Für (x, y) 6= (0, 0) gelten
s
|y|
∂f
x2 |y|
∂f
y2
(x, y) = −xy
und
(x, y) =
+
3
3 .
∂x
∂y
x2 + y 2
(x2 + y 2 ) 2
(x2 + y 2 ) 2
Außerhalb des Nullpunktes sind die partiellen Ableitungen stetig und damit ist f dort differenzierbar. Insbesondere ist f außerhalb des Nullpunktes stetig.
Wir berechnen die partiellen Ableitungen in (0, 0). Es gilt f (x, 0) = 0 und f (0, y) = y. Also
folgt
∂f
∂f
(0, 0) = 0
(0, 0) = 1
∂x
∂y
Wir zeigen nun, dass f in (0, 0) nicht differenzierbar ist. Wir nehmen an, dass f in (0, 0) differenzierbar ist. Dann gilt
∂f
1
1
1
1
1
= ∇f (0, 0), ( √ , √ ) = (0, 1), ( √ , √ ) = √ .
1 √1
√
∂( 2 , 2 )
2
2
2
2
2
Andererseite lässt sich die Richtungsableitung direkt berechnen
∂f
1 √1
√
∂( 2 , 2 )
=
lim
t→0
f ( √t2 , √t2 ) − f (0, 0)
t
1
t
t
1 t
= lim f ( √ , √ ) = lim √
t→0 t
t→0
t 2
2
2
Dies ist ein Widerspruch.
s
t2
2
t2
2
+
t2
2
=
1
2
6.4. PARTIELLE ABLEITUNGEN HÖHERER ORDNUNG
339
f ist in (0, 0) stetig, weil
s
|f (0, 0) − f (x, y)| = |y|
x2
y2
≤ |y|.
+ y2
2
Beispiel 6.3.4 Es sei U eine offene Teilmenge des Rn und f : U → R in x0 differenzierbar. Wir
bezeichnen die n-dimensionale Hyperebene, die durch
x(n + 1) − f (x0 ) =
n
X
∂f
(x0 )(x(k) − x0 (k))
∂xk
k=1
gegeben ist, als die Tangentialhyperebene an den Graphen von f im Punkt (x0 , f (x0 )).
6.4
Partielle Ableitungen höherer Ordnung
Otto Hesse wurde am 22. April 1811 in Königsberg geboren und er starb am 4. August 1874 in
München. Er studierte in Königsberg. Er lehrte in Königsberg, Halle, Heidelberg und München.
Wissenschaftlich beschäftigte er sich mit der analytischen Geometrie und Determinanten.
Hermann Amandus Schwarz wurde am 25. Januar 1843 in Hermsdorf in Schlesien geboren und
erstarb am 30. November 1921 in Berlin. Schwarz arbeitete auf dem Gebiet der Funktionentheorie
und der Theorie der Minimalflächen.
Es sei U eine offene Teilmenge des Rn und f : U → R eine Funktion, deren
∂f
auf U existiert. Diese partielle Ableitung ist eine Funktion
partielle Ableitung ∂x
i
auf U. Falls die partielle Ableitung dieser Funktion in x0 nach der j-ten Koordinate
existiert, so bezeichnen wir diese mit
∂ 2f
(x0 )
∂xj ∂xi
Entsprechend definieren wir höhere Ableitungen. Falls die partielle Ableitung von
f nach xk1 , . . . , xk` auf U existiert und die partielle Ableitung dieser Funktion in x0
nach der Variablen xk`+1 existiert, dann bezeichnen wir diese mit
∂ `+1 f
(x0 )
∂xk`+1 , . . . , ∂xk1
Falls alle partiellen Ableitungen der Ordnung ` existieren und auf einer offenen
Menge U stetig sind, dann heißt f `-mal stetig differenzierbar. C ` (U)ist der Vektorraum aller `-mal stetig differenzierbaren Funktionen auf U.
Im Allgemeinen kommt es bei der Bildung höherer partieller Ableitungen darauf an, in welcher Reihenfolge man differenziert. In vielen Fällen besteht Unabhängigkeit von der Reihenfolge. Man bezeichnet die Matrix

 ∂2f
∂2f
∂2f
·
·
·
2
∂x1 ∂x2
∂x1 ∂xn
∂x
 ∂ 2 f1

∂2f
∂2f
 ∂x2 ∂x1

·
·
·
2
∂x2 ∂xn 
∂x2



..
..
..
.


.
.
∂2f
∂2f
∂2f
···
∂xn ∂x1
∂xn ∂x2
∂x2
n
340
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
als Hesse Matrix. Für die Hesse Matrix von f wird auch die Bezeichnung ∇2 f
benutzt.
Beispiel 6.4.1 Es sei f : R3 → R durch
f (x, y, z) = 3x2 y − z 3 + x2 − 3y 7 − x6 z 3
gegeben. Dann gilt
∂f
= 6xy + 2x − 6x5 z 3
∂x
und



∂2f
∂x2
∂2f
∂y∂x
∂2f
∂z∂x
∂2f
∂x∂y
∂2f
∂y 2
∂2f
∂z∂y
∂2f
∂x∂z
∂2f
∂y∂z
∂2f
∂z 2

∂f
= 3x2 − 21y 6
∂y

6y + 2 − 30x4 z 3
 
6x
=
−18x5 z 2
∂f
= −3z 2 − 3x6 z 2
∂z
6x
−126y 5
0

−18x5 z 2

0
6
−6z − 6x z
Satz 6.4.1 (Hermann Amandus Schwarz) Es sei U eine offene Teilmenge des Rn ,
w ∈ U und f : U → R besitze zweite partielle Ableitungen, die in w stetig sind.
Dann gilt für alle i, j = 1, . . . , n
∂ 2f
∂ 2f
(w) =
(w).
∂xi ∂xj
∂xj ∂xi
Beweis. Wir nehmen an, dass i < j. Wir zeigen, dass für alle hi und hj reelle
Zahlen Θi und Θj mit 0 < Θi , Θj < 1 und
f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn )
−f (w1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn )
(6.2)
−f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wn ) + f (w)
∂ 2f
= hi hj
(w1 , . . . , wi−1 , wi + Θi hi , wi+1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn )
∂xi ∂xj
existieren. Genauso zeigen wir, dass es Θ̃i und Θ̃j gibt, so dass
f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn )
−f (w1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn )
(6.3)
−f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wn ) + f (w)
∂ 2f
= hi hj
(w1 , . . . , wi−1 , wi + Θ̃i hi , wi+1 , . . . , wj−1 , wj + Θ̃j hj , wj+1 , . . . , wn ).
∂xj ∂xi
Aus (6.2) und (6.3) folgt, dass es für alle hi und hj reelle Zahlen Θi , Θj , Θ̃i , Θ̃j mit
0 < Θi , Θj , Θ̃i , Θ̃j < 1 und
∂ 2f
(w1 , . . . , wi−1 , wi + Θi hi , wi+1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn )
∂xi ∂xj
∂ 2f
=
(w1 , . . . , wi−1 , wi + Θ̃i hi , wi+1 , . . . , wj−1 , wj + Θ̃j hj , wj+1 , . . . , wn ).
∂xj ∂xi
6.4. PARTIELLE ABLEITUNGEN HÖHERER ORDNUNG
gibt. Wegen der Stetigkeit von
∂2f
∂xi ∂xj
und
∂2f
∂xj ∂xi
341
im Punkt w folgt
∂ 2f
∂ 2f
(w) =
(w).
∂xi ∂xj
∂xj ∂xi
Wir zeigen nun (6.2). Dazu wenden wir den Mittelwersatz (Satz 3.6.2) auf die
Funktion φ : [wj , wj + hj ] → R
φ(t) = f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , t, wj+1 , . . . , wn )
−f (w1 , . . . , wj−1 , t, wj+1 , . . . , wn )
an. Es gibt Θj mit 0 < Θj < 1, so dass
φ0 (wj + Θj hj ) =
φ(wj + hj ) − φ(wj )
.
hj
Dies bedeutet aber
f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn )
−f (w1 , . . . , wj−1 , wj + hj , wj+1 , . . . , wn )
−f (w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wn ) + f (w)
∂f
= hj
(w1 , . . . , wi−1 , wi + hi , wi+1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn )
∂xj
∂f
(w1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn ) .
−
∂xj
Wir wenden den Mittelwertsatz ein weiteres Mal an, dieses Mal auf die Funktion
ψ : [wi , wi + hi ] → R
ψ(t) =
∂f
(w1 , . . . , wi−1 , t, wi+1 , . . . , wj−1 , wj + Θj hj , wj+1 , . . . , wn ).
∂xj
Es gibt ein Θi mit 0 < Θi < 1 und
ψ 0 (wi + Θi hi ) =
ψ(wi + hi ) − ψ(wi )
hi
Wir erhalten (6.2). Die Gleichung (6.3) wird genauso bewiesen. 2
Beispiel 6.4.2 Es sei f : R2 → R

0
2
2
f (x, y) =
 xy x − y
2
x + y2
falls
x=y=0
sonst
f ist in (0, 0) differenzierbar, die partiellen Ableitungen zweiter Ordnung existieren für alle (x, y) ∈
R2 und sind unstetig in (0, 0) und
∂2f
∂2f
(0, 0) 6=
(0, 0).
∂x∂y
∂y∂x
342
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Beweis. Für (x, y) 6= (0, 0) existieren die partiellen Ableitungen und man erhält sie durch direktes
Differenzieren. Für x = 0 oder y = 0 gilt f (0, y) = f (x, 0) = 0. Wir erhalten


falls x = y = 0
0
∂f
4
2
2
4
(x, y) =
 y x + 4x y − y
∂x
sonst

(x2 + y 2 )2


falls x = y = 0
0
∂f
4
2
2
4
(x, y) =
 x x − 4x y − y
∂y
sonst

(x2 + y 2 )2
Für die zweiten partiellen Ableitungen erhalten wir


 −1
2
∂ f
= (x2 − y 2 )(x4 + 10x2 y 2 + y 4 )
∂x∂y 

(x2 + y 2 )3


1
2
∂ f
= (x2 − y 2 )(x4 + 10x2 y 2 + y 4 )
∂y∂x 

(x2 + y 2 )3
falls x = y = 0
sonst
falls x = y = 0
sonst
f ist in (0, 0) differenzierbar, weil die partiellen Ableitungen dort stetig sind.
Da
∂2f
∂2f
(0, 0) = 1 6= −1 =
(0, 0)
∂y∂x
∂x∂y
gilt, muss mindestens eine der zweiten partiellen Ableitungen unstetig sein. Wir rechnen dies
elementar nach.
Für alle n ∈ N gilt
∂2f 1 1
( , )=0
∂x∂y n n
∂2f 1
( , 0) = 1
∂x∂y n
2
Beispiel 6.4.3 Eine Funktion f : Rn → R ist konvex, wenn für alle x, y ∈ Rn und alle t ∈ [0, 1]
f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y)
gilt.
(i) eine differenzierbare Funktion f : Rn → R ist genau dann konvex, wenn für alle x, y ∈ Rn
f (x) + h∇f (x), y − xi ≤ f (y)
gilt.
(ii) Eine zweimal stetig differenzierbare Funktion f : Rn → R ist genau dann konvex, wenn die
Hesse Matrix in allen Punkten positiv semidefinit ist.
Beweis. (i) Da f konvex ist, gilt
f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y).
Es folgt
f (x) +
f (x + t(y − x)) − f (x)
≤ f (y)
t
und damit
f (x) + lim
t→0
f (x + t(y − x)) − f (x)
≤ f (y).
t
6.5. ABBILDUNGEN VOM RN IN DEN RM
343
Es gilt
lim
t→0
f (x + t(y − x)) − f (x)
= h∇f (x), y − xi
t
und somit
f (x) + h∇f (x), y − xi ≤ f (y).
(ii) f ist genau dann konvex, wenn für alle x0 ∈ Rn und alle ξ ∈ Rn mit kξk2 = 1 die Funktion
g : R → R mit
g(t) = f (x0 + tξ)
konvex ist. Da f zweimal stetig differenzierbar ist, so ist auch g zweimal stetig differenzierbar.
Nach (??) ist g genau dann konvex, wenn für alle t ∈ R gilt, dass g 00 (t) ≥ 0. Weiter gelten
g 0 (t) = h∇f (x0 + tξ), ξi =
und
g 00 (t) =
n
X
i,j=1
ξi ξj
n
X
ξj
j=1
∂f
(x0 + tξ)
∂xj
∂2f
(x0 + tξ) = ξ t ∇2 (x0 + tξ)ξ.
∂xi ∂xj
Also ist f genau dann konvex, wenn für alle x0 und alle ξ
0≤
n
X
i,j=1
ξi ξj
∂2f
(x0 ).
∂xi ∂xj
2
Bei dem eben bewiesenen Satz ist es wichtig, dass die Definitionsmenge der
Funktion eine offene Teilmenge des Rn ist. Dazu das folgende Beispiel.
Beispiel 6.4.4 [64] Es gibt eine Funktion f : Q2 → Q, die überall differenzierbar ist, die stetige,
partielle Ableitungen aller Ordnungen besitzt und die für alle (x, y) ∈ Q2 die Ungleichung
∂2f
∂2f
(x, y) 6=
(x, y)
∂x∂y
∂y∂x
erfüllt.
6.5
Abbildungen vom Rn in den Rm
Carl Gustav Jacob Jacobi wurde am 10. Dezember 1804 in Potsdam geboren. Er starb
am 18. Februar 1851 in Berlin an einer Pockeninfektion. Er stammte aus einer wohlhabenden
jüdischen Bankiersfamilie in Berlin. Er machte schon mit 13 Jahren das Abitur. Er studierte in
Berlin. Er unterrichtete in Königsberg. Er forschte über elliptische Funktionen, auf dem Gebiet
der Differentialgeometrie, der partiellen Differentialgleichungen und der mathematischen Physik.
Nach ihm benannt sind die Jacobi Matrix, die Jacobi Polynome und der Mondkrater Jacobi.
Es sei U eine offene Teilmenge des Rn und f : U → Rm . Die Koordinateabbildungen von f sind fi U → R, i = 1, . . . m, mit fi =< f, ei >. Wir schreiben auch
f = (f1 , . . . , fm ), wobei fi , i = 1, . . . , m, die Koordinatenabbildungen sind.
344
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Definition 6.5.1 Eine Funktion f : U → Rm heißt differenzierbar (oder auch total
differenzierbar) in x0 , falls es eine lineare Abbildung T : Rn → Rm gibt, so dass
(6.4)
lim
h→0
f (x0 + h) − f (x0 ) − T h
=0
khk
gilt. Die lineare Abbildung T heißt das Differential oder auch totales Differential
von f .
Dies lässt sich auch so formulieren: f heißt in x0 differenzierbar, wenn es eine
m × n-Matrix
C = (ci,j )m,n
i,j=1
und eine Funktion φ : V(x0 ) → Rm gibt, die in einer Umgebung V(x0 ) von x0
definiert ist, so dass für alle i = 1, . . . , m
φi (x0 ) = lim φi (x) = 0
x→x0
fi (x) = fi (x0 ) +
n
X
j=1
ci,j (xj − x0j ) + φi (x)kx − x0 k
gilt.
Insbesondere bedeutet diese Definition, dass jede Koordinatenfunktion fi , i =
1, . . . , m, in x0 differenzierbar ist. Also gilt für i = 1, . . . , m und j = 1, . . . , n
ci,j =
∂fi
(x0 ).
∂xj
Man sieht auch, dass f differenzierbar ist, falls alle Koordinatenabbildungen differenzierbar sind.
Falls alle partiellen Ableitungen in x0 existieren (f muss nicht differenzierbar
sein), so nennt man die m × n Matrix
m,n
∂(f1 , . . . , fm )
∂fi
df
=
(x0 )
J(x0 ) =
(x0 ) =
(x0 )
dx
∂xj
∂(x1 , . . . , xn )
i,j=1
die Jacobische Funktionalmatrix von f an der Stelle x0 . Ausgeschrieben ist sie
 ∂f1

∂f1
· · · ∂x
∂x1
n
 ..
.. 
 .
. 
∂fm
∂fm
· · · ∂xn
∂x1
Beispiel 6.5.1 (Polarkoordinaten) Es sei f : (0, ∞) × R → R2 durch
f (r, φ) = (r cos φ, r sin φ)
gegeben. f ist auf (0, ∞) × R differenzierbar und
! ∂f1
∂f1
df
cos φ
∂r
∂φ
=
=
∂f2
∂f2
sin φ
d(r, φ)
∂r
∂φ
−r sin φ
r cos φ
.
Um nachzuweisen, dass f differenzierbar ist, reicht es zu zeigen, dass f1 und f2 differenzierbar
sind. Nach Satz 6.3.4 reicht es zu zeigen, dass die partiellen Ableitungen stetig sind.
6.6. KETTENREGEL
6.6
345
Kettenregel
Satz 6.6.1 Es sei U eine offene Teilmenge des Rn , W sei eine offene Teilmenge
des Rm . Es seien f : U → Rm und g : W → R` Funktionen mit f (U) ⊆ W. Es
seien f in x0 ∈ U und g in f (x0 ) ∈ W differenzierbar. Dann ist auch g ◦ f in x0
differenzierbar und
dg
df
d(g ◦ f )
(x0 ) = (f (x0 )) (x0 )
dx
dy
dx
bzw.

 ∂(g◦f )1
)1
(x0 ) . . . ∂(g◦f
(x0 )
∂x1
∂xn


..
..


.
.
∂(g◦f )`
(x0 )
∂x1


=
∂g1
(f (x0 ))
∂y1
...
..
.
∂g`
(f (x0 )) . . .
∂y1
...
∂g1
(f (x0 ))
∂ym
∂(g◦f )`
(x0 )
∂xn


..

.
∂g`
(f (x0 ))
∂ym
∂f1
(x0 )
∂x1
...
..
.
∂fm
(x0 ) . . .
∂x1
∂f1
(x0 )
∂xn


..
.
.
∂fm
(x0 )
∂xn
Die Ableitung von g ◦ f ist das Matrizenprodukt der Ableitungen von g und f .
Beweis. Für alle i = 1, . . . , m gilt
fi (x) = fi (x0 )+ < ∇fi (x0 ), x − x0 > +φi (x)kx − x0 k2
n
X
∂fi (x0 )
= fi (x0 ) +
(xj − x0j ) + φi (x)kx − x0 k2
∂xj
j=1
mit
lim φi (x) = 0.
x→x0
Für alle k = 1, . . . , ` gilt
gk (y) = gk (f (x0 ))+ < ∇gk (f (x0 )), y − f (x0 ) > +ψk (y)ky − f (x0 )k2
m
X
∂gk (f (x0 ))
= gk (f (x0 )) +
(yi − fi (x0 )) + ψk (y)ky − f (x0 )k2
∂yi
i=1
mit
lim ψk (x) = 0.
x→x0
Hieraus folgt
gk (f (x)) = gk (f (x0 ))+ < ∇gk (f (x0 )), f (x) − f (x0 ) > +ψk (f (x))kf (x) − f (x0 )k2
m
X
∂gk
= gk (f (x0 )) +
(f (x0 ))(fi (x) − fi (x0 )) + ψk (f (x))kf (x) − f (x0 )k2
∂y
i
i=1
m
X
∂gk
= gk (f (x0 )) +
(f (x0 )) < ∇fi (x0 ), x − x0 > +φi (x)kx − x0 k2
∂y
i
i=1
+ψk (f (x))kf (x) − f (x0 )k2 .
346
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Es folgt weiter
!
n
m
X
X
∂fi
∂gk
(f (x0 ))
(x0 ) (xj − x0j )
(g ◦ f )k (x) = (g ◦ f )k (x0 ) +
∂yi
∂xj
j=1
i=1
!
m
X
kf (x) − f (x0 )k2
∂gk
(f (x0 ))φi (x) + ψk (f (x))
kx − x0 k2 .
+
∂y
kx
−
x
k
i
0
2
i=1
Hiermit folgt
(g ◦ f )(x) = (g ◦ f )(x0 ) +
m
X
∂gk
!`,n
∂fi
(f (x0 ))
(x0 )
∂yi
∂xj
m
X
∂gk
i=1
k,j=1
(x − x0 )
!`
kf (x) − f (x0 )k2
kx − x0 k2
∂yi
kx − x0 k2
i=1
k=1
`,m m,n
∂fi
∂gk
(f (x0 ))
(x0 )
(x − x0 )
= (g ◦ f )(x0 ) +
∂yi
∂xj
k,i=1
i,j=1
!`
m
X
∂gk
kf (x) − f (x0 )k2
+
(f (x0 ))φi (x) + ψk (f (x))
kx − x0 k2 .
∂yi
kx − x0 k2
i=1
+
(f (x0 ))φi (x) + ψk (f (x))
k=1
Wir müssen überprüfen, dass für alle k = 1, . . . , `
lim
x→x0
m
X
∂gk
i=1
kf (x) − f (x0 )k2
(f (x0 ))φi (x) + ψk (f (x))
∂yi
kx − x0 k2
!
=0
gilt. Dies gilt, weil
lim φ(x) = 0
und
x→x0
lim ψ(f (x)) = 0
x→x0
gelten und weil es eine Umgebung gibt, in der
kf (x) − f (x0 )k2
kx − x0 k2
beschränkt ist. Letzteres gilt, weil f in x0 differenzierbar ist. Wir zeigen dies.
n X
∂fi (x0 ) |fi (x) − fi (x0 )| ≤
∂xj |xj − x0j | + |φi (x)|kx − x0 k2
j=1
!1
n X
∂fi (x0 ) 2 2
kx − x0 k2 + |φi (x)|kx − x0 k2
≤
∂xj j=1
Hieraus folgt

kf (x) − f (x0 )k2 
≤
kx − x0 k2
i=1
2
2  21
2 ! 12
n
X ∂fi (x0 ) + |φi (x)|  .
∂xj j=1
m X
6.7. MITTELWERTSATZ
347
Beispiel 6.6.1 Es seien f : R2 → R2 und g : R2 → R durch
g(x, y) = x2 + y 2
f (r, φ) = (r cos φ, r sin φ)
gegeben. Dann gilt
g ◦ f (r, φ) = r2
und
∂(g ◦ f )
= 2r
∂r
∂(g ◦ f )
=0
∂φ
Beweis. Es gilt
g ◦ f (r, φ) = r2 cos2 φ + r2 sin2 φ = r2 .
Hieraus folgt sofort
∂(g ◦ f )
= 2r
∂r
∂(g ◦ f )
=0
∂φ
Wir wollen nun die Kettenregel benutzen, um dasselbe Ergebnis zu bekommen.
!
∂f1
∂f1
r cos φ −r sin φ
∂g
∂g
∂r
∂φ
2x 2y
=
∂f2
∂f2
∂x
∂y
r sin φ r cos φ
∂r
∂φ
r cos φ −r sin φ
2r cos φ 2r sin φ
=
= ( 2r
r sin φ r cos φ
6.7
0 )
Mittelwertsatz
Die abgeschlossene Verbindungsstrecke oder das abgeschlossene Intervall von zwei
Punkten x und y im Rn ist
[x, y] = {(1 − t)x + ty|t ∈ [0, 1]}.
Das offene Intervall ist
(x, y) = {(1 − t)x + ty|t ∈ (0, 1)}.
Satz 6.7.1 Es sei U eine offene Teilmenge des Rn und f : U → R sei auf U
differenzierbar. Es seien x, y ∈ U mit [x, y] ⊆ U. Dann gibt es ein ξ ∈ (x, y) mit
f (y) − f (x) =< ∇f (ξ), y − x > .
Der Satz folgt unmittelbar aus dem 1-dimensionalen Fall.
Beweis. Es sei F : [0, 1] → R durch
F (t) = f (x + t(y − x))
gegeben. Mit der Kettenregel (Satz 6.6.1) erhalten wir
F 0 (t) =< ∇f (x + t(y − x)), y − x > .
348
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Nach dem Mittelwertsatz für Funktionen einer reellen Variablen gibt es ein Θ ∈ (0, 1)
mit
F (1) − F (0) = F 0 (Θ) =< ∇f (x + Θ(y − x)), y − x > .
2
Eine Teilmenge M des Rn heißt konvex, falls für alle x, y ∈ M auch die Verbindungsstrecke
[x, y] in M enthalten ist. Für solche Mengen ist die Voraussetzung von Satz 6.7.1
immer erfüllt.
Für Funktionen f : Rn → Rm , wobei m ≥ 2 gilt, kann man den Satz nicht
formulieren. Dazu das folgende Beispiel.
Beispiel 6.7.1 Es sei f : R → R2 durch
f (x) = (x2 , x3 )
gegeben. Dann gibt es kein ξ ∈ [0, 1] mit
df
(ξ) = f (1) − f (0)
dx
df
Beweis. Wir nehmen an, dass es ein ξ ∈ [0, 1] mit dx
(ξ) = f (1) − f (0) gibt. Dann folgt
1
0
2ξ
−
=
1
0
3ξ 2
Hieraus folgt, dass 2ξ = 1 und 3ξ 2 = 1 gelten. Aus der ersten Gleichung folgt ξ = 21 . Dies in die
zweite Gleichung eingesetzt liefert 34 = 1, was falsch ist. 2
Satz 6.7.2 Es sei G ein Gebiet im Rn und f : G → R sei auf G differenzierbar. f
ist genau dann auf G konstant, wenn für alle x ∈ G
∇f (x) = 0
gilt.
Beweis. Falls f konstant ist, dann sind alle partiellen Ableitungen 0 und damit gilt
∇f = 0.
Es gelte nun ∇f = 0. Da G ein Gebiet ist, gibt es für alle x, y ∈ G einen
Polygonzug, der ganz in G liegt und der die beiden Punkte verbindet.
x1 = x
xm = y
m−1
[
i=1
[xi , xi+1 ] ⊆ G
Nach dem Mittelwertsatz gibt es für alle i = 1, 2, . . . , m − 1 ein ξi ∈ (xi , xi+1 ), so
dass
f (xi+1 ) − f (xi ) =< ∇f (ξi ), xi+1 − xi >= 0
Deshalb gilt für alle i = 1, . . . , m − 1
f (xi ) = f (xi+1 ).
6.8. DER SATZ VON TAYLOR
349
Insbesondere gilt f (x) = f (y). Also ist f konstant. 2
In Satz 6.7.2 wird vorausgesetzt, dass f auf einer zusammenhängenden Menge
definiert ist und dort differenzierbar ist. Dies ist wesentlich. Die Funktion f :
R2 \ {(x, y)|x = 0} → R
(
1
x>0
f (x, y) =
−1
x<0
ist differenzierbar und es gilt ∇f = 0, aber f ist nicht konstant.
6.8
Der Satz von Taylor
Für Funktionen f : I → R, die m + 1-mal stetig differenzierbar sind, hatten wir die
Formel von Taylor bewiesen:
f (x) =
m
X
f (k) (x0 )
k=0
k!
(x − x0 )k + Rm (x, x0 ),
wobei es ein Θ ∈ (0, 1) gibt, so dass
Rm (x, x0 ) =
1
(x − x0 )m+1 f (m+1) (x0 + Θ(x − x0 )).
(m + 1)!
Wir benutzen hier die Lagrange Form des Restglieds. Dieses Ergebnis soll nun auf
Funktionen f : Rn → R verallgemeinert werden. Ein Polynom von n Veränderlichen
x1 , . . . , xn ist eine Funktion p : Rn → R mit
p(x1 , . . . , xn ) =
N
X
k1 ,...,kn =1
ak1 ,...,kn xk11 xk22 · · · xknn
Der Grad des Polynoms p ist die größte Zahl k1 + k2 + · · · + kn mit ak1 ,...,kn 6= 0. Das
Polynom
5 + 2x + 6y + 2x2 y 2 + 7x3 y 4
hat die Koeffizienten
a0,0 = 5
a1,0 = 2
a0,1 = 6
a2,2 = 2
a3,4 = 7.
Alle anderen Koeffizienten sind 0.
Wir schreiben formal für h = (h1 , . . . , hn ) ∈ Rn und ∇ = ( ∂x∂ 1 , . . . , ∂x∂n )
< h, ∇ >=
n
X
i=1
hi
∂
∂xi
350
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
und
n
X
m
< h, ∇ > =
i=1
∂
hi
∂xi
!m
=
n
X
k1 ,...,km =1
hk1 · · · hkm
∂m
.
∂xk1 · · · ∂xkm
Wir fassen < h, ∇ >m als eine lineare Abbildung bzw. als Differentialoperator von
C m (U) nach C(U) auf.
!m
n
n
X
X
∂
∂ mf
m
< h, ∇ > f =
hi
f=
hk1 · · · hkm
∂xi
∂xk1 · · · ∂xkm
i=1
k ,...,k =1
1
m
Wir behandeln ∇ formal wie einen Vektor des Rn .
Satz 6.8.1 (Taylor) Es sei U eine offene Teilmenge des Rn und f : U → R sei
m + 1-mal stetig differenzierbar. Es seien x0 , x ∈ U, so dass [x0 , x] ⊂ U. Dann gibt
es ein Θ ∈ (0, 1) mit
m
X
1
f (x) = f (x0 ) +
(< x − x0 , ∇ >k f )(x0 )
k!
k=1
+
Der Summand
1
(< x − x0 , ∇ >m+1 f )(x0 + Θ(x − x0 )).
(m + 1)!
m
X
1
f (x0 ) +
(< x − x0 , ∇ >k f )(x0 )
k!
k=1
wird als Taylorpolynom m-ten Grades bezeichnet und
Rm (x, x0 ) =
1
(< x − x0 , ∇ >m+1 f )(x0 + Θ(x − x0 ))
(m + 1)!
als das Restglied.
Beweis. Es gibt ein > 0, so dass
(x0 − (x − x0 ), x0 + (1 + )(x − x0 )) ⊂ U.
Wir definieren φ : (−, 1 + ) → R durch
φ(t) = f (x0 + t(x − x0 )).
Da f m + 1-mal stetig differenzierbar ist, folgt mit der Kettenregel, dass auch φ
m + 1-mal stetig differenzierbar ist. Wir wenden nun den Taylorschen Satz für
Funktionen einer Variablen auf φ an. Es gibt also ein Θ ∈ (0, 1), so dass
φ(1) = φ(0) +
m
X
φ(k) (0)
k=1
k!
+
φ(m+1) (Θ)
.
(m + 1)!
6.8. DER SATZ VON TAYLOR
351
Es gelten φ(1) = f (x), φ(0) = f (x0 ) und mit der Kettenregel folgt
φ(k) (0) = (< x − x0 , ∇ >k f )(x0 ).
Wir weisen dies mit Induktion nach. Es folgt mit der Kettenregel
n
X
∂f
(x0 + t(x − x0 ))
φ (t) = h∇f (x0 + t(x − x0 )), x − x0 i =
(xj − x0j )
∂xj
j=1
0
Wir nehmen nun an, dass wir
(m)
φ
n
X
(t) =
(xk1 − x0k1 ) · · · (xkm − x0km )
k1 ,...,km =1
∂ mf
(x0 + t(x − x0 ))
∂xk1 · · · ∂xkm
nachgewiesen haben und schließen auf die Aussage m + 1. Dann gilt
φ(m+1) (t)
n
X
(xk1 − x0k1 ) · · · (xkm − x0km ) ∇
=
=
∂ mf
(x0 + t(x − x0 )), x − x0
∂xk1 · · · ∂xkm
k1 ,...,km =1
n
X
n
X
k1 ,...,km =1
km+1 =1
(xk1 − x0k1 ) · · · (xkm − x0km )
(xkm+1 − x0km+1 )
∂ mf
∂xkm+1 ∂xk1 · · · ∂xkm
∂
2
Falls f unendlich oft differenzierbar ist und
lim Rm (x, x0 ) = 0
m→∞
gilt, dann erhalten wir
∞
X
1
f (x) = f (x0 ) +
(< x − x0 , ∇ >k f )(x0 ).
k!
k=1
Beispiel 6.8.1 (i) Es sei U eine offene Teilmenge des R2 und (x0 , y0 ) ∈ U. Die Abbildung
f : U → R sei in (x0 , y0 ) unendlich oft differenzierbar und
lim Rm ((x, y), (x0 , y0 )) = 0.
m→∞
Dann gilt
∞
m X
1 X m ∂ m f (x0 , y0 )
f (x, y) =
(x − x0 )k (y − y0 )m−k .
k ∂y m−k
m!
k
∂x
m=0
k=0
(Man beachte, dass die Reihenfolge der Differentiation keine Rolle spielt.)
(ii) Für alle (x, y) ∈ R2 gilt
∞ X
m
X
1 m k m−k
x+y
e
=
x y
.
m! k
m=0
k=0
352
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Beweis. (ii) Wir wenden hier die Formel von (i) an.
∂ k+` ex+y
= ex+y
∂xk ∂y `
Man kann diese Formel auch folgendermaßen herleiten. Für alle t ∈ R gilt
et =
Mit t = x + y folgt
ex+y =
∞
X
tm
.
m!
m=0
m ∞
∞
X
X
(x + y)m
1 X m k m−k
=
x y
.
m!
m! m=0 k
m=0
m=0
2
Das Konvergenzgebiet von Taylorreihen im 1-Dimensionalen ist ein Intervall. Die
Konvergenzgebiete von Taylorreihen bzw. Potenzreihen mehrerer Veränderlichen
sehen komplizierter aus als im eindimensionalen Fall.
Beispiel 6.8.2 Die Potenzreihe
∞
X
xn y n
n=0
konvergiert absolut in der Menge {(x, y)||x · y| < 1}. Diese Menge ist log-konvex, d.h. die Menge
{(ln x, ln y)|x · y < 1} ist konvex.
Man kann allgemein zeigen, dass die Konvergenzmenge einer Potenzreihe mit Entwicklungspunkt
0 log-konvex ist. Im Komplexen hängt dies mit Reinhardt-Gebieten zusammen [55].
6.9
Bogenlänge
Definition 6.9.1 Es sei (X, d) ein metrischer Raum und Φ : [a, b] → X eine Funktion und P = {x0 , . . . , xN } bezeichne Partitionen von [a, b]. Die Länge des Graphens
von Φ wird durch
L(Graph(Φ)) = sup
P
N
X
d(Φ(xi ), Φ(xi−1 ))
i=1
definiert.
Satz 6.9.1 Es sei Φ : [a, b] → Rn eine stetig differenzierbare Funktion. Φ1 , . . . , Φn
sind die Koordinatenfunktionen von Φ. In den Punkten a und b existieren die einseitigen partiellen Ableitungen und sie seien stetig dort. Dann ist die Länge des
Graphens von Φ gleich
Z
L(Graph(Φ)) =
a
b
!1
n X
∂Φi 2 2
dt
∂t (t)
i=1
6.9. BOGENLÄNGE
353
Lemma 6.9.1 Es sei eine Kurve in Polarkoordinaten gegeben. Dann
s
2
Z
dr L() =
r2 + dθ
dθ
Beweis. Es gilt
x = r cos θ
y = r sin θ
Deshalb gilt
∂x
∂r
=
cos θ − r sin θ
∂θ
∂θ
∂y
∂r
=
sin θ + r cos θ
∂θ
∂θ
Somit
2 2
∂y ∂x ∂θ 2 ∂y ∂θ 2
∂x + = ∂t ∂θ ∂t + ∂θ ∂t ∂t 2 2 !2
2 ∂r
∂θ ∂r
= cos θ − r sin θ + sin θ + r cos θ
∂t
∂θ
∂θ
!
2 2
∂θ ∂r = + r2
∂t
∂θ
Z
L() =
s Z
∂x 2 ∂y 2
+ dt =
∂t ∂t s s 2
Z
∂θ ∂r ∂r 2
+ r2 dt dθ =
+ r2 dθ
∂t ∂θ ∂θ dθ
2
Beispiel 6.9.1 Der Umfang einer Ellipse E mit Achsenlängen a und b mit a ≥ b ist
Z 2π r
b2
L(∂E) = a
1 − (1 − 2 ) cos2 θdθ
a
0
Der Ausdruck wird als elliptische Integral bezeichnet.
Ein elliptische Integral ist ein Integral der Gestalt
Z
p
R(x, P (x))dx,
wobei R eine rationale Funktion von zwei Variablen ist und P ein Polynom dritten oder vierten
Grades ohne mehrfache Nullstellen ist.
Beweis. Wir benutzen die Parametrisierung
x(t)
= a cos θ
y(t)
= b sin θ
354
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Dann gilt
Z 2π p
|x0 |2 + |y 0 |2 dθ =
|a sin θ|2 + |b cos θ|2 dθ
0
0
Z 2π r
Z 2π r
b
b2
2
2
= a
| sin θ| + | cos θ| dθ = a
1 − (1 − 2 ) cos2 θdθ
a
a
0
0
Z
L(∂E)
=
2π
p
2
Beispiel 6.9.2 (Goldene Spirale) Es seien 0 < a, b. Sp : [0, 1] → R2 durch Sp(0) = 0 und
1
− bt
Sp1 (t) = ae cos
t
b
1
Sp2 (t) = ae− t sin
t
Sp ist eine stetig differenzierbare Funktion, deren partielle Ableitungen auch in den Punkten a und
b stetig sind. Die Kurvenlänge ist
p
a b2 + 1e−b .
Beweis. Es gelten für t mit 0 < t ≤ 1
∂ Sp1
(t)
∂t
∂ Sp2
(t)
∂t
=
=
ab − b
a −b
1
1
t
t
e cos
+ 2 e sin
t2
t
t
t
1
1
ab − b
a b
e t sin
− 2 e− t cos
t2
t
t
t
Weiter erhalten wir
∂ Sp1
(0)
∂t
∂ Sp2
(0)
∂t
b
=
=
ae− t cos
lim
t→0
t
− bt
ae sin
lim
t→0
t
1
t
=0
1
t
=0
Es folgt
∂ Sp1 2 ∂ Sp2 2
a2 −2 b 2
+
t
b +1
∂t ∂t = t4 e
Die partiellen Ableitungen von Sp sind auf [0, 1] stetig. Wir können also Satz ?? anwenden. Es
folgt
Z 1
p
1 −b
L(Graph(Sp)) = a b2 + 1
e t dt
2
0 t
Wir substituieren θ =
1
t
Z
p
2
L(Graph(Sp)) = a b + 1
∞
p
e−bθ dθ = a b2 + 1e−b
1
2
x = r cos θ = a(cos θ)ebθ
y = r sin θ = a sin θebθ
6.9. BOGENLÄNGE
355
Die Bogenlänge von 0 bis (x(θ), y(θ)) ist
a√
1 + b2 ebθ .
b
Die Krümmung im Punkt (x(θ), y(θ)) ist
e−bθ
√
a 1 + b2
Der Winkel zwischen der Tangente der Kurve im Punkt (x(θ), y(θ)) und der Geraden
durch 0 und (x(θ), y(θ)) ist θ.
Beispiel 6.9.3 Es seien 0 < α. sp : [0, 1] → R2 durch sp(0) = 0 und
1
sp1 (t) = tα cos
t
1
sp2 (t) = tα sin
t
Der Graph von sp ist genau dann rektifizierbar, wenn α > 2.
Beweis.
∂ sp1
∂t
∂ sp2
∂t
Es folgt
1
1
+ tα−2 sin
t
t
1
1
= αtα−1 sin
− tα−2 cos
t
t
= αtα−1 cos
∂ sp1 2 ∂ sp2 2
2α−4
+
(α2 t2 + 1)
∂t ∂t = t
Deshalb
1
Z
tα−2
L(Graph(sp)) =
p
α2 t2 + 1dt.
0
Es gilt für α > 1
Z
L(Graph(sp)) =
0
1
tα−2
Z
p
p
α2 t2 + 1dt ≤ α2 + 1
tα−2 dt =
p
α2 + 1
0
Für α = 1
1
Z
tα−2
L(Graph(sp)) =
Z
L(Graph(sp)) =
Z
p
α2 t2 + 1dt ≥
1
0
0
Für 0 < α < 1
2
1
1
tα−2
p
0
α2 t2 + 1dt ≥
Z
0
t−1 dt = ∞.
1
tα−2 dt = ∞.
Beispiel 6.9.4 Die Helix (Schraubenlinie) H : [0, T ] → R3 ist durch
H1 (t)
=
a cos t
H2 (t)
=
a sin t
H3 (t)
=
b·t
definiert. Ihre Länge ist
T·
p
a2 + b2
1
α−1
356
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Beweis.
L(Graph(H))
s
∂H1 2 ∂H2 2 ∂H3 2
∂t (t) + ∂t (t) + ∂t (t) dt
T
Z
=
0
T
Z
p
|a sin(t)|2 + |a cos(t)|2 + b2 dt
=
0
= T
p
a2 + b2
2
Beispiel 6.9.5 (Lemniskate von Jakob Bernoulli)
(x2 + y 2 )2 = 2a2 (x2 − y 2 )
r2 = 2a2 cos 2θ
Dann gilt
Z
L() =
√
2a2
dt =
4a4 − t4
1
Z
q
1−
Z
t4
4a4
dt = 2a
√
1
dt
1 − t4
Bei dem letzten Ausdruck handelt es sich um ein elliptisches Integral.
Beweis. Nach Lemma ?? gilt
Z
L() =
s
r2
2
dr + dθ
dθ
Wir wählen nun r als Integrationsvariable
s
s
−2
2
Z
Z
dθ dθ
dθ L() =
r2 + dr =
1 + r2 dr
dr
dr
dr
√
Wegen r = a 2 cos 2θ gilt
2a sin 2θ
dr
= −√
dθ
2 cos 2θ
und somit
√
dθ
2 cos 2θ
=−
.
dr
2a sin 2θ
Es folgt
2
dθ = cos 2θ .
dr 2a2 sin2 2θ
Wegen r2 = 2a2 cos 2θ
sin2 2θ = 1 − cos2 2θ =
4a4 − r4
4a4
Hiermit folgt
2
r2
dθ r2
2a2
= cos 2θ =
=
4
4
dr 4a4 − r4
2a2 sin2 2θ
2a2 4a4a−r
4
Es folgt weiter
Z
L() =
2
s
2
Z r
dθ r4
1 + r2 dr =
1+ 4
dr
dr
4a − r4
6.10. EXTREMWERTE
6.10
357
Extremwerte
Es sei M eine Teilmenge des Rn und f : M → R. Man sagt, dass f in einem
Punkt x0 ∈ M ein lokales oder relatives Minimum bzw. Maximum hat, falls es eine
Umgebung V(x0 ) gibt, so dass für alle x ∈ V(x0 ) ∩ M
f (x) ≥ f (x0 )
bzw.
f (x) ≤ f (x0 )
gilt. Es liegt ein striktes lokales oder relatives Minimum bzw. Maximum vor, falls
es eine Umgebung V(x0 ) gibt, so dass für alle x ∈ V(x0 ) ∩ M mit x 6= x0
f (x) > f (x0 )
bzw.
f (x) < f (x0 )
gilt. Wir sagen, dass ein lokales Extremum vorliegt, falls ein lokales Minimum oder
Maximum vorliegt.
f hat ein globales Minimum oder Maximum in x0 , falls für alle x ∈ M
f (x) ≥ f (x0 )
bzw.
f (x) ≤ f (x0 )
gilt.
Lemma 6.10.1 Es sei U eine offene Teilmenge des Rn und f : U → R nach allen
Variablen partiell differenzierbar. Falls f in x0 ein lokales Extremum hat, so gilt
∇f (x0 ) = 0.
Wir nennen Punkte x0 mit ∇f (x0 ) = 0 kritische Punkte .
Beweis. Wir betrachten f als Funktion ihrer i-ten Variablen, φ : (x0 (i) − δ, x0 (i) +
δ) → R
φ(t) = f (x0 (1), . . . , x0 (i − 1), t, x0 (i + 1), . . . , x0 (n))
Offensichtlich hat φ in t = x0 (i) ein lokales Extremum. Somit gilt
dφ
(x0 (i)) = 0
dt
Es folgt weiter
∂f
(x0 )
∂xi
=
dφ
(x0 (i))
dt
= 0. 2
Das folgende Beispiel zeigt, dass die Bedingung von Lemma 6.10.1 zwar notwendig,
aber nicht hinreichend ist.
Beispiel 6.10.1 Es sei f : R2 → R durch f (x, y) = x · y gegeben. Es ist (0, 0) ein kritischer Punkt
mit ∇f (0, 0) = 0, aber es liegt in (0, 0) kein lokales Extremum vor.
Auf Grund der Form des Graphen von f sprechen wir von einem Sattelpunkt. Siehe hierzu die
Graphik.
358
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
f (x, y) = xy
-2 -1
0
1
2
4
2
0
-2
-4
-2
-1
1
0
2
Beweis. Es gilt
∂f
=y
∂x
∂f
=x
∂y
Also gilt ∇f (0, 0) = 0.
Wenn wir f auf die Gerade x = y einschränken, dann erhalten wir f (x, x) = x2 . Im Punkt
x = 0 liegt ein Minimum vor. Andererseits können wir f auf die Gerade y = −x einschränken und
erhalten f (x, −x) = −x2 . Hier liegt in x = 0 ein Maximum vor. Somit kann in (0, 0) weder ein
Minimum noch ein Maximum vorliegen. 2
Es sei A = (ai,j )ni,j=1 eine reelle, symmetrische Matrix, d.h. At = A. Das
Polynom
n
X
t
QA (x) = x Ax =
ai,j xi xj
i,j=1
heißt die zu A gehörige quadratische Form. Die Matrix A bzw. die Funktion QA
heißt
(i) positiv semidefinit, wenn für alle x ∈ Rn gilt, dass QA (x) ≥ 0.
(ii) negativ semidefinit, wenn für alle x ∈ Rn gilt, dass QA (x) ≤ 0.
(iii) positiv definit, wenn für alle x ∈ Rn mit x 6= 0 gilt, dass QA (x) > 0.
(iv) negativ definit, wenn für alle x ∈ Rn mit x 6= 0 gilt, dass QA (x) < 0.
(v) indefinit, falls A weder positiv semidefinit, noch negativ semidefinit ist.
Lemma 6.10.2 Es sei A eine reelle, symmetrische Matrix. Dann gilt:
(i) A ist genau dann positiv (negativ) definit, wenn alle Eigenwerte von A strikt
positiv (strikt negativ) sind.
(ii) A ist genau dann positiv (negativ) semidefinit, wenn alle Eigenwerte von A
nichtnegativ (nichtpositiv) sind.
6.10. EXTREMWERTE
359
Beweis. (i) A besitze einen Eigenwert, der nicht positiv ist. Wir zeigen, dass A
nicht positiv definit ist. Es sei x ein Eigenvektor von A zum Eigenwert λ mit λ ≤ 0.
Dann folgt
n
X
t
t
QA (x) = x Ax = x λx = λ
x2i ≤ 0
i=1
Um die andere Beweisrichtung zu führen, benötigt man das folgende Ergebnis der
linearen Algebra: Falls A eine reelle, symmetrische Matrix ist, dann gibt es eine
Matrix U , so dass U t U = I und
U AU t = D
eine Diagonalmatrix ist. Die Diagonalelemente der Matrix D sind die Eigenwerte
der Matrix A. Also gilt di,i > 0, i = 1, . . . , n.
Somit gilt A = U t DU und
xt Ax = xt U t DU x = (U x)t D(U x)
Wir setzen y = U x und erhalten
t
t
x Ax = y Dy =
n
X
di,i yi2 > 0
i=1
Die letzte Ungleichung gilt, weil di,i > 0 und y 6= 0. 2
Um zu entscheiden, ob eine Matrix positiv definit ist, müsste man also die Eigenwerte berechnen. Dies kann sich jedoch schwierig gestalten. Es reicht aber zu zeigen,
dass die Eigenwerte sämtlich positiv sind. Dies ist im wesentlichen der Inhalt des
folgenden Satzes.
Satz 6.10.1 Es sei A eine reelle, symmetrische n × n Matrix.
(i) A ist genau dann positiv definit, wenn für alle k = 1, . . . , n


a1,1 . . . a1,k

..  > 0
det  ...
. 
ak,1 . . . ak,k
gilt.
(ii) A ist genau dann negativ definit, wenn für alle k = 1, . . . , n


a1,1 . . . a1,k

..  > 0
(−1)k det  ...
. 
ak,1 . . . ak,k
gilt.
360
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Beispiel 6.10.2 (i) Die Matrix

λ1
0
..


0



.
λn
ist genau dann positiv definit, falls für alle i = 1, . . . , n gilt, dass λi > 0.
(ii) Die Matrix
a b
b c
ist genau dann positiv definit, wenn a > 0 und ac − b2 > 0 gelten.
Satz 6.10.1 lässt sich nicht direkt auf die Begriffe positiv semidefinit und negativ
semidefinit übertragen. Dazu das folgende Beispiel. Es sei
0 0
A=
0 −1
Für die Hauptunterdeterminanten erhalten wir
det(0) = 0
und
det
0 0
0 −1
=0
aber A ist nicht positiv semidefinit.
Satz 6.10.2 Eine reelle, symmetrische n×n Matrix ist genau dann positiv semidefinit,
wenn alle Hauptunterdeterminanten von A nicht negativ sind, d.h. wenn für alle
k = 1, . . . , n und alle i1 , . . . , ik


ai1 ,i1 . . . ai1 ,ik

..  ≥ 0
det  ...
. 
aik ,i1 . . . aik ,ik
gilt.
Es sei U eine offene Teilmenge des Rn und f : U → R sei in x0 zweimal stetig
differenzierbar. Wir bezeichnen die Matrix
n
2
∂ f
(x0 )
∂xi ∂xj
i,j=1
als Hesse-Matrix.
Lemma 6.10.3 Es sei U eine offene Teilmenge des Rn und f : U → R sei zweimal
stetig differenzierbar in U. Es seien x0 ∈ U und > 0 mit B2n (x0 , ) ⊆ U . Dann gibt
es eine Funktion ρ : B2n (0, ) → R mit limy→0 ρ(y) = 0, so dass für alle h ∈ B2n (0, )
n
1 X ∂ 2 f (x0 )
hi hj + khk22 ρ(h)
f (x0 + h) = f (x0 )+ < ∇f (x0 ), h > +
2 i,j=1 ∂xi ∂xj
gilt.
6.10. EXTREMWERTE
361
Beweis. Nach dem Satz von Taylor (Satz 6.8.1) gibt es zu jedem h ∈ Rn ein
Θ(h) ∈ (0, 1), so dass
n
1 X ∂ 2 f (x0 + Θ(h)h)
hi hj .
f (x0 + h) = f (x0 )+ < ∇f (x0 ), h > +
2 i,j=1
∂xi ∂xj
Deshalb
f (x0 + h) = f (x0 )+ < ∇f (x0 ), h > +
mit
n
1 X ∂ 2 f (x0 )
hi hj + r(h)
2 i,j=1 ∂xi ∂xj
n 1 X ∂ 2 f (x0 + Θ(h)h) ∂ 2 f (x0 )
−
hi hj
r(h) =
2 i,j=1
∂xi ∂xj
∂xi ∂xj
Dann gilt
n 2
2
X
|r(h)|
1
∂ f (x0 + Θ(h)h) ∂ f (x0 )
hi hj = −
.
khk22
2 i,j=1
∂xi ∂xj
∂xi ∂xj khk2 khk2 Mit der Dreiecksungleichung und mit |hi | ≤ khk für i = 1, . . . , n folgt
n |r(h)|
1 X ∂ 2 f (x0 + Θ(h)h) ∂ 2 f (x0 ) ≤
.
−
khk22
2 i,j=1 ∂xi ∂xj
∂xi ∂xj Da die zweiten partiellen Ableitungen von f in x0 stetig sind, gilt für alle i, j =
1, . . . , n
2
∂ f (x0 + Θ(h)h) ∂ 2 f (x0 )
−
lim
=0
h→0
∂xi ∂xj
∂xi ∂xj
und damit
|r(h)|
= 0.
h→0 khk2
2
lim
Wir setzen für h 6= 0
ρ(h) =
und ρ(0) = 0. 2
|r(h)|
khk22
Lemma 6.10.4 Eine reelle, symmetrische n × n-Matrix A ist genau dann positiv
definit, wenn es ein c > 0 gibt, so dass für alle x ∈ Rn
(6.5)
ckxk22
≤
n
X
i,j=1
ai,j xi xj
362
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Beweis. Falls (6.5) gilt, dann gilt für alle x ∈ Rn mit x 6= 0
0 < ckxk22 ≤
n
X
ai,j xi xj = xt Ax.
i,j=1
Nun die Umkehrung. Es gelte für alle x ∈ Rn mit x 6= 0
(6.6)
n
X
0<
ai,j xi xj .
i,j=1
P
{x ∈ Rn |kxk2 = 1} ist eine kompakte Menge und die Abbildung, die x auf ni,j=1 ai,j xi xj
abbildet, ist stetig. Nach Satz ?? nimmt diese Abbildung auf der Menge {x ∈
Rn |kxk2 = 1} ihr Minimum an. Also existiert
c = min
kxk2 =1
n
X
ai,j xi xj .
i,j=1
Wegen (??) gilt c > 0. Deshalb gilt für alle y ∈ Rn mit y 6= 0
0 < c = min
n
X
kxk2 =1
i,j=1
ai,j xi xj ≤
und damit
0<
n
X
n
X
i,j=1
ai,j
zi zj
kzk2 kzk2
ai,j zi zj .
i,j=1
2
Satz 6.10.3 Es sei U eine offene Teilmenge des Rn und f : U → R sei zweimal
stetig differenzierbar in U mit ∇f (x0 ) = 0. Dann gelten:
(i) Ist die Hesse-Matrix
2
n
∂ f
(x0 )
∂xi ∂xj
i,j=1
positiv definit, so hat f in x0 ein lokales Minimum. Ist die Hesse-Matrix negativ
definit, so hat f in x0 ein lokales Maximum.
(ii) Hat f in x0 ein lokales Minimum, so ist die Hesse-Matrix
n
∂ 2f
(x0 )
∂xi ∂xj
i,j=1
positiv semidefinit. Hat f in x0 ein lokales Maximum, so ist die Hesse-Matrix negativ
semidefinit.
(iii) Ist die Hesse-Matrix indefinit, so hat f in x0 kein relatives Extremum.
6.10. EXTREMWERTE
363
Punkte, in denen die Hesse-Matrix indefinit ist, nennt man Sattelpunkte.
Beweis. (i) Nach Lemma 6.10.3 gilt
n
1 X ∂ 2 f (x0 )
hi hj + khk22 ρ(h)
f (x0 + h) = f (x0 )+ < ∇f (x0 ), h > +
2 i,j=1 ∂xi ∂xj
mit
lim ρ(h) = 0.
h→0
Wegen ∇f (x0 ) = 0 gilt
n
f (x0 + h) − f (x0 )
1 X ∂ 2 f (x0 ) hi hj
=
+ ρ(h).
khk22
2 i,j=1 ∂xi ∂xj khk2 khk2
Wegen Lemma 6.10.4 gibt es eine Konstante c > 0 mit
n
1 X ∂ 2 f (x0 ) hi hj
≥ c.
2 i,j=1 ∂xi ∂xj khk2 khk2
Da ρ in 0 stetig ist, gibt es ein δ > 0, so dass für alle h mit khk2 < δ die Ungleichung
|ρ(h)| < 2c gilt. Also gilt für alle h 6= 0 mit khk2 < δ
f (x0 + h) − f (x0 )
c
≥ >0
2
khk2
2
und damit
0 < f (x0 + h) − f (x0 ).
(ii) Es gibt ein δ > 0, so dass für alle x mit kx − x0 k2 < δ die Funktion f
differenzierbar ist. Deshalb gibt es für alle h mit khk2 < δ ein Θ ∈ (0, 1), so dass
1
f (x0 + h) − f (x0 ) = (< ∇, h > f )(x0 ) + (< ∇, h >2 f )(x0 + Θ(h)h)
2
n
n
X
X
1
∂ 2f
∂f
(x0 )hi +
(x0 + Θ(h)h)hi hj
=
∂xi
2 i,j=1 ∂xi ∂xj
i=1
Da ∇f (x0 ) = 0 gilt, folgt
f (x0 + h) − f (x0 ) =
n
1 X ∂ 2f
(x0 + Θ(h)h)hi hj
2 i,j=1 ∂xi ∂xj
Da f in x0 ein lokales Minimum hat, so gibt es ein > 0, so dass für alle h mit
khk < n
1 X ∂ 2f
0 ≤ f (x0 + h) − f (x0 ) =
(x0 + Θ(h)h)hi hj
2 i,j=1 ∂xi ∂xj
364
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Es folgt, dass für alle h mit khk < und alle t ∈ (0, 1)
n
1 X ∂ 2f
(x0 + Θ(th)th)thi thj
0≤
2 i,j=1 ∂xi ∂xj
gilt. Hieraus folgt, dass für alle h mit khk < und alle t ∈ (0, 1)
0≤
n
X
∂ 2f
(x0 + Θ(th)th)hi hj
∂x
∂x
i
j
i,j=1
gilt. Wegen der Stetigkeit von
∂ 2f
∂xi ∂xj
in x0 ergibt sich für t → 0, dass für alle h mit khk < 0≤
n
X
∂ 2f
(x0 )hi hj
∂x
∂x
i
j
i,j=1
gilt. Damit ist die Hesse Matrix positiv semidefinit.
(iii) Falls die Hesse Matrix weder positiv semidefinit, noch negativ semidefinit
ist, dann gibt es ξ, η ∈ Rn mit
n
X
∂ 2f
(x0 )ξi ξj > 0
∂x
∂x
i
j
i,j=1
n
X
∂ 2f
(x0 )ηi ηj < 0.
∂x
∂x
i
j
i,j=1
Es folgt für alle t ∈ (0, 1)
n
1 X ∂ 2 f (x0 ) ξi ξj
f (x0 + tξ) − f (x0 )
+ ρ(tξ).
=
ktξk22
2 i,j=1 ∂xi ∂xj kξk2 kξk2
Für hinreichend kleines t erhalten wir
f (x0 + tξ) − f (x0 ) > 0.
Ebeenso zeigen wir für hinreichend kleine s
f (x0 + sη) − f (x0 ) < 0.
2
Beispiel 6.10.3 (i) Es sei f : R2 → R durch f (x, y) = x2 + y 2 gegeben. f hat in (0, 0) ein lokales,
striktes Minimum.
(ii) Es sei f : R2 → R durch f (x, y) = xy gegeben. f hat in (0, 0) einen Sattelpunkt.
(iii) Es sei f : R → R durch f (x) = x3 gegeben. Satz 6.10.3 reicht nicht aus, um zu entscheiden,
ob ein Minimum oder Maximum in 0 vorliegt. (Tatsächlich liegt keines von beiden vor.)
6.10. EXTREMWERTE
365
Beweis. (i) Es gilt
∂f
= 2y
∂y
∂f
= 2x
∂x
Also ist (0, 0) der einzige kritische Punkt. Die Hesse-Matrix im Punkt (0, 0) ist
! ∂2f
∂2f
2 0
2
∂x
∂x∂y
=
∂2f
∂2f
0 2
2
∂y∂x
∂y
Die Eigenwerte der Matrix sind alle strikt positiv, also ist sie positiv definit.
(ii) Es gilt
∂f
∂f
=y
=x
∂x
∂y
Also ist (0, 0) der einzige kritische Punkt. Die Hesse-Matrix in (0, 0) ist
0 1
1 0
Die Eigenwerte sind 1 und −1. Also ist die Matrix indefinit. Es liegt ein Sattelpunkt vor.
(iii) In 0 liegt der einzige kritische Punkt vor und die Hesse-Matrix ist dort 0. 2
Beispiel 6.10.4 Es sei f : R2 → R mit
f (x, y) = (2x2 + 3y 2 )e−x
2
−y 2
.
Dann sind (0, 0), (0, 1), (0, −1), (1, 0), (−1, 0) die kritischen Punkte. In (0, 0) liegt ein relatives
Minimum vor, in (0, 1) und (0, −1) liegen relative Maxima vor und in (1, 0) und (−1, 0) liegen
Sattelpunkte vor.
Beweis. Die ersten partiellen Ableitungen sind
2
2
∂f
= (4x − 4x3 − 6xy 2 )e−x −y
∂x
2
2
∂f
= (6y − 6y 3 − 4x2 y)e−x −y .
∂y
Die kritischen Punkte erfüllen
0 = 2x(2 − 2x2 − 3y 2 )
und
0 = 2y(3 − 2x2 − 3y 2 ).
366
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Also gelten
x=0
oder
2x2 + 3y 2 = 2
y=0
oder
2x2 + 3y 2 = 3.
und
Hieraus ergeben sich vier Fälle
2x2 + 3y 2 = 2
y=0
x=0
y=0
x=0
2x + 3y 2 = 3
2
2x2 + 3y 2 = 2
2x2 + 3y 2 = 3
Somit sind (0, 0), (±1, 0) und (0, ±1) die kritischen Punkte.
∂2f
∂x2
∂2f
∂y 2
2
−y 2
=
(4 − 12x2 − 6y 2 )e−x
=
(4 − 20x2 − 6y 2 + 8x4 + 12x2 y 2 )e−x
=
(6 − 18y 2 − 4x2 )e−x
=
(6 − 30y 2 − 4x2 + 12y 4 + 8x2 y 2 )e−x
2
−y 2
+ (4x − 4x3 − 6xy 2 )(−2x)e−x
2
−y 2
−y 2
+ (6y − 6y 3 − 4x2 y)(−2y)e−x
2
2
2
−y 2
−y 2
2
2
2
2
2
2
∂2f
= −12xye−x −y + (4x − 4x3 − 6xy 2 )(−2y)e−x −y = (−20xy + 8x3 y + 12xy 3 )e−x −y
∂x∂y
Die Hesse Matrizen in (0, 0), (±1, 0), (0, ±1) sind
8
4 0
−e 0
2
0 6
0
e
2
− 2e
0
0
− 12
e
Beispiel 6.10.5 Es sei f : R2 → R durch f (x, y) = (y − x2 )(y − 3x2 ) gegeben. Diese Funktion
hat in (0, 0) kein relatives Extremum, aber f eingeschränkt auf jede Gerade durch (0, 0) besitzt in
(0, 0) ein striktes relatives Minimum.
6.10. EXTREMWERTE
367
Beweis. Die ersten partiellen Ableitungen sind
∂f
= −2x(y − 3x2 ) − 6x(y − x2 ) = −8xy + 12x3
∂x
∂f
= (y − 3x2 ) + (y − x2 ) = 2y − 4x2 .
∂y
Die kritischen Punkte erfüllen
12x3 = 8xy
4x2 = 2y.
und
Hieraus folgt
12x3 = 16x3
und damit x = 0. Also gilt auch y = 0. Der einzige kritische Punkt ist (0, 0). Die zweiten,
partiellen Ableitungen sind
∂2f
=2
∂y 2
∂2f
= −8y + 36x2
∂x2
∂2f
= −8x.
∂x∂y
Die Hesse Matrix in (0, 0) ist
0
0
0
2
.
Diese Matrix besitzt einen strikt positiven Eigenwert. Das bedeutet, dass in (0, 0) kein relatives
Maximum vorliegen kann. Wir können nicht schließen, ob in (0, 0) ein lokales Minimum vorliegt
oder nicht. Um einzusehen, dass in (0, 0) kein lokales Extremum vorliegt, betrachten wir die Gerade
{(0, y)|y ∈ R} und die Kurve {(x, 2x2 )|}. Es gelten f (0, y) = y 2 und f (x, 2x2 ) = −x4 . Deshalb
nimmt f in jeder Umgebung von (0, 0) sowohl strikt positive, als auch strikt negative Werte an.
Deshalb liegt in (0, 0) kein relatives Extremum vor.
Wir schränken nun f auf die Gerade y = ax ein.
φa (x) = f (x, ax) = (ax − x2 )(ax − 3x2 ) = a2 x2 − 4ax3 + 3x4
φ0a (x) = 2a2 x − 12ax2 + 12x3
0 und
a
2
±
a
√
2 3
sind kritische Punkte.
φ00a (x) = 2a2 − 24ax + 36x2
Somit liegt in 0 ein striktes relatives Minimum vor.
Wir wollen noch untersuchen, wie der Graph von f aussieht. In dem Punkt
a
ein relatives Minimum vor. 2
relatives Maximum von φa und in a2 + 2√
3
a
2
−
a
√
2 3
liegt ein
Beispiel 6.10.6 (Beste Approximation im quadratischen Mittel) Es sei f ∈ C[0, 1]. Es gibt genau
ein Polynom
n
X
pn (x) =
ak xk
k=0
n-ten Grades, so dass
Z
0
minmal ist.
Es sei
Z
bk =
0
1
|f (x) − pn (x)|2 dx
1
f (x)xk dx
k = 0, 1, . . . , n
368
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Dann lassen sich die Koeffizienten des Polynoms durch

 
a0
n
1
 ..  
 . =
i + j + 1 i,j=0
an

b0
.. 
. 
bn
berechnen.
Die minimierenden Polynome sind nicht mit den Taylorpolynomen identisch.
Beweis. Wir setzen
2
n
X
ak xk dx
f (x) −
0
k=0
Z 1
Z
n
X
|f (x)|2 dx − 2
ak
Z
F (a0 , . . . , an )
=
=
0
1
k=0
1
f (x)xk dx +
0
n
X
ai aj
.
i+j+1
i,j=0
F ist ein Polynom 2. Grades. Wir wollen den Punkt bestimmen, an dem das absolute Minimum
angenommen wird. Zunächst wissen wir noch nicht, dass das Minimum überhaupt angenommen
wird, wir wissen auch noch nicht, dass dieser Punkt eindeutig ist.
Wir untersuchen die kritischen Punkte.
Z 1
n
X
∂F
ai
= −2
f (x)xj dx + 2
∂aj
i
+
j+1
0
i=0
Damit erfüllen die kritischen Punkte a die Gleichungen
Z 1
n
X
ai
=
f (x)xj dx
i
+
j
+
1
0
i=0
j = 0, 1, . . . , n
Wir zeigen nun, dass es genau eine Lösung diese Gleichungssystems gibt. Dazu zeigen wir, dass
die Matrix
n
1
i + j + 1 i,j=0
invertierbar ist. Wir zeigen, dass alle Eigenwerte der Matrix
n
1
i + j + 1 i,j=0
strikt positiv sind. Um dies zu zeigen, benutzen wir Satz und weisen nach, dass für alle k = 0, . . . , n
k
1
0 < det
i + j + 1 i,j=0
gilt. Hierzu benutzen wir die folgende Formel. Für alle Zahlen a0 , . . . , an und b0 , . . . , bn mit
ai + bj 6= 0, i, j = 0, . . . , n gilt
Q
n
0 ≤ i, j ≤ n (ai − aj )(bi − bj )
1
j <i
Qn
det
=
ai + bj i,j=0
i,j=0 (ai + bj )
Mit ai = i + 1 und bj erhalten wir für alle k = 1, . . . , n
Q
2
k
0 ≤ i, j ≤ k (i − j)
1
j <i
det
= Qk
>0
i + j + 1 i,j=0
i,j=0 (i + j + 1)
6.10. EXTREMWERTE
369
Damit gibt es genau einen kritischen Punkt, der die behauptete Gleichung erfüllt. Die Hesse Matrix
von F an dieser Stelle ist
n
1
.
i + j + 1 i,j=0
Wie wir eben festgestellt haben besitzt sie nur positive Eigenwerte und damit liegt ein striktes,
lokales Minimum vor.
Nun zeigen wir, dass das lokale Minimum auch ein globales ist. Dazu müssen wir zeigen, dass
ein globales Minimum existiert. Da ein globales Minimum insbesondere ein lokales ist und es nur
ein lokales Minimum gibt, muss das lokale Minimum das globale sein.
Wir überlegen uns, dass es ein r gibt, so dass für alle a ∈ Rn mit kak ≥ r
F (0) ≤ F (a)
gilt. Wir bezeichnen
Q(a) =
n
X
ai aj
i
+
j+1
i,j=0
und
L(a) = 2
n
X
Z
1
f (x)xj dx.
aj
j=0
0
Mit der Ungleichung von Cauchy Schwarz folgt

n Z
X
|L(a)| ≤ 2kak 
1
2 2
f (x)xj dx  .
1
0
j=0
Weiter gilt, dass
inf Q(b) = min Q(b) > 0.
kbk=1
kbk=1
Das Infimum wird angenommen, weil Q eine stetige Funktion ist und die Menge {b| kbk = 1}
kompakt ist. Das Minimum ist strikt größer als 0, weil Q positiv definit ist. Wir wählen
2
R
2 12
1
j
j=0 0 f (x)x dx
Pn
r=
minkbk=1 Q(b)
.
Hiermit gilt
F (a)
=
≥
Q(a) − L(a) +
kak2 Q
a
kak
Z
0
1
|f (x)|2 dx

n Z
X

− 2kak
j=0
1
2 2 Z
f (x)xj dx  +
1
0
0

≥

n Z
X

kak kak min Q(b) − 2 
kbk=1
j=0
Für a mit kak ≥ r folgt
F (a) ≥
Z
0
0
1
1
|f (x)|2 dx
1 
2 2
Z

f (x)xj dx   +
0
1
|f (x)|2 dx.
1
|f (x)|2 dx = F (0).
Also wird das Minimum von f in der Menge {a| kak ≤ r} angenommen. Also muss es sich um das
lokale Minimum handeln.
Tatsächlich hätten wir nicht nachweisen brauchen, dass die Hesse Matrix positiv definit ist.
Es reicht zu zeigen, dass ein globales Minimum existiert und dass es einen eindeutigen kritischen
Punkt gibt.
370
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Unter allen quadratischen Polynomen liefert
p2 (x) = (39e − 105) + (588 − 216e)x + (210e − 570)x2
das Minimum für
Z
0
1
|ex − (a0 + a1 x + a2 x2 )|2 dx.
Das Polynom ist nicht mit dem Taylorpolynom von ex identisch.
Bei der Berechnung des Polynoms verfahren wir wie folgt. Es gelten
Z 1
Z 1
Z 1
x
x
e dx = e − 1
xe dx = 1
x2 ex dx = e − 2.
0
0
Das Gleichungssystem

1

1
2
1
3
1
2
1
3
1
4
1
3
1
4
1
5
0

 

a0
e−1
  a1  =  1 
a2
e−2
hat die eindeutige Lösung
(a0 , a1 , a2 ) = (39e − 105, 588 − 216e, 210e − 570).
2
Beispiel 6.10.7 Eine rechteckige Schachtel ohne Deckel werde aus 12 m2 Karton hergestellt. Man
finde die Schachtel mit maximalem Volumen.
Die Länge, Breite und Höhe der Schachtel sei mit x, y, z bezeichnet. Dann ist das Volumen
gleich
V = xyz.
Für die Fläche erhalten wir
F = 2xz + 2yz + xy = 12.
Wir lösen diese Gleichung nach z auf
z=
Hiermit
V = xy
12 − xy
.
2(x + y)
12xy − x2 y 2
12 − xy
=
.
2(x + y)
2(x + y)
Wir fassen V als Funktion von {(x, y)|x > 0 und y > 0} nach R auf.
∂V
y 2 (12 − 2xy − x2 )
=
∂x
2(x + y)2
∂V
x2 (12 − 2xy − y 2 )
=
∂y
2(x + y)2
Für die kritischen Punkte gilt
x 6= 0
y 6= 0
weil anderenfalls V = 0. Deshalb gilt
12 − 2xy − x2 = 0
12 − 2xy − y 2 = 0
Hieraus folgt
x2 = y 2 .
Da x > 0 und y > 0, so gilt x = y. Es folgt
0 = 12 − 2xy − x2 = 12 − 3x2
6.11. UMKEHRABBILDUNGEN
371
und damit
x = 2.
Damit gilt auch y = 2. Für z erhalten wir
z=
12 − xy
12 − 4
=
= 1.
2(x + y)
8
Wir prüfen nach, dass es sich um ein lokales Maximum handelt.
∂2V
∂x2
=
=
∂ y 2 (12 − 2xy − x2 )
∂x
2(x + y)2
1 (−2y 3 − 2xy 2 )(x + y)2 − 2(x + y)y 2 (12 − 2xy − x2 )
2
(x + y)4
Für x = y = 2 erhalten wir
∂2V
∂2V
(2,
2)
=
(2, 2) = −1.
∂x2
∂y 2
Die gemischten, partiellen Ableitungen sind
∂2V
∂y∂x
=
=
∂ y 2 (12 − 2xy − x2 )
∂y
2(x + y)2
1 (24y − 6xy 2 − 2x2 y)(x + y)2 − 2(x + y)y 2 (12 − 2xy − x2 )
.
2
(x + y)4
Für x = y = 2 erhalten wir
∂2V
∂2V
1
(2, 2) =
(2, 2) = − .
∂y∂x
∂x∂y
2
Für die Hesse Matrix an der Stelle (2, 2) erhalten wir
! ∂2V
∂2V
−1
∂x2
∂y∂x
=
1
∂2V
∂2V
−
2
2
∂x∂y
∂y
− 21
−1
.
Die Eigenwerte der Matrix sind − 12 und − 32 . Damit haben wir nachgewiesen, dass ein lokales
Maximum in x = y = 2 vorliegt. Es bleibt noch zu zeigen, dass dies ein globales ist.
6.11
Umkehrabbildungen
Falls f : Rn → Rn eine lineare Abbildung ist, also f (x) = Ax, wobei A eine n × nMatrix ist, so ist f genau dann invertierbar, wenn die Determinante von
df
=A
dx
von 0 verschieden ist. Der allgemeine Fall folgt wieder mittels Approximation der
fi , i = 1, . . . , n durch Taylorpolynome 1. Grades
fi (x0 + h) ∼ fi (x0 ) +
n
X
∂fi
(x0 )hk .
∂x
k
k=1
372
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Definition 6.11.1 Es seien (X, dX ) und (Y, dY ) metrische Räume und f : X → Y
eine Abbildung. f heißt offen, falls das Bild einer offenen Menge wieder offen ist.
Falls f invertierbar und offen ist, dann ist f −1 stetig.
Lemma 6.11.1 Es sei U eine offene Teilmenge vom Rn , w ∈ U und f : U → Rn
stetig differenzierbar mit
df
(w)
dx
(6.7)
invertierbar. Dann gibt es eine Umgebung von w, auf der f injektiv ist.
Beweis. Wir zeigen, dass es ein > 0 gibt, so dass für alle ξ1 , . . . , ξn ∈ B2n (w, )
n !
∂fi
(ξi )
6= 0
(6.8)
det
∂xj
i,j=1
gilt. Damit sind die Matrizen invertierbar. (Wir brauchen hier tatsächlich, dass wir
jedes i einen anderen Vektor einsetzen können.) Dazu betrachten wir die Abbildung
F : Rn×n → R mit
n !
∂fi
.
(ξi )
(6.9)
F (ξ1 , . . . , ξn ) = det
∂xj
i,j=1
Wir statten den Rn×n mit der Norm
k(ξ1 , . . . , ξn )k = max kξi k2
1≤i≤n
aus. Diese Abbildung erfüllt
F (w, . . . , w) 6= 0
und sie ist stetig. Sie ist stetig, weil die partiellen Ableitungen stetig sind und weil
det stetig ist (det ist ein Polynom). Da F stetig ist, gibt es ein > 0, so dass für
alle (ξ1 , . . . , ξn ) ∈ B n×n ((w, . . . , w), )
F (ξ1 , . . . , ξn ) 6= 0
gilt. Damit haben wir (6.9) nachgewiesen.
Es seien nun y, z ∈ B2n (w, ). Nach dem Mittelwertsatz gibt es für alle i =
1, . . . , n ein Θi mit 0 < Θi < 1 und
fi (y) − fi (z) =
n
X
∂fi
(z + Θi (y − z))(yj − zj ).
∂x
j
j=1
Es folgt
f (y) − f (z) =
n
∂fi
(z + Θi (y − z))
(y − z).
∂xj
i,j=1
Da die Matrix nach (6.8) invertierbar ist, folgt f (y) 6= f (z), falls y 6= z. 2
6.11. UMKEHRABBILDUNGEN
373
Lemma 6.11.2 Es sei U eine offene Teilmange des Rn und f : U → Rn sei stetig
differenzierbar in U. Es sei w ∈ U und die Funktionalmatrix von f in w sei invertierbar. Dann gibt es eine Umgebung W von f (w) mit W ⊆ f (U).
Beweis. Nach Lemma 6.11.1 gibt es ein > 0, so dass f auf B2n (w, ) injektiv ist.
df
(x)) 6= 0 auf B2n (w, ) gilt. Dies gilt,
Außerdem können wir annehmen, dass det( dx
df
weil f stetig differenzierbar auf U ist und det( dx
(w)) 6= 0.
n
Wir betrachten g : B2 (w, ) → R mit
g(x) = kf (x) − f (w)k2 .
Es gibt ein η > 0, so dass für alle x mit kx − wk = η ≤ g(x)
gilt. Wir zeigen dies. Da g auf B2n (w, ) injektiv ist, gilt für alle x mit kx − wk2 = g(x) > 0. Anderenfalls würde f (x) = f (w) gelten und f wäre nicht injektiv. Da g
stetig ist und B2n (w, ) kompakt, nimmt g auf {x|kx − wk2 = } ihr Minimum an.
Diese Minimum ist strikt größer als 0.
Wir zeigen nun, dass für alle y mit ky − f (w)k2 < η2 ein x mit kx − wk2 < und
f (x) = y existiert, also
B2n (f (w), η2 ) ⊆ f (B2n (w, )).
Dazu betrachten wir die Funktion h : B2n (w, ) → R mit
h(x) = kf (x) − yk22 .
Diese Funktion nimmt ihr Minimum in einem inneren Punkt von B2n (w, ) an. Wir
zeigen dies. Da h stetig ist und B2n (w, ) kompakt, nimmt h ihr Minimum auf
B2n (w, ) an. Wir zeigen, dass das Minimum nicht auf der Menge {x|kx − wk2 = }
angenommen wird. In der Tat, für alle x mit kx − wk2 = gilt
η ≤ kf (x) − f (w)k2 = kf (x) − y + y − f (w)k2 ≤ kf (x) − yk2 + ky − f (w)k2 .
Wegen ky − f (w)k2 ≤
η
2
folgt für alle x mit kx − wk2 = η
≤ kf (x) − yk2 .
2
Wir nehmen nun an, dass es ein z mit kz − wk2 = und
h(z) = kf (z) − yk22 =
min
kx−wk2 ≤
kf (x) − yk22
gibt. Dann gilt
kf (z) − yk2 =
min
kx−wk2 ≤
kf (x) − yk2
und damit
η
η
≤ kf (z) − yk2 ≤ min kf (x) − yk2 ≤ kf (w) − yk2 < .
kx−wk2 ≤
2
2
374
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Dies ist ein Widerspruch. Also wird das Minimum in einem inneren Punkt z der
Menge B2n (w, ) angenommen. Somit gilt ∇h(z) = 0. Es folgt
!n
n
X
∂fi (z)
0 = ∇h(z) = 2
(fi (z) − y)
∂xj
i=1
j=1
bzw.
0=
∂fi
∂xj
n
i,j=1
(f (z) − y).
Da die Matrix auf B2n (w, ) invertierbar ist, folgt f (z) = y. 2
Satz 6.11.1 Es sei U eine offene Teilmenge des Rn und f : U → Rn sei auf U
stetig differenzierbar. Es seien x0 ∈ U und
df
det
(x0 ) 6= 0.
dx
Dann gibt es offene Umgebungen V(x0 ) von x0 und W(f (x0 )) von f (x0 ), so dass
V(x0 ) bijektiv auf W(f (x0 )) abgebildet wird, d.h. es gibt auf W(f (x0 )) eine Umkehrabbildung f −1 .
Die Umgebungen V(x0 ) und W(f (x0 )) können so gewählt werden, dass f −1 auf
W(f (x0 )) stetig differenzierbar ist und für alle x ∈ V(x0 )
(6.10)
df −1
(f (x)) =
dy
df
(x)
dx
−1
gilt.
Wenn man bereits weiß, dass f −1 existiert und differenzierbar ist, dann folgt die
Gleichung (6.10) aus der Kettenregel. In der Tat, aus
f −1 (f (x)) = x
folgt
d −1
f (f (x)) = In .
dx
Mit der Kettenregel folgt
df −1
df
(f (x)) (x) = In .
dy
dx
Also gilt
df −1
(f (x)) =
dy
df
(x)
dx
−1
.
Beweis. Wir weisen zuerst die Existenz der offenen Umgebungen V(x0 ) und W(f (x0 ))
von x0 und f (x0 ) nach. Wegen Lemma 6.11.1 gibt es eine offene Umgebung V1 (x0 )
6.11. UMKEHRABBILDUNGEN
375
(x)
auf
von x0 , auf der f injektiv ist. Wir können außerdem sicher stellen, dass dfdx
V1 (x0 ) invertierbar ist. Nun betrachten wir die Menge f (V1 (x0 )). Wegen Lemma
6.11.2 ist diese Menge offen. Mit demselben Argument schließen wir, dass die Abbildung f auf V1 (x0 ) eine offene Abbildung ist. Somit ist f −1 stetig.
Da f differenzierbar ist, gilt
f (x) = f (x0 ) +
df (x0 )
(x − x0 ) + φ(x)kx − x0 k2
dx
mit
lim φ(x) = 0.
x→x0
Wegen x = f −1 (y) und x0 = f −1 (y0 )
y − y0 =
df (x0 ) −1
(f (y) − f −1 (y0 )) + φ(f −1 (y))kf −1 (y) − f −1 (y0 )k2 .
dx
Es folgt
−1
−1
df (x0 )
df (x0 )
−1
−1
(y−y0 ) = f (y)−f (y0 )+
(φ(f −1 (y)))kf −1 (y)−f −1 (y0 )k2 .
dx
dx
Also
f
−1
−1
df (x0 )
(y − y0 )
(y) = f (y0 ) +
dx
!
−1
kf −1 (y) − f −1 (y0 )k2
df (x0 )
−1
+
ky − y0 k2 .
(φ(f (y)))
dx
ky − y0 k2
−1
Es bleibt zu zeigen
lim
y→y0
df (x0 )
dx
−1
kf −1 (y) − f −1 (y0 )k2
(φ(f −1 (y)))
ky − y0 k2
!
= 0.
Da f −1 stetig ist, gilt
lim f −1 (y) = f −1 (y0 ).
y→y0
Also
lim φ(f −1 (y)) = φ(f −1 (y0 )) = φ(x0 ) = 0.
y→y0
Es bleibt zu zeigen, dass
für y → y0 beschränkt bleibt.
(6.11)
kf −1 (y) − f −1 (y0 )k2
ky − y0 k2
kx − x0 k2
kf −1 (y) − f −1 (y0 )k2
=
=
ky − y0 k2
kf (x) − f (x0 )k2
1
kf (x)−f (x0 )k2
kx−x0 k2
376
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Es gilt
df (x0 )
kf (x) − f (x0 )k2 ≥ dx (x − x0 ) − kφ(x)k2 kx − x0 k2
2
und damit
df (x0 )
kf (x) − f (x0 )k2
x − x0
− kφ(x)k2
≥ kx − x0 k2
dx
kx − x0 k2 2
df (x0 )
(z)
≥ inf − kφ(x)k2
kzk2 =1
dx
2
df (x0 )
Da die Menge {z|kzk2 = 1} kompakt ist und die Abbildung, die z auf dx (z)
2
abbildet, stetig ist, wird das Infimum angenommen. Also
df (x0 )
x
−
x
kf (x) − f (x0 )k2
0
− kφ(x)k2
≥ dx
kx − x0 k2
kx − x0 k2 2
df (x0 )
− kφ(x)k2
≥ min (z)
kzk2 =1 dx
2
Da
df (x0 )
dx
invertierbar ist, gilt
df (x0 )
> 0.
α = min (z)
kzk2 =1 dx
2
Da φ in x0 stetig ist, gibt es ein > 0, so dass für alle x ∈ B2n (x0 , ) die Ungleichung
|φ(x)| < gilt. Wir wählen = α2 . Dann gilt für alle x ∈ B2n (x0 , α2 )
kf (x) − f (x0 )k2
α
≥ .
kx − x0 k2
2
Mit (6.11) folgt für alle y mit B2n (y0 , )
2
kf −1 (y) − f −1 (y0 )k2
2
≤ .
ky − y0 k2
α
Beispiel 6.11.1 (i) Es sei f : R2 → R2 durch
f (r, φ) = (x(r, φ), y(r, φ)) = (r cos φ, r sin φ)
gegeben. f ist in allen Punkten (r, φ) mit r 6= 0 lokal invertierbar. Die lokalen Inversen sind durch
r=
p
x2 + y 2
φ = arctan
y
x
gegeben (x 6= 0).
(ii) Es sei f : (0, ∞) × R → R2 durch
f (r, φ) = (x(r, φ), y(r, φ)) = (r cos φ, r sin φ)
6.11. UMKEHRABBILDUNGEN
377
gegeben. f ist in allen Punkten (r, φ) lokal invertierbar, f ist aber nicht global invertierbar.
(iii) Es sei f : R2 → R2 durch
f (x, y) = (u(x, y), v(x, y)) = (x2 + y 2 , xy)
gegeben. f ist lokal umkehrbar, falls x2 6= y 2 . Die lokalen Inversen sind durch
s
r
u
u2
v
r
y=
+
− v2
x=
q
2
4
u
u2
2
2 +
4 −v
gegeben.
(iv) (Polarkoordinaten) Es sei f : Rn → Rn durch
f (r, φ1 , . . . , φn−1 ) = (x1 , . . . , xn )
und
x1
= r cos φ1
x2
= r sin φ1 cos φ2
x3 = r sin φ1 sin φ2 cos φ3
..
.
xn−1
= r sin φ1 . . . sin φn−2 cos φn−1
xn
= r sin φ1 . . . sin φn−2 sin φn−1
gegeben. Dies lässt sich auch so schreiben
x1
=
xk
=
r cos φ1
k−1
Y
r
sin φi cos φk
k = 2, 3, . . . , n − 1
i=1
xn
=
r
n−1
Y
sin φi
i=1
Es gilt
det
df
d(r, φ1 , . . . , φn−1 )
= rn−1 sinn−2 φ1 sinn−3 φ2 . . . sin φn−2
= rn−1
n−2
Y
sinn−k−1 φk .
k=1
Beweis. (i) Wir wenden den Umkehrsatz an. Die Abbildung f ist stetig differenzierbar, weil die
partiellen Ableitungen existieren und stetig sind.
∂x
= cos φ
∂r
∂x
= −r sin φ
∂φ
Die Determinante der Funktionalmatrix ist
!
∂x
∂x
cos φ
∂r
∂φ
det
=
det
∂y
∂y
sin φ
∂r
∂φ
∂y
= sin φ
∂r
−r sin φ
r cos φ
∂y
= r cos φ
∂φ
= r cos2 φ + r sin2 φ = r.
378
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Die Funktionalmatrix ist also für alle (r, φ) mit r 6= 0 von 0 verschieden. Somit ist f in allen diesen
Punkten lokal invertierbar. Dies kann man auch leicht dadurch einsehen, dass man die Inverse
berechnet. Aus x = r cos φ und x = r sin φ folgen
r 2 = x2 + y 2
y
= tan φ.
x
und
Mit dem Satz über die Umkehrfunktion erhalten wir für die Ableitung der Inversen
−1
df
df −1
(f (r, φ)) =
(r, φ)
d(x, y)
d(r, φ)
bzw.
df −1
(f (r, φ))
d(x, y)
=
=
−r sin φ
r cos φ
y
r
=
x
cos φ
sin φ
x
r
− ry2
−1
=
√
x
x2 +y 2
y
− x2 +y
2
r2
cos φ
sin φ
− 1r sin φ 1r cos φ
!
√ 2y 2
x +y
.
x
x2 +y 2
Da wir die Umkehrabbildung explizit ausgerechnet haben, können wir die Ableitung auch direkt
ausrechnen.
(ii) f ist wegen (i) in allen Punkten lokal umkehrbar, aber nicht global umkehrbar, weil
f (r, φ) = f (r, φ + 2π).
(iii) Für die Funktionaldeterminante von f erhalten wir
!
∂f1
∂f1
2x 2y
∂x
∂y
det
= det
= 2x2 − 2y 2 .
∂f2
∂f2
y
x
∂x
∂y
Die Funktionaldeterminante ist also genau dann 0, wenn x2 = y 2 . Auch hier können wir die
Inversen explizit berechnen. Aus u = x2 + y 2 und v = xy folgt
x=
v
y
und
u=
v2
+ y2 .
x2
Es folgt
y4 − y2 u + v2
und damit
s
y=
u
+
2
r
u2
− v2 .
4
(iv) Wir entwickeln die Determinante gemäss der Laplace Formel nach der letzten Spalte, d.h. der
φn−1 -Spalte. In dieser Spalte sind nur die letzten beiden Koordinaten von 0 verschieden.
∂xn
det
∂(r, φ1 , . . . , φn−1 )
∂xnn−1
∂xnn
∂xn
∂xn
=
det
−
det
∂φn−1
∂(r, φ1 , . . . , φn−1 ) (n,n) ∂φn−1
∂(r, φ1 , . . . , φn−1 ) (n−1,n)
Weiter gilt
∂xnn−1 ∂xnn−1
∂xn
,
, . . . , n−1
∂r
∂φ1
∂φn−2
∂xnn ∂xnn
∂xnn
,
,...,
∂r ∂φ1
∂φn−2
= cos φn−1
= sin φn−1
n−1
∂xn−1
∂xn−1
n−1 ∂xn−1
,
, . . . , n−1
∂r
∂φ1
∂φn−2
n−1
∂xn−1
∂xn−1
n−1 ∂xn−1
,
, . . . , n−1
∂r
∂φ1
∂φn−2
!
.
!
6.11. UMKEHRABBILDUNGEN
379
Damit erhalten wir
det
∂xn
∂(r, φ1 , . . . , φn−1 )
weil die letzte Zeile der Matrix
det
= cos φn−1 det
(n,n)
∂xn
∂(r,φ1 ,...,φn−1 )
∂xn
∂(r, φ1 , . . . , φn−1 )
∂xn−1
∂(r, φ1 , . . . , φn−2 )
gestrichen wird. Ebenso erhalten wir
= sin φn−1 det
(n−1,n)
∂xn−1
∂(r, φ1 , . . . , φn−2 )
wobei wir beachten, dass die vorletzte Zeile gestrichen wird. Es folgt
∂xn
det
∂(r, φ1 , . . . , φn−1 )
∂xnn
∂xn−1
= cos φn−1
det
∂φn−1
∂(r, φ1 , . . . , φn−2 )
∂xn
∂xn−1
− sin φn−1 n−1 det
∂φn−1
∂(r, φ1 , . . . , φn−2 )
n−2
Y
∂xn−1
=r
sin φi det
∂(r, φ1 , . . . , φn−2 )
i=1
2
Es stellt sich die Frage, ob man beim Umkehrsatz die Voraussetzung, dass die
Funktion stetig differenzierbar ist, abschwächen kann? Reicht vielleicht die Diffferenzierbarkeit aus? Dies ist nicht der Fall. Dazu das folgende Beispiel.
Beispiel 6.11.2 Es sei f : R → R durch
x + x2 cos xπ2
f (x) =
0
x 6= 0
x=0
definiert. f ist überall differenzierbar f 0 (0) = 1, aber nicht in 0 lokal umkehrbar.
Beweis. Falls eine differenzierbare Funktion auf einem Intervall umkehrbar ist, so muss ihre
Ableitung nicht negativ oder nicht positiv auf dem Intervall sein. Da f 0 (0) = 1, so muss die
Ableitung auf dem Intervall nicht negativ sein. Es gilt
f 0 (x) = 1 + 2x cos
und für
π
2π
π
+
sin 2
2
x
x
x
1
x= q
2k +
erhalten wir

0
f q

1
2k +
3
2
 = 1 + 2q
also
0
2k +
f q
r
3
3
3
cos 2kπ + π + 2π 2k + sin 2kπ + π
2
2
2
1

3
2
3
2

1
2k +
3
2
 = 1 − 2π
r
2k +
3
<0
2
380
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
2
1
0.5
-1
-0.5
0.5
1
-0.5
-1
6.12
Implizite Funktionen
Es sei U eine offene Teilmenge des Rn und fi : U → R, i = 1, . . . , m. Unter welchen
Voraussetzungen kann man das Gleichungssystem
fi (x) = 0
i = 1, . . . , m
lösen? Kann man das Gleichungssystem nach bestimmten Variablen auflösen? Unter
welchen Voraussetzungen sind die Lösungen differenzierbare Funktionen?
Wir betrachten das Gleichungssystem
x2 + y 2 + z 2 = 1
ex = sin y
Dieses Gleichungssystem hat
x = ln(sin y)
p
1 − y 2 − | ln(sin y)|2
z =
als eine Lösung (vorausgesetzt die Ausdrücke sind sinnvoll). Wir haben nach x und
z aufgelöst.
Es seien m, n ∈ N mit m < n und U eine offene Teilmenge des Rn . Weiter sei
F : U → Rm eine Funktion. Wir sagen, dass das System F (x) = 0 bzw.
fi (x) = 0
i = 1, . . . , m
lokal in x0 nach x(1), . . . , x(m) auflösbar ist, falls es eine Umgebung V(x0 (m +
1), . . . , x0 (n)) von (x0 (m + 1), . . . , x0 (n)) ∈ Rn−m und eine eindeutige Funktion
φ : V(x0 (m + 1), . . . , x0 (n)) → Rm
6.12. IMPLIZITE FUNKTIONEN
381
gibt, so dass für alle (x(m + 1), . . . , x(n)) ∈ V(x0 (m + 1), . . . , x0 (n)) und alle i =
1, . . . , m
fi (φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)) = 0
und
φ(x0 (m + 1), . . . , x0 (n)) = (x0 (1), . . . , x0 (m))
gilt. Wir sagen, dass φ implizit durch das Gleichungssystem definiert ist.
Satz 6.12.1 Es seien m < n, U eine offene Teilmenge des Rn und F : U → Rm
stetig differenzierbare Funktionen auf U. Es sei x0 ∈ U mit F (x0 ) = 0. Die Matrix
m
∂fi
(x0 )
∂xk
i,k=1
sei nicht singulär. Dann ist das Gleichungssystem F (x) = 0 lokal in x0 auflösbar und
die Lösung φ ist auf einer Umgebung von (x0 (m+1), . . . , x0 (n)) stetig differenzierbar.
Die Funktionalmatrix von φ berechnet sich durch
m,n
∂φi
(x0 (m + 1), . . . , x0 (n))
∂xk
i=1,k=m+1
m !−1 m,n
∂fi
∂fi
=−
(x0 )
(x0 )
.
∂xk
∂xk
i,k=1
i=1,k=m+1
Satz 6.12.1 ist insbesondere dann von Interesse, wenn es zu kompliziert ist, ein
Gleichungssystem aufzulösen. Der Satz hat also theoretisches Interesse. Er stellt
nur sicher, dass es eine Lösung gibt, ohne jedoch eine explizite Formel für die Lösung
zu liefern.
Zum Beweis wird der Mittelwertsatz verwendet. Die Beweisidee und Formulierung
geht auf lineare Gleichungssysteme zurück. Falls fi , i = 1, . . . , m, lineare Abbildungen sind, so hat man
n
X
ai,k x(k) = 0
i = 1, . . . , m
k=1
Dieses System lässt sich nach x(1), . . . , x(m) auflösen, wenn die Determinante der
Matrix
m
∂fi
m
(ai,k )i,k=1 =
∂xk i,k=1
von 0 verschieden ist, bzw. wenn diese Matrix eine Inverse besitzt. Wir überlegen
uns dies. Es gilt
n
X
ai,k x(k) = 0
i = 1, . . . , m
k=1
382
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
genau dann, wenn
m
X
k=1
ai,k x(k) = −
n
X
ai,k x(k)
i = 1, . . . , m
k=m+1
gilt. A−1 sei die Inverse der Matrix A = (ai,k )m
i,k=1 . Dann folgt


!m
x(1)
n
X


A  ...  = −
ai,k x(k)
k=m+1
i=1
x(m)
bzw.


x(1)
 .. 
−1
 . =A
x(m)
−
n
X
!m
ai,k x(k)
k=m+1
.
i=1
Der Schritt von einem linearen Gleichungssystem auf ein allgemeines wird durch
Approximation mittels der Taylorpolynome 1. Grades vollzogen.
n
X
∂fi
(x0 )hk
fi (x0 + h) ∼ fi (x0 ) +
∂xk
k=1
i = 1, . . . , m
Beweis. Wir betrachten die ergänzte Abbildung F̃ : U → Rn mit
F̃ (x) = (f1 (x), . . . , fm (x), xm+1 , . . . , xn ).
Dann gilt
det
dF̃
dx
!
= det
∂fi
∂xk
m
!
i,k=1
Nach dem Satz über die Umkehrabbildung (Satz 6.11.1) gibt es eine offene Umgebung W von F̃ (x0 ) und eine Inverse F̃ −1 : W → V zu F̃ mit
F̃ −1 (y) = (ψ1 (y), . . . , ψm (y), ym+1 , . . . , yn ).
Nun definieren wir φ :→ Rm durch
φi (zm+1 , . . . , zn ) = ψi (0, . . . , 0, zm+1 , . . . , zn )
für alle i = 1, . . . , m. Es gilt
x = F̃ (F̃ −1 (x)) = F̃ ((ψ1 (x), . . . , ψm (x), xm+1 , . . . , xn )).
Für x = (0, . . . , 0, xm+1 , . . . , xn ) folgt für i = 1, . . . , m
0 = fi (ψ1 (0, . . . , 0, xm+1 , . . . , xn ), . . . , ψm (0, . . . , 0, xm+1 , . . . , xn ), xm+1 , . . . , xn )
= fi (φ1 (xm+1 , . . . , xn ), . . . , φm (xm+1 , . . . , xn ), xm+1 , . . . , xn ).
6.12. IMPLIZITE FUNKTIONEN
383
Also gilt
F (φ(x)) = 0.
Wir beweisen die Ableitungsformel. Es sei f = (f1 , . . . , fm ) und V eine offene
Umgebung von (x0 (m + 1), . . . , x0 (n)) im Rn−m , so dass für alle (x(m + 1), . . . , xn ) ∈
V und alle
φi : V → R
i = 1, . . . , m
gilt
f (φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)) = 0.
Wir definieren g : V → Rn durch
g(x(m + 1), . . . , x(n))
= (φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)).
Hiermit ergibt sich für alle (x(m + 1), . . . , x(n)) ∈ V
f ◦ g(x(m + 1), . . . , x(n)) = 0.
Deshalb gilt für alle (x(m + 1), . . . , x(n)) ∈ V
d(f ◦ g)
(x(m + 1), . . . , x(n)) = 0.
d((x(m + 1), . . . , x(n)))
Mit der Kettenregel (Satz 6.6.1) folgt für alle (x(m + 1), . . . , x(n)) ∈ V
dg
df
(g(x(m + 1), . . . , x(n)))
(x(m + 1), . . . , x(n)) = 0.
dx
d(x(m + 1), . . . , x(n))
In Matrizenschreibweise erhalten wir




∂f1
∂x1
...
..
.
∂fm
∂x1
∂f1
∂xn
..
.
...
∂fm
∂xn











∂φ1
∂xm+1
...
...
..
.
∂φm
∂xm+1
1
0
..
.
0
∂φ1
∂xn

..
.
...
0
1
...
...
...
...
...
0



∂φm 
∂xn 
0 
 = 0.
0 



1
Es folgt für alle j = m + 1, . . . , n und alle i = 1, . . . , m
m
X
∂fi
∂fi ∂φk
+
= 0.
∂x
∂x
k ∂xj
j
k=1
In Matrizenschreibweise ist dies
m,n
m m,n
∂fi
∂fi
∂φk
−
=
.
∂xj i=1,j=m+1
∂xk i,k=1 ∂xj k=1,j=m+1
384
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Beispiel 6.12.1 (i) Es sei f : R2 → R durch f (x, y) = x2 − y gegeben.
(ii) Es sei f : R2 → R durch f (x, y) = y − x3 gegeben. f (x, y) = 0 kann lokal in (0, 0) nach x
aufgelöst werden. Wir können aber nicht den Satz über implizite Funktionen anwenden, um dies
sicherzustellen.
(iii) Es sei f : (0, ∞) × (0, ∞) × (0, ∞) → R durch
f (x, y, z) = xy + y z + z x − 3
gegeben. f (x, y, z) = 0 kann in (1, 1, 1) lokal nach x aufgelöst werden und die Ableitung von x(y, z)
im Punkt (1, 1) ist
dx
(1, 1) = (−1, −1).
d(y, z)
(iv) Es sei f : R2 → R durch
f (x, y) = x3 + y 3 − x + y
gegeben. f hat in allen Punkten, in denen f (x, y) = 0 gilt, eine lokale Auflösung nach y. Im
Punkt x = √13 hat die implizite Funktion ein striktes lokales Maximum und im Punkt x = − √13 ein
striktes lokales Minimum. In allen anderen Punkten, in denen eine Auflösung möglich ist, liegen
keine Extrema vor.
Beweis. (i) Um die implizite Funktion f (x, y) = 0 bzw. x2 − y = 0 zu bestimmen, braucht man
den Satz über implizite Funktionen nicht. Wir wollen aber an diesem Beispiel die Aussage des
Satzes über implizite Funktionen studieren.
Offensichtlich ist die Auflösung nach y die Funktion y = x2 . Um den Satz anzuwenden müssen
wir
∂f
= −1
∂y
berechnen. Diese 1 × 1 Matrix ist nicht singulär. Also ist f (x, y) = 0 in allen Punkten (x0 , y0 ) mit
x20 − y0 = 0 lokal auflösbar. Die Ableitung lässt sich durch die Formel
dy
=−
dx
∂f
∂y
−1
∂f
= 2x
∂x
berechnen. Da wir die Auflösung y = x2 kennen lässt sich dieses Ergebnis auch direkt berechnen.
√
Als Auflösung nach x erhalten wir x = y. Der Satz kann angewendet werden und sagt aus,
dass wir lokal auflösen können, falls die partielle Ableitung ∂f
∂x = 2x von 0 verschieden ist. Dies
schließt den Punkt (0, 0) aus. Tatsächlich gibt es auch keine lokale Auflösung im Punkt (0, 0).
Eine solche Funktion müsste nach Definition in einer Umgebung des Punktes 0 existieren. Die
√
Auflösung y existiert aber nur rechts von 0.
Die Berechnung der Ableitung liefert
dx
=−
dy
(ii) Offensichtlich ist x =
angewendet werden, weil
√
3
∂f
∂x
−1
∂f
1
1
=
= √ .
∂y
2x
2 y
y eine Auflösung nach x. Der Satz kann aber nicht in (0, 0)
∂f
= −3x
∂x
für x = 0 gleich 0 ist.
(iii) Der Punkt (1, 1, 1) erfüllt die Gleichung. Wegen
∂f
= yxy−1 + (ln z)z x
∂x
6.12. IMPLIZITE FUNKTIONEN
385
gilt
∂f
(1, 1, 1) = 1.
∂x
Also ist f im Punkt (1, 1, 1) nach x lokal auflösbar. Weiter gilt
∂f
= (ln y)y z + xz x−1
∂z
∂f
= (ln x)xy + zy z−1
∂y
∂f
(1, 1, 1) = 1
∂y
∂f
(1, 1, 1) = 1
∂z
Damit erhalten wir
∂x
∂y (1, 1)
∂x
∂z (1, 1)
=−
∂f
(1, 1, 1)
∂x
−1 ∂f
∂y (1, 1, 1)
∂f
∂z (1, 1, 1)
= (−1, −1).
(iv) Wegen
∂f
= 3y 2 + 1 > 0
∂y
ist f (x, y) = 0 in allen Punkten (x0 , y0 ) mit f (x0 , y0 ) = 0 lokal auflösbar.
dy
=−
dx
∂f
∂y
−1 ∂f
∂x
=
1 − 3x2
3y 2 + 1
Diese Gleichung erhält man auch so: Aus x3 + y 3 − x + y = 0 folgt
3x2 + 3y 2 y 0 − 1 + y 0 = 0
und damit
y0 =
1 − 3x2
.
3y 2 + 1
Deshalb sind die einzigen kritischen Punkte x = √13 und x = − √13 . Tatsächlich gibt es ein y mit
f ( √13 , y) = 0. Für einen solchen Wert y muss gelten
1
1
2
y 3 + y = √ − ( √ )3 = √
3
3
3 3
2
Für y = 0 und y = 1 ergibt sich 0 < 3√
< 1. Also gibt es nach dem Zwischenwertsatz ein y mit
3
2
3
y + y = 3√3 . Ebenso verfahren wir für x = − √13 .
Nun prüfen wir nach, dass in
√1
3
y 00 =
Für x =
√1
3
ein Maximum und in − √13 ein Minimum liegt.
(3y 2 + 1)(−6x) − (1 − 3x2 )6yy 0
(3y 2 + 1)2
erhalten wir
6
(3y 2 + 1)(−6x) − (1 − 3x2 )6yy 0 = − √ (3y 2 + 1) < 0.
3
2
386
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
6.13
Lagrangesche Multiplikatoren
Joseph Lagrange (1736-1813) wurde in Turin geboren. Er sollte Jura studieren, studierte aber
Mathematik und wurde mit 19 Jahren Professor für Mathematik an der Königlichen Militär Schule
in Turin. Er wurde von Friedrich II. zum Nachfolger von Euler an der Akademie der Wissenschaften
in Berlin ernannt. Nach Friedrichs Tod ging er auf Einladung von Louis XVI. nach Paris. 1788
veröffentlichte er sein wichtigstes Werk ”Analytische Mechanik”. Dieses Werk setzt die Mechanik
von Newton, den Bernoullis und Euler fort. Es wird die Idee entwickelt, dass Probleme in der
Mechanik auf gewöhnliche und partielle Differentialgleichungen zurückzuführen sind. Da er sehr
introvertiert war, überlebte er die Französische Revolution.
Es sei U eine offene Teilmenge des Rn . Es seien f : U → R und g : U → Rm
stetig differenzierbare Funktionen. Wir wollen die lokalen Extrema von f auf der
Menge
{x ∈ U|g(x) = 0}
bestimmen. Wir bezeichnen dies als ein Extremwertproblem mit Nebenbedingungen.
Satz 6.13.1 Es sei U eine offene Teilmenge des Rn . Es seien f : U → R und
g : U → Rm stetig differenzierbare Funktionen. Es sei x0 ∈ U mit g(x0 ) = 0 und
rg
dg
(x0 )
dx
= m.
Wir nehmen an, dass f in x0 einn lokales Extremum unter der Nebenbedingung
g(x) = 0 habe. Dann gibt es ein λ ∈ Rm mit
∇f (x0 ) =
m
X
i=1
λi ∇gi (x0 ).
Die Zahlen λ1 , . . . , λm heißen Lagrangesche Multiplikatoren.
Beweis. Wir können annehmen, dass die Matrix
 ∂g1

∂g1
(x0 ) . . . ∂x
(x
)
0
∂x1
m


..
..


.
.
∂gm
∂gm
(x0 ) . . . ∂xm (x0 )
∂x1
nicht singulär ist, anderenfalls ordnen wir die Variablen x1 , . . . , xn neu.
Aus dem Satz über implizite Funktionen folgt, dass g(x) = 0 lokal in x0 nach
x(1), . . . , x(m) auflösbar ist. Also gibt es eine Umgebung V(x̃0 ) von x̃0 = (x0 (m +
1), . . . , x0 (n)) und eine Funktion φ : V → Rm mit
g(φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)) = 0
6.13. LAGRANGESCHE MULTIPLIKATOREN
387
Wir definieren
F (x(m + 1), . . . , x(n))
= f (φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)).
Nach Voraussetzungen hat F in x̃0 ein lokales Extremum. Also erhalten wir mit der
Kettenregel für alle k = m + 1, . . . , n
m
X ∂f
∂φi
∂f
∂F
=
(x0 )
(x̃0 ) +
(x0 )
0=
∂xk
∂x
∂x
∂x
i
k
k
i=1
wobei wir beachten, dass
x0 = (φ1 (x0 (m + 1), . . . , x0 (n)), . . . , φm (x0 (m + 1), . . . , x0 (n)), x0 (m + 1), . . . , x0 (n))
Also gilt
m
X
∂f
∂φj
∂f
(x0 ) = −
(x0 )
(x̃0 )
∂xk
∂xj
∂xk
j=1
Wir definieren nun die Lagrangeschen Multiplikatoren durch das lineare Gleichungssystem
m
X
∂f
∂gi
λi
(x0 ) =
(x0 )
j = 1, . . . , m
∂xj
∂xj
i=1
Da die Matrix
∂gi
(x0 )
∂xj
m
i,j=1
nicht singulär ist, gibt es eine eindeutige Lösung λ. Damit haben wir auch die
Bedingung
m
X
∇f (x0 ) =
λi ∇gi (x0 )
i=1
für die Koordinaten j = 1, . . . , m erfüllt. Weiter erhalten wir
∂f
(x0 )
∂xk
=−
=−
=−
m
X
∂f
∂φj
(x0 )
(x̃0 )
∂x
∂x
j
k
j=1
m X
m
X
λi
j=1 i=1
m
m
X
X
λi
i=1
j=1
∂gi
∂φj
(x0 )
(x̃0 )
∂xj
∂xk
∂φj
∂gi
(x0 )
(x̃0 )
∂xj
∂xk
Mit der Kettenregel erhalten wir für k = m + 1, . . . , n aus
g(φ1 (x(m + 1), . . . , x(n)), . . . , φm (x(m + 1), . . . , x(n)), x(m + 1), . . . , x(n)) = 0
388
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
dass
m
X
∂gi
∂φj
∂gi
(x0 ) = −
(x0 )
(x̃0 ).
∂xk
∂x
∂x
j
k
j=1
Somit erhalten wir für k = m + 1, . . . , n
m
X ∂gi
∂f
(x0 ) =
λi
(x0 ).
∂xk
∂xk
i=1
2
Beispiel 6.13.1 (Geometrisches und arithmetisches Mittel) Es sei x ∈ Rn mit xi ≥ 0, i =
1, . . . , n. Dann gilt
! n1
n
n
Y
1X
xi
≤
xi
n i=1
i=1
Beweis. Wir können das Problem auch so formulieren: Finde das Maximum von
! n1
n
Y
xi
i=1
unter der Nebenbedingung
n
1X
xi = 1
n i=1
xi ≥ 0, i = 1, . . . , n.
Es reicht, das Maximum der Funktion f : {x ∈ Rn |∀i : xi ≥ 0} → R
f (x) =
n
Y
xi
i=1
mit der Nebenbedingung
n
0 = g(x) =
1X
xi − 1
n i=1
zu finden. Da die Funktion f auf der abgeschlossenen und beschränkten, also kompakten Menge
n
(
)
X
n1
x∈R xi = 1 und xi ≥ 0, i = 1, . . . , n
n
i=1
stetig ist, nimmt diese Funktion dort Minimum und Maximum an.
sichtlich in einem Punkt x mit xi > 0, i = 1, . . . , n angenommen. f
und es wird in einem Punkt x mit xi > 0, i = 1, . . . , xn angenommen.
dere ein relatives Maximum.
Nun wenden wir Satz 6.13.1 auf die Funktion f an. Wir erhalten
Y
xi = λ
1≤i≤n
i 6= k
Es folgt für alle k = 1, . . . , n
Das Maximum wird offenbesitzt somit ein Maximum
Das Maximum ist insbesonaus
∂f
∂xk
∂g
= λ ∂x
, dass
k
1
n
n
Y
1
xi = λ xk .
n
i=1
Pn
Da xi 6= 0, i = 1, . . . , n, so gilt λ 6= 0. Damit gilt x1 = x2 = · · · = xn . Wegen n1 i=1 xi = 1 folgt
weiter x1 = x2 = · · · = xn = 1. Also wird das Maximum im Punkt (1, 1, . . . , 1) angenommen. 2
6.14. DIFFERENTIATION IN BANACHRÄUMEN
6.14
389
Differentiation in Banachräumen
René Maurice Fréchet wurde am 2. September 1878 in Maligny geboren. Er starb am 4. Juni 1973
in Paris. Er lehrte an der Universität Straßburg und in Paris an der École Normale Supérieure.
Er arbeitete auf dem Gebiet der Topologie und Wahrscheinlichkeitstheorie.
Lineare Abbildungen zwischen endlich-dimensionalen, normierten Räumen sind
stetig. Wenn der Grundraum nicht endlich-dimensional ist, so gibt es lineare Abbildungen, die nicht stetig sind.
Es seien X und Y Banachräume und U eine offene Teilmenge von X. Wir sagen,
dass eine Funktion f : U → Y in einem Punkt x0 ∈ U schwach differenzierbar oder
auch Gâteaux-differenzierbar ist, wenn es eine stetige, lineare Abbildung A : X → Y
gibt, so dass für alle x
f (x0 + tx) − f (x0 )
= A(x)
t→0
t
lim
gilt. Wir sagen, dass f : U → Y in x0 differenzierbar bzw. Fréchet-differenzierbar
ist, falls es eine stetige, lineare Abbildung A : X → Y , ein > 0 und eine Funktion
φ : B(0, ) → Y gibt, so dass für alle x mit kxk < f (x0 + x) = f (x0 ) + A(x) + φ(x)
und
φ(x)
=0
x→0 kxk
lim
gelten. Offensichtlich ist f in einem Punkt x0 Gâteaux-differenzierbar, wenn f in
x0 Fréchet-differenzierbar ist.
Lemma 6.14.1 (i) Die lineare Abbildung der Gâteaux-Differenzierbarkeit ist eindeutig.
(ii) Die lineare Abbildung der Fréchet-Differenzierbarkeit ist eindeutig.
(iii) Die lineare Abbildung der Gâteaux-Differenzierbarkeit und die der FréchetDifferenzierbarkeit stimmen überein.
Wenn f Fréchet-differenzierbar ist, dann bezeichnen wir A als das Differential
bzw. Fréchet Differential von f und schreiben
f 0 (x0 )
Df (x0 )
Beweis. (i) Wir nehmen an, es gäbe zwei verschiedene, lineare, stetige Abbildungen
A und B. Dann gelten für alle x
f (x0 + tx) − f (x0 )
= A(x)
t→0
t
lim
390
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
und
lim
t→0
f (x0 + tx) − f (x0 )
= B(x).
t
Also gilt für alle x
A(x) = B(x)
und damit A = B.
(ii) und (iii) folgen aus (i). Lemma 6.14.2 Es seien X und Y Banachräume und U eine offene Teilmenge von
X. Es sei f : U → Y eine Abbildung, die in x0 Fréchet-differenzierbar ist. Dann ist
sie in x0 stetig.
Lemma 6.14.3 Es seien X und Y Banachräume und U eine offene Teilmenge von
X. Es seien f, g : U → Y Abbildungen, die in x0 Fréchet-differenzierbar sind. Dann
ist f + g in x0 Fréchet-differenzierbar.
Beispiel 6.14.1 Es sei f : R2 → R durch
( f (x, y) =
x·y 2
x2 +y 4
0
2
(x, y) 6= (0, 0)
(x, y) = (0, 0)
Dann ist f Gâteaux-differenzierbar, aber nicht Fréchet-differenzierbar.
Das zweite Differential D2 f ist eine Abbildung von U nach L(X, L(X, Y )).
6.15. EQUIDISTRIBUTION THEOREM
6.15
391
Equidistribution theorem
In mathematics, the equidistribution theorem is the statement that the sequence a,
2a, 3a, ... mod 1 is uniformly distributed on the circle R/Z?, when a is an irrational
number. While this theorem was proved in 1909 and 1910 separately by Hermann
Weyl, Waclaw Sierpinski and Piers Bohl, variants of this theorem continue to be
studied to this day.
E. Stein, R. Shakarchi: Fourier analysis
Körner. Fourier analysis
392
CHAPTER 6. FUNKTIONEN MEHRERER REELLER VARIABLEN
Chapter 7
Integration im Rn
Für alle i = 1, . . . , n seien −∞ < ai < bi < ∞ . Die Menge
n
Y
I=
[ai , bi ]
i=1
heißt abgeschlossenes, n-dimensionales Intervall. Die Zahl
n
Y
µ(I) =
(bi − ai )
i=1
heisst n-dimensionales Volumen, n-dimensionales Mass oder n-dimensionaler Inhalt
von I. Eine Menge P = {I1 , . . . , Im } von abgeschlossenen Intervallen heißt Partition
von I, wenn
m
[
◦
◦
Ik
und
Ik ∩ I` = ∅ k 6= `
I=
k=1
gilt.
Der Durchmesser δ(A) einer Menge A des Rn ist
δ(A) = sup kx − yk
x,y∈A
Die Feinheit einer Partition P ist
kPk = max δ(Ik )
1≤k≤m
Man kann leicht nachrechnen, dass für alle Partitionen P = {I1 , . . . , Im } von I
µ(I) =
m
X
µ(Ik )
k=1
0
gilt. Eine Partition P 0 = {I10 , . . . , Im
0 } von I heisst Verfeinerung der Partition
P = {I1 , . . . , Im } von I, falls für jedes k 0 , k 0 = 1, . . . , m0 ein k, k = 1, . . . , m mit
Ik0 ⊆ Ik existiert.
393
CHAPTER 7. INTEGRATION IM RN
394
Insbesondere gilt δ(Ik0 ) ≤ δ(Ik ) und damit kP 0 k ≤ kPk.
Es sei I ein abgeschlossenes, n-dimensionales Intervall im Rn und f : I → R sei
beschränkt auf I. P = {I1 , . . . , Im } sei eine Partition von I. Wir setzen
mk (f ) = inf f (x)
Mk (f ) = sup f (x)
x∈Ik
x∈Ik
m(f ) = inf f (x)
M (f ) = sup f (x)
x∈I
x∈I
Die Zahl
US P (f ) =
m
X
mk (f )µ(Ik )
k=1
heißt Untersumme von f bezüglich P und die Zahl
OS P (f ) =
m
X
Mk (f )µ(Ik )
k=1
heißt Obersumme von f bezüglich P. Es gilt
m(f )µ(I) ≤ US P (f ) ≤ OS P (f ) ≤ M (f )µ(I)
Lemma 7.0.1 Es sei P 0 eine Verfeinerung von P. Dann gilt
(i) OS P 0 (f ) ≤ OS P (f )
(ii) US P 0 (f ) ≥ US P (f )
Lemma 7.0.2 Es seien P1 und P2 Partitionen von I. Dann gilt
US P1 (f ) ≤ OS P2 (f )
Als unteres Integral von f auf I bezeichnen wir
Z
Z
f (x)dx =
f (x1 , . . . , xn )d(x1 , . . . , xn ) = sup US P (f )
−I
P
−I
Als oberes Integral von f auf I bezeichnen wir
Z −
Z −
f (x)dx =
f (x1 , . . . , xn )d(x1 , . . . , xn ) = inf OS P (f )
I
P
I
Wir sagen, dass f auf I Riemann-integrierbar ist, falls
sup US P (f ) = inf OS P (f )
P
P
gilt und nennen diese Zahl das Riemann-Integral von f über I. Diese Zahl wird mit
Z
Z
f (x)dx = f (x1 , . . . , xn )d(x1 , . . . , xn )
I
bezeichnet.
I
395
Bemerkung 7.0.1 (i) Es gilt
Z
−I
f (x)dx ≤
Z
−
f (x)dx
I
(ii) Für alle > 0 existiert ein δ, so dass für alle Partitionen P mit kPk ≤ δ
Z
Z
f (x)dx − ≤ US P (f ) ≤
f (x)dx
−I
−I
Z −
Z −
f (x)dx
≤ OS P (f ) ≤
f (x)dx + I
I
Beweis. (i) folgt sofort aus Lemma. 2
Satz 7.0.1 Es sei I ein abgeschlossenes, n-dimensionales Intervall und f : I → R
sei auf I stetig. Dann ist f Riemann-integrierbar.
Beweis. Da I abgeschlossen und beschränkt ist, ist I kompakt. Deshalb ist f nach
Lemma auf I gleichmässig stetig.
∀ > 0∃δ > 0∀x, y ∈ I, d(x, y) < δ : |f (x) − f (y)| <
µ(I)
Es sei P = {I1 , . . . , Im } eine Partition von I mit kPk < δ. Dann gilt
R
R
0 ≤ I f (x)dx − −I f (x)dx
≤ OS P (f ) − US P (f )
m
m
X
X
mk (f )µ(Ik )
Mk (f )µ(Ik ) −
=
k=1
k=1
m
m
X
X
=
(Mk (f ) − mk (f ))µ(Ik ) ≤
µ(Ik ) = µ(I)
k=1
k=1
2
Bemerkung 7.0.2 Falls f (x) = c auf I gilt, dann gilt
Z
f (x)dx = cµ(I)
I
Es sei I ein abgeschlossenes, n-dimensionales Intervall und f : I → R sei auf I
beschränkt. Es sei P = {I1 , . . . , Im } eine Partition von I. Es sei ξ = (ξ1 , . . . , ξm )
mit ξk ∈ Ik , k = 1, . . . , m. Dann heisst
SP (f, ξ) =
m
X
k=1
f (ξk )µ(Ik )
CHAPTER 7. INTEGRATION IM RN
396
Riemannsche Summe von f bzgl. P und ξ.
Offensichtlich gilt
US P (f ) ≤ SP (f, ξ) ≤ OS P (f )
Falls ein J ∈ R existiert, so dass für alle > 0 ein δ > 0 existiert, so dass für alle
Partitionen P mit kPk < δ und für alle ξ
|SP (f, ξ) − J| < gilt, dann sagen wir, dass die Riemannschen Summen gegen J konvergieren und
schreiben
J = lim SP (f, ξ)
kPk→0
Satz 7.0.2 Es sei I ein abgeschlossenes, n-dimensionales Intervall.
(i) Falls f auf I Riemann-integrierbar ist, so gilt
Z
lim SP (f, ξ) = f (x)dx
kPk→0
I
(ii) Falls
lim SP (f, ξ)
kPk→0
existiert, so ist f auf I Riemann-integrierbar und es gilt
Z
lim SP (f, ξ) = f (x)dx
kPk→0
7.1
I
Iterierte Integrale
Satz 7.1.1 Es sei I = [a, b] × [c, d] und f : I → R sei Riemann-integrierbar. Für
alle x ∈ [a, b] existiere das Integral
d
Z
f (x, y)dy
c
Dann existiert das iterierte Integral
Z bZ
d
f (x, y)dydx
a
c
und es gilt
Z bZ
Z
f (x, y)d(x, y) =
I
d
f (x, y)dydx
a
c
7.1. ITERIERTE INTEGRALE
397
Beweis. Da f auf I integrierbar ist, gilt:
Z
∀ > 0∃δ > 0∀P, kPk < δ : f (x, y)d(x, y) − US P (f ) < I
Wir wählen nun spezielle Partitionen. Es seien
Px = {x0 , . . . , xm }
Py = {y0 , . . . , yn }
und
Partitionen von [a, b] und [c, d]. Dann ist
i = 1, . . . , m
j = 1, . . . , n
Ii,j = [xi−1 , xi ] × [yj−1 , yj ]
eine Partition P von I = [a, b] × [c, d]. Für die Feinheit der Partition P erhalten wir
kPk
=
max
1≤i≤m
→ 1≤j≤n
=
max
1≤i≤m
→ 1≤j≤n
sup{kx − yk |x ∈ Ii , y ∈ Jj }
q
(xi − xi−1 )2 + (yj − yj−1 )2
Mit der Dreiecksungleichung für die Euklidische Norm folgt
kPk ≤ max |xi − xi−1 | + max |yj − yj−1 | ≤ kPx k + kPy k
1≤i≤m
1≤j≤n
Da f auf I integrierbar ist, folgt
∀ > 0∃δ > 0∀Px , kPx k < δ, ∀Py , kPy k < δ :
Z
f (x, y)d(x, y) − ≤ US P (f )
I
=
=
m,n X
i,j=1
m
X
i=1
inf
(x,y)∈Ii,j
f (x, y) µ(Ii,j )
(xi − xi−1 )
n X
j=1
inf
(x,y)∈Ii,j
f (x, y) (yj − yj−1 )
Es seien ξi ∈ [xi−1 , xi ]. Dann folgt weiter
∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ∀Py , kPy k < δ :
Z
m
n
X
X
f (x, y)d(x, y) − ≤
(xi − xi−1 )
(
I
i=1
j=1
inf
(ξi ,y)∈Ii,j
f (x, y))(yj − yj−1 )
Die inneren Summen sind Untersummen für Integrale über Funktionen f (ξi , y),
wobei y die Variable ist. Nach Voraussetzung sind diese Funktionen integrierbar.
Also gilt
∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ, ξi ∈ [xi−1 , xi ] :
Z
Z d
m
X
f (x, y)d(x, y) − ≤
(xi − xi−1 )
f (ξi , y)dy
I
i=1
c
CHAPTER 7. INTEGRATION IM RN
398
Die rechte
R d Seite dieser Ungleichung ist eine Riemannsche Summe für die Funktion
F (x) = c f (x, y)dy. Es gilt
∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ, ξi ∈ [xi−1 , xi ] :
Z
m
X
f (x, y)d(x, y) − ≤
(xi − xi−1 )F (ξi )
I
i=1
Ebenso erhalten wir
∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ, ξi ∈ [xi−1 , xi ] :
Z
m
X
f (x, y)d(x, y) + ≥
(xi − xi−1 )F (ξi )
I
i=1
Damit erhalten wir
∀ > 0∃δ > 0∀Px , kPx k < δ, ∀ξ, ξi ∈ [xi−1 , xi ] :
Z
m
X
(xi − xi−1 )F (ξi ) < f (x, y)d(x, y) −
I
i=1
Nach Satz ?? ist die Funktion F auf [a, b] integrierbar und
Z bZ d
Z
f (x, y)dydx
f (x, y)d(x, y) =
a
I
2
c
Bemerkung 7.1.1 (i) Aus der Existenz des Integrals
Z
f (x, y)d(x, y)
I
folgt nicht die Existenz der iterierten Integrale. Ebenso folgt aus der Existenz der
iterierten Integrale nicht notwendig die des Integrals.
(ii) Es sei f : [a, b] × [c, d] → R eine stetige Funktion. Dann ist f integrierbar,
die iterierten Integrale existieren und es gilt
Z
Z dZ b
Z bZ d
f (x, y)d(x, y) =
f (x, y)dxdy =
f (x, y)dydx
[a,b]×[c,d]
c
a
a
c
Dies ist ein Spezialfall des Satzes von Fubini.
Als ein Beispiel zum ersten Teil der Bemerkung kann die folgende Funktion
angeführt werden. f : [0, 1] × [0, 1] → R ist durch
(
1
falls x = 21 und y ∈ Q
f (x, y) =
0
sonst
gegeben. Das Integral von f existiert und ist gleich 0, aber das Integral
Z 1
f ( 12 , y)dy
0
existiert nicht.
7.1. ITERIERTE INTEGRALE
399
Beispiel 7.1.1 (i) Es sei f : [0, 1] × [0, 1] → R durch f (x, y) = xy gegeben. Dann
ist f integrierbar und es gilt
Z
f (x, y)d(x, y) = 14
[0,1]×[0,1]
(ii) Es sei f : [1, e] × [1, e] → R durch f (x, y) = xy gegeben. Dann ist f integrierbar
und es gilt
Z
Z e+1 y
e
e+1
dy − ln
f (x, y)d(x, y) =
y
2
2
[1,e]×[1,e]
Das nichtausgewertete Integral hängt mit dem Exponentialintegral Ei zusammen.
(iii) Es sei f : [2, 4] × [3, 5] → R durch f (x, y) = ex+y gegeben. Dann ist f integrierbar und es gilt
Z
f (x, y)d(x, y) = (e4 − e2 )(e5 − e3 )
[0,1]×[1,2]
(iv) Es seien g : [a, b] → R und h : [c, d] → R integrierbare Funktionen und f :
[a, b] × [c, d] → R sei durch f (x, y) = g(x)h(y) gegeben. Dann ist f integrierbar und
es gilt
Z
Z
Z
d
b
h(y)dy
g(x)dx
f (x, y)d(x, y) =
c
a
[a,b]×[c,d]
(v) Es sei f : [0, 1] × [0, 1] → R durch f (x, y) = cos(xy) gegeben. Dann ist f
integrierbar und es gilt
Z
f (x, y)d(x, y) = Si(1) = 0.94608 . . .
[0,1]×[0,1]
wobei Si(x) den Integralsinus bezeichnet, der durch
Z x
sin t
dt
Si(x) =
t
0
festgelegt ist.
Beweis. (i) f ist stetig, also ist f integrierbar und die iterierten Integrale existieren
und sind gleich dem Integral.
Z
Z 1Z 1
Z 1
Z 1
2 1
1
1
f (x, y)d(x, y) =
xydydx =
[ 2 xy ]0 dx = 2
xdx = 41
[0,1]×[0,1]
0
0
0
0
(ii) f ist stetig, also ist f integrierbar und die iterierten Integrale existieren und sind
gleich dem Integral.
Z
Z eZ e
Z e
y
1
f (x, y)d(x, y)
=
x dxdy =
[ y+1
xy+1 ]e1 dy
[1,e]×[1,e]
1
Z
e
1
y+1
1
e
1
=
−
dy =
y+1
1 y+1
Z e+1 y
e
e+1
=
dy − ln
y
2
2
Z
2
e+1
ey
dy − [ln(y + 1)]e1
y
CHAPTER 7. INTEGRATION IM RN
400
(iii)
Z
Z
f (x, y)d(x, y)
4
Z
5
e
=
2
[2,4]×[3,5]
Z
Z
x+y
Z
5
dydx =
2
3
4
=
4
Z
[ex ey ]53 dx =
2
2
ex ey dydx
3
4
ex (e5 − e3 )dx
(v) Da f stetig ist, gilt
1
Z
Z
1
Z
f (x, y)d(x, y) =
[0,1]×[0,1]
cos(xy)dxdy
0
0
Es gilt
1
Z
0

 sin y
y
cos(xy)dx =

1
falls y 6= 0
falls y = 0
Diese Funktion der Variablen y ist auf [0, 1] stetig. Damit erhalten wir
1
Z
Z
f (x, y)d(x, y) =
0
[0,1]×[0,1]
sin y
dy = Si(1)
y
2
Beispiel 7.1.2 Es sei f : [0, 1] × [0, 1] → R durch

falls x = 0 oder y = 0
0
f (x, y) =
x−y

falls x =
6 0 und y =
6 0
(x + y)3
f ist nicht Riemann-intgrierbar, die iterierten Integrale existieren und es gilt
Z
0
1
Z
0
1
f (x, y)dxdy = − 12
Z
1
Z
1
f (x, y)dydx =
0
0
1
2
Beweis. f ist nicht Riemann-integrierbar, weil f unbeschränkt ist. Dazu betrachten wir die
Gerade y = 2x. Auf dieser Geraden nimmt f die folgenden Werte an
f (x, 2x) = −
x
1
=−
3
27x
27x2
Für x ∈ (0, 1] ist diese Funktion nicht beschränkt.
Wir zeigen nun, dass die iterierten Integrale existieren. Es gilt f (0, x) = 0 und ist integrierbar.
Für y 6= 0 ist
 x−y

x 6= 0
f (x, y) = (x + y)3

0
x=0
eine Funktion in x, die auf (0, 1] stetig und auf [0, 1] beschränkt ist, also integrierbar. Es gilt
Z
0
1
1
x−y
x
1
dx
=
−
=−
3
2
(x + y)
(x + y) 0
(1 + y)2
7.1. ITERIERTE INTEGRALE
401
Damit erhalten wir
1
Z
1
Z
0
0
x−y
dxdy =
(x + y)3
1
Z
−
0
1
1
1
dy
=
= − 12
(1 + y)2
1+y 0
Andererseits erhalten wir
Z
1
0
1
y
x−y
1
dy
=
=
(x + y)3
(x + y)2 0
(1 + y)2
und
Z
1
1
Z
0
0
x−y
dydx =
(x + y)3
1
Z
0
1
1
1
dy
=
−
=
(1 + y)2
1+y 0
1
2
2
Satz 7.1.2 Es sei I = [a1 , b1 ]×[a2 , b2 ]×· · ·×[an , bn ] und f : I → R sei integrierbar.
Für k mit 1 ≤ k ≤ n bezeichnen wir
Ixk = [a1 , b1 ] × · · · × [ak−1 , bk−1 ] × [ak+1 , bk+1 ] × · · · × [an , bn ]
(i) Es existiere für jedes xk ∈ [ak , bk ] das Integral
Z
f (x1 , . . . , xn )d(x1 , . . . , xk−1 , xk+1 , . . . , xn )
Ixk
Dann existiert das iterierte Integral
Z
bk
Z
f (x1 , . . . , xn )d(x1 , . . . , xk−1 , xk+1 , . . . , xn )dxk
ak
Ix k
und ist gleich dem Integral
Z
f (x)dx
I
(ii) Falls für alle (x1 , . . . , xk−1 , xk+1 , . . . , xn ) ∈ Ixk das Integral
Z
bk
f (x1 , . . . , xn )dxk
ak
existiert, so existiert auch das iterierte Integral
Z
Z
bk
f (x1 , . . . , xn )dxk d(x1 , . . . , xk−1 , xk+1 , . . . , xn )
Ixk
ak
und ist gleich
Z
f (x)dx
I
CHAPTER 7. INTEGRATION IM RN
402
Beispiel 7.1.3 Es sei f : [0, 1] × · · · × [0, 1] → R durch
f (x1 , . . . , xn ) =
n
Y
xk
k=1
gegeben. f ist integrierbar und
Z
f (x)dx =
[0,1]×···×[0,1]
1
2n
Beweis. f ist stetig und damit integrierbar. Es gilt
Z
Z
f (x)dx
=
[0,1]×···×[0,1]
1
n
1Y
xk dx1 · · · dxn
0 k=1
Z 1
Z 1 Y
n
1
xk dx2 · · · dxn
···
2
0
0
k=1
0
=
···
Z
Mit Induktion erhalten wir das Ergebnis. 2
7.2
Riemann-Integral auf beschränkten Mengen
Es sei X eine Teilmenge des Rn und f : X → R. Wir bezeichnen fX : Rn → R mit
(
f (x)
x∈X
fX (x) =
0
x∈
/X
als Erweiterung von f auf den Rn .
Falls X eine beschränkte Menge vom Rn ist, I ein n-dimensionales, abgeschlossenes Intervall mit X ⊆ I und f : X → R beschränkt ist, so bezeichnen wir
Z
Z
Z −
Z −
f (x)dx =
fX (x)dx
f (x)dx =
fX (x)dx
−X
−I
X
I
als Unter- und Oberintegral. Man kann leicht zeigen, dass die Ausdrücke nicht von
der Wahl des Intervalles I abhängen. Wir sagen, dass f auf X Riemann-integrierbar
ist, falls
Z
Z
−
f (x)dx =
−X
und bezeichnen diese Zahl mit
f (x)dx
X
Z
f (x)dx
X
7.3. DAS MASS VON MENGEN
403
Satz 7.2.1 Es sei X eine beschränkte Teilmenge des Rn und g, f : X → R seien
Riemann-intgrierbar. Dann sind auch g + f , cf , |f | und gf Riemann-integrierbar
und es gelten
(i)
Z
Z
cf dx = c
f dx
X
X
(ii)
Z
Z
f + gdx =
X
Z
f dx +
gdx
X
X
(iii)
Z
Z
f (x)dx ≤
|f (x)|dx
X
7.3
X
Das Maß von Mengen
Es sei X eine beschränkte Teilmenge des Rn , I ein abgeschlossenes, n-dimensi-onales
Intervall mit X ⊆ I und P = {I1 , . . . , Im } eine Partition von I. Wir bezeichnen
X
X
µ(Ik )
M P (X) =
µ(Ik )
M P (X) =
Ik ⊆X
Ik ∩X6=∅
Die Zahlen
µ(X) = sup M P (X)
µ(X) = inf M P (X)
P
P
heissen inneres und äußeres Riemann Maßvon X. Die Menge X heißt Riemann
messbar, wenn µ(X) = µ(X) gilt, und diese Zahl bezeichnen wir als Riemann Maß
µ(X) von X.
Lemma 7.3.1 Es sei X eine beschränkte Teilmenge des Rn . X ist genau dann
Riemann-messbar, wenn die charakteristische Funktion χX
(
1
falls x ∈ X
χX (x) =
0
falls x ∈
/X
Riemann-integrierbar ist.
Es gilt für X ⊆ I
Z
µ(X) =
Z
χX dx =
I
dx
X
Beweis. Es sei I ein abgeschlossenes, n-dimensionales Intervall und P = {I1 , . . . , Im }
eine Partition von I. Dann gilt
m X
X
US P (χX ) =
inf χX (x) µ(Ik ) =
µ(Ik ) = M P (X)
k=1
x∈Ik
Ik ⊆X
CHAPTER 7. INTEGRATION IM RN
404
OS P (χX ) =
m X
k=1
sup χX (x) µ(Ik ) =
x∈Ik
X
µ(Ik ) = M P (X)
Ik ∩X6=∅
Es folgt
2
OS P (χX ) − US P (χX ) = M P (X) − M P (X)
Beispiel 7.3.1 Die Teilmenge [0, 1] ∩ Q von R ist nicht Riemann-messbar.
Wir hatten bereits gezeigt, dass die Funktion χ[0,1]∩Q nicht Riemann-integrierbar
ist.
Lemma 7.3.2 (i) Es seien A und B beschränkte Teilmengen des Rn mit A∩B = ∅.
Dann gilt
µ(A ∪ B) ≤ µ(A) + µ(B)
(ii) Es seien A und B Riemann-messbare Teilmengen des Rn mit A ∩ B = ∅. Dann
ist auch A ∪ B Riemann-messbar und es gilt
µ(A ∪ B) = µ(A) + µ(B)
(iii) Es seien A und B Riemann-messbare Teilmengen des Rn mit A ⊆ B. Dann ist
B \ A Riemann-messbar und es gilt
µ(B \ A) = µ(B) − µ(A)
Eine Riemann-messbare Teilmenge A des Rn heisst Nullmenge, falls µ(A) = 0.
Wir definieren µ(∅) = 0.
Beweis. (ii) Es gilt wegen Lemma ??
Z
µ(A) = χA dx
Z
µ(B) =
χB dx
Damit folgt, dass χA + χB integrierbar ist und
Z
Z
Z
µ(A) + µ(B) = χA dx + χB dx = χA + χB dx
Weil A und B disjunkt sind erhalten wir
Z
µ(A) + µ(B) =
2
χA∪B dx
7.3. DAS MASS VON MENGEN
405
Beispiel 7.3.2 (i) Eine Teilmenge von Rn , die nur aus endlichen vielen Punkten
besteht, ist eine Nullmenge.
(ii) Die Cantor-Menge ist eine Nullmenge.
(iii) Eine beschränkte Teilmenge X von Rn , die ganz in einer Hyperebene
Hj = {x ∈ Rn |xj = const.}
enthalten ist, ist eine Nullmenge.
(iv) Die Vereinigung von endlich vielen Nullmengen ist eine Nullmenge.
Beweis. (iii) Da X eine beschränkte Teilmenge vom Rn ist, gibt es ein K > 0, so
dass
X ⊆ [−K, K] × · · · × [−K, K]
Ausserdem ist X eine Teilmenge von Hj
X ⊆ R × · · · × R × [c − , c + ] × R × · · · × R
Deshalb gilt für alle > 0
X ⊆ [−K, K] × · · · × [−K, K] × [c − , c + ] × [−K, K] × · · · × [−K, K]
Somit gilt für alle > 0
0 ≤ µ(X) ≤ µ(X) ≤ (2K)n−1 2
Also gilt
0 = µ(X) = µ(X)
2
Der Rand ∂X einer Teilmenge X eines metrischen Raumes ist
◦
∂X = X\ X
Satz 7.3.1 Eine beschränkte Teilmenge X des Rn ist genau dann Riemann-messbar,
wenn µ(∂X) = 0.
Beweis. Es gelte µ(∂X) = 0 und I sei ein abgeschlossenes, n-dimensionales Intervall
mit X ⊆ I. Da I abgeschlossen ist, so gilt X ⊆ I.
Es sei P = {I1 , . . . , Im } eine Partition von I mit
M P (∂X) < CHAPTER 7. INTEGRATION IM RN
406
Es gilt
X
µ(X) − µ(X) ≤ M P (X) − M P (X) =
≤
X
Ik ∩X6=∅
µ(Ik ) −
X
Ik ∩X6=∅
X
µ(Ik ) =
◦
Ik ⊆→X
µ(Ik ) −
X
µ(Ik )
Ik ⊆X
µ(Ik ) = M P (∂X) < Ik ∩∂X6=∅
Es folgt, dass µ(X) = µ(X). Also ist X Riemann-integrierbar.
Die Umkehrung wollen wir nur für abgeschlossene Mengen zeigen. Es sei I ein
abgeschlossenes, n-dimensionales Intervall mit X ⊆ I und P = {I1 , . . . , Im } eine
Partition mit
M P (X) − M P (X) < Wir setzen
)
[
x ∈ ∂X x ∈
/
Ik
(
X1 =
)
[
x ∈ ∂X x ∈
Ik
(
X2 =
Ik ⊆X
Ik ⊆X
Offenbar gilt
∂X = X1 ∪ X2
X1 ∩ X2 = ∅
S
x ∈ X2 bedeutet, dass x nicht innerer Punkt der Menge Ik ⊆X Ik sein kann. Sonst
wäre x ja auch innerer Punkt von X und nicht Randpunkt von X. Also ist x
Randpunkt einer der n-dimensionalen Intervalle Ik . Die Ränder von Ik liegen in
Hyperebenen der Art
Hj {x ∈ Rn |xj = c}
Mit Beispiel ?? folgt, dass µ(X2 ) = 0. Damit ergibt sich
µ(∂X) = µ(X1 ∪ X2 ) ≤ µ(X1 ) + µ(X2 ) = µ(X1 ) ≤ M P (X1 ) =
X
µ(Ik )
Ik ∩X1 6=∅
Es gilt
{k|Ik ∩ X1 6= ∅}
= {k|Ik ∩ ∂X 6= ∅ und Ik * X}
= {k|Ik ∩ ∂X 6= ∅} \ {k|Ik ⊆ X}
⊆ {k|Ik ∩ X 6= ∅} \ {k|Ik ⊆ X}
Da X eine abgeschlossene Menge ist, gilt X = X und wir erhalten
{k|Ik ∩ X1 6= ∅} ⊆ {k|Ik ∩ X 6= ∅} \ {k|Ik ⊆ X}
Damit folgt
µ(∂X) ≤
X
Ik ∩X1 6=∅
µ(Ik ) ≤
X
Ik ∩X6=∅
µ(Ik ) −
X
Ik ⊆X
µ(Ik ) = M P (X) − M P (X) < Also gilt für alle > 0, dass 0 ≤ µ(∂X) ≤ µ(∂X) < . Somit gilt µ(∂X) = µ(∂X) =
0. 2
7.3. DAS MASS VON MENGEN
407
Korollar 7.3.1 Falls die Teilmenge X des Rn Riemann-messbar ist, so sind auch
◦
X und X Riemann-messbar und es gilt
◦
µ(X) = µ(X ) = µ(X)
Beweis. Es sei X Riemann-messbar. Dann ist nach Satz auch ∂X Riemann-messbar
und µ(∂X) = 0. Es folgt
◦
◦
µ(X\ X ) ≤ µ(X\ X ) = µ(∂X) = 0
◦
Also ist X\ X eine Nullmenge und damit insbesondere messbar.
◦
◦
Weiter folgt hiermit und mit Lemma, dass X \ (X\ X ) =X messbar ist und
◦
◦
µ(X ) = µ(X) − µ(X\ X ) = µ(X)
◦
Wiederum mit Lemma ??folgt, dass X =X ∪∂X messbar ist und
◦
◦
◦
µ(X) = µ(X ∪∂X) = µ(X ) + µ(∂X) = µ(X )
2
Als Anwendung dieses Korollars wollen wir zeigen, dass [0, 1]∩Q nicht Riemannmessbar ist.
Wir nehmen an, dass [0, 1] ∩ Q Riemann-messbar ist. Es gilt
[0, 1] ∩ Q = [0, 1]
([0, 1] ∩ Q)◦ = ∅
Nach Korollar ?? gilt
0 = µ(∅) = µ([0, 1]) = 1
Dies ist ein Widerspruch.
Lemma 7.3.3 Eine Teilmenge X vom Rn ist genau dann eine Nullmenge, wenn
es zu jedem > 0 endlich viele abgeschlossene, n-dimensionale Intervalle I1 , . . . , Im
gibt, so dass
m
m
[
X
X⊆
Ik
µ(Ik ) < k=1
k=1
Beispiel 7.3.3 Es sei X eine kompakte Teilmenge des Rn und f : X → Rm sei
eine stetige Funktion. Dann ist die Teilmenge
{(x, f (x))|x ∈ X}
des Rn+m eine Nullmenge.
CHAPTER 7. INTEGRATION IM RN
408
Beweis. Da X kompakt und f stetig ist, ist f gleichmässig stetig.
∀∃δ∀x, y ∈ X, kx − yk < δ : kf (x) − f (y)k < Es sei I ein abgeschlossenes, n-dimensionales Intervall mit X ⊆ I. Wir wählen nun
eine Partition P = {I1 , . . . , IN }, so dass für alle i = 1, . . . , N gilt, dass δ(Ii ) < δ.
Wegen der gleichmässigen Stetigkeit von f gilt
∀i = 1, . . . , N ∀x, y ∈ Ii ∩ X : kf (x) − f (y)k < Es folgt
∀i, Ii ∩ X 6= ∅, ∃xi ∈ Ii ∀x ∈ Ii :
(x, f (x)) ∈ Ii × [f1 (xk ) − , f1 (xi ) + ] × · · · × [fm (xk ) − , fm (xi ) + ]
Hieraus folgt für alle > 0
µ({(x, f (x))|x ∈ X})
X
≤
µ(Ii × [f1 (xk ) − , f1 (xi ) + ] × · · · × [fm (xk ) − , fm (xi ) + ])
Ii ∩X6=∅
≤
N
X
µ(Ii )(2)m = (2)m µ(I)
i=1
Also gilt µ({(x, f (x))|x ∈ X}) = 0. 2
Beispiel 7.3.4 (i) Es sei f : [−1, 1] → R durch f (x) =
√
{(x, 1 − x2 )|x ∈ [−1, 1]}
√
1 − x2 gegeben. Dann ist
eine Nullmenge im R2 .
Hieraus folgt, dass
{(x, y)|x2 + y 2 = 1}
eine Nullmenge ist.
Pn−1 2
xi ≤ 1} → R durch
(ii) Es sei f : {(x1 , . . . , xn−1 )| i=1
v
u
n−1
u
X
t
f (x1 , . . . , xn−1 ) = 1 −
x2i
i=1
gegeben. Dann ist
v

u
n−1
n−1

u
X
X
(x1 , . . . , xn−1 , t1 −
x2i )|
x2i ≤ 1




i=1
eine Nullmenge im Rn .
Hieraus folgt, dass
eine Nullmenge ist.
{x| kxk = 1}
i=1
7.4. BERECHNUNG VON INTEGRALEN
7.4
409
Berechnung von Integralen
Es sei X eine beschränkte Teilmenge des R2 und f : X → R sei messbar. Es seien
y, y : [a, b] → R zwei stetige Funktionen, so dass
X = {(x, y)|a ≤ x ≤ b und y(x) ≤ y ≤ y(x)}
Man kann das Integral folgendermaßen berechnen
Z
Z b Z y(x)
f (x, y)d(x, y) =
f (x, y)dydx
a
X
y(x)
Beispiel 7.4.1 Es sei X = {(x, y)|0 ≤ x ≤ 1 und x2 ≤ y ≤ x} und f : X → R
sei durch f (x, y) = x + y gegeben. Dann gilt
Z
3
f (x, y)d(x, y) = 20
X
Beweis. Wir überlegen uns, dass f eine integrierbare Funktion ist. Nach Beispiel
ist X messbar und damit χX integrierbar. Die Funktion f˜ : [0, 1] × [0, 1] → R mit
f (x, y) = x + y ist eine stetige Funktion, also integrierbar. Das Produkt von zwei
integrierbaren Funktionen ist wieder integrierbar, also ist χX f˜ = fX integrierbar.
Z 1
Z 1Z x
Z
[xy + 12 y 2 ]xx2 dx
x + ydydx =
f (x, y)d(x, y)
=
2
0
X
Z0 1 x
3 2
1 5 1
3
=
x − x3 − 12 x4 dx = 21 x3 − 41 x4 − 10
x 0 = 20
2
0
2
Dies kann man auch für den Rn formulieren. Es sei X eine kompakte Teilmenge
des Rn . Es seien X(n−1) eine kompakte Teilmenge des Rn−1 und xn , xn : X(n−1) →
R, so dass
X = {x|xn (x1 , . . . , xn−1 ) ≤ xn ≤ xn (x1 , . . . , xn−1 ), (x1 , . . . , xn−1 ) ∈ X(n − 1)}
Weiter seien X(k − 1), 2 ≤ k ≤ n − 1 kompakte Teilmengen des Rk−1 und xk , xk :
X(k − 1) → R seien stetige Funktionen, so dass
X(k) = {x|xk (x1 , . . . , xk−1 ) ≤ xk ≤ xk (x1 , . . . , xk−1 ), (x1 , . . . , xk−1 ) ∈ X(k − 1)}
Außerdem gelte
X(1) = {x1 |a ≤ x1 ≤ b} = [a, b]
Dann gilt für stetige Funktionen
Z
Z b Z x2 (x1 )
Z
f (x)dx =
···
X
a
x2 (x1 )
xn (x1 ,...,xn−1 )
xn (x1 ,...,xn−1 )
f (x)dxn dxn−1 · · · dx1
CHAPTER 7. INTEGRATION IM RN
410
Beispiel 7.4.2 Es sei
X = {(x, y, z)| 0 ≤ x, y, z und x + y + z ≤ 1}
und f : X → R sei durch f (x, y, z) = 1 gegeben. Dann gilt
Z
f (x, y, z)d(x, y, z) = 61
X
Beweis. Es gilt
{(x, y, z)|0 ≤ x, y, z und x + y + z ≤ 1}
= {(x, y, z)|0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x, 0 ≤ z ≤ 1 − x − y}
Damit erhalten wir
Z
f (x, y, z)d(x, y, z)
Z
1
Z
1−x
Z
1−x−y
Z
1
Z
1−x
[z]1−x−y
dydx
dzdydx =
0
0
0
0
0
0
Z 1
Z 1 Z 1−x
[y − xy − 12 y 2 ]01−x dx
1 − x − ydydx =
=
0
Z0 1 0
1
=
− x + 12 x2 dx = [ 12 x − x2 + 16 x3 ]10 = 61
2
=
X
0
2
7.5
Transformationsformel für Integrale
Satz 7.5.1 Es sei U eine offene Teilmenge des Rn und g : U → Rn eine stetig
differenzierbare Abbildung, die U eineindeutig auf V = g(U) abbildet. Für alle y ∈ U
gelte
dg
det
(y) 6= 0
dy
Es sei K eine messbare, kompakte Teilmenge von V und f : K → R sei auf K stetig.
Dann gilt
Z
Z
dg
f (x)dx =
f (g(y)) det
(y) dy
dy
K
g −1 (K)
Diese Formel ist die Verallgemeinerung der Substitutionsformel für Funktionen
einer Variablen.
Z b
Z φ−1 (b)
f (x)dx =
f (φ(t))φ0 (t)dt
a
φ−1 (a)
7.5. TRANSFORMATIONSFORMEL FÜR INTEGRALE
411
Man beachte, dass in der Verallgemeinerung der Absolutbetrag der Determinante
genommen wird.
Zum Verständnis dieser Formel erinnere man sich daran, dass der Absolutbetrag
der Determinante gleich dem Volumen des von den Spaltenvektoren aufgespannten
Parallelflachs ist. Die Funktionaldeterminante von g beschreibt die Änderung, die
das Volumen unter der Transformation g erfährt.
Beispiel 7.5.1 Das Volumen der n-dimensionalen Euklidischen Kugel mit Radius R
n
)
(
X
2
n
|xi | ≤ R
x∈R i=1
ist
n
Rn
π2
Γ( n2 + 1)
Beweis. Wir benutzen Polarkoordinaten.
g : [0, R] × [0, π] × · · · × [0, π] × [0, 2π] → Rn
g(r, φ1 , . . . , φn−1 ) = x = (x1 , x2 , . . . , xn )
x1
= r cos φ1
x2
= r sin φ1 cos φ2
x3
= r sin φ1 sin φ2 cos φ3
..
.
xn−1
= r sin φ1 . . . sin φn−2 cos φn−1
xn
= r sin φ1 . . . sin φn−2 sin φn−1
g bildet [0, R] × [0, π] × · · · × [0, π] × [0, 2π] auf {x| kxk ≤ R} ab. Die Abbildung g ist auf
(0, R) × (0, π) × · · · × (0, π) × (0, 2π)
injektiv. Wir weisen die Injektivität nach. Es gelte
g(r, φ1 , . . . , φn−1 ) = x = g(r̃, φ̃1 , . . . , φ̃n−1 )
Es folgt r = kxk = r̃. Also gilt r = r̃. Weiter gilt
r cos φ1 = r̃ cos φ̃1 = r cos φ̃1
Also gilt cos φ1 = cos φ̃1 . Auf dem Intervall (0, π) ist der Cosinus aber injektiv, also gilt φ1 = φ̃1 .
Durch Induktion erhalten wir nun, dass alle weiteren Winkel ebenfalls gleich sein müssen.
Um das Volumen zu berechnen wollen wir nun die Transformationsformel anwenden. Auf der
offenen Menge
(0, R) × (0, π) × · · · × (0, π) × (0, 2π)
ist g injektiv und stetig differenzierbar. Als kompakte Teilmenge wählen wir
I = [, R − ] × [, π − ] × [, π − ] × · · · × [, π − ] × [, 2π − ]
Wir erhalten dann
Z
µ(g(I )) =
g(I )
Z ∂(x1 , . . . , xn ) dx =
∂(r, φ1 , . . . , φn−1 ) d(r, φ1 , . . . , φn−1 )
I
CHAPTER 7. INTEGRATION IM RN
412
Man kann zeigen, dass für → 0 die linke Seite der Gleichung gegen µ(I0 ) konvergiert (wir
verzichten hier auf das Argument). Damit ist das Volumen gleich
Z ∂(x1 , . . . , xn ) d(r, φ1 , . . . , φn−1 )
I ∂(r, φ1 , . . . , φn−1 )
Z π Z 2π
Z RZ π
rn−1 sinn−2 φ1 · · · sin φn−2 drdφ1 · · · dφn−1
···
=
0
0
0
0
Z π
Z 2π
sin φn−2 dφn−2
dφn−1
sinn−2 φ1 dφ1 · · ·
rn−1 dr
0
0
0
0
Z
Z π
2π n π n−2
=
sin
φ1 dφ1 · · ·
sin φn−2 dφn−2
R
n
0
0
Z
R
Z
π
=
π
2
Z
sin2m xdx =
0
m
(2m − 1)(2m − 3) · · · 3 · 1 π
π Y 2k − 1
=
2m(2m − 2) · · · 4 · 2
2
2
2k
k=1
Z
π
2
sin2m+1 xdx =
0
2m(2m − 2) · · · 4 · 2
=
(2m + 1)(2m − 1) · · · 5 · 3
Damit erhalten wir für m = 1, 2, . . .
Z π
Z
2m
sin xdx
0
π
sin2m−1 xdx = 4
0
m
Y
k=1
2k
2k + 1
π
π 1
=
2 2m
m
Damit folgt für gerades n, dass das Volumen der n-dimensionalen Euklidischen Kugel mit Radius
R gleich
n−2
n
2
π
2π n Y
π2
R
= Rn n
n
m
( 2 )!
m=1
ist. Der Fall, dass n ungerade ist, wird ähnlich behandelt. 2
Beispiel 7.5.2 Berechnung des Volumens der 3-dimensionalen Euklidischen Kugel
bzgl. rechtwinkliger Koordinaten.
Beweis. Das Volumen ist
Z −R Z −√R2 −x2 Z −√R2 −x2 −y2
R
Es gilt
√
R2 −x2
√
Z
−R
dzdydx =
R2 −x2 −y 2
Z √
a2
−
t2 dt
R
=
1
2
Z
√
− R2 −x2
√
R2 −x2
p
2 R2 − x2 − y 2 dydx
√
t
t a2 − t2 + a2 arcsin
a
Damit erhalten wir für das Volumen
√R2 −x2
Z R p
y
y R2 − x2 − y 2 + (R2 − x2 ) arcsin √
dx
R2 − x2 −√R2 −x2
−R
Z R
=
(R2 − x2 )(arcsin(1) − arcsin(−1))dx
−R
Z R
R
4π 3
=π
(R2 − x2 )dx = π R2 x − 13 x3 −R =
R
3
−R
2
7.5. TRANSFORMATIONSFORMEL FÜR INTEGRALE
413
Beispiel 7.5.3 (Das Gravitationspotential eines hohlen Planeten)
Es sei
o
n
p
2
2
2
x + y + z ≤ r2
P = (x, y, z)|r1 ≤
ein hohler Planet. Wir nehmen an, dass die Dichte ρ(x, y, z) = 1 ist. Es sei M die
2
Gesamtmasse des Planeten, m die Masse im Punkt (x, y, z) und G = 6, 67·10−11 Nkg·m2
die Gravitationskonstante. Dann gilt für das Gravitationspotential

p
GmM

p
falls
x2 + y 2 + z 2 > r2
2 + y2 + z2
x
V (x, y, z) =
p


Gm2π(r22 − r12 )
falls
x2 + y 2 + z 2 < r1
Das Potential im Inneren des Planeten ist konstant, es herrscht also Schwerelosigkeit im Innern.
Beweis. Für das Gravitationspotential im Punkt (x0 , y0 , z0 ) gilt
Z
V (x0 , y0 , z0 ) = Gm
P
ρ(x, y, z)
p
d(x, y, z)
2
(x − x0 ) + (y − y0 )2 + (z − z0 )2
P ist eine kompakte Menge und
1
p
2
(x − x0 ) + (y − y0 )2 + (z − z0 )2
ist eine stetige Funktion auf einer offenen Umgebung von P , weil entweder
p
(x − x0 )2 + (y − y0 )2 + (z − z0 )2 > r2
oder
p
(x − x0 )2 + (y − y0 )2 + (z − z0 )2 < r1
gilt. Da der Planet rotationssymmetrisch ist, können wir annehmen, dass (x0 , y0 , z0 ) =
(R, 0, 0). Außerdem wollen wir zu Polarkoordinaten übergehen.
x
y
z
r ∈ [r1 , r2 ]
φ ∈ [0, π]
θ ∈ [0, 2π]
= r cos φ
= r sin φ cos θ
= r sin φ sin θ
Es gilt
det
∂(x, y, z)
∂(r, φ, θ)
= r2 sin φ
Wie schon bei der Berechnung des Volumens der Kugel müssen wir eine Grenzwertbetrachtung durchführen, wenn wir zu Polarkoordinaten übergehen. Wir erhalten
CHAPTER 7. INTEGRATION IM RN
414
schließlich
V (R, 0, 0)
Z r2 Z
= Gm
π
2π
r2 sin φ
p
dθdφdr
(R − r cos φ)2 + r2 sin2 φ cos2 θ + r2 sin2 φ sin2 θ
r1
0
0
Z r2 Z π Z 2π
r2 sin φ
p
= Gm
dθdφdr
(R − r cos φ)2 + r2 sin2 φ
0
0
r1
Z r2 Z π
r2 sin φ
p
dφdr
= 2πGm
(R2 − 2rR cos φ + r2
r1
0
Z
Wir substituieren u = −2rR cos φ. Es gilt
du
= 2rR sin φ
dφ
u(0) = −2rR
u(π) = 2rR
Damit erhalten wir
Z
r2
Z
2rR
r
dudr
+ R2 + u
r1
−2rR 2R
Z
i2rR
πGm r2 h√ 2
2
=
dr
2r r + R + u
R
−2rR
r1
Z
√
πGm r2 √ 2
=
2r r + R2 + 2rR − 2r r2 + R2 − 2rR dr
R
Zr1r2
πGm
=
2r|R + r| − 2r|R − r|dr
R
r1
2πGm
√
r2
Da r > 0 und R > 0, so gilt |r + R| = r + R. Andererseits gilt R − r > 0, falls
R > r2 und R − r < 0, falls R < r1 . Damit erhalten wir zwei Fälle
Z

πGm r2 2


4r dr
falls r2 < R

R
r1
Z
V (R, 0, 0) =
πGm r2



4rRdr
falls r1 > R
R
r1
Damit erhalten wir

 4πGm (r3 − r3 )
2
1
V (R, 0, 0) =
3R

2πGm(r22 − r12 )
falls r2 < R
falls r1 > R
Da wir angenommen hatten, dass für die Dichte ρ(x, y, z) = 1 gilt, erhalten wir
M=
2
4π 3
(r − r13 )
3 2
7.6. UNSTETIGKEITSMENGEN VON FUNKTIONEN UND IHREN ABLEITUNGEN415
7.6
Unstetigkeitsmengen von Funktionen und ihren
Ableitungen
[90]
Satz 7.6.1 Es sei X ein separabler, metrischer Raum, in dem jede offene Menge
überabzählbar viele Elemente enthält. Es sei f eine Funktion, die von X nach
R abbildet. Die Menge aller Punkte, in denen f unstetig ist, ist eine Fσ -Menge.
Umgekehrt gibt es zu jeder Fσ -Menge A von X eine Funktion, die in allen Punkten
von A unstetig und in allen Punkten von Ac stetig ist.
Beweis. Es sei f : X → R eine beschränkte Funktion. Wir bezeichnen
(
)
ω(f, x0 ) = lim
sup
δ→0
x∈B(x0 ,δ)
f (x) −
inf
f (x)
x∈B(x0 ,δ)
als Oszillation von f in x0 . ω(f, x0 ) existiert, weil für alle δ > 0
sup
x∈B(x0 ,δ)
f (x) −
inf
x∈B(x0 ,δ)
f (x) ≥ 0
gilt und weil für alle δ, δ̃ mit δ ≤ δ̃
sup
x∈B(x0 ,δ)
f (x) −
inf
x∈B(x0 ,δ)
f (x) ≤
sup
x∈B(x0 ,δ̃)
f (x) −
inf
f (x)
x∈B(x0 ,δ̃)
gilt. Wir zeigen, dass f genau dann in x0 stetig ist, wenn ω(f, x0 ) = 0 gilt. Wir
nehmen an, dass f in x0 stetig ist.
∀ > 0∃δ > 0∀x ∈ B(x0 , δ) : |f (x) − f (x0 )| < Hieraus folgt
sup
f (x) < f (x0 ) + x∈B(x0 ,δ)
und
inf
x∈B(x0 ,δ)
f (x) > f (x0 ) − Also ω(f, x0 ) < 2.
Wir setzen
D = {x|ω(f, x) ≥ }
und zeigen, dass D für alle > 0 eine abgeschlossene Menge ist. Wir zeigen, dass
Dc eine offene Menge ist. Es gelte ω(f, x0 ) < . Dann gibt es ein δ > 0, so dass für
alle x ∈ B(x0 , δ)
sup f (x) − inf f (x) < x∈B(x0 ,δ)
x∈B(x0 ,δ)
CHAPTER 7. INTEGRATION IM RN
416
Hieraus folgt, dass für alle x ∈ B(x0 , δ)
ω(f, x) < gilt. Damit ist die Menge aller Unstetigkeitsstellen von f gleich
[
D1
n
n∈N
und damit eine Fσ -Menge.
Wir zeigen nun, dass es zu jeder Fσ -Menge eine Funktion gibt, die in genau
diesen Punkten unstetig ist. Es seien M eine abzählbare, dichte Teilmenge von X
und
∞
[
A=
An
n=0
wobei An abgeschlossene Mengen sind und überdies An ⊆ An+1 für n = 0, 1, 2, . . .
gilt. Wir setzen A0 = ∅. Wir definieren nun
Bn = {x|x ∈ (An \ An−1 ) \ (An \ An−1 )◦ oder x ∈ (An \ An−1 )◦ ∩ M }
Wir definieren
f (x) =
 −n

2
falls

0
falls
x ∈ Bn
∞
[
x∈
/
Bk
k=1
f ist wohldefiniert, da Bn ∩ Bm = ∅ für n 6= m gilt. Wir wollen dies nachprüfen.
Falls n > m, so gelten
Bn ⊆ An \ An−1
und
Bm ⊆ Am
Wir zeigen nun, dass f für alle x ∈ A unstetig ist. Es ergeben sich drei Fälle. Falls
x ∈ (An \ An−1 )◦ ∩ M , dann gilt f (x) = 2−n und es gibt ein δ0 , so dass für alle δ
mit 0 < δ < δ0 und alle y mit d(x, y) < δ
y ∈ (An \ An−1 )◦
gibt. Hieraus folgt, dass es ein y mit d(x, y) < δ gibt, so dass
y ∈ (An \ An−1 )◦ ∩ M c
Für ein solches y gilt
y∈
/
∞
[
Bk
k=1
Falls y ∈ Bk gilt, so folgt wegen Bk ⊆ Ak \ Ak−1 , dass k = n. Aus y ∈ (An \ An−1 )◦ ∩
M c erhalten wir
y∈
/ (An \ An−1 ) \ (An \ An−1 )◦ und y ∈
/ (An \ An−1 )◦ ∩ M
7.6. UNSTETIGKEITSMENGEN VON FUNKTIONEN UND IHREN ABLEITUNGEN417
Damit gilt f (y) = 0. Damit ist f nicht in x stetig.
Wir nehmen nun an, dass x ∈ (An \ An−1 )◦ ∩ M c . Wie wir uns eben überlegt
haben, gilt dann f (x) = 0. Ebenso wie im ersten Fall finden wir ein δ0 , so dass für
alle δ mit 0 < δ < δ0 ein y mit d(x, y) < δ und mit
y ∈ (An \ An−1 )◦ ∩ M
existiert. Also gilt f (y) = 0. Dies widerspricht der Stetigkeit von f in x. Als dritten
zu betrachtenden Fall haben wir
x ∈ (An \ An−1 ) \ (An \ An−1 )◦
Damit haben wir f (x) = 2−n . Weil x kein innerer Punkt von An \ An−1 ist, gibt
es eine Folge von Punkten xk ∈ (An \ An−1 )c , k ∈ N, mit d(x, xk ) < k1 . Für alle
xk , k ∈ N, gilt entweder xk ∈ An−1 oder xk ∈ Acn . Damit gilt, dass xk ∈
/ Bn gilt.
Hieraus folgt sofort, dass für alle k ∈ N
f (xk ) = 0
oder
f (xk ) ≥ 2−(n−1)
oder
f (xk ) ≤ 2−(n+1)
Auch dies widerspricht der Stetigkeit von f in x.
Nun zeigen wir, dass f in allen x ∈
/ A stetig ist. Es gilt f (x) = 0. Es sei > 0
gegeben. Wir wählen N so gross, dass > 2−N gilt. Nun wählen wir δ so klein, dass
für alle A1 , . . . , AN
B(x, δ) ∩ An = ∅
gilt. Somit gilt für alle y mit d(x, y) < δ
y∈
/
N
[
An
n=1
Insbesondere gilt für alle y mit d(x, y) < δ
y∈
/
N
[
Bn
n=1
Deshalb gilt für alle y mit d(x, y) < δ, dass
f (y) ≤ 2−N −1
Damit folgt für alle y mit d(x, y) < δ
|f (x) − f (y)| ≤ 2−N −1 < 2
Beispiel 7.6.1 (i) Q ist eine Fσ -Menge.
(ii) R \ Q ist keine Fσ -Menge.
(iii) Jede Teilmenge von R, die nicht Lebesgue messbar ist, ist keine Fσ -Menge.
418
CHAPTER 7. INTEGRATION IM RN
Satz 7.6.2 (i) Es sei f : [a, b] → R eine differenzierbare Funktion. Dann ist die
Menge aller Punkte, in denen f 0 stetig ist, eine Gδ -Menge, die in [a, b] dicht liegt.
(ii) Zu jeder Gδ -Menge A, die in [a, b] dicht liegt, gibt es eine Funktion f :
[a, b] → R, für die die Menge, in denen f 0 stetig ist, gleich A ist.
Satz 7.6.3 (Bruckner, p. 228) (i) Es sei f : [a, b] → R eine stetige Funktion. Dann
ist die Menge der Punkte, in denen f differenzierbar ist, vo der Form A ∩ B, wobei
A eine Fσ -Menge ist und B eine Fσδ -Menge mit λ(B) = λ([a, b]) ist.
(ii) Umgekehrt lässt sich zu jeder solchen Menge eine entsprechende Funktion
finden.
7.6. UNSTETIGKEITSMENGEN VON FUNKTIONEN UND IHREN ABLEITUNGEN419
Notizen
Die Menge der invertierbaren Matrizen ist offen: Die Determinante ist eine
stetige Abbildung.
Der Limes Superior ist der grösste Häufungspunkt der Folge.
)=
Wo ist die Funktion f mit f (x) = 0 für x irrational und f ( m
n
m teilerfremd sind differenzierbar?
1
n
wobei n und
Konvergenzradius von
∞
X
tan(n)xn
n=1
bestimmen.
Der Konvergenzradius von
∞
X
1 n
x
sin n
n=1
ist 1.
1
m n
| sin n| = | sin(n − mπ)| ≥ |n − mπ| = | − π|
2
2 m
Da π irrational ist, gilt
n
1
| − π| ≥ k
m
m
n
Ausserdem gilt m ∼ π. Damit folgt
| sin n| ≥
1
nk−1
Bei der Einführung der metrischen Räume muss auch die Stetigkeit von Funktionen auf metrischen Räumen abgehandelt werden. U.a. dass eine stetige Funktion
auf einer kompakten Menge Minimum und Maximum annimmt.
Die Euklidische Norm muss schon bei den metrischen Räumen eingeführt werden.
Ausserdem müssen an dieser Stelle die kompakten Mengen vom Rn charakterisiert
werden.
Der Satz von Alexandoff-Hausdorff: Jeder kompakte metrische Raum ist das
stetige Bild der Cantor-Menge. siehe der Artikel von Benyamini im AMM.
Bei der Einführung der Gammafunktion weitere Eigenschaften herleiten, um die
Berechnung des n- dimensionalen Volumens der Kugel einfacher zu gestalten.
Der Satz von Tschebyscheff über die Primzahlverteilung kann bewiesen werden
,wenn man die Grössenordnung von 2n
bestimmt hat.
n
CHAPTER 7. INTEGRATION IM RN
420
Die Determinante der Matrix

α 1
 1 α

 ..
 .
0 ···
0
1
···
0
···
···
0
0
..
.
···
···
1
α





führt auf die Differenzengleichung [LeLe,p.98]
Dn = αDn−1 − Dn−2
Aufgabe oder Beipiel: Bestimme die Anzahl aller surjektiven Abbildungen zwischen einer Menge mit n Elemente und einer mit k Elementen:
n n−k
k k!
k
Es gibt genau
n n−k
k
k
Möglichkeiten eine Menge mit n Elementen in k Teilmengen aufzuteilen, so dass
jede Teilmenge mindestens ein Element enthält.
Michel Rolle wurde 1652 in der Auvergne geboren, er starb 1719. Er war Mitglied
der Académie des Sciences. Sein Hauptwerk Traité d’Algebre erschien 1690.
card(R)=card(R2 ), card(R)=card([0,1])
Berechne
R
xx dx, möglicherweise als Reihe.
Aufgabe: Man versucht aus Dominosteinen einen Brückenbogen zu bauen, der
sich selbst trägt. Man stapelt die Steine übereinander und verschiebt sie dann
seitlich, ohne dass der entstehende Bogen umfällt. Wie weit kommt man? Antwort:
proportional zum Logarithmus der Anzahl der Steine.
Im Abschnitt über die Formel von Stirling wird die Trapez-Regel benutzt und
bewiesen. Interessant ist auch die Simpson Regel: Das Integral weicht höchstens um
(b − a)5
max |f (iv) (x)|
2880n4 x
von
(f (a0 ) + 4f (x1 ) + 2f (a1 ) + · · · )
ab.
∆x
6
7.6. UNSTETIGKEITSMENGEN VON FUNKTIONEN UND IHREN ABLEITUNGEN421
Die Mittelpunktsregel ist auch interessant: Das Integral weicht höchstens um
(b − a)3
max |f (iv) (x)|
x
24n2
von
(f (x1 ) + · · · + f (xn ))∆x
ab. xi sind die Mittelpunkte der Teilintervalle.
Das Nadel Problem von Buffon.
(i) Ein Punkt (y, θ) wird zufallsartig in dem Rechteck [0, 1] × [0, π] gewählt. Bestimme die Wahrscheinlichkeit, dass y ≤ sin θ gilt.
(ii) Eine Nadel der Länge 1 wird auf eine Fläche fallen gelassen, auf die parallele
Linien gezeichnet sind, die jeweils den Abstand 1 voneinander haben. Es sei P der
niedrigere der beiden Endpunkte von der Nadel, y sei der Abstand von P zur der
Linie, die oberhalb von P liegt und θ sei der Winkel, den die Nadel mit einer Linie
hat, die parallel zu den gegebenen Linien ist und die durch P läuft. Zeige, dass die
Wahrscheinlichkeit, dass die Nadel eine Linie trifft, gleich der von (i) ist.
Z π
sin θdθ = 2
0
Also ist die Wahrscheinlichkeit gleich 2/π.
Vermutlich ist es besser die e-Funktion durch Potenzreiehen einzuführen.
Berechne den Erwartungswert vom Abstand eines zufällig in einem Kreis mit
Radius 1 gewählten Punktes vom Kreismittelpunkt. Die Verteilungsfunktion ist
F (x) = P(0 ≤ X ≤ x) =
πx2
= x2
π
Damit ergibt sich für die Wahrscheinlichkeitsdichte
f (x) = F 0 (x) = 2x
und
Z
E(X) =
0
1
2x2 dx =
2
3
Der triaxiale Tritorus ist
x = sin u(1 + cos v)
2π
y = sin(u +
)(1 + cos(v +
3
4π
)(1 + cos(v +
z = sin(u +
3
2π
))
3
4π
))
3
wobei −π ≤ u ≤ π und −π ≤ v ≤ π. (http://astronomy.swin.edu.au/pbourke/geometry/)
CHAPTER 7. INTEGRATION IM RN
422
Beispiel 7.6.2 Die Folge
{(cos n, sin n)|n ∈ N}
liegt dicht in {(x, y)|x2 + y 2 = 1}.
Bibliography
[1] A. Alexander, Infinitesimal, Farrar, Straus und Giroux, New York, 2014.
[2] J. Anderson, Iterated Exponentials, American Mathematical Monthly 111
(2004), 668–679
[3] T.M. Apostol, Irrationality of the square root of two- a geometric proof,
American Mathematical Monthly 107 (2000), 841-842.
[4] A. Baker, A Concise Introduction to the Theory of Numbers, Cambridge
University Press, Cambridge, 1984.
[5] A. Baker, Transcendental Number Theory, Cambridge University Press,
Cambridge, 1975.
[6] D. Benko, The Basel Problem as a teleskoping series , The College Mathematics Journal 43 (2012), 244-250.
[7] M.A. Bennett, Positive rational solutions to xy = y mx , American Mathematical Monthly 111(2004), 48-50
[8] M. Bense, Einführung in die informationstheoretische Ästhetik, Rowohlt,
Hamburg, 1969
[9] Y. Benyamini, Applications of the universal surjectivity of the Cantor set,
American Mathematical Monthly 1998 (105), 832-839
[10] L. Berggren, J. Borwein und P. Borwein, Pi: A Source Book,
Springer-Verlag, New York 1997
[11] G.N. Berman, Aufgabensammlung zur Analysis, B.G. Teubner Verlagsgesellschaft, Leipzig 1981
[12] Á. Besenyei, Peano’s unnoticed proof of Borel’s theorem, American Mathematical Monthly 121 (2014), 69–72.
[13] P. Billingsley, Van der Waerden’s continuous nowhere differentiable function, American Mathematical Monthly 1982 (89), 691
[14] G.G. Bilodeau, The origin and early development of non-analytic infinitely
differentiable functions, Arch. Hist. Exact Sci. 27 (1982), 115-135.
423
424
BIBLIOGRAPHY
[15] T. Bröcker, Analysis I,II, Spektrum Akademischer Verlag Heidelberg 1995.
[16] A. Browder, Mathematical Analysis, Springer-Verlag, New York 1996.
[17] A.M. Bruckner, Differentiation of Real Functions, Lecture Notes in Mathematics 659, Springer-Verlag 1978
[18] A.M. Bruckner und J. Leonard, Derivatives, American Mathematical
Monthly 1966 (73), 24-56
[19] F.S. Cater, On Van der Waerden’s nowhere differentiable function, American Mathematical Monthly, 91,1984, 307-308
[20] R. Chapman, Evaluating ζ(2),
[21] Wai-Kai Chen, Passive and Active Filters
P
1
[22] B.R. Choe, An elementary proof of ∞
n=1 n2 =
Monthly 94 1987, 662-663
π2
,
6
American Mathematical
[23] K. Ciesielski, Set Theory for the Working Mathematician, London Mathematical Society, Student Texts 39, Cambridge University Press 1997
[24] H. Cohn, A short proof of the simple continued fraction expansion of e,
[25] D. van Dalen, Mystic, Geometer and Intuitionist: The Life of L.E.J.
Brouwer
P 1
2
= π6
[26] D. Daners, A short proof of
k2
[27] J. Dieudonné, Grundzüge der modernen Analysis 1-8, Vieweg und Sohn,
Braunschweig, 1985
[28] K. Devlin, The Joy of Sets, Springer-Verlag, 1979
[29] J. Douchet und B. Zwahlen, Calcul différentiel et intégral 3, Fonctions
réelles d’une variable rélle, Exercices résolus, Presses polytechniques romandes, Lausanne, 1987
[30] W. Dunham, Euler-The Master of Us All, Dolciani Mathematical Expositions, No. 22, Mathematical Association of America, Washington, 1999
[31] W. Dunham, The Calculus Gallery - Masterpieces from Newton to Lebesgue,
Princeton University Press, Princeton and Oxford, 2005.
[32] M. Eckert, Euler and the fountains of Sanssouci, Arch. Hist. Exact Sci. 56
(2002), 451–468.
[33] G.A. Edgar, Measure, Topology, and Fractal Geometry, Springer-Verlag,
New York, 1990
BIBLIOGRAPHY
425
[34] K. Endl und W. Luh, Analysis I,II, Akademische Verlagsgesellschaft,
Wiesbaden, 1977
[35] B. Enquist und Wilfried Schmidt, Mathematics Unlimited: 2001 and
Beyond
[36] F. Erwe, Differential- und Integralrechnung I,II, Bibliographisches Institut,
Mannheim, Zürich 1962
[37] L. Euler, De summis serierum reciprocarum, Comm. Acad. sci. Petrop. 7
(1734/35) 1740, 123-134, Nachdruck in Opera Omnia, Ser. I v. 14, 73-86.
[38] P. Eymard und Jean-Pierre Lafon, Autour du nombre π, Actualités
scientifiques et industrielles 1443, Hermann, Paris 1999
[39] L. Feigenbaum , Happy tercentenary, Brook Taylor!, Mathematical Intelligencer 8 (1986), 53
[40] O. Forster, Analysis 1,2, Vieweg, Braunschweig/Wiesbaden 1983
[41] O. Forster, Analysis 3, Integralrechnung im Rn mit Anwendungen, Vieweg
Braunschweig/Wiesbaden 1984
[42] O. Forster und R. Wessoly, Übungsbuch zur Analysis 1, Aufgaben und
Lösungen, Vieweg, Braunschweig, Wiesbaden 1995
[43] O. Forster und T. Szymczak, Übungsbuch zur Analysis 2, Aufgaben und
Lösungen, Vieweg, Braunschweig, Wiesbaden 1995.
[44] A.M. Gleason, Fundamentals of Abstract Analysis, Jones and Bartlett
Publishers, Boston 1991.
[45] S. Goldberg, Introduction to Difference Equations, Dover 1986.
[46] J.R. Goldman, The Queen of Mathematics, A historically motivated guide
to number theory, A.K. Peters, Wellesley, Massachusetts 1998
[47] P.R. Halmos, Naive Set Theory, Springer-Verlag, 1974.
[48] I. Halperin, Sums of a series, permitting rearrangements, C. R. Math. Rep.
Acad. Sci. Canada 8 (1986), 87–102.
[49] G.H. Hardy, Weierstrass’s non-differentiable function, Transactions of the
American Mathematical Society 17 (1916), 301-325.
[50] J.D. Harper, Another simple proof of 1 +
Mathematical Monthly 110 (2003), 540–541.
1
22
+
1
32
+ ··· =
π2
,
6
American
[51] A. Herschfeld, On infinite radicals, American Mathematical Monthly 42
(1935), 419-429
426
BIBLIOGRAPHY
[52] H. Heuser, Lehrbuch der Analysis, Teil 1 und Teil 2, B.G. Teubner,
Stuttgart 1990
[53] M.D. Hirschhorn, A simple proof that ζ(2) =
telligencer 33 (2011), 81-82.
π2
,
6
The Mathematical In-
[54] E.W. Hobson, The Theory of Functions of a Real Variable, Dover 1957 2
New York
[55] L. Hörmander, An Introduction to Complex Analysis in Several Variables,
North-Holland, New York, 1990
2
[56] J. Hofbauer, A simple proof of 1 + 212 + 312 + · · · = π6 and related identities,
American Mathematical Monthly 109 (2002), 196–200
[57] A. Jones, S.A. Morris und K.R. Pearson, Abstract Algebra and Famous Impossibilities, Springer-Verlag, New York 1991
[58] D.J. Jones, Continued powers and a sufficient condition for their convergence, Mathematical Magazine 68 (1995), 387-392
[59] W.J. Kaczor und M.T. Nowak, Problems in Mathematical Analysis I,
Student Mathematical Library 4, American Mathematical Society 2000
[60] D. Kalman, Six ways to sum a series, College Math. J. 24 (1993), 402-421
[61] R. Kannan und C.K. Krueger, Advanced Analysis on the Real Line,
Springer-Verlag New York 1996
[62] S.S. Kim und K.H. Kwon, Smooth C ∞ but nowhere analytic functions,
American Mathematical Monthly 107 (2000), 264-266
[63] T. Körner, Bulletin of the London Mathematical Society 23 (1991), 557562.
[64] T. Körner, Butterfly hunting and the symmetry of mixed partial derivatives,
American Mathematical Monthly 105 (1998), 756–758.
[65] E. Landau Grundlagen der Analysis, Akademische Verlagsgesellschaft,
Leipzig, 1930.
[66] S. Lang, Analysis II, Addison-Wesley 1969.
[67] W.G.Leavitt, The sum of the reciprocals of the primes, Two-Year College
Mathematics Journal 10 (1979), 198-199.
[68] J.-P. Lecoutre und P. Pilibossian, Analyse I,II, Exercices corrigés avec
rappels de cours, Masson, Paris, Mailand, Barcelona 1994.
[69] J. Lelong-Ferrand, Exercices résolus d’analyse, Dunod Université 1977
BIBLIOGRAPHY
427
[70] H. Levy und F. Lessmann, Finite Difference Equations, Dover, New York
1992
[71] E.H. Lieb und M. Loss, Analysis, Graduate Studies in Mathematics 14,
American Mathematical Society Providence, Rhode Island 1997
[72] L.H. Loomis und S. Sternberg, Advanced Calculus, Revised Edition,
Jones and Bartlett Publishers, Boston, London 1990
[73] M. Lynch, A continuous nowhere differentiable function, American Mathematical Monthly 99 (1992), 8-9.
[74] C.D. Lynd, Using difference equations to generalize results for periodic
nested radicals, American Mathematical Monthly 212 (2014), 45–59.
[75] B. Mandelbrot, The Fractal Geometry of Nature, W.H. Freeman and
Company 1982.
[76] E. Maor, The Pythagorean Theorem, Princton University Press 2007.
[77] J.E. Marsden und M.J. Hoffman, Elementary Classical Analysis, W.H.
Freeman and Company, New York 1974
[78] T. Marshall, A short proof of ζ(2) =
117 (2010), 352–353
[79] H. Meschkowski,
Mannheim
Unendliche
π2
,
6
American Mathematical Monthly
Reihen,
Bibliographisches
Institut
[80] J.M. Monier, Analyse, Tome 1, 800 exercises résolus et 18 sujets d’étude,
Dunod Université, Paris, 1990
[81] J.M. Monier, Analyse, Tome 2, 600 exercises résolus et 21 sujets d’étude,
Dunod Université Paris, 1990.
[82] I. Niven, A simple proof that π is irrational, Bulletin of the American Mathematical Society 53 (1947), 509.
[83] J.E. Nymann, The sum of the Cantor set with itself, L’Enseignement
Mathématique 39 (1993), 177-178
[84] C.D. Olds, Continued Fractions, Random House 1963.
[85] C.D. Olds, The simple continued fraction expansion of e, American Mathematical Monthly 77 (1970), 968-974.
[86] J.C. Oxtoby, Mass und Integral, Hochschultext, Springer-Verlag Berlin
1971.
[87] M. Pavone, The Cantor set and a geometric construction, L’Enseignement
Mathématique 35 (1989), 41-49.
428
BIBLIOGRAPHY
[88] O. Perron, Die Lehre von den Kettenbrüchen I,II, B.G. Teubner Verlagsgesellschaft, Stuttgart 1954.
[89] J.-P. Pier, Development of Mathematics 1950-2000, Birkhäuser
[90] G. Piranian, The set of nondifferentiability of a continuous function, American Mathematical Monthly 73 (1966), 57–66.
[91] A.S. Posamentier, The Pythagorean Theorem, Prometheus Books,
Amherst, 2010.
2
[92] D. Ritelli, Another proof of ζ(2) = π6 using double integrals, American
Mathematical Monthly 120 (2013), 642–645
[93] A.M. Rockett und P. Szüsz, Continued Fractions, World Scientific Publishing Company, 1992.
[94] A. Rosenthal, On functions with infinitely many derivatives, Proceedings
of the American Mathematical Society 4 (1953), 600-602.
[95] H. Sagan, An elementary proof that Schoenberg’s space-filling function is
nowhere differentiable, Mathematical Magazine 65 (1992), 125-128.
[96] C.E. Sandifer, Euler’s solution of the Basel problem - the longer story,
Euler at 300, MAA Spectrum, Mathematical Association of America, Washington, 2007, 105–117.
[97] A. Shidear, On the continuity of Van der Waerden’s function in the Hölder
sense, American Mathematical Monthly 93 (1986), 375-376.
[98] D. Singh, The infinitude of primes, American Mathematical Monthly
111(2004), 863
[99] W.S. Sizer, Continued roots, Mathematical Magazine 59 (1986), 23-27.
[100] W.I. Smirnow, Lehrgang der höheren Mathematik I,II, VEB Deutscher Verlag der Wissenschaften, Berlin 1972.
[101] J. Sondow, Double integrals for Euler’s constant and ln π4 and an analog of
Hadjicostas’s formula, American Mathematical Monthly 112 (2005), 61–65.
[102] S.B. Stechkin, A simple proof of Chebyshev’s prime number theorem, Uspekhi Mat. Nauk 23 (1968), 221-222.
[103] R.R. Stoll, Theory and Logic, Dover, New York 1979.
[104] A. Stubhang, Niels Henrik Abel, Springer-Verlag
[105] P. Suppes, Axiomatic Set Theory, Dover, New York, 1972
BIBLIOGRAPHY
429
[106] Tenenbaum und M. Mendés France, The Prime Numbers and their
Distribution, American Mathematical Society, 2000.
[107] J. Thim, Continuous nowhere differentiable functions, Master Thesis, Lulea
University of Technology, 2003.
[108] H.A. Thurston, The Number System, Dover Publications, New York, 2007.
[109] F. Toenniessen, Das Geheimnis der transzendenten Zahlen, SpringerVerlag, 2010.
[110] F. G. Tricomi, Elliptische Funktionen, Akademische Verlagsgesellschaft,
Leipzig, 1948.
[111] H. Tsumura, An elementary proof of Euler’s formula for ζ(2m), American
Mathematical Monthly 111 (2004), 430-431
[112] S. Ungar, The Koch curve: a geometric proof, American Mathematical
Monthly, 114 (2007), 61–66
[113] W. Walter, Analysis I,II, Springer-Verlag, Berlin, 1985, 1990.
[114] K. Weierstrass, Mathematische Werke, Band 2, Berlin, 1895.
[115] L. Wen, A nowhere differentiable continuous function, American Mathematical Monthly 107 (2000), 450-453
[116] G.T. Williams, A new method of evaluating ζ(2n), American Mathematical
Monthly 60 (1953), 19-25
[117] D. Zagier, Die ersten 50 Millionen Primzahlen, Mathematical Intelligencer
0 (1977)
Index
π, 194, 197, 302
e, 74, 75, 81, 180
überabzählbar, 44, 46
Euklidische Norm, 227
Euler-Mascheroni Konstante, 172
Exponentialfunktion, 153, 180
abgeschlossen, 220
Ableitung, 332
abzählbar, 46
algebraische Zahl, 312
analytische Funktion, 308
arithmetisch-geometrisches Mittel, 325
Auswahlaxiom, 22, 25
Axiomensystem von Cantor, 20
Axiomensystem von Peano, 27
Axiomensystem von Zermelo-Fraenkel, 21
Fibonacci Zahlen, 84
Folge, 61
Folge, konvergent, 61
Folge, monoton wachsend, 68
folgenstetig, 132
Fréchet differenzierbar, 389
Funktion, 24
Funktion, differenzierbar, 157
Funktion, konvex, 141, 342
Funktion, Riemann integrierbar, unstetig
in allen rationalen Punkten, 243
Funktion, stetig, 129
Funktion, stetig in irrationalen Punkten,
unstetig in rationalen Punkten,
139
Funktion, stetig, nicht differenzierbar, 160
Funktion, stetig, nirgendwo differenzierbar, 213
Funktion, trigonometrisch, 194
Funktion, unendlich oft differenzierbar,
nirgends analytisch, 308
Funktionalmatrix, 344
Betafunktion, 276
bijektiv, 24
Binomialkoeffizient, 40, 180
Binomische Formel, 40
Bogenlänge, 352
bogenzusammenhängend, 321
Cauchy Folge, 64
Cauchy Produkt von Reihen, 104
Cauchy-Hadamard, Formel von, 186
Cosinus, 194
Cotangens, 198
De Morgan, Formel von, 20
Dedekind Schnitt, 52
Dedekind vollständig, 59
Dezimalbruchdarstellung, 113
Differential, 331
Differenzengleichungen, 81
differenzierbar, 331
differenzierbar, linksseitig, 165
differenzierbar, rechtsseitig, 165
Dirichletfunktion, 130
elliptisches Integral, 353
Gammafunktion, 274
gleichmäßig stetig, 142
gleichmäßige Konverenz, 208
goldene Spirale, 354
Goldener Schnitt, 84
Grenzwertsatz von Abel, 192
Häufungspunkt, 220
Häufungswert, 87
Halbordnung, 24
Hauptsatz der Differential- und Integralrechnung, 266
430
INDEX
Hausdorffs Maximum Prinzip, 25
Hesse Matrix, 340
implizite Funktionen, 380
Induktion, 37
Infimum, 36
injektiv, 24
Integralkriterium für Reihen, 290
Intervallschachtelung, 72
Jacobi Matrix, 344
Körper, 32
Körper, Archimedisch, 36
Körper, geordnet, 34
Kardinalität, 43
Kettenbruch, 121
Kettenregel, 163, 345
kompakt, 224
Kontinuumshypothese, 47
Konvergenzradius, 186
kritischer Punkt, 357
Kurvenlänge vom Graphen, 277
L’Hôpital, Formel von, 200
Lagrange Multiplikatoren, 386
Leibniz Kriterium, 98
Lemniskate, 356
Limes Inferior, 88
Limes Superior, 88
linksseitig stetig, 133
Logarithmus, 153
Mächtigkeit, 43
Majorantenkriterium, 101
Mathematische Induktion, 37
Matrix, positiv definit, 358
Metrik, 219
Mittelwertsatz, 169
Mittelwertsatz der Integralrechnung, 271
Mittelwertsatz im Rn , 347
natürliche Zahlen, 26
Norm, 226
Obersumme, 240
offen, 220
431
offene Überdeckung, 224
offener Kern, 220
Ordnung, 24
p-adische Entwicklung, 113
partielle Ableitung, 330
partielle Integration, 270
Partition, 240
Polarkoordinaten, 353, 377
polygonzusammenhängend, 321
Potenzmenge, 45
Potenzreihen, 183
Primzahl, 29, 108
Primzahlsatz, 174
Primzahlzerlegung, 30
Produkt von Wallis, 287
Produktregel des Differenzierens, 162
Quotientenkriterium, 102
Quotientenregel des Differenzierens, 162
Raabe Kriterium, 103
rationale Zahlen, 31
Raum, metrisch, 219
Raum, normierter, 226
rechtsseitig stetig, 133
Regentropfen Funktion, 243
Reihe, absolut konvergent, 100
Reihe, geometrische, 93
Reihe, harmonische, 95
Reihe, unbedingt konvergent, 109
Restglied, Cauchy Form, 178
Restglied, Lagrange Form, 178
Richtungsableitung, 329
Riemann integrierbar, 242
Sattelpunkt, 357
Satz über implizite Funktionen, 381
Satz von Bolzano-Weierstraß, 73, 225
Satz von Rolle, 168
Satz von Schröder-Bernstein, 43
Satz von Taylor, 178, 350
Sinus, 194
Stammfunktion, 265
Stirling, Formel von, 295
Supremum, 36
432
surjektiv, 24
Takagifunktion, 213
Tangens, 198
Taylorreihe, 180
Teilfolge, 69
Thomae Funktion, 243
total , 225
transzendente Zahl, 312
Umkehrabbildung, 374
Umkehrfunktion, 144
Umordnungsatz von Riemann, 109
uneigentliche Integrale, 272
unendlich oft differenzierbare, nirgends analytische Funktion, 308
Untersumme, 240
Verdichtungskriterium von Cauchy, 94
Verfeinerung einer Partition, 240
Vieta, Formel von, 289
vollständig, 71
Weierstraßfunktion, 285
Wohlordnung, 25
Wurzelkriterium, 185
Zetafunktion, 239, 310
Zorns Lemma, 25
zusammenhängend, 321
Zwischenwertsatz, 137
INDEX
Herunterladen