Analysis 1 - math.uni

Werbung
Analysis 1
Vorlesungsskript
Wintersemester 2013/14
Bernd Schmidt∗
Version vom 29. Juli 2014
∗
Institut für Mathematik, Universität Augsburg, Universitätsstr. 14, 86135 Augsburg, [email protected]
1
Inhaltsverzeichnis
Inhaltsverzeichnis
2
1 Einleitung
4
2 Allgemeine Grundlagen
2.1 Aussagen und Beweise . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Mengen und Abbildungen . . . . . . . . . . . . . . . . . . . . . .
2.3 Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . .
6
6
14
21
3 Reelle und komplexe Zahlen
3.1 Die Körperaxiome . . . . . . . .
3.2 Die Anordnungsaxiome . . . . .
3.3 Zum Aufbau des Zahlensystems
3.4 Das Vollständigkeitsaxiom . . .
3.5 Die komplexen Zahlen . . . . .
.
.
.
.
.
28
28
34
39
42
48
.
.
.
.
.
.
54
54
60
64
66
75
77
.
.
.
.
.
83
83
88
91
95
98
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Folgen und Reihen
4.1 Folgen und Grenzwerte . . . . . . . . . . .
4.2 Reelle Folgen und Monotonie . . . . . . .
4.3 Konsequenzen der Vollständigkeit . . . . .
4.4 Reihen . . . . . . . . . . . . . . . . . . . .
4.5 Zur Darstellung der reellen Zahlen . . . . .
4.6 Potenzreihen und die Exponentialfunktion
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Stetige Funktionen
5.1 Definition und grundlegende Eigenschaften . .
5.2 Stetige Funktionen auf kompakten Intervallen
5.3 Monotonie und Umkehrfunktionen . . . . . . .
5.4 Asympotisches Verhalten . . . . . . . . . . . .
5.5 Trigonometrische Funktionen . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Differentiation
105
6.1 Definition, Beispiele und Grundlagen . . . . . . . . . . . . . . . . 106
6.2 Der Mittelwertsatz und seine Konsequenzen . . . . . . . . . . . . 113
2
6.3
Monotonie, Extrema und Konvexität . . . . . . . . . . . . . . . . 118
7 Das Integral
126
7.1 Definition des Integrals . . . . . . . . . . . . . . . . . . . . . . . . 126
Literaturverzeichnis
138
3
Kapitel 1
Einleitung
Es ist nicht möglich, in einer allgemeingültigen Definition zusammenfassen, was
‘die Mathematik’ für eine Wissenschaft sei. Ausgehend von Untersuchungen der
Eigenschaften von Zahlen und geometrischen Figuren, zu denen schon in der
Antike bedeutende Beiträge geleistet wurden, hat sie sich mittlerweile zu einem
riesigen theoretischen Gebäude aufgebaut, in viele einzelne Gebiete aufgegliedert,
und doch wieder Verbindungen zwischen entfernt scheinenden Bereichen aufgezeigt, so dass man nur sehr schwer einen Überblick gewinnen kann. Immer aber
geht es darum, Probleme zu lösen, theoretische Fragen durch logisches Schließen
absolut zweifelsfrei beantworten zu können. Die Herausforderung und Neugier an
ungelösten Fragestellungen waren seit jeher eine der wesentlichen Antriebsfedern
zur Beschäftigung und dadurch auch zur Weiterentwicklung der Mathematik.
Man denke nur an die Quadratur des Kreises – ein antikes Problem, das doch
erst nach Jahrtausenden gelöst werden konnte. Um derartige Fragen beantworten zu können, wurden eigene mathematische Theorien geschaffen, indem eine
Vielzahl neuer mathematischer Konstrukte definiert und deren Beziehungen untereinander untersucht wurden. Wie in anderen Wissenschaften, wirft jedoch eine
gelöste Frage oft gleich eine Vielzahl weiterer interessanter Fragestellungen auf.
In den allermeisten Fällen muss man dabei schon ein Experte sein, um überhaupt
vestehen zu können, was diese Fragen denn eigentlich sind. Doch obwohl sich die
Mathematik damit innermathematisch immer weiter fortentwickelt und sich in
immer abstrakteren Gedankengebilden zu verlieren scheint, kann sie erstaunliche Erfolge in den Anwendungen auf die verschiedensten außermathematischen
Wissenschaften vorweisen: von den Naturwissenschaften und der Physik im Besonderen bis zu den Wirtschafts- und Sozialwissenschaften.
Die angedeutete Schaffung einer mathematischen Theorie spiegelt sich auch
im Aufbau dieser Vorlesung – wie in den meisten Lehrbüchern zur Mathematik
– wieder. Überspitzt ausgedrückt folgt der Aufbau dem Schema
Definition – Satz – Beweis.
In den Definitionen werden die Begriffe, also die mathematischen Konstrukte
4
einer Theorie festgelegt. Ein Satz (auch Lehrsatz oder Theorem) macht dann eine Aussage über die Eigenschaften dieser Konstrukte und die Beziehungen der
Begriffe untereinander. Schließlich muss die Gültigkeit dieses Satzes durch einen
absolut zwingenden logischen Schluss begründet werde. Natürlich werden wir diesem etwas blutleeren Aufbau durch motivierende Worte etwas Farbe geben, die
erklären sollen, warum es interessant ist, gerade diesen oder jenen Begriff näher zu
untersuchen. Man darf sich durch diesen in Lehrbüchern üblichen Aufbau nicht
bei der eigenen mathematischen Arbeit am Problemlösen verunsichern lassen.
Das, was hier in der Vorlesung Analysis 1 vorgestellt wird, ist über viele Jahrhunderte auch in der Effizienz der Darstellung gereift. Beim eigenen Arbeiten an
den Hausaufgaben werden Sie merken, dass die ersten Wege zur Lösung meistens
nicht geradlinig verlaufen.
In der Vorlesung Analysis 1 nun geht es im Wesentlichen um die Differentialund Integralrechnung einer reellen Veränderlichen. Wir untersuchen also Eigenschaften von Funktionen, die einer reellen Zahl wieder eine reelle Zahl zuordnen.
Vorkenntnisse: sind (fast) keine nötig. Abitur ist mehr als genug.
Literatur: Es gibt viele gute Lehrbücher zur Analysis 1. Sehr empfehlenswert
sind die Analysisbücher [Fo] von Forster und [Kö] von Königsberger, deren Aufbau
auch dieser Vorlesung zugrunde liegt. Des Weiteren sei hier insbesondere auf die
Bücher [Br] von Bröcker, [He] von Heuser (sehr ausführlich), [Hi] von Hildebrandt
und [La] von Lang (auf Englisch) verwiesen.
Fehler: Bitte teilen Sie mir evtl. Tipp- oder auch andere Fehler in diesem Skript
per E-Mail mit.
Vielen Dank an alle, die mich auf Fehler in früheren Versionen dieses Skripts
aufmerksam gemacht haben, insbesondere an Herrn Gassner, Frau Maucher und
Herrn von Seelstrang.
5
Kapitel 2
Allgemeine Grundlagen
Wir beginnen damit, einige wichtige Grundlagen zusammenzustellen, die die Basis nicht nur der Analysis sind. Die eigentliche Analysis beginnt dann im Kapitel
3, wenn wir die reellen Zahlen axiomatisch einführen. Schon jetzt werden wir
allerdings in etlichen Beispielen Zahlen verwenden (natürliche, ganze, rationale
wie auch reelle), die Sie ja aus der Schule kennen.
2.1
Aussagen und Beweise
Ein mathematischer Sachverhalt wird durch eine mathematische Aussage formuliert. Dies ist ein Satz, der entweder zutrifft oder nicht und dem man entsprechend
den Wahrheitswert ‘wahr’ (w) oder ‘falsch’ (f) zuordnet. Eine Aussage kann jedoch nicht sowohl wahr als auch falsch sein.
Beispiele: Diese Sätze sind Aussagen:
• Der Lech fließt in die Donau. (w)
• Die Donau mündet in die Nordsee. (f)
• Eine gerade Quadratzahl ist durch 4 teilbar. (w)
√
• 2 ist rational. (f)
Die folgenden Sätze sind keine Aussagen:
• Hol mir mal ’ne Flasche Bier!
• Wie geht es dir?
• Dieser Satz ist falsch.
In der Mathematik geht es nun darum, (möglichst interessante) mathematische Aussagen zu treffen und mathematisch zu beweisen, dass diese wahr sind. Beweisen bedeutet hierbei, dass die fragliche Aussage durch mathematisch zulässige
6
Schlüsse aus anderen wahren Aussagen hergeleitet wird. Die wesentliche Arbeit
der Mathematiker besteht also darin, Folgerungen zu ziehen. Da man damit offensichtlich irgendwo beginnen muss, ist es nötig, einige (möglichst wenige und
möglichst grundlegende) Aussagen als wahr zu postulieren. Dies sind die sogenannten Axiome einer mathematischen Theorie. Sind die einmal festgelegt, beginnt die eigentliche Arbeit des Aufdeckens von Zusammenhängen, Formulierens
von Vermutungen und Aufsuchens eines mathematischen Beweises.
Auch die Suche nach geeigneten Axiomensystemen, also der Auswahl der
grundlegenden als wahr postulierten Aussagen, kann ein interessantes mathematisches Problem darstellen. Ein solches System sollte in sich widerspruchsfrei
sein, andererseits aber zu einer reichhaltigen Theorie, also vielen beweisbaren
Aussagen führen. Dabei hat – zumindest im Prinzip – jede Mathematikerin die
Freiheit, ihr eigenes Axiomensystem festzulegen. Tatsächlich haben sich in der
Mathematik jedoch gewisse allgemeinverbindliche Axiome durchgesetzt, die von
den meisten Mathematikern akzeptiert sind. Es gibt jedoch auch Axiome, wie
z.B. das Auswahlaxiom der Mengenlehre, die von einigen Mathematikern gemieden werden. Beide Sichtweisen haben ihre Berechtigung. Ein Leitgedanke bei der
Aufsuchung eines geeigneten Axiomensystems sollte es jedoch sein, zentrale Objekte der Mathematik, durch die sich auch Modelle in den Anwendungen etwa in
den Natur- oder Wirtschaftswissenschaften untersuchen lassen, einer mathematischen Analyse zugänglich zu machen. Hierbei kann es durchaus vorkommen, dass
es sinvoll ist, konkurrierende und miteinander nicht vereinbare Axiomensysteme
zu studieren. So gibt es in der ebenen Geometrie z.B. das Parallelenaxiom, das
von den übrigen Axiomen Euklids1 unabhängig ist. Es besagt, dass es ‘zu jeder
Geraden und jedem Punkt, der nicht auf dieser Geraden liegt, genau eine zu der
gegebenen Geraden parallele Gerade durch diesen Punkt gibt’. Alternativ lässt
sich das Gegenteil dieser Aussage als wahr postulieren, was zur Nichteuklidischen
Geometrie führt. Alle Sätze, die wir in der Mathematik als wahr erkennen, sind
also eigentlich nur wahr relativ zu einem ausgewählten Axiomensystem.
Kehren wir zurück zu unser Hauptaufgabe, mathematische Sätze zu formulieren und zu beweisen. Ein mathematischer Satz enthält Voraussetzungen und
Behauptungen. Er ist wahr, wenn im Falle, dass die Voraussetzungen wahr sind,
auch die Behauptungen wahr sind.
Beispiel: Ist n eine gerade Quadratzahl, so ist n
| durch{z4 teilbar}.
{z
}
|
= Behauptung
=Voraussetzung
Durch logisches Schließen können wir diesen Satz beweisen:
Beweis. 1. Ist n eine Quadratzahl, so gibt es eine natürliche Zahl m mit n = m2 .
2. Da n gerade ist, muss auch m gerade sein. Denn für m ungerade, ist auch
m2 = m · m ungerade. Wir können also m = 2k für eine natürliche Zahl k
schreiben.
1
aus Euklids Elementen
7
3. Dann aber ist n = m2 = (2k)2 = 4k 2 , was zeigt, dass n tatsächlich durch 4
teilbar ist.
(Die Box bezeichnet immer das Ende eines Beweises.)
Verknüpfungen von Aussagen
Mathematische Aussagen können – wie wir eben schon am Beispiel dieses Satzes
gesehen haben – verknüpft werden, wodurch eine neue Aussage entsteht. Die
wichtigsten Verknüpfungen sind die Folgenden. Hierbei stehen A und B jeweils
für eine Aussage und die Wahrheitstafel gibt an, unter welchen Wahrheitswerten
für A bzw. B die Verknüpfung wahr oder falsch ist:
1. Die Negation ¬: ¬A, gesprochen ‘Nicht-A’ oder ‘Non-A’.
A ¬A
w
f
f
w
Das heißt: Ist A wahr, so ist ¬A falsch.
Ist A falsch, so ist ¬A wahr.
2. Die Konjunktion ∧: A ∧ B, gesprochen ‘A und B’ oder ‘sowohl A als auch
B’.
A
w
w
f
f
B
w
f
w
f
A∧B
w
f
f
f
Das heißt: A ∧ B ist wahr, wenn sowohl
A als auch B wahr sind. In allen anderen Fällen ist A ∧ B falsch.
3. Die (nicht ausschließende) Disjunktion oder Adjunktion ∨: A ∨ B, gesprochen ‘A oder B’.
A
w
w
f
f
B
w
f
w
f
A∨B
w
w
w
f
Das heißt: A∨B ist wahr, wenn (mindestens) eine der Aussagen A oder B (ggf.
sogar beide) wahr sind. Nur wenn A
und B beide falsch sind, ist auch A ∨ B
falsch.
4. Die Implikation ⇒: A ⇒ B, gesprochen ‘A impliziert B’ oder ‘Aus A folgt
B’ oder ‘Wenn A dann B’ oder ‘B ist eine Konsequenz von A’.
A B
w w
w f
f w
f f
A⇒B
w
f
w
w
Aus einer wahren Aussage kann wahrheitsgemäß nur eine wahre Aussage folgen. Ist jedoch A falsch, so ist die Implikation A ⇒ B
wahr unabhängig vom Wahrheitswert von B.
(‘Ex falso quodlibet.’)
8
Gilt A ⇒ B, d.h. ist A ⇒ B eine wahre Aussage, so nennt man A eine
hinreichende Bedingung für B und B eine notwendige Bedingung für A.
Denn die Wahrheit von A ist ein hinreichender Grund für die Wahrheit von
B und umgekehrt muss B wahr sein, damit auch A wahr sein kann.
5. Die Äquivalenz ⇔: A ⇔ B, gesprochen ‘A ist äquivalent zu B’ oder ‘Genau
dann B wenn A’.
A
w
w
f
f
B
w
f
w
f
A⇔B
w
f
f
w
Die Äquivalenz A ⇔ B ist also wahr,
wenn A und B die gleichen Wahrheitswerte besitzen, und anderenfalls falsch.
Tautologien und Beweisprinzipien
Es gelten die folgenden wichtigen logischen Tautologien, also Aussagen, die unabhängig vom Wahrheitswert der beteiligten Aussagen A, B, C immer wahr sind:
Doppelte Verneinung: ¬(¬A) ⇔ A.
Beweis. Mit Wahrheitstafel:
A ¬A ¬(¬A) ¬(¬A) ⇔ A
w
f
w
w
f
w
f
w
De Morgansche Regeln: Diese beiden Tautologien sind
¬(A ∧ B) ⇔ (¬A ∨ ¬B) und ¬(A ∨ B) ⇔ ¬A ∧ ¬B.
Beweis. Wir beweisen nur die erste Regel – wieder mit einer Wahrheitstafel. Der
Beweis der zweiten Regel verläuft analog. (Überlegen Sie sich das!)
A B A ∧ B ¬(A ∧ B) ¬A ¬B ¬A ∨ ¬B ¬(A∧B) ⇔ (¬A∨¬B)
w w
w
f
f
f
f
w
w f
f
w
f
w
w
w
f w
f
w
w
f
w
w
f f
f
w
w
w
w
w
Die Wahrheitswerte von ¬(A ∧ B) ⇔ (¬A ∨ ¬B) sind also tatsächlich immer
wahr.
Beispiel: Ist A die Aussage ‘n ist eine Quadratzahl’, B die Aussage ‘n ist eine
gerade Zahl’. Dann ist A ∧ B ‘n ist eine Quadratzahl und n ist eine gerade Zahl’.
D.h.: ‘n ist eine gerade Quadratzahl’. Die Negation ¬(A∧B) ist dann ¬A∨¬B ‘n
ist nicht gerade oder n ist keine Quadratzahl’. Das bedeutet nicht, dass ‘n weder
gerade noch eine Quadratzahl ist’. (Überlegen Sie sich das für den Fall n = 6.)
9
Zur Äquivalenz: (A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A) .
Beweis. Mit Wahrheitstafel:
A B A ⇔ B A ⇒ B B ⇒ A (A ⇒ B) ∧ (B ⇒ A)
w w
w
w
w
w
w f
f
f
w
f
f w
f
w
f
f
f f
w
w
w
w
Die Wahrheitswerte der dritten und der sechsten Spalte sind identisch. Daher gilt
(A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A) .
Die Äquivalenz bedeutet also, dass sowohl A B impliziert als auch B A. Wird
in einem mathematischen Satz die Äquivalenz von zwei Aussagen A und B behauptet, so kann man dies nachweisen, indem man A ⇒ B und B ⇒ A beweist.
Transitivität der Implikation: (A ⇒ B) ∧ (B ⇒ C) ⇒ (A ⇒ C).
Beweis. Mit Wahrheitstafel, wobei wir die zu beweisende Tautologie mit (∗)
abkürzen.
A B C A ⇒ B B ⇒ C (A ⇒ B) ∧ (B ⇒ C) A ⇒ C (∗)
w w w
w
w
w
w
w
w w f
w
f
f
f
w
w f w
f
w
f
w
w
w f f
f
w
f
f
w
f w w
w
w
w
w
w
f w f
w
f
f
w
w
f f w
w
w
w
w
w
f f f
w
w
w
w
w
Wenn aus A B und aus B C folgt, so impliziert A C. Insbesondere dürfen wir
in Beweisen schrittweise schließen: Um C aus A zu folgern, können wir zunächst
von A auf eine andere (Hilfs-)Aussage B und von dieser dann auf C schließen.
Dieses Vorgehen kann man natürlich wiederholt anwenden und eine ganze Kette
von (Hilfs-)Aussagen B1 , . . . , Bn einführen, für die sich
A ⇒ B1 , B1 ⇒ B2 , . . . , Bn−1 ⇒ Bn sowie Bn ⇒ C
zeigen lässt und damit A ⇒ C. Einen Beweis nach diesem Schema nennt man
auch einen direkten Beweis.
Kontraposition: (A ⇒ B) ⇔ (¬B ⇒ ¬A).
Beweis. Mit Wahrheitstafel:
A B A ⇒ B ¬A ¬B ¬B ⇒ ¬A
w w
w
f
f
w
w f
f
f
w
f
f w
w
w
f
w
f f
w
w
w
w
10
Die Wahrheitswerte der dritten und der sechsten Spalte sind identisch.
Diese Tautologie liegt dem Beweisprinzip der Kontraposition zugrunde. Um
zu zeigen, dass aus A B folgt, kann man nachweisen, dass aus Nicht-B Nicht-A
folgt. M.a.W.: Man nehme an, dass B falsch ist und zeige dann, dass auch A
falsch ist.
Beispiel: Dieses Prinzip haben wir oben schon angewandt: Aus n gerade und
n = m2 für eine natürliche Zahl m folgt, dass auch m gerade ist.
Beweis. Durch Kontraposition: Ist m ist nicht gerade, also von der Form m =
2k−1 für eine natürlich Zahl k. Dann ist auch n = m2 = (2k−1)2 = 4k 2 −4k+1 =
2(2k 2 − 2k) + 1 nicht gerade.
Prinzip des Widerspruchsbeweises: (A ⇒ B) ⇔ ¬(A ∧ ¬B).
Beweis. Mit Wahrheitstafel:
A B A ⇒ B ¬B A ∧ ¬B ¬(A ∧ ¬B)
w w
w
f
f
w
w f
f
w
w
f
f w
w
f
f
w
f f
w
w
f
w
Die Wahrheitswerte der dritten und der sechsten Spalte sind identisch.
Diese Äquivalenz liegt dem Prinzip des Widerspruchsbeweises zugrunde: Um
B aus A zu folgern, kann man wie folgt vorgehen. Man findet eine Aussage C,
so dass sich C sowie deren Gegenteil ¬C aus der Annahme, dass A wahr und B
falsch ist, ableiten lassen, d.h. man weist nach, dass sowohl
(A ∧ ¬B) ⇒ C
als auch (A ∧ ¬B) ⇒ ¬C
gelten: Man konstruiert einen Widerspruch. Damit ist dann A ⇒ B gezeigt.
Es gilt nämlich, wobei man streng genommen auch die ersten beiden der
folgenden Schritte wieder mit Wahrheitstafeln begründen müsste,
(A ∧ ¬B) ⇒ C ∧ (A ∧ ¬B) ⇒ ¬C
⇔ (A ∧ ¬B) ⇒ (C ∧ ¬C)
⇔ ¬(A ∧ ¬B)
⇔ (A ⇒ B)
(s.o.).
Die zweite Äquivalenz ergibt sich hier daraus, dass Implikation mit der immer
falschen Folgerung C ∧¬C genau dann wahr ist, wenn die Prämisse A∧¬B falsch
ist.
√
Beispiel: 2 ist irrational. (Wie oben schon erwähnt ist auch dieser Satz eigentlich als eine Folgerung aus gewissen Grundannahmen in der Mathematik zu
verstehen.)
√
√
Beweis. Widerspruchsannahme: 2 ist rational, etwa 2 = pq mit p ∈ Z und
√
q ∈ N. Wegen 2 > 0√ist dann sogar p ∈ N. Indem wir diesen Bruch vollständig
kürzen, erhalten wir 2 = rs mit natürlichen Zahlen r und s. Dabei gilt:
11
r ist ungerade oder s ist ungerade.
√
Multiplikation mit s und anschließendes Quadrieren der Gleichung 2 = rs liefert
2s2 = r2 . Aus früheren Überlegungen (s.o.) wissen wir, dass dann r gerade und
r2 sogar durch 4 teilbar ist, etwa r2 = 4t. Dann aber folgt s2 = 2t, weshalb auch
s2 und damit auch s selbst gerade ist. D.h.:
r ist gerade und s ist gerade.
Widerspruch!
Quantoren und quantifizierte Aussagen
In der Mathematik werden oft Sätze, die von gewissen Variablen x, y, z, . . . aus
gewissen Mengen abhängen, untersucht. Ein solcher Satz A(x, y, x, . . .) ist selbst
keine Aussage. Er wird erst dann zu einer Aussage, wenn man die Variablen
quantifiziert. Die wichtigsten Quantoren, die dies leisten, sind der Allquantor ∀
‘für alle’ und der Existenzquantor ∃ ‘es existiert/gibt ein’. Für einen Satz A(x)
kann man dann etwa die Aussagen
• ∀ x : A(x), d.h. ‘Für alle x gilt A(x)’, und
• ∃ x : A(x), d.h. ‘Es existiert ein x, so dass A(x) gilt’,
bilden. ‘Es existiert ein x’ ist hier im Sinne von ‘Es existiert mindestens ein x’
zu verstehen. Möchte man ausdrücken, dass es genau ein x gibt (also nicht zwei
oder mehr), so schreibt man ∃!.
Beispiele:
1. Ist A(x) der Satz x > 7, wobei x eine Variable aus der Menge der reellen
Zahlen ist, so ergeben sich die folgenden Aussagen. ∀ x : x > 7: ‘Für alle
x gilt x > 7’. (Offensichtlich falsch.) Sowie ∃ x > 7: ‘Es existiert ein x mit
x > 7’. (Offensichtlich wahr.)
2. Ist A(x) der Satz x2 = 2, wobei x eine Variable aus der Menge der reellen
(oder rationalen) Zahlen ist, so ist ∃ x : A(x) eine wahre (bzw. falsche)
Aussage.
3. Es sei A(x, y) der Satz x < y mit reellen Zahlen x, y. Durch Quantifizierung
erhält man z.B. ∀ x ∃ y : x < y. In Worten: Für alle x gibt es ein y, so dass
x < y gilt. Dies ist ein wahrer Satz, denn man kann y = x + 1 wählen.
Man kann aber etwa auch den Satz ∃ y ∀ x : x < y bilden. In Worten: Es
existiert ein y, so dass für alle x gilt x < y. Dieser Satz ist falsch, wie das
Gegenbeispiel y = x zeigt.
12
Das letzte Beispiel zeigt, dass es wichtig ist, die Reihenfolge der Quantoren
zu beachten. Insbesondere darf die Reihenfolge verschiedener Quantoren nicht
vertauscht werden. Ist A(x, y) der Satz: Am Tag x esse ich zu Mittag gerne y,
wobei x einen Tag im Oktober und y etwas zu essen bezeichnet, so ist
• ∀ x ∃ y : A(x, y): ‘An jedem Tag des Oktobers esse ich zu Mittag gerne
etwas’ eine wahre Aussage,
• ∃ y ∀x : A(x, y): ‘Es gibt etwas, das ich an jedem Tag im Oktober gern zu
Mittag esse’ falsch.
(Teilen Sie diese Erkenntnis doch mit dem Studentenwerk.)
Zulässig ist es jedoch, die Reihenfolge zweier aufeinanderfolgender Allquantoren sowie die Reihenfolge zweier aufeinanderfolgender Existenzquantoren zu
vertauschen, d.h. es gelten
∀ x ∀ y : A(x, y) ⇔ ∀ y ∀ x : A(x, y)
und
∃ x ∃ y : A(x, y) ⇔ ∃ y ∃ x : A(x, y).
Die Negation einer Aussage mit Quantoren ist ganz einfach: Es ist
¬∀ x : A(x) ⇔ ∃ x : ¬A(x) und ¬∃ x : A(x) ⇔ ∀ x : ¬A(x).
Das Gegenteil von ‘Für alle x gilt A(x)’ ist ‘Es gibt ein x, für das A(x) nicht
gilt’. Das Gegenteil von ‘Es gibt ein x, für das A(x) gilt’ ist ‘Für alle x gilt A(x)
nicht’. Man kann also die Negation ¬ an einem Quantor ‘vorbeiziehen’, wobei ∀
zu ∃ bzw. ∃ zu ∀ wird. Damit lassen sich auch Aussagen mit mehreren Quantoren
leicht negieren, indem man (sukzessive) ¬ von links nach rechts schiebt und die
Quantoren auswechselt.
Beispiele:
1. Die Negation von ‘An jedem Tag des Oktobers esse ich zu Mittag gerne
etwas’ lautet ‘Es gibt einen Tag im Oktober, an dem ich nicht gerne zu
Mittag esse’.
2. Bezeichnet x, y reelle Zahlen, so ist
¬∃ y ∀ x : x < y ⇔ ∀ y ∃x : ¬x < y ⇔ ∀ y ∃x : x ≥ y.
3. Es ist
¬∀ x ∃ y ∀ z : A(x, y, z) ⇔ ∃ x ∀ y ∃ z : ¬A(x, y, z).
4. Das Gegenteil von
13
‘Für jede positive rationale Zahl x und jede natürlich Zahl n gibt
es eine rationale Zahl y mit x = y n ’
(was falsch ist) lautet
‘Es gibt eine rationale Zahl x und eine natürliche Zahl n, so dass
für alle rationalen Zahlen y gilt x 6= y n ’
(richtig, setze z.B. x = 2, n = 2).
Übung: Betrachten Sie den Satz A(x, y, z): ‘Am Tag x versteht der Student y
in der Analysisvorlesung z’, wobei z die Worte des Dozenten bezeichnet. Formulieren Sie alle möglichen Quantifizierungen durch ∀ und ∃ und deren Negation
umgangssprachlich.
2.2
Mengen und Abbildungen
Die Mengenlehre ist die Grundlage der modernen Mathematik. So lassen sich die
Begriffe, die wir insbesondere in der Analysis untersuchen, letztlich auf Begriffe
der Mengenlehre zurückführen. Das heute allgemein anerkannte Axiomensystem
der Mengenlehre geht auf Zermolo und Fraenkel zurück. Eine sorgfältige Untersuchung dieses Systems und seiner Konsequenzen muss jedoch einer eigenen
Vorlesung vorbehalten bleiben. Für die Zwecke der Analysis genügt es, eine Vorstellung vom Begriff der Menge zu haben und einige Operationen, die man mit
Mengen durchführen kann, zu erläutern.
Nach Cantor ist eine Menge eine
“Zusammenfassung von bestimmten, wohlunterschiedenen Objekten
unserer Anschauung oder unseres Denkens (welche ‘Elemente der Menge’ genannt werden) zu einem Ganzen.”
Dieser Begriff ist nicht unproblematisch, wie wir gleich noch sehen werden, genügt
als Leitfaden für alle Zwecke der Analysis 1-3 jedoch vollauf. Für eine Menge M
schreiben wir
• x ∈ M , wenn x ein Element von M ist (man sagt auch x liege in M ) und
• x∈
/ M , wenn x kein Element von M ist (wenn x nicht in M liegt).
Gilt für zwei Mengen M, N die Implikation x ∈ N ⇒ x ∈ M , so heißt N eine
Teilmenge von M , geschrieben N ⊂ M . (Manchmal schreibt man hierfür auch
N ⊆ M .) Gilt N ⊂ M und gibt es mindestens ein Element, das in M aber nicht
in N liegt, so nennen wir N eine echte Teilmenge von M und schreiben dafür auch
N ( M . Zwei Mengen, die kein Element gemein haben, nennt man disjunkt.
14
Zwei Mengen sind gleich, wenn sie dieselben Elemente besitzen: M = N heißt
M ⊂ N und N ⊂ M , m.a.W.: x ∈ M ⇔ x ∈ N . So ist z.B.
{3, 19, 8, 2013, 3} = {8, 19, 8, 8, 2013, 3} = {3, 8, 19, 2013}.
Üblicherweise schreibt man jedoch jedes Element nur einmal. Es gibt auch eine
Menge, die gar keine Elemente enthält: Die leere Menge ∅. Sie ist Teilmenge jeder
Menge.
Besitzt eine Menge M nur endlich viele Elemente, etwa x1 , x2 , . . . , xn , so lässt
sich M durch Aufzählen als
M = {x1 , x2 , . . . , xn }
schreiben. Auch für gewisse unendliche Mengen ist das möglich, wie etwa
{2, 4, 6, 8, . . .},
wenn durch die Pünktchen ‘. . . ’ klar ist, wie es weitergeht. Meistens beschreibt
man Mengen durch eine die Elemente charakterisierende Eigenschaft als Teilmenge einer anderen Menge in der Form
N = {x ∈ M : A(x)},
was heißt x ∈ N ⇔ (x ∈ M ∧ A(x)). Hier ist A(x) eine Aussage, die in Abhängigkeit von x ∈ M wahr oder falsch sein kann. Wir schreiben Mengen bisweilen auch
einfach als {x : A(x)} mit einer definierenden Eigenschaft A(x), wenn es sich
versteht, welche x hier zu betrachten sind.
Aus der Schule sollten Ihnen auch die folgenden unendlich großen Mengen von
Zahlen in Erinnerung sein:
• N = {1, 2, 3, . . .} (die natürliche Zahlen) sowie N0 = {0, 1, 2, 3, . . .} (die
natürliche Zahlen mit 0),
• Z = {. . . , −2, −1, 0, 1, 2, . . .} (die ganzen Zahlen),
• Q = { pq : p ∈ Z, q ∈ N} (die rationalen Zahlen) und
• die reellen Zahlen R.
Mengenoperationen
Durch Mengenoperationen lassen sich aus Mengen neue Mengen konstruieren. Im
Folgenden seien M, N Mengen.
• Der Schnitt (oder auch Durchschnitt) von M und N ist
M ∩ N = {x : x ∈ M ∧ x ∈ N },
also x ∈ M ∩ N ⇔ (x ∈ M ∧ x ∈ N ).
15
Beispiele:
1. {n ∈ N : n ist Primzahl} ∩ {n ∈ N : n ≤ 10} = {2, 3, 5, 7}.
2. Zwei Mengen M und N sind genau dann disjunkt, wenn M ∩ N = ∅
ist.
• Die Vereinigung von M und N ist
M ∪ N = {x : x ∈ M ∨ x ∈ N }.
Beispiel: {1, 3, 5, . . .} ∪ {2, 4, 6, . . .} = N.
• Die Differenz von M und N ist
M \ N = {x : x ∈ M ∧ x ∈
/ N }.
Beispiel: R \ {x ∈ R : x > 0} = {x ∈ R : x ≤ 0}.
• Das kartesische Produkt von M und N ist
M × N = {(x, y) : x ∈ M ∧ y ∈ N }.
Hierbei ist (x, y) ein geordnetes Paar: Es gilt
(x, y) = (x0 , y 0 ) ⇔ (x = x0 ∧ y = y 0 ).
• Die Potenzmenge von M ist die Menge aller Teilmengen von M :
P(M ) = {U : U ⊂ M }.
Beispiel: P({1, 2, 3}) = ∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3} .
Das letzte Beispiel zeigt, dass die Elemente von Mengen selbst Mengen sein
dürfen. An dieser Stelle ist ein Wort der Vorsicht angebracht. A priori ist es
nicht ausgeschlossen, dass eine Menge sogar sich selbst als Element enthält. Wir
werden so etwas nicht zulassen. Die uneingeschränkte Bildung von Mengen nach
der Cantorschen Definition würde dazu führen, dass man etwa auch ‘die Menge
aller Mengen’ M betrachten könnte, also M = {M : M ist Menge}. Dann aber
könnten wir auch die folgende Teilmenge konstruieren:
N = {M ∈ M : M ∈
/ M }.
Gilt nun N ∈ N ? Falls ja, so ist N ∈
/ N . Ist andererseits N ∈
/ N , so müsste doch
N ∈ N sein. Widerspruch! Dies ist die Russelsche Antinomie in der Mengenlehre,
16
die die Mathematik zu Beginn des letzten Jahrhunderts in eine Grundlagenkrise gestürzt hat. In dieser Vorlesung werden wir solche problematischen Mengen
allerdings gar nicht betrachten.
Oft ist es nötig, den Schnitt bzw. die Vereinigung mehrerer, eventuell sogar
unendlich vieler Mengen zu bilden. Ist I eine beliebige Menge und ist für jedes i ∈
I eine Menge Mi gegeben, so defniert man den Durchschnitt und die Vereinigung
der Mi durch
\
[
Mi = {x : ∀ i ∈ I : x ∈ Mi },
Mi = {x : ∃ i ∈ I : x ∈ Mi }.
i∈I
i∈I
In diesem Zusammenhang, wenn mehrere mathematische Objekte (hier Mengen)
durch eine Menge I indiziert werden, nennt man I auch eine Indexmenge.
Für den Umgang mit ∩ und ∪ gelten die folgenden Rechenregeln. Im Folgenden seien L, M, N Mengen.
• Kommutativgesetze:
M ∩N =N ∩M
und M ∪ N = N ∪ M.
• Assoziativgesetze:
(L ∩ M ) ∩ N = L ∩ (M ∩ N ) und (L ∪ M ) ∪ N = L ∪ (M ∪ N ),
weshalb man die Klammern auch gleich ganz weglassen darf.
• Distributivgesetze:
L ∩ (M ∪ N ) = (L ∩ M ) ∪ (L ∩ N ) und
L ∪ (M ∩ N ) = (L ∪ M ) ∩ (L ∪ N ).
• De Morgansche Gesetze:
(L \ M ) ∩ (L \ N ) = L \ (M ∪ N ) und
(L \ M ) ∪ (L \ N ) = L \ (M ∩ N ).
Beweis. Wir beweisen exemplarisch das zweite Distributivgesetz:
x ∈ L ∪ (M ∩ N ) ⇔ x ∈ L ∨ x ∈ M ∩ N
⇔ x ∈ L ∨ (x ∈ M ∧ x ∈ N )
⇔ (x ∈ L ∨ x ∈ M ) ∧ (x ∈ L ∨ x ∈ N )
⇔ (x ∈ L ∪ M ) ∧ (x ∈ L ∪ N )
⇔ x ∈ (L ∪ M ) ∩ (L ∪ N ).
(s.u.)
Hier haben wir im dritten Schritt das Distributivgesetz A ∨ (B ∧ C) ⇔ (A ∨ B) ∧
(A ∨ C) ausgenutzt, das man mit einer Wahrheitstafel zeigen kann. (Übung!) 17
Funktionen
Eine Funktion oder Abbildung f von einer Menge M in eine Menge N ordnet
jedem Element von M genau ein Element von N zu. Man schreibt f : M → N
und bezeichnet das x ∈ M zugeordnete Element aus N mit f (x), was man auch
als x 7→ f (x) notiert. Man nennt M den Definitionsbereich von f und N den
Bildbereich oder Wertebereich von f .
Ist M = {x1 , . . . , xn } endlich, so lässt sich eine Funktion durch eine vollständige Liste der Funktionswerte f (x1 ), . . . , f (xn ) angeben. Im Allgemeinen wird eine
Funktion jedoch durch eine Funktionsvorschrift gegeben sein, die f (x) durch einen
Ausdruck in x definiert.
Eine Funktion f : M → N heißt
• injektiv, wenn es zu jedem y ∈ N höchstens ein x ∈ M mit f (x) = y gibt,
d.h.:
∀ x ∈ M ∀ x0 ∈ M : f (x) = f (x0 ) ⇒ x = x0 ,
• surjektiv, wenn es zu jedem y ∈ N mindestens ein x ∈ M mit f (x) = y
gibt, d.h.:
∀ y ∈ N ∃ x ∈ M : y = f (x),
und
• bijektiv, wenn es zu jedem y ∈ N genau ein x ∈ M mit f (x) = y gibt, d.h.
wenn f sowohl injektiv als auch surjektiv ist.
Beispiele:
1. f : N → N, f (x) = x + 1 ist injektiv aber nicht surjektiv.
2. f : Z → Z, f (x) = x + 1 ist bijektiv.
3. f : R → R, f (x) = x3 − x ist surjektiv aber nicht injektiv.
4. f : R → R, x 7→ sin x ist weder injektiv noch surjektiv.
5. f : Q → Q, x 7→ x3 ist injektiv aber nicht surjektiv.
6. f : R → R, x 7→ x3 ist bijektiv.
Der Begriff der Bijektivität, also der ‘eineindeutigen Zuordnung’ gestattet es
insbeondere, die Größe von Mengen zu vergleichen. Wir sagen, dass die Mengen
M und N gleichmächtig sind, wenn es eine Bijektion (d.h. eine bijektive Abbildung) von M nach N gibt. Endliche Mengen sind diejenigen, die gleichmächtig
zu einer Menge {1, 2, . . . , n} für ein n ∈ N sind (und dann gerade n Elemente
haben). Ist eine Menge M gleichmächtig zur Menge der natürlichen Zahlen N, so
nennt man M abzählbar. Eine Menge, die weder endlich noch abzählbar ist, heißt
überabzählbar.
18
Beispiele:
1. {1, 2, 3, 4, 5, 6, 7, 8} und {2, 3, 5, 7, 11, 13, 17, 19} sind gleichmächtig, wie die
Abbildung
1 7→ 2, 2 7→ 3, . . . , 8 7→ 19
zeigt.
2. N0 ist abzählbar, denn f : N → N0 , f (n) = n − 1 ist eine Bijektion.
3. Auch N und Z sind gleichmächtig, denn die Wertetabelle
x
f (x)
1 2
0 1
3 4 5 6 7 ···
−1 2 −2 3 −3 · · ·
definiert eine Bijektion f : N → Z.
S
4. Die Vereinigung n∈N Mn abzählbar vieler abzählbarer Mengen M1 , M2 , . . .
ist wieder abzählbar. Dies lässt sich mit dem ‘ersten Cantorschen Diagonalverfahren’ zeigen. Wir bezeichnen die Elemente
S der i-ten Menge Mi mit
xi1 , xi2 , xi3 , . . .. Dann lassen sich alle Elemnte aus n∈N Mn abzählen, indem
man sie auf die folgende Weise anordnet und der Reihe nach abzählt, wobei
man diejenigen xij überspringt, die nicht zum ersten Mal in dieser Reihe
auftreten. (Gewisse Elemente können ja in mehreren Mi liegen.)
x11
x12
↓ %
x21
x22
.
x31
x32
↓ %
x41
x42
..
..
.
.
→ x13
x14
.
%
x23
x24
%
.
x33
x34
.
x43
x44
..
..
.
.
→ x15 · · ·
.
···
···
···
..
.
5. Q ist abzählbar, wie man mit Hilfe des vorigen Beispiels aus der Darstellung
[
Q=
{ pq : p ∈ Z}
q∈N
erkennt.
6. Für keine Menge M gibt es eine surjektive Abbildung f : M → P(M ).
Wir zeigen dies durch einen Widerspruchsbeweis und nehmen an, dass M
eine Menge und f : M → P(M ) surjektiv ist. Es sei
N = {x ∈ M : x ∈
/ f (x)} ∈ P(M ).
19
Da f surjektiv ist, gibt es ein x0 ∈ M mit f (x0 ) = N . Ist nun x0 ∈ N , so
gilt x0 ∈
/ f (x0 ) = N . Ist andererseits x0 ∈
/ N = f (x0 ), so folgt x0 ∈ N . Das
ergibt den Widerspruch x0 ∈
/ N ∧ x0 ∈ N .
Insbesondere ist P(M ) für jede unendliche Menge sogar überabzählbar.
Ist f : M → N eine Funktion von M nach N , so nennen wir für U ⊂ M
f (U ) = {f (x) : x ∈ U }
= {y ∈ N : ∃ x ∈ U mit y = f (x)}
das Bild von U unter f . Für V ⊂ N heißt
f −1 (V ) = {x ∈ M : f (x) ∈ V }
das Urbild von V unter f .
Für U, U 0 ⊂ M und V, V 0 ⊂ N gelten die folgenden Regeln:
f (U ∪ U 0 ) = f (U ) ∪ f (U 0 ),
f −1 (V ∩ V 0 ) = f −1 (V ) ∩ f −1 (V 0 ),
f −1 (V ∪ V 0 ) = f −1 (V ) ∪ f −1 (V 0 ).
Im Allgemeinen ist jedoch f (U ∩ U 0 ) = f (U ) ∩ f (U 0 ) falsch.
Übung: Beweisen Sie diese Aussagen!
Eine wichtige Operation ist die Verkettung von Funktionen. Sind L, M, N
Mengen und f : L → M , g : M → N Funktionen, so ist die Verkettung (oder
Komposition) von f und g die Funktion
g ◦ f : L → N,
g ◦ f (x) = g(f (x)).
Sie entsteht, indem man zunächst f und auf das Ergebnis dann g anwendet.
Beispiel: Sind f, g : R → R gegeben durch f (x) = x2 und g(x) = sin x, so sind
g ◦ f : R → R und f ◦ g : R → R gegeben durch
g ◦ f (x) = sin(x2 )
und
f ◦ g(x) = (sin x)2 .
Die Verkettung erfüllt das Assoziativgesetz: Sind f : K → L, g : L → M und
h : M → N Funktionen, so gilt
(h ◦ g) ◦ f = h ◦ (g ◦ f ).
Denn für alle x ∈ K gilt
(h ◦ g) ◦ f (x) = (h ◦ g)(f (x)) = h(g(f (x))) = h((g ◦ f )(x)) = h ◦ (g ◦ f ) (x).
20
2.3
Vollständige Induktion
Die vollständige Induktion ist ein besonders wichtiges Beweisprinzip, um Aussagen über natürliche Zahlen zu beweisen. Tatsächlich lässt sich dieses Prinzip
direkt aus einem geeigneten Axiomensystem für die natürlichen Zahlen gewinnen,
was wir hier aber nicht weiterverfolgen wollen.
Ist A(n) ein Satz, der für jede Wahl einer Zahl n ∈ N0 zu einer (wahren oder
falschen) Aussage wird, so betrachtet man oft die Aussage
‘Für alle n ∈ N0 gilt A(n)’, in Formeln: ∀ n ∈ N0 : A(n).
Manchmal interessiert man sich auch nur dafür, ob A(n) ab einem bestimmten
n0 ∈ N0 gilt, also
‘Für alle n ≥ n0 gilt A(n)’, d.h. ∀ n ≥ n0 : A(n),
wobei die letzte Formel abkürzend für ∀ n ∈ {m ∈ N0 : m ≥ n0 } : A(n) steht.
Das Beweisprinzip der vollständigen Induktion besagt nun, dass es, um ∀ n ≥
n0 : A(n) zu beweisen, genügt nachzuweisen, dass
(i) A(n0 ) wahr ist (Induktionsanfang) sowie
(ii) für jedes n ≥ n0 die Gültigkeit von A(n) die Gültigkeit von A(n + 1)
impliziert. (M.a.W.: ∀ n ≥ n0 : A(n) ⇒ A(n + 1).) (Induktionsschritt).
Anstelle A(n) gleich für beliebiges n zu beweisen, schränkt man sich also zunächst
einmal auf den ersten Fall n = n0 ein. Zweitens darf man, um A(n + 1) für beliebiges n ≥ n0 nachzuweisen, annehmen, dass A(n) (die Induktionsvoraussetzung)
schon als wahr erkannt ist.
Dass die fragliche Behauptung hiermit gezeigt ist, erklärt sich so: Zunächst
gilt A(n0 ) nach (i). Wendet man dann (ii) auf den Fall n = n0 an, so erhält man,
dass auch A(n0 + 1) wahr ist. Nun kann man (ii) auf n = n0 + 1 anwenden und
erkennt die Gültigkeit von A(n + 2). Indem man diesen Prozess wiederholt und
(ii) immer wieder auf das nächstgrößere n anwendet, folgt schließlich A(n) für
alle n ≥ n0 .
Man kann sich das wie beim Umwerfen einer Reihe von Dominosteinen (nummeriert durch 0, 1, 2, . . .) vorstellen. Wenn Sie feststellen wollen, ob alle Steine ab
dem n0 -ten fallen, so genügt es, zwei Dinge zu wissen:
(i) Der n0 -te Stein fällt.
(ii) Wenn der n-te Stein fällt, so fällt auch sein Nachfolger mit der Nummer
n + 1.
Ähnlich wie eben sieht man ein, dass sich die Bedingung (ii) abschwächen
lässt zu
21
(ii’) ∀ n ≥ n0 : (A(n0 ) ∧ . . . ∧ A(n)) ⇒ A(n + 1).
Man darf also, um A(n + 1) zu zeigen, annehmen, dass all die Behauptungen
A(n0 ), . . . , A(n) erfüllt sind.
Wir werden nun einige Sätze mit diesem Prinzip beweisen. Zunächst führen
dazu noch die folgenden abkürzenden Notationen ein: Sind m ≤ n ganze Zahlen
und ist für jedes ganze k mit m ≤ k ≤ n eine reelle Zahl ak gegeben, so setzen
wir
n
X
ak = am + am+1 + . . . + an ,
n
Y
sowie
k=m
ak = am · am+1 · . . . · an .
k=m
(Sprich: Die Summe/das Produkt der ak von m bis n.) Ist m = n + 1, so ist es
bisweilen nützlich, für die leere Summe und das leere Produkt
n
X
ak = 0,
bzw.
n
Y
ak = 1
k=m
k=m
zu setzen. Das Produkt der ersten n natürlichen Zahlen nennt man n! (sprich:
n-Fakultät):
n
Y
k.
n! = 1 · 2 · . . . · n =
k=1
Satz 2.1 Für alle n ∈ N gilt
n
X
k=1
k=
n(n + 1)
.
2
Beweis. Mit vollständiger Induktion. Induktionsanfang: Die Behauptung ist richtig für n = 1, denn es ist
1
X
1(1 + 1)
k=1=
.
2
k=1
Induktionsschritt: Wir nehmen an, dass die Behauptung für ein n richtig ist,
also
n
X
n(n + 1)
k=
2
k=1
22
für dieses n gilt. Daraus folgt dann
n+1
X
k=
k=1
n
X
k + (n + 1)
k=1
n(n + 1)
+ (n + 1)
2
n(n + 1) + 2(n + 1)
=
2
(n + 1)(n + 2)
,
=
2
(nach Induktionsvoraussetzung)
=
also die Behauptung für n + 1.
Satz 2.2 (Die geometrische Summenformel) Es sei q ∈ R \ {1}. Für alle
n ∈ N0 gilt
n
X
1 − q n+1
qk =
.
1−q
k=0
Beweis. Mit vollständiger Induktion. Induktionsanfang: Die Behauptung ist richtig für n = 0, denn
0
X
1−q
.
q0 = 1 =
1
−
q
k=0
(q 0 ist immer 1, nach Konvention sogar für q = 0.)
Induktionsschritt: Die Behauptung sei wahr für n. Dann folgt
n+1
X
k
q =
k=0
n
X
q k + q n+1
k=0
1 − q n+1
+ q n+1
(nach Induktionsvoraussetzung)
1−q
1 − q n+1 + q n+1 − q n+2
=
1−q
n+2
1−q
=
,
1−q
=
was gerade die Behauptung für n + 1 ist.
Satz 2.3 Es gibt unendlich viele Primzahlen.
Dem Beweis schicken wir ein Lemma, also einen Hilfssatz voraus:
Lemma 2.4 Jede natürliche Zahl n ≥ 2 ist durch eine Primzahl teilbar.
23
Beweis. Mit vollständiger Induktion. Induktionsanfang: 2 ist eine Primzahl und
natürlich durch sich selbst teilbar.
Induktionsschritt (gemäß (ii’)): Die Behauptung sei für alle 2 ≤ k ≤ n bereits
etabliert. Entweder ist dann n + 1 selbst eine Primzahl, woraus die Behauptung
für n + 1 sofort folgt. Oder es ist n + 1 = km mit 2 ≤ k, m ≤ n. Nach Induktionsvoraussetzung gibt es eine Primzahl, die m teilt und damit auch n + 1 = km.
Beweis von Satz 2.3. Widerspruchsannahme: Es gibt nur endlich viele Primzahlen,
etwa p1 , . . . , pn . Dann aber ist die natürliche Zahl
N =1+
n
Y
pk
k=1
durch keine der Primzahlen p1 , . . . , pn teilbar. (Immer bleibt der Rest 1.) Dies
widerspricht dem vorigen Lemma.
Satz 2.5 Die Anzahl der möglichen Anordnungen einer Menge mit n ∈ N Elementen ist n!.
Erster Beweis. Es gibt n Möglichkeiten, dass erste Element auszuwählen, n −
1 Möglichkeiten, dass zweite Element auszuwählen, n − 2 für das dritte u.s.w.
Schließlich hat man noch zwei Auswahlmöglichkeiten für das vorletzte und nur
eine einzige für das letzte Element. Dies führt zu
n · (n − 1) · (n − 2) · . . . 2 · 1 = n!
möglichen Anordnungen.
Wir haben hier – wie auch schon zuvor mit Pünktchen ‘. . . ’– durch ‘und so
weiter’ angedeutet, dass es klar ist (oder sein sollte), wie das Verfahren Schritt
für Schritt weitergeht. Ganz formal lässt sich dieses Vorgehen mit Hilfe eines
Beweises durch vollständige Induktion begründen.
Zweiter Beweis. Mit vollständiger Induktion. Induktionsanfang: Für n = 1 ist
dies klar, da man eine einelementige Menge nur auf eine Weise anordnen kann
und 1! = 1 ist.
Induktionsschritt: Die Behauptung sei für n-elementige Mengen bewiesen. Ist
nun M = {x1 , . . . , xn+1 } eine (n + 1)-elementige Menge, so kann man die möglichen Anordnungen von M in n + 1 Klassen K1 , . . . , Kn+1 aufteilen, wobei die
Anordnungen der Klasse Kk dadurch charaketrisiert seien, dass sie an der ersten
Stelle das Element xk haben. In jeder Klasse Kk liegen dann so viele Anordnungen, wie es Möglichkeiten gibt, wie verbleibenden n Elemente anzuordnen, also
nach Voraussetzung gerade n!. Insgesamt gibt es also
(n + 1)n! = (n + 1)!
24
Anordnungen von M .
Eine bijektive Abbildung f : M → M einer Menge in sich nennt man auch
eine Permutation von M . Da jede Anordnung (xi1 , xi2 , . . . , xin ) der Elemente von
M = {x1 , . . . , xn } durch
f (x1 ) = xi1 , . . . , f (xn ) = xin
eine Permutation f : M → M definiert und umgekehrt jeder Permutation f :
M → M eine Anordnung (f (x1 ), . . . , f (xn )) entspricht, erhalten wir:
Korollar 2.6 Die Anzahl der Permutationen auf einer n-elementigen Menge ist
n!.
(Ein Korollar ist ein Satz, der – mehr oder weniger – unmittelbar aus einem
anderen Ergebnis folgt.)
Beweis. Klar nach Satz 2.5
Definition 2.7 Für n, k ∈ N0 definieren wir den Binomialkoeffizienten
n
n · (n − 1) · . . . · (n − k + 1)
:=
k
1 · 2 · ... · k
=
k
Y
n−i+1
i=1
i
!
.
Es ist dann
(
0
n
=
n!
k
=
k!(n−k)!
n
n−k
für k > n,
für k ≤ n.
(Mit dem Zeichen := wird ausgedrückt, dass die linke Seite der Gleichung durch
die rechte Seite definiert wird.)
Der Name Binomialkoeffizient rührt daher, dass diese Zahlen als Koeffizienten
im Binomischen Lehrsatz, einer Verallgemeinerung der binomischen Formel auf
höhere Exponenten, auftreten, s. Satz
2.9. Diese Zahlen haben auch in der Kombinatorik eine wichtige Bedeutung: nk ist die Anzahl der k-elementigen Teilmengen
einer n-elementigen Menge.2 Denn zunächst gibt es n · (n − 1) · . . . · (n − k + 1)
Möglichkeiten, k Elemente unter Berücksichtigung der Reihenfolge aus n Elementen auszuwählen3 : n Möglichkeiten für die erste Wahl, dann n − 1 für die zweite
u.s.w. Für das zuletzt gewählte Element bleiben noch (n−k+1) Auswahlmöglichkeiten. Nach Satz 2.5 entspricht nun jede k-Elementige Teilmenge genau k! dieser
Auswahlen, so das sich
Teilmengen tatsächlich
für die Anzahl der k-elementigen
n·(n−1)·...·(n−k+1)
n
n
= k ergibt. Insbesondere ist k immer eine ganze Zahl.
k!
2
Dies kennen Sie vielleicht noch aus der Schule unter dem Namen ‘Kombination ohne Zurücklegen’. In einer Menge kommt es ja nicht auf die Reihenfolge der Elemente an.
3
Dies kennen Sie vielleicht unter dem Namen ‘Variation ohne Zurücklegen’.
25
Lemma 2.8 Für k, n ∈ N0 gilt
n
n
n+1
=
+
.
k+1
k
k+1
Beweis. Für k = n ist die Behauptung 1 = 1 + 0, für k > n lautet sie 0 + 0 = 0,
was beides offensichtlich richtig ist. Für die übrigen Fälle k < n kann man wie
folgt schließen:
n
n
n!
n!
+
=
+
k
k+1
k!(n − k)! (k + 1)!(n − k − 1)!
n!(k + 1)
n!(n − k)
=
+
(k + 1)!(n − k)! (k + 1)!(n − k)!
n!(k + 1 + n − k)
=
(k + 1)!(n − k)!
n+1
(n + 1)!
=
.
=
k+1
(k + 1)!(n − k)!
Die Werte der Binomialkoeffizienten lassen sich im Pascalschen Dreieck anordnen:
1
1
1
1
1
1
.
1
2
3
4
1
3
6
5
10
1
4
10
1
5
..
1
..
.
Dabei findet man nk in der n-ten Zeile an der
k-ten
Position (wobei die Zählung
n
n
bei 0 beginnt). Ganz außen steht wegen 0 = n immer 1. Nach Lemma 2.8
ergeben sich die anderen Einträge als Summe der beiden (schräg) darüber befindlichen Werte.
Satz 2.9 (Binomischer Lehrsatz) Für n ∈ N0 und reelle Zahlen x, y gilt
n X
n k n−k
x y .
(x + y) =
k
k=0
n
Beweis. Mit vollständiger Induktion. Der Fall n = 0 ist klar, denn
0 0 0 0 X n k n−k
(x + y) = 1 =
xy =
x y .
0
k
k=0
0
26
Ist der Satz für ein n ∈ N0 bereits gezeigt, so ergibt sich
(x + y)n+1 = (x + y)(x + y)n
n X
n k n−k
= (x + y)
x y
k
k=0
n n X
X
n k n−k
n k n−k
=x
x y
+y
x y
k
k
k=0
k=0
n n X
X
n k+1 n−k
n k n−k+1
=
x y
+
x y
k
k
k=0
k=0
n+1 n X
X
n
n k n−k+1
k n−k+1
=
x y
+
x y
k−1
k
k=1
k=0
n X
n 0 n+1
n
n
n n+1 0
k n−k+1
=
+
x y
+
x y +
xy
k−1
k
n
0
k=1
n X
n + 1 k n+1−k
n + 1 n+1 0
n + 1 0 n+1
=
x y
+
x y +
xy
k
n
+
1
0
k=1
n+1
X n + 1
=
xk y n+1−k ,
k
k=0
wobei wir im siebten Schritt Lemma 2.8 und die Identitäten nn = 1 =
sowie n0 = 1 = n+1
benutzt haben.
0
Bemerkung. Speziell für x = y = 1 führt dieser Satz auf die Formel
n+1
n+1
n X
n k n−k
x y
= 2n .
k
k=0
Insbesondere besitzt eine n-elementige Menge genau 2n Teilmengen. (Was Sie
sich auch direkt überlegen können.)
27
Kapitel 3
Reelle und komplexe Zahlen
Wir beginnen die eigentliche Analysis nun damit, die grundlegenden Objekte
durch eine ganze Reihe von Axiomen einzuführen: die reellen Zahlen. Dabei werden wir die natürlichen, die ganzen sowie die rationalen Zahlen als Teilmengen
der reellen Zahlen wiedergewinnen. Schließlich werden wir den Zahlbereich auf
die sogennnten komplexen Zahlen ausdehnen.
Das grundlegende Axiom der reellen Zahlen lautet:
Axiom. Es gibt eine Menge, fortan mit R bezeichnet, die den Körperaxiomen,
den Anordnungsaxiomen und dem Vollständigkeitsaxiom genügt.
Diese Begriffe werden nun gleich in den folgenden Kapiteln erklärt. Kurz sagt
man auch: R ist ein vollständiger angeordneter Körper. Die Elemente von R
heißen reelle Zahlen.
3.1
Die Körperaxiome
Die Menge der reellen Zahlen R ist eine Menge auf der zwei innere Verknüpfungen
gegeben sind: Die Addition
R × R → R,
(x, y) 7→ x + y
und die Multiplikation
R × R → R,
(x, y) 7→ x · y
(kurz: x · y = xy).
Diese genügen den folgenden Regeln:
• Axiome der Addition:
(A1) Assoziativgesetz: ∀ x, y, z ∈ R:
x + (y + z) = (x + y) + z.
28
(A2) Kommutativgesetz: ∀ x, y ∈ R:
x + y = y + x.
(A3) Existenz eines additiv neutralen Elements: Es gibt eine Zahl 0 ∈ R
(die Null), so dass für alle x ∈ R gilt
x + 0 = x.
(A4) Existenz eines additiv inversen Elements: Zu jedem x ∈ R gibt es ein
−x ∈ R (das Negative von x) mit
x + (−x) = 0.
• Axiome der Multiplikation:
(M1) Assoziativgesetz: ∀ x, y, z ∈ R:
x(yz) = (xy)z.
(M2) Kommutativgesetz: ∀ x, y ∈ R:
xy = yx.
(M3) Existenz eines multiplikativ neutralen Elements: Es gibt eine Zahl 1 ∈
R (die Eins), so dass für alle x ∈ R gilt
x · 1 = x.
(M4) Existenz eines multiplikativ inversen Elements: Zu jedem x ∈ R \ {0}
gibt es ein x−1 ∈ R (schlicht das Inverse von x) mit
xx−1 = 1.
• Über den Zusammenhang von + und ·:
(N) Für die neutralen Elemente gilt 0 6= 1.
(D) Distributivgesetz: ∀ x, y, z ∈ R:
x(y + z) = (xy) + (xz).
Beachten Sie, dass −x und x−1 lediglich Bezeichnungen für das additiv bzw.
multiplikativ Inverse einer Zahl x sind. Weder haben wir bislang die Subtraktion
noch Potenzen eingeführt. Die Klammern geben an, in welcher Reihenfolge die
inneren Verknüpfungen auszuführen sind. Wie üblich vereinbaren wir dabei die
29
‘Punkt-vor-Strich-Regel’, so dass wir etwa (xy) + (xz) auch einfach als xy + xz
schreiben können. Des Weiteren setzen wir abkürzend
x
x − y := x + (−y)
und
:= x/y := xy −1 .
y
für x, y ∈ R. (Hierdurch werden nun tatsächlich innere Verknüpfungen auf R
bzw. R \ {0} definiert, denn wie wir gleich sehen werden sind −y und y −1 durch
y eindeutig gegeben.)
Bemerkung. Man nennt diese Regeln die Körperaxiome. Jede Menge, auf der
zwei innere Verknüpfungen + und · definiert sind, die diesen Axiomen genügen,
nennt man einen Körper. So ist etwa auch Q ein Körper.
Eine wichtige Konsequenz aus diesen Axiomen ist, dass wir elementare Gleichungen lösen können:
Satz 3.1 Es seien a, b ∈ R.
(i) Die Gleichung a + x = b hat eine eindeutige Lösung. (Nämlich x = b − a.)
(ii) Ist a 6= 0, so hat auch die Gleichung ax = b hat eine eindeutige Lösung.
(Nämlich x = a−1 b.)
Beweis. (i) Tatsächlich ist x = b − a eine Lösung, denn
(A2)
a + (b − a) = a + (b + (−a)) = a + ((−a) + b)
(A1)
(A4)
(A2)
(A3)
= (a + (−a)) + b = 0 + b = b + 0 = b.
Es bleibt, die Eindeutigkeit zu begründen. Dazu zeigen wir, dass beliebige
Lösungen x1 , x2 gleich sein müssen:
a + x1 = b = a + x2
⇒ a + x1 = a + x2
⇒ (−a) + (a + x1 ) = (−a) + (a + x2 )
(A1)
⇒ ((−a) + a) + x1 = ((−a) + a) + x2
(A2)
⇒ (a + (−a)) + x1 = (a + (−a)) + x2
(A4)
⇒ 0 + x1 = 0 + x2
(A2)
⇒ x1 + 0 = x2 + 0
(A3)
⇒ x1 = x2 .
30
(ii) Der Beweis verläuft völlig analog zu (i). Man muss nur ‘+’ durch ‘·’, ‘−a’
durcg ‘a−1 ’ und ‘0’ durch ‘1’ ersetzen und entsprechend die Axiome (M1)–(M4)
verwenden.
Korollar 3.2 (i) Eindeutigkeit der neutralen Elemente: Die Zahlen 0 und 1
sind durch ihre Eigenschaften eindeutig festgelegt.
(ii) Eindeutigkeit der additiven und multiplikativen Inversen: Für jedes a ∈ R
ist −a und für jedes a ∈ R \ {0} ist a−1 eindeutig festgelegt.
Beweis. (i) Ist c eine beliebige Zahl (6= 0), so gilt nach Satz 3.1(i)
c+x=c ⇒ x=0
bzw.
c · x = c ⇒ x = 1.
(ii) Nach Satz 3.1(ii) haben die Gleichungen
a+x=0
bzw.
a·x=1
für a ∈ R bzw. a ∈ R \ {0} eine eindeutige Lösung.
Aus den Körperaxiomen folgen alle Rechenregeln der vier Grundrechenarten.
Wir nennen hier exemplarisch die Folgenden.
Satz 3.3 Für reelle Zahlen x, y gilt:
(i) −(−x) = x,
(ii) −(x + y) = −x − y,
(iii) x · 0 = 0,
(iv) (−x)y = −(xy) = x(−y),
(v) (x−1 )−1 = x
(wenn x 6= 0),
(vi) (xy)−1 = x−1 y −1
(wenn x, y 6= 0),
(vii) xy = 0 ⇔ x = 0 ∨ y = 0.
Beweis. (i) Nach (A4) und (A2) gilt
−x + (−(−x)) = 0
und
− x + x = 0.
Aus der Eindeutigkeit des Negativen von −x folgt daher −(−x) = x.
(ii) Aus (A1)–(A4) folgt
x + y + (−x − y) = x + y + ((−y) + (−x))
= x + (y + (−y)) + (−x) = x + 0 + (−x) = x + (−x) = 0
31
und damit −x − y = −(x + y) aus der Eindeutigkeit des Negativen von x + y.
(iii) Nach (A3) und (D) ist x · 0 = x(0 + 0) = x · 0 + x · 0. Mit Satz 3.1(i)
ergibt sich daraus x · 0 = x · 0 − x · 0 = 0.
(iv) Nach (D), (A4), und (iii) ist
xy + x(−y) = x(y − y) = x · 0 = 0,
also x(−y) = −xy.
Angewandt auf x und y mit vertauschten Rollen folgt dann auch (−x)y =
y(−x) = −(yx) = −(xy), wobei wir (M2) benutzt haben.
(v) Das folgt analog zu (i).
(vi) Das folgt analog zu (ii).
(vii) ‘⇐’: Nach (iii) (und (M2)) ist x · 0 = 0 · y = 0.
‘⇒’: Ist x = 0, so ist nichts zu beweisen. Ist dagegen x 6= 0, so folgt aus xy = 0
mit (M2), (M3), (M4), (M1) und (iii)
y = 1 · y = (x−1 x)y = x−1 (xy) = x−1 · 0 = 0.
Bemerkung. All diese Regeln gelten in einem beliebigen Körper. Ein exotischeres Beispiel für einen Körper – und der kleinstmögliche mit nur zwei Elementen
– ist die Menge {0, 1}, wenn die Addition und die Multiplikation gegeben sind
durch
0 + 0 = 0,
0 · 0 = 0,
0 + 1 = 1,
0 · 1 = 0,
1 + 0 = 1,
1 · 0 = 0,
1 + 1 = 0,
1 · 1 = 1.
Wiederholte Anwendung des Assoziativgesetzes (Induktion!) zeigt, dass jede
mögliche Klammerung in endlichen Summen oder Produkten zum gleichen Ergebnis führt, so dass man die Klammern auch ganz weglassen kann. Das haben
wir schon oben ausgenutzt, indem wir
n
X
ak = am + am+1 + . . . + an
und
k=m
n
Y
ak = am · am+1 · . . . · an
k=m
für am , . . . , an ∈ R geschrieben haben. Wiederholte Anwendung des Kommutativgesetzes zeigt, dass für jede Umordnung (Permutation) (k0 , k1 , . . . , kn−m ) von
(m, m + 1, . . . , n) gilt
n
X
k=m
ak =
n−m
X
aki
sowie
i=0
n
Y
k=m
32
ak =
n−m
Y
i=0
aki .
Für Doppelsummen und -produkte mit Zahlen aij , m ≤ i ≤ n, m0 ≤ j ≤ n0 ist
daher
0
n X
n
X
i=m
0
aij =
j=m0
n X
n
X
j=m0
0
aij
n Y
n
Y
sowie
i=m
i=m
0
aij =
j=m0
n Y
n
Y
j=m0
aij .
i=m
Hier wird die Summe bzw. das Prdukt aller aij gebildet. Da es auf die Reihenfolge
nicht ankommt schreibt man dies auch als
X
Y
aij
bzw.
aij .
m≤i≤n
m0 ≤j≤n0
m≤i≤n
m0 ≤j≤n0
Durch wiederholte Anwendung des Distributivgesetzes schließlich ergibt sich
für Zahlen am , . . . , an und bm0 , . . . , bn0
X
n
n0
X
X
ai
bj =
ai b j .
i=m
j=m0
m≤i≤n
m0 ≤j≤n0
Wir definieren hier noch die ganzzahligen Potenzen:
Definition 3.4 Für x ∈ R und n ∈ N setzt man
x0 := 1,
xn := x
. . · x}
| · .{z
(eigtl. per Induktion: xn+1 := xn x),
n-mal
x−n := (x−1 )n , falls x 6= 0.
Es gelten dann die folgenden Rechenregeln:
Satz 3.5 Für n, m ∈ Z und x, y ∈ R (ungleich 0, wenn der entsprechende Exponent negativ ist) ist
(i) xn xm = xn+m ,
(ii) (xn )m = xnm ,
(iii) xn y n = (xy)n .
Beweis. Übung!
33
3.2
Die Anordnungsaxiome
Mit reellen Zahlen lässt sich nicht nur rechnen, man kann sie auch der Größe
nach vergleichen. Dies wird in den Anordnungsaxiomen formalisiert: In R gibt es
eine Menge R+ ⊂ R, deren Elemente positive Zahlen heißen, mit den folgenden
Eigenschaften:
(O1) Trichotomie: Für jedes x ∈ R gilt genau eine der folgenden Aussagen:
x ∈ R+ ,
−x ∈ R+ .
x = 0,
(O2) Verträglichkeit mit der Addition: Für x, y ∈ R+ ist auch x + y ∈ R+ .
(O3) Verträglichkeit mit der Multiplikation: Für x, y ∈ R+ ist auch xy ∈ R+ .
Statt x ∈ R+ schreiben wir auch x > 0 (sprich: ‘x ist größer als 0’). Gilt −x ∈ R+ ,
so sagen wir, x sei negativ. Allgemeiner setzen wir dann für x, y ∈ R:
x>y
x≥y
x<y
x≤y
:⇔
:⇔
:⇔
:⇔
x − y > 0,
x > y ∨ x = y,
y > x,
y≥x
(sprich:
(sprich:
(sprich:
(sprich:
x
x
x
x
größer y)
größer/gleich y)
kleiner y)
kleiner/gleich y).
Bemerkung. Ein Körper, der den Anordnungsaxiomen (O1), (O2) und (O3)
genügt, heißt angeordneter Körper. Auch Q ist ein solcher.
Beachte: Nach (O1) ist für x 6= y immer entweder x > y oder x < y, denn
entweder ist x − y > 0 oder −(x − y) = y − x > 0.
Es gelten die folgenden Regeln für die Manipulation von Ungleichungen.
Satz 3.6
(i) Für reelle Zahlen x, y, x0 , y 0 gilt
x>y
x≥y
x<y
x≤y
∧
∧
∧
∧
x0
x0
x0
x0
≥ y0
≥ y0
≤ y0
≤ y0
x + x0
x + x0
x + x0
x + x0
⇒
⇒
⇒
⇒
> y + y0,
≥ y + y0,
< y + y0,
≤ y + y0.
(ii) Für x, y, z ∈ R gilt
x>y
x≥y
x>y
x≥y
∧
∧
∧
∧
z
z
z
z
>0
>0
<0
<0
⇒
⇒
⇒
⇒
xz
xz
xz
xz
> yz,
≥ yz,
< yz,
≤ yz.
Entsprechende Aussagen gelten für x < y bzw. x ≤ y.
34
(iii) Für x, y ∈ R gilt
x≥0 ∨ y≥0
xy > 0
⇒
⇔
xy ≥ 0,
(x > 0 ∧ y > 0) ∨ (x < 0 ∧ y < 0).
(iv) Für alle x ∈ R ist x2 ≥ 0. Insbesondere ist 1 > 0.
(v) Für x ∈ R \ {0} ist
x>0
⇔
x−1 > 0.
(vi) Für reelle x, y gilt
⇒
x>y>0
x−1 < y −1 .
Beweis. (i) Wir zeigen nur die beiden ersten Implikationen:
x > y ∧ x0 ≥ y 0 ⇒ x − y > 0 ∧ x0 − y 0 > 0 ∨ x0 = y 0
⇒ x − y > 0 ∧ x0 − y 0 > 0 ∨ x − y > 0 ∨ x0 = y 0
(O2)
⇒ x − y + x0 − y 0 > 0
| {z } | {z }
∈R+
∈R+ ∪{0}
⇒ x + x0 > y + y 0
und
x ≥ y ∧ x0 ≥ y 0 ⇒
(O2)
⇒
x − y > 0 ∨ x = y ∧ x0 − y 0 > 0 ∨ x0 = y 0
x − y + x0 − y 0 > 0 ∨ x = y ∧ x 0 = y
⇒ x + x0 ≥ y + y 0 .
Die anderen beiden Implikationen folgen daraus und der Definition von < und ≤
unmittelbar.
(ii) Es genügt, die erste und die dritte Implikation zu beweisen. Die anderen
ergeben sich daraus direkt, da dann nur noch der Fall x = y zu betrachten bleibt.
Sie folgen aus
x>y∧z >0 ⇒ x−y >0∧z >0
(O3)
⇒ xz − yz = (x − y)z > 0
⇒ xz > yz
35
bzw.
x > y ∧ z < 0 ⇒ x − y > 0 ∧ −z > 0
(O3)
⇒ yz − xz = (x − y)(−z) > 0
⇒ yz > xz.
(iii) Für x, y > 0 ist nach (O3) auch xy > 0. Für x > 0 und y < 0 ist wegen
(O3) −xy = x(−y) > 0 und damit xy < 0. Genauso folgt aus x < 0 und y > 0
auch xy < 0. Sind x, y beide negativ, so folgt wieder mit (O3) xy = (−x)(−y) > 0.
Nach Satz 3.3(vii) ist außerdem xy = 0 ⇔ x = 0 ∨ y = 0. Aus all dem folgen die
Behauptungen.
(iv) Dies folgt aus (iii) mit x = y und 1 = 12 , da nach Axiom (N) 1 6= 0 ist.
(v) Nach (iv) ist xx−1 = 1 > 0. Nach (iii) sind daher x und x−1 beide positiv
oder beide negativ.
(vi) Nach (v) und (O3) ist x−1 y −1 > 0. Mit Hilfe von (ii) für z = x−1 y −1 folgt
dann
y −1 = xx−1 y −1 > yx−1 y −1 = x−1 .
Die Beziehungen ≥ und ≤ definieren eine Ordnungsrelation auf R. Wir formulieren dies im folgenden Satz nur für ≥. Entsprechende Regeln gelten dann
aber (offensichtlich!) auch für ≤.
Satz 3.7 Für alle x, y, z ∈ R gelten:
(i) Reflexivität: x ≥ x,
(ii) Antisymmetrie: x ≥ y ∧ y ≥ x ⇒ x = y,
(iii) Transitivität: x ≥ y ∧ y ≥ z ⇒ x ≥ z.
Beweis. (i) Klar.
(ii) Durch Kontraposition: Wie oben bemerkt gilt x 6= y ⇒ x < y ∨ x > y.
(iii) Aus Satz 3.6 folgt
x ≥ y ∧ y ≥ z ⇒ x + y ≥ y + z ⇒ x = x + y − y ≥ y + z − y = z.
Da für zwei Zahlen x, y immer x ≥ y oder y ≥ x (genauso für ≤) gilt, nennt
man dies auch eine totale Ordnung.
Wir halten fest: Für den Umgang mit den Relationen >, <, ≥ und ≤ gelten
die Ihnen aus der Schule bekannten Regeln. Wir haben sie nun auf eine feste
axiomatische Grundlage gelegt.
36
Definition 3.8 Der Absolutbetrag (oder Betrag) einer Zahl x ist
(
x,
x ≥ 0,
|x| =
−x, x < 0.
Satz 3.9
(i) Für alle x ∈ R gilt
|x| ≥ 0
|x| = 0 ⇔ x = 0.
sowie
(ii) Für alle x ∈ R gilt
| − x| = |x|
|x−1 | = |x|−1 (falls x 6= 0).
sowie
(iii) Für alle x, y ∈ R ist
|xy| = |x| |y|.
(iv) Dreiecksungleichung1 : Für alle x, y ∈ R ist
|x + y| ≤ |x| + |y|.
(v) Umgekehrte Dreiecksungleichung: Für alle x, y ∈ R ist
|x − y| ≥ |x| − |y|.
Beweis. (i) Klar.
(ii) Für x > 0 ist −x < 0 also | − x| = −(−x) = x > 0. Für x ≤ 0 ist −x ≥ 0
also auch | − x| = −x ≥ 0.
Für x > 0 ist nach Satz 3.6(v) auch x−1 > 0 also |x−1 | = x−1 > 0. Für x < 0
ist nach Satz 3.6(v) auch x−1 < 0 also |x−1 | = −x−1 > 0.
(iii) Die Behauptung ist nach (i) klar für x = 0 ∨ y = 0. Für x 6= 0, y 6= 0 gilt
nach Satz 3.6(iii)

xy = |xy|,
falls x > 0, y > 0,



(−x)y = −xy = |xy|,
falls x < 0, y > 0,
|x| |y| =

x(−y) = −xy = |xy|,
falls x > 0, y < 0,



(−x)(−y) = xy = |xy|, falls x < 0, y < 0.
(iv) Wegen x ≤ |x|, y ≤ |y|, −x ≤ |x| und −y ≤ |y| ist
x + y ≤ |x| + |y|
sowie
− (x + y) = −x − y ≤ |x| + |y|.
Dann aber muss auch
|x + y| ≤ |x| + |y|
1
Woher der Name kommt, wird im Abschnitt 3.5 klar werden.
37
gelten.
(v) Wendet man die Dreiecksungleichung auf x − y und y an, so folgt
|x − y| = |x − y| + |y| − |y| ≥ |x − y + y| − |y| = |x| − |y|,
Indem man die Rollen von x und y vertauscht, ergibt sich auch
|x − y| = |y − x| ≥ |y| − |x| = −(|x| − |y|).
Mit diesen beiden Abschätzungen ist dann aber |x − y| ≥ |x| − |y|.
Für x, y ∈ R ist
(
x − y, falls x ≥ y,
.
|x − y| =
y − x, falls y ≥ x,
Man nennt |x − y| daher auch den Abstand von x zu y.
In der Analysis sind Abschätzungen, also Ungleichungen besonders wichtig.
Wir werden im Laufe des Vorlesungszyklus einige nützliche Ungleichungen beweisen. Erste Beispiele geben die beiden folgenden Sätze.
Satz 3.10 (Die Bernoullische Ungleichung) Für alle n ∈ N0 und x ∈ R mit
x ≥ −1 gilt
(1 + x)n ≥ 1 + nx.
Beweis. Mit Induktion: Der Fall n = 0 ist klar. Ist die Behauptung für n gezeigt,
so ergibt sich wegen 1 + x ≥ 0
(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 + x)
= 1 + nx + x + nx2 ≥ 1 + (n + 1)x.
Satz 3.11 Für das arithmetische Mittel
x+y
2
x<y ⇒ x<
zweier reeller Zahlen x, y gilt
x+y
< y.
2
Beweis. Dies folgt aus
x=
x x
x y
y y
+ < + < + = y.
2 2
2 2
2 2
Zum Schluss dieses Abschnitts führen wir noch eine spezielle Klasse von Teilmengen in R ein: Die Intervalle.
38
Definition 3.12 Für a, b ∈ R mit a < b (bzw. a ≤ b im vierten Fall) setzt man:
(a, b) := {x ∈ R : a < x < b},
[a, b) := {x ∈ R : a ≤ x < b},
(a, b] := {x ∈ R : a < x ≤ b},
[a, b] := {x ∈ R : a ≤ x ≤ b},
(−∞, b) := {x ∈ R : x < b},
(−∞, b] := {x ∈ R : x ≤ b},
(a, ∞) := {x ∈ R : a < x},
[a, ∞) := {x ∈ R : a ≤ x},
(−∞, ∞) := R.
Man nennt diese Mengen Intervalle. In den ersten vier Fällen sagt man, die
Intervalle seien endlich; die übrigen sind unendlich.
Die Intervalle (a, b), (−∞, b), (a, ∞) nennt man offen, [a, b), (a, b] sind halboffen,
[a, b], (−∞, b], [a, ∞) heißen abgeschlossen, (−∞, ∞) ist sowohl offen als auch abgeschlossen.2
Die Länge der endlichen Intervalle ist definiert als
|(a, b)| = |[a, b)| = |(a, b]| = |[a, b]| = b − a.
Beispiel. Für x ∈ R und r ∈ R+ ist
{y ∈ R : |y − x| < r} = (x − r, x + r).
Überlegen Sie sich das!
3.3
Zum Aufbau des Zahlensystems
Bisher haben wir mit den Mengen N, Z, Q und – zumindest vor Kapitel 3 –
auch mit R ‘naiv’, also wie aus der Schule bekannt gerechnet. Wir wollen diese
Zahlbereiche nun auf eine gefestigte axiomatische Grundlage stellen, wobei nur
die bisher eingeführten Axiome von R verwendet werden. Sie müssen also für
diesen Abschnitt zunächst vergessen, was die natürlichen, ganzen und rationalen
Zahlen sind und was wir über diese Zahlen schon bewiesen haben. Wir definieren
diese Zahlbereiche dann hier als gewisse Teilmengen von R. Die Regeln für das
Rechnen und Anordnen übertragen sich direkt auf diese Mengen. Insbesondere
werden wir aus den Axiomen für R das Induktionsprinzip für N ableiten. Mit
diesem Wissen können sie dann noch einmal zurückblättern, sich wieder an alles
erinnern und feststellen, dass sich auch die schon früher gezeigten Aussagen aus
den Axiomen für R beweisen lassen.
2
Die Begriffe offen und abgeschlossen werden später noch für viel allgemeinere Mengen definiert werden.
39
Definition 3.13 Eine Menge M ⊂ R heißt induktiv, wenn gilt:
(i) 1 ∈ M und
(ii) a ∈ M ⇒ a + 1 ∈ M .
Beispiel. R, R+ , {x ∈ R : x ≥ 1} sind induktiv.
LemmaT3.14 Ist (Mi )i∈I eine Familie von induktiven Mengen, so ist auch der
Schnitt i∈I Mi induktiv.
T
T
Beweis. Wegen 1 ∈ Mi für alle i ∈ I gilt auch 1 ∈ i∈I Mi . Ist a ∈ i∈I Mi , so
gilt a ∈ TMi für jedes i und somit auch a + 1 ∈ Mi für jedes i, also in der Tat
a + 1 ∈ i∈I Mi .
Definition 3.15 Die Menge N der natürlichen Zahlen ist
\
M.
N :=
M induktiv
D.h.: N ist der Durchschnitt aller induktiven Mengen in R und also Teilmenge
einer jeden induktiven Menge. Nach dem vorigen Lemma ist N selbst induktiv.
Das Induktionsprinzip lässt sich nun so formulieren:
Satz 3.16 (Induktionsprinzip) Ist M ⊂ N induktiv, so gilt M = N.
Direkt aus den obigen Beispielen sieht man, dass N ⊂ R+ ist, so dass natürliche Zahlen positiv sind, und dass sogar N ⊂ {x ∈ R : x ≥ 1} gilt. 1 ist also die
kleinste natürliche Zahl.
Um eine Aussage A(n) für natürlich Zahlen zu beweisen, setzt man dann
einfach M = {n ∈ N : A(n) stimmt}. (Um eine Aussage der Form ∀ n ≥ n0 : A(n)
zu beweisen, betrachtet man M = {n ∈ N : n < n0 ∨ (n ≥ n0 ∧ A(n))}.)
Beweis von Satz 3.16. Nach Voraussetzung ist M ⊂ N. Da M induktiv ist, gilt
aber auch N ⊂ M . Es folgt M = N.
Die Summen- und Produktbildung führt nicht aus N hinaus:
Satz 3.17 Die Summe m + n und das Produkt mn zweier natürlicher Zahlen
m, n ist wieder eine natürliche Zahl.
Man sagt auch, N sei bezüglich + und · abgeschlossen.
Beweis. 1. Summen: Ist n ∈ N gegeben, so betrachten wir M = {m ∈ N : n+m ∈
N}. Da N induktiv ist und somit n + 1 ∈ N ist, gilt 1 ∈ M . Aus demselben Grund
folgt
m ∈ M ⇒ n + m ∈ N ⇒ n + m + 1 ∈ N ⇒ m + 1 ∈ M.
M ⊂ N ist also induktiv, d.h. M = N.
40
2. Produkte: Es sei für festes n ∈ N nun M = {m ∈ N : nm ∈ N}. Offenbar
ist 1 ∈ M . Da – wie schon gezeigt – Summen nicht aus N hinausführen, ist zudem
m ∈ M ⇒ nm ∈ N ⇒ n(m + 1) = nm + n ∈ N ⇒ m + 1 ∈ M.
Dies zeigt M = N.
Dass N tatsächlich so beschaffen ist, wie wir das gewohnt sind, und sich der
Größe nach anordnen lässt durch
1 < 2 := 1 + 1 < 3 := 1 + 1 + 1 + . . . ,
wird im folgenden Satz präzisiert.
Satz 3.18 Für alle n ∈ N gilt: Es gibt kein m ∈ N mit n < m < n + 1.
Beweis. Wir zeigen dies, indem wir nachweisen, dass
M = {n ∈ N : Es gibt kein m ∈ N mit n < m < n + 1}
induktiv ist.
1. Die Menge M1 = {1} ∪ {x ∈ R : x ≥ 2 = 1 + 1} ist induktiv: Offenbar gilt
1 ∈ M1 . Ist x ∈ M1 , so ist entweder x = 1 und damit 1 + 1 = 2 ∈ M1 oder x ≥ 2
und daher auch x + 1 ≥ 2. Das zeigt N ⊂ M1 , so dass zwischen 1 und 2 keine
natürliche Zahl liegt: Es gilt 1 ∈ M .
2. Wir überlegen uns zunächst, dass für jedes n ∈ N die folgende Aussage
richtig ist: n = 1 oder n − 1 ∈ N. Dies folgt wieder daraus, dass die fragliche
Menge
M2 = {n ∈ N : n = 1 ∨ n − 1 ∈ N}
induktiv ist: Es ist 1 ∈ M2 und n ∈ M2 impliziert (trivialerweise) n ∈ N. Dann
aber ist n + 1 ∈ N und (n + 1) − 1 = n ∈ N, also auch n + 1 ∈ M2 .
3. Es sei nun n ∈ M . Wäre n + 1 ∈
/ M , so gäbe es ein m ∈ N mit n + 1 <
m < n + 2. Wegen m > n + 1 ∈ N muss m 6= 1 sein. Nach 2. ist dann aber auch
m − 1 ∈ N, wobei n < m − 1 < n + 1 ist. Dies widerspricht n ∈ M .
Aus diesem Satz nun lässt sich das Wohlordnungsprinzip der natürlichen Zahlen gewinnen.
Satz 3.19 (Wohlordnungsprinzip) Jede nicht leere Menge natürlicher Zahlen
besitzt ein kleinstes Element
Beweis. Um einen Widerspruchsbeweis zu führen, nehmen wir an, dass es eine
Menge M ⊂ N, M 6= ∅, gibt, die kein kleinstes Element besitzt. D.h.: Es gibt
kein m ∈ M mit m ≤ x für alle x ∈ M . Definiere
L = {n ∈ N : n ≤ x für alle x ∈ M }.
41
L ist induktiv: 1 ∈ L ist klar. Es sei nun n ∈ L und insbesondere n ≤ x für alle
x ∈ M . Es gilt n ∈
/ M , denn sonst wäre n ein kleinstes Element von M . Da es
nach Satz 3.18 kein Element von M zwischen n und n + 1 geben kann, muss dann
auch n + 1 ∈ L gelten. Damit ist L als induktiv nachgewiesen, d.h. L = N. Da
M nicht leer ist, gibt es ein x0 ∈ M . Wegen x0 + 1 ∈ N folgt der Widerspruch
x0 + 1 ≤ x0 .
Die übrigen Zahlbereiche ergeben sich aus N nun wie folgt:
Definition 3.20 Es seien
(i) N0 := N ∪ {0} die natürlichen Zahlen mit 0,
(ii) Z := N ∪ {0} ∪ {−n : n ∈ N} die Menge der ganzen Zahlen und
(iii) Q := { pq : p ∈ Z, q ∈ Z \ {0}} die Menge der rationalen Zahlen.
Es ist nicht schwer zu sehen, dass die Summen- und Produktbildung in N0 ,
Z bzw. Q nicht aus den jeweiligen Mengen hinausführt. Z enthält mit jeder Zahl
auch ihr Negatives, Q enthält mit jeder Zahl bzw. jeder von 0 verschiedenen Zahl
auch deren Negatives bzw. Inverses.
Bemerkung. Diese Mengen lassen sich in jedem angeordneten Körper definieren.
3.4
Das Vollständigkeitsaxiom
Wir benötigen noch ein letztes Axiom, das – anschaulich gesagt – garantiert, dass
R ‘keine Löcher hat’. Wir formulieren es erst und erklären die dabei auftretenden
Begriffe gleich im Anschluss. Das Vollständigkeitsaxiom besagt:
(V) In R besitzt jede nach oben beschränkte nicht leere Teilmenge ein Supremum.
Definition 3.21 Es sei M ⊂ R.
(i) a ∈ R heißt
– obere Schranke für M , wenn für alle x ∈ M gilt x ≤ a,
– untere Schranke für M , wenn für alle x ∈ M gilt x ≥ a.
(ii) Besitzt M eine obere (oder untere) Schranke, so nennt man M nach oben
(bzw. nach unten) beschränkt. Ist M nach oben und nach unten beschränkt,
so heißt M schlicht beschränkt.
(iii) a ∈ R heißt
– Supremum von M , wenn a obere Schranke von M ist und für jede
obere Schranke a0 von M gilt a ≤ a0 ,
42
– Infimum von M , wenn a untere Schranke von M ist und für jede untere
Schranke a0 von M gilt a ≥ a0 .
Wir schreiben dann a = sup M bzw. a = inf M .
Ein Supremum nennt man daher auch kleinste obere Schranke, ein Infimum
auch größte untere Schranke von M . Beachten Sie: Ein Supremum bzw. Infimum,
so es denn existiert, muss nicht in der Menge M selbst liegen. Äquivalent zu (V)
hätte man auch die Existenz eines Infimums für nach unten beschränkte Mengen
fordern können, wie sich gleich aus Satz 3.24 ergeben wird.
Nicht jede Teilmenge von R hat eine obere bzw. untere Schranke. (Z.B. gibt
es für R selbst kein a ∈ R mit x ≤ a für alle x ∈ R.) Es gilt aber:
Lemma 3.22 Ist M ⊂ R nach oben (nach unten) beschränkt, so ist das Supremum (bzw. Infimum) von M eindeutig.
Beweis. Sind a1 und a2 Suprema von M , also insbesondere obere Schranken, so
gilt a1 ≤ a2 und a2 ≤ a1 . Dies zeigt a1 = a2 . Analog argumentiert man für Infima.
Dieses Lemma rechtfertigt auch die Schreibweisen sup M und inf M . Wir vereinbaren noch, sup M = +∞ für nicht nach oben, inf M = −∞ für nicht nach
unten beschränkte M zu schreiben und für die leere Menge sup ∅ = −∞ sowie
inf ∅ = +∞ zu setzen. +∞ und −∞ zwar sind keine reellen Zahlen. Fügt man
diese Größen den reellen Zahlen hinzu, so erhält man den erweiterten Zahlbereich
R = R ∪ {−∞, +∞}. Auch auf R lässt sich – mit Vorsicht!! – rechnen, was wir
hier aber nicht vertiefen wollen. Die Ordnungsrelationen jedoch lassen sich leicht
auf R erweitern, indem man +∞ > x und −∞ < x für alle x ∈ R definiert.
Definition 3.23 Es sei M ⊂ R eine nach oben (unten) beschränkte Menge. Gilt
sup M ∈ M (bzw. inf M ∈ M ) so schreiben wir auch sup M = max M (bzw.
inf M = min M ) und nennen diesen Wert das Maximum (Minimum) von M .
Beispiele.
1. Endliche Intervalle sind beschränkt. Für reelle a < b ist
inf(a, b) = inf[a, b) = inf(a, b] = inf[a, b] = a,
sup(a, b) = sup[a, b) = sup(a, b] = sup[a, b] = b.
(Dies gilt für die in diesem Fall definierten Intervalle auch noch für a, b ∈ R.)
Für reelle a < b ist
min[a, b) = min[a, b] = a
und
max(a, b] = max[a, b] = b.
Die übrigen Suprema/Infima sind keine Maxima/Minima.
43
2. Jede endliche Menge reeller Zahlen ist beschränkt und besitzt ein Minimum
sowie ein Maximum.
3. N ist nicht nach oben beschränkt. Ansonsten gäbe es nach (V) eine kleinste
obere Schranke x0 ∈ R für N. Da mit n auch n + 1 natürlich ist, gilt dann
für alle n ∈ N auch n + 1 ≤ x0 , also n ≤ x0 − 1. Auch x0 − 1 ist damit eine
obere Schranke von N im Widerspruch zur Minimalität von x0 .
4. Die Menge M = {x ∈ Q : x2 ≤ 2} ist nach oben beschränkt, etwa durch 2.
(x > 2 ⇒ x2 > 4 > 2.) Wegen 1 ∈ M gilt 1 ≤ sup M ≤ 2.
2
Bemerkung.
√ Im letzten Beispiel wird sich zeigen, dass (sup M ) = 2 (also
sup M = 2) ist. Im Körper Q selbst hat diese Menge kein Supremum. Dies
zeigt, dass Q nicht vollständig ist.
Für M ⊂ R sei −M = {x ∈ R : −x ∈ M }.
Satz 3.24 (i) a ist obere Schranke für M ⊂ R genau dann, wenn −a eine
untere Schranke für −M ist.
(ii) a ist Supremum von M genau dann, wenn −a Infimum von −M ist.
Beweis. (i) Dies folgt aus
∀ x ∈ M : x ≤ a ⇔ ∀ x ∈ M : −x ≥ −a ⇔ ∀ y ∈ −M : y ≥ −a.
(ii) Ist a = sup M , so ist −a nach (i) eine untere Schranke für −M . Ist auch r
eine solche, so ist wiederum nach (i) −r eine obere Schranke von M = −(−M ).
Dann aber ist −r ≥ a und somit r ≤ −a. Damit ist −a = inf M nachgewiesen.
Die Umkehrung folgt analog.
Satz 3.25 Für alle x, y ∈ R mit x, y > 0 gibt es ein n ∈ N mit nx > y.
Beweis. Anderenfalls wäre xy eine obere Schranke von N.
Bemerkung Man bezeichnet die Aussage dieses Satzes auch als das archimedische Axiom. In unserem Axiomensystem ist es eine Folgerung aus den Körper-,
Anordnungs- und Vollständigkeitsaxiomen. Ohne (V) muss Satz 3.25 nicht gelten.
Einen angeordneten Körper, in dem dieser Satz gilt, nennt man auch archimedisch
angeordnet.
Korollar 3.26
(i) Für jedes ε > 0 gibt es ein n ∈ N, so dass 0 <
1
n
< ε gilt.3
(ii) Ist q > 1, so gibt es für jedes K > 0 ein n ∈ N mit q n > K.
3
Genauer natürlich: Für jedes ε ∈ R mit ε > 0 . . . . – Im Folgenden lassen wir das ‘∈ R’
bisweilen weg und verabreden, dass in Ausdrücke wie ‘Sei x > 0’ oder ‘Für alle x > 0’ o.ä. x
als reell vorausgesetzt wird, wenn es nicht ausdrücklich anders spezifiziert ist.
44
(iii) Ist 0 < q < 1, so gibt es für jedes ε > 0 ein n ∈ N mit 0 < q n < ε.
Beweis. (i) Wähle n > 1ε .
(ii) Schreibt man q = 1 + x, so folgt aus der Bernoullischen Ungleichung
q n = (1 + x)n ≥ 1 + nx > nx. Die Behauptung stimmt also für n ≥ Kx .
(iii) Nach (ii) gibt es ein n ∈ N mit q1n = ( 1q )n > 1ε , also (0 <) q n < ε.
Der folgende Satz besagt, dass Q in R ‘dicht liegt’, obwohl es – wie wir in
Satz 3.30 sehen werden – ‘viel mehr’ reelle als rationale Zahlen gibt.
Satz 3.27 Ist x ∈ R, so gibt es zu jedem ε > 0 ein r ∈ Q mit |x − r| < ε.
Beweis. Wir zeigen, dass es zu jedem x ∈ R und q ∈ N ein p ∈ Z gibt mit
|x − pq | ≤ 1q . Nach Korollar 3.26 folgt hieraus die Behauptung.
Für x = 0 ist das klar. Für x > 0 sei p das minimale Element in {p ∈ N : x ≤
p
}, welches nach Satz 3.19 ja existiert. Falls p > 1 ist, muss dann p−1
< x ≤ pq
q
q
gelten. Ist p = 1, so ist 0 < x ≤ 1q . In jedem Fall folgt |x − pq | < 1q .
Für x < 0 wähle p ∈ N mit | − x − pq | < 1q , so dass dann |x − −p
| < 1q ist. q
Korollar 3.28 Zu x1 , x2 ∈ R mit x1 < x2 gibt es ein r ∈ Q mit x1 < r < x2 .
2
Beweis. Wähle r ∈ Q mit | x1 +x
− r| <
2
x2 −x1
.
2
Dann ist tatsächlich
x2 − x1 x 2 − x1
x1 + x2 x2 − x1
+
>−
+
= 0,
2
2
2
2
x2 − x 1 x1 + x2
x2 − x1 x2 − x1
x2 − r =
+
−r >
−
= 0.
2
2
2
2
r − x1 = r −
Eine weitere wichtige Konsequenz aus (V) ist der folgende Existenzsatz über
Elemente in ineinandergeschachtelten Intervallen.
Satz 3.29 (Intervallschachtelungsprinzip) Es seien I1 , I2 , I3 , . . . endliche abgeschlossene Intervalle mit I1 ⊃ I2 ⊃ I3 ⊃ . . ..
T
(i) Dann ist n∈N In 6= ∅.
(ii) Gibt es für jedes ε ∈ R mit T
ε > 0 ein n ∈ N, so dass |In | < ε gilt, so gibt
es genau eine reelle Zahl in n∈N In .
Beweis. (i) Ist In = [an , bn ], so gilt
a1 ≤ a2 ≤ a3 ≤ . . . ≤ b 3 ≤ b 2 ≤ b 1 .
Da also A = {a1 , a2 , . . .} (etwa durch b1 ) nach oben beschränkt und B = {b1 , b2 , . . .}
(etwa durch a1 ) nach unten beschränkt ist, existieren sup A und inf B. Da jedes
45
bn obere Schranke von A ist, gilt auch sup A ≤ bnTfür alle n ∈ N. Das aber zeigt,
dass für alle n gilt sup A ∈ [an , bn ], also sup A ∈ n∈N
T In .
0
(ii) Gäbe es zwei verschiedene Punkte x, x ∈ n∈N In , so wählen wir ε =
|x − x0 |. Nach Voraussetzung gibt es ein n mit |In | < ε. Anderereits folgt aus
x, x0 ∈ In auch |In | ≥ |x − x0 | = ε. Widerspruch.
Bemerkung. Die Aussage von Satz 3.29 ist – auf der Basis der übrigen Axiome – sogar äquivalent zum Vollständigkeitsaxiom (V). Man hätte also ebensogut
die Aussage dieses Satzes zu einem Axiom erklären können und dann die Supremumseigenschaft nach oben beschränkter Mengen als Satz beweisen können.
Als Anwendung dieses Satzes zeigen wir, dass R (im Gegensatz zu Q) ‘viel
größer’ als N ist:
Satz 3.30 R ist überabzählbar.
Beweis. Es genügt zu zeigen, dass keine Abbildung von N nach R surjektiv ist.
Zu f : N → R definieren dazu induktiv:
• I1 ⊂ [0, 1] sei ein abgeschlossenes Intervall der Länge
1
3
mit f (1) ∈
/ I1 .
• Ist In schon gewählt, so nehmen wir In+1 ⊂ In als abgeschlossenes Intervall
/ In+1 .
der Länge 31n mit f (n + 1) ∈
I1 kann man hierbei als eines der Intervalle [0, 13 ] oder [ 23 , 1] wählen, die ja nicht
beide f (1) enthalten können. Ist In = [an , an + 31n ] schon konstruiert, so wählen
1
2
wir als In+1 etwa dasjenige der Intervalle [an , an + 3n+1
], [an + 3n+1
, an + 31n ], das
f (n + 1) nicht enthält.
T
Für jedes n ist dann f (n) ∈
/ k∈N Ik , obwohl diese Menge nicht leer ist. f ist
also nicht surjektiv.
2
Wir können nun auch endlich garantieren, dass die Gleichung x = 2 in R
lösbar ist. Allgemein gilt:
Satz 3.31 Zu jeder reellen Zahl y ≥ 0 und jedem k ∈ N gibt es genau ein reelles
x ≥ 0 mit xk = y.
Bemerkung. Wir werden dies gleich mit Hilfe einer Intervallschachtelung und
damit mehr oder weniger direkt aus den Axiomen von R ableiten. Später, wenn
wir schon wesentlich mehr Theorie entwickelt haben werden, wird sich dieser Satz
in wenigen Zeilen beweisen lassen.
Wir schicken dem Beweis die folgende Übungsaufgabe voraus:
Übung. Für a, b ∈ R, n ∈ N gilt
n
n
b −a = b−a b
n−1
+b
n−2
a + . . . + ba
n−2
+a
n−1
n−1
X
n−1−k k
= (b − a)
b
a .
k=0
46
Beweis von Satz 3.31. Es sei zunächst y > 1. Wir konstruieren eine Intervallschachtelung I1 = [a1 , b1 ] ⊃ I2 = [a2 , b2 ] ⊃ . . ., so dass für alle n ∈ N gilt
akn ≤ y ≤ bkn
sowie
|In+1 | = 12 |In |.
Dazu definieren wir die In induktiv mit dem Intervallhalbierungsverfahren:
Für n = 1 setzen wir [a1 , b1 ] = [1, y], so dass ak1 = 1k ≤ y ≤ y k = bk1 gilt.
Ist In mit den geforderten Eigenschaften schon definiert, so setzen wir
(
n
n k
[an , an +b
], falls ( an +b
) ≥ y,
2
2
In+1 = an +bn
an +bn k
[ 2 , bn ], falls ( 2 ) < y.
Dann genügt auch In+1 den geforderten Bedingungen.
1
Induktiv ergibt sich, dass |In | = 2n−1
|I1 | ist, womit nach Korollar 3.26(ii)
zu jedem
ε > 0 ein n ∈ N mit |In | < ε existiert. Gemäß Satz 3.29 gibt es ein
T
x ∈ n∈N In .
Wir betrachten nun die Intervalle Jn = [akn , bkn ]. Offensichtlich ist Jn+1 ⊂ Jn
für alle n. Indem man n ∈ N zu gegebenem ε > 0 mit ( 21 )n−1 < kbεk wählt, was
1
nach Korollar 3.26(ii) möglich ist, lässt sich die Länge von Jn abschätzen durch
|Jn | = bkn − akn
k−2
= (bn − an )(bnk−1 + bk−2
+ ak−1
n an + . . . + b n an
n )
1
ε
1
kbk = ε.
≤ n−1 kbkn ≤ n−1 kbk1 <
2
2
kbk1 1
Nun ist wegen x ∈ In für alle n auch xk ∈ Jn für alle n. Nach Konstruktion
gilt aber auch y ∈ Jn für alle n. Gemäß Satz 3.29(ii) muss dann aber xk = y
gelten.
Die behauptete Eindeutigkeit ist einfacher zu sehen: Für alle x0 > 0 mit x0 6= x
gilt entweder x0 < x und somit auch (x0 )k < xk = y oder aber x0 > x und somit
auch (x0 )k > xk = y.
Im Fall 0 < y < 1 folgt die Behauptung nun aus dem schon Gezeigten und
der Beobachtung xk = y ⇔ (x−1 )k = y −1 . Die Fälle y = 0 und y = 1 schließlich
sind trivial.
Definition 3.32 Ist y ∈ R nicht negativ, k ∈ N, so nennt man die eindeutige
√
reelle Zahl x ≥ 0 mit xk = y die k-te Wurzel von y und schreibt x = k y oder
1
√
auch x = y k . Für k = 2 schreibt man auch nur x = y.
Wir bemerken noch, dass die k-ten Wurzeln die folgende Monotonieeigenschaft
besitzen:
√
√
k
0 ≤ y1 < y2 ⇒
y1 < k y2 .
47
Dies ergibt sich einfach durch Kontraposition, denn
√
√
( k y1 )k ≥ ( k y2 )k = y2 (Induktion nach k).
√
√
k y ≥ k y
1
2 impliziert y1 =
Übung. Zeigen
Sie, dass für die Menge M aus Beispiel 4 von Seite 44 tatsächlich
√
sup M = 2 ist.
Bemerkung. Zum Ende dieses Abschnitts bemerken wir noch, dass R ‘bis auf
Isomorphie’ als vollständiger angeordneter Körper eindeutig ist. D.h.: Ist etwa R̃
ein weiterer vollständiger angeordneter Körper, so gibt es eine (eindeutige) Bijektion R → R̃, die sämtliche Strukturen erhält. (Das Bild einer Summe ist die
Summe der Bilder, genauso für Produkte, die neutralen und inversen Elemente in
R werden auf die entsprechenden in R̃ abgebildet, die Anordnungsrelation bleibt
erhalten u.s.w.) Von unserem Standpunkt lassen sich R und R̃ schlicht nicht unterscheiden. Obwohl der Beweis nicht allzu schwierig ist, verzichten wir darauf,
ihn hier anzugeben, da er für das Folgende nicht von Belang ist. Eine Selbstverständlichkeit ist dies jedoch nicht. Schließlich mussten wir bis zum letzten
Axiom (V) warten, um endlich R und Q unterscheiden zu können.
3.5
Die komplexen Zahlen
In den natürlichen Zahlen allein kann man nicht uneingeschränkt subtrahieren:
Die elementare Gleichung
a+x=b
besitzt selbst für a, b ∈ N nicht immer eine Lösung x ∈ N. In Z dagegen ist sie
lösbar – sogar für alle a, b ∈ Z. Die Gleichung
(a 6= 0)
ax = b
ist jedoch auch in Z im Allgemeinen nicht lösbar. Wohl aber in Q – sogar für
alle a, b ∈ Q (a 6= 0). Auch Q jedoch genügt unseren Ansprüchen noch nicht,
da es nicht vollständig ist und insbesondere im Allgemeinen keine Lösungen der
Gleichung
x2 = b
(b ≥ 0)
zulässt. Selbst in R gibt es nun immer noch elementare Gleichungen, die keine
Lösungen besitzen:
x2 = −1
kann für keine reelle Zahl x gelten, da ja immer x2 ≥ 0 und −1 < 0 ist.
Dennoch möchten wir in der Mathematik diese Gleichung lösen können – aus
vielerlei Gründen, die sich Ihnen so richtig wohl erst dann erschließen, wenn Sie
im Laufe Ihres Studiums sehen, was man damit machen kann. Dies führt uns
zum Zahlbereich der komplexen Zahlen. Mathematiker haben schon recht lange
mit diesen Zahlen gerechnet. Bevor sie von Gauß und Hamilton im vorletzten
48
Jahrhundert auf eine theoretisch fundierte Grundlage gestellt wurden, wurden
damit schon Gleichungen gelöst, die im Reellen keine Lösung besitzen.
Für quadratische Gleichungen
x2 + px + q = 0
etwa lassen sich mit der ‘Mitternachts-’ oder ‘p-q-Formel’ die Lösungen als
p
−p ± p2 − 4q
x1,2 =
2
angeben. Ist p2 − 4q ≥ 0, so sind diese Lösunen reell. Im Fall p2 − 4q < 0 lässt
sich dies mit einer ‘imaginären Einheit’ i, für die i2 = −1 ist, unformen zu
p
|p2 − 4q|
p
i,
x1,2 = − ±
2
2
√ 2
|p −4q|
p
eine Zahl mit einem ‘Realteil’ − 2 und einem ‘Imaginärteil’ ±
.
2
Wir werden solche Zahlen nun – ohne das Imaginationsvermögen überzustrapazieren – ganz formal als Paare reeller Zahlen einführen.
Definition 3.33 Der Körper der komplexen Zahlen C ist die Menge R × R mit
den inneren Verknüpfungen
(i) Addition:
(x1 , y1 ) + (x2 , y2 ) := (x1 + x2 , y1 + y2 ),
(ii) Multiplikation:
(x1 , y1 ) · (x2 , y2 ) := (x1 x2 − y1 y2 , x1 y2 + x2 y1 ).
Die Addition ist hier nichts Anderes als die Vektoraddition in der Ebene, die Sie
evtl. aus der Schule kennen. Wir werden gleich sehen, was es mit der Multiplikation auf sich hat.
Satz 3.34 C ist ein Körper.
Beweis. Die Köperaxiome (A1), (A2), (A3), (M1), (M2), (M3), (N) und (D)
bestätigt man durch einfaches Nachrechnen, wobei die Null durch (0, 0) und die
Eins durch (1, 0) gegeben ist. Ebenso rechnet man leicht nach, dass das Negative
von z = (x, y) durch −z = (−x, −y) sowie das Inverse von z = (x, y) 6= (0, 0)
durch
1 x
−y =
,
.
z
x2 + y 2 x2 + y 2
49
gegeben ist.
Speziell für komplexe Zahlen der Form (x1 , 0), (x2 , 0) gilt
(x1 , 0) + (x2 , 0) = (x1 + x2 , 0)
(x1 , 0) · (x2 , 0) = (x1 x2 , 0).
und
Dies erlaubt es, die reellen Zahlen mit der Teilmenge {(x, 0) : x ∈ R} von C zu
identifizieren. (Ganz formal: Die Abbildung x 7→ (x, 0) vermittelt einen Isomorphismus zwischen den Körpern R und {(x, 0) : x ∈ R}, d.h. sie ist bijektiv und mit
der Körperstruktur (den inneren Verknüpfungen) verträglich.) Wir dürfen daher
die Elemente der Form (x, 0) selbst als reelle Zahlen betrachten und einfach mit
x bezeichnen.
Definition 3.35 Es sei z = (x, y) ∈ C.
(i) Man nennt Re z = x den Realteil von z.
(ii) Man nennt Im z = y den Imaginärteil von z.
(iii) Ist Im z = 0, so heißt z reell, ist Re z = 0, so heißt z rein imaginär.
(iv) Die rein imaginäre Zahl i = (0, 1) heißt die imaginäre Einheit.
Wegen i2 = (−1, 0) = −1 sind z = ±i Lösungen der Gleichung z 2 + 1 = 0.
Damit haben wir nun einerseits unser Ausgangsproblem gelöst. Auf der anderen
Seite impliziert dieser Zusammenhang, dass C nicht angeordnet werden kann, da
ja in jedem angeordneten Körper von 0 verschiedene Quadrate positiv sind. In C
sind jedoch sowohl 1 = 12 als auch −1 = i2 Quadrate.
Für gewöhnlich schreibt man die komplexen Zahlen nicht explizit als Paare
reeller Zahlen, sondern nutzt die Darstellung
(x, y) = (x, 0) + (0, 1) · (y, 0) = x + iy
als Summe des Realteils und des Produkts des Imaginärteils mit der imaginären
Einheit. – Dann muss man sich die Regeln zur Summen- und Produktregel nicht
auswendig merken; sie ergeben sich automatisch aus i2 = −1: Für x1 , y1 , x2 , y2 ∈
R ist
(x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i(y1 + y2 ),
(x1 + iy1 ) · (x2 + iy2 ) = x1 x2 + ix1 y2 + iy1 x2 + i2 y1 y2
= (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ).
(Und aus diesem Grund haben wir diese Operationen natürlich genau so definiert.)
50
Definition 3.36 Es sei z = x + iy ∈ C (x, y ∈ R).
(i) Die zu z konjugiert komplexe Zahl ist z := x − iy.
p
√
(ii) Der Betrag von z ist |z| := zz = x2 + y 2 .
(In (ii) haben wir (x+iy)(x−iy) = x2 −(iy)2 = x2 +y 2 ausgenutzt. Beachte, dass
(ii) mit unserer früheren Definition des Betrags einer reellen Zahl übereinstimmt,
wenn z reell ist.)
Die Konjugation erfüllt die folgenden Eigenschaften:
Satz 3.37 Es seien z, z1 , z2 ∈ C.
(i) z = z,
(ii) z1 + z2 = z1 + z2 ,
(iii) z1 z2 = z1 z2 ,
(iv) Re z = 12 (z + z),
(v) Im z =
1
(z
2i
− z).
Beweis. (i) und (ii) sind klar.
(iii) Ist z1 = x1 + iy1 , z2 = x2 + iy2 (x1 , y1 , x2 , y2 ∈ R), so gilt
z1 z2 = x1 x2 − y1 y2 + i(x1 y2 + x2 y1 ) = x1 x2 − y1 y2 − i(x1 y2 + x2 y1 )
= x1 x2 − (−y1 )(−y2 ) + i x1 (−y2 ) + x2 (−y1 ) = z1 z2 .
(iv, v) Mit z = x + iy ist
1
(z + z) =
2
1
(z − z) =
2i
1
(x + iy + x − iy) = x = Re z
und
2
1
x + iy − (x − iy) = y = Im z.
2i
Für den Betrag ergeben sich die folgenden Regeln:
Satz 3.38 Es seien z, z1 , z2 ∈ C.
(i) |z| ≥ 0 und |z| = 0 ⇔ z = 0.
(ii) |z| = |z|,
(iii) | Re z| ≤ |z| und | Im z| ≤ |z|,
51
(iv) |z1 z2 | = |z1 ||z2 |,
(v) Dreiecksungleichung: |z1 + z2 | ≤ |z1 | + |z2 |.
(vi) Umgekehrte Dreiecksungleichung: |z1 − z2 | ≥ |z1 | − |z2 |.
Beweis. Es sei z = x + iy (x, y ∈ R).
p
(i) Klar, da |z| = x2 + y 2 ≥ 0 und |z| = 0 ⇔ x = y = 0 ⇔ z = 0.
p
p
(ii) Dies folgt aus |z| = x2 + y 2 = x2 + (−y)2 = |z|.
(iii) Aus der Monotonieeigenschaft der Wurzel folgt
p
√
sowie
| Re z| = |x| = x2 ≤ x2 + y 2 = |z|
p
p
| Im z| = |y| = y 2 ≤ x2 + y 2 = |z|.
(iv) Dies folgt nach Wurzelziehen aus
|z1 z2 |2 = z1 z2 z1 z2 = z1 z1 z2 z2 = |z1 |2 |z2 |2 .
(v) Nach (iii), (iv) und (ii) ist
|z1 + z2 |2 = (z1 + z2 )(z1 + z2 ) = z1 z1 + z1 z2 + z2 z1 + z2 z2
= |z1 |2 + z1 z2 + z1 z2 +|z2 |2 ≤ |z1 |2 + 2|z1 z2 | + |z2 |2
| {z }
=2 Re(z1 z2 )
2
= |z1 | + 2|z1 ||z2 | + |z2 |2 = (|z1 | + |z2 |)2 .
Die Behauptung folgt nun durch Wurzelziehen.
(vi) Dies folgt genauso wie im reellen Fall direkt aus der Dreiecksungleichung
(vgl. Satz 3.9(v)).
Da man C nicht anordnen kann, ist es nicht sinnvoll, obere oder untere Schranken für Teilmengen von C definieren zu wollen. Man kann jedoch von beschränkten Mengen sprechen:
Definition 3.39 Eine Menge M ⊂ C komplexer Zahlen heißt beschränkt, wenn
die Menge {|z| : z ∈ M } in R beschränkt ist. (D.h.: Wenn ein c ∈ R mit |z| ≤ c
für alle z ∈ M existiert.)
Man kann sich die komplexen Zahlen in der Gaußschen Zahlenebene R × R
veranschaulichen. z = x + iy ∈ C ist dann der Punkt (x, y), so dass dem xAchsenabschnitt der Realteil und dem y-Achsenabschnitt der Imaginärteil von
z entspricht. (Man spricht daher hier auch von der ‘reellen’ bzw. ‘imaginären
Achse’.) In dieser Interpretation ist z gerade der an der reellen Achse gespiegelte Punkt z. Die Addition ist dann – wie schon bemerkt – die Addition von
ebenen Vektoren. Alternativ kann man den z darstellenden Vektor auch durch
seine Länge r = |z| und den mit der reellen Achse eingeschlossenen Winkel φ
52
beschreiben. Dies ist die sogenannte Polardarstellung, die wir später noch ganz
sauber definieren werden. Es gilt dann
x = r cos φ
und
y = r sin φ.
Im Vorgriff hierauf – und ohne dies im Folgenden auszunutzen, bevor wir die
folgenden Rechnungen gerechtfertigt haben, – gehen wir auf diese vor allem auch
für die Anschauung nützliche Darstellung kurz ein.
Sind z1 = x1 + iy1 , z2 = x2 + iy2 komplexe Zahlen mit entsprechenden Beträgen r1 bzw. r2 und Winkeln φ1 bzw. φ2 , so ist nach den trigonometrischen
Additionstheoremen
z1 z2 = (r1 cos φ1 + ir1 sin φ1 )(r2 cos φ2 + ir2 sin φ2 )
= r1 r2 cos φ1 cos φ2 − sin φ1 sin φ2 + i(cos φ1 sin φ2 + cos φ2 sin φ1 )
= r1 r2 (cos(φ1 + φ2 ) + i sin(φ1 + φ2 )).
Das heißt: Bildet man das Produkt zweier komplexer Zahlen, so werden die Beträge multipliziert und die Winkel zur reellen Achse addiert. Hält man w ∈ C
mit Betrag r und Winkel φ fest, so ist die Abbildung C → C, z 7→ wz eine Drehstreckung: z = (x, y) wird um den Faktor r gestreckt und dann um den Winkel
φ gedreht. Speziell für w = i (mit r = 1 und φ = 90◦ ) ergibt sich eine Drehung
um 90◦ .
Nun wird auch endlich klar, woher der Name Dreiecksungleichung für die
Beziehung |z1 + z2 | ≤ |z1 | + |z2 | für komplexe Zahlen z1 , z2 stammt. In einem
Dreieck mit den Eckpunkten 0, z1 und z1 + z2 ist die Seite zwischen 0 und z1 + z2
der Länge |z1 + z2 | höchstens so groß wie die Summe der beiden anderen Seiten
zwischen 0 und z1 der Länge |z1 | und zwischen z1 und z1 + z2 der Länge |z2 |.
53
Kapitel 4
Folgen und Reihen
Ein zentrales Konzept in der Analysis ist der Begriff des Grenzwerts. Hierdurch
wird in mathematisch rigoroser Weise formalisiert, was eine ‘beliebig genaue Approximation’ ist. Dabei werden wir in diesem Kapitel untersuchen, was es heißt
eine Zahl durch eine (abzählbar unendliche) Folge von Zahlen beliebig gut zu
approximieren.
4.1
Folgen und Grenzwerte
Definition 4.1 Es sei M eine Menge. Eine Abbildung von N nach M (oder auch
von N0 nach M ) heißt eine Folge in M .
Ist M = R bzw. M = C, so spricht man auch von einer reellen bzw. komplexen
Folge.
Folgen schreibt man meist nicht in der Form f : N → M , n 7→ f (n). Stattdessen notiert man eine Folge N → M mit n 7→ an als (an )n∈N oder auch
(a1 , a2 , . . .), manchmal auch einfach als (an ). Die an nennt man die Folgenglieder der Folge (an ). Bisweilen bezeichntet man allgemeiner auch Abbildungen
{m, m + 1, m + 2, . . .} → M , n 7→ an als Folgen, wenn m irgendeine ganze Zahl
ist. Dies notiert man dann mit (an )n≥m . Da wir uns im Folgenden nur für das
asymptotische Verhalten von Folgen interessieren, auf das endliche Abschnitte zu
Beginn der Folge keinen Einfluss haben, ergeben sich hierfür im Folgenden keine
wesentlichen Unterschiede.
Beispiele.
1. Für M = N ist die Folge der ungeraden Zahlen
(1, 3, 5, . . .) = (2n − 1)n∈N .
2. Die harmonische Folge ist die reelle Folge
1
1 1
= 1, , , . . . .
n n∈N
2 3
54
3. Für an = 2−n ist
1 1 1
(an )n∈N0 = 1, , , , . . . .
2 4 8
4. Eine komplexe Folge ist z.B.
(in )n∈N0 = (1, i, −1, −i, 1, i, −1, −i, 1, . . .).
5. Für beliebiges z ∈ C ist
(z n )n∈N0 = (1, z, z 2 , z 3 , . . .)
eine sogenannte geometrische Folge.
P
6. Für xn = nk=1 9 · 10−k ist1
(xn )n∈N = (0.9, 0.99, 0.999, . . .).
Wir betrachten nun Folgen mit Werten in R oder C. Sie dürfen – und sollen,
wenn sie mit den komplexen Zahlen noch nicht völlig vertraut sind, – sich im
Folgenden beim ersten Lesen immer auf den reellen Fall konzentrieren. (In diesem
Fall müssen sie sich beim zweiten Lesen dann jedoch noch den komplexen Fall
klar machen.)
Definition 4.2 Es sei (an )n∈N eine reelle (oder komplexe) Folge. (an ) konvergiert
gegen a ∈ R (oder C), wenn gilt:
∀ ε > 0 ∃ N ∈ N ∀ n ≥ N : |an − a| < ε.
(D.h.: Für jedes ε > 0 gibt es einen (von ε abhängigen) Index N ∈ N, so dass für
alle n ≥ N die Bedingung |an −a| < ε erfüllt ist.) Man schreibt dann limn→∞ an =
a oder auch an → a (für n → ∞). Ist a = 0, so nennt man (an )n∈N auch eine
Nullfolge.
Konvergiert (an ) gegen eine Zahl, so heißt (an ) konvergent. Konvergiert (an )
nicht, so sagt man (an ) divergiert oder sei divergent.
Nochmal: an → a heißt: Zu beliebig vorgelegtem ε > 0 dürfen die an für hinreichend große n ∈ N nicht weiter als ε von a entfernt liegen.
Äquivalente Formulierung: Für jedes ε > 0 gilt |an − a| < ε für fast alle
n ∈ N. (D.h. für alle n ∈ N mit endlich vielen Ausnahmen.)
Beispiele.
1. Ist (an )n∈N eine konstante Folge mit an = a für alle n ∈ N, so gilt limn→∞ an =
a.
Klar, denn für jedes ε > 0 und alle n ∈ N ist |an − a| = 0 < ε.
1
Die Dezimaldarstellung werden wir später noch exakt einführen.
55
2. limn→∞
1
n
= 0.
Denn zu ε > 0 gibt es nach dem archimedischen Axiom ein N ∈ N mit
1
< ε (vgl. Korollar 3.26(i)). Dann aber ist für n ≥ N
N
1 1 ≤ < ε.
n
N
3. Die Folge (in )n∈N0 divergiert.
Denn wäre limn→∞ in = z, so müsste für ε = 1 ein N ∈ N mit |in − z| < 1
für alle n ≥ N existieren. Dann aber wäre nach der Dreiecksungleichung
2 > |iN +2 − z| + |iN − z| ≥ |iN +2 − iN | = |iN ||i2 − 1| = | − 1 − 1| = 2.
4. Die Folge ((−1)n )n∈N0 divergiert.
Das sieht man ähnlich wie im vorigen Beispiel. (Übung!)
5. Allgemein gilt: Die Folge (z n )n∈N0 konvergiert für |z| < 1 gegen 0 und für
z = 1 gegen 1. Anderenfalls divergiert sie.
Für |z| < 1 gibt es zu jedem ε > 0 nach Korollar 3.26(iii) nämlich ein
N ∈ N mit |z|N < ε. Dann aber ist auch
|z n | = |z|n ≤ |z|N < ε ∀ n ≥ N.
Der Fall z = 1 folgt direkt aus 1.
Ist nun |z| ≥ 1 und z 6= 1, so kann (z n ) nicht gegen ein w ∈ C konvergieren.
Anderenfalls gäbe es zu ε = |z−1|
(> 0) ein N ∈ N mit |z n − w| < ε für alle
2
n ≥ N . Dann aber wäre (Dreiecksungleichung)
|z − 1| = 2ε > |z N +1 − w| + |w − z N | ≥ |z N +1 − w + w − z N |
= |z N +1 − z N | = |z N ||z − 1| = |z|N |z − 1| ≥ |z − 1|.
Der folgende Satz rechtfertigt es, im Falle der Existenz von dem Grenzwert
einer Folge zu sprechen.
Satz 4.3 Der Grenzwert einer konvergenten reellen (oder komplexen) Folge ist
eindeutig.
Beweis. Wäre dies nicht der Fall, so gäbe es eine (reelle oder komplexe) Folge
(an )n∈N mit an → a und an → a0 für n → ∞ für zwei verschiedene a und a0 . Dann
0|
> 0, so dass N ∈ N und N 0 ∈ N mit
aber ist ε = |a−a
2
|an − a| < ε ∀ n ≥ N
und
|an − a0 | < ε ∀ n ≥ N 0
existieren. Für n ≥ max{N, N 0 } ergibt sich hieraus der Widerspruch
|a − a0 | = |a − an + an − a0 | ≤ |an − a| + |an − a0 | < ε + ε = |a − a0 |.
56
Satz 4.4 Eine konvergente reelle (oder komplexe) Folge ist beschränkt.
Beweis. Gilt limn→∞ an = a, so wählen wir N ∈ N, so dass für alle n ≥ N gilt
|an − a| < 1. Für diese n ist dann 1 > |an − a| ≥ |an | − |a| nach der umgekehrten
Dreiecksungleichung und damit |an | ≤ |a| + 1. Setzt man nun
c = max{|a1 |, . . . , |aN −1 |, |a| + 1},
so gilt tatsächlich |an | ≤ c für alle n ∈ N.
Bemerkung. Die Umkehrung dieser Behauptung ist falsch! Z.B. ist ((−1)n )n∈N
beschränkt aber divergent.
Der folgende Satz fasst wichtige Grenzwertsätze zusammen.
Satz 4.5 (Grenzwertsätze für Folgen) Es seien (an )n∈N und (bn )n∈N konvergente reelle (oder komplexe) Folgen. Dann gilt:
(i) Auch (an ± bn )n∈N ist konvergent und es ist
lim an ± bn = lim an ± lim bn .
n→∞
n→∞
n→∞
(ii) Auch (an bn )n∈N ist konvergent und es ist
lim an bn = lim an lim bn .
n→∞
n→∞
n→∞
(iii) Gilt bn 6= 0 für alle n und limn→∞ bn 6= 0, so ist auch ( abnn )n∈N konvergent
mit
lim an
an
= n→∞ .
lim
n→∞ bn
lim bn
n→∞
Bemerkung. Gilt limn→∞ bn = b 6= 0, so gibt es zu ε = |b| ein N mit |bn | ≥
|b| − |bn − b| > |b| − ε = 0 für n ≥ N . Es können also höchstens endlich viele der
bn gleich 0 sein. Da dies für das Grenzwertverhalten nicht von Belang ist, können
wir in (iii) auf die Bedingung bn 6= 0 für alle n auch verzichten. (Zumindest wenn
wir uns nicht daran stören, dass die Folgenglieder abnn ggf. nur für hinreichend
große n erklärt sind.)
Beweis. Es seien limn→∞ an = a und limn→∞ an = b.
(i) Zu ε > 0 gibt es N ∈ N und N 0 ∈ N mit
|an − a| <
ε
2
∀n ≥ N
und
|bn − b| <
ε
2
∀ n ≥ N 0.
Für n ≥ max{N, N 0 } ergibt sich hieraus
|an + bn − (a + b)| ≤ |an − a| + |bn − b| <
57
ε ε
+ = ε,
2 2
wie gewünscht.
(ii) Nach Satz 4.4 gibt es ein C > 0 mit |bn | ≤ C für alle b ∈ N. Wir wählen
nun N ∈ N und N 0 ∈ N mit
|an − a| <
ε
2C
∀n ≥ N
|bn − b| <
und
ε
1 + 2|a|
∀ n ≥ N 0.
Für n ≥ max{N, N 0 } ist dann
|an bn − ab| = |an bn − abn + abn − ab| ≤ |an bn − abn | + |abn − ab|
ε
ε
ε ε
= |bn ||an − a| + |a||bn − b| < C
+ |a|
≤ + = ε.
2C
1 + 2|a|
2 2
(iii) Nach (ii) genügt es
Gilt b 6= 0, so gibt es zu
1
bn
|b|
2
→ 1b zu zeigen.
ein N ∈ N mit
|bn | = |b − (b − bn )| ≥ |b| − |bn − b| > |b| −
|b|
|b|
=
2
2
für n ≥ N . Zu gegebenem ε > 0 gibt es außerdem ein N 0 ∈ N mit |bn − b| <
für n ≥ N 0 . Ist nun n ≥ max{N, N 0 }, so folgt
|b|2 ε
2
1
1 |b − bn |
|b|2 ε/2
<
= ε.
− =
bn
b
|bn b|
|b|2 /2
Beispiele.
1. Wendet man Satz 4.5 speziell mit einer konstanten Folge bn = c für alle n
an, so ergibt sich für eine konvergente Folge (an )
lim c an = c lim an .
n→∞
n→∞
2. Nach den Grenzwertsätzen ist
1 + 6n−3 − 3n−5
n7 + 6n4 − 3n2
=
lim
n→∞ 3 + n−1 − 2n−7
n→∞ 3n7 + n6 − 2
3
5
lim 1 + 6 lim n1 − 3 lim n1
n→∞
n→∞
= n→∞
7
1
lim 3 + lim n − 2 lim n1
lim
n→∞
n→∞
n→∞
1 + 6 · 03 − 3 · 05
1
=
= .
7
3+0−2·0
3
Beachte hierbei, dass die Anwendung der Grenzwertsätze gerechtfertigt ist,
da alle auftretenden Limites existieren und der Nenner nicht verschwindet.
58
Bei der Untersuchung von Folgen ist es – wie wir sehen werden – oft nützlich, aus einer Folge eine neue Folge zu generieren, indem man einfach einige
Folgenglieder weglässt. Genauer:
Definition 4.6 Es sei (an )n∈N eine Folge und (nk )k∈N eine Folge natürlicher
Zahlen mit n1 < n2 < . . .. Dann ist die Folge (ank )k∈N (also k 7→ ank ) eine
Teilfolge von (an )n∈N .
Beispiele.
1. Die Folge (2,4,6,. . . ) der geraden Zahlen ist eine Teilfolge der Folge (1, 2, 3, . . .)
aller natürlichen Zahlen.
2. Für nk = 2k erhält man aus ( n1 )n∈N die Teilfolge ( 21k )k∈N .
Satz 4.7 Konvergiert (an ) gegen a, so gilt auch limk→∞ ank = a für jede Teilfolge
(ank ).
Beweis. Das ist (fast) klar: Für jedes ε > 0 gilt |an − a| < ε für fast alle n, erst
recht also |ank − a| < ε für fast alle k.
Definition 4.8 Es sei (an ) eine reelle (oder komplexe) Folge. a ∈ R (oder C)
heißt Häufungspunkt von (an ), wenn es eine Teilfolge (ank ) von (an ) gibt, die
gegen a konvergiert.
Eine äquivalente Formulierung gibt der folgende Satz an:
Satz 4.9 a ist Häufungspunkt der reellen (oder komplexen) Folge (an ) genau
dann, wenn es für jedes ε > 0 unendlich viele Indizes n mit |an − a| < ε gibt.
Beweis. ⇒: Klar: Gilt etwa ank → a, so gibt es zu ε > 0 ein K ∈ N mit |ank −a| < ε
für alle (unendlich vielen) k ≥ K.
⇐: Wir definieren natürliche Zahlen n1 < n2 < . . . wie folgt induktiv. Zunächst
wählen wir n1 mit |an1 −a| < 1. Ist nun nk schon definiert, so wählen wir nk+1 > nk
1
. Da unendlich viele Folgenglieder dieser Abschätzung
mit |ank+1 − a| < k+1
genügen, ist dies möglich.
Zu gegebenem ε > 0 gibt es nun ein K ∈ N mit K1 < ε. Für k ≥ K ist
dann |ank − a| < k1 ≤ K1 < ε. Dies zeigt, dass limk→∞ ank = a gilt, a also ein
Häufungspunkt von (an ) ist.
Beispiele.
1. Die Häufungspunkte der Folge (an )n∈N mit
(
3 + n1 , n ungerade,
an =
0,
n gerade,
sind 0 und 3.
59
2. Die Häufungspunkte der komplexen Folge (in )n∈N sind 1, i, −1 und −i.
3. Es sei q1 , q2 , . . . eine Nummerierung der rationalen Zahlen, also Q = {q1 , q2 , . . .}.
Dann ist die Menge der Häufungspunkte der Folge (qn )n∈N ganz R. (Überlegen Sie sich das!)
4.2
Reelle Folgen und Monotonie
Wir untersuchen nun speziell reelle Folgen und die Konsequenzen, die sich durch
Größenvergleiche auf den Grenzwertprozess ergeben.
Satz 4.10 Es seien (an ) und (bn ) konvergente reelle Folgen mit an ≤ bn für alle
n ∈ N. Dann gilt auch limn→∞ an ≤ limn→∞ bn .
Beweis. Setze a = limn→∞ an , b = limn→∞ bn . Wäre a > b, so gäbe es zu ε =
natürliche Zahlen N und N 0 mit
|an − a| < ε für alle n ≥ N
und
a−b
2
|bn − b| < ε für alle n ≥ N 0 .
Für n = max{N, N 0 } führt dies zum Widerspruch
a − b = a − an + an − bn +bn − b ≤ |a − an | + |b − bn | < 2ε = a − b.
| {z }
≤0
Beachten Sie: Aus an < bn folgt im Allgemeinen nicht limn→∞ an < limn→∞ bn .
Gegenbeispiel: an = 0 und bn = n1 für n ∈ N.
Korollar 4.11 Es seien (an ) eine konvergente reelle Folge und a0 , a00 ∈ R mit
a0 ≤ an ≤ a00 für alle n ∈ N. Dann gilt auch a0 ≤ limn→∞ an ≤ a00 .
Beweis. Dies folgt sofort aus Satz 4.10, angewandt auf (an ) und die konstanten
Folgen (a0 ) und (a00 ).
Durch Größenvergleich lassen sich auch neue Konvergenzkriterien gewinnen:
Satz 4.12 (Einschnürungssatz) Es seien (an ), (bn ) und (xn ) reelle Folgen mit
limn→∞ an = limn→∞ bn = x und an ≤ xn ≤ bn für alle n ∈ N. Dann gilt auch
limn→∞ xn = x.
Beweis. Übungsaufgabe!
Eine wichtige Klasse von Folgen besteht aus solchen, deren Folgenglieder der
Größe nach angeordnet sind. Für diese Folgen lässt sich – wie wir gleich sehen
werden – erstens ein besonders einfaches Kriterium für die Konvergenz angeben. Zweitens gewinnt man hieraus ein für viele theoretische Untersuchungen
grundlegendes Existenzresultat auch für allgemeinere Folgen. Drittens schließlich
umfasst diese Klasse viele interessante Anwendungen, was wir schon im folgenden
Abschnitt 4.4 bei der absoluten Konvergenz von Reihen ausnutzen werden
60
Definition 4.13 Eine reelle Folge (an )n∈N heißt
(i) monoton wachsend, wenn an ≤ an+1 für alle n ∈ N gilt,
(ii) streng monoton wachsend, wenn an < an+1 für alle n ∈ N gilt,
(iii) monoton fallend, wenn an ≥ an+1 für alle n ∈ N gilt, und
(iv) streng monoton fallend, wenn an > an+1 für alle n ∈ N ist.
Eine Folge (an ) ist also genau dann (streng) monoton fallend, wenn (−an )
(streng) mononoton wächst.
Satz 4.14 Jede beschränkte monoton wachsende (bzw. fallende) Folge (an ) konvergiert. Es gilt
lim an = sup{an : n ∈ N}
n→∞
(bzw. lim an = inf{an : n ∈ N}).
n→∞
Da eine monoton wachsende (fallende) Folge (an ) durch a1 immer nach unten
(oben) beschränkt ist, hätte es auch genügt zu fordern, dass (an ) nach oben
(unten) beschränkt ist.
Beweis. 1. Es seien (an ) beschränkt und monoton wachsend, a = sup{an : n ∈ N}.
Ist ε > 0, so ist a − ε keine obere Schranke von {an : n ∈ N}, so dass ein N ∈ N
mit aN > a − ε existiert. Da (an ) monoton wächst, gilt dann aber auch
an ≥ a − ε ∀ n ≥ N.
Andererseits ist an ≤ a < a + ε sogar für alle n. Damit ist
a − ε < an < a + ε ∀ n ≥ N,
so dass an → a folgt.
2. Ist (an ) beschränkt und monoton fallend, so folgt nach 1.
lim (−an ) = sup{−an : n ∈ N} = − inf{an : n ∈ N},
n→∞
also in der Tat limn→∞ an = inf{an : n ∈ N}.
Satz 4.15 Jede reelle Folge besitzt eine monotone Teilfolge.
Beweis. Für eine reelle Folge (an ) setze
M = {n ∈ N : für alle k ≥ n gilt ak ≥ an }.
Fall 1: M ist unbeschränkt. Dann gibt es unendlich viele n1 , n2 , . . . ∈ M mit
n1 < n2 < . . .. Nach Konstruktion ist ank+1 ≥ ank , so dass die Teilfolge (ank )
monoton wächst.
Fall 2: M ist beschränkt. Wähle dann n1 > sup M und induktiv nk+1 > nk mit
ank+1 < ank . (Dies ist möglich, da nk > sup M , also nk ∈
/ M ist.) Die Teilfolge
(ank ) fällt dann (sogar streng) monoton.
Das folgende Korollar, ist eine wichtige(!) Existenzaussage in der Analysis.
61
Korollar 4.16 (Satz von Bolzano-Weierstraß (für reelle Folgen)) Jede beschränkte reelle Folge besitzt eine konvergente Teilfolge.
Beweis. Klar nach den Sätzen 4.15 und 4.14.
Konvergiert eine reelle Folge deshalb nicht, weil ihre Folgenglieder ‘gegen +∞
oder gegen −∞ streben’, spricht man von uneigentlicher Konvergenz oder bestimmter Divergenz. Genauer:
Definition 4.17 Eine Folge (an ) mit Werten in R∪{−∞, +∞} heißt uneigentlich
konvergent gegen +∞ (oder −∞), wenn es zu jedem K > 0 ein N ∈ N gibt mit
an ≥ K
(bzw. an ≤ −K) ∀ n ≥ N.
Man schreibt dann auch limn→∞ an = +∞ bzw. limn→∞ an = −∞.
Statt von uneigentlicher Konvergenz spricht man auch von bestimmter Divergenz
gegen +∞ bzw. −∞.
Beispiele.
1. limn→∞ −2n + 1 = −∞.
2. Es sei (an )n∈N eine Folge mit an > 0 (bzw. an < 0) für alle n. Genau dann
ist (an )n∈N eine Nullfolge, wenn ( a1n )n∈N bestimmt gegen +∞ (bzw. −∞)
divergiert.
Übung: Zeigen Sie dies!
3. Es sei x ∈ R. Die Folge (xn )n∈N
– konvergiert für −1 < x ≤ 1 (vgl. Beispiel 5 auf Seite 56),
– konvergiert uneigentlich gegen +∞ für x > 1 und
– divergiert (nicht bestimmt) für x ≤ −1.
Übung: Zeigen Sie dies!
Satz 4.18 Jede monotone Folge ist entweder konvergent oder uneigentlich konvergent.
Beweis. Es sei (an ) monoton wachsend. Ist (an ) nach oben beschränkt, so folgt
die Behauptung aus Satz 4.14. Ist (an ) nach oben unbeschränkt, so gibt es zu
jedem K > 0 ein N ∈ N mit aN > K. Aus der Monotonie folgt dann aber auch
an > K
∀ n ≥ N.
Ist (an ) monoton fallend, so ist (−an ) nach dem eben Gezeigten konvergent oder
uneigentlich konvergent, also auch (an ) selbst. Schließlich bemerken wir, dass
eine Folge offensichtlich nicht zugleich konvergieren und uneigentlich konvergieren
kann.
Wir führen nun noch ein Konzept ein, dass es uns erlaubt, das asymptotische
Verhalten einer möglicherweise divergenten reellen Folge genauer zu untersuchen.
62
Definition 4.19 Es sei (an ) eine reelle Folge.
(i) Der Limes superior von (an ) ist
lim sup an := lim sup{ak : k ≥ n}.
n→∞
n→∞
(ii) Der Limes inferior von (an ) ist
lim inf an := lim inf{ak : k ≥ n}.
n→∞
n→∞
Statt lim sup schreibt man auch lim , statt lim inf auch lim .
n→∞
n→∞
n→∞
n→∞
Beachte, dass die Folge (sup{ak : k ≥ n})n∈N monoton fällt. (Mit wachsendem n wird das Supremum über immer kleinere Mengen gebildet.) Der Limes
dieser Folge existiert also im eigentlichen oder uneigentlichen Sinne. Genauso
konvergiert (inf{ak : k ≥ n})n∈N als monoton wachsende Folge eigentlich oder
uneigentlich. Im Gegensatz zum Limes existieren der Limes inferior und der Limes superior einer jeden Folge!
Beispiele.
1. Es gilt
lim inf (−1)n = −1
und
n→∞
lim sup(−1)n = 1.
n→∞
2. Ist (an )n∈N gegeben durch
(
3 + n1 , n ungerade,
an =
− n12 ,
n gerade,
so ist lim supn→∞ an = 3 und lim inf n→∞ an = 0.
Satz 4.20 Es sei (an ) eine reelle Folge.
(i) Genau dann gilt limn→∞ an = a, wenn
lim sup an = lim inf an = a
n→∞
n→∞
ist.
(ii) Ist (an )n∈N beschränkt und bezeichnet H die Menge der Häufungspunkte von
(an ), so gilt
max H = lim sup an
und
n→∞
63
min H = lim inf an .
n→∞
Beweis. Übung!
Zum Schluss dieses Abschnitts notieren wir noch das Satz 4.10 entsprechende
Ergebnis für lim inf und lim sup:
Satz 4.21 Es seien (an ) und (bn ) reelle Folgen mit an ≤ bn für alle n ∈ N. Dann
gilt auch
lim inf an ≤ lim inf bn
n→∞
n→∞
und
lim sup an ≤ lim sup bn .
n→∞
n→∞
Beweis. Dies folgt sofort aus Satz 4.10, indem man beobachtet, dass inf{ak : k ≥
n} ≤ inf{bk : k ≥ n} sowie sup{ak : k ≥ n} ≤ sup{bk : k ≥ n} für jedes n ∈ N
gilt.
4.3
Konsequenzen der Vollständigkeit
Besonders wichtig für die Analysis sind die Konsequenzen für die Untersuchung
von Folgen, die sich aus dem Vollständigkeitsaxiom ergeben, wie etwa der Satz
4.14 und der Satz von Bolzano-Weierstraß, dessen reelle Variante wir schon in
Korollar 4.16 kennengelernt haben. (Die übrigen bisher diskutierten Ergebnisse
lassen sich auch aus dem schwächeren Archimedischen Axiom gewinnen.)
Zunächst bemerken wir, dass die Ergebnisse des vorigen Abschnitts auch Konsequenzen für komplexe Folgen haben. Deren Konvergenz lässt sich nämlich auf
die Konvergenz von reellen Folgen zurückführen.
Satz 4.22 Eine komplexe Folge (zn )n∈N konvergiert genau dann gegen z ∈ C,
wenn limn→∞ Re zn = Re z und limn→∞ Im zn = Im z gilt.
Beweis. ⇒: Zu ε > 0 wähle N ∈ N mit |zn − z| < ε für alle n ≥ N . Für diese n
gilt dann auch
| Re zn − Re z| ≤ |zn − z| < ε
und
| Im zn − Im z| ≤ |zn − z| < ε.
⇐: Zu ε > 0 wähle N1 ∈ N und N2 ∈ N mit | Re zn − Re z| < 2ε für alle n ≥ N1
und | Im zn − Im z| < 2ε für alle n ≥ N2 . Für n ≥ N := max{N1 , N2 } ist dann
nach der Dreiecksungleichung
|zn − z| = | Re zn − Re z + i(Im zn − Im z)|
≤ | Re zn − Re z| + |i|| Im zn − Im z| <
ε ε
+ = ε.
2 2
Satz 4.23 (Satz von Bolzano-Weierstraß) Jede beschränkte reelle (oder komplexe) Folge besitzt eine konvergente Teilfolge.
64
Beweis. Nach Korollar 4.16 müssen wir nur noch komplexe Folgen untersuchen.
Ist nun (an ) eine beschränkte komplexe Folge, so sind nach Satz 3.38(iii) (Re an )n∈N
und (Im an )n∈N beschränkte reelle Folgen. Nach Korollar 4.16 gibt es eine Teilfolge (znk )k∈N , so dass (Re znk )k∈N konvergiert. Wieder nach Korollar 4.16 gibt es
eine (Teil-)Teilfolge (znkj )j∈N , für die (Im znkj )j∈N konvergiert. Als Teilfolge der
konvergenten Folge (Re znk )k∈N konvergiert aber auch (Re znkj )j∈N . Gemäß Satz
4.22 konvergiert dann auch die komplexe Folge (znkj )j∈N .
Ein zentrales Konvergenzkriterium ist das Cauchykriterium, das eine notwendige und hinreichende Bedingung für die Konvergenz einer reellen (oder komplexen) Folge angibt, ohne dass der fragliche Grenzwert angegeben werden muss. Da
man dieses Kriterium allgemeiner auch für andere Bereiche als R oder C untersucht, in denen es notwendig, jedoch nicht hinreichend sein muss, geben wir hier
zunächst eine extra Definition, die sich später leicht verallgemeinern lässt.
Definition 4.24 Eine Folge reeller (oder komplexer) Zahlen (an ) heißt Cauchyfolge, wenn es zu jedem ε > 0 ein N ∈ N gibt, so dass
|am − an | < ε für alle m, n ≥ N
gilt.
Satz 4.25 Eine reelle (oder komplexe) Folge ist genau dann konvergent, wenn
sie eine Cauchyfolge ist.
Beweis. ⇒: Gilt limn→∞ an = a, so gibt es zu jedem ε > 0 ein N ∈ N mit
|an − a| < 2ε für alle n ≥ N . Dann gilt aber auch
ε ε
|am − an | = |am − a + a − an | ≤ |am − a| + |an − a| < + = ε
2 2
für m, n ≥ N .
⇐: Es sei nun (an ) als Cauchyfolge vorausgesetzt. Zu ε = 1 gibt es dann ein
N ∈ N mit |an − aN | < 1 und damit |an | ≤ |aN | + 1 für alle n ≥ N . Dann aber
ist
|an | ≤ max{|a1 |, |a2 |, . . . , |aN −1 |, |aN | + 1},
was zeigt, dass die Folge (an ) beschränkt ist. Nach Satz 4.23 besitzt (an ) also eine
konvergente Teilfolge (ank )k∈N , etwa limk→∞ ank = a.
Tatsächlich gilt dann aber schon an → a. Ist nämlich ε > 0 gegeben, so können
wir N, K ∈ N mit
ε
ε
|am − an | < für m, n ≥ N
sowie
|ank − a| < für k ≥ K
2
2
wählen. Dann aber folgt für alle n ≥ N , indem man k ≥ K mit nk ≥ N wählt,
ε ε
|an − a| ≤ |an − ank | + |ank − a| < + = ε.
2 2
65
Bemerkungen.
1. Die Aussagen des Satzes von Bolzano-Weierstraß und des Cauchykriteriums
sind im folgenden Sinne sogar äquivalent zur Vollständigkeit von R: Ist K
ein angeordneter Körper, so sind äquivalent:
• K ist vollständig. (D.h. das Vollständigkeitsaxiom (V) gilt.)
• K ist ein archimedisch angeordneter Körper, in dem jede beschränkte
Folge eine konvergente Teilfolge besitzt.
• K ist ein archimedisch angeordneter Körper, in dem jede Cauchyfolge
konvergiert.
Um dies zu zeigen, muss man zunächst bemerken, dass man die Konvergenz von Folgen – genau wie oben beschrieben – allgemein für archimedisch
angeordnete Körper definieren kann, s. z.B. [Fo]. (Das archimedische Axiom garantiert dann, dass der Grenzwert einer konvergenten Folge eindeutig
ist.) Wir gehen hier nicht weiter darauf ein. (Was Sie nicht daran hindern
soll, sich dies selbst zu überlegen.)
2. Mit Hilfe von Cauchyfolgen lässt sich nun die Vollständigkeit auch für nicht
angeordnete Räume definieren. Da nach Satz 4.25 insbesondere auch in C
jede Cauchyfolge konvergiert, sagen wir auch, dass C vollständig ist.
4.4
Reihen
Durch sukzessive Addition der Glieder einer gegebenen reellen (oder komplexen)
Folge (an )n∈N entsteht eine neue Folge: (sm )m∈N mit sm = a1 + . . . , +am , die
unendliche Reihe der an . Etwas allgemeiner betrachten wir gleich Folgen mit
erstem Index n0 ∈ Z (vgl. den Absatz zu Beginn des Abschnitts 4.1). In diesem
Abschnitt stellen wir grundlegende Konvergenzkriterien für Reihen bereit.
Definition
Pm 4.26 Es sei (an )n≥n0 eine reelle (oder komplexe) Folge. Die Zahl
sm =
n=n0 an heißt die m-te Partialsumme von (an ). Die Folge der Partialsummen (sm )m≥n0 nennt man auch die (unendliche) Reihe der an und schreibt
(sm )m≥n0 =
∞
X
an .
n=n0
Ist diese Reihe konvergent oder uneigentlich konvergent, so bezeichnet man
auch ihren Grenzwert so:
lim
m→∞
m
X
an =
n=n0
∞
X
n=n0
66
an .
P
Beachten Sie: Das Symbol ∞
n=1 an bedeutet zweierlei: Erstens steht es für die
Folge der Partialsummen, zweitens – im Falle der Konvergenz – auch für deren
Limes.
Natürlich kann man die Folge (an )n≥n0 aus der Folge der Partialsummen
(sm )m≥n0 zurückgewinnen, da ja an0 = sn0 und an = sn − sn−1 für n ≥ n0 + 1
gilt.
Beispiele.
1. Die geometrische Reihe: Für z ∈ C mit |z| < 1 gilt
∞
X
zn =
n=0
1
.
1−z
Für |z| ≥ 1 ist diese Reihe divergent.
Der Fall z = 1 ist hier klar. Für z 6= 1 beobachten wir zunächst, dass
der Satz 2.2 auch im Komplexen gültig ist. (Der Beweis ist haargenau der
gleiche.) Demnach ist
m
X
1 − z m+1
.
zn =
1−z
n=0
Da z m+1 → 0 mit m → ∞, wenn |z| < 1 ist, und anderenfalls (z m+1 )
divergiert, folgt die Behauptung.
2. Die harmonische Reihe
∞
X
1
n
n=1
divergiert bestimmt gegen +∞:
Wählt man zu gegebenem K > 0 ein N ∈ N mit N ≥ 2K, so gilt für
m ≥ 2N
N
m
2
N
−1
X
X
1 X1
≥
≥
n n=2 n
n=1
k=0
k+1
2X
N
−1
X
1
N
1
≥
2k · k+1 ≥
≥ K.
n
2
2
k=0
n=2k +1
| {z }
2k Summanden,
jeweils ≥ 1/2k+1
3. Es gilt
∞
X
1
1
1
1
+
+
+ ... =
= 1.
1·2 2·3 3·4
n(n + 1)
n=1
67
P
1
1
1
1
Die Summe ∞
n=1 n(n+1) ist eine ‘Teleskopsumme’: Wegen n(n+1) = n − n+1
ist tatsächlich
m
1
X
1
1 1 1 1 1
1 = 1−
+
−
+
−
+ ... +
−
n(n + 1)
2
2 3
3 4
m m+1
n=1
=1−
1
→1
m+1
mit m → ∞.
Direkt aus den Grenzwertsätzen ergibt sich:
P∞
P
(oder komplexe) unSatz 4.27 Sind ∞
n=n0 bn konvergente reelleP
n=n0 an und
endliche Reihen sowie c ∈ R (oder C), so konvergiert auch ∞
n=n0 (an + c bn ) und
es ist
∞
∞
∞
X
X
X
(an + c bn ) =
an + c
bn .
n=n0
n=n0
n=n0
Beweis. Klar nach Satz 4.5.
Wir untersuchen nun Kriterien für die Konvergenz von unendlichen Reihen.
Als erstes notwendiges (aber nicht hinreichendes!) Kriterium halten wir fest:
P
Satz 4.28 Konvergiert die reelle (oder komplexe) unendliche Reihe ∞
n=n0 an , so
ist (an )n≥n0 eine Nullfolge.
P
Pm
Beweis. Es seien a = ∞
n=n0 an und sm =
n=n0 an die m-te Partialsumme. Zu
gegebenem ε > 0 wählen wir M ∈ N mit |sm − a| < 2ε für alle m ≥ M . Dann gilt
für m ≥ M + 1 auch
|am | = |sm − sm−1 | = |sm − a + a − sm−1 |
ε ε
≤ |sm − a| + |a − sm−1 | < + = ε.
2 2
( n1 )n∈N
eine
Beachten Sie: DiePUmkehrung dieses Satzes gilt nicht! Z.B. ist
1
Nullfolge, die Reihe ∞
n=1 n aber – wie wir gesehen haben – divergent.
Natürlich liefert jedes Konvergenzkriterium für Folgen auch ein Konvergenzkriterium für Reihen, indem man es auf die entsprechende Partialsummenfolge
anwendet. Da es im Folgenden wichtig ist, gehen wir hier (noch einmal) speziell
auf das Cauchykriterium ein.
P
Satz 4.29 Die unendliche Reihe ∞
k=n0 ak mit ak ∈ R (oder C) konvergiert genau dann, wenn es zu jedem ε > 0 ein N ∈ N gibt, so dass
m
X
ak < ε
k=n
für alle m ≥ n ≥ N gilt.
68
Beweis.
Ist (sm ) die Folge der Partialsummen, so besagt diese Bedingung wegen
Pm
a
k=n k = sm − sn−1 gerade, dass (sm ) eine Cauchyfolge ist. Die Behauptung
folgt daher aus Satz 4.25.
Als nächstes diskutieren wir ein hinreichendes (aber nicht notwendiges!) Kriterium für Reihen mit weitreichenden Konsequenzen. Dazu führen wir zunächst
einen Begriff ein.
P∞
Definition 4.30 Eine unendliche
reelle
(oder
komplexe)
Reihe
n=n0 an konP
|a
|
konvergiert.
vergiert absolut, wenn die Reihe ∞
n
n=n0
Satz 4.31 Jede absolut konvergente Reihe konvergiert.
P∞
Beweis. Es sei
n=n0 an absolut konvergent. Ist ε > 0, so gibt es nach dem
Cauchykriterium ein N ∈ N mit
m
X
|ak | < ε
k=n
für
Pm alle m, n ≥ N gilt. Nach der Dreiecksungleichung aber ist |
k=n |ak |, so dass auch
m
X
ak < ε
Pm
k=n
ak | ≤
k=n
für
P∞alle m, n ≥ N gilt. Wieder nach dem Cauchykriterium folgt nun, dass auch
n=n0 an konvergiert.
Beachten Sie: Die Umkehrung
giltn im Allgemeinen nicht. Z.B. ist – wie wir
P∞ (−1)
gleich noch P
sehen werden – n=1 n konvergent, nicht jedoch absolut konver1
gent, da ja ∞
n=1 n divergiert.
P
Die wesentlich Beobachtung ist nun, dass ∞
n=n0 an monoton wächst. Hieraus
ergibt sich:
P
Satz 4.32 Eine unendliche reelle (oder komplexe) Reihe ∞
n=n0 an konvergiert
P∞
genau dann absolut, wenn die Folge der Partialsummen der Reihe
n=n0 |an |
beschränkt ist.
P
Beweis. Dies folgt sofort aus Satz 4.14, da die Partialsummenfolge ∞
n=n0 |an |
monoton wächst.
Im Folgenden diskutieren wir einige Konvergenzkriterien für die absolute Konvergenz einer Reihe.
P∞
Satz 4.33 (Majorantenkriterium)
Es
seien
n=n0 an eine reelle (oder komP∞
plexe) Reihe und n=n0 bn eine konvergente P
Reihe mit reellen Gliedern bn ≥ 0.
Gilt |an | ≤ bn für alle n ≥ n0 , so konvergiert ∞
n=n0 an absolut.
69
P∞
Man
nennt
in
diesem
Fall
die
Reihe
n=n0 bn eine Majorante der Reihe
P∞
a
.
n=n0 n
P∞
Beweis. Da
n=n0 bn als konvergente Reihe gemäß Satz 4.4 insbesondere beschränkt ist, gibt es ein C > 0 mit
m
X
n=n0
m
X
|an | ≤
bn ≤ C
n=n0
für alle m ≥ n0 . Die Behauptung folgt somit aus Satz 4.32.
Beispiel. Die Reihe
∞
X
1
n=1
n2
konvergiert.
P
1
Es genügt hier zu begründen, dass ∞
n=2 n2 konvergiert. Dies folgt nun daraus,
dass die Reihe
∞
X
1
1
1
1
=
+
+
+ ...
(n
−
1)n
1
·
2
2
·
3
3
·
4
n=2
eine – nach dem Beispiel 3 von Seite 67 konvergente – Majorante ist.
Die folgenden beiden Kriterien für die absolute Konvergenz beruhen auf dem
Majorantenkriterium, wobei eine geometrische Reihe als konvergente Majorante
dient. Vorbereitend beweisen wir ein Lemma, durch das sich die Voraussetzungen
dieser Kriterien äquivalent umformulieren lassen.
Lemma 4.34 Ist (xn ) eine reelle Folge, so gilt lim supn→∞ xn < 1 genau dann,
wenn es ein r < 1 und ein N ∈ N gibt, so dass xn ≤ r für alle n ≥ N gilt.
Achtung! Diese Bedingung ist nicht äquivalent dazu, dass xn < 1 für alle
n ≥ N gilt. (Gegenbeispiel: xn = 1 − n1 .)
Beweis. ⇒: Ist lim supn→∞ xn = limn→∞ sup{xk : k ≥ n} =: x < 1, so gibt es zu
x < r < 1 ein N ∈ N mit (setze ε = r − x)
sup{xk : k ≥ N } < r.
⇐: Gibt es einen Index N und ein r < 1, so dass xk ≤ r für alle k ≥ N ist,
dann ist auch sup{xk : k ≥ N } ≤ r und damit nach Satz 4.14
lim sup xn = lim sup{xk : k ≥ n} ≤ sup{xk : k ≥ N } ≤ r < 1.
n→∞
n→∞
70
P
Satz 4.35 (Quotientenkriterium) Es sei ∞
n=n0 an eine reelle (oder komplexe) Reihe. Gilt
|an+1 |
lim sup
< 1,
|an |
n→∞
P
so konvergiert ∞
n=n0 an absolut.
Bemerkung. Gemäß Lemma 4.34 ist die Voraussetzung lim supn→∞
äquivalent zur folgenden Bedingung:
∃ r < 1 ∃N ≥ n0 ∀n ≥ N :
|an+1 |
|an |
<1
|an+1 |
≤ r.
|an |
Beweis von Satz 4.35. Wir wählen nach Lemma 4.34 N ∈ N und r P
> 0 mit
∞
|an+1 |
≤
r
für
n
≥
N
.
Es
genügt
nun,
die
absolute
Konvergenz
der
Reihe
n=N an
|an |
nachzuweisen, da die ersten endlich vielen Glieder keinen Einfluss auf das Konvergenzverhalten haben.
|
Aus |a|an+1
≤ r folgt induktiv aber |an | ≤ rn−N |aN |, so dass sich die Behaupn|
tung aus dem Majorantenkriterium ergibt, denn es ist
∞
X
|aN |r
n−N
= |aN |
∞
X
rn < ∞.
n=0
n=N
Beispiel. Die Reihe
n7 2−n
n=1 1+n2
P∞
(n+1)7 2−n−1
1+(n+1)2
n7 2−n
1+n2
=
konvergiert absolut, denn es gilt
(n + 1)7 2−n−1
1
1 + n2
·
→ <1
·
7
−n
2
+ 1)
2
{z } | 2{z } |1 + (n
| n
{z
}
1
→1
→2
→1
mit n → ∞.
P
Satz 4.36 (Wurzelkriterium) Es sei ∞
n=n0 an eine reelle (oder komplexe) Reihe.
p
P
(i) Gilt lim supn→∞ n |an | < 1, so konvergiert ∞
n=n0 an absolut.
p
P
(ii) Gilt lim supn→∞ n |an | > 1, so divergiert ∞
n=n0 an .
Beweis. (i) Wiepim Beweis von Satz 4.35 wählen wir nach Lemma 4.34 N ∈ N
und r > 0 mit n |an | ≤P
r für n ≥ N und beobachten, dass es genügt, die absolute
Konvergenz der Reihe ∞
n=N an nachzuweisen.
71
p
Aus n |an | ≤ r folgt aber direkt |an | ≤ rn , so dass sich die Behauptung wieder
aus dem Majorantenkriterium ergibt, denn es ist
∞
X
n
r =r
N
∞
X
rn < ∞.
n=0
n=N
p
p
(ii) Gilt lim supn→∞ n |an | > 1, so gibt es unendlich viele n mit n |an | ≥ 1
und damit auchP|an | ≥ 1. Die Folge (an ) kann demnach keine Nullfolge sein, so
dass die Reihe ∞
n=n0 an gemäß Satz 4.28 divergiert.
p
n
Beachten Sie: Gilt lim supn→∞
|an | = 1, so ist
Aussage
qkeine allgemeine P
q
1
möglich. Z.B. gilt lim supn→∞ n | n1 | = lim supn→∞ n | n12 | = 1, wobei ∞
n=n0 n
P∞
divergiert, n=n0 n12 aber konvergiert.
Beispiel. Es sei
(
2−n für n gerade,
an =
3−n für n ungerade.
P
Dann konvergiert ∞
n=0 an nach dem Wurzelkriterium. Es ist nämlich
(
1
√
für n gerade,
n
an = 21
für n ungerade
3
p
und somit lim supn→∞ n |an | = 12 < 1.
Das Quotientenkriterium versagt in diesem Beispiel, denn es ist
( n
a 2
= 13 · ( 23 )n für n gerade,
n+1 3n+1
=
3n
an
= 12 · ( 32 )n für n ungerade
2n+1
und daher lim supn→∞ | an+1
| = ∞.
an
Das folgende Kriterium gilt für alternierende Reihen, deren Glieder abwechselnd positives und negatives Vorzeichen haben.
Satz 4.37 (Leibnizkriterium) Ist (an )n≥n0 eine monoton fallende Nullfolge,
dann ist die Reihe
∞
X
(−1)n an
n=n0
P∞
P
n
(und damit auch n=n0 (−1)n+1 an = − ∞
n=n0 (−1) an ) konvergent.
Für alle m ≥ n0 gilt die Abschätzung
m
∞
X
X
n
(−1) an −
(−1)n an ≤ am+1 .
n=n0
n=n0
72
Beweis. Es genügt den Fall n0 = 0 zu betrachten. Der allgemeine Fall folgt
hieraus durch Umnummerierung
der Summe und ggf. Multiplikation mit −1:
P∞
P
∞
n
n
= ± n=0 (−1) an0 +n .
n=n0 (−1) an P
n
Setze sm = m
n=0 (−1) an . Dann sind wegen
s2k = s2k−2 −a2k−1 + a2k ≤ s2k−2
|
{z
}
≤0
und s2k+1 = s2k−1 +a2k − a2k+1 ≥ s2k−1
|
{z
}
≥0
für k ∈ N die Folgen (s2k )k∈N0 und (s2k+1 )k∈N0 monoton fallend bzw. monoton
wachsend. Dabei ist
s1 ≤ s2k+1 = s2k − a2k+1 ≤ s2k ≤ s0 .
Diese Folgen sind also auch beschränkt und somit konvergent. Wir setzen s =
limk→∞ s2k+1 .
Für m ≥ k ist außerdem
s2k+1 ≤ s2m+1 = s2m − a2m+1 ≤ s2m ≤ s2k
und folglich (mit m → ∞)
s2k+1 ≤ s ≤ s2k .
Für m ∈ N ist also sm ≤ s ≤ sm+1 oder sm+1 ≤ s ≤ sm . Es folgt
|sm − s| ≤ |sm+1 − sm | = am+1 → 0
mit m → ∞.
Beispiel. Die alternierende harmonische Reihe
∞
X
(−1)n+1
n
n=1
konvergiert nach Satz 4.37.
Wir untersuchen nun noch die Frage, inwiefern es bei unendlichen Reihen auf
die Summationsreihenfolge ankommt. Im Allgemeinen darf man die Reihenglieder
nicht beliebig umordnen wie die folgende Überlegung zeigt: Es ist
∞
X 1
1 1
1 + + + ... =
=∞
3 5
2k − 1
k=1
und
∞
X 1
1 1 1
+ + + ... =
= ∞.
2 4 6
2k
k=1
P
P∞ 1
1
oder
2
(Anderenfall wären 2 ∞
k=1 2k−1
k=1 2k konvergente Majoranten der harmonischen Reihe.) Nun kann man die Glieder der alternierenden harmonischen
P
(−1)n+1
Reihe ∞
z.B. so umordnen:
n=1
n
73
• Addiere so lange die ersten Glieder mit ungeraden Indizes auf, bis das Ergebnis ≥ 15 ist.
• Addiere dann die ersten Glieder mit geraden Indizes hinzu, bis das Ergebnis
≤ −14 ist.
• Addiere dazu nun die nächsten Glieder mit geraden Indizes, bis das Ergebnis
wieder ≥ 15 ist.
• Addiere dann die nächsten Glieder mit ungeraden Indizes, bis das Ergebnis
wieder ≤ −14 ist.
• u.s.w.
Die Partialsummenfolge nimmt dann sowohl immer wieder Werte ≥ 15 als auch
Werte ≤ −14 an und kann nicht konvergieren. Vgl. auch die Bemerkung im
Anschluss an den folgenden Satz.
Umordnungen sind jedoch für absolut konvergente Reihen erlaubt:
P
Satz 4.38 Es sei ∞
n=n0 an eine reelle (oder komplexe) absolut konvergente Reihe.
P∞Ist π : {n ∈ Z : n ≥ n0 } → {n ∈ Z : n ≥ n0 } bijektiv, so konvergiert auch
n=n0 aπ(n) absolut und es ist
∞
X
aπ(n) =
n=n0
Beweis. Da
mit
P∞
n=n0
∞
X
an .
n=n0
an absolut konvergiert, gibt es zu gegebenem ε > 0 ein N ∈ N
m
N
X
X
ε
|an | = |an | −
|an | <
2
n=n
n=n
n=N +1
m
X
0
0
für alle m ≥ N und
N
∞
X
ε
X
< .
a
a
−
n
n
2
n=n
n=n
0
0
0
Ist nun N ∈ N so groß gewählt, dass {π(1), . . . , π(N 0 )} ⊃ {1, . . . , N } ist
(insbesondere N 0 ≥ N ), so folgt für m ≥ N 0 mit M = max{π(1), . . . , π(N 0 )}
(≥ N )
m
m
X
∞
∞
N
X
X
X
X
X
N
ε ε
aπ(n) −
an ≤ aπ(n) −
an +
an −
an < + = ε.
2 2
n=n0
n=n0
n=n0
n=n0
n=n
n=n0
{z
}
| 0
P
≤ M
n=N +1 |an |
Bemerkung. Es sei n=n0 an eine konvergente aber nicht absolut konvergente
Folge
P∞ in R. Dann gibt es zu jedem x ∈ R eine Umordnung π der Indizes, so dass
n=n0 aπ(n) = x ist. (Übungsaugfgabe: Überlegen Sie sich das!)
P∞
74
4.5
Zur Darstellung der reellen Zahlen
Endlich können wir nun mit Hilfe der unendlichen Reihen die Darstellung der
reellen Zahlen im Dezimalsystem oder – allgemeiner – in einem Zahlensystem zu
einer natürlichen Basis ≥ 2 angeben.
Definition 4.39 Es sei b ∈ N \ {1}. Ein b-adischer Bruch ist eine Reihe von der
Form
∞
X
±
an b−n ,
n=−k
wobei k ∈ N0 und an ∈ {0, 1, . . . , b−1} die ‘Ziffern’ sind. Ist festgelegt, zu welcher
Basis b man rechnet, so schreibt man eine solche Reihe dann auch einfach als
±
∞
X
an b−n = ±a−k a−k+1 . . . a0 , a1 a2 . . . ,
n=−k
indem man die an einfach hintereinander aufreiht.
Satz 4.40 Es sei b ∈ N \ {1}.
(i) Jeder b-adische Bruch konvergiert gegen eine reelle Zahl.
(ii) Umgekehrt lässt sich jede reelle Zahl in einen b-adischen Bruch entwickeln.
Für b = 10 heißt diese Darstellung die Dezimaldarstellung, für b = 2 die binäre
Darstellung.
Beispiel. Die Zahl 0, 101010 . . . im Binärsystem ist
∞
X
n=0
−(2n+1)
2
−1
=2
∞
X
1
1
(4−1 )n = ·
2 1−
n=0
1
4
2
= .
3
Bemerkung. In speziellen Fällen ist die Darstellung einer reellen Zahl als badischer Bruch nicht eindeutig. Das ist immer dann der Fall, wenn sich ein Zahl
durch einen b-adischen Bruch schreiben lässt, dessen Ziffern von irgendeiner Stelle
an immer b − 1 sind. Z.B. ist etwa im Dezimalsystem 2, 5999 . . . = 2, 6000 . . .
und im binären Sytem 0, 111 . . . = 1, 000 . . .. Für alle anderen Zahlen ist die
Darstellung als b-adischer Bruch jedoch eindeutig. (Übungsaufgabe: Überlegen
Sie sich das!)
P
−n
Beweis von Satz 4.40.2 (i) Dies folgt daraus, dass jeder b-adische Bruch ± ∞
n=−k an b
dem Cauchykriterium genügt. Ist nämlich m ≥ n, so gilt
∞
m
m
X
X
X
(b − 1)b−n
−j −j
−n
b−j ≤
aj b ≤
= b−n+1 .
(b − 1)b = (b − 1)b
±
−1
1−b
j=n
j=n
j=0
2
Dieser Beweis wurde in der Vorlesung weggelassen.
75
Wegen b−n+1 → 0 mit n → ∞, lässt sich daher zu gegebenem ε > 0 ein N ∈ N
finden, so dass
m
X
aj b−j < ε
±
j=n
für m ≥ n ≥ N ist.
P
−n
(ii) Es genügt zu zeigen, dass sich jedes x ≥ 0 als Dezimalbruch x = ∞
n=−k an b
schreiben lässt.
Es sei k die kleinste Zahl aus N0 mit x < bk+1 . Wir definieren die Folge
(an )n≥−k mit an ∈ {0, 1, . . . , b − 1} und
sm :=
m
X
an b−n ≤ x <
n=−k
m
X
an b−n + b−m = sm + b−m .
n=−k
induktiv:
Zunächst betrachten wir die Unterteilung
0 = 0 · bk < 1 · bk < 2 · bk < . . . < (b − 1)bk < b · bk = bk+1
des Intervalls [0, bk+1 ). Da x in diesem Intervall liegt, gibt es genau ein a−k ∈
{0, 1, . . . , b − 1} mit
s−k := a−k bk ≤ x < (a−k + 1)bk = a−k bk + bk .
Ist nun a−k , . . . , am schon definiert, so betrachten wir die Unterteilung
sm = sm + 0 · b−m−1 < sm + 1 · b−m−1 < . . .
< sm + (b − 1)b−m−1 < sm + b · b−m−1 = sm + b−m
des Intervalls [sm , sm + b−m ) und wählen am+1 mit
sm+1 := sm + am+1 b−m−1 ≤ x < sm + (am+1 + 1)b−m−1 = sm+1 + b−m−1 .
Wegen |sm − x| < b−m folgt nun
x = lim sm =
m→∞
∞
X
an b−n .
n=−k
Bemerkungen.
1. Die rationalen Zahlen sind genau diejenigen, deren b-adische Darstellung
von irgendeiner Stelle an periodisch ist:
Q = {a−k a−k+1 . . . a0 , a1 a2 . . . : ∃ N ≥ −k ∃ p ∈ N ∀ n ≥ N : an+p = an }.
(Übungsaufgabe: Überlegen Sie sich das!)
76
2. Mit Hilfe der Dezimaldarstellung lässt sich ein alternativer Beweis von Satz
3.30 angeben. Mit dem ‘zweiten Cantorschen Diagonalverfahren’ (vgl. das
Beispiel 4 von Seite 19 zum Ersten) zeigt man dazu, dass eine Abbildung
f : N → R nicht surjektiv sein kann. Schreibt man nämlich die Nachkommastellen der Bilder von f als
f (1) = . . . , a11 a12 a13 . . .
f (1) = . . . , a21 a22 a23 . . .
f (1) = . . . , a31 a32 a33 . . .
..
.
und bildet aus den diagonalen Einträgen a11 , a22 , a33 , . . . die Zahl
x = 0, b1 b2 b3 . . .
mit
(
7 falls ann =
6 7,
bn =
3 falls ann = 7,
so ist tatsächlich x 6= f (n) für jedes n ∈ N.
4.6
Potenzreihen und die Exponentialfunktion
Viele spezielle Funktionen, insbesondere etwa die Ihnen aus der Schule bekannte
e-Funktion oder auch die Sinus- und Cosinusfunktion lassen sich mit Hilfe von
Reihen definieren. Diese Reihen sind von der Form
∞
X
cn (z − z0 )n ,
n=0
wobei cn ∈ C komplexe Koeffizienten und z0 ∈ C der sogenannte Entwicklungspunkt sind, die wir als fest gewählt betrachten. z ∈ C ist eine Variable. (Wir
betrachten hier gleich allgemein den komplexen Fall.) Konvergiert diese Reihe
für z ∈ M , M eine
C, so definiert dies eine Abbildungsvorschrift
P Teilmenge von
n
M → C, z 7→ ∞
c
(z
−
z
)
.
Eine
Reihe von dieser Form nennt man eine
0
n=0 n
Potenzreihe. Kümmert man sich zunächst nicht um deren Konvergenz, so spricht
man auch von einer formalen Potenzreihe.
Mit den bislang entwickelten Methoden lässt sich genauer beschreiben, für
welche z diese Reihen konvergieren. Es stellt sich heraus, dass dies gerade auf
Kreisscheiben um z0 der Fall ist. Wir führen daher die Notation Br (z0 ) := {z ∈
C : |z − z0 | < r} ein.
77
Satz 4.41 Es seien cn , z0 ∈ C, n ∈ N0 . Setze
r=
wobei hier(!)
1
∞
als 0 und
1
0
1
lim supn→∞
p
,
n
|cn |
als ∞ zu lesen ist. Dann gilt:
(i) Die Reihe
∞
X
cn (z − z0 )n
n=0
konvergiert absolut, falls |z − z0 | < r ist, und stellt damit eine Funktion
f : Br (z0 ) → C dar.
(ii) Sie divergiert, falls |z − z0 | > r ist.
Beweis. Setze an = cn (z − z0 )n . Dann ist
p
p
lim sup n |an | = |z − z0 | lim sup n |cn |
n→∞
n→∞


< 1 ⇔ |z − z0 | <
1√
,
lim sup n |cn |

> 1 ⇔ |z − z0 | >
1√
.
lim sup n |cn |
n→∞
n→∞
Die Behauptung folgt nun sofort aus dem Wurzelkriterium (Satz 4.36).
Die Reihe konvergiert also für diejenigen z ∈ C, die in einer Kreisscheibe mit
dem Radius r um z0 liegen. Dabei wird allerdings keine Aussage darüber gemacht,
ob sie auch auf den Randpunkten dieses Kreises konvergiert. Liegt z weiter als
r von z0 entfernt, so divergiert sie jedoch auf jeden Fall. Dies legt die folgende
Definition nahe:
Definition 4.42 Es sei
P∞
n=0 cn (z
− z0 )n eine Potenzreihe. Die Zahl
∞
X
n
sup |z − z0 | :
cn (z − z0 ) konvergiert =
n=0
1
lim supn→∞
p
n
|cn |
heißt der Konvergenzradius dieser Potenzreihe.
n|
Bemerkung. Der Konvergenzradius ist auch gegeben durch limn→∞ |c|cn+1
, falls
|
dieser Grenzwert existiert. (Übung!)
Beispiele:
P
n
1. Die Potenzreihe ∞
n=0 z hat den Konvergenzradius r = 1. Sie stellt die
1
Funktion B1 (0) → C, z 7→ 1−z
dar.
P
n n
2. Die Potenzreihe ∞
n=0 n z hat den Konvergenzradius 0. (Übung!)
78
3. Die Potenzreihe
P∞
n=0
3n z n hat den Konvergenzradius
r=
1
lim supn→∞
p
n
1
= .
3
|3n |
1
Sie stellt die Funktion B1/3 (0) → C, z 7→ 1−3z
dar.
P∞ zn
4. Die sogenannte Exponentialreihe
n=0 n! hat den Konvergenzradius ∞,
konvergiert also für alle z ∈ C.
Dies folgt aus dem Quotientenkriterium, da
|z|
|z n+1 n!|
=
→0<1
|z n (n + 1)!|
n+1
mit n → ∞.
Bemerkung:
Sind z0 = x0 und alle cn reell, so stellt die reelle Potenzreihe
P∞
n
n=0 cn (x − x0 ) , x ∈ R, eine reelle Funktion f : (x0 − r, x0 + r) → R dar, wobei
∞
X
k
ck (x − x0 ) konvergiert
r = sup |x − x0 | : x ∈ R und
k=0
ist. Nach unseren Ergebnissen von oben, konvergiert diese Reihe aber tatsächlich
auf der ganzen komplexen Kreisscheibe {z ∈ C : |z − x0 | < r} und stellt dort eine
Funktion f : Br (x0 ) → C dar.
Multipliziert man zwei Potenzreihen mit demselben Entwiclungspunkt z0 , so
erhält man wieder eine Potenzreihe mit dem Entwicklungspunkt z0 . Die Idee
hierbei ist, all die Terme, die beim Ausmultiplizieren des Produktes der Reihen entstehen, nach Potenzen von z n zusammenzufassen. Wir fomulieren dazu
zunächst einen Produktsatz für allgemeine Reihen.
P
P∞
Satz 4.43 (Das Cauchyprodukt) Es seienP ∞
n=0 an und
n=0 bn absolut konn
vergente komplexe Reihen. Setzt man cn = k=0 an−k bk , so ist auch die Reihe
P
∞
n=0 cn absolut konvergent und es gilt
X
X
∞
∞
∞
X
cn =
an ·
bn .
n=0
n=0
n=0
Beweis. Setze
sm =
m
X
cn =
n=0
n
m X
X
an−k bk ,
s̄m =
m
X
|cn | ≤
n=0
n=0 k=0
m X
n
X
|an−k bk |
n=0 k=0
sowie
tm =
X
m
n=0
X
m
an ·
bn ,
t̄m =
n=0
X
m
n=0
79
X
m
|an | ·
|bn | .
n=0
Nach Voraussetzung konvergieren (tm ) und (t̄m ), wobei
X
X
∞
∞
lim tm =
an ·
bn
m→∞
n=0
n=0
ist.
Mit Hilfe der Indezmengen Qm = {(i, j) ∈ N0 × N0 : i, j ≤ m} und Dm =
{(i, j) ∈ N0 × N0 : i + j ≤ m} lassen sich diese Summen auch schreiben als
X
X
sm =
ai bj ,
s̄m ≤
|ai bj |
(i,j)∈Dm
(i,j)∈Dm
sowie
tm =
X
ai b j ,
X
t̄m =
(i,j)∈Qm
|ai bj |.
(i,j)∈Qm
Wegen
P∞ Dm ⊂ Qm folgt hieraus zunächst s̄m ≤ t̄m ≤ limk→∞ t̄m , so dass in der
Tat n=0 cn absolut konvergiert.
Zu gegebenem ε > 0 wählen wir nun ein k ∈ N mit t̄m − t̄k < ε für m ≥ k.
Für m ≥ 2k ergibt sich dann wegen Dm ⊃ Qk , dass
X
X
|tm − sm | = |ai bj | = t̄m − t̄k < ε
ai bj ≤
(i,j)∈Qm \Qk
(i,j)∈Qm \Dm
ist. Damit aber folgt limm→∞ sm = limm→∞ tm , was zu zeigen war.
Speziell für Potenzreihen zeigt dies, dass das Produkt zweier Potenzreihen
wieder eine Potenzreihe ist, deren Konvergenzradius mindesten so groß ist, wie
das Minimum der Konvergenzradien der Faktoren:
P∞
P
n
Korollar 4.44 Konvergieren die Potenzreihen ∞
n=0 bn (z−
n=0 an (z−z0 ) und
n
z0 ) im Punkt z absolut, so gilt
X
X
X
∞
∞
∞ X
n
n
n
an (z − z0 ) ·
bn (z − z0 ) =
an−k bk (z − z0 )n .
n=0
n=0
n=0
k=0
Beweis. Klar nach Satz 4.43.
Wir werden uns später noch wesentlich ausführlicher mit Potenzreihen beschäftigen. Hier konzentrieren wir uns nun auf eine besonders wichtige. (Die Wichtigste
überhaupt!)
Nach Beispiel 4 von Seite 79 dürfen wir definieren:
Definition 4.45 Die Funktion exp : C → C,
exp(z) =
∞
X
zn
n=0
n!
heißt die Exponentialfunktion. Die Zahl e := exp(1) heißt auch die Eulersche Zahl.
80
Beachte, dass nach der Bemerkung von Seite 79 exp(x) reell ist, wenn x reell
ist. Offensichtlich ist exp(0) = 1.
Grundlegend ist nun die folgende Funktionalgleichung für die Exponentialfunktion.
Satz 4.46 Für z1 , z2 ∈ C ist
exp(z1 + z2 ) = exp(z1 ) · exp(z2 ).
Beweis. Nach Satz 4.43 ist
exp(z1 ) · exp(z2 ) =
=
∞ X
n
X
∞
n z2k X 1 X n n−k k
z1n−k
·
=
z z2
(n − k)! k!
n! k=0 k 1
n=0
n=0 k=0
∞
X
(z1 +
n=0
z2 )n
= exp(z1 + z2 ),
n!
wobei wir im dritten Schritt den allgemeinen binomischen Lehrsatz 2.9 ausgenutzt
haben. (Der gilt auch in C; der Beweis ist wörtlich derselbe.)
Satz 4.47 Es gilt
(i) exp(z) 6= 0 für alle z ∈ C,
(ii) exp(x) > 0 für alle x ∈ R,
(iii) exp(n) = en für alle n ∈ Z,
√
(iv) exp( pq ) = q ep für alle p ∈ Z, q ∈ N.
Beweis. (i) Für z ∈ C ist
exp(−z) exp(z) = exp(z − z) = exp(0) = 1
und somit insbesondere exp(z) 6= 0.
P
xn
(ii) Für x ≥ 0 ist offensichtlich exp(x) = ∞
n=0 n! ≥ 1 > 0. Für x < 0 folgt
dann wegen exp(x) exp(−x) = 1 und exp(−x) > 0 nach dem schon Gezeigten
auch exp(x) > 0.
(iii, iv) Wir überlegen uns, dass allgemeiner für jedes z ∈ C und n ∈ Z gilt
exp(nz) = (exp(z))n .
Zunächst gilt exp(0 · z) = 1 = (exp(z))0 . Induktiv ergibt sich daraus exp(nz) =
(exp(z))n für alle n ∈ N: Ist dies für n schon gezeigt, so folgt
exp((n + 1)z) = (exp(z))n exp(z) = (exp(z))n+1 .
81
Hieraus folgt dann für n ∈ Z \ N (und damit −n ∈ N) auch
1 = exp(nz − nz) = exp(nz) exp(−nz) = exp(nz)(exp(z))−n ,
1
n
also exp(nz) = (exp(z))
−n = (exp(z)) .
Nun folgt (iii) sofort mit z = 1. (iv) ergibt sich mit z =
exp(q · pq ) = exp(p) = ep (nach (iii)).
82
p
q
aus (exp( pq ))q =
Kapitel 5
Stetige Funktionen
Wir untersuchen nun Funktionen, die auf Teilmengen von R (oder C) definiert
sind. Dabei konzentrieren wir uns im Wesentlichen auf den reellen Fall, also Funktionen f : D → R mit D ⊂ R. Oft ist dabei D ein Intervall in R.
5.1
Definition und grundlegende Eigenschaften
Im Folgenden sei D ⊂ R.
Eine ganz wesentliche Güteeigenschaft einer Funktion f : D → R ist dann
gegeben, wenn kleine Änderungen in x ∈ D nur kleine Änderungen der Funktionswerte f (x) bewirken. Formal:
Definition 5.1 Eine Funktion f : D → R heißt stetig im Punkt x0 ∈ D, wenn
es zu jedem ε > 0 ein δ > 0 gibt, so dass für alle x ∈ D mit |x − x0 | < δ gilt
|f (x) − f (x0 )| < ε, d.h.:
∀ ε > 0 ∃ δ > 0 ∀ x ∈ D : |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε.
f : D → R heißt stetig, wenn f in jedem Punkt aus D stetig ist.
Das bedeutet: Zu jeder vorgelegten ‘Fehlertoleranz’ ε > 0 gibt es ein (kleines)
δ > 0, so dass die Funktionswerte f (x) weniger als ε von f (x0 ) abweichen, wenn
nur der Abstand von x zu x0 kleiner als δ ist.
Beispiele.
1. Jede konstante Funktion f : R → R, f (x) = c (für ein c ∈ R) ist stetig.
(Klar: δ kann hier beliebig gewählt werden.)
2. Die identische Funktion f : R → R, f (x) = x ist stetig.
Indem man zu gegebenem ε > 0 einfach δ = ε wählt folgt tatsächlich für
jedes x0 ∈ R:
|f (x) − f (x0 )| = x − x0 ≤ |x − x0 | < ε.
83
3. Der Absolutbetrag f : R → R, f (x) = |x| ist stetig.
Sind nämlich x0 ∈ R und ε > 0 gegeben, so gilt für x mit |x − x0 | < δ := ε
nach der umgekehrten Dreiecksungleichung
|f (x) − f (x0 )| = |x| − |x0 | ≤ |x − x0 | < ε.
4. f : R → R, f (x) = x2 stetig.
ε
Sind nämlich x0 ∈ R und ε > 0 gegeben, so wählen wir δ = min{1, 1+2|x
}.
0|
Dann gilt für x mit |x − x0 | < δ
|f (x) − f (x0 )| = |x2 − x20 | = |x − x0 + x0 + x0 ||x − x0 |
≤ (|x − x0 | + 2|x0 |)|x − x0 | < (δ + 2|x0 |)δ ≤ (1 + 2|x0 |)δ ≤ ε.
5. Die Funktion f : R → R,
(
0, für x ≤ 0,
f (x) =
1, für x > 0,
ist im Nullpunkt nicht stetig. (Sonst schon.)
Zu ε = 21 gibt es zu jedem δ > 0 den Punkt x = 2δ , der zwar |x − 0| =
erfüllt, aber auch
δ
2
<δ
|f (x) − f (0)| = |1 − 0| = 1 > ε.
6. Der ganzzahlige Anteil f : R → R, f (x) = bxc ist genau in den Punkten
x0 ∈ Z nicht stetig. (Überlegen Sie sich das!)
7. Die Funktion f : R → R,
(
1, für x ∈ Q,
f (x) =
0, für x ∈ R \ Q
ist nirgends stetig. (Überlegen Sie sich das!)
Während diese ‘ε-δ-Definition’ der Stetigkeit für viele Untersuchungen grundlegend ist, ist sie, wie wir etwa im vorangegangenen Beispiel 4 gesehen haben,
für Beispiele oft zu schwerfällig. Wir geben daher nun eine äquivalente Umformulierung mit Hilfe von Grenzwerten der Form limx→x0 f (x) an. Dazu müssen wir
uns zunächst überlegen, wie sich eine solcher Grenzwert einer Funktion definieren
lässt.
84
Definition 5.2 Es seien D ⊂ R, f : D → R.
(i) Die Menge
D = {x ∈ R : Es gibt eine Folge (xn ) in D mit lim xn = x}
n→∞
heißt der Abschluss von D.
(ii) Ist x0 ∈ D, so schreiben wir
lim f (x) = a
x→x0
(oder auch f (x) → a für x → x0 ),
wenn für jede Folge (xn ) in D mit limn→∞ xn = x0 gilt limn→∞ f (xn ) = a.
a heißt der Grenzwert von f bei x0 .
Offensichtlich gilt immer D ⊂ D. Beachten Sie: In (ii) genügt es nicht, dass
limn→∞ f (xn ) = a für eine Folge (xn ) mit xn → x0 gilt. Diese Bedingung muss
für alle diese Folgen erfüllt sein.
Beispiele.
1. Für f : R → R, f (x) = xk (k ∈ N0 ) und x0 ∈ R ist
lim f (x) = lim xk = xk0 = f (x0 ).
x→x0
x→x0
Für jede Folge (xn ) mit xn → x0 gilt nach dem Grenzwertsatz für Produkte
nämlich
lim xkn = xk0 .
n→∞
2. Für exp : R → R gilt
lim exp(x) = 1.
x→0
Um dies einzusehen, bemerken wir zuerst, dass für |x| < 1 gilt
∞ n
∞
X
X x 1
≤ |x|
= |x|(e − 1).
| exp(x) − 1| = n!
n!
n=1
n=1
Ist nun (xn ) eine Folge in R mit xn → 0, so folgt hieraus limn→∞ | exp(xn ) −
1| → 0 und damit exp(xn ) → 1 für n → ∞.
Satz 5.3 Eine Funktion f : D → R ist genau dann stetig in x0 ∈ D, wenn gilt
lim f (x) = f (x0 ).
x→x0
85
Beweis. ⇒: Es sei (xn ) eine Folge in D mit xn → x0 . Zu gegebenem ε > 0 wählen
wir δ > 0 mit
|f (x) − f (x0 )| < ε für alle x ∈ D mit |x − x0 | < δ.
Danach wählen wir N ∈ N mit |xn − x0 | < δ für alle n ≥ N . Für n ≥ N ist damit
auch |f (xn ) − f (x0 )| < ε.
⇐: Die Rückrichtung zeigen wir durch Kontraposition: Ist f bei x0 nicht
stetig, so gilt
∃ ε > 0 ∀ δ > 0 ∃ x ∈ D : |x − x0 | < δ und |f (x) − f (x0 )| ≥ ε.
Es gibt also ein ε > 0, so dass wir insbesondere zu jedem δ =
xn ∈ D finden mit
|xn − x0 | <
1
n
(n ∈ N) ein
1
und |f (xn ) − f (x0 )| ≥ ε.
n
Dann aber gilt xn → x0 und f (xn ) 6→ f (x0 ) und somit f (x) 6→ f (x0 ) für x → x0 .
Beispiele.
1. Nach Beispiel 1 von Seite 85 ist die für jedes k ∈ N0 Funktion f : R → R,
f (x) = xk stetig.
2. Die Exponentialfunktion exp : R → R ist stetig. Die Stetigkeit im Nullpunkt folgt sofort aus Beispiel 2 von Seite 85. Ist allgemein x0 ∈ R, so folgt
hieraus auch
lim exp(x) = exp(x0 ) lim exp(x − x0 ) = exp(x0 ).
x→x
}
| 0 {z
x→x0
=exp(0)=1
Wir zeigen nun, dass aus stetigen Funktionen zusammengesetzte Funktionen
wieder stetig sind. Dabei definieren wir die Summe, die Differenz, das Produkt
oder den Quotienten zweier Funktionen ganz allgemein punktweise:
Definition 5.4 Es seien M eine Menge, f, g : M → R Funktionen. Man definiert dann dann f + g, f − g, f g : M → R und, falls g nirgends 0 ist, fg : M → R
durch
(f ± g)(x) = f (x) ± g(x),
(f g)(x) = f (x)g(x),
f
f (x)
(x) =
.
g
g(x)
(Hat g Nullstellen, so kann man auf diese Weise immer noch
0} → R definieren.)
86
f
g
: {x ∈ M : g(x) 6=
Satz 5.5 Es seien f, g : D → R in x0 ∈ D stetige Funktionen. Dann sind auch
die Funktionen f + g, f − g, f g : D → R und, falls g(x0 ) 6= 0, fg : {x ∈ D : g(x) 6=
0} → R stetig in x0 .
Beweis. Das folgt sofort aus den Grenzwertsätzen.
Auch die Komposition stetiger Abbildungen ist wieder stetig:
Satz 5.6 Es seien D, E ⊂ R, f : D → E stetig in x0 ∈ D und g : E → R stetig
in f (x0 ). Dann ist g ◦ f stetig in x0 .
Beweis. Gilt xn → x0 in D, so folgt f (xn ) → f (x0 ) aus der Stetigkeit von f bei
x0 und hieraus dann g(f (xn )) → g(f (x0 )) aus der Stetigkeit von g bei f (x0 ), wie
zu zeigen war.
Beispiele.
1. Ist f : D → R stetig, c ∈ R, so auch cf : R → R, x 7→ cf (x).
cf ist ja das Produkt der konstanten Funktion mit Wert c und f .
2. Jedes Polynom, also jede Funktion f : R → R,
f (x) = an xn + an−1 xn−1 + . . . + a1 x + a0
für gegebene Koeffizienten a0 , . . . , an ∈ R ist stetig. (Ist an 6= 0, so nennt
man n den Grad dieses Polynoms.)
3. Jede rationale Funktion fg : R \ {x ∈ R : g(x) = 0} → R, wobei f und g
Polynome sind, ist stetig.
4. Die Funktion f : R → R,
f (x) =
exp(x5 )
2 + |x|
ist stetig.
Zum Schluss dieses Abschnitts bemerken wir noch, dass man all diese Ergebnisse direkt ins Komplexe übertragen kann. Die Definition der Stetigkeit ist
genau die gleiche:
Definition 5.7 Es sei nun D ⊂ C, z0 ∈ D. Eine Funktion f : D → C heißt
stetig im Punkt z0 ∈ D, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass für alle
z ∈ D mit |z − z0 | < δ gilt |f (z) − f (z0 )| < ε, d.h.:
∀ ε > 0 ∃ δ > 0 ∀ z ∈ D : |z − z0 | < δ ⇒ |f (z) − f (z0 )| < ε.
f : D → C heißt stetig, wenn f in jedem Punkt aus D stetig ist.
Bemerkung. Genau wie zuvor zeigt man, dass die Stetigkeit in einem Punkt z0 ∈
D zu limz→z0 f (z) = f (z0 ) äquivalent ist und dass aus stetigen Funktionen (durch
Addition, Subtraktion, Multiplikation und Division wie auch durch Komposition)
zusammengesetzte Funktionen wieder stetig sind.
Genau die gleiche Argumentation wir im Reellen zeigt, dass die Exponentialfunktion exp : C → C auch im Komplexen stetig ist.
87
5.2
Stetige Funktionen auf kompakten Intervallen
Wir untersuchen nun drei grundlegende Sätze über stetige Funktionen auf einem
abgeschlossenen beschränkten Intervall [a, b]. Ein solches Intervall nennt man
auch kompakt. Für den folgenden Abschnitt fixieren wir a, b ∈ R mit a < b.
Die im Folgenden wesentliche Eigenschaft solcher Intervalle ist das folgende
Korollar zum Satz von Bolzano-Weierstraß, das man auch selbst oft wieder einfach
‘Satz von Bolzano-Weierstraß’ nennt.
Korollar 5.8 Jede Folge in [a, b] besitzt eine in [a, b] konvergente Teilfolge.
Beweis. Nach Satz 4.23 besitzt jede Folge in [a, b] eine konvergente Teilfolge, deren
Limes nach Korollar 4.11 selbst in [a, b] liegt.
Der erste Satz befasst sich mit der Existenz von Minima und Maxima stetiger
Funktionen.
Definition 5.9 Ist M eine Menge, f : M → R eine Abbildung, so nennt man
f (nach oben/nach unten) beschränkt, wenn f (M ) (nach oben/unten) beschränkt
ist.
Satz 5.10 Es sei f : [a, b] → R stetig.
(i) Dann ist f beschränkt.
(ii) f nimmt ihr Minimum und Maximum an, d.h. es gibt Punkte xmin ∈ [a, b]
und xmax ∈ [a, b] mit
f (xmin ) = min f ([a, b])
f (xmax ) = max f ([a, b]).
sowie
Achtung: Für beide Aussagen ist es wichtig, dass das Intervall [a, b] kompakt,
also abgeschlossen und beschränkt, ist! (Z.B. ist das Intervall (0, 1] beschränkt,
die Funktion (0, 1] → R, x 7→ x1 aber stetig und unbeschränkt. Weiterhin ist R ein
abgeschlossenes Intervall, die identische Funktion auf R jedoch ebenso stetig und
unbeschränkt.) Des Weiteren sind die Extremalstellen xmin , xmax im Allgemeinen
nicht eindeutig.
Beweis von Satz 5.10. Setze M = sup f ([a, b]). Dann gibt es zu jedem n ∈ N ein
xn ∈ [a, b] mit
M−
1
≤ f (xn ) ≤ M,
n
falls M < ∞,
bzw.
88
n ≤ f (xn ),
falls M = ∞.
In jedem Fall gilt also f (xn ) → M mit n → ∞. Nach dem Satz von BolzanoWeierstraß in der Form von Korollar 5.8 gibt es eine Teilfolge (xnk ) mit xnk →
xmax für ein xmax ∈ [a, b]. Aus der Stetigkeit von f folgt nun
f (xmax ) = lim f (xnk ) = M
k→∞
und damit erstens M = f (xmax ) < ∞, so dass f nach oben beschränkt ist, und
zweitens f (xmax ) = M = max f ([a, b]).
Wendet man das eben Gezeigte auf −f an, so zeigt sich, dass f auch nach
unten beschränkt ist und auch sein Minimum annimmt.
Der zweite Satz garantiert unter geeigneten Voraussetzungen, dass eine Gleichung von der Form
f (x) = 0
eine Lösung in [a, b] besitzt. (Er zeigt sogar, wie man etwa mit Hilfe des sogenannten Intervallhalbierungsverfahren eine solche Lösung numerisch berechnen
kann.)
Satz 5.11 (Zwischenwertsatz) Es sei f : [a, b] → R stetig. Es gelte entweder
f (a) > 0 und f (b) < 0
oder
f (a) < 0 und f (b) > 0.
Dann gibt es ein x0 ∈ (a, b) mit f (x0 ) = 0.
Wir zeigen zunächst ein auch für sich genommen interessantes Lemma über
stetige Funktionen.
Lemma 5.12 Es sei f : D → R in x0 ∈ D stetig mit f (x0 ) > 0. Dann gibt es
ein δ > 0 mit
f (x) > 0
∀ x ∈ D ∩ (x0 − δ, x0 + δ).
(Indem man dies auf −f anwendet, ergibt sich eine analoge Aussage für f (x0 ) <
0.)
Beweis. Setze ε = f (x0 ). Dann gibt es nach der Definition der Stetigkeit in x0
ein δ > 0 mit
f (x) = f (x0 ) + f (x) − f (x0 ) ≥ f (x0 ) − |f (x) − f (x0 )| > f (x0 ) − ε = 0
für alle x ∈ D mit |x − x0 | < δ.
Beweis von Satz 5.11. Es sei f (a) > 0 und f (b) < 0. Setze
A := {x ∈ [a, b] : f (x) ≥ 0}
und
x0 := sup A.
Wegen a ∈ A ist A nicht leer. Wir wählen (ähnlich wir im Beweis von Satz 5.10)
eine Folge (xn ) in A mit limn→∞ xn = x0 . Da für jedes n gilt f (xn ) ≥ 0, muss
auch
f (x0 ) = lim f (xn ) ≥ 0
n→∞
89
gelten. Insbesondere folgt x0 6= b. Wäre aber f (x0 ) > 0, so gäbe es nach Lemma
5.12 ein δ > 0 mit (x0 − δ, x0 + δ) ∩ [a, b] ⊂ A im Widerspruch zu x0 = sup A.
Dies zeigt, dass in der Tat f (x0 ) = 0 ist. Wegen f (a), f (b) 6= 0, ist sogar
x0 ∈ (a, b).
Ist umgekehrt f (a) < 0 und f (b) > 0, so folgt die Behauptung, indem wir das
eben Gezeigte auf −f anwenden.
Tatsächlich folgt hieraus direkt, dass f alle Werte zwischen f (a) und f (b)
annimmt:
Korollar 5.13 Es sei f : [a, b] → R stetig. Setze c = min{f (a), f (b)}, d =
max{f (a), f (b)}. Dann gilt [c, d] ⊂ f ([a, b]).
Beweis. Natürlich ist immer {c, d} = {f (a), f (b)} ⊂ f ([a, b]). Es bleibt zu zeigen,
dass, falls c 6= d, auch (c, d) ⊂ f ([a, b]) gilt.
Es sei also y ∈ (c, d). Definiere g : [a, b] → R durch g(x) := f (x) − y. Dann
ist g stetig und es gilt entweder g(a) = f (a) − y < 0 und g(b) = f (b) − y > 0
oder umgekehrt g(a) > 0 und g(b) < 0. Nach dem Zwischenwertsatz gibt es also
tatsächlich ein x0 ∈ (a, b) mit
0 = g(x0 ) = f (x0 ) − y.
Beachten Sie, dass f auch größere und kleinere Werte annehmen kann.
Der letzte wichtige Satz in diesem Abschnitt zeigt, dass stetige Funktionen
auf abgeschlossenen beschränkten Intervallen sogar einer verschärften Version
der Stetigkeit genügen, die besagt, dass das δ zu ε unabhängig vom betrachteten
Punkt x0 gewählt werden kann.
Zur Erinnerung formulieren wir noch einmal die Bedingung, dass eine Funktion f : D → R, D ⊂ R, stetig ist:
∀ x ∈ D ∀ ε > 0 ∃ δ > 0 ∀ x0 ∈ D : |x0 − x| < δ ⇒ |f (x0 ) − f (x)| < ε.
Definition 5.14 Eine Funktion f : D → R heißt gleichmäßig stetig, wenn es
zu jedem ε > 0 ein δ > 0 gibt, so dass für alle x, x0 ∈ D mit |x − x0 | < δ gilt
|f (x) − f (x0 )| < ε, d.h.:
∀ ε > 0 ∃ δ > 0 ∀ x ∈ D ∀ x0 ∈ D : |x0 − x| < δ ⇒ |f (x0 ) − f (x)| < ε.
Beispiele.
1. Offensichtlich ist jede gleichmäßig stetige Funktion auch stetig. (Die Umkehrung aber gilt, wie wir gleich sehen werden, nicht!)
2. Die Beispiele 1, 2 und 3 von Seite 83-84 (konstante Funktionen, identische
Funktion und Absolutbetrag) sind – wie wir dort schon gezeigt haben –
sogar gleichmäßig stetig.
90
3. Die Funktion f : R → R, f (x) = x2 aus Beispiel 4 von Seite 84 ist nicht
gleichmäßig stetig.
Für ε = 1 und jedes δ > 0 können wir nämlich x =
wählen, so dass |x0 − x| = 2δ < δ, aber auch
|f (x0 ) − f (x)| =
1
δ
+
1
δ
und x0 =
1
δ
+
δ
2
δ 2 1 2
δ2
−
=1+
>ε
2
δ
4
ist.
Satz 5.15 Jede stetige Funktion f : [a, b] → R ist sogar gleichmäßig stetig.
Beweis. Angenommen f ist nicht gleichmäßig stetig. Dann gibt es ein ε > 0, so
dass es zu jedem n ∈ N Punkte xn , x0n ∈ [a, b] gibt mit (wähle δ = n1 )
|x0n − xn | <
1
n
aber
|f (x0n ) − f (xn )| ≥ ε.
Nach dem Satz von Bolzano-Weierstraß in der Form von Korollar 5.8 gibt es eine
Teilfolge (xnk ) in [a, b] mit limk→∞ xnk = x für ein x ∈ [a, b]. Wegen |x0n − xn | <
1
→ 0 mit n → ∞, folgt dann aber auch limk→∞ x0nk = x. Aus der Stetigkeit von
n
f (und dem Absolutbetrag) folgt nun der Widerspruch
lim |f (x0nk ) − f (xnk )| = |f (x) − f (x)| = 0.
{z
}
k→∞ |
≥ε für alle n
Achtung: Wieder ist es wichtig vorausszusetzen, dass das betrachtete Intervall
abgeschlossen und beschränkt ist! Z.B. ist (0, 1) → R, x 7→ x1 nicht gleichmäßig
stetig. (Übungsaufgabe: Überlegen Sie sich das!) Beispiel 3 von Seite 91 zeigt,
dass auch die Beschränktheit notwendig ist.
√
Beispiel. Für jedes k ∈ N0 ist f : [0, ∞) → R, f (x) = k x gleichmäßig stetig.
(Übung!)
5.3
Monotonie und Umkehrfunktionen
Wir untersuchen nun bijektive Abbildungen f , für die sich die Zuordnungsvorschrift x 7→ f (x) umkehren lässt. Allgemein definiert man:
Definition 5.16 Ist f : M → N eine bijektive Abbildung zwischen Mengen M
und N , so ist die Umkehrfunktion f −1 : N → M definiert durch
f −1 (y) = x ⇔ f (x) = y.
91
Definition 5.17 Es sei D ⊂ R. Eine Funktion f : D → R heißt
(i) monoton wachsend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) ≤ f (x0 ),
(ii) streng monoton wachsend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) < f (x0 ),
(iii) monoton fallend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) ≥ f (x0 ), und
(iv) streng monoton fallend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) > f (x0 ).
Beispiele.
1. f : [0, ∞) → R, f (x) = xk (k ∈ N) ist streng monoton wachsend.
2. f : (0, ∞) → R, f (x) = x−k (k ∈ N) ist streng monoton fallend.
3. exp : R → R ist streng monoton wachsend:
Für x < x0 ist x0 − x > 0 und daher exp(x0 − x) =
aber ist auch
P∞
n=0
(x0 −x)n
n!
> 1. Damit
exp(x0 ) = exp(x + x0 − x) = exp(x) exp(x0 − x) > exp(x).
Satz 5.18 Es seien D ⊂ R und f : D → R streng monoton wachsend (oder
fallend).
(i) Dann ist f : D → f (D) bijektiv und f −1 : f (D) → D ebenfalls streng
monoton wachsend (bzw. fallend).
(ii) Ist f stetig und D = [a, b] ein kompaktes Intervall, so ist auch f −1 stetig
und f (D) = [f (a), f (b)] (bzw. f (D) = [f (b), f (a)]).
Hierbei ist mit f : D → f (D) diejenige Funktion gemeint, die aus f : D → R
entsteht, wenn man den Bildbereich R auf das Bild f (D) einschränkt. Streng
genommen sind das zwei verschieden Funktionen, wenn nicht gerade f (D) = R
ist. Für die Stetigkeit oder Monotonie einer Funktion ist diese Unterscheidung
jedoch offenbar irrelevant. Genauso können wir f −1 auch wieder als Funktion
f −1 : f (D) → R mit Wertebereich R auffassen.
Beweis. (i) Wir behandeln nur den Fall, dass f streng monoton wächst. Der
andere Fall ergibt sich völlig analog dazu (oder daraus durch Übergang zu −f .)
Als streng monoton wachsende Funktion ist f injektiv. Offensichtlich ist f : D →
f (D) (nach Konstruktion) auch surjektiv, also bijektiv. Sind nun y, y 0 ∈ f (D) mit
y < y 0 , etwa f (x) = y und f (x0 ) = y 0 , so folgt f −1 (y) < f −1 (y 0 ), denn anderenfalls
wäre x = f −1 (y) ≥ f −1 (y 0 ) = x0 und damit y = f (x) ≥ f (x0 ) = y 0 .
(ii) Setze [c, d] = [f (a), f (b)] (bzw. [c, d] = [f (b), f (a)]). Aus der Monotonie
von f folgt f (D) ⊂ [c, d]. Andererseits gilt nach Korollar 5.13 auch [c, d] ⊂ f (D).
92
Wäre nun f −1 nicht stetig, so gäbe es ein y ∈ [c, d] und eine Folge (yn ) in
[c, d] mit yn → y aber f −1 (yn ) 6→ f −1 (y). D.h. es gäbe ein ε > 0 und unendlich
viele Indizes n1 < n2 < . . . mit |f −1 (ynk ) − f −1 (y)| ≥ ε für alle k ∈ N. Nach
dem Satz von Bolzano-Weierstraß gibt es dann eine Teilfolge (f −1 (ynkj ))j∈N von
(f −1 (ynk ))k∈N mit limj→∞ f −1 (ynkj ) = x für ein x ∈ [a, b]. Aus der Stetigkeit von
f ergibt sich dann aber
f (x) = lim f (f −1 (ynkj )) = lim ynkj = y
j→∞
j→∞
und hieraus
lim f −1 (ynkj ) = x = f −1 (y)
j→∞
im Widerspruch zu |f −1 (ynk ) − f −1 (y)| ≥ ε für alle k ∈ N.
Beachten Sie: Für die Stetigkeit der Umkehrfunktion ist es wichtig vorauszusetzen, dass D ein Intervall ist. Z.B. ist die Umkehrfunktion der stetigen und
streng wachsenden Funktion
(
x
für 0 ≤ x ≤ 1,
f : [0, 1] ∪ (2, 3] → [0, 2],
f (x) =
x − 1 für 2 < x ≤ 3,
gegeben durch
f −1 : [0, 2] → [0, 1] ∪ (2, 3],
(
x
für 0 ≤ x ≤ 1,
f −1 (x) =
x + 1 für 1 < x ≤ 1,
und somit nicht stetig.
Beispiele.
1. Die Umkehrfunktion von f : [0, ∞) → [0, ∞), f (x) = xk (k ∈ N) ist
√
f −1 : [0, ∞) → [0, ∞), f −1 (y) = k y.
2. Die Exponentialfunktion bildet R bijektiv auf (0, ∞) ab.
Wir
schon, dass exp(R) ⊂ (0, ∞) ist, s. Satz 4.47(ii). Wegen exp(k) =
P∞ wissen
kn
1
≥
k und damit auch exp(−k) = exp(k)
≤ k1 , ergibt sich aus Satz
n=0 n!
5.18(ii)
[
[ h1 i
, k = (0, ∞).
exp(R) ⊃
exp([−k, k]) ⊃
k
k∈N
k∈N
Das letzte Beispiel gibt zur Definition einer wichtigen Funktion Anlass.
Definition 5.19 Die Umkehrfunktion der Exponentialfunktion heißt der natürliche
Logarithmus. Sie wird mit log : (0, ∞) → R oder auch mit ln : (0, ∞) → R bezeichnet.
93
Nach Satz 5.18 ist log stetig und streng monoton wachsend. Aus der Funktionalgleichung für exp (‘Summen werden zu Produkten’, vgl. Satz 4.46) gewinnt
man die entsprechende Funktionalgleichung für log (‘Produkte werden zu Summen’).
Satz 5.20 Für x, x0 > 0 gilt log(xx0 ) = log(x) + log(x0 ).
Beweis. Es ist
exp(log(xx0 )) = xx0 = exp(log(x)) exp(log(x0 )) = exp(log(x) + log(x0 )).
Da exp bijektiv ist, folgt hieraus auch log(xx0 ) = log(x) + log(x0 ) wie behauptet.
Mit Hilfe der Exponential- und Logarithumsfunktion lassen sich nun beliebige
allgemeine Potenzen definieren.
Definition 5.21 Für a > 0 und b ∈ R definieren wir die reelle Zahl ab (sprich:
‘a hoch b’) durch
ab := exp(b log(a)).
Beachte, dass dies für b ∈ Z wegen (vgl. den Beweis von Satz 4.47)
exp(b log(a)) = (exp(log(a)))b = ab
mit unserer früheren Definition übereinstimmt. Für b =
√
1
a n = n a, denn
1
an
n
=
exp
1
n
log a
n
1
n
(n ∈ N) ist außerdem
1
= exp n · log a = exp(log a) = a.
n
Insbesondere ist für a = e = exp(1) und somit log(e) = 1
exp(x) = exp(x log(e)) = ex
für alle x ∈ R. Allgemeiner schreibt man auch für z ∈ C
exp(z) = ez .
Wir bemerken noch, dass sich unmittelbar aus dieser Definition das Rechengesetz
log(ab ) = b log(a).
ergibt.
94
Satz 5.22
(i) Es sei b ∈ R fixiert. Die allgemeine Potenzfunktion
x 7→ xb
(0, ∞) → (0, ∞),
ist stetig, für b > 0 streng monoton wachsend und für b < 0 streng monoton
fallend. Es gilt
xb (x0 )b = (xx0 )b
für alle x, x0 > 0.
(ii) Es sei a > 0 fixiert. Die Exponentialfunktion zur Basis a
x 7→ ax
R → (0, ∞),
ist stetig, für a > 1 streng monoton wachsend und für 0 < a < 1 streng
monoton fallend. Es gilt
0
ax+x = ax ax
0
0
axx = (ax )x
sowie
0
für alle x.x0 ∈ R.
Beweis. Setze pb : (0, ∞) → (0, ∞), pb (x) = xb und expa : R → (0, ∞), expa (x) =
ax .
Die Stetigkeit von pb und expa ergibt sich daraus, dass sich diese Funktionen
als Verkettung stetiger Funktionen schreiben lassen. Ist nämlich fc : R → R für
(festes) c ∈ R gegeben durch fc (x) = cx, so ist
pb = exp ◦fb ◦ log
und
expa = exp ◦flog a .
Übungsaufgabe: Beweisen Sie die übrigen Aussagen!
5.4
Asympotisches Verhalten
In diesem Abschnitt untersuchen und vergleichen wir das Verhalten von xα ,
exp(x) und log(x) für betragsmäßig sehr kleine oder sehr große Werte von x
und insbesondere im Limes x → 0 und x → ∞. Dazu müssen wir zunächst auch
uneigentliche Funktionengrenzwerte definieren.
Definition 5.23 Es seien D ⊂ R, f : D → R.
(i) Ist x0 ∈ D und c ∈ {−∞, +∞}, so schreiben wir
lim f (x) = c,
x→x0
wenn für jede Folge (xn ) in D, die gegen x0 konvergiert, gilt limn→∞ f (xn ) =
c (im uneigentlichen Sinne).
95
(ii) Ist D nach unten (oder oben) unbeschränkt und c ∈ R ∪ {−∞, +∞}, so
schreiben wir
lim f (x) = c
bzw.
x→−∞
lim f (x) = c,
x→+∞
wenn für jede Folge (xn ) in D, die gegen −∞ bzw. +∞ uneigentlich konvergiert, gilt limn→∞ f (xn ) = c (im eigentlichen oder uneigentlichen Sinne).
Beachten Sie, dass diese Grenzwerte und sogar die bloße Existenz dieser
Grenzwerte vom Definitionsbereich D abhängt. Man schreibt die Bedingung x ∈
D zur Verdeutlichung daher auch oft explizit unter das Limeszeichen.
Beispiele.
1. Für D = (0, +∞) ist
lim
x→0
x∈D
1
1
= lim
= +∞,
x→0 x
x
x>0
für D = (−∞, 0) aber
lim
x→0
x∈D
1
1
= lim
= −∞.
x→0 x
x
x<0
Für D = R \ {0} existiert lim x→0
x∈D
1
x
= lim x→0
x6=0
1
x
nicht.
2. Es sei D = R und p : R → R, p(x) = an xn + . . . a1 x + a0 ein Polynom mit
an > 0. Dann ist
(
+∞, falls n gerade ist,
lim p(x) = ∞
und
lim p(x) =
x→∞
x→−∞
−∞, falls n ungerade ist.
Übungsaufgabe: Zeigen Sie dies!
Wir vergleichen nun das Wachstumsverhalten der Exponential-, Potenz- und
Logarithumsfunktion für x → 0 und x → ∞.
Satz 5.24 Für jedes α ∈ R gilt
ex
= ∞.
x→∞ xα
Man sagt daher, die Exponentialfunktion wachse stärker als jede Potenz.
Beweis. Wir wählen k ∈ N mit k ≥ α. Für x ≥ 1 ist nach Satz 5.22(ii)
lim
x
e =
∞
X
xn
n=0
xk+1
xxα
>
≥
,
n!
(k + 1)!
(k + 1)!
ex
x
d.h. xα ≥ (k+1)!
. Ist nun (xn ) eine Folge mit xn → ∞ und also auch
xn
so folgt hieraus auch limn→∞ exα = +∞.
n
96
xn
(k+1)!
→ ∞,
Korollar 5.25 Für jedes α ∈ R gilt
lim xα e−x = 0
1
lim
xα e x = +∞.
x→0
und
x→∞
x>0
Beweis. Die erste Behauptung folgt aus xα e−x =
Die Zweite ergibt sich (mit y = x1 ) aus
1
x−α ex
für x > 0 und Satz 5.24.
1
lim
xα e x = lim y −α ey = ∞
x→0
x>0
y→∞
nach Satz 5.24.
Eine weitere unmittelbare Konsequenz ist das
Korollar 5.26 Es gilt
(i) limx→+∞ ex = +∞ und limx→−∞ ex = 0 sowie
(ii) limx→+∞ log x = +∞ und lim x→0 log x = −∞.
x>0
Beweis. (i) folgt sofort aus Satz 5.24 und Korollar 5.25 im Falle α = 0.
(ii) Ist (xn ) eine Folge mit xn → ∞ und K > 0, so gibt es ein N ∈ N mit
xn > eK für alle n ≥ N . Aus der Monotonie des Logarithmus folgt dann aber
auch
log xn ≥ log eK = K
für n ≥ N . Dies zeigt limx→+∞ log x = +∞. Die zweite Behauptung ergibt sich
hieraus, denn es ist
lim
log x = lim log(y −1 ) = − lim log y = −∞.
x→0
y→+∞
x>0
y→+∞
Korollar 5.27
(i) Für jedes α > 0 gilt
lim xα = +∞
lim
xα = 0.
x→0
und
x→+∞
x>0
(ii) Für jedes α < 0 gilt
lim xα = 0
x→+∞
und
lim
xα = +∞.
x→0
x>0
97
Beweis. (i) Ist (xn ) eine Folge mit xn → +∞, so folgt log xn → ∞ wie eben
gesehen und damit auch
xαn = eα log xn → ∞.
Dies zeigt limx→+∞ xα = +∞. Daraus folgt auch
1
= 0.
y→∞ y α
lim
xα = lim (y −1 )α = lim
x→0
y→∞
x>0
(ii) Dies folgt aus (i) wegen
lim xα = lim
y −α = 0
y→0
x→+∞
und
y>0
lim
xα = lim y −α = +∞.
x→0
y→+∞
x>0
Wir können also die Potenzfunktion x →
7 x für positive α auf [0, ∞) stetig
α
fortsetzen, indem wir 0 := 0 vereinbaren.
α
Korollar 5.28 Für jedes α > 0 gilt
log x
=0
x→+∞ xα
lim
und
lim
xα log x = 0.
x→0
x>0
Das heißt: Der Logarithmus wächst im Unendlichen langsamer als jede positive Potenz; für x → 0 divergiert er langsamer gegen Unendlich als jede positive
Potenz gegen 0 konvergiert.
Beweis. Mit x → ∞ gilt auch α log x → ∞ und daher nach Korollar 5.25
1 α log x
log x
= lim
· α log x = 0.
α
x→+∞ x
x→+∞ α
e
lim
Hieraus ergibt sich auch
lim
xα log x = lim y −α log(y −1 ) = lim
x→0
x>0
y→∞
y→∞
− log y
= 0.
yα
5.5
Trigonometrische Funktionen
Wir definieren nun die trigonometrischen Funktionen sin, cos und tan und untersuchen einige ihre Eigenschaften.
Für x ∈ R ist |eix |2 = eix eix = eix e−ix = e0 = 1. eix liegt also auf dem
Einheitskreis in der komplexen Ebene.
98
Definition 5.29 Die Cosinusfunktion cos : R → R und die Sinusfunktion sin :
R → R sind definiert durch
cos x = Re eix
sin x = Im eix
und
für x ∈ R.
Unmittelbar aus der Definition ergeben sich die im folgenden Satz zusammengestellten Eigenschaften.
Satz 5.30 Für alle x ∈ R gelten
(i) die Eulersche Fomel
eix = cos x + i sin x,
(ii) cos x = 12 (eix + e−ix ) und sin x =
1
(eix
2i
− e−ix ),
(iii) cos(−x) = cos x und sin(−x) = − sin x,
(iv) der ‘trigonometrische Pythagoras’
cos2 x + sin2 x = 1,
(mit cos2 x = (cos x)2 und sin2 x = (sin x)2 ) sowie
(v) cos(0) = 1 und sin(0) = 0.
Beweis. Klar.
Satz 5.31 cos und sin sind stetig.
Beweis. Ist (xn ) eine reelle Folge mit xn → x, so folgt aus der Bemerkung von
Seite 87 und Satz 4.22
cos xn = Re eixn → Re eix = cos x
und
sin xn = Im eixn → Im eix = sin x.
Endlich können wir nun auch die schon am Ende von Abschnitt 3.5 benutzten
Additionstheoreme für den Cosinus und den Sinus beweisen.
Satz 5.32 Für x, y ∈ R gelten
cos(x + y) = cos x cos y − sin x sin y
sin(x + y) = sin x cos y + cos x sin y.
99
und
Beweis. Aus der Eulerschen Formel und der Funktionalgleichung der Exponentialfunktion folgt
cos(x + y) = i sin(x + y) = ei(x+y) = eix eiy
= (cos x + i sin x)(cos y + i sin y)
= cos x cos y − sin x sin y + i(sin x cos y + cos x sin y),
woraus die Behauptung folgt, indem man Real- und Imaginärteil vergleicht. Aus der Exponentialreihe lässt sich auch eine Reihendarstellung für cos und
sin ableiten:
Satz 5.33 Für jedes x ∈ R ist
cos x =
sin x =
∞
X
n=0
∞
X
(−1)n
x2n
x2 x4
=1−
+
− +...
(2n)!
2!
4!
(−1)n
x2n+1
x3 x 5
=x−
+
− +....
(2n + 1)!
3!
5!
n=0
und
Diese Reihen konvergieren absolut.
Beweis. Die absolute Konvergenz dieser Reihen folgt sofort aus der absoluten
Konvergenz der Exponentialreihe und dem Majorantenkriterium.
Für alle N ∈ N gilt
2N
+1
X
n=0
N
N
2n
X
(ix)n X
x2n+1
n x
(−1)
(−1)n
=
+i
,
n!
(2n)!
(2n + 1)!
n=0
n=0
woraus im Limes N → ∞
cos x + i sin x = eix =
∞
X
(ix)n
n=0
n!
=
∞
X
n=0
(−1)n
∞
X
x2n
x2n+1
+i
(−1)n
(2n)!
(2n + 1)!
n=0
folgt. Die Behauptung ergibt sich nun durch Vergleich des Real- und Imaginärteils.
Zur näherungsweisen Berechnung dieser Reihen durch ihre Partialsummen,
beweisen wir noch eine Restgliedabschätzung. Dazu setzen wir
R2N +2 (x) := cos x −
N
X
n=0
(−1)n
∞
X
x2n
x2n
=
(−1)n
,
(2n)! n=N +1
(2n)!
N
∞
2n+1
X
X
x2n+1
n x
R2N +3 (x) := sin x −
(−1)
=
(−1)n
.
(2n + 1)! n=N +1
(2n + 1)!
n=0
100
Satz 5.34 Für |x| ≤ 2N + 3 bzw. |x| ≤ 2N + 4 gilt
2N +2 2N +3 x
x
.
|R2N +2 (x)| ≤ bzw.
|R2N +3 (x)| ≤ (2N + 2)!
(2N + 3)! Beweis. Setze an =
|x| ≤ 2N + 4 ist
|x|2n
,
(2n)!
bn =
|x|2n+1
.
(2n+1)!
Für n ≥ N + 1 und |x| ≤ 2N + 3 bzw.
|x|2
(2N + 3)2
an ≤
an ≤ an
(2n + 1)(2n + 2)
(2N + 3)(2N + 4)
|x|2
(2N + 4)2
=
bn ≤
bn ≤ bn ,
(2n + 2)(2n + 3)
(2N + 4)(2N + 5)
an+1 =
bn+1
bzw.
d.h. (an )n≥N +1 und (bn )n≥N +1 sind monoton fallende Nullfolgen. Aus der Abschätzung
im Leibnizkriterium (Satz 4.37, der auch für m = n0 −1 richtig bleibt) folgt daher
2N +2 ∞
2n X
x
n
≤ x
bzw.
|R2N +2 (x)| = (−1)
(2N + 2)! (2n)!
n=N +1
∞
2N +3 2n+1 X
x
n
≤ x
.
|R2N +3 (x)| = (−1)
(2n
+
1)!
(2N
+
3)!
n=N +1
Wir wissen schon, dass sin(0) = 0 und cos(0) = 1 ist. Genauer können wir
nun folgern:
Korollar 5.35 Es gilt
lim
x→0
x6=0
sin x
=1
x
Beweis. Wegen |R3 (x)| ≤
2
cos x−(1− x )
|x|3
3!
und
lim
x→0
x6=0
1
1 − cos x
=
.
x2
2
für |x| ≤ 3 ist | sin xx−x | ≤
|x|2
6
und wegen |R4 (x)| ≤
x4
4!
2
2
für |x| ≤ 4 ist |
| ≤ |x|
. Hieraus folgt die Behauptung.
x2
24
Als weitere Folgerung halten wir fest, dass der Cosinus auf dem Intervall [0, 2]
sein Vorzeichen wechselt.
Lemma 5.36 Der Cosinus besizt im Intervall [0, 2] eine Nullstelle.
Beweis. Nach Satz 5.30 ist cos(0) = 1. Andererseits gilt nach Satz 5.34 |R4 (2)| ≤
24
und somit
4!
22 24
2
1
cos(2) ≤ 1 −
+
= 1 − 2 + = − < 0.
2!
4!
3
3
Die Behauptung folgt daher aus dem Zwischenwertsatz.
101
Definition 5.37 Die Kreiszahl π ist definiert als das Doppelte der kleinsten positiven Nullstelle von cos:
π := 2 min{x > 0 : cos x = 0}.
Beachte, dass das Minimum der Menge M := {x > 0 : cos x = 0} tatsächlich
existiert. Nach Lemma 5.36 ist M nicht leer. Setzt man x = inf M (≥ 0) und
wählt man eine Folge (xn ) aus M mit xn → x, so folgt aus der Stetigkeit des
Cosinus auch cos x = 0. Wegen cos(0) = 1 6= 0 muss außerdem x > 0 sein. Es ist
also x ∈ M und damit x = min M .
iπ
Satz 5.38 Es gilt e 2 = i.
Beweis. Wegen cos π2 = 0 ist nach Satz 5.30(iv) sin π2 = ±1. Satz 5.34 liefert nun
für x = π2 ≤ 2
x2 x
sin x = x + R3 (x) ≥ x 1 −
≥ >0
| {z 6 } 3
≥1− 46 = 13
iπ
und somit sin π2 = 1. Dies zeigt e 2 = cos π2 + i sin π2 = i.
Hieraus ergibt sich allgemein e
x
eix
cos(x)
sin(x)
···
···
···
···
iπn
2
0
1
1
0
= in für n ∈ Z und daraus die Wertetabelle
π
2
i
0
1
3π
π
2π
2
−1 −i 1
−1 0
1
0 −1 0
···
···
···
···
Insbesondere gilt die wunderschöne Formel
eiπ + 1 = 0,
die die Eulersche Zahl e, die Kreiszahl π, die imaginäre Einheit i, das neutrale
Element 1 bezüglich der Multiplikation und das neutrale Element 0 bezüglich der
Addition verbindet.
Als Folgerung aus dieser Wertetabelle und Satz 5.38 erhalten wir weitere
Eigenschaften der Cosinus- und Sinusfunktion
Korollar 5.39 Für x ∈ R gilt
(i) cos(x + 2π) = cos x und sin(x + 2π) = sin(x),
(ii) cos(x + π) = − cos x und sin(x + π) = − sin(x),
(iii) cos(x + π2 ) = − sin x und sin(x + π2 ) = cos x,
(iv) cos( π2 − x) = sin x und sin( π2 − x) = cos(x).
102
Beweis. Die Aussagen (i)–(iv) folgen direkt aus den Additionstheoremen, der
oben angegebenen Wertetabelle und Satz 5.30(iii). Z.B. folgt die erste Gleichung
in (iv) aus
cos(
π
π
π
− x) = cos cos(−x) − sin sin(−x) = sin x.
2
| {z 2}
| {z2} | {z }
=0
=1
=− sin x
Bemerkung. (i) besagt, dass die Funktionen cos und sin 2π-periodisch sind.
Allgemein nennt man eine Funktion f : R → R p-periodisch für ein p ∈ R, wenn
gilt
f (x + p) = f (x) ∀ x ∈ R.
Wir charakterisieren nun noch die Nullstellenmengen sowie die Positivitätsund Negativitätsbereiche von cos und sin. Wegen der 2π-Periodizität genügt es
hier, das Intervall [0, 2π) zu betrachten.
Satz 5.40 Auf [0, 2π) gilt

3π
π

> 0 für x ∈ [0, 2 ) ∪ ( 2 , 2π),
cos x = 0 für x ∈ { π2 , 3π
},
2


π 3π
< 0 für x ∈ ( 2 , 2 ),


> 0 für x ∈ (0, π),
sin x = 0 für x ∈ {0, π},


< 0 für x ∈ (π, 2π).
Beweis. Wegen sin(0) = 0 ist nach Korollar 5.39(ii) auch sin(π) = 0.
Andererseits ist nach Definition von π und wegen cos x = cos(−x) für alle x
und cos(0) = 1 auch cos x > 0 für − π2 < x < π2 . Nach 5.39(iii) ist daher sin x > 0
für 0 < x < π und damit nach 5.39(ii) auch sin x < 0 für π < x < 2π.
Aus 5.39(i) und (iii) folgen nun auch die entsprechenden Aussagen für den
Cosinus.
Korollar 5.41 Für x ∈ R ist
(i) cos x = 0 ⇔ x ∈
π
2
+ πZ und sin x = 0 ⇔ x ∈ πZ,
(ii) eix = 1 ⇔ x ∈ 2πZ.
Beweis. (i) Klar nach Korollar 5.39(i) und Satz 5.40.
(ii) Es gilt eix = 1 genau dann, wenn cos x = 1 und sin x = 0 ist. Dabei
ist nach (i) sin x = 0 genau dann, wenn x ∈ πZ ist. Nach 5.39(ii) ist außerdem
cos(nπ) = (−1)n für ∈ Z. Hieraus folgt die Behauptung.
Auch die Quotienten von Sinus und Cosinus sind wichtige Größen, weshalb
sie einen eigenen Namen verdienen.
103
Definition 5.42
durch
(i) Die Tangensfunktion tan : R \ ( π2 + πZ) → R ist definiert
tan x =
sin x
.
cos x
(ii) Die Cotangensfunktion cot : R \ πZ → R ist definiert durch
cot x =
cos x
.
sin x
Da diese Funktionen durch cos und sin vollständig beschrieben sind, diskutieren wir ihre Eigenschaften hier nicht im Detail, bemerken aber noch, dass sie
sogar periodisch zur Periode π sind:
tan(x + π) = tan x
bzw.
für alle x, für die dieser Ausdruck definiert ist.
104
cot(x + π) = cot x
Kapitel 6
Differentiation
Wir wollen das Verhalten einer Funktion f : D → R (D ⊂ R) nun lokal, d.h. in
der Nähe eines gegebenen Punktes x0 ∈ D genauer untersuchen. Ist f in x0 stetig,
so bedeutet dies gerade, dass sich f (x) für x nahe x0 durch einen konstanten Wert,
nämlich f (x0 ) approximieren lässt; es gilt dann ja
lim f (x) = f (x0 ).
x→x0
Etwas umständlicher lässt sich das so ausdrücken: In einer (kleinen) Umgebung
(x0 − η, x0 + η) ∩ D lässt sich die Funktion f durch die konstante Abbildung
x 7→ f (x0 ) approximieren.
Damit ist aber noch nicht quantifiziert,
wie gut diese Approximation für
p
x 6= x0 ist. Z.B. ist R → R, x 7→ k |x| stetig in x0 = 0, die Konvergenz
f (x) → f (0) für große k aber sehr langsam.
Dies hat zur Folge, dass der map
k
ximale Approximationsfehler (im Beispiel
|x|) viel größer sein kann als der
Abstand von x zu x0 .
Besonders gutartig sind nun solche Funktionen, für die sich eine lokale Änderungsrate definieren lässt. Das heißt, dass es ein a ∈ R (die ‘Änderungsrate’)
gibt, das das Verhältnis der Differenz der Funktionswerte f (x) − f (x0 ) und der
Differenz der Argumente x − x0 approximiert, so dass also
f (x) − f (x0 )
≈a
x − x0
gilt. (Genauer: Für x → x0 konvergiert die linke Seite gegen a.) Auflösen nach
f (x) ergibt dann
f (x) ≈ f (x0 ) + a(x − x0 ),
wobei der Approximationsfehler sehr viel kleiner als |x − x0 | ist. (Genauer: Nach
Division durch x − x0 konvergiert der Fehler für x → x0 immer noch gegen 0.)
Wie wir sehen werden ist dies für viele Funktionen der Fall, insbesondere für Polynome, rationale Funktionen, trigonometrische Funktionen, allgemeine Potenz105
und Exponentialfunktionen und den Logarithmus. Dies führt zur Definition der
Differenzierbarkeit von f in x0 .
Während die Stetigkeit also eine Approximation von f durch eine konstante
Funktion liefert, erhalten wir aus der letzten Gleichung eine wesentlich genauere
Approximation von f durch die affine Abbildung1 x 7→ f (x0 ) + a(x − x0 ). Es
geht also eigentlich darum, die Funktion f lokal zu ‘linearisieren’ und sie dadurch
weiteren Untersuchungen zugänglicher zu machen.
6.1
Definition, Beispiele und Grundlagen
Definition 6.1 Es seien D ⊂ R und f : D → R.
(i) Es sei x0 ∈ D, so dass es mindestens eine Folge (xn ) in D \ {x0 } gibt mit
xn → x0 . Existiert der Grenzwert
f 0 (x0 ) = x→x
lim
0
x6=x0
f (x) − f (x0 )
x − x0
(x0 )
, so heißt f differenzierbar in x0 . f 0 (x0 )
der Differenzenquotienten f (x)−f
x−x0
heißt der Differentialquotient bei x0 oder auch die Ableitung von f bei x0 .
Statt f 0 (x0 ) schreibt man auch
df
(x0 ).
dx
(ii) Ist f in jedem Punkt x0 ∈ D differenzierbar, so heißt f selbst differenzierbar.
Die Abbildung f 0 : D → R, x 7→ f 0 (x) nennt man dann die Ableitung von
f.
Geometrisch ist der Differenzenquotient die Steigung der Sekante des Graphen
von f durch die Punkte (x0 , f (x0 )) und (x, f (x)). Im Limes x → x0 gehen diese
Sekanten in eine Tangente an den Graphen über, die diesen im Punkt (x0 , f (x0 ))
berührt.
Bemerkungen.
1. Die Bedingung, dass es mindestens eine gegen x0 konvergente Folge in D \
{x0 } geben muss, heißt, dasss x0 kein isolierter Punkt von D ist. Sie ist für
den wichtigsten Fall, dass D ein Intervall ist, immer für alle x0 ∈ D erfüllt.
2. Oft schreibt man den Differentialquotienten in der äquivalenten Form
f (x0 + h) − f (x0 )
,
h→0
h
f 0 (x0 ) = lim
wobei hier h → 0 eigentlich bedeutet h → 0 mit h 6= 0 und x0 + h ∈ D.
1
Abbildungen der Form x 7→ ax + b mit a, b ∈ R nennt man affin.
106
Beispiele.
1. Ist f : R → R konstant, etwa f (x) = c, so gilt für jedes x0 ∈ R
f 0 (x0 ) = x→x
lim
0
x6=x0
f (x) − f (x0 )
= x→x
lim 0 = 0.
0
x − x0
x6=x0
2. Ist f : R → R affin, etwa f (x) = ax + b, so gilt für jedes x0 ∈ R
f (x0 + h) − f (x0 )
a(x0 + h) + b − ax0 − b
= lim
= a.
h→0
h→0
x − x0
h
f 0 (x0 ) = lim
3. Es sei nun f : R → R, f (x) = xn (n ∈ N). Dann ist für jedes x0 ∈ R
(x0 + h)n − xn0
h→0
h
n X
n n−k k
1 n
n−1
x0 + nx0 h +
x0 h − xn0 = nxn−1
.
= lim
0
h→0 h
k
k=2
f 0 (x0 ) = lim
4. Für die Exponentialfunktion ergibt sich für alle x
exp(x + h) − exp(x)
h→0
h
exp(h) − exp(0)
= exp(x),
= exp(x) lim
h→0
h
exp0 (x) = lim
denn für |h| < 1 ist
| exp(h) − 1 − h| ≤
∞
X
|h|k
k=2
∞
X
1
≤ |h|
≤ e|h|2 .
k!
k!
k=2
2
Dies ist eine fundamental wichtige Eigenschaft der Exponentialfunktion: Sie
ist ihre eigene Ableitung!
5. Die Ableitung des Sinus ist der Cosinus. Für x ∈ R ist nämlich
sin(x + h) − sin x
h→0
h
sin x cos h + cos x sin h − sin x
= lim
h→0
h
cos h − 1
sin h
= sin x lim
+ cos x lim
= cos x
h→0
h→0 h
h
sin0 (x) = lim
nach Korollar 5.35.
107
6. Umgekehrt ist die Ableitung des Cosinus das Negative des Sinus. Für x ∈ R
ist nämlich
cos(x + h) − cos x
h→0
h
cos x cos h − sin x sin h − cos x
= lim
h→0
h
sin h
cos h − 1
− sin x lim
= − sin x
= cos x lim
h→0 h
h→0
h
cos0 (x) = lim
nach Korollar 5.35.
7. Die Funktion f : R → R, f (x) = |x| ist im Nullpunkt nicht differenzierbar,
n
denn für xn = (−1)
→ 0 (n → ∞) existiert der Grenzwert von
n
|xn |
f (xn ) − f (0)
=
= (−1)n
xn
xn
nicht. (In jedem Punkt x 6= 0 ist f aber differenzierbar, was man wie in
Beispiel 2 sieht.) Die einseitigen Grenzwerte
lim
x→0
x>0
f (x) − f (0)
=1
x
und
lim
x→0
x<0
f (x) − f (0)
= −1
x
existieren in diesem Beispiel jedoch.
Bemerkung. Im Falle der Existenz nennt man
f+0 (x0 ) = x→x
lim
0
x>x0
f (x) − f (x0 )
x − x0
f−0 (x0 ) = x→x
lim
und
0
x<x0
f (x) − f (x0 )
x − x0
die rechtsseitige bzw. linksseitige Ableitung in x0 .
Wir kommen nun auf unsere eingangs gegebene Motivation der Approximierbarkeit von Funktionen zurück.
Satz 6.2 Es seien x0 ∈ D, so dass es mindestens eine Folge (xn ) in D \ {x0 }
gibt mit xn → x0 , und f : D → R. Genau dann ist f in x0 differenzierbar, wenn
es ein a ∈ R gibt, so dass
f (x) = f (x0 ) + a(x − x0 ) + r(x)
mit einer Funktion r gibt, für die lim x→x
0
x6=x0
0
Ist dies der Fall, so ist a = f (x0 ).
108
r(x)
x−x0
= 0 ist.
In diesem Sinne ist die Abbildung x 7→ f (x0 )+f 0 (x0 )(x−x0 ) die Linearisierung
von f in der Nähe von x0 .2
Beweis. Für a ∈ R ist die gefragte Gleichung gerade für r(x) = f (x) − f (x0 ) −
a(x − x0 ) erfüllt. Aus
r(x)
f (x) − f (x0 )
=
−a
x − x0
x − x0
ergibt sich nun, dass die linke Seite für x → x0 genau dann gegen 0 konvergiert,
wenn f bei x0 differenzierbar ist und a = f 0 (x0 ) gilt.
Diffenzierbare Funktionen sind insbesondere stetig, denn es gilt:
Satz 6.3 Ist D ⊂ R, x0 ∈ D und f : D → R in x0 differenzierbar, so ist f in x0
stetig.
Beweis. Für r wie in Satz 6.2 ist offensichtlich limx→x0 r(x) = 0, da ja sogar
r(x)
= 0 ist, so dass sich im Limes x → x0
lim x→x
0
x−x0
x6=x
0
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + r(x) → f (x0 )
|
{z
} |{z}
→0
→0
ergibt.
Beachten Sie: Die Umkehrung gilt nicht!! (S. Beispiel 7 von Seite 108.)
Ähnlich wie bei der Stetigkeit sind auch aus differenzierbaren Funktionen
zusammengesetzte Funktionen wieder differenzierbar.
Satz 6.4 Es seien f, g : D → R in x0 ∈ D differenzierbare Funktionen und
λ, µ ∈ R. Dann gilt:
(i) Linearität: Auch λf + µg ist bei x0 differenzierbar. Dabei ist
(λf + µg)(x0 ) = λf 0 (x0 ) + µg 0 (x0 ),
(ii) Produktregel: Auch f g ist bei x0 differenzierbar. Es ist
(f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ),
(iii) die Quotientenregel: Falls g(x0 ) 6= 0,
zierbar in x0 mit
f 0
g
2
(x0 ) =
f
g
: {x ∈ D : g(x) 6= 0} → R differen-
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
.
(g(x0 ))2
Be wise, linearize! (Engl. Sprichwort)
109
Beweis. (i) Nach den Grenzwertsätzen gilt in der Tat
lim
x→x0
x6=x0
λf (x) + µg(x) − λf (x0 ) − µg(x0 )
x − x0
= λ x→x
lim
0
x6=x0
f (x) − f (x0 )
g(x) − g(x0 )
+ µ x→x
lim
= λf 0 (x0 ) + µg 0 (x0 )
0
x − x0
x
−
x
0
x6=x0
(ii) Dies folgt aus
f (x)g(x) − f (x0 )g(x0 )
f (x)g(x) − f (x)g(x0 ) + f (x)g(x0 ) − f (x0 )g(x0 )
=
x − x0
x − x0
g(x) − g(x0 )
f (x) − f (x0 )
= f (x)
+g(x0 )
|{z}
x − x0
x − x0
{z
}
|
{z
}
→f (x0 ) |
→g 0 (x0 )
→f 0 (x0 )
→ f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 )
im Grenzwert x → x0 , wobei wir Satz 6.3 benutzt haben.
(iii) Für den Quotienten schließlich betrachten wir zunächst den Fall f = 1.
Nach Satz 6.3 ist dann
1
g(x)
−
1
g(x0 )
x − x0
=
g 0 (x0 )
1
g(x0 ) − g(x)
→−
g(x)g(x )
x − x0
(g(x0 ))2
{z
}
| {z 0 } |
→−g 0 (x0 )
→(g(x0 ))2
für x → x0 . Nach (ii) folgt dann auch für allgemeines f , dass der Quotient fg bei
x0 differenzierbar ist mit
f 0
g 0 (x0 )
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
1
− f (x0 )
=
.
(x0 ) = f 0 (x0 )
g
g(x0 )
(g(x0 ))2
(g(x0 ))2
Es bleibt zu bemerken, dass x0 kein isolierter Punkt von {x ∈ D : g(x) 6= 0} ist.
Wegen g(x0 ) 6= 0 gibt es nach Lemma 5.12 nämlich ein ε > 0, so dass g(x) 6= 0
für alle x ∈ D ∩ (x0 − ε, x0 + ε) ist.
Beispiele.
1. Für f : R \ {0} → R, f (x) = x−n (n ∈ N) ist
1 0
nxn−1
f 0 (x) =
=
−
= −nx−n−1 .
xn
x2n
2. Für x ∈
/
π
2
+ πZ ist
0
tan (x) =
sin x 0
cos x
sin0 (x) cos x − sin x cos0 (x)
cos2 x
2
cos x + sin2 x
1
=
=
.
cos2 x
cos2 x
=
110
Auch die Verkettung differenzierbarer Funktionen ist wieder differenzierbar:
Satz 6.5 Es seien D, E ⊂ R, f : D → E differenzierbar in x0 ∈ D und g : E →
R differenzierbar in f (x0 ). Dann ist g ◦ f differenzierbar in x0 , die Ableitung
berechnet sich nach der Kettenregel:
(g ◦ f )0 (x0 ) = g 0 f (x0 ) f 0 (x0 ).
Beweis. Nach Satz 6.2 gibt es eine Funktion r : E → R mit
g(y) − g f (x0 ) = g 0 f (x0 ) y − f (x0 ) + r(y)
r(y)
y−f (x0 )
= 0. Teilen durch x − x0 führt für y = f (x) auf
f (x) − f (x0 ) r f (x)
g f (x) − g f (x0 )
0
= g f (x0 )
+
.
x − x0
x − x0
x − x0
und limy→f (x0 )
Für x → x0 und damit auch f (x) → f (x0 ) (Satz 6.3) folgt nun wegen
(
r f (x)
0,
falls f (x) = f (x0 ),
=
f (x)−f (x0 )
r(f (x))
x − x0
· x−x0 , falls f (x) 6= f (x0 ),
f (x)−f (x0 )
zunächst lim x→x
0
x6=x
0
r(f (x))
x−x0
= 0 und damit dann
g f (x) − g f (x0 )
lim
= g 0 f (x0 ) f 0 (x0 ).
x→x0
x − x0
x6=x0
Beispiele.
2
1. Die Ableitung von f : R \ {0} → R, f (x) = sin3 (e1/x ) ist gegeben durch
2
2
2
2
f 0 (x) = (sin3 (e1/x ))0 = 3 sin2 (e1/x ) · cos(e1/x ) · e1/x · (−2x−3 ).
2. Für die Exponentialfunktion R → R, x 7→ ax zur Basis a > 0 ist
(ax )0 = (ex log a )0 = (ex log a ) log a = ax log a.
Wir untersuchen nun noch Umkehrfunktionen.
Satz 6.6 Es seien D ⊂ R ein Intervall und f : D → R stetig und streng monoton. Ist f in x ∈ D differenzierbar mit f 0 (x) 6= 0, so ist die Umkehrfunktion
f −1 : f ([a, b]) → R in y = f (x) differenzierbar und es gilt
(f −1 )0 (y) =
1
f 0 (f −1 (y))
111
.
Beweis. Es sei (yn ) eine Folge in f ([a, b]) mit yn → y und yn 6= y für alle n. Setze
xn = f −1 (yn ). Da auch f −1 nach Satz 5.18 stetig und streng monoton ist, gilt
lim xn = lim f −1 (yn ) = f −1 (y) = x
n→∞
n→∞
und
xn 6= x ∀ n ∈ N.
Es folgt
xn − x
f −1 (yn ) − f −1 (y)
= lim
= lim
n→∞ f (xn ) − f (x)
n→∞
n→∞
yn − y
lim
wie behauptet.
Beispiele.
1
f (xn )−f (x)
xn −x
=
1
f 0 (x)
,
1. Für x > 0 ist
log0 (x) =
1
1
=
.
exp0 (log x)
x
2. Hieraus folgt mit Hilfe der Kettenregel für die allgemeine Potenzfunktion
(0, ∞) → R, x 7→ xα (α ∈ R)
α
α
(xα )0 = (eα log x )0 = eα log x · = xα · = αxα−1 .
x
x
3. Eine alternative Darstellung der Exponentialfunktion: Wird ein Euro mit
x (also mit 100x Prozent) verzinst, so erhält man nach einem Jahr 1 +
x Euro. Würden stattdessen die halben Zinsen halbjährig gutgeschrieben,
so erhielte man mit Zins und Zinseszins nach einem Jahr den größeren
Betrag von (1 + x2 )2 Euro. Bei Dritteljähriger Verzinsung mit x3 ergäben
sich (1 + x3 )3 Euro. Würde allgemein n1 -jährig der Zinssatz nx angerechnet,
so ergäbe sich nach einem Jahr ein Guthaben von (1 + nx )n Euro. Man
kann sich nun fragen, welcher Betrag sich erreichen ließe, wenn man immer
kurzfristiger mit dem entsprechenden Bruchteil von x verzinsen würde, also
zum Grenzwert n → ∞ einer instantanen ‘stetigen Verzinsung’ überginge.
Mathematisch ausgedrückt: Was ist
x n
?
lim 1 +
n→∞
n
Die Antwort folgt aus Beispiel 1. Für die logarithmierten Werte ergibt sich
wegen log(1) = 0 demnach nämlich
log(1 + nx ) − log(1)
x
lim n log 1 +
= x lim
= x log0 (1) = x.
x
n→∞
n→∞
n
n
Da exp aber stetig ist, folgt hieraus
x n
x lim 1 +
= exp lim n log 1 +
= ex .
n→∞
n→∞
n
n
(Für x = 0, 02 ist das mit ca. 1.0202 nur geringfügig größer als 1+x = 1, 02.
Viel bringt es also nicht.)
112
Wir bemerken zum Schluss dieses Absatzes noch, dass man den Prozess des
Ableitens natürlich auch iterieren kann: Ist f : D → R differenzierbar, so kann
man überprüfen, ob die Ableitung f 0 : D → R selbst eine Ableitung f 00 : D → R
besitzt, die womöglich wieder einer Ableitung f 000 : D → R hat u.s.w.
Definition 6.7 Es sei f : D → R eine Funktion. Ist f (einmal) differenzierbar
bei x0 ∈ D, so schreibt man auch f (1) (x0 ) = f 0 (x0 ). Induktiv definiert man für
n ≥ 2:
(i) Es sei x0 ∈ D. Die Funktion f ist n-mal differenzierbar bei x0 , wenn es ein
ε > 0 gibt, so dass f in jedem x ∈ (x0 − ε, x0 + ε) (n − 1)-mal differenzierbar
ist und die Abbildung (x0 − ε, x0 + ε), x 7→ f (n−1) (x) bei x0 differenzierbar
ist. Die n-te Ableitung bei x0 ist dann f (n) (x0 ) := (f n−1 )0 (x0 ). (Für n = 2, 3
schreibt man auch f 00 (x0 ) bzw. f 000 (x0 ).)
(ii) Ist f in jedem Punkt x ∈ D n-mal differenzierbar, so heißt f n-mal differenzierbar. Die n-te Ableitung von f ist f (n) : D → R.
Mit der ‘nullten Ableitung’ f (0) von f ist die Funktion f selbst gemeint.
Beispiele.
1. Für f : R → R, f (x) = xm ist
(
f
(n)
(x) = m(m − 1) · . . . · (m − n + 1)x
m−n
=
m! m−n
x
,
n!
0,
falls n ≤ m,
falls n > m.
2. Für f : R → R, f (x) = cos x ist

cos x,



− sin x,
f (n) (x) =

− cos x,



sin x,
6.2
falls
falls
falls
falls
n ∈ 4N0 ,
n ∈ 4N0 + 1,
n ∈ 4N0 + 2,
n ∈ 4N0 + 3.
Der Mittelwertsatz und seine Konsequenzen
Wir wollen nun untersuchen, inwiefern sich aus bestimmten Aspekten der Ableitung f 0 einer Funktion f Rückschlüsse auf f selbst gewinnen lassen. Ein grundlegender Satz der Differentialrechnung ist hier der sogenannte Mittelwertsatz, der
aus dem Satz von Rolle folgen wird.
113
Definition 6.8 Es sei D ⊂ R. Eine Funktion f : D → R hat in x ∈ D ein
lokales Maximum (bzw. lokales Minimum), wenn es ein ε > 0 gibt, so dass
f (x) = max{f (y) : y ∈ D mit |y − x| < ε}
f (x) = min{f (y) : y ∈ D mit |y − x| < ε}
bzw.
gilt. Man nennt dann x eine lokale Maximal- bzw. Minimalstelle.
Maxima und Minima nennt man auch Extrema, Maximal- und Minimalstellen
entsprechend Extremalstellen.
Wir beschränken uns in diesem Abschnitt fortan auf den Fall, dass D ein
Intervall ist. Im Folgenden sei a < b.
Durch Ableiten erhält man ein notwendiges Kriterium für Extremalstellen:
Satz 6.9 Es sei f : (a, b) → R und x0 ∈ (a, b). Ist x0 eine Extremalstelle von f
und f differenzierbar in x0 , so gilt
f 0 (x0 ) = 0.
Beweis. Hat f bei x0 ein lokales Maximum, so so gibt es ein ε > 0 mit f (x) ≤
f (x0 ) für alle x ∈ D mit |x − x0 | < ε. Daher ist
f 0 (x0 ) = x→x
lim
f (x) − f (x0 )
≤0
x − x0
f 0 (x0 ) = x→x
lim
f (x) − f (x0 )
≥ 0,
x − x0
0
x>x0
und
0
x<x0
also f 0 (x0 ) = 0.
Ist x0 eine lokale Minimalstelle, so hat −f bei x0 ein lokales Maximum, weshalb −f 0 (x0 ) = 0 also auch f 0 (x0 ) = 0 ist.
Beachten Sie: Dieses Kriterium ist nicht hinreichend! So gilt z.B. für die Funktion
f : (−1, 1) → R,
f (x) = x3
f 0 (0) = 0, obwohl sie bei 0 kein lokales Extremum hat. Es ist außerdem wichtig
anzunehmen, dass x0 im offenen Intervall (a, b) liegt. Z.B. sind die Extremalstellen
von
f : [0, 1] → R,
f (x) = x
0 und 1, jedoch f 0 (0) = f 0 (1) 6= 0.
Satz 6.10 (Satz von Rolle) Es sei f : [a, b] → R stetig und in (a, b) differenzierbar. Gilt f (a) = f (b), so gibt es ein x0 ∈ (a, b) mit f 0 (x0 ) = 0.
114
Beweis. Ist f konstant, so ist die Behauptung trivial. Anderenfalls gibt es, da
nach Satz 5.10 f sein Minimum und sein Maximum in [a, b] annimmt, eine Extremalstelle x0 ∈ (a, b). Gemäß Satz 6.9 ist dann f 0 (x0 ) = 0.
Korollar 6.11 (Mittelwertsatz) Es sei f : [a, b] → R stetig und in (a, b) dif(a)
ferenzierbar. Dann gibt es ein x0 ∈ (a, b) mit f 0 (x0 ) = f (b)−f
.
b−a
Das heißt: Es gibt einen Punkt x0 ∈ (a, b), so dass die Steigung f 0 (x0 ) der
(a)
Tangente an den Graphen von f durch (x0 , f (x0 )) gerade die Steigung f (b)−f
b−a
der Sekante durch (a, f (a)) und (b, f (b)) ist.
Beweis. Setze g : [a, b] → R,
g(x) = f (x) −
f (b) − f (a)
(x − a),
b−a
so dass insbesondere g(b) = g(a) ist. Nach dem Satz 6.10 von Rolle gibt es ein
x0 ∈ (a, b) mit
f (b) − f (a)
0 = g 0 (x0 ) = f 0 (x0 ) −
,
b−a
womit x0 die Behauptung des Satzes erfüllt.
Korollar 6.12 (Schrankensatz) Es sei f : [a, b] → R stetig und in (a, b) differenzierbar. Setze m = inf{f 0 (x) : x ∈ (a, b)} und M = sup{f 0 (x) : x ∈ (a, b)}.
Dann gilt
m(y − x) ≤ f (y) − f (x) ≤ M (y − x)
für alle x, y ∈ [a, b] mit x ≤ y.
Beweis. Wendet man den Mittelwertsatz (Korollar 6.11) auf das Intervall [x, y]
an, so folgt für ein x0 ∈ (x, y)
f (y) − f (x)
= f 0 (x0 ) ∈ [m, M ].
y−x
Korollar 6.13 Es sei f : [a, b] → R stetig und in (a, b) differenzierbar. Gilt
f 0 (x) = 0 für alle x ∈ (a, b), so ist f konstant.
Beweis. Nach dem Schrankensatz (mit m = M = 0) ist f (x) = f (y) für alle
x, y ∈ [a, b].
Eine weitere Folgerung aus dem Satz von Rolle ist eine verallgemeinerte Form
des Mittelwertsatzes.
115
Satz 6.14 (Verallgemeinerter Mittelwertsatz) Es seien f, g : [a, b] → R
stetig und in (a, b) differenzierbar, wobei g 0 (x) 6= 0 für alle x ∈ (a, b) sei. Dann
gibt es ein x0 ∈ (a, b) mit
f (b) − f (a)
f 0 (x0 )
= 0
.
g(b) − g(a)
g (x0 )
(Insbesondere ist g(a) 6= g(b).)
Beweis. Wir bemerken zunächst, dass g(a) 6= g(b) ist. Anderenfalls hätte g
nämlich nach dem Satz von Rolle eine Nullstelle in (a, b). Setze nun h : [a, b] → R,
h(x) = f (x) −
f (b) − f (a)
(g(x) − g(a)),
g(b) − g(a)
so dass insbesondere h(b) = f (a) = h(a) ist. Nach dem Satz 6.10 von Rolle gibt
es ein x0 ∈ (a, b) mit
0 = h0 (x0 ) = f 0 (x0 ) −
f (b) − f (a) 0
g (x0 ),
g(b) − g(a)
womit x0 die Behauptung des Satzes erfüllt.
Der verallgemeinerte Mittelwertsatz liefert ein nützliches Kriterium zur Berechnung von Funktionengrenzwerten von Quotienten in Fällen, in denen die
Grenzwertsätze versagen.
Satz 6.15 (Regel von l’Hospital) Es seien f, g : (a, b) → R differenzierbar,
wobei g 0 (x) 6= 0 für alle x ∈ (a, b) sei. Des Weiteren gelte
lim
f (x) = 0
x→a
und
x>a
lim
g(x) = 0
x→a
x>a
oder
lim
f (x) = ±∞
x→a
und
x>a
lim
g(x) = ±∞.
x→a
x>a
Falls nun der Grenzwert lim x→a
x>a
es ist
lim
x→a
x>a
f 0 (x)
g 0 (x)
existiert, so existiert auch lim x→a
x>a
f (x)
g(x)
und
f (x)
f 0 (x)
= lim
.
x→a
g(x)
g 0 (x)
x>a
Analoge Aussagen gelten für x → b. Dies gilt auch noch für a = −∞ oder
b = +∞, da sich diese Fälle durch eine geeignete Substitution (y = ∓ x1 ) auf den
Fall endlicher Intervallgrenzen zurückführen lassen.
Beweis. 1. Im ersten Fall können wir f und g durch f (a) := g(a) := 0 stetig bei
a ergänzen. Ist nun (xn ) eine Folge in (a, b) mit xn → a, so gibt es nach dem
116
verallgemeinerten Mittelwertsatz Punkte ξn ∈ (a, xn ) (und damit auch ξn → a)
mit
f (xn )
f (xn ) − f (a)
f 0 (ξn )
f 0 (x)
=
= 0
→ lim
.
x→0 g 0 (x)
g(xn )
g(xn ) − g(a)
g (ξn )
x>a
0
f (x)
zu gegebenem ε > 0 ein
2. Im zweiten Fall wählen wir für c = lim x→a
0
x>a g (x)
δ > 0, so dass
f 0 (x)
− c < ε für x ∈ (a, a + δ)
0
g (x)
gilt. Für alle x, y ∈ (a, a + δ) gibt es nun nach dem verallgemeinerten Mittelwertsatz ein ξ zwischen x und y mit
f (x)
f 0 (ξ)
f (x) − f (y) 1 − g(y)/g(x)
= 0
=
·
d(x, y)
g(x)
g(x) − g(y) 1 − f (y)/f (x)
g (ξ)
{z
}
|
=:d(x,y)
und daher wegen ξ ∈ (a, a + δ)
f 0 (ξ)
f (x)
−
c
=
d(x,
y)
−
c
0
g(x)
g (ξ)
f 0 (ξ)
− c d(x, y) + c d(x, y) − 1 = 0
g (ξ)
≤ ε|d(x, y)| + |c| |d(x, y) − 1|,
wobei die rechte Seite für x → a gegen ε konvergiert, da ja dann d(x, y) → 1 gilt.
Indem wir 0 < δ 0 < δ hinreichend klein wählen, folgt also
f (x)
− c < 2ε
g(x)
für x ∈ (a, a + δ 0 ). Hieraus folgt lim x→a
x>a
Beispiele.
f (x)
g(x)
= c.
1. Für α > 0 ist im Grenzwert x → 0
x−1
log x
lim
x log x = lim
= − lim
= α−1 lim
xα = 0.
x→0 αx−α−1
x→0
x→0
x→0 x−α
x>0
x>0
x>0
x>0
α
2. Zweimalige Anwendung der l’Hospitalschen Regel zeigt
tan x − x
cos−2 x − 1
2 cos−3 x sin x
1
=
lim
=
lim
= ,
3
2
x→0
x→0
x→0
x
3x
6x
3
lim
da ja limx→0
sin x
x
= 1 ist.
117
6.3
Monotonie, Extrema und Konvexität
Eine weitere direkte Folgerung aus dem Mittelwertsatz gestattet es, das Monotonieverhalten von f in Termen der Ableitung f 0 zu beschreiben, was uns schließlich
bei der genaueren Untersuchung von Extremalstellen von f nützlich sein wird.
Das Vorzeichen der lokalen Änderungsrate gibt Auskunft darüber, ob die
Funktionswerte mit wachsendem Argument lokal zu- oder abnehmen. Genauer
gilt:
Satz 6.16 Es seien [a, b] ⊂ R ein Intervall und f : [a, b] → R eine stetige
Funktion, die in (a, b) differenzierbar sei. Dann gilt:
(i) f 0 (x) ≥ 0 für alle x ∈ (a, b) ⇔ f ist monoton wachsend,
(ii) f 0 (x) > 0 für alle x ∈ (a, b) ⇒ f ist streng monoton wachsend,
(iii) f 0 (x) ≤ 0 für alle x ∈ (a, b) ⇔ f ist monoton fallend,
(iv) f 0 (x) < 0 für alle x ∈ (a, b) ⇒ f ist streng monoton fallend.
Beachten Sie: Die Umkehrungen in (ii) und (iv) gelten nicht, wie die Beispiele
f : (−1, 1) → R mit f (x) = x3 bzw. f (x) = −x3 zeigen.
Beweis. (i) ‘⇒’: Für x, x0 ∈ [a, b] mit x < x0 gibt es nach dem Mittelwertsatz ein
x0 ∈ (x, x0 ) mit
f (x0 ) − f (x)
= f 0 (x0 ) ≥ 0.
0
x −x
‘⇐’: Ist f monoton wachsend, so gilt für jedes x0 ∈ (a, b)
f 0 (x) = x→x
lim
0
x>x0
f (x) − f (x0 )
≥ 0.
x − x0
(ii) Dies folgt analog zu ‘⇒’ in (i) mit > statt ≥.
(iii) & (iv) Diese Aussagen ergeben sich aus (i) und (ii) durch Übergang zu
−f .
Als Anwendung dieses Satzes kommen wir nun auf die Untersuchung der trigonometrischen Funktionen zurück.
Beispiele.
1. Der Cosinus ist streng monoton fallend auf [0, π]. Nach Satz 5.40 nämlich
ist (cos x)0 = − sin x < 0 für 0 < x < π. Wegen cos(0) = 1 und cos(π) = −1
ist daher
[0, π] → [−1, 1],
x 7→ cos x
bijektiv. Die Umkehrfunktion hiervon wird als Arcuscosinus (oder auch als
der Hauptzweig des Arcuscosinus) arccos : [−1, 1] → [0, π] bezeichnet. Nach
118
Satz 6.6 und der Beziehung sin y = ±
x ∈ (−1, 1)
(arccos x) =
p
1 − cos2 y für alle y ∈ R gilt für
1
1
1
= ∓√
= ∓p
.
− sin(arccos x)
1 − x2
1 − cos2 (arccos x)
Beachtet man noch, dass auch arccos monoton fällt, so ergibt sich
arccos0 x = − √
1
.
1 − x2
Nach Satz 5.40 und Korollar 5.39 ist nun cos auf jedem Intervall der Form
[nπ, (n + 1)π], n ∈ Z, streng monoton, so dass man die Cosinusfunktion
auch auf ein solches Intervall einschränken und die Umkehrfunktion hierzu
betrachten kann. Dies führt für n 6= 0 auf die sogenannten Nebenzweige des
Arcuscosinus.
2. Nach dem ersten Beispiel und Korollar 5.39 ist
h π πi
→ [−1, 1],
x→
7 sin x
− ,
2 2
streng monoton wachsend und bijektiv. Die Umkehrfunktion hiervon wird
als Arcussinus (oder als auch der Hauptzweig des Arcussinus) arcsin :
[−1, 1] → [− π2 , π2 ] bezeichnet. Nach Satz 6.6 und der Beziehung cos y =
p
± 1 − sin2 y für alle y ∈ R gilt für x ∈ (−1, 1)
(arcsin x)0 =
1
1
1
√
= ±p
=
±
.
cos(arcsin x)
1 − x2
1 − sin2 (arcsin x)
Beachtet man noch, dass auch arcsin monoton wächst, so ergibt sich
arcsin0 x = √
1
.
1 − x2
Analog wie für den Arcuscosinus sind die Nebenzweige des Arcussinus definiert.
3. Die Tangensfunktion erfüllt
tan0 x =
1
= 1 = tan2 x > 0
cos2 x
für alle x ∈ (− π2 , π2 ). Wegen cos x > 0 auf (− π2 , π2 ), sin(− π2 ) = −1, sin( π2 ) = 1
und cos(± π2 ) = 0 gilt außerdem
lim tan x = −∞
x→− π
2
x> π
2
und
119
lim tan x = +∞,
x→+ π
2
x< π
2
so dass also tan : (− π2 , π2 ) → R monoton wachsend und bijektiv ist. Die
Umkehrfunktion, der sogenannte (Hauptzweig des) Arcustangens
π π
arctan : R → (− , )
2 2
ist dann ebenfalls streng wachsend mit
arctan0 x =
1
1
=
.
1 + tan (arctan x)
1 + x2
2
Wieder gibt es analog zum Arcuscosinus auch Nebenzweige des Arcustangens. Ganz analog erhält man auch die Umkehrfuntion des Cotangens: den
streng fallenden Arcuscotangens arccot : R → (0, π).
Wir leiten nun ein hinreichendes Kriterium für lokale Extrema her.
Satz 6.17 Es seien f : (a, b) → R, x0 ∈ (a, b). Ist f in x0 zweimal differenzierbar
mit
f 0 (x0 ) = 0
und
f 00 (x0 ) > 0 oder f 00 (x0 ) < 0,
so hat f bei x0 ein lokales Minimim bzw. Maximum.
Beweis. Ist
f 00 (x0 ) = lim
x→x0
f 0 (x) − f 0 (x0 )
> 0,
x − x0
so gibt es ein ε > 0 mit
f 0 (x) − f 0 (x0 )
>0
x − x0
für alle x ∈ (x0 − ε, x0 + ε). Wegen f 0 (x0 ) = 0 ist daher
f 0 (x) < 0 für x ∈ (x0 − ε, x0 )
und
f 0 (x) > 0 für x ∈ (x0 , x0 + ε),
so dass f nach Satz 6.16 auf [x0 − ε, x0 ] streng monoton fällt und auf [x0 , x0 + ε]
streng monoton wächst. Dies zeigt, dass f bei x0 ein Minimum hat.
Den Fall f 00 (x0 ) < 0 behandelt man analog oder indem man das eben Gezeigte
auf −f anwendet.
Beachten Sie: Das Kriterium ist nicht notwendig, wie das Beispiel (−1, 1) →
R, x 7→ x4 zeigt.
Bemerkung. Der Beweis zeigt, dass in x0 sogar eine isolierte Extremalstelle
vorliegt: Es gibt ein ε > 0, so dass für x ∈ (x0 − ε, x0 + ε) mit x 6= x0 sogar die
strikte Ungleichung
f (x0 ) < f (x)
bzw.
f (x0 ) > f (x).
erfüllt ist.
Wir untersuchen nun noch eine Eigenschaft von Funktionen, die in vielen
Anwendungen und in der Analysis selbst eine wichtige Rolle spielt.
120
Definition 6.18 Es sei D ⊂ R ein Intervall. Eine Funktion f : D → R heißt
(i) konvex, wenn für alle x1 , x2 ∈ D und alle λ ∈ [0, 1] gilt
f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ),
(ii) strikt konvex, wenn für alle x1 , x2 ∈ D mit x1 6= x2 und alle λ ∈ (0, 1) gilt
f (λx1 + (1 − λ)x2 ) < λf (x1 ) + (1 − λ)f (x2 ),
(iii) (strikt) konkav, wenn −f (strikt) konvex ist.
Geometrisch bedeutet die (strikte) Konvexität, dass der Graph von f im Intervall (x1 , x2 ) (echt) unterhalb der Sekante durch die Punkte (x1 , f (x1 )) und
(x2 , f (x2 )) liegt.
Da für x1 < x2 die Punkte x = λx1 + (1 − λ)x2 mit λ ∈ [0, 1] gerade die
Punkte x ∈ [x1 , x2 ] sind, lässt sich die Konvexitätsungleichung äquivalent auch
als
x2 − x
x − x1
f (x) ≤
f (x1 ) +
f (x2 )
x2 − x1
x2 − x1
(mit strikter Ungleichung für x ∈
/ {x1 , x2 } im Falle strikter Konvexität) schreiben.
−x
1
(Beachte, dass x = λx1 + (1 − λ)x2 ⇔ λ = xx22−x
⇔ 1 − λ = xx−x
.)
1
2 −x1
Bemerkung. Konvexe Funktionen sind stetig. (Übung!)
Beispiel. Die Funktion f : R → R, f (x) = |x| ist konvex: Für x1 , x2 ∈ R und
0 ≤ λ ≤ 1 ist
|λx1 + (1 − λ)x2 | ≤ λ|x1 | + (1 − λ)|x2 |
nach der Dreiecksungleichung. (Insbesondere müssen konvexe Funktionen nicht
unbedingt differenzierbar sein.)
Lemma 6.19 Es seien D ⊂ R ein Intervall, f : D → R eine Funktion, x, x1 , x2 ∈
D mit x1 < x < x2 . Dann sind äquivalent
(i) f (x) ≤
x2 −x
f (x1 )
x2 −x1
(ii)
f (x)−f (x1 )
x−x1
(iii)
f (x2 )−f (x1 )
x2 −x1
(iv)
f (x)−f (x1 )
x−x1
≤
≤
≤
+
x−x1
f (x2 ),
x2 −x1
f (x2 )−f (x1 )
,
x2 −x1
f (x2 )−f (x)
x2 −x
und
f (x2 )−f (x)
.
x2 −x
Dies gilt auch, wenn man in diesen Ungleichungen jeweils ≤ durch < ersetzt.
121
Beweis. (i) ⇔ (ii): (i) ist äquivalent zu
f (x) − f (x1 ) ≤ −
x − x1
x − x1
(x − x1 )(f (x2 ) − f (x1 ))
f (x1 ) +
f (x2 ) =
,
x2 − x1
x2 − x1
x2 − x1
was wiederum zu (ii) äquivalent ist.
(i) ⇔ (iii): (i) ist äquivalent zu
f (x) − f (x2 ) ≤
x2 − x
x2 − x
(x2 − x)(f (x1 ) − f (x2 ))
f (x1 ) −
f (x2 ) =
,
x2 − x1
x2 − x1
x2 − x1
was wiederum zu (iii) äquivalent ist.
(i) ⇔ (iv): (i) ist äquivalent zu
(x2 − x + x − x1 )f (x) ≤ (x2 − x)f (x1 ) + (x − x1 )f (x2 )
und damit zu
(x2 − x)(f (x) − f (x1 )) ≤ (x − x1 )(f (x2 ) − f (x)),
was wiederum zu (iv) äquivalent ist.
Damit ist der Satz vollständig bewiesen.
Satz 6.20 Es seien (a, b) ⊂ R ein Intervall und f : (a, b) → R eine zweimal
differenzierbare Funktion. Dann gilt:
(i) f 00 (x) ≥ 0 für alle x ∈ (a, b) ⇔ f ist konvex,
(ii) f 00 (x) > 0 für alle x ∈ (a, b) ⇒ f ist strikt konvex.
Natürlich gelten entsprechende Aussagen für konkave Funktionen.
Beweis. Gilt f 00 (x) ≥ 0 (bzw. > 0) für alle x ∈ (a, b), so ist f 0 nach Satz 6.16
(streng) monoton wachsend. Sind nun x, x1 , x2 ∈ (a, b) mit x1 < x < x2 gegeben,
so folgt aus dem Mittelwertsatz
f (x) − f (x1 )
f (x2 ) − f (x)
= f 0 (ξ1 ) ≤ f 0 (ξ2 ) =
x − x1
x2 − x
für geeignete ξ1 ∈ (x1 , x) und ξ2 ∈ (x, x2 ), wobei die Ungleichung im Fall f 00 > 0
strikt ist. Nach Lemma 6.19 ist f demnach (strikt) konvex.
Ist nun umgekehrt f als konvex vorausgesetzt, so folgt für x1 < x2 aus Lemma
6.19 (ii) und (iii)
f 0 (x1 ) = x→x
lim
1
x>x1
f (x) − f (x1 )
f (x2 ) − f (x1 )
f (x) − f (x2 )
≤
≤ x→x
lim
= f 0 (x2 ).
2
x − x1
x 2 − x1
x − x2
x<x2
f 0 ist also monoton. Nach Satz 6.16 folgt hieraus aber f 00 ≥ 0.
122
Beispiele.
1. Die Funktion f : R → R, f (x) = x2 ist strikt konvex.
2. exp : R → R ist strikt konvex.
3. log : (0, ∞) → R ist strikt konkav, denn log00 (x) = − x12 < 0 für alle x > 0.
Als Anwendung leiten wir nun einige Ungleichungen her, die für viele Untersuchungen in der Analysis von großer Bedeutung sind.
Satz 6.21 (Die Youngsche Ungleichung) Es seien p, q ∈ (1, ∞) mit
1. Dann gilt für alle a, b ≥ 0
ap bq
+ .
ab ≤
p
q
1
p
+ 1q =
Beweis. Die Behauptung ist klar für a = 0 oder b = 0. Gilt a, b 6= 0, so folgt aus
der Konkavität des Logarithmus
1
1 q 1
1
p
log a + b ≥ log(ap ) + log(bq )
p
q
p
q
und hieraus, indem man auf beiden Seiten die Exponentialfunktion anwendet,
1
1
ap b q
+ ≥ (ap ) p (bq ) q = ab.
p
q
Hieraus ergeben sich zwei grundlegende Ungleichungen für Vektoren im Rn
(oder Cn ) (also n-Tupel von reellen bzw. komplexen Zahlen). Zunächst führen
wir die folgende Notation ein.
Definition 6.22 Für x = (x1 , . . . , xn ) ∈ Rn (oder Cn ) und p ∈ [1, ∞) definieren
wir die p-Norm von x durch
kxkp :=
X
n
p
|xk |
p1
.
k=1
Für p = ∞ setzt man
kxk∞ := max |xk |
1≤k≤n
(:= max{|xk | : k = 1, . . . , n}).
Satz 6.23 (Die Höldersche Ungleichung) Es seien p, q ∈ [1, ∞] mit p1 + 1q =
1
1, wobei hier ∞
= 0 zu lesen ist. Dann gilt für x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈
n
C
n
X
|xk yk | ≤ kxkp kykq .
k=1
123
Beweis. O.B.d.A. (d.h. ‘ohne Beschränkung der Allgemeinheit’) nehmen wir an,
dass kxk, kyk =
6 0 ist. (Anderenfalls ist x = 0 oder y = 0 und die Aussage trivial.)
1. Fall: p, q ∈ (1, ∞). Indem wir für k = 1, . . . , n die Youngsche Ungleichung
|xk |
|yk |
jeweils mit a = kxk
und b = kyk
anwenden, ergibt sich
p
q
n
n n
X
X
X
1
|xk |p
|yk |q
1 1
|xk | |yk |
·
≤
= + = 1.
|xk yk | =
p +
q
kxkp kykq k=1
kxkp kykq
pkxkp qkykq
p q
k=1
k=1
Nach Multiplikation mit kxkp kykq folgt hieraus die Behauptung.
2. Fall: {p, q} = {1, ∞}. O.B.d.A. sei p = 1 und q = ∞. (Ansonsten vertausche
man die Rollen von p und q.) Es folgt
n
n
X
X
|xk yk | ≤ max |yk |
|xk | = kyk∞ kxk1 .
1≤k≤n
k=1
k=1
Bemerkung. Speziell für p = 2 ergibt sich die Cauchy-Schwarzsche Ungleichung
n
n
auf
von x und y ist x · y :=
Pn
Pn dem R (oderPCn ): Das euklidische Skalarprodukt
k=1 xk yk ). Wegen |x · y| ≤
k=1 |xk yk | folgt nun
k=1 xk yk (bzw.
|x · y| ≤ kxk2 kyk2 .
Satz 6.24 (Die Minkowskische Ungleichung) Es sei p ∈ [1, ∞]. Dann gilt
für x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Cn
kx + ykp ≤ kxkp + kykp .
(Hierbei bezeichnet x + y = (x1 + y1 , . . . , xn + yn ) die komponentenweise zu
bildende Vektorsumme von x und y.)
Beweis. 1. Fall: p ∈ (1, ∞). Nach der Hölderschen Ungleichung ist für p1 + 1q = 1,
p
also q = p−1
,
kx +
ykpp
=
≤
n
X
k=1
n
X
|xk + yk | · |xk + yk |p−1
p−1
|xk | · |xk + yk |
+
k=1
≤ kxkp
∞
X
|yk | · |xk + yk |p−1
k=1
X
n
|xk + yk |(p−1)q
1q
+ kykp
k=1
k=1
= kxkp + kykp
X
n
X
n
|xk + yk |p
k=1
= kxkp + kykp kx + ykpp−1 .
124
p1 pq
|xk + yk |(p−1)q
1q
Division durch kx + ykp−1
ergibt die Behauptung
p
2. Fall: p = 1: Für p = 1 folgt direkt aus der Dreiecksungleichung
kx + yk1 =
n
X
k=1
|xk + yk | ≤
n
X
|xk | +
k=1
n
X
|yk | = kxk1 + kyk1 .
k=1
3. Fall: p = ∞: Für p = ∞ schließlich erhält man die Behauptung, da mit
|xk | ≤ kxk∞ und |yk | ≤ kyk∞ für alle k auch |xk + yk | ≤ kxk∞ + kyk∞ für alle k
ist.
125
Kapitel 7
Das Integral
Rb
In diesem Kapitel definieren wir das Integral a f (x) dx für geeignete Funktionen
f : [a, b] → R und und untersuchen dessen wichtigste Eigenschaften. Das Integral
misst die (signierte) Fläche zwischen Funktionsgraph und x-Achse. Heuristisch
erhält man das Integral, indem man die Strecke [a, b] in unendlich viele unendlich
feine Intervalle [x, x+dx) aufteilt und die entsprechend unendlichRvielen unendlich
dünnen Rechtecke mit signierter Fläche f (x) dx aufsummiert: f (x) dx. Daher
auch das stilisierte S als Integrationszeichen. Unsere erste Aufgabe wird es sein,
diese heuristischen Ideen in sinnvolle Mathematik zu überfüren: Das geschieht in
Abschnitt 7.1.
Der Integrationsbegriff ist von grundlegender Bedeutung für die gesamte Analysis und viele weitere Bereiche innerhalb der Mathematik und den Anwendungen.
Vor allem der Zusammenhang zur Differentiation ist fundamental: Wir werden
sehen, dass die Integration in gewisser Hinsicht eine zur Differentiation inverse
Operation darstellt.
7.1
Definition des Integrals
Die Strategie zur Definition des Integrals ist die folgende: Zunächst betrachten
wir besonders einfache Funktionen, für die man das Integral einfach hinschreiben
kann. Dann verwenden wir einen Grenzprozess, um die Klasse der integrierbaren
Funktionen soweit auszudehnen, dass sie für all unsere Belange ausreicht und
insbesondere alle stetigen Funktionen beinhaltet. Für diesen Grenzprozess gibt
es in der mathematischen Literatur mehrere Ansätze, die zu Integralbegriffen
unterschiedlicher Allgemeinheit führen. Wir werden hier vor allem das RiemannIntegral behandeln und später noch kurz auf das sogenannte Regelintegral eingehen. Beide dieser Ansätze haben ihre Vorzüge und Nachteile, der Begriff des
Riemann-Integrals ist aber wohl der anschaulichere. Das wesentlich allgemeinere
Lebesgue-Integral werden wir erst in der Analysis 3 behandeln.
126
Das Integral für Treppenfunktionen
Es sei [a, b] ⊂ R ein kompaktes Intervall.
Definition 7.1 Eine Funktion f : [a, b] → R heißt Treppenfunktion, wenn es
eine Unterteilung a = x0 < x1 < . . . < xn = b derart gibt, dass f |(xi−1 ,xi ) konstant
ist für alle i = 1, . . . , n. Eine solche Unterteilung heiße f zugehörig. Die Menge
der Treppenfunktionen auf [a, b] wird mit T [a, b] bezeichnet.
(Sind M, N Mengen, f : M → N eine Abbildung und U ⊂ M , so bezeichnet
f |U : U → N die Einschränkung von f auf U , die durch f |U (x) = f (x) für x ∈ U
gegeben ist.)
Lemma 7.2 Sind f, g ∈ T [a, b] und λ ∈ R, so sind auch f + g und λf Treppenfunktionen.
Beweis. Es seien
Z : a = x0 < x1 < . . . < xn = b
Z 0 : a = x00 < x01 < . . . < x0m = b
und
Zerlegungen, so dass f auf allen (xi−1 , xi ) und g auf allen (x0j−1 , x0j ) konstant ist.
Die gemeinsame Verfeinerung von Z und Z 0 ist dann die Unterteilung
Z 00 : a = x000 < x001 < . . . < x00l = b
mit {x000 , . . . , x00l } = {x0 , . . . , xn } ∪ {x00 , . . . , x0m }. Da f + g und λf auf allen Intervallen (x00k−1 , x00k ) konstant sind, ergibt sich die Behauptung.
Bemerkung. Da die Menge R[a,b] aller Abbildungen von [a, b] nach R ein Vektorraum ist und offensichtlich 0 ∈ T [a, b] gilt, besagt dieses Lemma gerade, dass
T [a, b] ein Vektorraum ist. Man spricht daher auch vom Raum der Treppenfunktionen auf [a, b].
Definition 7.3 Es sei f ∈ T [a, b] mit f (x) = ci für x ∈ (xi−1 , xi ), i = 1, . . . , n,
für die f zugehörige Unterteilung a = x0 < x1 < . . . < xn = b. Das Integral von
f ist dann definiert durch
Z b
n
X
f (x) dx :=
ci (xi − xi−1 ).
a
i=1
Wir schreiben auch manchmal nur kurz
Rb
a
f.
Wir müssen zeigen, dass dieser Begriff wohldefiniert ist, also nicht von der speziell
gewählten Zerlegung abhängt.
Beweis. Es seien
Z : a = x0 < x1 < . . . < xn = b
und
127
Z 0 : a = x00 < x01 < . . . < x0m = b
zu f gehörige Zerlegungen, so dass f die Werte ci bzw. c0j auf den entsprechenden
Intervallen annehme. Enthält etwa Z 0 nur einen zusätzlichen Punkt x0 , der im
Intervall (xk−1 , xk ) liegt, so ist
m
X
c0j (x0j − x0j−1 )
j=1
=
k−1
X
ci (xi − xi−1 ) + ck (x0 − xk−1 ) + ck (xk − x0 ) +
i=1
=
n
X
n
X
ci (xi − xi−1 )
i=k+1
ci (xi − xi−1 ),
i=1
so dass diese Unterteilungen zum gleichen Integral führen. Daraus ergibt sich
induktiv der Fall, dass Z 0 eine Verfeinerung von Z ist, d.h., dass jeder Unterteilungspunkt von Z auch einer von Z 0 ist, induktiv. Der allgemeine Fall folgt dann,
indem man die Werte für Z und Z 0 mit dem der gemeinsamen Verfeinerung Z 00
vergleicht.
Lemma 7.4 Das Integral ist linear und monoton auf T [a, b]:
(i) Für f, g ∈ T [a, b], λ ∈ R gilt
Z
a
b
Z
b
Z
f (x) dx +
f (x) + g(x) dx =
a
Z b
Z b
λf (x) dx = λ
f (x) dx.
a
b
g(x) dx
sowie
a
a
(ii) Für f, g ∈ T [a, b] mit f ≤ g ist
Z
b
Z
f (x) dx ≤
a
b
g(x) dx.
a
Beweis. Indem wir ggf. zur gemeinsamen Verfeinerung übergehen, dürfen wir
alle Integrale bezüglich einer sowohl zu f als auch zu g gehörigen Unterteilung
angeben. Die Behauptungen sind dann klar.
Das Riemann-Integral
Wir kommen nun zur wesentlichen Idee der Riemann-Integration: der Approximation von oben und unten durch Treppenfunktionen.
128
Definition 7.5 Ist f : [a, b] → R beschränkt, so definieren wir das Ober- und
Unterintegral von f durch
Z
∗
b
Z
ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≥ f
f (x) dx := inf
,
a
Z
Z
b
ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≤ f
f (x) dx := sup
∗
bzw.
.
a
Ist f selbst schon eine Treppenfunktion, so gilt natürlich
Z ∗
Z
Z b
f (x) dx = f (x) dx =
f (x) dx.
∗
a
Des Weiteren ist offenbar für jedes f
Z
Z ∗
f≤
f
und
Z
∗
Z
f =−
∗
(−f ).
∗
Lemma 7.6 Es seien f, g : [a, b] → R beschränkt und λ ≥ 0. Dann gilt:
(i) Subadditivität des Oberintegrals:
Z
Z ∗
(f + g) ≤
∗
Z
∗
g.
f+
(ii) Superadditivität des Unterintegrals:
Z
Z
Z
(f + g) ≥ f + g.
∗
∗
∗
(iii) Positive Homogenität des Ober- und Unterintegrals:
Z ∗
Z ∗
Z
Z
λf = λ
f
und
λf = λ f.
∗
∗
Beweis. (i) Es sei ε > 0. Wähle Treppenfunktionen ϕ, ψ mit ϕ ≥ f , ψ ≥ g und
R∗
Rb
R∗
Rb
f ≥ a ϕ − 2ε sowie
g ≥ a ψ − 2ε . Nach Lemma 7.4 ist dann
Z
∗
Z
(f + g) ≤
b
Z
(ϕ + ψ) =
a
b
Z
Z
ψ≤
ϕ+
a
b
a
Da ε beliebig war, folgt die Behauptung.
R
R∗
(ii) Das folgt direkt aus (i) und ∗ f = − (−f ).
129
∗
Z
f+
∗
g + ε.
(iii) Der Fall λ = 0 ist trivial, so dass wir λ > 0 annehmen. Zu ε > 0 wähle
R∗
Rb
eine Treppenfunktion ϕ mit ϕ ≥ f und
f ≥ a ϕ − λε . Da λf ≤ λϕ gilt, ergibt
sich
Z ∗
Z b
Z ∗
Z ∗
Z b
ε
λϕ = λ
ϕ≤λ
=λ
f + ε.
λf ≤
f+
λ
a
a
Wieder weil ε beliebig war, folgt daraus nun
Z ∗
Z
λf ≤ λ
∗
f
und damit – angewendet auf λ−1 – auch
Z ∗
Z ∗
Z
−1
−1
f =λ
λ λf ≤ λλ
λ
∗
Z
λf =
∗
λf.
Die analoge Aussage für Unterintegrale ergibt sich nun wieder durch Übergang
von f zu −f .
Definition 7.7 Eine beschränkte Funktion f : [a, b] → R heißt (Riemann-)integrierbar, wenn
Z ∗
Z
f= f
∗
gilt. Ist f Riemann-integrierbar, so definiert man das (Riemann-)Integral von f
durch
Z b
Z b
Z ∗
f :=
f (x) dx :=
f (x) dx.
a
a
Die Menge der Riemann-integrierbaren Funktionen auf [a, b] bezeichnen wir mit
R[a, b].
Natürlich kann man statt
für die IntegrationsvaR b x auch
R b andere RBezeichnungen
b
riable benutzen, etwa a f = a f (t) dt = a f (y) dy . . .
Beachte, dass dieses Integral für Treppenfunktionen mit dem zuvor definierten
Integral übereinstimmt.
Beispiel: Es seien a = 0, b = 1 und f (x) = x. Für jedes n ∈ N sind die Funktionen ϕ, ψ mit
1
1
ϕn (x) = ψn (x) +
ψn (x) = bnxc ,
n
n
Treppenfunktionen mit ψn ≤ f ≤ ϕn und Integralen
Z
0
1
n−1
X
i 1
n−1
ψn (x) dx =
· =
,
n
n
2n
i=0
Z
1
Z
ϕ(x) dx =
0
130
1
ψn (x) dx +
0
1
n+1
=
.
n
2n
Daher ist für alle n
n−1
≤
2n
Z
Z
∗
f (x) dx ≤
f (x) dx ≤
∗
n+1
.
2n
Mit n → ∞ folgt f ∈ R[0, 1] und
1
Z
0
1
x dx = .
2
Direkt aus der Definition ergibt sich das folgende Kriterium.
Lemma 7.8 Eine Funktion f : [a, b] → R liegt genau dann in R[a, b], wenn es
zu jedem ε > 0 Treppenfunktionen ψ, ϕ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und
Z
b
b
Z
ψ≤ε
ϕ−
a
a
gibt.
Beweis. Klar.
Integrierbare Funktionen
Satz 7.9 Die Menge der Riemann-integrierbaren Funktionen R[a, b] bildet einen
Vektorraum. Das Riemann-Integral ist eine monotone lineare Abbildung von R[a, b]
nach R:
(i) Für f, g ∈ R[a, b], λ ∈ R sind auch f + g und λf ∈ R[a, b] mit
Z
a
b
Z
b
Z
f (x) dx +
f (x) + g(x) dx =
a
Z b
Z b
λf (x) dx = λ
f (x) dx.
a
b
g(x) dx
sowie
a
a
(ii) Für f, g ∈ R[a, b] mit f ≤ g gilt
Z
b
Z
f (x) dx ≤
a
b
g(x) dx.
a
Beweis. (i) Die Additivität folgt aus Lemma 7.6. Demnach ist
Z
b
Z
Z
g≤
f+
a
b
a
Z
(f + g) ≤
∗
∗
Z
(f + g) ≤
Z
f+
a
131
b
b
g,
a
so dass hier sogar Gleichheit gilt. Damit ist f + g integrierbar und das Integral
ist
Z b
Z b
Z ∗
Z b
g.
f+
(f + g) =
(f + g) =
a
a
a
Die positive Homogenität ergibt sich auch direkt aus Lemma 7.6. Dann gilt aber
auch für λ < 0
Z
Z ∗
Z
Z b
Z ∗
Z ∗
Z
λf,
f = λ f = − (−λf ) =
f =λ
(−λf ) = λ
λf = −
∗
∗
a
∗
Rb
Rb
also λf ∈ R[a, b] mit a λf = λ a f .
(ii) Für jedes ϕ ∈ T [a, b] mit ϕ ≥ g ist auch ϕ ≥ f . Daher ist
Z
b
Z
∗
∗
Z
f≤
f=
Z
g=
a
b
g.
a
Des Weiteren erfüllt R[a, b] die folgenden Eigenschaften.
Satz 7.10 Sind f, g ∈ R[a, b], so sind auch
(i) f+ , f− ∈ R[a, b],
(ii) |f |α ∈ R[a, b] für alle α > 0 und
(iii) f g ∈ R[a, b].
Hierbei bezeichnet f± die Funktionen
(
f (x), falls f (x) ≥ 0,
f+ (x) =
0,
falls f (x) < 0
(
−f (x), falls f (x) ≤ 0,
f− (x) = (−f )+ (x) =
0,
falls f (x) > 0.
und
Beweis. (i) Für jedes ε > 0 gibt es ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und
ε. Dann aber sind auch ϕ± und ψ± Treppenfunktionen, die
ψ+ ≤ f+ ≤ ϕ+
ϕ− ≤ f− ≤ ψ−
und
erfüllen. Die Behauptung folgt dann aus Lemma 7.8 mit
Z b
Z b
Z b
ϕ+ −
ψ+ ≤
(ϕ − ψ) < ε,
a
a
a
132
Rb
a
ϕ−
Rb
a
ψ<
denn es ist ϕ+ − ψ+ ≤ ϕ − ψ, und
Z b
Z b
Z b
ψ− −
ϕ− ≤
(ϕ − ψ) < ε,
a
a
a
denn es ist ψ− − ϕ− = (−ψ)+ − (−ϕ)+ ≤ −ψ − (−ϕ) = ϕ − ψ.
(ii) Wir überlegen uns zunächst, dass es zu jedem η > 0 und M > 0 eine
Konstante C gibt, so dass
|y α − xα | ≤ η + C|y − x| ∀ x, y ∈ [0, M ]
gilt. Dazu muss man nur beachten, dass es wegen der gleichmäßigen Stetigkeit der
Abbildung t 7→ tα auf [0, M ] ein δ > 0 gibt, so dass |y α − xα | ≤ η für |y − x| ≤ δ
α
gilt. Setzt man dann C = Mδ , so gilt diese Abschätzung für alle x, y ∈ [0, M ].
ε
.
Es sei ε > 0 beliebig. Setze M = max{|f (x)| : x ∈ [a, b]} und η = 2(b−a)
Rb
Rb
ε
Wähle ϕ, ψ ∈ T [a, b] mit 0 ≤ ψ ≤ |f | ≤ ϕ ≤ M und a ϕ − a ψ < 2C
.
α
α
(Nach (i) ist |f | = f+ + f− ∈ R[a, b].) Dann sind einerseits ϕ , ψ ∈ T [a, b] mit
ψ α ≤ |f |α ≤ ϕα . Andererseits gilt
Z b
Z b Z b
Z b
Z b
ε
α
α
ϕ−
ψ < ε.
ϕ −
ψ ≤
(η + C(ϕ − ψ)) = + C
2
a
a
a
a
a
(iii) Dies folgt aus (ii) und f g = 14 (|f + g|2 − |f − g|2 ).
Als direkte Folgerung halten wir noch eine elementare aber wichtige Abschätzung
fest.
Korollar 7.11 Ist f Riemann-integrierbar, so auch |f |. Dabei gilt
Z b
Z b
≤
f
(x)
dx
|f (x)| dx.
a
a
Beweis. Dies folgt direkt aus der Monotonie des Integrals und aus f, −f ≤ |f |. In Abhängigkeit vom Integrationsbereich ergibt sich das folgende Lemma.
Lemma 7.12 Es sei a < b < c. Genau dann ist f ∈ R[a, c], wenn f |[a,b] ∈ R[a, b]
und f |[b,c] ∈ R[b, c] ist. In diesem Falle gilt
Z c
Z b
Z c
f=
f+
f.
a
a
b
Beweis. Klar.
Vereinbarungsgemäß setzen wir noch
Z a
Z b
f := −
f
b
a
für a < b.
Besonders wichtig ist es nun natürlich zu wissen, ob gegebene Funktionen
integrierbar sind. Der folgende Satz garantiert dies für alle stetigen Funktionen.
133
Satz 7.13 Jede stetige Funktion f : [a, b] → R ist Riemann-integrierbar.
Wir zeigen hierzu ein auch für sich genommen interessantes Lemma über die
Approximierbarkeit von stetigen Funktionen durch Treppenfunktionen.
Lemma 7.14 Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ − ψ ≤ ε.
Beweis. Da f auf [a, b] gleichmäßig stetig ist, können wir zu gegebenem ε > 0 ein
δ > 0 finden, so dass |f (x) − f (y)| ≤ ε für alle x, y ∈ [a, b] mit |x − y| ≤ δ ist.
Es sei nun Z : a = x0 < x1 < . . . < xn = b eine Zerlegung mit max{xk − xk−1 :
k = 1, . . . , n} < δ, z.B. die äquidistante Zerlegung mit xk = a + nk (b − a) mit
xk − xk−1 = b−a
für hinreichend große n. Wir definieren dann Treppenfunktionen
n
ψ, ϕ durch
ψ(x) = min{f (ξ) : ξ ∈ [xi−1 , xi ]},
ϕ(x) = max{f (ξ) : ξ ∈ [xi−1 , xi ]}
für x ∈ [xi−1 , xi ) und ψ(b) = ϕ(b) = f (b). Dann gilt ψ ≤ f ≤ ϕ und ϕ − ψ ≤ ε.
Beweis von Satz 7.13. Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es nach
ε
.
Lemma 7.14 Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ − ψ < b−a
Dann aber ist auch
Z b
Z b
Z b
ε
ϕ−
ψ≤
dx = ε,
a
a
a b−a
und die Behauptung folgt aus Lemma 7.8.
1
Bemerkungen.
1. Es gibt noch mehr integrierbare Abbildungen. Eine weitere Klasse ist die
der monotonen Funktionen: Jede monotone Funktion f : [a, b] → R ist
Riemann-integrierbar. (Übung!)
2. Ohne Beweis und Relevanz für unsere weiteren Untersuchungen geben wir
noch ein notwendig und hinreichendes Kriterium für die Riemann-Integrierbarkeit an. Man nennt eine Teilmenge M ⊂ [a, b] eine Lebesguesche Nullmenge, wenn es zu jedem ε > 0 eine Folge von Intervallen (ai , bi ) gibt, die
M überdecken, d.h.
[
M ⊂ (ai , bi )
gilt, und die
X
(bi − ai ) < ε
i
erfüllen. (Solche Mengen sind also in gewissem Sinne sehr klein.) Man kann
dann zeigen, dass eine beschränkte Funktion f : [a, b] → R genau dann
Riemann-integrierbar ist, wenn sie außerhalb einer Lebesgueschen Nullmenge stetig ist.
1
Die zweite Bemerkung wurde in der VL weggelassen.
134
Riemannsche Summen
Ist f : [a, b] → R eine Funktion,
Z : a = x0 < x1 < . . . < xn = b
eine Zerlegung von [a, b] und ξk ∈ [xk−1 , xk ], k = 1, . . . , n, so nennt man
n
X
f (ξk )(xk − xk−1 )
k=1
eine Riemannsche Summe. Man definiert die Feinheit von Z durch
ρ(Z) := max{xk − xk−1 : k = 1, . . . , n}.
In der Tat konvergieren Riemannsche Summen gegen das Integral von f , wenn
die Feinheit der Zerlegung gegen 0 strebt:
Satz 7.15 Es sei f : [a, b] → R stetig. Dann gibt es zu jedem ε > 0 ein δ > 0,
so dass für jede Unterteilung Z : a = x0 < x1 < . . . < xn = b mit ρ(Z) ≤ δ und
jede Wahl von Stützstellen ξk ∈ [xk−1 , xk ], k = 1, . . . , n,
Z
n
b
X
f (x) dx −
f (ξk )(xk − xk−1 ) < ε
a
k=1
gilt.
Bemerkung: Der Satz gilt sogar für alle f ∈ R[a, b], was wir hier aber nicht
beweisen.
Beweis. Zu gegebenem ε > 0 definieren wir genau wie im Beweis von Lemma 7.14
ε
(nur mit b−a
an Stelle von ε) zu einer Zerlegung Z : a = x0 < x1 < . . . < xn = b
mit ρ(Z) ≤ δ die Treppenfunktionen ψ und ϕ. Es ist dann einerseits
b
Z
Z
ψ≤
a
b
Z
b
f≤
a
b
Z
ϕ≤
ψ + ε.
a
a
Andererseits ergibt sich wegen ψ(x) ≤ f (ξk ) ≤ ϕ(x) für x ∈ [xk−1 , xk ) auch
Z
b
ψ≤
a
n
X
Z
f (ξi )(xi − xi−1 ) ≤
Z
ϕ≤
a
i=1
b
b
ψ + ε.
a
Hieraus folgt die Behauptung.
Als Anwendung dieses Satzes können wir nun die Hölder- und die MinkowskiUngleichung vom Rn auf Funktionen übertragen.
135
Definition 7.16 Für f ∈ R[a, b] und 1 ≤ p < ∞ definiert man die p-Norm von
f durch
Z b
p1
kf kp :=
|f (x)|p dx .
a
Satz 7.17 Es sei f : [a, b] → R stetig.
1
p
(i) Höldersche Ungleichung: Für p, q ∈ (1, ∞) mit
+
1
q
= 1 ist
kf gk1 ≤ kf kp kgkq .
(ii) Minkowski-Ungleichung: Für p ∈ [1, ∞) ist
kf + gkp ≤ kf kp + kgkp .
Beweis. Wir zerlegen das Intervall [a, b] äquidistant in n ∈ N Strecken der Länge
∆n = b−a
und wählen entsprechende Stützstellen ξ1 , . . . , ξn . Indem man die
n
1/p
Höldersche Ungleichung für den Rn auf die Vektoren ∆n (f (ξ1 ), . . . , f (ξn )) und
1/q
∆n (g(ξ1 ), . . . , g(ξn )) anwendet, ergibt sich
n
X
|f (ξk )g(ξk )|∆n ≤
k=1
n
X
! p1
|f (ξk )|p ∆n
k=1
n
X
! 1q
|g(ξk )|q ∆n
.
k=1
Die hier auftretenden Summen sind nun Riemannsche Summen, so dass sich die
Behauptung (i) mit n → ∞ ergibt.
Ähnlich sieht man mit der Minkowski-Ungleichung für den Rn angewendet
1/p
1/p
auf die Vektoren ∆n (f (ξ1 ), . . . , f (ξn )) und ∆n (g(ξ1 ), . . . , g(ξn ))
n
X
i=1
! p1
|f (ξk ) + g(ξk )|p ∆n
≤
n
X
! p1
|f (ξk )|p ∆n
k=1
+
n
X
! p1
|g(ξk )|p ∆n
,
k=1
so dass sich im Limes n → ∞ auch (ii) aus Satz 7.15 ergibt.
Bemerkung: Auch dieser Satz gilt sogar auf R[a, b].
Integration vektorwertiger Funktionen
Die Integration vektorwertiger Funktionen f : [a, b] → Rn , insbesondere die Integration komplexwertiger Funktionen f : [a, b] → C kann ganz einfach auf die
Integration reeller Funktionen zurückgespielt werden, indem man das Integral
komponentenweise definiert:
136
Definition 7.18 Eine Funktion f : [a, b] → Rn , x 7→ f (x) = (f1 (x), . . . , fn (x))
heißt Riemann-integrierbar, wenn jede Komponente fk : [a, b] → R, k = 1, . . . , n,
Riemann-integrierbar ist. Wir schreiben dann f ∈ R([a, b]; Rn ) und setzen
Z b
Z b
Z b
fn (x) dx .
f (x) dx :=
f1 (x) dx, . . . ,
a
a
a
Für eine komplexwertige Funktion f : [a, b] → C, x 7→ f (x) = u(x) + iv(x)
mit u, v : [a, b] → R erhält man gemäß C ∼
= R2 , dass f Riemann-integrierbar ist
(d.h. f ∈ R([a, b]; C)), wenn u, v ∈ R[a, b] ist. Es ist dann
Z
b
Z
f (x) dx :=
a
b
Z
u(x) dx + i
a
v(x) dx.
a
137
b
Literaturverzeichnis
[Br] Th. Bröcker: Analysis I Spektrum Akademischer Verlag, 1995.
[Fo] O. Forster: Analysis 1. Vieweg + Teubner, Wiesbaden, 2011.
[He] H. Heuser: Lehrbuch der Analysis, Teil 1. Vieweg + Teubner, Wiesbaden,
2009.
[Hi] S. Hildebrandt: Analysis 1. Springer, Berlin, 2006.
[Kö] K. Königsberger: Analysis 1. Springer, Berlin, 2004.
[La] S. Lang: Undergraduate Analysis. Springer, New York, 1997.
138
Herunterladen