Analysis 1 - math.uni

Analysis 1
Vorlesungsskript
Wintersemester 2013/14
Bernd Schmidt∗
Version vom 29. Juli 2014
∗
Institut für Mathematik, Universität Augsburg, Universitätsstr. 14, 86135 Augsburg, [email protected]
1
Inhaltsverzeichnis
Inhaltsverzeichnis
2
1 Einleitung
4
2 Allgemeine Grundlagen
2.1 Aussagen und Beweise . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Mengen und Abbildungen . . . . . . . . . . . . . . . . . . . . . .
2.3 Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . .
6
6
14
21
3 Reelle und komplexe Zahlen
3.1 Die Körperaxiome . . . . . . . .
3.2 Die Anordnungsaxiome . . . . .
3.3 Zum Aufbau des Zahlensystems
3.4 Das Vollständigkeitsaxiom . . .
3.5 Die komplexen Zahlen . . . . .
.
.
.
.
.
28
28
34
39
42
48
.
.
.
.
.
.
54
54
60
64
66
75
77
.
.
.
.
.
83
83
88
91
95
98
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Folgen und Reihen
4.1 Folgen und Grenzwerte . . . . . . . . . . .
4.2 Reelle Folgen und Monotonie . . . . . . .
4.3 Konsequenzen der Vollständigkeit . . . . .
4.4 Reihen . . . . . . . . . . . . . . . . . . . .
4.5 Zur Darstellung der reellen Zahlen . . . . .
4.6 Potenzreihen und die Exponentialfunktion
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Stetige Funktionen
5.1 Definition und grundlegende Eigenschaften . .
5.2 Stetige Funktionen auf kompakten Intervallen
5.3 Monotonie und Umkehrfunktionen . . . . . . .
5.4 Asympotisches Verhalten . . . . . . . . . . . .
5.5 Trigonometrische Funktionen . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6 Differentiation
105
6.1 Definition, Beispiele und Grundlagen . . . . . . . . . . . . . . . . 106
6.2 Der Mittelwertsatz und seine Konsequenzen . . . . . . . . . . . . 113
2
6.3
Monotonie, Extrema und Konvexität . . . . . . . . . . . . . . . . 118
7 Das Integral
126
7.1 Definition des Integrals . . . . . . . . . . . . . . . . . . . . . . . . 126
Literaturverzeichnis
138
3
Kapitel 1
Einleitung
Es ist nicht möglich, in einer allgemeingültigen Definition zusammenfassen, was
‘die Mathematik’ für eine Wissenschaft sei. Ausgehend von Untersuchungen der
Eigenschaften von Zahlen und geometrischen Figuren, zu denen schon in der
Antike bedeutende Beiträge geleistet wurden, hat sie sich mittlerweile zu einem
riesigen theoretischen Gebäude aufgebaut, in viele einzelne Gebiete aufgegliedert,
und doch wieder Verbindungen zwischen entfernt scheinenden Bereichen aufgezeigt, so dass man nur sehr schwer einen Überblick gewinnen kann. Immer aber
geht es darum, Probleme zu lösen, theoretische Fragen durch logisches Schließen
absolut zweifelsfrei beantworten zu können. Die Herausforderung und Neugier an
ungelösten Fragestellungen waren seit jeher eine der wesentlichen Antriebsfedern
zur Beschäftigung und dadurch auch zur Weiterentwicklung der Mathematik.
Man denke nur an die Quadratur des Kreises – ein antikes Problem, das doch
erst nach Jahrtausenden gelöst werden konnte. Um derartige Fragen beantworten zu können, wurden eigene mathematische Theorien geschaffen, indem eine
Vielzahl neuer mathematischer Konstrukte definiert und deren Beziehungen untereinander untersucht wurden. Wie in anderen Wissenschaften, wirft jedoch eine
gelöste Frage oft gleich eine Vielzahl weiterer interessanter Fragestellungen auf.
In den allermeisten Fällen muss man dabei schon ein Experte sein, um überhaupt
vestehen zu können, was diese Fragen denn eigentlich sind. Doch obwohl sich die
Mathematik damit innermathematisch immer weiter fortentwickelt und sich in
immer abstrakteren Gedankengebilden zu verlieren scheint, kann sie erstaunliche Erfolge in den Anwendungen auf die verschiedensten außermathematischen
Wissenschaften vorweisen: von den Naturwissenschaften und der Physik im Besonderen bis zu den Wirtschafts- und Sozialwissenschaften.
Die angedeutete Schaffung einer mathematischen Theorie spiegelt sich auch
im Aufbau dieser Vorlesung – wie in den meisten Lehrbüchern zur Mathematik
– wieder. Überspitzt ausgedrückt folgt der Aufbau dem Schema
Definition – Satz – Beweis.
In den Definitionen werden die Begriffe, also die mathematischen Konstrukte
4
einer Theorie festgelegt. Ein Satz (auch Lehrsatz oder Theorem) macht dann eine Aussage über die Eigenschaften dieser Konstrukte und die Beziehungen der
Begriffe untereinander. Schließlich muss die Gültigkeit dieses Satzes durch einen
absolut zwingenden logischen Schluss begründet werde. Natürlich werden wir diesem etwas blutleeren Aufbau durch motivierende Worte etwas Farbe geben, die
erklären sollen, warum es interessant ist, gerade diesen oder jenen Begriff näher zu
untersuchen. Man darf sich durch diesen in Lehrbüchern üblichen Aufbau nicht
bei der eigenen mathematischen Arbeit am Problemlösen verunsichern lassen.
Das, was hier in der Vorlesung Analysis 1 vorgestellt wird, ist über viele Jahrhunderte auch in der Effizienz der Darstellung gereift. Beim eigenen Arbeiten an
den Hausaufgaben werden Sie merken, dass die ersten Wege zur Lösung meistens
nicht geradlinig verlaufen.
In der Vorlesung Analysis 1 nun geht es im Wesentlichen um die Differentialund Integralrechnung einer reellen Veränderlichen. Wir untersuchen also Eigenschaften von Funktionen, die einer reellen Zahl wieder eine reelle Zahl zuordnen.
Vorkenntnisse: sind (fast) keine nötig. Abitur ist mehr als genug.
Literatur: Es gibt viele gute Lehrbücher zur Analysis 1. Sehr empfehlenswert
sind die Analysisbücher [Fo] von Forster und [Kö] von Königsberger, deren Aufbau
auch dieser Vorlesung zugrunde liegt. Des Weiteren sei hier insbesondere auf die
Bücher [Br] von Bröcker, [He] von Heuser (sehr ausführlich), [Hi] von Hildebrandt
und [La] von Lang (auf Englisch) verwiesen.
Fehler: Bitte teilen Sie mir evtl. Tipp- oder auch andere Fehler in diesem Skript
per E-Mail mit.
Vielen Dank an alle, die mich auf Fehler in früheren Versionen dieses Skripts
aufmerksam gemacht haben, insbesondere an Herrn Gassner, Frau Maucher und
Herrn von Seelstrang.
5
Kapitel 2
Allgemeine Grundlagen
Wir beginnen damit, einige wichtige Grundlagen zusammenzustellen, die die Basis nicht nur der Analysis sind. Die eigentliche Analysis beginnt dann im Kapitel
3, wenn wir die reellen Zahlen axiomatisch einführen. Schon jetzt werden wir
allerdings in etlichen Beispielen Zahlen verwenden (natürliche, ganze, rationale
wie auch reelle), die Sie ja aus der Schule kennen.
2.1
Aussagen und Beweise
Ein mathematischer Sachverhalt wird durch eine mathematische Aussage formuliert. Dies ist ein Satz, der entweder zutrifft oder nicht und dem man entsprechend
den Wahrheitswert ‘wahr’ (w) oder ‘falsch’ (f) zuordnet. Eine Aussage kann jedoch nicht sowohl wahr als auch falsch sein.
Beispiele: Diese Sätze sind Aussagen:
• Der Lech fließt in die Donau. (w)
• Die Donau mündet in die Nordsee. (f)
• Eine gerade Quadratzahl ist durch 4 teilbar. (w)
√
• 2 ist rational. (f)
Die folgenden Sätze sind keine Aussagen:
• Hol mir mal ’ne Flasche Bier!
• Wie geht es dir?
• Dieser Satz ist falsch.
In der Mathematik geht es nun darum, (möglichst interessante) mathematische Aussagen zu treffen und mathematisch zu beweisen, dass diese wahr sind. Beweisen bedeutet hierbei, dass die fragliche Aussage durch mathematisch zulässige
6
Schlüsse aus anderen wahren Aussagen hergeleitet wird. Die wesentliche Arbeit
der Mathematiker besteht also darin, Folgerungen zu ziehen. Da man damit offensichtlich irgendwo beginnen muss, ist es nötig, einige (möglichst wenige und
möglichst grundlegende) Aussagen als wahr zu postulieren. Dies sind die sogenannten Axiome einer mathematischen Theorie. Sind die einmal festgelegt, beginnt die eigentliche Arbeit des Aufdeckens von Zusammenhängen, Formulierens
von Vermutungen und Aufsuchens eines mathematischen Beweises.
Auch die Suche nach geeigneten Axiomensystemen, also der Auswahl der
grundlegenden als wahr postulierten Aussagen, kann ein interessantes mathematisches Problem darstellen. Ein solches System sollte in sich widerspruchsfrei
sein, andererseits aber zu einer reichhaltigen Theorie, also vielen beweisbaren
Aussagen führen. Dabei hat – zumindest im Prinzip – jede Mathematikerin die
Freiheit, ihr eigenes Axiomensystem festzulegen. Tatsächlich haben sich in der
Mathematik jedoch gewisse allgemeinverbindliche Axiome durchgesetzt, die von
den meisten Mathematikern akzeptiert sind. Es gibt jedoch auch Axiome, wie
z.B. das Auswahlaxiom der Mengenlehre, die von einigen Mathematikern gemieden werden. Beide Sichtweisen haben ihre Berechtigung. Ein Leitgedanke bei der
Aufsuchung eines geeigneten Axiomensystems sollte es jedoch sein, zentrale Objekte der Mathematik, durch die sich auch Modelle in den Anwendungen etwa in
den Natur- oder Wirtschaftswissenschaften untersuchen lassen, einer mathematischen Analyse zugänglich zu machen. Hierbei kann es durchaus vorkommen, dass
es sinvoll ist, konkurrierende und miteinander nicht vereinbare Axiomensysteme
zu studieren. So gibt es in der ebenen Geometrie z.B. das Parallelenaxiom, das
von den übrigen Axiomen Euklids1 unabhängig ist. Es besagt, dass es ‘zu jeder
Geraden und jedem Punkt, der nicht auf dieser Geraden liegt, genau eine zu der
gegebenen Geraden parallele Gerade durch diesen Punkt gibt’. Alternativ lässt
sich das Gegenteil dieser Aussage als wahr postulieren, was zur Nichteuklidischen
Geometrie führt. Alle Sätze, die wir in der Mathematik als wahr erkennen, sind
also eigentlich nur wahr relativ zu einem ausgewählten Axiomensystem.
Kehren wir zurück zu unser Hauptaufgabe, mathematische Sätze zu formulieren und zu beweisen. Ein mathematischer Satz enthält Voraussetzungen und
Behauptungen. Er ist wahr, wenn im Falle, dass die Voraussetzungen wahr sind,
auch die Behauptungen wahr sind.
Beispiel: Ist n eine gerade Quadratzahl, so ist n
| durch{z4 teilbar}.
{z
}
|
= Behauptung
=Voraussetzung
Durch logisches Schließen können wir diesen Satz beweisen:
Beweis. 1. Ist n eine Quadratzahl, so gibt es eine natürliche Zahl m mit n = m2 .
2. Da n gerade ist, muss auch m gerade sein. Denn für m ungerade, ist auch
m2 = m · m ungerade. Wir können also m = 2k für eine natürliche Zahl k
schreiben.
1
aus Euklids Elementen
7
3. Dann aber ist n = m2 = (2k)2 = 4k 2 , was zeigt, dass n tatsächlich durch 4
teilbar ist.
(Die Box bezeichnet immer das Ende eines Beweises.)
Verknüpfungen von Aussagen
Mathematische Aussagen können – wie wir eben schon am Beispiel dieses Satzes
gesehen haben – verknüpft werden, wodurch eine neue Aussage entsteht. Die
wichtigsten Verknüpfungen sind die Folgenden. Hierbei stehen A und B jeweils
für eine Aussage und die Wahrheitstafel gibt an, unter welchen Wahrheitswerten
für A bzw. B die Verknüpfung wahr oder falsch ist:
1. Die Negation ¬: ¬A, gesprochen ‘Nicht-A’ oder ‘Non-A’.
A ¬A
w
f
f
w
Das heißt: Ist A wahr, so ist ¬A falsch.
Ist A falsch, so ist ¬A wahr.
2. Die Konjunktion ∧: A ∧ B, gesprochen ‘A und B’ oder ‘sowohl A als auch
B’.
A
w
w
f
f
B
w
f
w
f
A∧B
w
f
f
f
Das heißt: A ∧ B ist wahr, wenn sowohl
A als auch B wahr sind. In allen anderen Fällen ist A ∧ B falsch.
3. Die (nicht ausschließende) Disjunktion oder Adjunktion ∨: A ∨ B, gesprochen ‘A oder B’.
A
w
w
f
f
B
w
f
w
f
A∨B
w
w
w
f
Das heißt: A∨B ist wahr, wenn (mindestens) eine der Aussagen A oder B (ggf.
sogar beide) wahr sind. Nur wenn A
und B beide falsch sind, ist auch A ∨ B
falsch.
4. Die Implikation ⇒: A ⇒ B, gesprochen ‘A impliziert B’ oder ‘Aus A folgt
B’ oder ‘Wenn A dann B’ oder ‘B ist eine Konsequenz von A’.
A B
w w
w f
f w
f f
A⇒B
w
f
w
w
Aus einer wahren Aussage kann wahrheitsgemäß nur eine wahre Aussage folgen. Ist jedoch A falsch, so ist die Implikation A ⇒ B
wahr unabhängig vom Wahrheitswert von B.
(‘Ex falso quodlibet.’)
8
Gilt A ⇒ B, d.h. ist A ⇒ B eine wahre Aussage, so nennt man A eine
hinreichende Bedingung für B und B eine notwendige Bedingung für A.
Denn die Wahrheit von A ist ein hinreichender Grund für die Wahrheit von
B und umgekehrt muss B wahr sein, damit auch A wahr sein kann.
5. Die Äquivalenz ⇔: A ⇔ B, gesprochen ‘A ist äquivalent zu B’ oder ‘Genau
dann B wenn A’.
A
w
w
f
f
B
w
f
w
f
A⇔B
w
f
f
w
Die Äquivalenz A ⇔ B ist also wahr,
wenn A und B die gleichen Wahrheitswerte besitzen, und anderenfalls falsch.
Tautologien und Beweisprinzipien
Es gelten die folgenden wichtigen logischen Tautologien, also Aussagen, die unabhängig vom Wahrheitswert der beteiligten Aussagen A, B, C immer wahr sind:
Doppelte Verneinung: ¬(¬A) ⇔ A.
Beweis. Mit Wahrheitstafel:
A ¬A ¬(¬A) ¬(¬A) ⇔ A
w
f
w
w
f
w
f
w
De Morgansche Regeln: Diese beiden Tautologien sind
¬(A ∧ B) ⇔ (¬A ∨ ¬B) und ¬(A ∨ B) ⇔ ¬A ∧ ¬B.
Beweis. Wir beweisen nur die erste Regel – wieder mit einer Wahrheitstafel. Der
Beweis der zweiten Regel verläuft analog. (Überlegen Sie sich das!)
A B A ∧ B ¬(A ∧ B) ¬A ¬B ¬A ∨ ¬B ¬(A∧B) ⇔ (¬A∨¬B)
w w
w
f
f
f
f
w
w f
f
w
f
w
w
w
f w
f
w
w
f
w
w
f f
f
w
w
w
w
w
Die Wahrheitswerte von ¬(A ∧ B) ⇔ (¬A ∨ ¬B) sind also tatsächlich immer
wahr.
Beispiel: Ist A die Aussage ‘n ist eine Quadratzahl’, B die Aussage ‘n ist eine
gerade Zahl’. Dann ist A ∧ B ‘n ist eine Quadratzahl und n ist eine gerade Zahl’.
D.h.: ‘n ist eine gerade Quadratzahl’. Die Negation ¬(A∧B) ist dann ¬A∨¬B ‘n
ist nicht gerade oder n ist keine Quadratzahl’. Das bedeutet nicht, dass ‘n weder
gerade noch eine Quadratzahl ist’. (Überlegen Sie sich das für den Fall n = 6.)
9
Zur Äquivalenz: (A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A) .
Beweis. Mit Wahrheitstafel:
A B A ⇔ B A ⇒ B B ⇒ A (A ⇒ B) ∧ (B ⇒ A)
w w
w
w
w
w
w f
f
f
w
f
f w
f
w
f
f
f f
w
w
w
w
Die Wahrheitswerte der dritten und der sechsten Spalte sind identisch. Daher gilt
(A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A) .
Die Äquivalenz bedeutet also, dass sowohl A B impliziert als auch B A. Wird
in einem mathematischen Satz die Äquivalenz von zwei Aussagen A und B behauptet, so kann man dies nachweisen, indem man A ⇒ B und B ⇒ A beweist.
Transitivität der Implikation: (A ⇒ B) ∧ (B ⇒ C) ⇒ (A ⇒ C).
Beweis. Mit Wahrheitstafel, wobei wir die zu beweisende Tautologie mit (∗)
abkürzen.
A B C A ⇒ B B ⇒ C (A ⇒ B) ∧ (B ⇒ C) A ⇒ C (∗)
w w w
w
w
w
w
w
w w f
w
f
f
f
w
w f w
f
w
f
w
w
w f f
f
w
f
f
w
f w w
w
w
w
w
w
f w f
w
f
f
w
w
f f w
w
w
w
w
w
f f f
w
w
w
w
w
Wenn aus A B und aus B C folgt, so impliziert A C. Insbesondere dürfen wir
in Beweisen schrittweise schließen: Um C aus A zu folgern, können wir zunächst
von A auf eine andere (Hilfs-)Aussage B und von dieser dann auf C schließen.
Dieses Vorgehen kann man natürlich wiederholt anwenden und eine ganze Kette
von (Hilfs-)Aussagen B1 , . . . , Bn einführen, für die sich
A ⇒ B1 , B1 ⇒ B2 , . . . , Bn−1 ⇒ Bn sowie Bn ⇒ C
zeigen lässt und damit A ⇒ C. Einen Beweis nach diesem Schema nennt man
auch einen direkten Beweis.
Kontraposition: (A ⇒ B) ⇔ (¬B ⇒ ¬A).
Beweis. Mit Wahrheitstafel:
A B A ⇒ B ¬A ¬B ¬B ⇒ ¬A
w w
w
f
f
w
w f
f
f
w
f
f w
w
w
f
w
f f
w
w
w
w
10
Die Wahrheitswerte der dritten und der sechsten Spalte sind identisch.
Diese Tautologie liegt dem Beweisprinzip der Kontraposition zugrunde. Um
zu zeigen, dass aus A B folgt, kann man nachweisen, dass aus Nicht-B Nicht-A
folgt. M.a.W.: Man nehme an, dass B falsch ist und zeige dann, dass auch A
falsch ist.
Beispiel: Dieses Prinzip haben wir oben schon angewandt: Aus n gerade und
n = m2 für eine natürliche Zahl m folgt, dass auch m gerade ist.
Beweis. Durch Kontraposition: Ist m ist nicht gerade, also von der Form m =
2k−1 für eine natürlich Zahl k. Dann ist auch n = m2 = (2k−1)2 = 4k 2 −4k+1 =
2(2k 2 − 2k) + 1 nicht gerade.
Prinzip des Widerspruchsbeweises: (A ⇒ B) ⇔ ¬(A ∧ ¬B).
Beweis. Mit Wahrheitstafel:
A B A ⇒ B ¬B A ∧ ¬B ¬(A ∧ ¬B)
w w
w
f
f
w
w f
f
w
w
f
f w
w
f
f
w
f f
w
w
f
w
Die Wahrheitswerte der dritten und der sechsten Spalte sind identisch.
Diese Äquivalenz liegt dem Prinzip des Widerspruchsbeweises zugrunde: Um
B aus A zu folgern, kann man wie folgt vorgehen. Man findet eine Aussage C,
so dass sich C sowie deren Gegenteil ¬C aus der Annahme, dass A wahr und B
falsch ist, ableiten lassen, d.h. man weist nach, dass sowohl
(A ∧ ¬B) ⇒ C
als auch (A ∧ ¬B) ⇒ ¬C
gelten: Man konstruiert einen Widerspruch. Damit ist dann A ⇒ B gezeigt.
Es gilt nämlich, wobei man streng genommen auch die ersten beiden der
folgenden Schritte wieder mit Wahrheitstafeln begründen müsste,
(A ∧ ¬B) ⇒ C ∧ (A ∧ ¬B) ⇒ ¬C
⇔ (A ∧ ¬B) ⇒ (C ∧ ¬C)
⇔ ¬(A ∧ ¬B)
⇔ (A ⇒ B)
(s.o.).
Die zweite Äquivalenz ergibt sich hier daraus, dass Implikation mit der immer
falschen Folgerung C ∧¬C genau dann wahr ist, wenn die Prämisse A∧¬B falsch
ist.
√
Beispiel: 2 ist irrational. (Wie oben schon erwähnt ist auch dieser Satz eigentlich als eine Folgerung aus gewissen Grundannahmen in der Mathematik zu
verstehen.)
√
√
Beweis. Widerspruchsannahme: 2 ist rational, etwa 2 = pq mit p ∈ Z und
√
q ∈ N. Wegen 2 > 0√ist dann sogar p ∈ N. Indem wir diesen Bruch vollständig
kürzen, erhalten wir 2 = rs mit natürlichen Zahlen r und s. Dabei gilt:
11
r ist ungerade oder s ist ungerade.
√
Multiplikation mit s und anschließendes Quadrieren der Gleichung 2 = rs liefert
2s2 = r2 . Aus früheren Überlegungen (s.o.) wissen wir, dass dann r gerade und
r2 sogar durch 4 teilbar ist, etwa r2 = 4t. Dann aber folgt s2 = 2t, weshalb auch
s2 und damit auch s selbst gerade ist. D.h.:
r ist gerade und s ist gerade.
Widerspruch!
Quantoren und quantifizierte Aussagen
In der Mathematik werden oft Sätze, die von gewissen Variablen x, y, z, . . . aus
gewissen Mengen abhängen, untersucht. Ein solcher Satz A(x, y, x, . . .) ist selbst
keine Aussage. Er wird erst dann zu einer Aussage, wenn man die Variablen
quantifiziert. Die wichtigsten Quantoren, die dies leisten, sind der Allquantor ∀
‘für alle’ und der Existenzquantor ∃ ‘es existiert/gibt ein’. Für einen Satz A(x)
kann man dann etwa die Aussagen
• ∀ x : A(x), d.h. ‘Für alle x gilt A(x)’, und
• ∃ x : A(x), d.h. ‘Es existiert ein x, so dass A(x) gilt’,
bilden. ‘Es existiert ein x’ ist hier im Sinne von ‘Es existiert mindestens ein x’
zu verstehen. Möchte man ausdrücken, dass es genau ein x gibt (also nicht zwei
oder mehr), so schreibt man ∃!.
Beispiele:
1. Ist A(x) der Satz x > 7, wobei x eine Variable aus der Menge der reellen
Zahlen ist, so ergeben sich die folgenden Aussagen. ∀ x : x > 7: ‘Für alle
x gilt x > 7’. (Offensichtlich falsch.) Sowie ∃ x > 7: ‘Es existiert ein x mit
x > 7’. (Offensichtlich wahr.)
2. Ist A(x) der Satz x2 = 2, wobei x eine Variable aus der Menge der reellen
(oder rationalen) Zahlen ist, so ist ∃ x : A(x) eine wahre (bzw. falsche)
Aussage.
3. Es sei A(x, y) der Satz x < y mit reellen Zahlen x, y. Durch Quantifizierung
erhält man z.B. ∀ x ∃ y : x < y. In Worten: Für alle x gibt es ein y, so dass
x < y gilt. Dies ist ein wahrer Satz, denn man kann y = x + 1 wählen.
Man kann aber etwa auch den Satz ∃ y ∀ x : x < y bilden. In Worten: Es
existiert ein y, so dass für alle x gilt x < y. Dieser Satz ist falsch, wie das
Gegenbeispiel y = x zeigt.
12
Das letzte Beispiel zeigt, dass es wichtig ist, die Reihenfolge der Quantoren
zu beachten. Insbesondere darf die Reihenfolge verschiedener Quantoren nicht
vertauscht werden. Ist A(x, y) der Satz: Am Tag x esse ich zu Mittag gerne y,
wobei x einen Tag im Oktober und y etwas zu essen bezeichnet, so ist
• ∀ x ∃ y : A(x, y): ‘An jedem Tag des Oktobers esse ich zu Mittag gerne
etwas’ eine wahre Aussage,
• ∃ y ∀x : A(x, y): ‘Es gibt etwas, das ich an jedem Tag im Oktober gern zu
Mittag esse’ falsch.
(Teilen Sie diese Erkenntnis doch mit dem Studentenwerk.)
Zulässig ist es jedoch, die Reihenfolge zweier aufeinanderfolgender Allquantoren sowie die Reihenfolge zweier aufeinanderfolgender Existenzquantoren zu
vertauschen, d.h. es gelten
∀ x ∀ y : A(x, y) ⇔ ∀ y ∀ x : A(x, y)
und
∃ x ∃ y : A(x, y) ⇔ ∃ y ∃ x : A(x, y).
Die Negation einer Aussage mit Quantoren ist ganz einfach: Es ist
¬∀ x : A(x) ⇔ ∃ x : ¬A(x) und ¬∃ x : A(x) ⇔ ∀ x : ¬A(x).
Das Gegenteil von ‘Für alle x gilt A(x)’ ist ‘Es gibt ein x, für das A(x) nicht
gilt’. Das Gegenteil von ‘Es gibt ein x, für das A(x) gilt’ ist ‘Für alle x gilt A(x)
nicht’. Man kann also die Negation ¬ an einem Quantor ‘vorbeiziehen’, wobei ∀
zu ∃ bzw. ∃ zu ∀ wird. Damit lassen sich auch Aussagen mit mehreren Quantoren
leicht negieren, indem man (sukzessive) ¬ von links nach rechts schiebt und die
Quantoren auswechselt.
Beispiele:
1. Die Negation von ‘An jedem Tag des Oktobers esse ich zu Mittag gerne
etwas’ lautet ‘Es gibt einen Tag im Oktober, an dem ich nicht gerne zu
Mittag esse’.
2. Bezeichnet x, y reelle Zahlen, so ist
¬∃ y ∀ x : x < y ⇔ ∀ y ∃x : ¬x < y ⇔ ∀ y ∃x : x ≥ y.
3. Es ist
¬∀ x ∃ y ∀ z : A(x, y, z) ⇔ ∃ x ∀ y ∃ z : ¬A(x, y, z).
4. Das Gegenteil von
13
‘Für jede positive rationale Zahl x und jede natürlich Zahl n gibt
es eine rationale Zahl y mit x = y n ’
(was falsch ist) lautet
‘Es gibt eine rationale Zahl x und eine natürliche Zahl n, so dass
für alle rationalen Zahlen y gilt x 6= y n ’
(richtig, setze z.B. x = 2, n = 2).
Übung: Betrachten Sie den Satz A(x, y, z): ‘Am Tag x versteht der Student y
in der Analysisvorlesung z’, wobei z die Worte des Dozenten bezeichnet. Formulieren Sie alle möglichen Quantifizierungen durch ∀ und ∃ und deren Negation
umgangssprachlich.
2.2
Mengen und Abbildungen
Die Mengenlehre ist die Grundlage der modernen Mathematik. So lassen sich die
Begriffe, die wir insbesondere in der Analysis untersuchen, letztlich auf Begriffe
der Mengenlehre zurückführen. Das heute allgemein anerkannte Axiomensystem
der Mengenlehre geht auf Zermolo und Fraenkel zurück. Eine sorgfältige Untersuchung dieses Systems und seiner Konsequenzen muss jedoch einer eigenen
Vorlesung vorbehalten bleiben. Für die Zwecke der Analysis genügt es, eine Vorstellung vom Begriff der Menge zu haben und einige Operationen, die man mit
Mengen durchführen kann, zu erläutern.
Nach Cantor ist eine Menge eine
“Zusammenfassung von bestimmten, wohlunterschiedenen Objekten
unserer Anschauung oder unseres Denkens (welche ‘Elemente der Menge’ genannt werden) zu einem Ganzen.”
Dieser Begriff ist nicht unproblematisch, wie wir gleich noch sehen werden, genügt
als Leitfaden für alle Zwecke der Analysis 1-3 jedoch vollauf. Für eine Menge M
schreiben wir
• x ∈ M , wenn x ein Element von M ist (man sagt auch x liege in M ) und
• x∈
/ M , wenn x kein Element von M ist (wenn x nicht in M liegt).
Gilt für zwei Mengen M, N die Implikation x ∈ N ⇒ x ∈ M , so heißt N eine
Teilmenge von M , geschrieben N ⊂ M . (Manchmal schreibt man hierfür auch
N ⊆ M .) Gilt N ⊂ M und gibt es mindestens ein Element, das in M aber nicht
in N liegt, so nennen wir N eine echte Teilmenge von M und schreiben dafür auch
N ( M . Zwei Mengen, die kein Element gemein haben, nennt man disjunkt.
14
Zwei Mengen sind gleich, wenn sie dieselben Elemente besitzen: M = N heißt
M ⊂ N und N ⊂ M , m.a.W.: x ∈ M ⇔ x ∈ N . So ist z.B.
{3, 19, 8, 2013, 3} = {8, 19, 8, 8, 2013, 3} = {3, 8, 19, 2013}.
Üblicherweise schreibt man jedoch jedes Element nur einmal. Es gibt auch eine
Menge, die gar keine Elemente enthält: Die leere Menge ∅. Sie ist Teilmenge jeder
Menge.
Besitzt eine Menge M nur endlich viele Elemente, etwa x1 , x2 , . . . , xn , so lässt
sich M durch Aufzählen als
M = {x1 , x2 , . . . , xn }
schreiben. Auch für gewisse unendliche Mengen ist das möglich, wie etwa
{2, 4, 6, 8, . . .},
wenn durch die Pünktchen ‘. . . ’ klar ist, wie es weitergeht. Meistens beschreibt
man Mengen durch eine die Elemente charakterisierende Eigenschaft als Teilmenge einer anderen Menge in der Form
N = {x ∈ M : A(x)},
was heißt x ∈ N ⇔ (x ∈ M ∧ A(x)). Hier ist A(x) eine Aussage, die in Abhängigkeit von x ∈ M wahr oder falsch sein kann. Wir schreiben Mengen bisweilen auch
einfach als {x : A(x)} mit einer definierenden Eigenschaft A(x), wenn es sich
versteht, welche x hier zu betrachten sind.
Aus der Schule sollten Ihnen auch die folgenden unendlich großen Mengen von
Zahlen in Erinnerung sein:
• N = {1, 2, 3, . . .} (die natürliche Zahlen) sowie N0 = {0, 1, 2, 3, . . .} (die
natürliche Zahlen mit 0),
• Z = {. . . , −2, −1, 0, 1, 2, . . .} (die ganzen Zahlen),
• Q = { pq : p ∈ Z, q ∈ N} (die rationalen Zahlen) und
• die reellen Zahlen R.
Mengenoperationen
Durch Mengenoperationen lassen sich aus Mengen neue Mengen konstruieren. Im
Folgenden seien M, N Mengen.
• Der Schnitt (oder auch Durchschnitt) von M und N ist
M ∩ N = {x : x ∈ M ∧ x ∈ N },
also x ∈ M ∩ N ⇔ (x ∈ M ∧ x ∈ N ).
15
Beispiele:
1. {n ∈ N : n ist Primzahl} ∩ {n ∈ N : n ≤ 10} = {2, 3, 5, 7}.
2. Zwei Mengen M und N sind genau dann disjunkt, wenn M ∩ N = ∅
ist.
• Die Vereinigung von M und N ist
M ∪ N = {x : x ∈ M ∨ x ∈ N }.
Beispiel: {1, 3, 5, . . .} ∪ {2, 4, 6, . . .} = N.
• Die Differenz von M und N ist
M \ N = {x : x ∈ M ∧ x ∈
/ N }.
Beispiel: R \ {x ∈ R : x > 0} = {x ∈ R : x ≤ 0}.
• Das kartesische Produkt von M und N ist
M × N = {(x, y) : x ∈ M ∧ y ∈ N }.
Hierbei ist (x, y) ein geordnetes Paar: Es gilt
(x, y) = (x0 , y 0 ) ⇔ (x = x0 ∧ y = y 0 ).
• Die Potenzmenge von M ist die Menge aller Teilmengen von M :
P(M ) = {U : U ⊂ M }.
Beispiel: P({1, 2, 3}) = ∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3} .
Das letzte Beispiel zeigt, dass die Elemente von Mengen selbst Mengen sein
dürfen. An dieser Stelle ist ein Wort der Vorsicht angebracht. A priori ist es
nicht ausgeschlossen, dass eine Menge sogar sich selbst als Element enthält. Wir
werden so etwas nicht zulassen. Die uneingeschränkte Bildung von Mengen nach
der Cantorschen Definition würde dazu führen, dass man etwa auch ‘die Menge
aller Mengen’ M betrachten könnte, also M = {M : M ist Menge}. Dann aber
könnten wir auch die folgende Teilmenge konstruieren:
N = {M ∈ M : M ∈
/ M }.
Gilt nun N ∈ N ? Falls ja, so ist N ∈
/ N . Ist andererseits N ∈
/ N , so müsste doch
N ∈ N sein. Widerspruch! Dies ist die Russelsche Antinomie in der Mengenlehre,
16
die die Mathematik zu Beginn des letzten Jahrhunderts in eine Grundlagenkrise gestürzt hat. In dieser Vorlesung werden wir solche problematischen Mengen
allerdings gar nicht betrachten.
Oft ist es nötig, den Schnitt bzw. die Vereinigung mehrerer, eventuell sogar
unendlich vieler Mengen zu bilden. Ist I eine beliebige Menge und ist für jedes i ∈
I eine Menge Mi gegeben, so defniert man den Durchschnitt und die Vereinigung
der Mi durch
\
[
Mi = {x : ∀ i ∈ I : x ∈ Mi },
Mi = {x : ∃ i ∈ I : x ∈ Mi }.
i∈I
i∈I
In diesem Zusammenhang, wenn mehrere mathematische Objekte (hier Mengen)
durch eine Menge I indiziert werden, nennt man I auch eine Indexmenge.
Für den Umgang mit ∩ und ∪ gelten die folgenden Rechenregeln. Im Folgenden seien L, M, N Mengen.
• Kommutativgesetze:
M ∩N =N ∩M
und M ∪ N = N ∪ M.
• Assoziativgesetze:
(L ∩ M ) ∩ N = L ∩ (M ∩ N ) und (L ∪ M ) ∪ N = L ∪ (M ∪ N ),
weshalb man die Klammern auch gleich ganz weglassen darf.
• Distributivgesetze:
L ∩ (M ∪ N ) = (L ∩ M ) ∪ (L ∩ N ) und
L ∪ (M ∩ N ) = (L ∪ M ) ∩ (L ∪ N ).
• De Morgansche Gesetze:
(L \ M ) ∩ (L \ N ) = L \ (M ∪ N ) und
(L \ M ) ∪ (L \ N ) = L \ (M ∩ N ).
Beweis. Wir beweisen exemplarisch das zweite Distributivgesetz:
x ∈ L ∪ (M ∩ N ) ⇔ x ∈ L ∨ x ∈ M ∩ N
⇔ x ∈ L ∨ (x ∈ M ∧ x ∈ N )
⇔ (x ∈ L ∨ x ∈ M ) ∧ (x ∈ L ∨ x ∈ N )
⇔ (x ∈ L ∪ M ) ∧ (x ∈ L ∪ N )
⇔ x ∈ (L ∪ M ) ∩ (L ∪ N ).
(s.u.)
Hier haben wir im dritten Schritt das Distributivgesetz A ∨ (B ∧ C) ⇔ (A ∨ B) ∧
(A ∨ C) ausgenutzt, das man mit einer Wahrheitstafel zeigen kann. (Übung!) 17
Funktionen
Eine Funktion oder Abbildung f von einer Menge M in eine Menge N ordnet
jedem Element von M genau ein Element von N zu. Man schreibt f : M → N
und bezeichnet das x ∈ M zugeordnete Element aus N mit f (x), was man auch
als x 7→ f (x) notiert. Man nennt M den Definitionsbereich von f und N den
Bildbereich oder Wertebereich von f .
Ist M = {x1 , . . . , xn } endlich, so lässt sich eine Funktion durch eine vollständige Liste der Funktionswerte f (x1 ), . . . , f (xn ) angeben. Im Allgemeinen wird eine
Funktion jedoch durch eine Funktionsvorschrift gegeben sein, die f (x) durch einen
Ausdruck in x definiert.
Eine Funktion f : M → N heißt
• injektiv, wenn es zu jedem y ∈ N höchstens ein x ∈ M mit f (x) = y gibt,
d.h.:
∀ x ∈ M ∀ x0 ∈ M : f (x) = f (x0 ) ⇒ x = x0 ,
• surjektiv, wenn es zu jedem y ∈ N mindestens ein x ∈ M mit f (x) = y
gibt, d.h.:
∀ y ∈ N ∃ x ∈ M : y = f (x),
und
• bijektiv, wenn es zu jedem y ∈ N genau ein x ∈ M mit f (x) = y gibt, d.h.
wenn f sowohl injektiv als auch surjektiv ist.
Beispiele:
1. f : N → N, f (x) = x + 1 ist injektiv aber nicht surjektiv.
2. f : Z → Z, f (x) = x + 1 ist bijektiv.
3. f : R → R, f (x) = x3 − x ist surjektiv aber nicht injektiv.
4. f : R → R, x 7→ sin x ist weder injektiv noch surjektiv.
5. f : Q → Q, x 7→ x3 ist injektiv aber nicht surjektiv.
6. f : R → R, x 7→ x3 ist bijektiv.
Der Begriff der Bijektivität, also der ‘eineindeutigen Zuordnung’ gestattet es
insbeondere, die Größe von Mengen zu vergleichen. Wir sagen, dass die Mengen
M und N gleichmächtig sind, wenn es eine Bijektion (d.h. eine bijektive Abbildung) von M nach N gibt. Endliche Mengen sind diejenigen, die gleichmächtig
zu einer Menge {1, 2, . . . , n} für ein n ∈ N sind (und dann gerade n Elemente
haben). Ist eine Menge M gleichmächtig zur Menge der natürlichen Zahlen N, so
nennt man M abzählbar. Eine Menge, die weder endlich noch abzählbar ist, heißt
überabzählbar.
18
Beispiele:
1. {1, 2, 3, 4, 5, 6, 7, 8} und {2, 3, 5, 7, 11, 13, 17, 19} sind gleichmächtig, wie die
Abbildung
1 7→ 2, 2 7→ 3, . . . , 8 7→ 19
zeigt.
2. N0 ist abzählbar, denn f : N → N0 , f (n) = n − 1 ist eine Bijektion.
3. Auch N und Z sind gleichmächtig, denn die Wertetabelle
x
f (x)
1 2
0 1
3 4 5 6 7 ···
−1 2 −2 3 −3 · · ·
definiert eine Bijektion f : N → Z.
S
4. Die Vereinigung n∈N Mn abzählbar vieler abzählbarer Mengen M1 , M2 , . . .
ist wieder abzählbar. Dies lässt sich mit dem ‘ersten Cantorschen Diagonalverfahren’ zeigen. Wir bezeichnen die Elemente
S der i-ten Menge Mi mit
xi1 , xi2 , xi3 , . . .. Dann lassen sich alle Elemnte aus n∈N Mn abzählen, indem
man sie auf die folgende Weise anordnet und der Reihe nach abzählt, wobei
man diejenigen xij überspringt, die nicht zum ersten Mal in dieser Reihe
auftreten. (Gewisse Elemente können ja in mehreren Mi liegen.)
x11
x12
↓ %
x21
x22
.
x31
x32
↓ %
x41
x42
..
..
.
.
→ x13
x14
.
%
x23
x24
%
.
x33
x34
.
x43
x44
..
..
.
.
→ x15 · · ·
.
···
···
···
..
.
5. Q ist abzählbar, wie man mit Hilfe des vorigen Beispiels aus der Darstellung
[
Q=
{ pq : p ∈ Z}
q∈N
erkennt.
6. Für keine Menge M gibt es eine surjektive Abbildung f : M → P(M ).
Wir zeigen dies durch einen Widerspruchsbeweis und nehmen an, dass M
eine Menge und f : M → P(M ) surjektiv ist. Es sei
N = {x ∈ M : x ∈
/ f (x)} ∈ P(M ).
19
Da f surjektiv ist, gibt es ein x0 ∈ M mit f (x0 ) = N . Ist nun x0 ∈ N , so
gilt x0 ∈
/ f (x0 ) = N . Ist andererseits x0 ∈
/ N = f (x0 ), so folgt x0 ∈ N . Das
ergibt den Widerspruch x0 ∈
/ N ∧ x0 ∈ N .
Insbesondere ist P(M ) für jede unendliche Menge sogar überabzählbar.
Ist f : M → N eine Funktion von M nach N , so nennen wir für U ⊂ M
f (U ) = {f (x) : x ∈ U }
= {y ∈ N : ∃ x ∈ U mit y = f (x)}
das Bild von U unter f . Für V ⊂ N heißt
f −1 (V ) = {x ∈ M : f (x) ∈ V }
das Urbild von V unter f .
Für U, U 0 ⊂ M und V, V 0 ⊂ N gelten die folgenden Regeln:
f (U ∪ U 0 ) = f (U ) ∪ f (U 0 ),
f −1 (V ∩ V 0 ) = f −1 (V ) ∩ f −1 (V 0 ),
f −1 (V ∪ V 0 ) = f −1 (V ) ∪ f −1 (V 0 ).
Im Allgemeinen ist jedoch f (U ∩ U 0 ) = f (U ) ∩ f (U 0 ) falsch.
Übung: Beweisen Sie diese Aussagen!
Eine wichtige Operation ist die Verkettung von Funktionen. Sind L, M, N
Mengen und f : L → M , g : M → N Funktionen, so ist die Verkettung (oder
Komposition) von f und g die Funktion
g ◦ f : L → N,
g ◦ f (x) = g(f (x)).
Sie entsteht, indem man zunächst f und auf das Ergebnis dann g anwendet.
Beispiel: Sind f, g : R → R gegeben durch f (x) = x2 und g(x) = sin x, so sind
g ◦ f : R → R und f ◦ g : R → R gegeben durch
g ◦ f (x) = sin(x2 )
und
f ◦ g(x) = (sin x)2 .
Die Verkettung erfüllt das Assoziativgesetz: Sind f : K → L, g : L → M und
h : M → N Funktionen, so gilt
(h ◦ g) ◦ f = h ◦ (g ◦ f ).
Denn für alle x ∈ K gilt
(h ◦ g) ◦ f (x) = (h ◦ g)(f (x)) = h(g(f (x))) = h((g ◦ f )(x)) = h ◦ (g ◦ f ) (x).
20
2.3
Vollständige Induktion
Die vollständige Induktion ist ein besonders wichtiges Beweisprinzip, um Aussagen über natürliche Zahlen zu beweisen. Tatsächlich lässt sich dieses Prinzip
direkt aus einem geeigneten Axiomensystem für die natürlichen Zahlen gewinnen,
was wir hier aber nicht weiterverfolgen wollen.
Ist A(n) ein Satz, der für jede Wahl einer Zahl n ∈ N0 zu einer (wahren oder
falschen) Aussage wird, so betrachtet man oft die Aussage
‘Für alle n ∈ N0 gilt A(n)’, in Formeln: ∀ n ∈ N0 : A(n).
Manchmal interessiert man sich auch nur dafür, ob A(n) ab einem bestimmten
n0 ∈ N0 gilt, also
‘Für alle n ≥ n0 gilt A(n)’, d.h. ∀ n ≥ n0 : A(n),
wobei die letzte Formel abkürzend für ∀ n ∈ {m ∈ N0 : m ≥ n0 } : A(n) steht.
Das Beweisprinzip der vollständigen Induktion besagt nun, dass es, um ∀ n ≥
n0 : A(n) zu beweisen, genügt nachzuweisen, dass
(i) A(n0 ) wahr ist (Induktionsanfang) sowie
(ii) für jedes n ≥ n0 die Gültigkeit von A(n) die Gültigkeit von A(n + 1)
impliziert. (M.a.W.: ∀ n ≥ n0 : A(n) ⇒ A(n + 1).) (Induktionsschritt).
Anstelle A(n) gleich für beliebiges n zu beweisen, schränkt man sich also zunächst
einmal auf den ersten Fall n = n0 ein. Zweitens darf man, um A(n + 1) für beliebiges n ≥ n0 nachzuweisen, annehmen, dass A(n) (die Induktionsvoraussetzung)
schon als wahr erkannt ist.
Dass die fragliche Behauptung hiermit gezeigt ist, erklärt sich so: Zunächst
gilt A(n0 ) nach (i). Wendet man dann (ii) auf den Fall n = n0 an, so erhält man,
dass auch A(n0 + 1) wahr ist. Nun kann man (ii) auf n = n0 + 1 anwenden und
erkennt die Gültigkeit von A(n + 2). Indem man diesen Prozess wiederholt und
(ii) immer wieder auf das nächstgrößere n anwendet, folgt schließlich A(n) für
alle n ≥ n0 .
Man kann sich das wie beim Umwerfen einer Reihe von Dominosteinen (nummeriert durch 0, 1, 2, . . .) vorstellen. Wenn Sie feststellen wollen, ob alle Steine ab
dem n0 -ten fallen, so genügt es, zwei Dinge zu wissen:
(i) Der n0 -te Stein fällt.
(ii) Wenn der n-te Stein fällt, so fällt auch sein Nachfolger mit der Nummer
n + 1.
Ähnlich wie eben sieht man ein, dass sich die Bedingung (ii) abschwächen
lässt zu
21
(ii’) ∀ n ≥ n0 : (A(n0 ) ∧ . . . ∧ A(n)) ⇒ A(n + 1).
Man darf also, um A(n + 1) zu zeigen, annehmen, dass all die Behauptungen
A(n0 ), . . . , A(n) erfüllt sind.
Wir werden nun einige Sätze mit diesem Prinzip beweisen. Zunächst führen
dazu noch die folgenden abkürzenden Notationen ein: Sind m ≤ n ganze Zahlen
und ist für jedes ganze k mit m ≤ k ≤ n eine reelle Zahl ak gegeben, so setzen
wir
n
X
ak = am + am+1 + . . . + an ,
n
Y
sowie
k=m
ak = am · am+1 · . . . · an .
k=m
(Sprich: Die Summe/das Produkt der ak von m bis n.) Ist m = n + 1, so ist es
bisweilen nützlich, für die leere Summe und das leere Produkt
n
X
ak = 0,
bzw.
n
Y
ak = 1
k=m
k=m
zu setzen. Das Produkt der ersten n natürlichen Zahlen nennt man n! (sprich:
n-Fakultät):
n
Y
k.
n! = 1 · 2 · . . . · n =
k=1
Satz 2.1 Für alle n ∈ N gilt
n
X
k=1
k=
n(n + 1)
.
2
Beweis. Mit vollständiger Induktion. Induktionsanfang: Die Behauptung ist richtig für n = 1, denn es ist
1
X
1(1 + 1)
k=1=
.
2
k=1
Induktionsschritt: Wir nehmen an, dass die Behauptung für ein n richtig ist,
also
n
X
n(n + 1)
k=
2
k=1
22
für dieses n gilt. Daraus folgt dann
n+1
X
k=
k=1
n
X
k + (n + 1)
k=1
n(n + 1)
+ (n + 1)
2
n(n + 1) + 2(n + 1)
=
2
(n + 1)(n + 2)
,
=
2
(nach Induktionsvoraussetzung)
=
also die Behauptung für n + 1.
Satz 2.2 (Die geometrische Summenformel) Es sei q ∈ R \ {1}. Für alle
n ∈ N0 gilt
n
X
1 − q n+1
qk =
.
1−q
k=0
Beweis. Mit vollständiger Induktion. Induktionsanfang: Die Behauptung ist richtig für n = 0, denn
0
X
1−q
.
q0 = 1 =
1
−
q
k=0
(q 0 ist immer 1, nach Konvention sogar für q = 0.)
Induktionsschritt: Die Behauptung sei wahr für n. Dann folgt
n+1
X
k
q =
k=0
n
X
q k + q n+1
k=0
1 − q n+1
+ q n+1
(nach Induktionsvoraussetzung)
1−q
1 − q n+1 + q n+1 − q n+2
=
1−q
n+2
1−q
=
,
1−q
=
was gerade die Behauptung für n + 1 ist.
Satz 2.3 Es gibt unendlich viele Primzahlen.
Dem Beweis schicken wir ein Lemma, also einen Hilfssatz voraus:
Lemma 2.4 Jede natürliche Zahl n ≥ 2 ist durch eine Primzahl teilbar.
23
Beweis. Mit vollständiger Induktion. Induktionsanfang: 2 ist eine Primzahl und
natürlich durch sich selbst teilbar.
Induktionsschritt (gemäß (ii’)): Die Behauptung sei für alle 2 ≤ k ≤ n bereits
etabliert. Entweder ist dann n + 1 selbst eine Primzahl, woraus die Behauptung
für n + 1 sofort folgt. Oder es ist n + 1 = km mit 2 ≤ k, m ≤ n. Nach Induktionsvoraussetzung gibt es eine Primzahl, die m teilt und damit auch n + 1 = km.
Beweis von Satz 2.3. Widerspruchsannahme: Es gibt nur endlich viele Primzahlen,
etwa p1 , . . . , pn . Dann aber ist die natürliche Zahl
N =1+
n
Y
pk
k=1
durch keine der Primzahlen p1 , . . . , pn teilbar. (Immer bleibt der Rest 1.) Dies
widerspricht dem vorigen Lemma.
Satz 2.5 Die Anzahl der möglichen Anordnungen einer Menge mit n ∈ N Elementen ist n!.
Erster Beweis. Es gibt n Möglichkeiten, dass erste Element auszuwählen, n −
1 Möglichkeiten, dass zweite Element auszuwählen, n − 2 für das dritte u.s.w.
Schließlich hat man noch zwei Auswahlmöglichkeiten für das vorletzte und nur
eine einzige für das letzte Element. Dies führt zu
n · (n − 1) · (n − 2) · . . . 2 · 1 = n!
möglichen Anordnungen.
Wir haben hier – wie auch schon zuvor mit Pünktchen ‘. . . ’– durch ‘und so
weiter’ angedeutet, dass es klar ist (oder sein sollte), wie das Verfahren Schritt
für Schritt weitergeht. Ganz formal lässt sich dieses Vorgehen mit Hilfe eines
Beweises durch vollständige Induktion begründen.
Zweiter Beweis. Mit vollständiger Induktion. Induktionsanfang: Für n = 1 ist
dies klar, da man eine einelementige Menge nur auf eine Weise anordnen kann
und 1! = 1 ist.
Induktionsschritt: Die Behauptung sei für n-elementige Mengen bewiesen. Ist
nun M = {x1 , . . . , xn+1 } eine (n + 1)-elementige Menge, so kann man die möglichen Anordnungen von M in n + 1 Klassen K1 , . . . , Kn+1 aufteilen, wobei die
Anordnungen der Klasse Kk dadurch charaketrisiert seien, dass sie an der ersten
Stelle das Element xk haben. In jeder Klasse Kk liegen dann so viele Anordnungen, wie es Möglichkeiten gibt, wie verbleibenden n Elemente anzuordnen, also
nach Voraussetzung gerade n!. Insgesamt gibt es also
(n + 1)n! = (n + 1)!
24
Anordnungen von M .
Eine bijektive Abbildung f : M → M einer Menge in sich nennt man auch
eine Permutation von M . Da jede Anordnung (xi1 , xi2 , . . . , xin ) der Elemente von
M = {x1 , . . . , xn } durch
f (x1 ) = xi1 , . . . , f (xn ) = xin
eine Permutation f : M → M definiert und umgekehrt jeder Permutation f :
M → M eine Anordnung (f (x1 ), . . . , f (xn )) entspricht, erhalten wir:
Korollar 2.6 Die Anzahl der Permutationen auf einer n-elementigen Menge ist
n!.
(Ein Korollar ist ein Satz, der – mehr oder weniger – unmittelbar aus einem
anderen Ergebnis folgt.)
Beweis. Klar nach Satz 2.5
Definition 2.7 Für n, k ∈ N0 definieren wir den Binomialkoeffizienten
n
n · (n − 1) · . . . · (n − k + 1)
:=
k
1 · 2 · ... · k
=
k
Y
n−i+1
i=1
i
!
.
Es ist dann
(
0
n
=
n!
k
=
k!(n−k)!
n
n−k
für k > n,
für k ≤ n.
(Mit dem Zeichen := wird ausgedrückt, dass die linke Seite der Gleichung durch
die rechte Seite definiert wird.)
Der Name Binomialkoeffizient rührt daher, dass diese Zahlen als Koeffizienten
im Binomischen Lehrsatz, einer Verallgemeinerung der binomischen Formel auf
höhere Exponenten, auftreten, s. Satz
2.9. Diese Zahlen haben auch in der Kombinatorik eine wichtige Bedeutung: nk ist die Anzahl der k-elementigen Teilmengen
einer n-elementigen Menge.2 Denn zunächst gibt es n · (n − 1) · . . . · (n − k + 1)
Möglichkeiten, k Elemente unter Berücksichtigung der Reihenfolge aus n Elementen auszuwählen3 : n Möglichkeiten für die erste Wahl, dann n − 1 für die zweite
u.s.w. Für das zuletzt gewählte Element bleiben noch (n−k+1) Auswahlmöglichkeiten. Nach Satz 2.5 entspricht nun jede k-Elementige Teilmenge genau k! dieser
Auswahlen, so das sich
Teilmengen tatsächlich
für die Anzahl der k-elementigen
n·(n−1)·...·(n−k+1)
n
n
= k ergibt. Insbesondere ist k immer eine ganze Zahl.
k!
2
Dies kennen Sie vielleicht noch aus der Schule unter dem Namen ‘Kombination ohne Zurücklegen’. In einer Menge kommt es ja nicht auf die Reihenfolge der Elemente an.
3
Dies kennen Sie vielleicht unter dem Namen ‘Variation ohne Zurücklegen’.
25
Lemma 2.8 Für k, n ∈ N0 gilt
n
n
n+1
=
+
.
k+1
k
k+1
Beweis. Für k = n ist die Behauptung 1 = 1 + 0, für k > n lautet sie 0 + 0 = 0,
was beides offensichtlich richtig ist. Für die übrigen Fälle k < n kann man wie
folgt schließen:
n
n
n!
n!
+
=
+
k
k+1
k!(n − k)! (k + 1)!(n − k − 1)!
n!(k + 1)
n!(n − k)
=
+
(k + 1)!(n − k)! (k + 1)!(n − k)!
n!(k + 1 + n − k)
=
(k + 1)!(n − k)!
n+1
(n + 1)!
=
.
=
k+1
(k + 1)!(n − k)!
Die Werte der Binomialkoeffizienten lassen sich im Pascalschen Dreieck anordnen:
1
1
1
1
1
1
.
1
2
3
4
1
3
6
5
10
1
4
10
1
5
..
1
..
.
Dabei findet man nk in der n-ten Zeile an der
k-ten
Position (wobei die Zählung
n
n
bei 0 beginnt). Ganz außen steht wegen 0 = n immer 1. Nach Lemma 2.8
ergeben sich die anderen Einträge als Summe der beiden (schräg) darüber befindlichen Werte.
Satz 2.9 (Binomischer Lehrsatz) Für n ∈ N0 und reelle Zahlen x, y gilt
n X
n k n−k
x y .
(x + y) =
k
k=0
n
Beweis. Mit vollständiger Induktion. Der Fall n = 0 ist klar, denn
0 0 0 0 X n k n−k
(x + y) = 1 =
xy =
x y .
0
k
k=0
0
26
Ist der Satz für ein n ∈ N0 bereits gezeigt, so ergibt sich
(x + y)n+1 = (x + y)(x + y)n
n X
n k n−k
= (x + y)
x y
k
k=0
n n X
X
n k n−k
n k n−k
=x
x y
+y
x y
k
k
k=0
k=0
n n X
X
n k+1 n−k
n k n−k+1
=
x y
+
x y
k
k
k=0
k=0
n+1 n X
X
n
n k n−k+1
k n−k+1
=
x y
+
x y
k−1
k
k=1
k=0
n X
n 0 n+1
n
n
n n+1 0
k n−k+1
=
+
x y
+
x y +
xy
k−1
k
n
0
k=1
n X
n + 1 k n+1−k
n + 1 n+1 0
n + 1 0 n+1
=
x y
+
x y +
xy
k
n
+
1
0
k=1
n+1
X n + 1
=
xk y n+1−k ,
k
k=0
wobei wir im siebten Schritt Lemma 2.8 und die Identitäten nn = 1 =
sowie n0 = 1 = n+1
benutzt haben.
0
Bemerkung. Speziell für x = y = 1 führt dieser Satz auf die Formel
n+1
n+1
n X
n k n−k
x y
= 2n .
k
k=0
Insbesondere besitzt eine n-elementige Menge genau 2n Teilmengen. (Was Sie
sich auch direkt überlegen können.)
27
Kapitel 3
Reelle und komplexe Zahlen
Wir beginnen die eigentliche Analysis nun damit, die grundlegenden Objekte
durch eine ganze Reihe von Axiomen einzuführen: die reellen Zahlen. Dabei werden wir die natürlichen, die ganzen sowie die rationalen Zahlen als Teilmengen
der reellen Zahlen wiedergewinnen. Schließlich werden wir den Zahlbereich auf
die sogennnten komplexen Zahlen ausdehnen.
Das grundlegende Axiom der reellen Zahlen lautet:
Axiom. Es gibt eine Menge, fortan mit R bezeichnet, die den Körperaxiomen,
den Anordnungsaxiomen und dem Vollständigkeitsaxiom genügt.
Diese Begriffe werden nun gleich in den folgenden Kapiteln erklärt. Kurz sagt
man auch: R ist ein vollständiger angeordneter Körper. Die Elemente von R
heißen reelle Zahlen.
3.1
Die Körperaxiome
Die Menge der reellen Zahlen R ist eine Menge auf der zwei innere Verknüpfungen
gegeben sind: Die Addition
R × R → R,
(x, y) 7→ x + y
und die Multiplikation
R × R → R,
(x, y) 7→ x · y
(kurz: x · y = xy).
Diese genügen den folgenden Regeln:
• Axiome der Addition:
(A1) Assoziativgesetz: ∀ x, y, z ∈ R:
x + (y + z) = (x + y) + z.
28
(A2) Kommutativgesetz: ∀ x, y ∈ R:
x + y = y + x.
(A3) Existenz eines additiv neutralen Elements: Es gibt eine Zahl 0 ∈ R
(die Null), so dass für alle x ∈ R gilt
x + 0 = x.
(A4) Existenz eines additiv inversen Elements: Zu jedem x ∈ R gibt es ein
−x ∈ R (das Negative von x) mit
x + (−x) = 0.
• Axiome der Multiplikation:
(M1) Assoziativgesetz: ∀ x, y, z ∈ R:
x(yz) = (xy)z.
(M2) Kommutativgesetz: ∀ x, y ∈ R:
xy = yx.
(M3) Existenz eines multiplikativ neutralen Elements: Es gibt eine Zahl 1 ∈
R (die Eins), so dass für alle x ∈ R gilt
x · 1 = x.
(M4) Existenz eines multiplikativ inversen Elements: Zu jedem x ∈ R \ {0}
gibt es ein x−1 ∈ R (schlicht das Inverse von x) mit
xx−1 = 1.
• Über den Zusammenhang von + und ·:
(N) Für die neutralen Elemente gilt 0 6= 1.
(D) Distributivgesetz: ∀ x, y, z ∈ R:
x(y + z) = (xy) + (xz).
Beachten Sie, dass −x und x−1 lediglich Bezeichnungen für das additiv bzw.
multiplikativ Inverse einer Zahl x sind. Weder haben wir bislang die Subtraktion
noch Potenzen eingeführt. Die Klammern geben an, in welcher Reihenfolge die
inneren Verknüpfungen auszuführen sind. Wie üblich vereinbaren wir dabei die
29
‘Punkt-vor-Strich-Regel’, so dass wir etwa (xy) + (xz) auch einfach als xy + xz
schreiben können. Des Weiteren setzen wir abkürzend
x
x − y := x + (−y)
und
:= x/y := xy −1 .
y
für x, y ∈ R. (Hierdurch werden nun tatsächlich innere Verknüpfungen auf R
bzw. R \ {0} definiert, denn wie wir gleich sehen werden sind −y und y −1 durch
y eindeutig gegeben.)
Bemerkung. Man nennt diese Regeln die Körperaxiome. Jede Menge, auf der
zwei innere Verknüpfungen + und · definiert sind, die diesen Axiomen genügen,
nennt man einen Körper. So ist etwa auch Q ein Körper.
Eine wichtige Konsequenz aus diesen Axiomen ist, dass wir elementare Gleichungen lösen können:
Satz 3.1 Es seien a, b ∈ R.
(i) Die Gleichung a + x = b hat eine eindeutige Lösung. (Nämlich x = b − a.)
(ii) Ist a 6= 0, so hat auch die Gleichung ax = b hat eine eindeutige Lösung.
(Nämlich x = a−1 b.)
Beweis. (i) Tatsächlich ist x = b − a eine Lösung, denn
(A2)
a + (b − a) = a + (b + (−a)) = a + ((−a) + b)
(A1)
(A4)
(A2)
(A3)
= (a + (−a)) + b = 0 + b = b + 0 = b.
Es bleibt, die Eindeutigkeit zu begründen. Dazu zeigen wir, dass beliebige
Lösungen x1 , x2 gleich sein müssen:
a + x1 = b = a + x2
⇒ a + x1 = a + x2
⇒ (−a) + (a + x1 ) = (−a) + (a + x2 )
(A1)
⇒ ((−a) + a) + x1 = ((−a) + a) + x2
(A2)
⇒ (a + (−a)) + x1 = (a + (−a)) + x2
(A4)
⇒ 0 + x1 = 0 + x2
(A2)
⇒ x1 + 0 = x2 + 0
(A3)
⇒ x1 = x2 .
30
(ii) Der Beweis verläuft völlig analog zu (i). Man muss nur ‘+’ durch ‘·’, ‘−a’
durcg ‘a−1 ’ und ‘0’ durch ‘1’ ersetzen und entsprechend die Axiome (M1)–(M4)
verwenden.
Korollar 3.2 (i) Eindeutigkeit der neutralen Elemente: Die Zahlen 0 und 1
sind durch ihre Eigenschaften eindeutig festgelegt.
(ii) Eindeutigkeit der additiven und multiplikativen Inversen: Für jedes a ∈ R
ist −a und für jedes a ∈ R \ {0} ist a−1 eindeutig festgelegt.
Beweis. (i) Ist c eine beliebige Zahl (6= 0), so gilt nach Satz 3.1(i)
c+x=c ⇒ x=0
bzw.
c · x = c ⇒ x = 1.
(ii) Nach Satz 3.1(ii) haben die Gleichungen
a+x=0
bzw.
a·x=1
für a ∈ R bzw. a ∈ R \ {0} eine eindeutige Lösung.
Aus den Körperaxiomen folgen alle Rechenregeln der vier Grundrechenarten.
Wir nennen hier exemplarisch die Folgenden.
Satz 3.3 Für reelle Zahlen x, y gilt:
(i) −(−x) = x,
(ii) −(x + y) = −x − y,
(iii) x · 0 = 0,
(iv) (−x)y = −(xy) = x(−y),
(v) (x−1 )−1 = x
(wenn x 6= 0),
(vi) (xy)−1 = x−1 y −1
(wenn x, y 6= 0),
(vii) xy = 0 ⇔ x = 0 ∨ y = 0.
Beweis. (i) Nach (A4) und (A2) gilt
−x + (−(−x)) = 0
und
− x + x = 0.
Aus der Eindeutigkeit des Negativen von −x folgt daher −(−x) = x.
(ii) Aus (A1)–(A4) folgt
x + y + (−x − y) = x + y + ((−y) + (−x))
= x + (y + (−y)) + (−x) = x + 0 + (−x) = x + (−x) = 0
31
und damit −x − y = −(x + y) aus der Eindeutigkeit des Negativen von x + y.
(iii) Nach (A3) und (D) ist x · 0 = x(0 + 0) = x · 0 + x · 0. Mit Satz 3.1(i)
ergibt sich daraus x · 0 = x · 0 − x · 0 = 0.
(iv) Nach (D), (A4), und (iii) ist
xy + x(−y) = x(y − y) = x · 0 = 0,
also x(−y) = −xy.
Angewandt auf x und y mit vertauschten Rollen folgt dann auch (−x)y =
y(−x) = −(yx) = −(xy), wobei wir (M2) benutzt haben.
(v) Das folgt analog zu (i).
(vi) Das folgt analog zu (ii).
(vii) ‘⇐’: Nach (iii) (und (M2)) ist x · 0 = 0 · y = 0.
‘⇒’: Ist x = 0, so ist nichts zu beweisen. Ist dagegen x 6= 0, so folgt aus xy = 0
mit (M2), (M3), (M4), (M1) und (iii)
y = 1 · y = (x−1 x)y = x−1 (xy) = x−1 · 0 = 0.
Bemerkung. All diese Regeln gelten in einem beliebigen Körper. Ein exotischeres Beispiel für einen Körper – und der kleinstmögliche mit nur zwei Elementen
– ist die Menge {0, 1}, wenn die Addition und die Multiplikation gegeben sind
durch
0 + 0 = 0,
0 · 0 = 0,
0 + 1 = 1,
0 · 1 = 0,
1 + 0 = 1,
1 · 0 = 0,
1 + 1 = 0,
1 · 1 = 1.
Wiederholte Anwendung des Assoziativgesetzes (Induktion!) zeigt, dass jede
mögliche Klammerung in endlichen Summen oder Produkten zum gleichen Ergebnis führt, so dass man die Klammern auch ganz weglassen kann. Das haben
wir schon oben ausgenutzt, indem wir
n
X
ak = am + am+1 + . . . + an
und
k=m
n
Y
ak = am · am+1 · . . . · an
k=m
für am , . . . , an ∈ R geschrieben haben. Wiederholte Anwendung des Kommutativgesetzes zeigt, dass für jede Umordnung (Permutation) (k0 , k1 , . . . , kn−m ) von
(m, m + 1, . . . , n) gilt
n
X
k=m
ak =
n−m
X
aki
sowie
i=0
n
Y
k=m
32
ak =
n−m
Y
i=0
aki .
Für Doppelsummen und -produkte mit Zahlen aij , m ≤ i ≤ n, m0 ≤ j ≤ n0 ist
daher
0
n X
n
X
i=m
0
aij =
j=m0
n X
n
X
j=m0
0
aij
n Y
n
Y
sowie
i=m
i=m
0
aij =
j=m0
n Y
n
Y
j=m0
aij .
i=m
Hier wird die Summe bzw. das Prdukt aller aij gebildet. Da es auf die Reihenfolge
nicht ankommt schreibt man dies auch als
X
Y
aij
bzw.
aij .
m≤i≤n
m0 ≤j≤n0
m≤i≤n
m0 ≤j≤n0
Durch wiederholte Anwendung des Distributivgesetzes schließlich ergibt sich
für Zahlen am , . . . , an und bm0 , . . . , bn0
X
n
n0
X
X
ai
bj =
ai b j .
i=m
j=m0
m≤i≤n
m0 ≤j≤n0
Wir definieren hier noch die ganzzahligen Potenzen:
Definition 3.4 Für x ∈ R und n ∈ N setzt man
x0 := 1,
xn := x
. . · x}
| · .{z
(eigtl. per Induktion: xn+1 := xn x),
n-mal
x−n := (x−1 )n , falls x 6= 0.
Es gelten dann die folgenden Rechenregeln:
Satz 3.5 Für n, m ∈ Z und x, y ∈ R (ungleich 0, wenn der entsprechende Exponent negativ ist) ist
(i) xn xm = xn+m ,
(ii) (xn )m = xnm ,
(iii) xn y n = (xy)n .
Beweis. Übung!
33
3.2
Die Anordnungsaxiome
Mit reellen Zahlen lässt sich nicht nur rechnen, man kann sie auch der Größe
nach vergleichen. Dies wird in den Anordnungsaxiomen formalisiert: In R gibt es
eine Menge R+ ⊂ R, deren Elemente positive Zahlen heißen, mit den folgenden
Eigenschaften:
(O1) Trichotomie: Für jedes x ∈ R gilt genau eine der folgenden Aussagen:
x ∈ R+ ,
−x ∈ R+ .
x = 0,
(O2) Verträglichkeit mit der Addition: Für x, y ∈ R+ ist auch x + y ∈ R+ .
(O3) Verträglichkeit mit der Multiplikation: Für x, y ∈ R+ ist auch xy ∈ R+ .
Statt x ∈ R+ schreiben wir auch x > 0 (sprich: ‘x ist größer als 0’). Gilt −x ∈ R+ ,
so sagen wir, x sei negativ. Allgemeiner setzen wir dann für x, y ∈ R:
x>y
x≥y
x<y
x≤y
:⇔
:⇔
:⇔
:⇔
x − y > 0,
x > y ∨ x = y,
y > x,
y≥x
(sprich:
(sprich:
(sprich:
(sprich:
x
x
x
x
größer y)
größer/gleich y)
kleiner y)
kleiner/gleich y).
Bemerkung. Ein Körper, der den Anordnungsaxiomen (O1), (O2) und (O3)
genügt, heißt angeordneter Körper. Auch Q ist ein solcher.
Beachte: Nach (O1) ist für x 6= y immer entweder x > y oder x < y, denn
entweder ist x − y > 0 oder −(x − y) = y − x > 0.
Es gelten die folgenden Regeln für die Manipulation von Ungleichungen.
Satz 3.6
(i) Für reelle Zahlen x, y, x0 , y 0 gilt
x>y
x≥y
x<y
x≤y
∧
∧
∧
∧
x0
x0
x0
x0
≥ y0
≥ y0
≤ y0
≤ y0
x + x0
x + x0
x + x0
x + x0
⇒
⇒
⇒
⇒
> y + y0,
≥ y + y0,
< y + y0,
≤ y + y0.
(ii) Für x, y, z ∈ R gilt
x>y
x≥y
x>y
x≥y
∧
∧
∧
∧
z
z
z
z
>0
>0
<0
<0
⇒
⇒
⇒
⇒
xz
xz
xz
xz
> yz,
≥ yz,
< yz,
≤ yz.
Entsprechende Aussagen gelten für x < y bzw. x ≤ y.
34
(iii) Für x, y ∈ R gilt
x≥0 ∨ y≥0
xy > 0
⇒
⇔
xy ≥ 0,
(x > 0 ∧ y > 0) ∨ (x < 0 ∧ y < 0).
(iv) Für alle x ∈ R ist x2 ≥ 0. Insbesondere ist 1 > 0.
(v) Für x ∈ R \ {0} ist
x>0
⇔
x−1 > 0.
(vi) Für reelle x, y gilt
⇒
x>y>0
x−1 < y −1 .
Beweis. (i) Wir zeigen nur die beiden ersten Implikationen:
x > y ∧ x0 ≥ y 0 ⇒ x − y > 0 ∧ x0 − y 0 > 0 ∨ x0 = y 0
⇒ x − y > 0 ∧ x0 − y 0 > 0 ∨ x − y > 0 ∨ x0 = y 0
(O2)
⇒ x − y + x0 − y 0 > 0
| {z } | {z }
∈R+
∈R+ ∪{0}
⇒ x + x0 > y + y 0
und
x ≥ y ∧ x0 ≥ y 0 ⇒
(O2)
⇒
x − y > 0 ∨ x = y ∧ x0 − y 0 > 0 ∨ x0 = y 0
x − y + x0 − y 0 > 0 ∨ x = y ∧ x 0 = y
⇒ x + x0 ≥ y + y 0 .
Die anderen beiden Implikationen folgen daraus und der Definition von < und ≤
unmittelbar.
(ii) Es genügt, die erste und die dritte Implikation zu beweisen. Die anderen
ergeben sich daraus direkt, da dann nur noch der Fall x = y zu betrachten bleibt.
Sie folgen aus
x>y∧z >0 ⇒ x−y >0∧z >0
(O3)
⇒ xz − yz = (x − y)z > 0
⇒ xz > yz
35
bzw.
x > y ∧ z < 0 ⇒ x − y > 0 ∧ −z > 0
(O3)
⇒ yz − xz = (x − y)(−z) > 0
⇒ yz > xz.
(iii) Für x, y > 0 ist nach (O3) auch xy > 0. Für x > 0 und y < 0 ist wegen
(O3) −xy = x(−y) > 0 und damit xy < 0. Genauso folgt aus x < 0 und y > 0
auch xy < 0. Sind x, y beide negativ, so folgt wieder mit (O3) xy = (−x)(−y) > 0.
Nach Satz 3.3(vii) ist außerdem xy = 0 ⇔ x = 0 ∨ y = 0. Aus all dem folgen die
Behauptungen.
(iv) Dies folgt aus (iii) mit x = y und 1 = 12 , da nach Axiom (N) 1 6= 0 ist.
(v) Nach (iv) ist xx−1 = 1 > 0. Nach (iii) sind daher x und x−1 beide positiv
oder beide negativ.
(vi) Nach (v) und (O3) ist x−1 y −1 > 0. Mit Hilfe von (ii) für z = x−1 y −1 folgt
dann
y −1 = xx−1 y −1 > yx−1 y −1 = x−1 .
Die Beziehungen ≥ und ≤ definieren eine Ordnungsrelation auf R. Wir formulieren dies im folgenden Satz nur für ≥. Entsprechende Regeln gelten dann
aber (offensichtlich!) auch für ≤.
Satz 3.7 Für alle x, y, z ∈ R gelten:
(i) Reflexivität: x ≥ x,
(ii) Antisymmetrie: x ≥ y ∧ y ≥ x ⇒ x = y,
(iii) Transitivität: x ≥ y ∧ y ≥ z ⇒ x ≥ z.
Beweis. (i) Klar.
(ii) Durch Kontraposition: Wie oben bemerkt gilt x 6= y ⇒ x < y ∨ x > y.
(iii) Aus Satz 3.6 folgt
x ≥ y ∧ y ≥ z ⇒ x + y ≥ y + z ⇒ x = x + y − y ≥ y + z − y = z.
Da für zwei Zahlen x, y immer x ≥ y oder y ≥ x (genauso für ≤) gilt, nennt
man dies auch eine totale Ordnung.
Wir halten fest: Für den Umgang mit den Relationen >, <, ≥ und ≤ gelten
die Ihnen aus der Schule bekannten Regeln. Wir haben sie nun auf eine feste
axiomatische Grundlage gelegt.
36
Definition 3.8 Der Absolutbetrag (oder Betrag) einer Zahl x ist
(
x,
x ≥ 0,
|x| =
−x, x < 0.
Satz 3.9
(i) Für alle x ∈ R gilt
|x| ≥ 0
|x| = 0 ⇔ x = 0.
sowie
(ii) Für alle x ∈ R gilt
| − x| = |x|
|x−1 | = |x|−1 (falls x 6= 0).
sowie
(iii) Für alle x, y ∈ R ist
|xy| = |x| |y|.
(iv) Dreiecksungleichung1 : Für alle x, y ∈ R ist
|x + y| ≤ |x| + |y|.
(v) Umgekehrte Dreiecksungleichung: Für alle x, y ∈ R ist
|x − y| ≥ |x| − |y|.
Beweis. (i) Klar.
(ii) Für x > 0 ist −x < 0 also | − x| = −(−x) = x > 0. Für x ≤ 0 ist −x ≥ 0
also auch | − x| = −x ≥ 0.
Für x > 0 ist nach Satz 3.6(v) auch x−1 > 0 also |x−1 | = x−1 > 0. Für x < 0
ist nach Satz 3.6(v) auch x−1 < 0 also |x−1 | = −x−1 > 0.
(iii) Die Behauptung ist nach (i) klar für x = 0 ∨ y = 0. Für x 6= 0, y 6= 0 gilt
nach Satz 3.6(iii)

xy = |xy|,
falls x > 0, y > 0,



(−x)y = −xy = |xy|,
falls x < 0, y > 0,
|x| |y| =

x(−y) = −xy = |xy|,
falls x > 0, y < 0,



(−x)(−y) = xy = |xy|, falls x < 0, y < 0.
(iv) Wegen x ≤ |x|, y ≤ |y|, −x ≤ |x| und −y ≤ |y| ist
x + y ≤ |x| + |y|
sowie
− (x + y) = −x − y ≤ |x| + |y|.
Dann aber muss auch
|x + y| ≤ |x| + |y|
1
Woher der Name kommt, wird im Abschnitt 3.5 klar werden.
37
gelten.
(v) Wendet man die Dreiecksungleichung auf x − y und y an, so folgt
|x − y| = |x − y| + |y| − |y| ≥ |x − y + y| − |y| = |x| − |y|,
Indem man die Rollen von x und y vertauscht, ergibt sich auch
|x − y| = |y − x| ≥ |y| − |x| = −(|x| − |y|).
Mit diesen beiden Abschätzungen ist dann aber |x − y| ≥ |x| − |y|.
Für x, y ∈ R ist
(
x − y, falls x ≥ y,
.
|x − y| =
y − x, falls y ≥ x,
Man nennt |x − y| daher auch den Abstand von x zu y.
In der Analysis sind Abschätzungen, also Ungleichungen besonders wichtig.
Wir werden im Laufe des Vorlesungszyklus einige nützliche Ungleichungen beweisen. Erste Beispiele geben die beiden folgenden Sätze.
Satz 3.10 (Die Bernoullische Ungleichung) Für alle n ∈ N0 und x ∈ R mit
x ≥ −1 gilt
(1 + x)n ≥ 1 + nx.
Beweis. Mit Induktion: Der Fall n = 0 ist klar. Ist die Behauptung für n gezeigt,
so ergibt sich wegen 1 + x ≥ 0
(1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 + x)
= 1 + nx + x + nx2 ≥ 1 + (n + 1)x.
Satz 3.11 Für das arithmetische Mittel
x+y
2
x<y ⇒ x<
zweier reeller Zahlen x, y gilt
x+y
< y.
2
Beweis. Dies folgt aus
x=
x x
x y
y y
+ < + < + = y.
2 2
2 2
2 2
Zum Schluss dieses Abschnitts führen wir noch eine spezielle Klasse von Teilmengen in R ein: Die Intervalle.
38
Definition 3.12 Für a, b ∈ R mit a < b (bzw. a ≤ b im vierten Fall) setzt man:
(a, b) := {x ∈ R : a < x < b},
[a, b) := {x ∈ R : a ≤ x < b},
(a, b] := {x ∈ R : a < x ≤ b},
[a, b] := {x ∈ R : a ≤ x ≤ b},
(−∞, b) := {x ∈ R : x < b},
(−∞, b] := {x ∈ R : x ≤ b},
(a, ∞) := {x ∈ R : a < x},
[a, ∞) := {x ∈ R : a ≤ x},
(−∞, ∞) := R.
Man nennt diese Mengen Intervalle. In den ersten vier Fällen sagt man, die
Intervalle seien endlich; die übrigen sind unendlich.
Die Intervalle (a, b), (−∞, b), (a, ∞) nennt man offen, [a, b), (a, b] sind halboffen,
[a, b], (−∞, b], [a, ∞) heißen abgeschlossen, (−∞, ∞) ist sowohl offen als auch abgeschlossen.2
Die Länge der endlichen Intervalle ist definiert als
|(a, b)| = |[a, b)| = |(a, b]| = |[a, b]| = b − a.
Beispiel. Für x ∈ R und r ∈ R+ ist
{y ∈ R : |y − x| < r} = (x − r, x + r).
Überlegen Sie sich das!
3.3
Zum Aufbau des Zahlensystems
Bisher haben wir mit den Mengen N, Z, Q und – zumindest vor Kapitel 3 –
auch mit R ‘naiv’, also wie aus der Schule bekannt gerechnet. Wir wollen diese
Zahlbereiche nun auf eine gefestigte axiomatische Grundlage stellen, wobei nur
die bisher eingeführten Axiome von R verwendet werden. Sie müssen also für
diesen Abschnitt zunächst vergessen, was die natürlichen, ganzen und rationalen
Zahlen sind und was wir über diese Zahlen schon bewiesen haben. Wir definieren
diese Zahlbereiche dann hier als gewisse Teilmengen von R. Die Regeln für das
Rechnen und Anordnen übertragen sich direkt auf diese Mengen. Insbesondere
werden wir aus den Axiomen für R das Induktionsprinzip für N ableiten. Mit
diesem Wissen können sie dann noch einmal zurückblättern, sich wieder an alles
erinnern und feststellen, dass sich auch die schon früher gezeigten Aussagen aus
den Axiomen für R beweisen lassen.
2
Die Begriffe offen und abgeschlossen werden später noch für viel allgemeinere Mengen definiert werden.
39
Definition 3.13 Eine Menge M ⊂ R heißt induktiv, wenn gilt:
(i) 1 ∈ M und
(ii) a ∈ M ⇒ a + 1 ∈ M .
Beispiel. R, R+ , {x ∈ R : x ≥ 1} sind induktiv.
LemmaT3.14 Ist (Mi )i∈I eine Familie von induktiven Mengen, so ist auch der
Schnitt i∈I Mi induktiv.
T
T
Beweis. Wegen 1 ∈ Mi für alle i ∈ I gilt auch 1 ∈ i∈I Mi . Ist a ∈ i∈I Mi , so
gilt a ∈ TMi für jedes i und somit auch a + 1 ∈ Mi für jedes i, also in der Tat
a + 1 ∈ i∈I Mi .
Definition 3.15 Die Menge N der natürlichen Zahlen ist
\
M.
N :=
M induktiv
D.h.: N ist der Durchschnitt aller induktiven Mengen in R und also Teilmenge
einer jeden induktiven Menge. Nach dem vorigen Lemma ist N selbst induktiv.
Das Induktionsprinzip lässt sich nun so formulieren:
Satz 3.16 (Induktionsprinzip) Ist M ⊂ N induktiv, so gilt M = N.
Direkt aus den obigen Beispielen sieht man, dass N ⊂ R+ ist, so dass natürliche Zahlen positiv sind, und dass sogar N ⊂ {x ∈ R : x ≥ 1} gilt. 1 ist also die
kleinste natürliche Zahl.
Um eine Aussage A(n) für natürlich Zahlen zu beweisen, setzt man dann
einfach M = {n ∈ N : A(n) stimmt}. (Um eine Aussage der Form ∀ n ≥ n0 : A(n)
zu beweisen, betrachtet man M = {n ∈ N : n < n0 ∨ (n ≥ n0 ∧ A(n))}.)
Beweis von Satz 3.16. Nach Voraussetzung ist M ⊂ N. Da M induktiv ist, gilt
aber auch N ⊂ M . Es folgt M = N.
Die Summen- und Produktbildung führt nicht aus N hinaus:
Satz 3.17 Die Summe m + n und das Produkt mn zweier natürlicher Zahlen
m, n ist wieder eine natürliche Zahl.
Man sagt auch, N sei bezüglich + und · abgeschlossen.
Beweis. 1. Summen: Ist n ∈ N gegeben, so betrachten wir M = {m ∈ N : n+m ∈
N}. Da N induktiv ist und somit n + 1 ∈ N ist, gilt 1 ∈ M . Aus demselben Grund
folgt
m ∈ M ⇒ n + m ∈ N ⇒ n + m + 1 ∈ N ⇒ m + 1 ∈ M.
M ⊂ N ist also induktiv, d.h. M = N.
40
2. Produkte: Es sei für festes n ∈ N nun M = {m ∈ N : nm ∈ N}. Offenbar
ist 1 ∈ M . Da – wie schon gezeigt – Summen nicht aus N hinausführen, ist zudem
m ∈ M ⇒ nm ∈ N ⇒ n(m + 1) = nm + n ∈ N ⇒ m + 1 ∈ M.
Dies zeigt M = N.
Dass N tatsächlich so beschaffen ist, wie wir das gewohnt sind, und sich der
Größe nach anordnen lässt durch
1 < 2 := 1 + 1 < 3 := 1 + 1 + 1 + . . . ,
wird im folgenden Satz präzisiert.
Satz 3.18 Für alle n ∈ N gilt: Es gibt kein m ∈ N mit n < m < n + 1.
Beweis. Wir zeigen dies, indem wir nachweisen, dass
M = {n ∈ N : Es gibt kein m ∈ N mit n < m < n + 1}
induktiv ist.
1. Die Menge M1 = {1} ∪ {x ∈ R : x ≥ 2 = 1 + 1} ist induktiv: Offenbar gilt
1 ∈ M1 . Ist x ∈ M1 , so ist entweder x = 1 und damit 1 + 1 = 2 ∈ M1 oder x ≥ 2
und daher auch x + 1 ≥ 2. Das zeigt N ⊂ M1 , so dass zwischen 1 und 2 keine
natürliche Zahl liegt: Es gilt 1 ∈ M .
2. Wir überlegen uns zunächst, dass für jedes n ∈ N die folgende Aussage
richtig ist: n = 1 oder n − 1 ∈ N. Dies folgt wieder daraus, dass die fragliche
Menge
M2 = {n ∈ N : n = 1 ∨ n − 1 ∈ N}
induktiv ist: Es ist 1 ∈ M2 und n ∈ M2 impliziert (trivialerweise) n ∈ N. Dann
aber ist n + 1 ∈ N und (n + 1) − 1 = n ∈ N, also auch n + 1 ∈ M2 .
3. Es sei nun n ∈ M . Wäre n + 1 ∈
/ M , so gäbe es ein m ∈ N mit n + 1 <
m < n + 2. Wegen m > n + 1 ∈ N muss m 6= 1 sein. Nach 2. ist dann aber auch
m − 1 ∈ N, wobei n < m − 1 < n + 1 ist. Dies widerspricht n ∈ M .
Aus diesem Satz nun lässt sich das Wohlordnungsprinzip der natürlichen Zahlen gewinnen.
Satz 3.19 (Wohlordnungsprinzip) Jede nicht leere Menge natürlicher Zahlen
besitzt ein kleinstes Element
Beweis. Um einen Widerspruchsbeweis zu führen, nehmen wir an, dass es eine
Menge M ⊂ N, M 6= ∅, gibt, die kein kleinstes Element besitzt. D.h.: Es gibt
kein m ∈ M mit m ≤ x für alle x ∈ M . Definiere
L = {n ∈ N : n ≤ x für alle x ∈ M }.
41
L ist induktiv: 1 ∈ L ist klar. Es sei nun n ∈ L und insbesondere n ≤ x für alle
x ∈ M . Es gilt n ∈
/ M , denn sonst wäre n ein kleinstes Element von M . Da es
nach Satz 3.18 kein Element von M zwischen n und n + 1 geben kann, muss dann
auch n + 1 ∈ L gelten. Damit ist L als induktiv nachgewiesen, d.h. L = N. Da
M nicht leer ist, gibt es ein x0 ∈ M . Wegen x0 + 1 ∈ N folgt der Widerspruch
x0 + 1 ≤ x0 .
Die übrigen Zahlbereiche ergeben sich aus N nun wie folgt:
Definition 3.20 Es seien
(i) N0 := N ∪ {0} die natürlichen Zahlen mit 0,
(ii) Z := N ∪ {0} ∪ {−n : n ∈ N} die Menge der ganzen Zahlen und
(iii) Q := { pq : p ∈ Z, q ∈ Z \ {0}} die Menge der rationalen Zahlen.
Es ist nicht schwer zu sehen, dass die Summen- und Produktbildung in N0 ,
Z bzw. Q nicht aus den jeweiligen Mengen hinausführt. Z enthält mit jeder Zahl
auch ihr Negatives, Q enthält mit jeder Zahl bzw. jeder von 0 verschiedenen Zahl
auch deren Negatives bzw. Inverses.
Bemerkung. Diese Mengen lassen sich in jedem angeordneten Körper definieren.
3.4
Das Vollständigkeitsaxiom
Wir benötigen noch ein letztes Axiom, das – anschaulich gesagt – garantiert, dass
R ‘keine Löcher hat’. Wir formulieren es erst und erklären die dabei auftretenden
Begriffe gleich im Anschluss. Das Vollständigkeitsaxiom besagt:
(V) In R besitzt jede nach oben beschränkte nicht leere Teilmenge ein Supremum.
Definition 3.21 Es sei M ⊂ R.
(i) a ∈ R heißt
– obere Schranke für M , wenn für alle x ∈ M gilt x ≤ a,
– untere Schranke für M , wenn für alle x ∈ M gilt x ≥ a.
(ii) Besitzt M eine obere (oder untere) Schranke, so nennt man M nach oben
(bzw. nach unten) beschränkt. Ist M nach oben und nach unten beschränkt,
so heißt M schlicht beschränkt.
(iii) a ∈ R heißt
– Supremum von M , wenn a obere Schranke von M ist und für jede
obere Schranke a0 von M gilt a ≤ a0 ,
42
– Infimum von M , wenn a untere Schranke von M ist und für jede untere
Schranke a0 von M gilt a ≥ a0 .
Wir schreiben dann a = sup M bzw. a = inf M .
Ein Supremum nennt man daher auch kleinste obere Schranke, ein Infimum
auch größte untere Schranke von M . Beachten Sie: Ein Supremum bzw. Infimum,
so es denn existiert, muss nicht in der Menge M selbst liegen. Äquivalent zu (V)
hätte man auch die Existenz eines Infimums für nach unten beschränkte Mengen
fordern können, wie sich gleich aus Satz 3.24 ergeben wird.
Nicht jede Teilmenge von R hat eine obere bzw. untere Schranke. (Z.B. gibt
es für R selbst kein a ∈ R mit x ≤ a für alle x ∈ R.) Es gilt aber:
Lemma 3.22 Ist M ⊂ R nach oben (nach unten) beschränkt, so ist das Supremum (bzw. Infimum) von M eindeutig.
Beweis. Sind a1 und a2 Suprema von M , also insbesondere obere Schranken, so
gilt a1 ≤ a2 und a2 ≤ a1 . Dies zeigt a1 = a2 . Analog argumentiert man für Infima.
Dieses Lemma rechtfertigt auch die Schreibweisen sup M und inf M . Wir vereinbaren noch, sup M = +∞ für nicht nach oben, inf M = −∞ für nicht nach
unten beschränkte M zu schreiben und für die leere Menge sup ∅ = −∞ sowie
inf ∅ = +∞ zu setzen. +∞ und −∞ zwar sind keine reellen Zahlen. Fügt man
diese Größen den reellen Zahlen hinzu, so erhält man den erweiterten Zahlbereich
R = R ∪ {−∞, +∞}. Auch auf R lässt sich – mit Vorsicht!! – rechnen, was wir
hier aber nicht vertiefen wollen. Die Ordnungsrelationen jedoch lassen sich leicht
auf R erweitern, indem man +∞ > x und −∞ < x für alle x ∈ R definiert.
Definition 3.23 Es sei M ⊂ R eine nach oben (unten) beschränkte Menge. Gilt
sup M ∈ M (bzw. inf M ∈ M ) so schreiben wir auch sup M = max M (bzw.
inf M = min M ) und nennen diesen Wert das Maximum (Minimum) von M .
Beispiele.
1. Endliche Intervalle sind beschränkt. Für reelle a < b ist
inf(a, b) = inf[a, b) = inf(a, b] = inf[a, b] = a,
sup(a, b) = sup[a, b) = sup(a, b] = sup[a, b] = b.
(Dies gilt für die in diesem Fall definierten Intervalle auch noch für a, b ∈ R.)
Für reelle a < b ist
min[a, b) = min[a, b] = a
und
max(a, b] = max[a, b] = b.
Die übrigen Suprema/Infima sind keine Maxima/Minima.
43
2. Jede endliche Menge reeller Zahlen ist beschränkt und besitzt ein Minimum
sowie ein Maximum.
3. N ist nicht nach oben beschränkt. Ansonsten gäbe es nach (V) eine kleinste
obere Schranke x0 ∈ R für N. Da mit n auch n + 1 natürlich ist, gilt dann
für alle n ∈ N auch n + 1 ≤ x0 , also n ≤ x0 − 1. Auch x0 − 1 ist damit eine
obere Schranke von N im Widerspruch zur Minimalität von x0 .
4. Die Menge M = {x ∈ Q : x2 ≤ 2} ist nach oben beschränkt, etwa durch 2.
(x > 2 ⇒ x2 > 4 > 2.) Wegen 1 ∈ M gilt 1 ≤ sup M ≤ 2.
2
Bemerkung.
√ Im letzten Beispiel wird sich zeigen, dass (sup M ) = 2 (also
sup M = 2) ist. Im Körper Q selbst hat diese Menge kein Supremum. Dies
zeigt, dass Q nicht vollständig ist.
Für M ⊂ R sei −M = {x ∈ R : −x ∈ M }.
Satz 3.24 (i) a ist obere Schranke für M ⊂ R genau dann, wenn −a eine
untere Schranke für −M ist.
(ii) a ist Supremum von M genau dann, wenn −a Infimum von −M ist.
Beweis. (i) Dies folgt aus
∀ x ∈ M : x ≤ a ⇔ ∀ x ∈ M : −x ≥ −a ⇔ ∀ y ∈ −M : y ≥ −a.
(ii) Ist a = sup M , so ist −a nach (i) eine untere Schranke für −M . Ist auch r
eine solche, so ist wiederum nach (i) −r eine obere Schranke von M = −(−M ).
Dann aber ist −r ≥ a und somit r ≤ −a. Damit ist −a = inf M nachgewiesen.
Die Umkehrung folgt analog.
Satz 3.25 Für alle x, y ∈ R mit x, y > 0 gibt es ein n ∈ N mit nx > y.
Beweis. Anderenfalls wäre xy eine obere Schranke von N.
Bemerkung Man bezeichnet die Aussage dieses Satzes auch als das archimedische Axiom. In unserem Axiomensystem ist es eine Folgerung aus den Körper-,
Anordnungs- und Vollständigkeitsaxiomen. Ohne (V) muss Satz 3.25 nicht gelten.
Einen angeordneten Körper, in dem dieser Satz gilt, nennt man auch archimedisch
angeordnet.
Korollar 3.26
(i) Für jedes ε > 0 gibt es ein n ∈ N, so dass 0 <
1
n
< ε gilt.3
(ii) Ist q > 1, so gibt es für jedes K > 0 ein n ∈ N mit q n > K.
3
Genauer natürlich: Für jedes ε ∈ R mit ε > 0 . . . . – Im Folgenden lassen wir das ‘∈ R’
bisweilen weg und verabreden, dass in Ausdrücke wie ‘Sei x > 0’ oder ‘Für alle x > 0’ o.ä. x
als reell vorausgesetzt wird, wenn es nicht ausdrücklich anders spezifiziert ist.
44
(iii) Ist 0 < q < 1, so gibt es für jedes ε > 0 ein n ∈ N mit 0 < q n < ε.
Beweis. (i) Wähle n > 1ε .
(ii) Schreibt man q = 1 + x, so folgt aus der Bernoullischen Ungleichung
q n = (1 + x)n ≥ 1 + nx > nx. Die Behauptung stimmt also für n ≥ Kx .
(iii) Nach (ii) gibt es ein n ∈ N mit q1n = ( 1q )n > 1ε , also (0 <) q n < ε.
Der folgende Satz besagt, dass Q in R ‘dicht liegt’, obwohl es – wie wir in
Satz 3.30 sehen werden – ‘viel mehr’ reelle als rationale Zahlen gibt.
Satz 3.27 Ist x ∈ R, so gibt es zu jedem ε > 0 ein r ∈ Q mit |x − r| < ε.
Beweis. Wir zeigen, dass es zu jedem x ∈ R und q ∈ N ein p ∈ Z gibt mit
|x − pq | ≤ 1q . Nach Korollar 3.26 folgt hieraus die Behauptung.
Für x = 0 ist das klar. Für x > 0 sei p das minimale Element in {p ∈ N : x ≤
p
}, welches nach Satz 3.19 ja existiert. Falls p > 1 ist, muss dann p−1
< x ≤ pq
q
q
gelten. Ist p = 1, so ist 0 < x ≤ 1q . In jedem Fall folgt |x − pq | < 1q .
Für x < 0 wähle p ∈ N mit | − x − pq | < 1q , so dass dann |x − −p
| < 1q ist. q
Korollar 3.28 Zu x1 , x2 ∈ R mit x1 < x2 gibt es ein r ∈ Q mit x1 < r < x2 .
2
Beweis. Wähle r ∈ Q mit | x1 +x
− r| <
2
x2 −x1
.
2
Dann ist tatsächlich
x2 − x1 x 2 − x1
x1 + x2 x2 − x1
+
>−
+
= 0,
2
2
2
2
x2 − x 1 x1 + x2
x2 − x1 x2 − x1
x2 − r =
+
−r >
−
= 0.
2
2
2
2
r − x1 = r −
Eine weitere wichtige Konsequenz aus (V) ist der folgende Existenzsatz über
Elemente in ineinandergeschachtelten Intervallen.
Satz 3.29 (Intervallschachtelungsprinzip) Es seien I1 , I2 , I3 , . . . endliche abgeschlossene Intervalle mit I1 ⊃ I2 ⊃ I3 ⊃ . . ..
T
(i) Dann ist n∈N In 6= ∅.
(ii) Gibt es für jedes ε ∈ R mit T
ε > 0 ein n ∈ N, so dass |In | < ε gilt, so gibt
es genau eine reelle Zahl in n∈N In .
Beweis. (i) Ist In = [an , bn ], so gilt
a1 ≤ a2 ≤ a3 ≤ . . . ≤ b 3 ≤ b 2 ≤ b 1 .
Da also A = {a1 , a2 , . . .} (etwa durch b1 ) nach oben beschränkt und B = {b1 , b2 , . . .}
(etwa durch a1 ) nach unten beschränkt ist, existieren sup A und inf B. Da jedes
45
bn obere Schranke von A ist, gilt auch sup A ≤ bnTfür alle n ∈ N. Das aber zeigt,
dass für alle n gilt sup A ∈ [an , bn ], also sup A ∈ n∈N
T In .
0
(ii) Gäbe es zwei verschiedene Punkte x, x ∈ n∈N In , so wählen wir ε =
|x − x0 |. Nach Voraussetzung gibt es ein n mit |In | < ε. Anderereits folgt aus
x, x0 ∈ In auch |In | ≥ |x − x0 | = ε. Widerspruch.
Bemerkung. Die Aussage von Satz 3.29 ist – auf der Basis der übrigen Axiome – sogar äquivalent zum Vollständigkeitsaxiom (V). Man hätte also ebensogut
die Aussage dieses Satzes zu einem Axiom erklären können und dann die Supremumseigenschaft nach oben beschränkter Mengen als Satz beweisen können.
Als Anwendung dieses Satzes zeigen wir, dass R (im Gegensatz zu Q) ‘viel
größer’ als N ist:
Satz 3.30 R ist überabzählbar.
Beweis. Es genügt zu zeigen, dass keine Abbildung von N nach R surjektiv ist.
Zu f : N → R definieren dazu induktiv:
• I1 ⊂ [0, 1] sei ein abgeschlossenes Intervall der Länge
1
3
mit f (1) ∈
/ I1 .
• Ist In schon gewählt, so nehmen wir In+1 ⊂ In als abgeschlossenes Intervall
/ In+1 .
der Länge 31n mit f (n + 1) ∈
I1 kann man hierbei als eines der Intervalle [0, 13 ] oder [ 23 , 1] wählen, die ja nicht
beide f (1) enthalten können. Ist In = [an , an + 31n ] schon konstruiert, so wählen
1
2
wir als In+1 etwa dasjenige der Intervalle [an , an + 3n+1
], [an + 3n+1
, an + 31n ], das
f (n + 1) nicht enthält.
T
Für jedes n ist dann f (n) ∈
/ k∈N Ik , obwohl diese Menge nicht leer ist. f ist
also nicht surjektiv.
2
Wir können nun auch endlich garantieren, dass die Gleichung x = 2 in R
lösbar ist. Allgemein gilt:
Satz 3.31 Zu jeder reellen Zahl y ≥ 0 und jedem k ∈ N gibt es genau ein reelles
x ≥ 0 mit xk = y.
Bemerkung. Wir werden dies gleich mit Hilfe einer Intervallschachtelung und
damit mehr oder weniger direkt aus den Axiomen von R ableiten. Später, wenn
wir schon wesentlich mehr Theorie entwickelt haben werden, wird sich dieser Satz
in wenigen Zeilen beweisen lassen.
Wir schicken dem Beweis die folgende Übungsaufgabe voraus:
Übung. Für a, b ∈ R, n ∈ N gilt
n
n
b −a = b−a b
n−1
+b
n−2
a + . . . + ba
n−2
+a
n−1
n−1
X
n−1−k k
= (b − a)
b
a .
k=0
46
Beweis von Satz 3.31. Es sei zunächst y > 1. Wir konstruieren eine Intervallschachtelung I1 = [a1 , b1 ] ⊃ I2 = [a2 , b2 ] ⊃ . . ., so dass für alle n ∈ N gilt
akn ≤ y ≤ bkn
sowie
|In+1 | = 12 |In |.
Dazu definieren wir die In induktiv mit dem Intervallhalbierungsverfahren:
Für n = 1 setzen wir [a1 , b1 ] = [1, y], so dass ak1 = 1k ≤ y ≤ y k = bk1 gilt.
Ist In mit den geforderten Eigenschaften schon definiert, so setzen wir
(
n
n k
[an , an +b
], falls ( an +b
) ≥ y,
2
2
In+1 = an +bn
an +bn k
[ 2 , bn ], falls ( 2 ) < y.
Dann genügt auch In+1 den geforderten Bedingungen.
1
Induktiv ergibt sich, dass |In | = 2n−1
|I1 | ist, womit nach Korollar 3.26(ii)
zu jedem
ε > 0 ein n ∈ N mit |In | < ε existiert. Gemäß Satz 3.29 gibt es ein
T
x ∈ n∈N In .
Wir betrachten nun die Intervalle Jn = [akn , bkn ]. Offensichtlich ist Jn+1 ⊂ Jn
für alle n. Indem man n ∈ N zu gegebenem ε > 0 mit ( 21 )n−1 < kbεk wählt, was
1
nach Korollar 3.26(ii) möglich ist, lässt sich die Länge von Jn abschätzen durch
|Jn | = bkn − akn
k−2
= (bn − an )(bnk−1 + bk−2
+ ak−1
n an + . . . + b n an
n )
1
ε
1
kbk = ε.
≤ n−1 kbkn ≤ n−1 kbk1 <
2
2
kbk1 1
Nun ist wegen x ∈ In für alle n auch xk ∈ Jn für alle n. Nach Konstruktion
gilt aber auch y ∈ Jn für alle n. Gemäß Satz 3.29(ii) muss dann aber xk = y
gelten.
Die behauptete Eindeutigkeit ist einfacher zu sehen: Für alle x0 > 0 mit x0 6= x
gilt entweder x0 < x und somit auch (x0 )k < xk = y oder aber x0 > x und somit
auch (x0 )k > xk = y.
Im Fall 0 < y < 1 folgt die Behauptung nun aus dem schon Gezeigten und
der Beobachtung xk = y ⇔ (x−1 )k = y −1 . Die Fälle y = 0 und y = 1 schließlich
sind trivial.
Definition 3.32 Ist y ∈ R nicht negativ, k ∈ N, so nennt man die eindeutige
√
reelle Zahl x ≥ 0 mit xk = y die k-te Wurzel von y und schreibt x = k y oder
1
√
auch x = y k . Für k = 2 schreibt man auch nur x = y.
Wir bemerken noch, dass die k-ten Wurzeln die folgende Monotonieeigenschaft
besitzen:
√
√
k
0 ≤ y1 < y2 ⇒
y1 < k y2 .
47
Dies ergibt sich einfach durch Kontraposition, denn
√
√
( k y1 )k ≥ ( k y2 )k = y2 (Induktion nach k).
√
√
k y ≥ k y
1
2 impliziert y1 =
Übung. Zeigen
Sie, dass für die Menge M aus Beispiel 4 von Seite 44 tatsächlich
√
sup M = 2 ist.
Bemerkung. Zum Ende dieses Abschnitts bemerken wir noch, dass R ‘bis auf
Isomorphie’ als vollständiger angeordneter Körper eindeutig ist. D.h.: Ist etwa R̃
ein weiterer vollständiger angeordneter Körper, so gibt es eine (eindeutige) Bijektion R → R̃, die sämtliche Strukturen erhält. (Das Bild einer Summe ist die
Summe der Bilder, genauso für Produkte, die neutralen und inversen Elemente in
R werden auf die entsprechenden in R̃ abgebildet, die Anordnungsrelation bleibt
erhalten u.s.w.) Von unserem Standpunkt lassen sich R und R̃ schlicht nicht unterscheiden. Obwohl der Beweis nicht allzu schwierig ist, verzichten wir darauf,
ihn hier anzugeben, da er für das Folgende nicht von Belang ist. Eine Selbstverständlichkeit ist dies jedoch nicht. Schließlich mussten wir bis zum letzten
Axiom (V) warten, um endlich R und Q unterscheiden zu können.
3.5
Die komplexen Zahlen
In den natürlichen Zahlen allein kann man nicht uneingeschränkt subtrahieren:
Die elementare Gleichung
a+x=b
besitzt selbst für a, b ∈ N nicht immer eine Lösung x ∈ N. In Z dagegen ist sie
lösbar – sogar für alle a, b ∈ Z. Die Gleichung
(a 6= 0)
ax = b
ist jedoch auch in Z im Allgemeinen nicht lösbar. Wohl aber in Q – sogar für
alle a, b ∈ Q (a 6= 0). Auch Q jedoch genügt unseren Ansprüchen noch nicht,
da es nicht vollständig ist und insbesondere im Allgemeinen keine Lösungen der
Gleichung
x2 = b
(b ≥ 0)
zulässt. Selbst in R gibt es nun immer noch elementare Gleichungen, die keine
Lösungen besitzen:
x2 = −1
kann für keine reelle Zahl x gelten, da ja immer x2 ≥ 0 und −1 < 0 ist.
Dennoch möchten wir in der Mathematik diese Gleichung lösen können – aus
vielerlei Gründen, die sich Ihnen so richtig wohl erst dann erschließen, wenn Sie
im Laufe Ihres Studiums sehen, was man damit machen kann. Dies führt uns
zum Zahlbereich der komplexen Zahlen. Mathematiker haben schon recht lange
mit diesen Zahlen gerechnet. Bevor sie von Gauß und Hamilton im vorletzten
48
Jahrhundert auf eine theoretisch fundierte Grundlage gestellt wurden, wurden
damit schon Gleichungen gelöst, die im Reellen keine Lösung besitzen.
Für quadratische Gleichungen
x2 + px + q = 0
etwa lassen sich mit der ‘Mitternachts-’ oder ‘p-q-Formel’ die Lösungen als
p
−p ± p2 − 4q
x1,2 =
2
angeben. Ist p2 − 4q ≥ 0, so sind diese Lösunen reell. Im Fall p2 − 4q < 0 lässt
sich dies mit einer ‘imaginären Einheit’ i, für die i2 = −1 ist, unformen zu
p
|p2 − 4q|
p
i,
x1,2 = − ±
2
2
√ 2
|p −4q|
p
eine Zahl mit einem ‘Realteil’ − 2 und einem ‘Imaginärteil’ ±
.
2
Wir werden solche Zahlen nun – ohne das Imaginationsvermögen überzustrapazieren – ganz formal als Paare reeller Zahlen einführen.
Definition 3.33 Der Körper der komplexen Zahlen C ist die Menge R × R mit
den inneren Verknüpfungen
(i) Addition:
(x1 , y1 ) + (x2 , y2 ) := (x1 + x2 , y1 + y2 ),
(ii) Multiplikation:
(x1 , y1 ) · (x2 , y2 ) := (x1 x2 − y1 y2 , x1 y2 + x2 y1 ).
Die Addition ist hier nichts Anderes als die Vektoraddition in der Ebene, die Sie
evtl. aus der Schule kennen. Wir werden gleich sehen, was es mit der Multiplikation auf sich hat.
Satz 3.34 C ist ein Körper.
Beweis. Die Köperaxiome (A1), (A2), (A3), (M1), (M2), (M3), (N) und (D)
bestätigt man durch einfaches Nachrechnen, wobei die Null durch (0, 0) und die
Eins durch (1, 0) gegeben ist. Ebenso rechnet man leicht nach, dass das Negative
von z = (x, y) durch −z = (−x, −y) sowie das Inverse von z = (x, y) 6= (0, 0)
durch
1 x
−y =
,
.
z
x2 + y 2 x2 + y 2
49
gegeben ist.
Speziell für komplexe Zahlen der Form (x1 , 0), (x2 , 0) gilt
(x1 , 0) + (x2 , 0) = (x1 + x2 , 0)
(x1 , 0) · (x2 , 0) = (x1 x2 , 0).
und
Dies erlaubt es, die reellen Zahlen mit der Teilmenge {(x, 0) : x ∈ R} von C zu
identifizieren. (Ganz formal: Die Abbildung x 7→ (x, 0) vermittelt einen Isomorphismus zwischen den Körpern R und {(x, 0) : x ∈ R}, d.h. sie ist bijektiv und mit
der Körperstruktur (den inneren Verknüpfungen) verträglich.) Wir dürfen daher
die Elemente der Form (x, 0) selbst als reelle Zahlen betrachten und einfach mit
x bezeichnen.
Definition 3.35 Es sei z = (x, y) ∈ C.
(i) Man nennt Re z = x den Realteil von z.
(ii) Man nennt Im z = y den Imaginärteil von z.
(iii) Ist Im z = 0, so heißt z reell, ist Re z = 0, so heißt z rein imaginär.
(iv) Die rein imaginäre Zahl i = (0, 1) heißt die imaginäre Einheit.
Wegen i2 = (−1, 0) = −1 sind z = ±i Lösungen der Gleichung z 2 + 1 = 0.
Damit haben wir nun einerseits unser Ausgangsproblem gelöst. Auf der anderen
Seite impliziert dieser Zusammenhang, dass C nicht angeordnet werden kann, da
ja in jedem angeordneten Körper von 0 verschiedene Quadrate positiv sind. In C
sind jedoch sowohl 1 = 12 als auch −1 = i2 Quadrate.
Für gewöhnlich schreibt man die komplexen Zahlen nicht explizit als Paare
reeller Zahlen, sondern nutzt die Darstellung
(x, y) = (x, 0) + (0, 1) · (y, 0) = x + iy
als Summe des Realteils und des Produkts des Imaginärteils mit der imaginären
Einheit. – Dann muss man sich die Regeln zur Summen- und Produktregel nicht
auswendig merken; sie ergeben sich automatisch aus i2 = −1: Für x1 , y1 , x2 , y2 ∈
R ist
(x1 + iy1 ) + (x2 + iy2 ) = (x1 + x2 ) + i(y1 + y2 ),
(x1 + iy1 ) · (x2 + iy2 ) = x1 x2 + ix1 y2 + iy1 x2 + i2 y1 y2
= (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ).
(Und aus diesem Grund haben wir diese Operationen natürlich genau so definiert.)
50
Definition 3.36 Es sei z = x + iy ∈ C (x, y ∈ R).
(i) Die zu z konjugiert komplexe Zahl ist z := x − iy.
p
√
(ii) Der Betrag von z ist |z| := zz = x2 + y 2 .
(In (ii) haben wir (x+iy)(x−iy) = x2 −(iy)2 = x2 +y 2 ausgenutzt. Beachte, dass
(ii) mit unserer früheren Definition des Betrags einer reellen Zahl übereinstimmt,
wenn z reell ist.)
Die Konjugation erfüllt die folgenden Eigenschaften:
Satz 3.37 Es seien z, z1 , z2 ∈ C.
(i) z = z,
(ii) z1 + z2 = z1 + z2 ,
(iii) z1 z2 = z1 z2 ,
(iv) Re z = 12 (z + z),
(v) Im z =
1
(z
2i
− z).
Beweis. (i) und (ii) sind klar.
(iii) Ist z1 = x1 + iy1 , z2 = x2 + iy2 (x1 , y1 , x2 , y2 ∈ R), so gilt
z1 z2 = x1 x2 − y1 y2 + i(x1 y2 + x2 y1 ) = x1 x2 − y1 y2 − i(x1 y2 + x2 y1 )
= x1 x2 − (−y1 )(−y2 ) + i x1 (−y2 ) + x2 (−y1 ) = z1 z2 .
(iv, v) Mit z = x + iy ist
1
(z + z) =
2
1
(z − z) =
2i
1
(x + iy + x − iy) = x = Re z
und
2
1
x + iy − (x − iy) = y = Im z.
2i
Für den Betrag ergeben sich die folgenden Regeln:
Satz 3.38 Es seien z, z1 , z2 ∈ C.
(i) |z| ≥ 0 und |z| = 0 ⇔ z = 0.
(ii) |z| = |z|,
(iii) | Re z| ≤ |z| und | Im z| ≤ |z|,
51
(iv) |z1 z2 | = |z1 ||z2 |,
(v) Dreiecksungleichung: |z1 + z2 | ≤ |z1 | + |z2 |.
(vi) Umgekehrte Dreiecksungleichung: |z1 − z2 | ≥ |z1 | − |z2 |.
Beweis. Es sei z = x + iy (x, y ∈ R).
p
(i) Klar, da |z| = x2 + y 2 ≥ 0 und |z| = 0 ⇔ x = y = 0 ⇔ z = 0.
p
p
(ii) Dies folgt aus |z| = x2 + y 2 = x2 + (−y)2 = |z|.
(iii) Aus der Monotonieeigenschaft der Wurzel folgt
p
√
sowie
| Re z| = |x| = x2 ≤ x2 + y 2 = |z|
p
p
| Im z| = |y| = y 2 ≤ x2 + y 2 = |z|.
(iv) Dies folgt nach Wurzelziehen aus
|z1 z2 |2 = z1 z2 z1 z2 = z1 z1 z2 z2 = |z1 |2 |z2 |2 .
(v) Nach (iii), (iv) und (ii) ist
|z1 + z2 |2 = (z1 + z2 )(z1 + z2 ) = z1 z1 + z1 z2 + z2 z1 + z2 z2
= |z1 |2 + z1 z2 + z1 z2 +|z2 |2 ≤ |z1 |2 + 2|z1 z2 | + |z2 |2
| {z }
=2 Re(z1 z2 )
2
= |z1 | + 2|z1 ||z2 | + |z2 |2 = (|z1 | + |z2 |)2 .
Die Behauptung folgt nun durch Wurzelziehen.
(vi) Dies folgt genauso wie im reellen Fall direkt aus der Dreiecksungleichung
(vgl. Satz 3.9(v)).
Da man C nicht anordnen kann, ist es nicht sinnvoll, obere oder untere Schranken für Teilmengen von C definieren zu wollen. Man kann jedoch von beschränkten Mengen sprechen:
Definition 3.39 Eine Menge M ⊂ C komplexer Zahlen heißt beschränkt, wenn
die Menge {|z| : z ∈ M } in R beschränkt ist. (D.h.: Wenn ein c ∈ R mit |z| ≤ c
für alle z ∈ M existiert.)
Man kann sich die komplexen Zahlen in der Gaußschen Zahlenebene R × R
veranschaulichen. z = x + iy ∈ C ist dann der Punkt (x, y), so dass dem xAchsenabschnitt der Realteil und dem y-Achsenabschnitt der Imaginärteil von
z entspricht. (Man spricht daher hier auch von der ‘reellen’ bzw. ‘imaginären
Achse’.) In dieser Interpretation ist z gerade der an der reellen Achse gespiegelte Punkt z. Die Addition ist dann – wie schon bemerkt – die Addition von
ebenen Vektoren. Alternativ kann man den z darstellenden Vektor auch durch
seine Länge r = |z| und den mit der reellen Achse eingeschlossenen Winkel φ
52
beschreiben. Dies ist die sogenannte Polardarstellung, die wir später noch ganz
sauber definieren werden. Es gilt dann
x = r cos φ
und
y = r sin φ.
Im Vorgriff hierauf – und ohne dies im Folgenden auszunutzen, bevor wir die
folgenden Rechnungen gerechtfertigt haben, – gehen wir auf diese vor allem auch
für die Anschauung nützliche Darstellung kurz ein.
Sind z1 = x1 + iy1 , z2 = x2 + iy2 komplexe Zahlen mit entsprechenden Beträgen r1 bzw. r2 und Winkeln φ1 bzw. φ2 , so ist nach den trigonometrischen
Additionstheoremen
z1 z2 = (r1 cos φ1 + ir1 sin φ1 )(r2 cos φ2 + ir2 sin φ2 )
= r1 r2 cos φ1 cos φ2 − sin φ1 sin φ2 + i(cos φ1 sin φ2 + cos φ2 sin φ1 )
= r1 r2 (cos(φ1 + φ2 ) + i sin(φ1 + φ2 )).
Das heißt: Bildet man das Produkt zweier komplexer Zahlen, so werden die Beträge multipliziert und die Winkel zur reellen Achse addiert. Hält man w ∈ C
mit Betrag r und Winkel φ fest, so ist die Abbildung C → C, z 7→ wz eine Drehstreckung: z = (x, y) wird um den Faktor r gestreckt und dann um den Winkel
φ gedreht. Speziell für w = i (mit r = 1 und φ = 90◦ ) ergibt sich eine Drehung
um 90◦ .
Nun wird auch endlich klar, woher der Name Dreiecksungleichung für die
Beziehung |z1 + z2 | ≤ |z1 | + |z2 | für komplexe Zahlen z1 , z2 stammt. In einem
Dreieck mit den Eckpunkten 0, z1 und z1 + z2 ist die Seite zwischen 0 und z1 + z2
der Länge |z1 + z2 | höchstens so groß wie die Summe der beiden anderen Seiten
zwischen 0 und z1 der Länge |z1 | und zwischen z1 und z1 + z2 der Länge |z2 |.
53
Kapitel 4
Folgen und Reihen
Ein zentrales Konzept in der Analysis ist der Begriff des Grenzwerts. Hierdurch
wird in mathematisch rigoroser Weise formalisiert, was eine ‘beliebig genaue Approximation’ ist. Dabei werden wir in diesem Kapitel untersuchen, was es heißt
eine Zahl durch eine (abzählbar unendliche) Folge von Zahlen beliebig gut zu
approximieren.
4.1
Folgen und Grenzwerte
Definition 4.1 Es sei M eine Menge. Eine Abbildung von N nach M (oder auch
von N0 nach M ) heißt eine Folge in M .
Ist M = R bzw. M = C, so spricht man auch von einer reellen bzw. komplexen
Folge.
Folgen schreibt man meist nicht in der Form f : N → M , n 7→ f (n). Stattdessen notiert man eine Folge N → M mit n 7→ an als (an )n∈N oder auch
(a1 , a2 , . . .), manchmal auch einfach als (an ). Die an nennt man die Folgenglieder der Folge (an ). Bisweilen bezeichntet man allgemeiner auch Abbildungen
{m, m + 1, m + 2, . . .} → M , n 7→ an als Folgen, wenn m irgendeine ganze Zahl
ist. Dies notiert man dann mit (an )n≥m . Da wir uns im Folgenden nur für das
asymptotische Verhalten von Folgen interessieren, auf das endliche Abschnitte zu
Beginn der Folge keinen Einfluss haben, ergeben sich hierfür im Folgenden keine
wesentlichen Unterschiede.
Beispiele.
1. Für M = N ist die Folge der ungeraden Zahlen
(1, 3, 5, . . .) = (2n − 1)n∈N .
2. Die harmonische Folge ist die reelle Folge
1
1 1
= 1, , , . . . .
n n∈N
2 3
54
3. Für an = 2−n ist
1 1 1
(an )n∈N0 = 1, , , , . . . .
2 4 8
4. Eine komplexe Folge ist z.B.
(in )n∈N0 = (1, i, −1, −i, 1, i, −1, −i, 1, . . .).
5. Für beliebiges z ∈ C ist
(z n )n∈N0 = (1, z, z 2 , z 3 , . . .)
eine sogenannte geometrische Folge.
P
6. Für xn = nk=1 9 · 10−k ist1
(xn )n∈N = (0.9, 0.99, 0.999, . . .).
Wir betrachten nun Folgen mit Werten in R oder C. Sie dürfen – und sollen,
wenn sie mit den komplexen Zahlen noch nicht völlig vertraut sind, – sich im
Folgenden beim ersten Lesen immer auf den reellen Fall konzentrieren. (In diesem
Fall müssen sie sich beim zweiten Lesen dann jedoch noch den komplexen Fall
klar machen.)
Definition 4.2 Es sei (an )n∈N eine reelle (oder komplexe) Folge. (an ) konvergiert
gegen a ∈ R (oder C), wenn gilt:
∀ ε > 0 ∃ N ∈ N ∀ n ≥ N : |an − a| < ε.
(D.h.: Für jedes ε > 0 gibt es einen (von ε abhängigen) Index N ∈ N, so dass für
alle n ≥ N die Bedingung |an −a| < ε erfüllt ist.) Man schreibt dann limn→∞ an =
a oder auch an → a (für n → ∞). Ist a = 0, so nennt man (an )n∈N auch eine
Nullfolge.
Konvergiert (an ) gegen eine Zahl, so heißt (an ) konvergent. Konvergiert (an )
nicht, so sagt man (an ) divergiert oder sei divergent.
Nochmal: an → a heißt: Zu beliebig vorgelegtem ε > 0 dürfen die an für hinreichend große n ∈ N nicht weiter als ε von a entfernt liegen.
Äquivalente Formulierung: Für jedes ε > 0 gilt |an − a| < ε für fast alle
n ∈ N. (D.h. für alle n ∈ N mit endlich vielen Ausnahmen.)
Beispiele.
1. Ist (an )n∈N eine konstante Folge mit an = a für alle n ∈ N, so gilt limn→∞ an =
a.
Klar, denn für jedes ε > 0 und alle n ∈ N ist |an − a| = 0 < ε.
1
Die Dezimaldarstellung werden wir später noch exakt einführen.
55
2. limn→∞
1
n
= 0.
Denn zu ε > 0 gibt es nach dem archimedischen Axiom ein N ∈ N mit
1
< ε (vgl. Korollar 3.26(i)). Dann aber ist für n ≥ N
N
1 1 ≤ < ε.
n
N
3. Die Folge (in )n∈N0 divergiert.
Denn wäre limn→∞ in = z, so müsste für ε = 1 ein N ∈ N mit |in − z| < 1
für alle n ≥ N existieren. Dann aber wäre nach der Dreiecksungleichung
2 > |iN +2 − z| + |iN − z| ≥ |iN +2 − iN | = |iN ||i2 − 1| = | − 1 − 1| = 2.
4. Die Folge ((−1)n )n∈N0 divergiert.
Das sieht man ähnlich wie im vorigen Beispiel. (Übung!)
5. Allgemein gilt: Die Folge (z n )n∈N0 konvergiert für |z| < 1 gegen 0 und für
z = 1 gegen 1. Anderenfalls divergiert sie.
Für |z| < 1 gibt es zu jedem ε > 0 nach Korollar 3.26(iii) nämlich ein
N ∈ N mit |z|N < ε. Dann aber ist auch
|z n | = |z|n ≤ |z|N < ε ∀ n ≥ N.
Der Fall z = 1 folgt direkt aus 1.
Ist nun |z| ≥ 1 und z 6= 1, so kann (z n ) nicht gegen ein w ∈ C konvergieren.
Anderenfalls gäbe es zu ε = |z−1|
(> 0) ein N ∈ N mit |z n − w| < ε für alle
2
n ≥ N . Dann aber wäre (Dreiecksungleichung)
|z − 1| = 2ε > |z N +1 − w| + |w − z N | ≥ |z N +1 − w + w − z N |
= |z N +1 − z N | = |z N ||z − 1| = |z|N |z − 1| ≥ |z − 1|.
Der folgende Satz rechtfertigt es, im Falle der Existenz von dem Grenzwert
einer Folge zu sprechen.
Satz 4.3 Der Grenzwert einer konvergenten reellen (oder komplexen) Folge ist
eindeutig.
Beweis. Wäre dies nicht der Fall, so gäbe es eine (reelle oder komplexe) Folge
(an )n∈N mit an → a und an → a0 für n → ∞ für zwei verschiedene a und a0 . Dann
0|
> 0, so dass N ∈ N und N 0 ∈ N mit
aber ist ε = |a−a
2
|an − a| < ε ∀ n ≥ N
und
|an − a0 | < ε ∀ n ≥ N 0
existieren. Für n ≥ max{N, N 0 } ergibt sich hieraus der Widerspruch
|a − a0 | = |a − an + an − a0 | ≤ |an − a| + |an − a0 | < ε + ε = |a − a0 |.
56
Satz 4.4 Eine konvergente reelle (oder komplexe) Folge ist beschränkt.
Beweis. Gilt limn→∞ an = a, so wählen wir N ∈ N, so dass für alle n ≥ N gilt
|an − a| < 1. Für diese n ist dann 1 > |an − a| ≥ |an | − |a| nach der umgekehrten
Dreiecksungleichung und damit |an | ≤ |a| + 1. Setzt man nun
c = max{|a1 |, . . . , |aN −1 |, |a| + 1},
so gilt tatsächlich |an | ≤ c für alle n ∈ N.
Bemerkung. Die Umkehrung dieser Behauptung ist falsch! Z.B. ist ((−1)n )n∈N
beschränkt aber divergent.
Der folgende Satz fasst wichtige Grenzwertsätze zusammen.
Satz 4.5 (Grenzwertsätze für Folgen) Es seien (an )n∈N und (bn )n∈N konvergente reelle (oder komplexe) Folgen. Dann gilt:
(i) Auch (an ± bn )n∈N ist konvergent und es ist
lim an ± bn = lim an ± lim bn .
n→∞
n→∞
n→∞
(ii) Auch (an bn )n∈N ist konvergent und es ist
lim an bn = lim an lim bn .
n→∞
n→∞
n→∞
(iii) Gilt bn 6= 0 für alle n und limn→∞ bn 6= 0, so ist auch ( abnn )n∈N konvergent
mit
lim an
an
= n→∞ .
lim
n→∞ bn
lim bn
n→∞
Bemerkung. Gilt limn→∞ bn = b 6= 0, so gibt es zu ε = |b| ein N mit |bn | ≥
|b| − |bn − b| > |b| − ε = 0 für n ≥ N . Es können also höchstens endlich viele der
bn gleich 0 sein. Da dies für das Grenzwertverhalten nicht von Belang ist, können
wir in (iii) auf die Bedingung bn 6= 0 für alle n auch verzichten. (Zumindest wenn
wir uns nicht daran stören, dass die Folgenglieder abnn ggf. nur für hinreichend
große n erklärt sind.)
Beweis. Es seien limn→∞ an = a und limn→∞ an = b.
(i) Zu ε > 0 gibt es N ∈ N und N 0 ∈ N mit
|an − a| <
ε
2
∀n ≥ N
und
|bn − b| <
ε
2
∀ n ≥ N 0.
Für n ≥ max{N, N 0 } ergibt sich hieraus
|an + bn − (a + b)| ≤ |an − a| + |bn − b| <
57
ε ε
+ = ε,
2 2
wie gewünscht.
(ii) Nach Satz 4.4 gibt es ein C > 0 mit |bn | ≤ C für alle b ∈ N. Wir wählen
nun N ∈ N und N 0 ∈ N mit
|an − a| <
ε
2C
∀n ≥ N
|bn − b| <
und
ε
1 + 2|a|
∀ n ≥ N 0.
Für n ≥ max{N, N 0 } ist dann
|an bn − ab| = |an bn − abn + abn − ab| ≤ |an bn − abn | + |abn − ab|
ε
ε
ε ε
= |bn ||an − a| + |a||bn − b| < C
+ |a|
≤ + = ε.
2C
1 + 2|a|
2 2
(iii) Nach (ii) genügt es
Gilt b 6= 0, so gibt es zu
1
bn
|b|
2
→ 1b zu zeigen.
ein N ∈ N mit
|bn | = |b − (b − bn )| ≥ |b| − |bn − b| > |b| −
|b|
|b|
=
2
2
für n ≥ N . Zu gegebenem ε > 0 gibt es außerdem ein N 0 ∈ N mit |bn − b| <
für n ≥ N 0 . Ist nun n ≥ max{N, N 0 }, so folgt
|b|2 ε
2
1
1 |b − bn |
|b|2 ε/2
<
= ε.
− =
bn
b
|bn b|
|b|2 /2
Beispiele.
1. Wendet man Satz 4.5 speziell mit einer konstanten Folge bn = c für alle n
an, so ergibt sich für eine konvergente Folge (an )
lim c an = c lim an .
n→∞
n→∞
2. Nach den Grenzwertsätzen ist
1 + 6n−3 − 3n−5
n7 + 6n4 − 3n2
=
lim
n→∞ 3 + n−1 − 2n−7
n→∞ 3n7 + n6 − 2
3
5
lim 1 + 6 lim n1 − 3 lim n1
n→∞
n→∞
= n→∞
7
1
lim 3 + lim n − 2 lim n1
lim
n→∞
n→∞
n→∞
1 + 6 · 03 − 3 · 05
1
=
= .
7
3+0−2·0
3
Beachte hierbei, dass die Anwendung der Grenzwertsätze gerechtfertigt ist,
da alle auftretenden Limites existieren und der Nenner nicht verschwindet.
58
Bei der Untersuchung von Folgen ist es – wie wir sehen werden – oft nützlich, aus einer Folge eine neue Folge zu generieren, indem man einfach einige
Folgenglieder weglässt. Genauer:
Definition 4.6 Es sei (an )n∈N eine Folge und (nk )k∈N eine Folge natürlicher
Zahlen mit n1 < n2 < . . .. Dann ist die Folge (ank )k∈N (also k 7→ ank ) eine
Teilfolge von (an )n∈N .
Beispiele.
1. Die Folge (2,4,6,. . . ) der geraden Zahlen ist eine Teilfolge der Folge (1, 2, 3, . . .)
aller natürlichen Zahlen.
2. Für nk = 2k erhält man aus ( n1 )n∈N die Teilfolge ( 21k )k∈N .
Satz 4.7 Konvergiert (an ) gegen a, so gilt auch limk→∞ ank = a für jede Teilfolge
(ank ).
Beweis. Das ist (fast) klar: Für jedes ε > 0 gilt |an − a| < ε für fast alle n, erst
recht also |ank − a| < ε für fast alle k.
Definition 4.8 Es sei (an ) eine reelle (oder komplexe) Folge. a ∈ R (oder C)
heißt Häufungspunkt von (an ), wenn es eine Teilfolge (ank ) von (an ) gibt, die
gegen a konvergiert.
Eine äquivalente Formulierung gibt der folgende Satz an:
Satz 4.9 a ist Häufungspunkt der reellen (oder komplexen) Folge (an ) genau
dann, wenn es für jedes ε > 0 unendlich viele Indizes n mit |an − a| < ε gibt.
Beweis. ⇒: Klar: Gilt etwa ank → a, so gibt es zu ε > 0 ein K ∈ N mit |ank −a| < ε
für alle (unendlich vielen) k ≥ K.
⇐: Wir definieren natürliche Zahlen n1 < n2 < . . . wie folgt induktiv. Zunächst
wählen wir n1 mit |an1 −a| < 1. Ist nun nk schon definiert, so wählen wir nk+1 > nk
1
. Da unendlich viele Folgenglieder dieser Abschätzung
mit |ank+1 − a| < k+1
genügen, ist dies möglich.
Zu gegebenem ε > 0 gibt es nun ein K ∈ N mit K1 < ε. Für k ≥ K ist
dann |ank − a| < k1 ≤ K1 < ε. Dies zeigt, dass limk→∞ ank = a gilt, a also ein
Häufungspunkt von (an ) ist.
Beispiele.
1. Die Häufungspunkte der Folge (an )n∈N mit
(
3 + n1 , n ungerade,
an =
0,
n gerade,
sind 0 und 3.
59
2. Die Häufungspunkte der komplexen Folge (in )n∈N sind 1, i, −1 und −i.
3. Es sei q1 , q2 , . . . eine Nummerierung der rationalen Zahlen, also Q = {q1 , q2 , . . .}.
Dann ist die Menge der Häufungspunkte der Folge (qn )n∈N ganz R. (Überlegen Sie sich das!)
4.2
Reelle Folgen und Monotonie
Wir untersuchen nun speziell reelle Folgen und die Konsequenzen, die sich durch
Größenvergleiche auf den Grenzwertprozess ergeben.
Satz 4.10 Es seien (an ) und (bn ) konvergente reelle Folgen mit an ≤ bn für alle
n ∈ N. Dann gilt auch limn→∞ an ≤ limn→∞ bn .
Beweis. Setze a = limn→∞ an , b = limn→∞ bn . Wäre a > b, so gäbe es zu ε =
natürliche Zahlen N und N 0 mit
|an − a| < ε für alle n ≥ N
und
a−b
2
|bn − b| < ε für alle n ≥ N 0 .
Für n = max{N, N 0 } führt dies zum Widerspruch
a − b = a − an + an − bn +bn − b ≤ |a − an | + |b − bn | < 2ε = a − b.
| {z }
≤0
Beachten Sie: Aus an < bn folgt im Allgemeinen nicht limn→∞ an < limn→∞ bn .
Gegenbeispiel: an = 0 und bn = n1 für n ∈ N.
Korollar 4.11 Es seien (an ) eine konvergente reelle Folge und a0 , a00 ∈ R mit
a0 ≤ an ≤ a00 für alle n ∈ N. Dann gilt auch a0 ≤ limn→∞ an ≤ a00 .
Beweis. Dies folgt sofort aus Satz 4.10, angewandt auf (an ) und die konstanten
Folgen (a0 ) und (a00 ).
Durch Größenvergleich lassen sich auch neue Konvergenzkriterien gewinnen:
Satz 4.12 (Einschnürungssatz) Es seien (an ), (bn ) und (xn ) reelle Folgen mit
limn→∞ an = limn→∞ bn = x und an ≤ xn ≤ bn für alle n ∈ N. Dann gilt auch
limn→∞ xn = x.
Beweis. Übungsaufgabe!
Eine wichtige Klasse von Folgen besteht aus solchen, deren Folgenglieder der
Größe nach angeordnet sind. Für diese Folgen lässt sich – wie wir gleich sehen
werden – erstens ein besonders einfaches Kriterium für die Konvergenz angeben. Zweitens gewinnt man hieraus ein für viele theoretische Untersuchungen
grundlegendes Existenzresultat auch für allgemeinere Folgen. Drittens schließlich
umfasst diese Klasse viele interessante Anwendungen, was wir schon im folgenden
Abschnitt 4.4 bei der absoluten Konvergenz von Reihen ausnutzen werden
60
Definition 4.13 Eine reelle Folge (an )n∈N heißt
(i) monoton wachsend, wenn an ≤ an+1 für alle n ∈ N gilt,
(ii) streng monoton wachsend, wenn an < an+1 für alle n ∈ N gilt,
(iii) monoton fallend, wenn an ≥ an+1 für alle n ∈ N gilt, und
(iv) streng monoton fallend, wenn an > an+1 für alle n ∈ N ist.
Eine Folge (an ) ist also genau dann (streng) monoton fallend, wenn (−an )
(streng) mononoton wächst.
Satz 4.14 Jede beschränkte monoton wachsende (bzw. fallende) Folge (an ) konvergiert. Es gilt
lim an = sup{an : n ∈ N}
n→∞
(bzw. lim an = inf{an : n ∈ N}).
n→∞
Da eine monoton wachsende (fallende) Folge (an ) durch a1 immer nach unten
(oben) beschränkt ist, hätte es auch genügt zu fordern, dass (an ) nach oben
(unten) beschränkt ist.
Beweis. 1. Es seien (an ) beschränkt und monoton wachsend, a = sup{an : n ∈ N}.
Ist ε > 0, so ist a − ε keine obere Schranke von {an : n ∈ N}, so dass ein N ∈ N
mit aN > a − ε existiert. Da (an ) monoton wächst, gilt dann aber auch
an ≥ a − ε ∀ n ≥ N.
Andererseits ist an ≤ a < a + ε sogar für alle n. Damit ist
a − ε < an < a + ε ∀ n ≥ N,
so dass an → a folgt.
2. Ist (an ) beschränkt und monoton fallend, so folgt nach 1.
lim (−an ) = sup{−an : n ∈ N} = − inf{an : n ∈ N},
n→∞
also in der Tat limn→∞ an = inf{an : n ∈ N}.
Satz 4.15 Jede reelle Folge besitzt eine monotone Teilfolge.
Beweis. Für eine reelle Folge (an ) setze
M = {n ∈ N : für alle k ≥ n gilt ak ≥ an }.
Fall 1: M ist unbeschränkt. Dann gibt es unendlich viele n1 , n2 , . . . ∈ M mit
n1 < n2 < . . .. Nach Konstruktion ist ank+1 ≥ ank , so dass die Teilfolge (ank )
monoton wächst.
Fall 2: M ist beschränkt. Wähle dann n1 > sup M und induktiv nk+1 > nk mit
ank+1 < ank . (Dies ist möglich, da nk > sup M , also nk ∈
/ M ist.) Die Teilfolge
(ank ) fällt dann (sogar streng) monoton.
Das folgende Korollar, ist eine wichtige(!) Existenzaussage in der Analysis.
61
Korollar 4.16 (Satz von Bolzano-Weierstraß (für reelle Folgen)) Jede beschränkte reelle Folge besitzt eine konvergente Teilfolge.
Beweis. Klar nach den Sätzen 4.15 und 4.14.
Konvergiert eine reelle Folge deshalb nicht, weil ihre Folgenglieder ‘gegen +∞
oder gegen −∞ streben’, spricht man von uneigentlicher Konvergenz oder bestimmter Divergenz. Genauer:
Definition 4.17 Eine Folge (an ) mit Werten in R∪{−∞, +∞} heißt uneigentlich
konvergent gegen +∞ (oder −∞), wenn es zu jedem K > 0 ein N ∈ N gibt mit
an ≥ K
(bzw. an ≤ −K) ∀ n ≥ N.
Man schreibt dann auch limn→∞ an = +∞ bzw. limn→∞ an = −∞.
Statt von uneigentlicher Konvergenz spricht man auch von bestimmter Divergenz
gegen +∞ bzw. −∞.
Beispiele.
1. limn→∞ −2n + 1 = −∞.
2. Es sei (an )n∈N eine Folge mit an > 0 (bzw. an < 0) für alle n. Genau dann
ist (an )n∈N eine Nullfolge, wenn ( a1n )n∈N bestimmt gegen +∞ (bzw. −∞)
divergiert.
Übung: Zeigen Sie dies!
3. Es sei x ∈ R. Die Folge (xn )n∈N
– konvergiert für −1 < x ≤ 1 (vgl. Beispiel 5 auf Seite 56),
– konvergiert uneigentlich gegen +∞ für x > 1 und
– divergiert (nicht bestimmt) für x ≤ −1.
Übung: Zeigen Sie dies!
Satz 4.18 Jede monotone Folge ist entweder konvergent oder uneigentlich konvergent.
Beweis. Es sei (an ) monoton wachsend. Ist (an ) nach oben beschränkt, so folgt
die Behauptung aus Satz 4.14. Ist (an ) nach oben unbeschränkt, so gibt es zu
jedem K > 0 ein N ∈ N mit aN > K. Aus der Monotonie folgt dann aber auch
an > K
∀ n ≥ N.
Ist (an ) monoton fallend, so ist (−an ) nach dem eben Gezeigten konvergent oder
uneigentlich konvergent, also auch (an ) selbst. Schließlich bemerken wir, dass
eine Folge offensichtlich nicht zugleich konvergieren und uneigentlich konvergieren
kann.
Wir führen nun noch ein Konzept ein, dass es uns erlaubt, das asymptotische
Verhalten einer möglicherweise divergenten reellen Folge genauer zu untersuchen.
62
Definition 4.19 Es sei (an ) eine reelle Folge.
(i) Der Limes superior von (an ) ist
lim sup an := lim sup{ak : k ≥ n}.
n→∞
n→∞
(ii) Der Limes inferior von (an ) ist
lim inf an := lim inf{ak : k ≥ n}.
n→∞
n→∞
Statt lim sup schreibt man auch lim , statt lim inf auch lim .
n→∞
n→∞
n→∞
n→∞
Beachte, dass die Folge (sup{ak : k ≥ n})n∈N monoton fällt. (Mit wachsendem n wird das Supremum über immer kleinere Mengen gebildet.) Der Limes
dieser Folge existiert also im eigentlichen oder uneigentlichen Sinne. Genauso
konvergiert (inf{ak : k ≥ n})n∈N als monoton wachsende Folge eigentlich oder
uneigentlich. Im Gegensatz zum Limes existieren der Limes inferior und der Limes superior einer jeden Folge!
Beispiele.
1. Es gilt
lim inf (−1)n = −1
und
n→∞
lim sup(−1)n = 1.
n→∞
2. Ist (an )n∈N gegeben durch
(
3 + n1 , n ungerade,
an =
− n12 ,
n gerade,
so ist lim supn→∞ an = 3 und lim inf n→∞ an = 0.
Satz 4.20 Es sei (an ) eine reelle Folge.
(i) Genau dann gilt limn→∞ an = a, wenn
lim sup an = lim inf an = a
n→∞
n→∞
ist.
(ii) Ist (an )n∈N beschränkt und bezeichnet H die Menge der Häufungspunkte von
(an ), so gilt
max H = lim sup an
und
n→∞
63
min H = lim inf an .
n→∞
Beweis. Übung!
Zum Schluss dieses Abschnitts notieren wir noch das Satz 4.10 entsprechende
Ergebnis für lim inf und lim sup:
Satz 4.21 Es seien (an ) und (bn ) reelle Folgen mit an ≤ bn für alle n ∈ N. Dann
gilt auch
lim inf an ≤ lim inf bn
n→∞
n→∞
und
lim sup an ≤ lim sup bn .
n→∞
n→∞
Beweis. Dies folgt sofort aus Satz 4.10, indem man beobachtet, dass inf{ak : k ≥
n} ≤ inf{bk : k ≥ n} sowie sup{ak : k ≥ n} ≤ sup{bk : k ≥ n} für jedes n ∈ N
gilt.
4.3
Konsequenzen der Vollständigkeit
Besonders wichtig für die Analysis sind die Konsequenzen für die Untersuchung
von Folgen, die sich aus dem Vollständigkeitsaxiom ergeben, wie etwa der Satz
4.14 und der Satz von Bolzano-Weierstraß, dessen reelle Variante wir schon in
Korollar 4.16 kennengelernt haben. (Die übrigen bisher diskutierten Ergebnisse
lassen sich auch aus dem schwächeren Archimedischen Axiom gewinnen.)
Zunächst bemerken wir, dass die Ergebnisse des vorigen Abschnitts auch Konsequenzen für komplexe Folgen haben. Deren Konvergenz lässt sich nämlich auf
die Konvergenz von reellen Folgen zurückführen.
Satz 4.22 Eine komplexe Folge (zn )n∈N konvergiert genau dann gegen z ∈ C,
wenn limn→∞ Re zn = Re z und limn→∞ Im zn = Im z gilt.
Beweis. ⇒: Zu ε > 0 wähle N ∈ N mit |zn − z| < ε für alle n ≥ N . Für diese n
gilt dann auch
| Re zn − Re z| ≤ |zn − z| < ε
und
| Im zn − Im z| ≤ |zn − z| < ε.
⇐: Zu ε > 0 wähle N1 ∈ N und N2 ∈ N mit | Re zn − Re z| < 2ε für alle n ≥ N1
und | Im zn − Im z| < 2ε für alle n ≥ N2 . Für n ≥ N := max{N1 , N2 } ist dann
nach der Dreiecksungleichung
|zn − z| = | Re zn − Re z + i(Im zn − Im z)|
≤ | Re zn − Re z| + |i|| Im zn − Im z| <
ε ε
+ = ε.
2 2
Satz 4.23 (Satz von Bolzano-Weierstraß) Jede beschränkte reelle (oder komplexe) Folge besitzt eine konvergente Teilfolge.
64
Beweis. Nach Korollar 4.16 müssen wir nur noch komplexe Folgen untersuchen.
Ist nun (an ) eine beschränkte komplexe Folge, so sind nach Satz 3.38(iii) (Re an )n∈N
und (Im an )n∈N beschränkte reelle Folgen. Nach Korollar 4.16 gibt es eine Teilfolge (znk )k∈N , so dass (Re znk )k∈N konvergiert. Wieder nach Korollar 4.16 gibt es
eine (Teil-)Teilfolge (znkj )j∈N , für die (Im znkj )j∈N konvergiert. Als Teilfolge der
konvergenten Folge (Re znk )k∈N konvergiert aber auch (Re znkj )j∈N . Gemäß Satz
4.22 konvergiert dann auch die komplexe Folge (znkj )j∈N .
Ein zentrales Konvergenzkriterium ist das Cauchykriterium, das eine notwendige und hinreichende Bedingung für die Konvergenz einer reellen (oder komplexen) Folge angibt, ohne dass der fragliche Grenzwert angegeben werden muss. Da
man dieses Kriterium allgemeiner auch für andere Bereiche als R oder C untersucht, in denen es notwendig, jedoch nicht hinreichend sein muss, geben wir hier
zunächst eine extra Definition, die sich später leicht verallgemeinern lässt.
Definition 4.24 Eine Folge reeller (oder komplexer) Zahlen (an ) heißt Cauchyfolge, wenn es zu jedem ε > 0 ein N ∈ N gibt, so dass
|am − an | < ε für alle m, n ≥ N
gilt.
Satz 4.25 Eine reelle (oder komplexe) Folge ist genau dann konvergent, wenn
sie eine Cauchyfolge ist.
Beweis. ⇒: Gilt limn→∞ an = a, so gibt es zu jedem ε > 0 ein N ∈ N mit
|an − a| < 2ε für alle n ≥ N . Dann gilt aber auch
ε ε
|am − an | = |am − a + a − an | ≤ |am − a| + |an − a| < + = ε
2 2
für m, n ≥ N .
⇐: Es sei nun (an ) als Cauchyfolge vorausgesetzt. Zu ε = 1 gibt es dann ein
N ∈ N mit |an − aN | < 1 und damit |an | ≤ |aN | + 1 für alle n ≥ N . Dann aber
ist
|an | ≤ max{|a1 |, |a2 |, . . . , |aN −1 |, |aN | + 1},
was zeigt, dass die Folge (an ) beschränkt ist. Nach Satz 4.23 besitzt (an ) also eine
konvergente Teilfolge (ank )k∈N , etwa limk→∞ ank = a.
Tatsächlich gilt dann aber schon an → a. Ist nämlich ε > 0 gegeben, so können
wir N, K ∈ N mit
ε
ε
|am − an | < für m, n ≥ N
sowie
|ank − a| < für k ≥ K
2
2
wählen. Dann aber folgt für alle n ≥ N , indem man k ≥ K mit nk ≥ N wählt,
ε ε
|an − a| ≤ |an − ank | + |ank − a| < + = ε.
2 2
65
Bemerkungen.
1. Die Aussagen des Satzes von Bolzano-Weierstraß und des Cauchykriteriums
sind im folgenden Sinne sogar äquivalent zur Vollständigkeit von R: Ist K
ein angeordneter Körper, so sind äquivalent:
• K ist vollständig. (D.h. das Vollständigkeitsaxiom (V) gilt.)
• K ist ein archimedisch angeordneter Körper, in dem jede beschränkte
Folge eine konvergente Teilfolge besitzt.
• K ist ein archimedisch angeordneter Körper, in dem jede Cauchyfolge
konvergiert.
Um dies zu zeigen, muss man zunächst bemerken, dass man die Konvergenz von Folgen – genau wie oben beschrieben – allgemein für archimedisch
angeordnete Körper definieren kann, s. z.B. [Fo]. (Das archimedische Axiom garantiert dann, dass der Grenzwert einer konvergenten Folge eindeutig
ist.) Wir gehen hier nicht weiter darauf ein. (Was Sie nicht daran hindern
soll, sich dies selbst zu überlegen.)
2. Mit Hilfe von Cauchyfolgen lässt sich nun die Vollständigkeit auch für nicht
angeordnete Räume definieren. Da nach Satz 4.25 insbesondere auch in C
jede Cauchyfolge konvergiert, sagen wir auch, dass C vollständig ist.
4.4
Reihen
Durch sukzessive Addition der Glieder einer gegebenen reellen (oder komplexen)
Folge (an )n∈N entsteht eine neue Folge: (sm )m∈N mit sm = a1 + . . . , +am , die
unendliche Reihe der an . Etwas allgemeiner betrachten wir gleich Folgen mit
erstem Index n0 ∈ Z (vgl. den Absatz zu Beginn des Abschnitts 4.1). In diesem
Abschnitt stellen wir grundlegende Konvergenzkriterien für Reihen bereit.
Definition
Pm 4.26 Es sei (an )n≥n0 eine reelle (oder komplexe) Folge. Die Zahl
sm =
n=n0 an heißt die m-te Partialsumme von (an ). Die Folge der Partialsummen (sm )m≥n0 nennt man auch die (unendliche) Reihe der an und schreibt
(sm )m≥n0 =
∞
X
an .
n=n0
Ist diese Reihe konvergent oder uneigentlich konvergent, so bezeichnet man
auch ihren Grenzwert so:
lim
m→∞
m
X
an =
n=n0
∞
X
n=n0
66
an .
P
Beachten Sie: Das Symbol ∞
n=1 an bedeutet zweierlei: Erstens steht es für die
Folge der Partialsummen, zweitens – im Falle der Konvergenz – auch für deren
Limes.
Natürlich kann man die Folge (an )n≥n0 aus der Folge der Partialsummen
(sm )m≥n0 zurückgewinnen, da ja an0 = sn0 und an = sn − sn−1 für n ≥ n0 + 1
gilt.
Beispiele.
1. Die geometrische Reihe: Für z ∈ C mit |z| < 1 gilt
∞
X
zn =
n=0
1
.
1−z
Für |z| ≥ 1 ist diese Reihe divergent.
Der Fall z = 1 ist hier klar. Für z 6= 1 beobachten wir zunächst, dass
der Satz 2.2 auch im Komplexen gültig ist. (Der Beweis ist haargenau der
gleiche.) Demnach ist
m
X
1 − z m+1
.
zn =
1−z
n=0
Da z m+1 → 0 mit m → ∞, wenn |z| < 1 ist, und anderenfalls (z m+1 )
divergiert, folgt die Behauptung.
2. Die harmonische Reihe
∞
X
1
n
n=1
divergiert bestimmt gegen +∞:
Wählt man zu gegebenem K > 0 ein N ∈ N mit N ≥ 2K, so gilt für
m ≥ 2N
N
m
2
N
−1
X
X
1 X1
≥
≥
n n=2 n
n=1
k=0
k+1
2X
N
−1
X
1
N
1
≥
2k · k+1 ≥
≥ K.
n
2
2
k=0
n=2k +1
| {z }
2k Summanden,
jeweils ≥ 1/2k+1
3. Es gilt
∞
X
1
1
1
1
+
+
+ ... =
= 1.
1·2 2·3 3·4
n(n + 1)
n=1
67
P
1
1
1
1
Die Summe ∞
n=1 n(n+1) ist eine ‘Teleskopsumme’: Wegen n(n+1) = n − n+1
ist tatsächlich
m
1
X
1
1 1 1 1 1
1 = 1−
+
−
+
−
+ ... +
−
n(n + 1)
2
2 3
3 4
m m+1
n=1
=1−
1
→1
m+1
mit m → ∞.
Direkt aus den Grenzwertsätzen ergibt sich:
P∞
P
(oder komplexe) unSatz 4.27 Sind ∞
n=n0 bn konvergente reelleP
n=n0 an und
endliche Reihen sowie c ∈ R (oder C), so konvergiert auch ∞
n=n0 (an + c bn ) und
es ist
∞
∞
∞
X
X
X
(an + c bn ) =
an + c
bn .
n=n0
n=n0
n=n0
Beweis. Klar nach Satz 4.5.
Wir untersuchen nun Kriterien für die Konvergenz von unendlichen Reihen.
Als erstes notwendiges (aber nicht hinreichendes!) Kriterium halten wir fest:
P
Satz 4.28 Konvergiert die reelle (oder komplexe) unendliche Reihe ∞
n=n0 an , so
ist (an )n≥n0 eine Nullfolge.
P
Pm
Beweis. Es seien a = ∞
n=n0 an und sm =
n=n0 an die m-te Partialsumme. Zu
gegebenem ε > 0 wählen wir M ∈ N mit |sm − a| < 2ε für alle m ≥ M . Dann gilt
für m ≥ M + 1 auch
|am | = |sm − sm−1 | = |sm − a + a − sm−1 |
ε ε
≤ |sm − a| + |a − sm−1 | < + = ε.
2 2
( n1 )n∈N
eine
Beachten Sie: DiePUmkehrung dieses Satzes gilt nicht! Z.B. ist
1
Nullfolge, die Reihe ∞
n=1 n aber – wie wir gesehen haben – divergent.
Natürlich liefert jedes Konvergenzkriterium für Folgen auch ein Konvergenzkriterium für Reihen, indem man es auf die entsprechende Partialsummenfolge
anwendet. Da es im Folgenden wichtig ist, gehen wir hier (noch einmal) speziell
auf das Cauchykriterium ein.
P
Satz 4.29 Die unendliche Reihe ∞
k=n0 ak mit ak ∈ R (oder C) konvergiert genau dann, wenn es zu jedem ε > 0 ein N ∈ N gibt, so dass
m
X
ak < ε
k=n
für alle m ≥ n ≥ N gilt.
68
Beweis.
Ist (sm ) die Folge der Partialsummen, so besagt diese Bedingung wegen
Pm
a
k=n k = sm − sn−1 gerade, dass (sm ) eine Cauchyfolge ist. Die Behauptung
folgt daher aus Satz 4.25.
Als nächstes diskutieren wir ein hinreichendes (aber nicht notwendiges!) Kriterium für Reihen mit weitreichenden Konsequenzen. Dazu führen wir zunächst
einen Begriff ein.
P∞
Definition 4.30 Eine unendliche
reelle
(oder
komplexe)
Reihe
n=n0 an konP
|a
|
konvergiert.
vergiert absolut, wenn die Reihe ∞
n
n=n0
Satz 4.31 Jede absolut konvergente Reihe konvergiert.
P∞
Beweis. Es sei
n=n0 an absolut konvergent. Ist ε > 0, so gibt es nach dem
Cauchykriterium ein N ∈ N mit
m
X
|ak | < ε
k=n
für
Pm alle m, n ≥ N gilt. Nach der Dreiecksungleichung aber ist |
k=n |ak |, so dass auch
m
X
ak < ε
Pm
k=n
ak | ≤
k=n
für
P∞alle m, n ≥ N gilt. Wieder nach dem Cauchykriterium folgt nun, dass auch
n=n0 an konvergiert.
Beachten Sie: Die Umkehrung
giltn im Allgemeinen nicht. Z.B. ist – wie wir
P∞ (−1)
gleich noch P
sehen werden – n=1 n konvergent, nicht jedoch absolut konver1
gent, da ja ∞
n=1 n divergiert.
P
Die wesentlich Beobachtung ist nun, dass ∞
n=n0 an monoton wächst. Hieraus
ergibt sich:
P
Satz 4.32 Eine unendliche reelle (oder komplexe) Reihe ∞
n=n0 an konvergiert
P∞
genau dann absolut, wenn die Folge der Partialsummen der Reihe
n=n0 |an |
beschränkt ist.
P
Beweis. Dies folgt sofort aus Satz 4.14, da die Partialsummenfolge ∞
n=n0 |an |
monoton wächst.
Im Folgenden diskutieren wir einige Konvergenzkriterien für die absolute Konvergenz einer Reihe.
P∞
Satz 4.33 (Majorantenkriterium)
Es
seien
n=n0 an eine reelle (oder komP∞
plexe) Reihe und n=n0 bn eine konvergente P
Reihe mit reellen Gliedern bn ≥ 0.
Gilt |an | ≤ bn für alle n ≥ n0 , so konvergiert ∞
n=n0 an absolut.
69
P∞
Man
nennt
in
diesem
Fall
die
Reihe
n=n0 bn eine Majorante der Reihe
P∞
a
.
n=n0 n
P∞
Beweis. Da
n=n0 bn als konvergente Reihe gemäß Satz 4.4 insbesondere beschränkt ist, gibt es ein C > 0 mit
m
X
n=n0
m
X
|an | ≤
bn ≤ C
n=n0
für alle m ≥ n0 . Die Behauptung folgt somit aus Satz 4.32.
Beispiel. Die Reihe
∞
X
1
n=1
n2
konvergiert.
P
1
Es genügt hier zu begründen, dass ∞
n=2 n2 konvergiert. Dies folgt nun daraus,
dass die Reihe
∞
X
1
1
1
1
=
+
+
+ ...
(n
−
1)n
1
·
2
2
·
3
3
·
4
n=2
eine – nach dem Beispiel 3 von Seite 67 konvergente – Majorante ist.
Die folgenden beiden Kriterien für die absolute Konvergenz beruhen auf dem
Majorantenkriterium, wobei eine geometrische Reihe als konvergente Majorante
dient. Vorbereitend beweisen wir ein Lemma, durch das sich die Voraussetzungen
dieser Kriterien äquivalent umformulieren lassen.
Lemma 4.34 Ist (xn ) eine reelle Folge, so gilt lim supn→∞ xn < 1 genau dann,
wenn es ein r < 1 und ein N ∈ N gibt, so dass xn ≤ r für alle n ≥ N gilt.
Achtung! Diese Bedingung ist nicht äquivalent dazu, dass xn < 1 für alle
n ≥ N gilt. (Gegenbeispiel: xn = 1 − n1 .)
Beweis. ⇒: Ist lim supn→∞ xn = limn→∞ sup{xk : k ≥ n} =: x < 1, so gibt es zu
x < r < 1 ein N ∈ N mit (setze ε = r − x)
sup{xk : k ≥ N } < r.
⇐: Gibt es einen Index N und ein r < 1, so dass xk ≤ r für alle k ≥ N ist,
dann ist auch sup{xk : k ≥ N } ≤ r und damit nach Satz 4.14
lim sup xn = lim sup{xk : k ≥ n} ≤ sup{xk : k ≥ N } ≤ r < 1.
n→∞
n→∞
70
P
Satz 4.35 (Quotientenkriterium) Es sei ∞
n=n0 an eine reelle (oder komplexe) Reihe. Gilt
|an+1 |
lim sup
< 1,
|an |
n→∞
P
so konvergiert ∞
n=n0 an absolut.
Bemerkung. Gemäß Lemma 4.34 ist die Voraussetzung lim supn→∞
äquivalent zur folgenden Bedingung:
∃ r < 1 ∃N ≥ n0 ∀n ≥ N :
|an+1 |
|an |
<1
|an+1 |
≤ r.
|an |
Beweis von Satz 4.35. Wir wählen nach Lemma 4.34 N ∈ N und r P
> 0 mit
∞
|an+1 |
≤
r
für
n
≥
N
.
Es
genügt
nun,
die
absolute
Konvergenz
der
Reihe
n=N an
|an |
nachzuweisen, da die ersten endlich vielen Glieder keinen Einfluss auf das Konvergenzverhalten haben.
|
Aus |a|an+1
≤ r folgt induktiv aber |an | ≤ rn−N |aN |, so dass sich die Behaupn|
tung aus dem Majorantenkriterium ergibt, denn es ist
∞
X
|aN |r
n−N
= |aN |
∞
X
rn < ∞.
n=0
n=N
Beispiel. Die Reihe
n7 2−n
n=1 1+n2
P∞
(n+1)7 2−n−1
1+(n+1)2
n7 2−n
1+n2
=
konvergiert absolut, denn es gilt
(n + 1)7 2−n−1
1
1 + n2
·
→ <1
·
7
−n
2
+ 1)
2
{z } | 2{z } |1 + (n
| n
{z
}
1
→1
→2
→1
mit n → ∞.
P
Satz 4.36 (Wurzelkriterium) Es sei ∞
n=n0 an eine reelle (oder komplexe) Reihe.
p
P
(i) Gilt lim supn→∞ n |an | < 1, so konvergiert ∞
n=n0 an absolut.
p
P
(ii) Gilt lim supn→∞ n |an | > 1, so divergiert ∞
n=n0 an .
Beweis. (i) Wiepim Beweis von Satz 4.35 wählen wir nach Lemma 4.34 N ∈ N
und r > 0 mit n |an | ≤P
r für n ≥ N und beobachten, dass es genügt, die absolute
Konvergenz der Reihe ∞
n=N an nachzuweisen.
71
p
Aus n |an | ≤ r folgt aber direkt |an | ≤ rn , so dass sich die Behauptung wieder
aus dem Majorantenkriterium ergibt, denn es ist
∞
X
n
r =r
N
∞
X
rn < ∞.
n=0
n=N
p
p
(ii) Gilt lim supn→∞ n |an | > 1, so gibt es unendlich viele n mit n |an | ≥ 1
und damit auchP|an | ≥ 1. Die Folge (an ) kann demnach keine Nullfolge sein, so
dass die Reihe ∞
n=n0 an gemäß Satz 4.28 divergiert.
p
n
Beachten Sie: Gilt lim supn→∞
|an | = 1, so ist
Aussage
qkeine allgemeine P
q
1
möglich. Z.B. gilt lim supn→∞ n | n1 | = lim supn→∞ n | n12 | = 1, wobei ∞
n=n0 n
P∞
divergiert, n=n0 n12 aber konvergiert.
Beispiel. Es sei
(
2−n für n gerade,
an =
3−n für n ungerade.
P
Dann konvergiert ∞
n=0 an nach dem Wurzelkriterium. Es ist nämlich
(
1
√
für n gerade,
n
an = 21
für n ungerade
3
p
und somit lim supn→∞ n |an | = 12 < 1.
Das Quotientenkriterium versagt in diesem Beispiel, denn es ist
( n
a 2
= 13 · ( 23 )n für n gerade,
n+1 3n+1
=
3n
an
= 12 · ( 32 )n für n ungerade
2n+1
und daher lim supn→∞ | an+1
| = ∞.
an
Das folgende Kriterium gilt für alternierende Reihen, deren Glieder abwechselnd positives und negatives Vorzeichen haben.
Satz 4.37 (Leibnizkriterium) Ist (an )n≥n0 eine monoton fallende Nullfolge,
dann ist die Reihe
∞
X
(−1)n an
n=n0
P∞
P
n
(und damit auch n=n0 (−1)n+1 an = − ∞
n=n0 (−1) an ) konvergent.
Für alle m ≥ n0 gilt die Abschätzung
m
∞
X
X
n
(−1) an −
(−1)n an ≤ am+1 .
n=n0
n=n0
72
Beweis. Es genügt den Fall n0 = 0 zu betrachten. Der allgemeine Fall folgt
hieraus durch Umnummerierung
der Summe und ggf. Multiplikation mit −1:
P∞
P
∞
n
n
= ± n=0 (−1) an0 +n .
n=n0 (−1) an P
n
Setze sm = m
n=0 (−1) an . Dann sind wegen
s2k = s2k−2 −a2k−1 + a2k ≤ s2k−2
|
{z
}
≤0
und s2k+1 = s2k−1 +a2k − a2k+1 ≥ s2k−1
|
{z
}
≥0
für k ∈ N die Folgen (s2k )k∈N0 und (s2k+1 )k∈N0 monoton fallend bzw. monoton
wachsend. Dabei ist
s1 ≤ s2k+1 = s2k − a2k+1 ≤ s2k ≤ s0 .
Diese Folgen sind also auch beschränkt und somit konvergent. Wir setzen s =
limk→∞ s2k+1 .
Für m ≥ k ist außerdem
s2k+1 ≤ s2m+1 = s2m − a2m+1 ≤ s2m ≤ s2k
und folglich (mit m → ∞)
s2k+1 ≤ s ≤ s2k .
Für m ∈ N ist also sm ≤ s ≤ sm+1 oder sm+1 ≤ s ≤ sm . Es folgt
|sm − s| ≤ |sm+1 − sm | = am+1 → 0
mit m → ∞.
Beispiel. Die alternierende harmonische Reihe
∞
X
(−1)n+1
n
n=1
konvergiert nach Satz 4.37.
Wir untersuchen nun noch die Frage, inwiefern es bei unendlichen Reihen auf
die Summationsreihenfolge ankommt. Im Allgemeinen darf man die Reihenglieder
nicht beliebig umordnen wie die folgende Überlegung zeigt: Es ist
∞
X 1
1 1
1 + + + ... =
=∞
3 5
2k − 1
k=1
und
∞
X 1
1 1 1
+ + + ... =
= ∞.
2 4 6
2k
k=1
P
P∞ 1
1
oder
2
(Anderenfall wären 2 ∞
k=1 2k−1
k=1 2k konvergente Majoranten der harmonischen Reihe.) Nun kann man die Glieder der alternierenden harmonischen
P
(−1)n+1
Reihe ∞
z.B. so umordnen:
n=1
n
73
• Addiere so lange die ersten Glieder mit ungeraden Indizes auf, bis das Ergebnis ≥ 15 ist.
• Addiere dann die ersten Glieder mit geraden Indizes hinzu, bis das Ergebnis
≤ −14 ist.
• Addiere dazu nun die nächsten Glieder mit geraden Indizes, bis das Ergebnis
wieder ≥ 15 ist.
• Addiere dann die nächsten Glieder mit ungeraden Indizes, bis das Ergebnis
wieder ≤ −14 ist.
• u.s.w.
Die Partialsummenfolge nimmt dann sowohl immer wieder Werte ≥ 15 als auch
Werte ≤ −14 an und kann nicht konvergieren. Vgl. auch die Bemerkung im
Anschluss an den folgenden Satz.
Umordnungen sind jedoch für absolut konvergente Reihen erlaubt:
P
Satz 4.38 Es sei ∞
n=n0 an eine reelle (oder komplexe) absolut konvergente Reihe.
P∞Ist π : {n ∈ Z : n ≥ n0 } → {n ∈ Z : n ≥ n0 } bijektiv, so konvergiert auch
n=n0 aπ(n) absolut und es ist
∞
X
aπ(n) =
n=n0
Beweis. Da
mit
P∞
n=n0
∞
X
an .
n=n0
an absolut konvergiert, gibt es zu gegebenem ε > 0 ein N ∈ N
m
N
X
X
ε
|an | = |an | −
|an | <
2
n=n
n=n
n=N +1
m
X
0
0
für alle m ≥ N und
N
∞
X
ε
X
< .
a
a
−
n
n
2
n=n
n=n
0
0
0
Ist nun N ∈ N so groß gewählt, dass {π(1), . . . , π(N 0 )} ⊃ {1, . . . , N } ist
(insbesondere N 0 ≥ N ), so folgt für m ≥ N 0 mit M = max{π(1), . . . , π(N 0 )}
(≥ N )
m
m
X
∞
∞
N
X
X
X
X
X
N
ε ε
aπ(n) −
an ≤ aπ(n) −
an +
an −
an < + = ε.
2 2
n=n0
n=n0
n=n0
n=n0
n=n
n=n0
{z
}
| 0
P
≤ M
n=N +1 |an |
Bemerkung. Es sei n=n0 an eine konvergente aber nicht absolut konvergente
Folge
P∞ in R. Dann gibt es zu jedem x ∈ R eine Umordnung π der Indizes, so dass
n=n0 aπ(n) = x ist. (Übungsaugfgabe: Überlegen Sie sich das!)
P∞
74
4.5
Zur Darstellung der reellen Zahlen
Endlich können wir nun mit Hilfe der unendlichen Reihen die Darstellung der
reellen Zahlen im Dezimalsystem oder – allgemeiner – in einem Zahlensystem zu
einer natürlichen Basis ≥ 2 angeben.
Definition 4.39 Es sei b ∈ N \ {1}. Ein b-adischer Bruch ist eine Reihe von der
Form
∞
X
±
an b−n ,
n=−k
wobei k ∈ N0 und an ∈ {0, 1, . . . , b−1} die ‘Ziffern’ sind. Ist festgelegt, zu welcher
Basis b man rechnet, so schreibt man eine solche Reihe dann auch einfach als
±
∞
X
an b−n = ±a−k a−k+1 . . . a0 , a1 a2 . . . ,
n=−k
indem man die an einfach hintereinander aufreiht.
Satz 4.40 Es sei b ∈ N \ {1}.
(i) Jeder b-adische Bruch konvergiert gegen eine reelle Zahl.
(ii) Umgekehrt lässt sich jede reelle Zahl in einen b-adischen Bruch entwickeln.
Für b = 10 heißt diese Darstellung die Dezimaldarstellung, für b = 2 die binäre
Darstellung.
Beispiel. Die Zahl 0, 101010 . . . im Binärsystem ist
∞
X
n=0
−(2n+1)
2
−1
=2
∞
X
1
1
(4−1 )n = ·
2 1−
n=0
1
4
2
= .
3
Bemerkung. In speziellen Fällen ist die Darstellung einer reellen Zahl als badischer Bruch nicht eindeutig. Das ist immer dann der Fall, wenn sich ein Zahl
durch einen b-adischen Bruch schreiben lässt, dessen Ziffern von irgendeiner Stelle
an immer b − 1 sind. Z.B. ist etwa im Dezimalsystem 2, 5999 . . . = 2, 6000 . . .
und im binären Sytem 0, 111 . . . = 1, 000 . . .. Für alle anderen Zahlen ist die
Darstellung als b-adischer Bruch jedoch eindeutig. (Übungsaufgabe: Überlegen
Sie sich das!)
P
−n
Beweis von Satz 4.40.2 (i) Dies folgt daraus, dass jeder b-adische Bruch ± ∞
n=−k an b
dem Cauchykriterium genügt. Ist nämlich m ≥ n, so gilt
∞
m
m
X
X
X
(b − 1)b−n
−j −j
−n
b−j ≤
aj b ≤
= b−n+1 .
(b − 1)b = (b − 1)b
±
−1
1−b
j=n
j=n
j=0
2
Dieser Beweis wurde in der Vorlesung weggelassen.
75
Wegen b−n+1 → 0 mit n → ∞, lässt sich daher zu gegebenem ε > 0 ein N ∈ N
finden, so dass
m
X
aj b−j < ε
±
j=n
für m ≥ n ≥ N ist.
P
−n
(ii) Es genügt zu zeigen, dass sich jedes x ≥ 0 als Dezimalbruch x = ∞
n=−k an b
schreiben lässt.
Es sei k die kleinste Zahl aus N0 mit x < bk+1 . Wir definieren die Folge
(an )n≥−k mit an ∈ {0, 1, . . . , b − 1} und
sm :=
m
X
an b−n ≤ x <
n=−k
m
X
an b−n + b−m = sm + b−m .
n=−k
induktiv:
Zunächst betrachten wir die Unterteilung
0 = 0 · bk < 1 · bk < 2 · bk < . . . < (b − 1)bk < b · bk = bk+1
des Intervalls [0, bk+1 ). Da x in diesem Intervall liegt, gibt es genau ein a−k ∈
{0, 1, . . . , b − 1} mit
s−k := a−k bk ≤ x < (a−k + 1)bk = a−k bk + bk .
Ist nun a−k , . . . , am schon definiert, so betrachten wir die Unterteilung
sm = sm + 0 · b−m−1 < sm + 1 · b−m−1 < . . .
< sm + (b − 1)b−m−1 < sm + b · b−m−1 = sm + b−m
des Intervalls [sm , sm + b−m ) und wählen am+1 mit
sm+1 := sm + am+1 b−m−1 ≤ x < sm + (am+1 + 1)b−m−1 = sm+1 + b−m−1 .
Wegen |sm − x| < b−m folgt nun
x = lim sm =
m→∞
∞
X
an b−n .
n=−k
Bemerkungen.
1. Die rationalen Zahlen sind genau diejenigen, deren b-adische Darstellung
von irgendeiner Stelle an periodisch ist:
Q = {a−k a−k+1 . . . a0 , a1 a2 . . . : ∃ N ≥ −k ∃ p ∈ N ∀ n ≥ N : an+p = an }.
(Übungsaufgabe: Überlegen Sie sich das!)
76
2. Mit Hilfe der Dezimaldarstellung lässt sich ein alternativer Beweis von Satz
3.30 angeben. Mit dem ‘zweiten Cantorschen Diagonalverfahren’ (vgl. das
Beispiel 4 von Seite 19 zum Ersten) zeigt man dazu, dass eine Abbildung
f : N → R nicht surjektiv sein kann. Schreibt man nämlich die Nachkommastellen der Bilder von f als
f (1) = . . . , a11 a12 a13 . . .
f (1) = . . . , a21 a22 a23 . . .
f (1) = . . . , a31 a32 a33 . . .
..
.
und bildet aus den diagonalen Einträgen a11 , a22 , a33 , . . . die Zahl
x = 0, b1 b2 b3 . . .
mit
(
7 falls ann =
6 7,
bn =
3 falls ann = 7,
so ist tatsächlich x 6= f (n) für jedes n ∈ N.
4.6
Potenzreihen und die Exponentialfunktion
Viele spezielle Funktionen, insbesondere etwa die Ihnen aus der Schule bekannte
e-Funktion oder auch die Sinus- und Cosinusfunktion lassen sich mit Hilfe von
Reihen definieren. Diese Reihen sind von der Form
∞
X
cn (z − z0 )n ,
n=0
wobei cn ∈ C komplexe Koeffizienten und z0 ∈ C der sogenannte Entwicklungspunkt sind, die wir als fest gewählt betrachten. z ∈ C ist eine Variable. (Wir
betrachten hier gleich allgemein den komplexen Fall.) Konvergiert diese Reihe
für z ∈ M , M eine
C, so definiert dies eine Abbildungsvorschrift
P Teilmenge von
n
M → C, z 7→ ∞
c
(z
−
z
)
.
Eine
Reihe von dieser Form nennt man eine
0
n=0 n
Potenzreihe. Kümmert man sich zunächst nicht um deren Konvergenz, so spricht
man auch von einer formalen Potenzreihe.
Mit den bislang entwickelten Methoden lässt sich genauer beschreiben, für
welche z diese Reihen konvergieren. Es stellt sich heraus, dass dies gerade auf
Kreisscheiben um z0 der Fall ist. Wir führen daher die Notation Br (z0 ) := {z ∈
C : |z − z0 | < r} ein.
77
Satz 4.41 Es seien cn , z0 ∈ C, n ∈ N0 . Setze
r=
wobei hier(!)
1
∞
als 0 und
1
0
1
lim supn→∞
p
,
n
|cn |
als ∞ zu lesen ist. Dann gilt:
(i) Die Reihe
∞
X
cn (z − z0 )n
n=0
konvergiert absolut, falls |z − z0 | < r ist, und stellt damit eine Funktion
f : Br (z0 ) → C dar.
(ii) Sie divergiert, falls |z − z0 | > r ist.
Beweis. Setze an = cn (z − z0 )n . Dann ist
p
p
lim sup n |an | = |z − z0 | lim sup n |cn |
n→∞
n→∞


< 1 ⇔ |z − z0 | <
1√
,
lim sup n |cn |

> 1 ⇔ |z − z0 | >
1√
.
lim sup n |cn |
n→∞
n→∞
Die Behauptung folgt nun sofort aus dem Wurzelkriterium (Satz 4.36).
Die Reihe konvergiert also für diejenigen z ∈ C, die in einer Kreisscheibe mit
dem Radius r um z0 liegen. Dabei wird allerdings keine Aussage darüber gemacht,
ob sie auch auf den Randpunkten dieses Kreises konvergiert. Liegt z weiter als
r von z0 entfernt, so divergiert sie jedoch auf jeden Fall. Dies legt die folgende
Definition nahe:
Definition 4.42 Es sei
P∞
n=0 cn (z
− z0 )n eine Potenzreihe. Die Zahl
∞
X
n
sup |z − z0 | :
cn (z − z0 ) konvergiert =
n=0
1
lim supn→∞
p
n
|cn |
heißt der Konvergenzradius dieser Potenzreihe.
n|
Bemerkung. Der Konvergenzradius ist auch gegeben durch limn→∞ |c|cn+1
, falls
|
dieser Grenzwert existiert. (Übung!)
Beispiele:
P
n
1. Die Potenzreihe ∞
n=0 z hat den Konvergenzradius r = 1. Sie stellt die
1
Funktion B1 (0) → C, z 7→ 1−z
dar.
P
n n
2. Die Potenzreihe ∞
n=0 n z hat den Konvergenzradius 0. (Übung!)
78
3. Die Potenzreihe
P∞
n=0
3n z n hat den Konvergenzradius
r=
1
lim supn→∞
p
n
1
= .
3
|3n |
1
Sie stellt die Funktion B1/3 (0) → C, z 7→ 1−3z
dar.
P∞ zn
4. Die sogenannte Exponentialreihe
n=0 n! hat den Konvergenzradius ∞,
konvergiert also für alle z ∈ C.
Dies folgt aus dem Quotientenkriterium, da
|z|
|z n+1 n!|
=
→0<1
|z n (n + 1)!|
n+1
mit n → ∞.
Bemerkung:
Sind z0 = x0 und alle cn reell, so stellt die reelle Potenzreihe
P∞
n
n=0 cn (x − x0 ) , x ∈ R, eine reelle Funktion f : (x0 − r, x0 + r) → R dar, wobei
∞
X
k
ck (x − x0 ) konvergiert
r = sup |x − x0 | : x ∈ R und
k=0
ist. Nach unseren Ergebnissen von oben, konvergiert diese Reihe aber tatsächlich
auf der ganzen komplexen Kreisscheibe {z ∈ C : |z − x0 | < r} und stellt dort eine
Funktion f : Br (x0 ) → C dar.
Multipliziert man zwei Potenzreihen mit demselben Entwiclungspunkt z0 , so
erhält man wieder eine Potenzreihe mit dem Entwicklungspunkt z0 . Die Idee
hierbei ist, all die Terme, die beim Ausmultiplizieren des Produktes der Reihen entstehen, nach Potenzen von z n zusammenzufassen. Wir fomulieren dazu
zunächst einen Produktsatz für allgemeine Reihen.
P
P∞
Satz 4.43 (Das Cauchyprodukt) Es seienP ∞
n=0 an und
n=0 bn absolut konn
vergente komplexe Reihen. Setzt man cn = k=0 an−k bk , so ist auch die Reihe
P
∞
n=0 cn absolut konvergent und es gilt
X
X
∞
∞
∞
X
cn =
an ·
bn .
n=0
n=0
n=0
Beweis. Setze
sm =
m
X
cn =
n=0
n
m X
X
an−k bk ,
s̄m =
m
X
|cn | ≤
n=0
n=0 k=0
m X
n
X
|an−k bk |
n=0 k=0
sowie
tm =
X
m
n=0
X
m
an ·
bn ,
t̄m =
n=0
X
m
n=0
79
X
m
|an | ·
|bn | .
n=0
Nach Voraussetzung konvergieren (tm ) und (t̄m ), wobei
X
X
∞
∞
lim tm =
an ·
bn
m→∞
n=0
n=0
ist.
Mit Hilfe der Indezmengen Qm = {(i, j) ∈ N0 × N0 : i, j ≤ m} und Dm =
{(i, j) ∈ N0 × N0 : i + j ≤ m} lassen sich diese Summen auch schreiben als
X
X
sm =
ai bj ,
s̄m ≤
|ai bj |
(i,j)∈Dm
(i,j)∈Dm
sowie
tm =
X
ai b j ,
X
t̄m =
(i,j)∈Qm
|ai bj |.
(i,j)∈Qm
Wegen
P∞ Dm ⊂ Qm folgt hieraus zunächst s̄m ≤ t̄m ≤ limk→∞ t̄m , so dass in der
Tat n=0 cn absolut konvergiert.
Zu gegebenem ε > 0 wählen wir nun ein k ∈ N mit t̄m − t̄k < ε für m ≥ k.
Für m ≥ 2k ergibt sich dann wegen Dm ⊃ Qk , dass
X
X
|tm − sm | = |ai bj | = t̄m − t̄k < ε
ai bj ≤
(i,j)∈Qm \Qk
(i,j)∈Qm \Dm
ist. Damit aber folgt limm→∞ sm = limm→∞ tm , was zu zeigen war.
Speziell für Potenzreihen zeigt dies, dass das Produkt zweier Potenzreihen
wieder eine Potenzreihe ist, deren Konvergenzradius mindesten so groß ist, wie
das Minimum der Konvergenzradien der Faktoren:
P∞
P
n
Korollar 4.44 Konvergieren die Potenzreihen ∞
n=0 bn (z−
n=0 an (z−z0 ) und
n
z0 ) im Punkt z absolut, so gilt
X
X
X
∞
∞
∞ X
n
n
n
an (z − z0 ) ·
bn (z − z0 ) =
an−k bk (z − z0 )n .
n=0
n=0
n=0
k=0
Beweis. Klar nach Satz 4.43.
Wir werden uns später noch wesentlich ausführlicher mit Potenzreihen beschäftigen. Hier konzentrieren wir uns nun auf eine besonders wichtige. (Die Wichtigste
überhaupt!)
Nach Beispiel 4 von Seite 79 dürfen wir definieren:
Definition 4.45 Die Funktion exp : C → C,
exp(z) =
∞
X
zn
n=0
n!
heißt die Exponentialfunktion. Die Zahl e := exp(1) heißt auch die Eulersche Zahl.
80
Beachte, dass nach der Bemerkung von Seite 79 exp(x) reell ist, wenn x reell
ist. Offensichtlich ist exp(0) = 1.
Grundlegend ist nun die folgende Funktionalgleichung für die Exponentialfunktion.
Satz 4.46 Für z1 , z2 ∈ C ist
exp(z1 + z2 ) = exp(z1 ) · exp(z2 ).
Beweis. Nach Satz 4.43 ist
exp(z1 ) · exp(z2 ) =
=
∞ X
n
X
∞
n z2k X 1 X n n−k k
z1n−k
·
=
z z2
(n − k)! k!
n! k=0 k 1
n=0
n=0 k=0
∞
X
(z1 +
n=0
z2 )n
= exp(z1 + z2 ),
n!
wobei wir im dritten Schritt den allgemeinen binomischen Lehrsatz 2.9 ausgenutzt
haben. (Der gilt auch in C; der Beweis ist wörtlich derselbe.)
Satz 4.47 Es gilt
(i) exp(z) 6= 0 für alle z ∈ C,
(ii) exp(x) > 0 für alle x ∈ R,
(iii) exp(n) = en für alle n ∈ Z,
√
(iv) exp( pq ) = q ep für alle p ∈ Z, q ∈ N.
Beweis. (i) Für z ∈ C ist
exp(−z) exp(z) = exp(z − z) = exp(0) = 1
und somit insbesondere exp(z) 6= 0.
P
xn
(ii) Für x ≥ 0 ist offensichtlich exp(x) = ∞
n=0 n! ≥ 1 > 0. Für x < 0 folgt
dann wegen exp(x) exp(−x) = 1 und exp(−x) > 0 nach dem schon Gezeigten
auch exp(x) > 0.
(iii, iv) Wir überlegen uns, dass allgemeiner für jedes z ∈ C und n ∈ Z gilt
exp(nz) = (exp(z))n .
Zunächst gilt exp(0 · z) = 1 = (exp(z))0 . Induktiv ergibt sich daraus exp(nz) =
(exp(z))n für alle n ∈ N: Ist dies für n schon gezeigt, so folgt
exp((n + 1)z) = (exp(z))n exp(z) = (exp(z))n+1 .
81
Hieraus folgt dann für n ∈ Z \ N (und damit −n ∈ N) auch
1 = exp(nz − nz) = exp(nz) exp(−nz) = exp(nz)(exp(z))−n ,
1
n
also exp(nz) = (exp(z))
−n = (exp(z)) .
Nun folgt (iii) sofort mit z = 1. (iv) ergibt sich mit z =
exp(q · pq ) = exp(p) = ep (nach (iii)).
82
p
q
aus (exp( pq ))q =
Kapitel 5
Stetige Funktionen
Wir untersuchen nun Funktionen, die auf Teilmengen von R (oder C) definiert
sind. Dabei konzentrieren wir uns im Wesentlichen auf den reellen Fall, also Funktionen f : D → R mit D ⊂ R. Oft ist dabei D ein Intervall in R.
5.1
Definition und grundlegende Eigenschaften
Im Folgenden sei D ⊂ R.
Eine ganz wesentliche Güteeigenschaft einer Funktion f : D → R ist dann
gegeben, wenn kleine Änderungen in x ∈ D nur kleine Änderungen der Funktionswerte f (x) bewirken. Formal:
Definition 5.1 Eine Funktion f : D → R heißt stetig im Punkt x0 ∈ D, wenn
es zu jedem ε > 0 ein δ > 0 gibt, so dass für alle x ∈ D mit |x − x0 | < δ gilt
|f (x) − f (x0 )| < ε, d.h.:
∀ ε > 0 ∃ δ > 0 ∀ x ∈ D : |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε.
f : D → R heißt stetig, wenn f in jedem Punkt aus D stetig ist.
Das bedeutet: Zu jeder vorgelegten ‘Fehlertoleranz’ ε > 0 gibt es ein (kleines)
δ > 0, so dass die Funktionswerte f (x) weniger als ε von f (x0 ) abweichen, wenn
nur der Abstand von x zu x0 kleiner als δ ist.
Beispiele.
1. Jede konstante Funktion f : R → R, f (x) = c (für ein c ∈ R) ist stetig.
(Klar: δ kann hier beliebig gewählt werden.)
2. Die identische Funktion f : R → R, f (x) = x ist stetig.
Indem man zu gegebenem ε > 0 einfach δ = ε wählt folgt tatsächlich für
jedes x0 ∈ R:
|f (x) − f (x0 )| = x − x0 ≤ |x − x0 | < ε.
83
3. Der Absolutbetrag f : R → R, f (x) = |x| ist stetig.
Sind nämlich x0 ∈ R und ε > 0 gegeben, so gilt für x mit |x − x0 | < δ := ε
nach der umgekehrten Dreiecksungleichung
|f (x) − f (x0 )| = |x| − |x0 | ≤ |x − x0 | < ε.
4. f : R → R, f (x) = x2 stetig.
ε
Sind nämlich x0 ∈ R und ε > 0 gegeben, so wählen wir δ = min{1, 1+2|x
}.
0|
Dann gilt für x mit |x − x0 | < δ
|f (x) − f (x0 )| = |x2 − x20 | = |x − x0 + x0 + x0 ||x − x0 |
≤ (|x − x0 | + 2|x0 |)|x − x0 | < (δ + 2|x0 |)δ ≤ (1 + 2|x0 |)δ ≤ ε.
5. Die Funktion f : R → R,
(
0, für x ≤ 0,
f (x) =
1, für x > 0,
ist im Nullpunkt nicht stetig. (Sonst schon.)
Zu ε = 21 gibt es zu jedem δ > 0 den Punkt x = 2δ , der zwar |x − 0| =
erfüllt, aber auch
δ
2
<δ
|f (x) − f (0)| = |1 − 0| = 1 > ε.
6. Der ganzzahlige Anteil f : R → R, f (x) = bxc ist genau in den Punkten
x0 ∈ Z nicht stetig. (Überlegen Sie sich das!)
7. Die Funktion f : R → R,
(
1, für x ∈ Q,
f (x) =
0, für x ∈ R \ Q
ist nirgends stetig. (Überlegen Sie sich das!)
Während diese ‘ε-δ-Definition’ der Stetigkeit für viele Untersuchungen grundlegend ist, ist sie, wie wir etwa im vorangegangenen Beispiel 4 gesehen haben,
für Beispiele oft zu schwerfällig. Wir geben daher nun eine äquivalente Umformulierung mit Hilfe von Grenzwerten der Form limx→x0 f (x) an. Dazu müssen wir
uns zunächst überlegen, wie sich eine solcher Grenzwert einer Funktion definieren
lässt.
84
Definition 5.2 Es seien D ⊂ R, f : D → R.
(i) Die Menge
D = {x ∈ R : Es gibt eine Folge (xn ) in D mit lim xn = x}
n→∞
heißt der Abschluss von D.
(ii) Ist x0 ∈ D, so schreiben wir
lim f (x) = a
x→x0
(oder auch f (x) → a für x → x0 ),
wenn für jede Folge (xn ) in D mit limn→∞ xn = x0 gilt limn→∞ f (xn ) = a.
a heißt der Grenzwert von f bei x0 .
Offensichtlich gilt immer D ⊂ D. Beachten Sie: In (ii) genügt es nicht, dass
limn→∞ f (xn ) = a für eine Folge (xn ) mit xn → x0 gilt. Diese Bedingung muss
für alle diese Folgen erfüllt sein.
Beispiele.
1. Für f : R → R, f (x) = xk (k ∈ N0 ) und x0 ∈ R ist
lim f (x) = lim xk = xk0 = f (x0 ).
x→x0
x→x0
Für jede Folge (xn ) mit xn → x0 gilt nach dem Grenzwertsatz für Produkte
nämlich
lim xkn = xk0 .
n→∞
2. Für exp : R → R gilt
lim exp(x) = 1.
x→0
Um dies einzusehen, bemerken wir zuerst, dass für |x| < 1 gilt
∞ n
∞
X
X x 1
≤ |x|
= |x|(e − 1).
| exp(x) − 1| = n!
n!
n=1
n=1
Ist nun (xn ) eine Folge in R mit xn → 0, so folgt hieraus limn→∞ | exp(xn ) −
1| → 0 und damit exp(xn ) → 1 für n → ∞.
Satz 5.3 Eine Funktion f : D → R ist genau dann stetig in x0 ∈ D, wenn gilt
lim f (x) = f (x0 ).
x→x0
85
Beweis. ⇒: Es sei (xn ) eine Folge in D mit xn → x0 . Zu gegebenem ε > 0 wählen
wir δ > 0 mit
|f (x) − f (x0 )| < ε für alle x ∈ D mit |x − x0 | < δ.
Danach wählen wir N ∈ N mit |xn − x0 | < δ für alle n ≥ N . Für n ≥ N ist damit
auch |f (xn ) − f (x0 )| < ε.
⇐: Die Rückrichtung zeigen wir durch Kontraposition: Ist f bei x0 nicht
stetig, so gilt
∃ ε > 0 ∀ δ > 0 ∃ x ∈ D : |x − x0 | < δ und |f (x) − f (x0 )| ≥ ε.
Es gibt also ein ε > 0, so dass wir insbesondere zu jedem δ =
xn ∈ D finden mit
|xn − x0 | <
1
n
(n ∈ N) ein
1
und |f (xn ) − f (x0 )| ≥ ε.
n
Dann aber gilt xn → x0 und f (xn ) 6→ f (x0 ) und somit f (x) 6→ f (x0 ) für x → x0 .
Beispiele.
1. Nach Beispiel 1 von Seite 85 ist die für jedes k ∈ N0 Funktion f : R → R,
f (x) = xk stetig.
2. Die Exponentialfunktion exp : R → R ist stetig. Die Stetigkeit im Nullpunkt folgt sofort aus Beispiel 2 von Seite 85. Ist allgemein x0 ∈ R, so folgt
hieraus auch
lim exp(x) = exp(x0 ) lim exp(x − x0 ) = exp(x0 ).
x→x
}
| 0 {z
x→x0
=exp(0)=1
Wir zeigen nun, dass aus stetigen Funktionen zusammengesetzte Funktionen
wieder stetig sind. Dabei definieren wir die Summe, die Differenz, das Produkt
oder den Quotienten zweier Funktionen ganz allgemein punktweise:
Definition 5.4 Es seien M eine Menge, f, g : M → R Funktionen. Man definiert dann dann f + g, f − g, f g : M → R und, falls g nirgends 0 ist, fg : M → R
durch
(f ± g)(x) = f (x) ± g(x),
(f g)(x) = f (x)g(x),
f
f (x)
(x) =
.
g
g(x)
(Hat g Nullstellen, so kann man auf diese Weise immer noch
0} → R definieren.)
86
f
g
: {x ∈ M : g(x) 6=
Satz 5.5 Es seien f, g : D → R in x0 ∈ D stetige Funktionen. Dann sind auch
die Funktionen f + g, f − g, f g : D → R und, falls g(x0 ) 6= 0, fg : {x ∈ D : g(x) 6=
0} → R stetig in x0 .
Beweis. Das folgt sofort aus den Grenzwertsätzen.
Auch die Komposition stetiger Abbildungen ist wieder stetig:
Satz 5.6 Es seien D, E ⊂ R, f : D → E stetig in x0 ∈ D und g : E → R stetig
in f (x0 ). Dann ist g ◦ f stetig in x0 .
Beweis. Gilt xn → x0 in D, so folgt f (xn ) → f (x0 ) aus der Stetigkeit von f bei
x0 und hieraus dann g(f (xn )) → g(f (x0 )) aus der Stetigkeit von g bei f (x0 ), wie
zu zeigen war.
Beispiele.
1. Ist f : D → R stetig, c ∈ R, so auch cf : R → R, x 7→ cf (x).
cf ist ja das Produkt der konstanten Funktion mit Wert c und f .
2. Jedes Polynom, also jede Funktion f : R → R,
f (x) = an xn + an−1 xn−1 + . . . + a1 x + a0
für gegebene Koeffizienten a0 , . . . , an ∈ R ist stetig. (Ist an 6= 0, so nennt
man n den Grad dieses Polynoms.)
3. Jede rationale Funktion fg : R \ {x ∈ R : g(x) = 0} → R, wobei f und g
Polynome sind, ist stetig.
4. Die Funktion f : R → R,
f (x) =
exp(x5 )
2 + |x|
ist stetig.
Zum Schluss dieses Abschnitts bemerken wir noch, dass man all diese Ergebnisse direkt ins Komplexe übertragen kann. Die Definition der Stetigkeit ist
genau die gleiche:
Definition 5.7 Es sei nun D ⊂ C, z0 ∈ D. Eine Funktion f : D → C heißt
stetig im Punkt z0 ∈ D, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass für alle
z ∈ D mit |z − z0 | < δ gilt |f (z) − f (z0 )| < ε, d.h.:
∀ ε > 0 ∃ δ > 0 ∀ z ∈ D : |z − z0 | < δ ⇒ |f (z) − f (z0 )| < ε.
f : D → C heißt stetig, wenn f in jedem Punkt aus D stetig ist.
Bemerkung. Genau wie zuvor zeigt man, dass die Stetigkeit in einem Punkt z0 ∈
D zu limz→z0 f (z) = f (z0 ) äquivalent ist und dass aus stetigen Funktionen (durch
Addition, Subtraktion, Multiplikation und Division wie auch durch Komposition)
zusammengesetzte Funktionen wieder stetig sind.
Genau die gleiche Argumentation wir im Reellen zeigt, dass die Exponentialfunktion exp : C → C auch im Komplexen stetig ist.
87
5.2
Stetige Funktionen auf kompakten Intervallen
Wir untersuchen nun drei grundlegende Sätze über stetige Funktionen auf einem
abgeschlossenen beschränkten Intervall [a, b]. Ein solches Intervall nennt man
auch kompakt. Für den folgenden Abschnitt fixieren wir a, b ∈ R mit a < b.
Die im Folgenden wesentliche Eigenschaft solcher Intervalle ist das folgende
Korollar zum Satz von Bolzano-Weierstraß, das man auch selbst oft wieder einfach
‘Satz von Bolzano-Weierstraß’ nennt.
Korollar 5.8 Jede Folge in [a, b] besitzt eine in [a, b] konvergente Teilfolge.
Beweis. Nach Satz 4.23 besitzt jede Folge in [a, b] eine konvergente Teilfolge, deren
Limes nach Korollar 4.11 selbst in [a, b] liegt.
Der erste Satz befasst sich mit der Existenz von Minima und Maxima stetiger
Funktionen.
Definition 5.9 Ist M eine Menge, f : M → R eine Abbildung, so nennt man
f (nach oben/nach unten) beschränkt, wenn f (M ) (nach oben/unten) beschränkt
ist.
Satz 5.10 Es sei f : [a, b] → R stetig.
(i) Dann ist f beschränkt.
(ii) f nimmt ihr Minimum und Maximum an, d.h. es gibt Punkte xmin ∈ [a, b]
und xmax ∈ [a, b] mit
f (xmin ) = min f ([a, b])
f (xmax ) = max f ([a, b]).
sowie
Achtung: Für beide Aussagen ist es wichtig, dass das Intervall [a, b] kompakt,
also abgeschlossen und beschränkt, ist! (Z.B. ist das Intervall (0, 1] beschränkt,
die Funktion (0, 1] → R, x 7→ x1 aber stetig und unbeschränkt. Weiterhin ist R ein
abgeschlossenes Intervall, die identische Funktion auf R jedoch ebenso stetig und
unbeschränkt.) Des Weiteren sind die Extremalstellen xmin , xmax im Allgemeinen
nicht eindeutig.
Beweis von Satz 5.10. Setze M = sup f ([a, b]). Dann gibt es zu jedem n ∈ N ein
xn ∈ [a, b] mit
M−
1
≤ f (xn ) ≤ M,
n
falls M < ∞,
bzw.
88
n ≤ f (xn ),
falls M = ∞.
In jedem Fall gilt also f (xn ) → M mit n → ∞. Nach dem Satz von BolzanoWeierstraß in der Form von Korollar 5.8 gibt es eine Teilfolge (xnk ) mit xnk →
xmax für ein xmax ∈ [a, b]. Aus der Stetigkeit von f folgt nun
f (xmax ) = lim f (xnk ) = M
k→∞
und damit erstens M = f (xmax ) < ∞, so dass f nach oben beschränkt ist, und
zweitens f (xmax ) = M = max f ([a, b]).
Wendet man das eben Gezeigte auf −f an, so zeigt sich, dass f auch nach
unten beschränkt ist und auch sein Minimum annimmt.
Der zweite Satz garantiert unter geeigneten Voraussetzungen, dass eine Gleichung von der Form
f (x) = 0
eine Lösung in [a, b] besitzt. (Er zeigt sogar, wie man etwa mit Hilfe des sogenannten Intervallhalbierungsverfahren eine solche Lösung numerisch berechnen
kann.)
Satz 5.11 (Zwischenwertsatz) Es sei f : [a, b] → R stetig. Es gelte entweder
f (a) > 0 und f (b) < 0
oder
f (a) < 0 und f (b) > 0.
Dann gibt es ein x0 ∈ (a, b) mit f (x0 ) = 0.
Wir zeigen zunächst ein auch für sich genommen interessantes Lemma über
stetige Funktionen.
Lemma 5.12 Es sei f : D → R in x0 ∈ D stetig mit f (x0 ) > 0. Dann gibt es
ein δ > 0 mit
f (x) > 0
∀ x ∈ D ∩ (x0 − δ, x0 + δ).
(Indem man dies auf −f anwendet, ergibt sich eine analoge Aussage für f (x0 ) <
0.)
Beweis. Setze ε = f (x0 ). Dann gibt es nach der Definition der Stetigkeit in x0
ein δ > 0 mit
f (x) = f (x0 ) + f (x) − f (x0 ) ≥ f (x0 ) − |f (x) − f (x0 )| > f (x0 ) − ε = 0
für alle x ∈ D mit |x − x0 | < δ.
Beweis von Satz 5.11. Es sei f (a) > 0 und f (b) < 0. Setze
A := {x ∈ [a, b] : f (x) ≥ 0}
und
x0 := sup A.
Wegen a ∈ A ist A nicht leer. Wir wählen (ähnlich wir im Beweis von Satz 5.10)
eine Folge (xn ) in A mit limn→∞ xn = x0 . Da für jedes n gilt f (xn ) ≥ 0, muss
auch
f (x0 ) = lim f (xn ) ≥ 0
n→∞
89
gelten. Insbesondere folgt x0 6= b. Wäre aber f (x0 ) > 0, so gäbe es nach Lemma
5.12 ein δ > 0 mit (x0 − δ, x0 + δ) ∩ [a, b] ⊂ A im Widerspruch zu x0 = sup A.
Dies zeigt, dass in der Tat f (x0 ) = 0 ist. Wegen f (a), f (b) 6= 0, ist sogar
x0 ∈ (a, b).
Ist umgekehrt f (a) < 0 und f (b) > 0, so folgt die Behauptung, indem wir das
eben Gezeigte auf −f anwenden.
Tatsächlich folgt hieraus direkt, dass f alle Werte zwischen f (a) und f (b)
annimmt:
Korollar 5.13 Es sei f : [a, b] → R stetig. Setze c = min{f (a), f (b)}, d =
max{f (a), f (b)}. Dann gilt [c, d] ⊂ f ([a, b]).
Beweis. Natürlich ist immer {c, d} = {f (a), f (b)} ⊂ f ([a, b]). Es bleibt zu zeigen,
dass, falls c 6= d, auch (c, d) ⊂ f ([a, b]) gilt.
Es sei also y ∈ (c, d). Definiere g : [a, b] → R durch g(x) := f (x) − y. Dann
ist g stetig und es gilt entweder g(a) = f (a) − y < 0 und g(b) = f (b) − y > 0
oder umgekehrt g(a) > 0 und g(b) < 0. Nach dem Zwischenwertsatz gibt es also
tatsächlich ein x0 ∈ (a, b) mit
0 = g(x0 ) = f (x0 ) − y.
Beachten Sie, dass f auch größere und kleinere Werte annehmen kann.
Der letzte wichtige Satz in diesem Abschnitt zeigt, dass stetige Funktionen
auf abgeschlossenen beschränkten Intervallen sogar einer verschärften Version
der Stetigkeit genügen, die besagt, dass das δ zu ε unabhängig vom betrachteten
Punkt x0 gewählt werden kann.
Zur Erinnerung formulieren wir noch einmal die Bedingung, dass eine Funktion f : D → R, D ⊂ R, stetig ist:
∀ x ∈ D ∀ ε > 0 ∃ δ > 0 ∀ x0 ∈ D : |x0 − x| < δ ⇒ |f (x0 ) − f (x)| < ε.
Definition 5.14 Eine Funktion f : D → R heißt gleichmäßig stetig, wenn es
zu jedem ε > 0 ein δ > 0 gibt, so dass für alle x, x0 ∈ D mit |x − x0 | < δ gilt
|f (x) − f (x0 )| < ε, d.h.:
∀ ε > 0 ∃ δ > 0 ∀ x ∈ D ∀ x0 ∈ D : |x0 − x| < δ ⇒ |f (x0 ) − f (x)| < ε.
Beispiele.
1. Offensichtlich ist jede gleichmäßig stetige Funktion auch stetig. (Die Umkehrung aber gilt, wie wir gleich sehen werden, nicht!)
2. Die Beispiele 1, 2 und 3 von Seite 83-84 (konstante Funktionen, identische
Funktion und Absolutbetrag) sind – wie wir dort schon gezeigt haben –
sogar gleichmäßig stetig.
90
3. Die Funktion f : R → R, f (x) = x2 aus Beispiel 4 von Seite 84 ist nicht
gleichmäßig stetig.
Für ε = 1 und jedes δ > 0 können wir nämlich x =
wählen, so dass |x0 − x| = 2δ < δ, aber auch
|f (x0 ) − f (x)| =
1
δ
+
1
δ
und x0 =
1
δ
+
δ
2
δ 2 1 2
δ2
−
=1+
>ε
2
δ
4
ist.
Satz 5.15 Jede stetige Funktion f : [a, b] → R ist sogar gleichmäßig stetig.
Beweis. Angenommen f ist nicht gleichmäßig stetig. Dann gibt es ein ε > 0, so
dass es zu jedem n ∈ N Punkte xn , x0n ∈ [a, b] gibt mit (wähle δ = n1 )
|x0n − xn | <
1
n
aber
|f (x0n ) − f (xn )| ≥ ε.
Nach dem Satz von Bolzano-Weierstraß in der Form von Korollar 5.8 gibt es eine
Teilfolge (xnk ) in [a, b] mit limk→∞ xnk = x für ein x ∈ [a, b]. Wegen |x0n − xn | <
1
→ 0 mit n → ∞, folgt dann aber auch limk→∞ x0nk = x. Aus der Stetigkeit von
n
f (und dem Absolutbetrag) folgt nun der Widerspruch
lim |f (x0nk ) − f (xnk )| = |f (x) − f (x)| = 0.
{z
}
k→∞ |
≥ε für alle n
Achtung: Wieder ist es wichtig vorausszusetzen, dass das betrachtete Intervall
abgeschlossen und beschränkt ist! Z.B. ist (0, 1) → R, x 7→ x1 nicht gleichmäßig
stetig. (Übungsaufgabe: Überlegen Sie sich das!) Beispiel 3 von Seite 91 zeigt,
dass auch die Beschränktheit notwendig ist.
√
Beispiel. Für jedes k ∈ N0 ist f : [0, ∞) → R, f (x) = k x gleichmäßig stetig.
(Übung!)
5.3
Monotonie und Umkehrfunktionen
Wir untersuchen nun bijektive Abbildungen f , für die sich die Zuordnungsvorschrift x 7→ f (x) umkehren lässt. Allgemein definiert man:
Definition 5.16 Ist f : M → N eine bijektive Abbildung zwischen Mengen M
und N , so ist die Umkehrfunktion f −1 : N → M definiert durch
f −1 (y) = x ⇔ f (x) = y.
91
Definition 5.17 Es sei D ⊂ R. Eine Funktion f : D → R heißt
(i) monoton wachsend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) ≤ f (x0 ),
(ii) streng monoton wachsend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) < f (x0 ),
(iii) monoton fallend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) ≥ f (x0 ), und
(iv) streng monoton fallend, wenn ∀ x, x0 ∈ D : x < x0 ⇒ f (x) > f (x0 ).
Beispiele.
1. f : [0, ∞) → R, f (x) = xk (k ∈ N) ist streng monoton wachsend.
2. f : (0, ∞) → R, f (x) = x−k (k ∈ N) ist streng monoton fallend.
3. exp : R → R ist streng monoton wachsend:
Für x < x0 ist x0 − x > 0 und daher exp(x0 − x) =
aber ist auch
P∞
n=0
(x0 −x)n
n!
> 1. Damit
exp(x0 ) = exp(x + x0 − x) = exp(x) exp(x0 − x) > exp(x).
Satz 5.18 Es seien D ⊂ R und f : D → R streng monoton wachsend (oder
fallend).
(i) Dann ist f : D → f (D) bijektiv und f −1 : f (D) → D ebenfalls streng
monoton wachsend (bzw. fallend).
(ii) Ist f stetig und D = [a, b] ein kompaktes Intervall, so ist auch f −1 stetig
und f (D) = [f (a), f (b)] (bzw. f (D) = [f (b), f (a)]).
Hierbei ist mit f : D → f (D) diejenige Funktion gemeint, die aus f : D → R
entsteht, wenn man den Bildbereich R auf das Bild f (D) einschränkt. Streng
genommen sind das zwei verschieden Funktionen, wenn nicht gerade f (D) = R
ist. Für die Stetigkeit oder Monotonie einer Funktion ist diese Unterscheidung
jedoch offenbar irrelevant. Genauso können wir f −1 auch wieder als Funktion
f −1 : f (D) → R mit Wertebereich R auffassen.
Beweis. (i) Wir behandeln nur den Fall, dass f streng monoton wächst. Der
andere Fall ergibt sich völlig analog dazu (oder daraus durch Übergang zu −f .)
Als streng monoton wachsende Funktion ist f injektiv. Offensichtlich ist f : D →
f (D) (nach Konstruktion) auch surjektiv, also bijektiv. Sind nun y, y 0 ∈ f (D) mit
y < y 0 , etwa f (x) = y und f (x0 ) = y 0 , so folgt f −1 (y) < f −1 (y 0 ), denn anderenfalls
wäre x = f −1 (y) ≥ f −1 (y 0 ) = x0 und damit y = f (x) ≥ f (x0 ) = y 0 .
(ii) Setze [c, d] = [f (a), f (b)] (bzw. [c, d] = [f (b), f (a)]). Aus der Monotonie
von f folgt f (D) ⊂ [c, d]. Andererseits gilt nach Korollar 5.13 auch [c, d] ⊂ f (D).
92
Wäre nun f −1 nicht stetig, so gäbe es ein y ∈ [c, d] und eine Folge (yn ) in
[c, d] mit yn → y aber f −1 (yn ) 6→ f −1 (y). D.h. es gäbe ein ε > 0 und unendlich
viele Indizes n1 < n2 < . . . mit |f −1 (ynk ) − f −1 (y)| ≥ ε für alle k ∈ N. Nach
dem Satz von Bolzano-Weierstraß gibt es dann eine Teilfolge (f −1 (ynkj ))j∈N von
(f −1 (ynk ))k∈N mit limj→∞ f −1 (ynkj ) = x für ein x ∈ [a, b]. Aus der Stetigkeit von
f ergibt sich dann aber
f (x) = lim f (f −1 (ynkj )) = lim ynkj = y
j→∞
j→∞
und hieraus
lim f −1 (ynkj ) = x = f −1 (y)
j→∞
im Widerspruch zu |f −1 (ynk ) − f −1 (y)| ≥ ε für alle k ∈ N.
Beachten Sie: Für die Stetigkeit der Umkehrfunktion ist es wichtig vorauszusetzen, dass D ein Intervall ist. Z.B. ist die Umkehrfunktion der stetigen und
streng wachsenden Funktion
(
x
für 0 ≤ x ≤ 1,
f : [0, 1] ∪ (2, 3] → [0, 2],
f (x) =
x − 1 für 2 < x ≤ 3,
gegeben durch
f −1 : [0, 2] → [0, 1] ∪ (2, 3],
(
x
für 0 ≤ x ≤ 1,
f −1 (x) =
x + 1 für 1 < x ≤ 1,
und somit nicht stetig.
Beispiele.
1. Die Umkehrfunktion von f : [0, ∞) → [0, ∞), f (x) = xk (k ∈ N) ist
√
f −1 : [0, ∞) → [0, ∞), f −1 (y) = k y.
2. Die Exponentialfunktion bildet R bijektiv auf (0, ∞) ab.
Wir
schon, dass exp(R) ⊂ (0, ∞) ist, s. Satz 4.47(ii). Wegen exp(k) =
P∞ wissen
kn
1
≥
k und damit auch exp(−k) = exp(k)
≤ k1 , ergibt sich aus Satz
n=0 n!
5.18(ii)
[
[ h1 i
, k = (0, ∞).
exp(R) ⊃
exp([−k, k]) ⊃
k
k∈N
k∈N
Das letzte Beispiel gibt zur Definition einer wichtigen Funktion Anlass.
Definition 5.19 Die Umkehrfunktion der Exponentialfunktion heißt der natürliche
Logarithmus. Sie wird mit log : (0, ∞) → R oder auch mit ln : (0, ∞) → R bezeichnet.
93
Nach Satz 5.18 ist log stetig und streng monoton wachsend. Aus der Funktionalgleichung für exp (‘Summen werden zu Produkten’, vgl. Satz 4.46) gewinnt
man die entsprechende Funktionalgleichung für log (‘Produkte werden zu Summen’).
Satz 5.20 Für x, x0 > 0 gilt log(xx0 ) = log(x) + log(x0 ).
Beweis. Es ist
exp(log(xx0 )) = xx0 = exp(log(x)) exp(log(x0 )) = exp(log(x) + log(x0 )).
Da exp bijektiv ist, folgt hieraus auch log(xx0 ) = log(x) + log(x0 ) wie behauptet.
Mit Hilfe der Exponential- und Logarithumsfunktion lassen sich nun beliebige
allgemeine Potenzen definieren.
Definition 5.21 Für a > 0 und b ∈ R definieren wir die reelle Zahl ab (sprich:
‘a hoch b’) durch
ab := exp(b log(a)).
Beachte, dass dies für b ∈ Z wegen (vgl. den Beweis von Satz 4.47)
exp(b log(a)) = (exp(log(a)))b = ab
mit unserer früheren Definition übereinstimmt. Für b =
√
1
a n = n a, denn
1
an
n
=
exp
1
n
log a
n
1
n
(n ∈ N) ist außerdem
1
= exp n · log a = exp(log a) = a.
n
Insbesondere ist für a = e = exp(1) und somit log(e) = 1
exp(x) = exp(x log(e)) = ex
für alle x ∈ R. Allgemeiner schreibt man auch für z ∈ C
exp(z) = ez .
Wir bemerken noch, dass sich unmittelbar aus dieser Definition das Rechengesetz
log(ab ) = b log(a).
ergibt.
94
Satz 5.22
(i) Es sei b ∈ R fixiert. Die allgemeine Potenzfunktion
x 7→ xb
(0, ∞) → (0, ∞),
ist stetig, für b > 0 streng monoton wachsend und für b < 0 streng monoton
fallend. Es gilt
xb (x0 )b = (xx0 )b
für alle x, x0 > 0.
(ii) Es sei a > 0 fixiert. Die Exponentialfunktion zur Basis a
x 7→ ax
R → (0, ∞),
ist stetig, für a > 1 streng monoton wachsend und für 0 < a < 1 streng
monoton fallend. Es gilt
0
ax+x = ax ax
0
0
axx = (ax )x
sowie
0
für alle x.x0 ∈ R.
Beweis. Setze pb : (0, ∞) → (0, ∞), pb (x) = xb und expa : R → (0, ∞), expa (x) =
ax .
Die Stetigkeit von pb und expa ergibt sich daraus, dass sich diese Funktionen
als Verkettung stetiger Funktionen schreiben lassen. Ist nämlich fc : R → R für
(festes) c ∈ R gegeben durch fc (x) = cx, so ist
pb = exp ◦fb ◦ log
und
expa = exp ◦flog a .
Übungsaufgabe: Beweisen Sie die übrigen Aussagen!
5.4
Asympotisches Verhalten
In diesem Abschnitt untersuchen und vergleichen wir das Verhalten von xα ,
exp(x) und log(x) für betragsmäßig sehr kleine oder sehr große Werte von x
und insbesondere im Limes x → 0 und x → ∞. Dazu müssen wir zunächst auch
uneigentliche Funktionengrenzwerte definieren.
Definition 5.23 Es seien D ⊂ R, f : D → R.
(i) Ist x0 ∈ D und c ∈ {−∞, +∞}, so schreiben wir
lim f (x) = c,
x→x0
wenn für jede Folge (xn ) in D, die gegen x0 konvergiert, gilt limn→∞ f (xn ) =
c (im uneigentlichen Sinne).
95
(ii) Ist D nach unten (oder oben) unbeschränkt und c ∈ R ∪ {−∞, +∞}, so
schreiben wir
lim f (x) = c
bzw.
x→−∞
lim f (x) = c,
x→+∞
wenn für jede Folge (xn ) in D, die gegen −∞ bzw. +∞ uneigentlich konvergiert, gilt limn→∞ f (xn ) = c (im eigentlichen oder uneigentlichen Sinne).
Beachten Sie, dass diese Grenzwerte und sogar die bloße Existenz dieser
Grenzwerte vom Definitionsbereich D abhängt. Man schreibt die Bedingung x ∈
D zur Verdeutlichung daher auch oft explizit unter das Limeszeichen.
Beispiele.
1. Für D = (0, +∞) ist
lim
x→0
x∈D
1
1
= lim
= +∞,
x→0 x
x
x>0
für D = (−∞, 0) aber
lim
x→0
x∈D
1
1
= lim
= −∞.
x→0 x
x
x<0
Für D = R \ {0} existiert lim x→0
x∈D
1
x
= lim x→0
x6=0
1
x
nicht.
2. Es sei D = R und p : R → R, p(x) = an xn + . . . a1 x + a0 ein Polynom mit
an > 0. Dann ist
(
+∞, falls n gerade ist,
lim p(x) = ∞
und
lim p(x) =
x→∞
x→−∞
−∞, falls n ungerade ist.
Übungsaufgabe: Zeigen Sie dies!
Wir vergleichen nun das Wachstumsverhalten der Exponential-, Potenz- und
Logarithumsfunktion für x → 0 und x → ∞.
Satz 5.24 Für jedes α ∈ R gilt
ex
= ∞.
x→∞ xα
Man sagt daher, die Exponentialfunktion wachse stärker als jede Potenz.
Beweis. Wir wählen k ∈ N mit k ≥ α. Für x ≥ 1 ist nach Satz 5.22(ii)
lim
x
e =
∞
X
xn
n=0
xk+1
xxα
>
≥
,
n!
(k + 1)!
(k + 1)!
ex
x
d.h. xα ≥ (k+1)!
. Ist nun (xn ) eine Folge mit xn → ∞ und also auch
xn
so folgt hieraus auch limn→∞ exα = +∞.
n
96
xn
(k+1)!
→ ∞,
Korollar 5.25 Für jedes α ∈ R gilt
lim xα e−x = 0
1
lim
xα e x = +∞.
x→0
und
x→∞
x>0
Beweis. Die erste Behauptung folgt aus xα e−x =
Die Zweite ergibt sich (mit y = x1 ) aus
1
x−α ex
für x > 0 und Satz 5.24.
1
lim
xα e x = lim y −α ey = ∞
x→0
x>0
y→∞
nach Satz 5.24.
Eine weitere unmittelbare Konsequenz ist das
Korollar 5.26 Es gilt
(i) limx→+∞ ex = +∞ und limx→−∞ ex = 0 sowie
(ii) limx→+∞ log x = +∞ und lim x→0 log x = −∞.
x>0
Beweis. (i) folgt sofort aus Satz 5.24 und Korollar 5.25 im Falle α = 0.
(ii) Ist (xn ) eine Folge mit xn → ∞ und K > 0, so gibt es ein N ∈ N mit
xn > eK für alle n ≥ N . Aus der Monotonie des Logarithmus folgt dann aber
auch
log xn ≥ log eK = K
für n ≥ N . Dies zeigt limx→+∞ log x = +∞. Die zweite Behauptung ergibt sich
hieraus, denn es ist
lim
log x = lim log(y −1 ) = − lim log y = −∞.
x→0
y→+∞
x>0
y→+∞
Korollar 5.27
(i) Für jedes α > 0 gilt
lim xα = +∞
lim
xα = 0.
x→0
und
x→+∞
x>0
(ii) Für jedes α < 0 gilt
lim xα = 0
x→+∞
und
lim
xα = +∞.
x→0
x>0
97
Beweis. (i) Ist (xn ) eine Folge mit xn → +∞, so folgt log xn → ∞ wie eben
gesehen und damit auch
xαn = eα log xn → ∞.
Dies zeigt limx→+∞ xα = +∞. Daraus folgt auch
1
= 0.
y→∞ y α
lim
xα = lim (y −1 )α = lim
x→0
y→∞
x>0
(ii) Dies folgt aus (i) wegen
lim xα = lim
y −α = 0
y→0
x→+∞
und
y>0
lim
xα = lim y −α = +∞.
x→0
y→+∞
x>0
Wir können also die Potenzfunktion x →
7 x für positive α auf [0, ∞) stetig
α
fortsetzen, indem wir 0 := 0 vereinbaren.
α
Korollar 5.28 Für jedes α > 0 gilt
log x
=0
x→+∞ xα
lim
und
lim
xα log x = 0.
x→0
x>0
Das heißt: Der Logarithmus wächst im Unendlichen langsamer als jede positive Potenz; für x → 0 divergiert er langsamer gegen Unendlich als jede positive
Potenz gegen 0 konvergiert.
Beweis. Mit x → ∞ gilt auch α log x → ∞ und daher nach Korollar 5.25
1 α log x
log x
= lim
· α log x = 0.
α
x→+∞ x
x→+∞ α
e
lim
Hieraus ergibt sich auch
lim
xα log x = lim y −α log(y −1 ) = lim
x→0
x>0
y→∞
y→∞
− log y
= 0.
yα
5.5
Trigonometrische Funktionen
Wir definieren nun die trigonometrischen Funktionen sin, cos und tan und untersuchen einige ihre Eigenschaften.
Für x ∈ R ist |eix |2 = eix eix = eix e−ix = e0 = 1. eix liegt also auf dem
Einheitskreis in der komplexen Ebene.
98
Definition 5.29 Die Cosinusfunktion cos : R → R und die Sinusfunktion sin :
R → R sind definiert durch
cos x = Re eix
sin x = Im eix
und
für x ∈ R.
Unmittelbar aus der Definition ergeben sich die im folgenden Satz zusammengestellten Eigenschaften.
Satz 5.30 Für alle x ∈ R gelten
(i) die Eulersche Fomel
eix = cos x + i sin x,
(ii) cos x = 12 (eix + e−ix ) und sin x =
1
(eix
2i
− e−ix ),
(iii) cos(−x) = cos x und sin(−x) = − sin x,
(iv) der ‘trigonometrische Pythagoras’
cos2 x + sin2 x = 1,
(mit cos2 x = (cos x)2 und sin2 x = (sin x)2 ) sowie
(v) cos(0) = 1 und sin(0) = 0.
Beweis. Klar.
Satz 5.31 cos und sin sind stetig.
Beweis. Ist (xn ) eine reelle Folge mit xn → x, so folgt aus der Bemerkung von
Seite 87 und Satz 4.22
cos xn = Re eixn → Re eix = cos x
und
sin xn = Im eixn → Im eix = sin x.
Endlich können wir nun auch die schon am Ende von Abschnitt 3.5 benutzten
Additionstheoreme für den Cosinus und den Sinus beweisen.
Satz 5.32 Für x, y ∈ R gelten
cos(x + y) = cos x cos y − sin x sin y
sin(x + y) = sin x cos y + cos x sin y.
99
und
Beweis. Aus der Eulerschen Formel und der Funktionalgleichung der Exponentialfunktion folgt
cos(x + y) = i sin(x + y) = ei(x+y) = eix eiy
= (cos x + i sin x)(cos y + i sin y)
= cos x cos y − sin x sin y + i(sin x cos y + cos x sin y),
woraus die Behauptung folgt, indem man Real- und Imaginärteil vergleicht. Aus der Exponentialreihe lässt sich auch eine Reihendarstellung für cos und
sin ableiten:
Satz 5.33 Für jedes x ∈ R ist
cos x =
sin x =
∞
X
n=0
∞
X
(−1)n
x2n
x2 x4
=1−
+
− +...
(2n)!
2!
4!
(−1)n
x2n+1
x3 x 5
=x−
+
− +....
(2n + 1)!
3!
5!
n=0
und
Diese Reihen konvergieren absolut.
Beweis. Die absolute Konvergenz dieser Reihen folgt sofort aus der absoluten
Konvergenz der Exponentialreihe und dem Majorantenkriterium.
Für alle N ∈ N gilt
2N
+1
X
n=0
N
N
2n
X
(ix)n X
x2n+1
n x
(−1)
(−1)n
=
+i
,
n!
(2n)!
(2n + 1)!
n=0
n=0
woraus im Limes N → ∞
cos x + i sin x = eix =
∞
X
(ix)n
n=0
n!
=
∞
X
n=0
(−1)n
∞
X
x2n
x2n+1
+i
(−1)n
(2n)!
(2n + 1)!
n=0
folgt. Die Behauptung ergibt sich nun durch Vergleich des Real- und Imaginärteils.
Zur näherungsweisen Berechnung dieser Reihen durch ihre Partialsummen,
beweisen wir noch eine Restgliedabschätzung. Dazu setzen wir
R2N +2 (x) := cos x −
N
X
n=0
(−1)n
∞
X
x2n
x2n
=
(−1)n
,
(2n)! n=N +1
(2n)!
N
∞
2n+1
X
X
x2n+1
n x
R2N +3 (x) := sin x −
(−1)
=
(−1)n
.
(2n + 1)! n=N +1
(2n + 1)!
n=0
100
Satz 5.34 Für |x| ≤ 2N + 3 bzw. |x| ≤ 2N + 4 gilt
2N +2 2N +3 x
x
.
|R2N +2 (x)| ≤ bzw.
|R2N +3 (x)| ≤ (2N + 2)!
(2N + 3)! Beweis. Setze an =
|x| ≤ 2N + 4 ist
|x|2n
,
(2n)!
bn =
|x|2n+1
.
(2n+1)!
Für n ≥ N + 1 und |x| ≤ 2N + 3 bzw.
|x|2
(2N + 3)2
an ≤
an ≤ an
(2n + 1)(2n + 2)
(2N + 3)(2N + 4)
|x|2
(2N + 4)2
=
bn ≤
bn ≤ bn ,
(2n + 2)(2n + 3)
(2N + 4)(2N + 5)
an+1 =
bn+1
bzw.
d.h. (an )n≥N +1 und (bn )n≥N +1 sind monoton fallende Nullfolgen. Aus der Abschätzung
im Leibnizkriterium (Satz 4.37, der auch für m = n0 −1 richtig bleibt) folgt daher
2N +2 ∞
2n X
x
n
≤ x
bzw.
|R2N +2 (x)| = (−1)
(2N + 2)! (2n)!
n=N +1
∞
2N +3 2n+1 X
x
n
≤ x
.
|R2N +3 (x)| = (−1)
(2n
+
1)!
(2N
+
3)!
n=N +1
Wir wissen schon, dass sin(0) = 0 und cos(0) = 1 ist. Genauer können wir
nun folgern:
Korollar 5.35 Es gilt
lim
x→0
x6=0
sin x
=1
x
Beweis. Wegen |R3 (x)| ≤
2
cos x−(1− x )
|x|3
3!
und
lim
x→0
x6=0
1
1 − cos x
=
.
x2
2
für |x| ≤ 3 ist | sin xx−x | ≤
|x|2
6
und wegen |R4 (x)| ≤
x4
4!
2
2
für |x| ≤ 4 ist |
| ≤ |x|
. Hieraus folgt die Behauptung.
x2
24
Als weitere Folgerung halten wir fest, dass der Cosinus auf dem Intervall [0, 2]
sein Vorzeichen wechselt.
Lemma 5.36 Der Cosinus besizt im Intervall [0, 2] eine Nullstelle.
Beweis. Nach Satz 5.30 ist cos(0) = 1. Andererseits gilt nach Satz 5.34 |R4 (2)| ≤
24
und somit
4!
22 24
2
1
cos(2) ≤ 1 −
+
= 1 − 2 + = − < 0.
2!
4!
3
3
Die Behauptung folgt daher aus dem Zwischenwertsatz.
101
Definition 5.37 Die Kreiszahl π ist definiert als das Doppelte der kleinsten positiven Nullstelle von cos:
π := 2 min{x > 0 : cos x = 0}.
Beachte, dass das Minimum der Menge M := {x > 0 : cos x = 0} tatsächlich
existiert. Nach Lemma 5.36 ist M nicht leer. Setzt man x = inf M (≥ 0) und
wählt man eine Folge (xn ) aus M mit xn → x, so folgt aus der Stetigkeit des
Cosinus auch cos x = 0. Wegen cos(0) = 1 6= 0 muss außerdem x > 0 sein. Es ist
also x ∈ M und damit x = min M .
iπ
Satz 5.38 Es gilt e 2 = i.
Beweis. Wegen cos π2 = 0 ist nach Satz 5.30(iv) sin π2 = ±1. Satz 5.34 liefert nun
für x = π2 ≤ 2
x2 x
sin x = x + R3 (x) ≥ x 1 −
≥ >0
| {z 6 } 3
≥1− 46 = 13
iπ
und somit sin π2 = 1. Dies zeigt e 2 = cos π2 + i sin π2 = i.
Hieraus ergibt sich allgemein e
x
eix
cos(x)
sin(x)
···
···
···
···
iπn
2
0
1
1
0
= in für n ∈ Z und daraus die Wertetabelle
π
2
i
0
1
3π
π
2π
2
−1 −i 1
−1 0
1
0 −1 0
···
···
···
···
Insbesondere gilt die wunderschöne Formel
eiπ + 1 = 0,
die die Eulersche Zahl e, die Kreiszahl π, die imaginäre Einheit i, das neutrale
Element 1 bezüglich der Multiplikation und das neutrale Element 0 bezüglich der
Addition verbindet.
Als Folgerung aus dieser Wertetabelle und Satz 5.38 erhalten wir weitere
Eigenschaften der Cosinus- und Sinusfunktion
Korollar 5.39 Für x ∈ R gilt
(i) cos(x + 2π) = cos x und sin(x + 2π) = sin(x),
(ii) cos(x + π) = − cos x und sin(x + π) = − sin(x),
(iii) cos(x + π2 ) = − sin x und sin(x + π2 ) = cos x,
(iv) cos( π2 − x) = sin x und sin( π2 − x) = cos(x).
102
Beweis. Die Aussagen (i)–(iv) folgen direkt aus den Additionstheoremen, der
oben angegebenen Wertetabelle und Satz 5.30(iii). Z.B. folgt die erste Gleichung
in (iv) aus
cos(
π
π
π
− x) = cos cos(−x) − sin sin(−x) = sin x.
2
| {z 2}
| {z2} | {z }
=0
=1
=− sin x
Bemerkung. (i) besagt, dass die Funktionen cos und sin 2π-periodisch sind.
Allgemein nennt man eine Funktion f : R → R p-periodisch für ein p ∈ R, wenn
gilt
f (x + p) = f (x) ∀ x ∈ R.
Wir charakterisieren nun noch die Nullstellenmengen sowie die Positivitätsund Negativitätsbereiche von cos und sin. Wegen der 2π-Periodizität genügt es
hier, das Intervall [0, 2π) zu betrachten.
Satz 5.40 Auf [0, 2π) gilt

3π
π

> 0 für x ∈ [0, 2 ) ∪ ( 2 , 2π),
cos x = 0 für x ∈ { π2 , 3π
},
2


π 3π
< 0 für x ∈ ( 2 , 2 ),


> 0 für x ∈ (0, π),
sin x = 0 für x ∈ {0, π},


< 0 für x ∈ (π, 2π).
Beweis. Wegen sin(0) = 0 ist nach Korollar 5.39(ii) auch sin(π) = 0.
Andererseits ist nach Definition von π und wegen cos x = cos(−x) für alle x
und cos(0) = 1 auch cos x > 0 für − π2 < x < π2 . Nach 5.39(iii) ist daher sin x > 0
für 0 < x < π und damit nach 5.39(ii) auch sin x < 0 für π < x < 2π.
Aus 5.39(i) und (iii) folgen nun auch die entsprechenden Aussagen für den
Cosinus.
Korollar 5.41 Für x ∈ R ist
(i) cos x = 0 ⇔ x ∈
π
2
+ πZ und sin x = 0 ⇔ x ∈ πZ,
(ii) eix = 1 ⇔ x ∈ 2πZ.
Beweis. (i) Klar nach Korollar 5.39(i) und Satz 5.40.
(ii) Es gilt eix = 1 genau dann, wenn cos x = 1 und sin x = 0 ist. Dabei
ist nach (i) sin x = 0 genau dann, wenn x ∈ πZ ist. Nach 5.39(ii) ist außerdem
cos(nπ) = (−1)n für ∈ Z. Hieraus folgt die Behauptung.
Auch die Quotienten von Sinus und Cosinus sind wichtige Größen, weshalb
sie einen eigenen Namen verdienen.
103
Definition 5.42
durch
(i) Die Tangensfunktion tan : R \ ( π2 + πZ) → R ist definiert
tan x =
sin x
.
cos x
(ii) Die Cotangensfunktion cot : R \ πZ → R ist definiert durch
cot x =
cos x
.
sin x
Da diese Funktionen durch cos und sin vollständig beschrieben sind, diskutieren wir ihre Eigenschaften hier nicht im Detail, bemerken aber noch, dass sie
sogar periodisch zur Periode π sind:
tan(x + π) = tan x
bzw.
für alle x, für die dieser Ausdruck definiert ist.
104
cot(x + π) = cot x
Kapitel 6
Differentiation
Wir wollen das Verhalten einer Funktion f : D → R (D ⊂ R) nun lokal, d.h. in
der Nähe eines gegebenen Punktes x0 ∈ D genauer untersuchen. Ist f in x0 stetig,
so bedeutet dies gerade, dass sich f (x) für x nahe x0 durch einen konstanten Wert,
nämlich f (x0 ) approximieren lässt; es gilt dann ja
lim f (x) = f (x0 ).
x→x0
Etwas umständlicher lässt sich das so ausdrücken: In einer (kleinen) Umgebung
(x0 − η, x0 + η) ∩ D lässt sich die Funktion f durch die konstante Abbildung
x 7→ f (x0 ) approximieren.
Damit ist aber noch nicht quantifiziert,
wie gut diese Approximation für
p
x 6= x0 ist. Z.B. ist R → R, x 7→ k |x| stetig in x0 = 0, die Konvergenz
f (x) → f (0) für große k aber sehr langsam.
Dies hat zur Folge, dass der map
k
ximale Approximationsfehler (im Beispiel
|x|) viel größer sein kann als der
Abstand von x zu x0 .
Besonders gutartig sind nun solche Funktionen, für die sich eine lokale Änderungsrate definieren lässt. Das heißt, dass es ein a ∈ R (die ‘Änderungsrate’)
gibt, das das Verhältnis der Differenz der Funktionswerte f (x) − f (x0 ) und der
Differenz der Argumente x − x0 approximiert, so dass also
f (x) − f (x0 )
≈a
x − x0
gilt. (Genauer: Für x → x0 konvergiert die linke Seite gegen a.) Auflösen nach
f (x) ergibt dann
f (x) ≈ f (x0 ) + a(x − x0 ),
wobei der Approximationsfehler sehr viel kleiner als |x − x0 | ist. (Genauer: Nach
Division durch x − x0 konvergiert der Fehler für x → x0 immer noch gegen 0.)
Wie wir sehen werden ist dies für viele Funktionen der Fall, insbesondere für Polynome, rationale Funktionen, trigonometrische Funktionen, allgemeine Potenz105
und Exponentialfunktionen und den Logarithmus. Dies führt zur Definition der
Differenzierbarkeit von f in x0 .
Während die Stetigkeit also eine Approximation von f durch eine konstante
Funktion liefert, erhalten wir aus der letzten Gleichung eine wesentlich genauere
Approximation von f durch die affine Abbildung1 x 7→ f (x0 ) + a(x − x0 ). Es
geht also eigentlich darum, die Funktion f lokal zu ‘linearisieren’ und sie dadurch
weiteren Untersuchungen zugänglicher zu machen.
6.1
Definition, Beispiele und Grundlagen
Definition 6.1 Es seien D ⊂ R und f : D → R.
(i) Es sei x0 ∈ D, so dass es mindestens eine Folge (xn ) in D \ {x0 } gibt mit
xn → x0 . Existiert der Grenzwert
f 0 (x0 ) = x→x
lim
0
x6=x0
f (x) − f (x0 )
x − x0
(x0 )
, so heißt f differenzierbar in x0 . f 0 (x0 )
der Differenzenquotienten f (x)−f
x−x0
heißt der Differentialquotient bei x0 oder auch die Ableitung von f bei x0 .
Statt f 0 (x0 ) schreibt man auch
df
(x0 ).
dx
(ii) Ist f in jedem Punkt x0 ∈ D differenzierbar, so heißt f selbst differenzierbar.
Die Abbildung f 0 : D → R, x 7→ f 0 (x) nennt man dann die Ableitung von
f.
Geometrisch ist der Differenzenquotient die Steigung der Sekante des Graphen
von f durch die Punkte (x0 , f (x0 )) und (x, f (x)). Im Limes x → x0 gehen diese
Sekanten in eine Tangente an den Graphen über, die diesen im Punkt (x0 , f (x0 ))
berührt.
Bemerkungen.
1. Die Bedingung, dass es mindestens eine gegen x0 konvergente Folge in D \
{x0 } geben muss, heißt, dasss x0 kein isolierter Punkt von D ist. Sie ist für
den wichtigsten Fall, dass D ein Intervall ist, immer für alle x0 ∈ D erfüllt.
2. Oft schreibt man den Differentialquotienten in der äquivalenten Form
f (x0 + h) − f (x0 )
,
h→0
h
f 0 (x0 ) = lim
wobei hier h → 0 eigentlich bedeutet h → 0 mit h 6= 0 und x0 + h ∈ D.
1
Abbildungen der Form x 7→ ax + b mit a, b ∈ R nennt man affin.
106
Beispiele.
1. Ist f : R → R konstant, etwa f (x) = c, so gilt für jedes x0 ∈ R
f 0 (x0 ) = x→x
lim
0
x6=x0
f (x) − f (x0 )
= x→x
lim 0 = 0.
0
x − x0
x6=x0
2. Ist f : R → R affin, etwa f (x) = ax + b, so gilt für jedes x0 ∈ R
f (x0 + h) − f (x0 )
a(x0 + h) + b − ax0 − b
= lim
= a.
h→0
h→0
x − x0
h
f 0 (x0 ) = lim
3. Es sei nun f : R → R, f (x) = xn (n ∈ N). Dann ist für jedes x0 ∈ R
(x0 + h)n − xn0
h→0
h
n X
n n−k k
1 n
n−1
x0 + nx0 h +
x0 h − xn0 = nxn−1
.
= lim
0
h→0 h
k
k=2
f 0 (x0 ) = lim
4. Für die Exponentialfunktion ergibt sich für alle x
exp(x + h) − exp(x)
h→0
h
exp(h) − exp(0)
= exp(x),
= exp(x) lim
h→0
h
exp0 (x) = lim
denn für |h| < 1 ist
| exp(h) − 1 − h| ≤
∞
X
|h|k
k=2
∞
X
1
≤ |h|
≤ e|h|2 .
k!
k!
k=2
2
Dies ist eine fundamental wichtige Eigenschaft der Exponentialfunktion: Sie
ist ihre eigene Ableitung!
5. Die Ableitung des Sinus ist der Cosinus. Für x ∈ R ist nämlich
sin(x + h) − sin x
h→0
h
sin x cos h + cos x sin h − sin x
= lim
h→0
h
cos h − 1
sin h
= sin x lim
+ cos x lim
= cos x
h→0
h→0 h
h
sin0 (x) = lim
nach Korollar 5.35.
107
6. Umgekehrt ist die Ableitung des Cosinus das Negative des Sinus. Für x ∈ R
ist nämlich
cos(x + h) − cos x
h→0
h
cos x cos h − sin x sin h − cos x
= lim
h→0
h
sin h
cos h − 1
− sin x lim
= − sin x
= cos x lim
h→0 h
h→0
h
cos0 (x) = lim
nach Korollar 5.35.
7. Die Funktion f : R → R, f (x) = |x| ist im Nullpunkt nicht differenzierbar,
n
denn für xn = (−1)
→ 0 (n → ∞) existiert der Grenzwert von
n
|xn |
f (xn ) − f (0)
=
= (−1)n
xn
xn
nicht. (In jedem Punkt x 6= 0 ist f aber differenzierbar, was man wie in
Beispiel 2 sieht.) Die einseitigen Grenzwerte
lim
x→0
x>0
f (x) − f (0)
=1
x
und
lim
x→0
x<0
f (x) − f (0)
= −1
x
existieren in diesem Beispiel jedoch.
Bemerkung. Im Falle der Existenz nennt man
f+0 (x0 ) = x→x
lim
0
x>x0
f (x) − f (x0 )
x − x0
f−0 (x0 ) = x→x
lim
und
0
x<x0
f (x) − f (x0 )
x − x0
die rechtsseitige bzw. linksseitige Ableitung in x0 .
Wir kommen nun auf unsere eingangs gegebene Motivation der Approximierbarkeit von Funktionen zurück.
Satz 6.2 Es seien x0 ∈ D, so dass es mindestens eine Folge (xn ) in D \ {x0 }
gibt mit xn → x0 , und f : D → R. Genau dann ist f in x0 differenzierbar, wenn
es ein a ∈ R gibt, so dass
f (x) = f (x0 ) + a(x − x0 ) + r(x)
mit einer Funktion r gibt, für die lim x→x
0
x6=x0
0
Ist dies der Fall, so ist a = f (x0 ).
108
r(x)
x−x0
= 0 ist.
In diesem Sinne ist die Abbildung x 7→ f (x0 )+f 0 (x0 )(x−x0 ) die Linearisierung
von f in der Nähe von x0 .2
Beweis. Für a ∈ R ist die gefragte Gleichung gerade für r(x) = f (x) − f (x0 ) −
a(x − x0 ) erfüllt. Aus
r(x)
f (x) − f (x0 )
=
−a
x − x0
x − x0
ergibt sich nun, dass die linke Seite für x → x0 genau dann gegen 0 konvergiert,
wenn f bei x0 differenzierbar ist und a = f 0 (x0 ) gilt.
Diffenzierbare Funktionen sind insbesondere stetig, denn es gilt:
Satz 6.3 Ist D ⊂ R, x0 ∈ D und f : D → R in x0 differenzierbar, so ist f in x0
stetig.
Beweis. Für r wie in Satz 6.2 ist offensichtlich limx→x0 r(x) = 0, da ja sogar
r(x)
= 0 ist, so dass sich im Limes x → x0
lim x→x
0
x−x0
x6=x
0
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + r(x) → f (x0 )
|
{z
} |{z}
→0
→0
ergibt.
Beachten Sie: Die Umkehrung gilt nicht!! (S. Beispiel 7 von Seite 108.)
Ähnlich wie bei der Stetigkeit sind auch aus differenzierbaren Funktionen
zusammengesetzte Funktionen wieder differenzierbar.
Satz 6.4 Es seien f, g : D → R in x0 ∈ D differenzierbare Funktionen und
λ, µ ∈ R. Dann gilt:
(i) Linearität: Auch λf + µg ist bei x0 differenzierbar. Dabei ist
(λf + µg)(x0 ) = λf 0 (x0 ) + µg 0 (x0 ),
(ii) Produktregel: Auch f g ist bei x0 differenzierbar. Es ist
(f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ),
(iii) die Quotientenregel: Falls g(x0 ) 6= 0,
zierbar in x0 mit
f 0
g
2
(x0 ) =
f
g
: {x ∈ D : g(x) 6= 0} → R differen-
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
.
(g(x0 ))2
Be wise, linearize! (Engl. Sprichwort)
109
Beweis. (i) Nach den Grenzwertsätzen gilt in der Tat
lim
x→x0
x6=x0
λf (x) + µg(x) − λf (x0 ) − µg(x0 )
x − x0
= λ x→x
lim
0
x6=x0
f (x) − f (x0 )
g(x) − g(x0 )
+ µ x→x
lim
= λf 0 (x0 ) + µg 0 (x0 )
0
x − x0
x
−
x
0
x6=x0
(ii) Dies folgt aus
f (x)g(x) − f (x0 )g(x0 )
f (x)g(x) − f (x)g(x0 ) + f (x)g(x0 ) − f (x0 )g(x0 )
=
x − x0
x − x0
g(x) − g(x0 )
f (x) − f (x0 )
= f (x)
+g(x0 )
|{z}
x − x0
x − x0
{z
}
|
{z
}
→f (x0 ) |
→g 0 (x0 )
→f 0 (x0 )
→ f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 )
im Grenzwert x → x0 , wobei wir Satz 6.3 benutzt haben.
(iii) Für den Quotienten schließlich betrachten wir zunächst den Fall f = 1.
Nach Satz 6.3 ist dann
1
g(x)
−
1
g(x0 )
x − x0
=
g 0 (x0 )
1
g(x0 ) − g(x)
→−
g(x)g(x )
x − x0
(g(x0 ))2
{z
}
| {z 0 } |
→−g 0 (x0 )
→(g(x0 ))2
für x → x0 . Nach (ii) folgt dann auch für allgemeines f , dass der Quotient fg bei
x0 differenzierbar ist mit
f 0
g 0 (x0 )
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
1
− f (x0 )
=
.
(x0 ) = f 0 (x0 )
g
g(x0 )
(g(x0 ))2
(g(x0 ))2
Es bleibt zu bemerken, dass x0 kein isolierter Punkt von {x ∈ D : g(x) 6= 0} ist.
Wegen g(x0 ) 6= 0 gibt es nach Lemma 5.12 nämlich ein ε > 0, so dass g(x) 6= 0
für alle x ∈ D ∩ (x0 − ε, x0 + ε) ist.
Beispiele.
1. Für f : R \ {0} → R, f (x) = x−n (n ∈ N) ist
1 0
nxn−1
f 0 (x) =
=
−
= −nx−n−1 .
xn
x2n
2. Für x ∈
/
π
2
+ πZ ist
0
tan (x) =
sin x 0
cos x
sin0 (x) cos x − sin x cos0 (x)
cos2 x
2
cos x + sin2 x
1
=
=
.
cos2 x
cos2 x
=
110
Auch die Verkettung differenzierbarer Funktionen ist wieder differenzierbar:
Satz 6.5 Es seien D, E ⊂ R, f : D → E differenzierbar in x0 ∈ D und g : E →
R differenzierbar in f (x0 ). Dann ist g ◦ f differenzierbar in x0 , die Ableitung
berechnet sich nach der Kettenregel:
(g ◦ f )0 (x0 ) = g 0 f (x0 ) f 0 (x0 ).
Beweis. Nach Satz 6.2 gibt es eine Funktion r : E → R mit
g(y) − g f (x0 ) = g 0 f (x0 ) y − f (x0 ) + r(y)
r(y)
y−f (x0 )
= 0. Teilen durch x − x0 führt für y = f (x) auf
f (x) − f (x0 ) r f (x)
g f (x) − g f (x0 )
0
= g f (x0 )
+
.
x − x0
x − x0
x − x0
und limy→f (x0 )
Für x → x0 und damit auch f (x) → f (x0 ) (Satz 6.3) folgt nun wegen
(
r f (x)
0,
falls f (x) = f (x0 ),
=
f (x)−f (x0 )
r(f (x))
x − x0
· x−x0 , falls f (x) 6= f (x0 ),
f (x)−f (x0 )
zunächst lim x→x
0
x6=x
0
r(f (x))
x−x0
= 0 und damit dann
g f (x) − g f (x0 )
lim
= g 0 f (x0 ) f 0 (x0 ).
x→x0
x − x0
x6=x0
Beispiele.
2
1. Die Ableitung von f : R \ {0} → R, f (x) = sin3 (e1/x ) ist gegeben durch
2
2
2
2
f 0 (x) = (sin3 (e1/x ))0 = 3 sin2 (e1/x ) · cos(e1/x ) · e1/x · (−2x−3 ).
2. Für die Exponentialfunktion R → R, x 7→ ax zur Basis a > 0 ist
(ax )0 = (ex log a )0 = (ex log a ) log a = ax log a.
Wir untersuchen nun noch Umkehrfunktionen.
Satz 6.6 Es seien D ⊂ R ein Intervall und f : D → R stetig und streng monoton. Ist f in x ∈ D differenzierbar mit f 0 (x) 6= 0, so ist die Umkehrfunktion
f −1 : f ([a, b]) → R in y = f (x) differenzierbar und es gilt
(f −1 )0 (y) =
1
f 0 (f −1 (y))
111
.
Beweis. Es sei (yn ) eine Folge in f ([a, b]) mit yn → y und yn 6= y für alle n. Setze
xn = f −1 (yn ). Da auch f −1 nach Satz 5.18 stetig und streng monoton ist, gilt
lim xn = lim f −1 (yn ) = f −1 (y) = x
n→∞
n→∞
und
xn 6= x ∀ n ∈ N.
Es folgt
xn − x
f −1 (yn ) − f −1 (y)
= lim
= lim
n→∞ f (xn ) − f (x)
n→∞
n→∞
yn − y
lim
wie behauptet.
Beispiele.
1
f (xn )−f (x)
xn −x
=
1
f 0 (x)
,
1. Für x > 0 ist
log0 (x) =
1
1
=
.
exp0 (log x)
x
2. Hieraus folgt mit Hilfe der Kettenregel für die allgemeine Potenzfunktion
(0, ∞) → R, x 7→ xα (α ∈ R)
α
α
(xα )0 = (eα log x )0 = eα log x · = xα · = αxα−1 .
x
x
3. Eine alternative Darstellung der Exponentialfunktion: Wird ein Euro mit
x (also mit 100x Prozent) verzinst, so erhält man nach einem Jahr 1 +
x Euro. Würden stattdessen die halben Zinsen halbjährig gutgeschrieben,
so erhielte man mit Zins und Zinseszins nach einem Jahr den größeren
Betrag von (1 + x2 )2 Euro. Bei Dritteljähriger Verzinsung mit x3 ergäben
sich (1 + x3 )3 Euro. Würde allgemein n1 -jährig der Zinssatz nx angerechnet,
so ergäbe sich nach einem Jahr ein Guthaben von (1 + nx )n Euro. Man
kann sich nun fragen, welcher Betrag sich erreichen ließe, wenn man immer
kurzfristiger mit dem entsprechenden Bruchteil von x verzinsen würde, also
zum Grenzwert n → ∞ einer instantanen ‘stetigen Verzinsung’ überginge.
Mathematisch ausgedrückt: Was ist
x n
?
lim 1 +
n→∞
n
Die Antwort folgt aus Beispiel 1. Für die logarithmierten Werte ergibt sich
wegen log(1) = 0 demnach nämlich
log(1 + nx ) − log(1)
x
lim n log 1 +
= x lim
= x log0 (1) = x.
x
n→∞
n→∞
n
n
Da exp aber stetig ist, folgt hieraus
x n
x lim 1 +
= exp lim n log 1 +
= ex .
n→∞
n→∞
n
n
(Für x = 0, 02 ist das mit ca. 1.0202 nur geringfügig größer als 1+x = 1, 02.
Viel bringt es also nicht.)
112
Wir bemerken zum Schluss dieses Absatzes noch, dass man den Prozess des
Ableitens natürlich auch iterieren kann: Ist f : D → R differenzierbar, so kann
man überprüfen, ob die Ableitung f 0 : D → R selbst eine Ableitung f 00 : D → R
besitzt, die womöglich wieder einer Ableitung f 000 : D → R hat u.s.w.
Definition 6.7 Es sei f : D → R eine Funktion. Ist f (einmal) differenzierbar
bei x0 ∈ D, so schreibt man auch f (1) (x0 ) = f 0 (x0 ). Induktiv definiert man für
n ≥ 2:
(i) Es sei x0 ∈ D. Die Funktion f ist n-mal differenzierbar bei x0 , wenn es ein
ε > 0 gibt, so dass f in jedem x ∈ (x0 − ε, x0 + ε) (n − 1)-mal differenzierbar
ist und die Abbildung (x0 − ε, x0 + ε), x 7→ f (n−1) (x) bei x0 differenzierbar
ist. Die n-te Ableitung bei x0 ist dann f (n) (x0 ) := (f n−1 )0 (x0 ). (Für n = 2, 3
schreibt man auch f 00 (x0 ) bzw. f 000 (x0 ).)
(ii) Ist f in jedem Punkt x ∈ D n-mal differenzierbar, so heißt f n-mal differenzierbar. Die n-te Ableitung von f ist f (n) : D → R.
Mit der ‘nullten Ableitung’ f (0) von f ist die Funktion f selbst gemeint.
Beispiele.
1. Für f : R → R, f (x) = xm ist
(
f
(n)
(x) = m(m − 1) · . . . · (m − n + 1)x
m−n
=
m! m−n
x
,
n!
0,
falls n ≤ m,
falls n > m.
2. Für f : R → R, f (x) = cos x ist

cos x,



− sin x,
f (n) (x) =

− cos x,



sin x,
6.2
falls
falls
falls
falls
n ∈ 4N0 ,
n ∈ 4N0 + 1,
n ∈ 4N0 + 2,
n ∈ 4N0 + 3.
Der Mittelwertsatz und seine Konsequenzen
Wir wollen nun untersuchen, inwiefern sich aus bestimmten Aspekten der Ableitung f 0 einer Funktion f Rückschlüsse auf f selbst gewinnen lassen. Ein grundlegender Satz der Differentialrechnung ist hier der sogenannte Mittelwertsatz, der
aus dem Satz von Rolle folgen wird.
113
Definition 6.8 Es sei D ⊂ R. Eine Funktion f : D → R hat in x ∈ D ein
lokales Maximum (bzw. lokales Minimum), wenn es ein ε > 0 gibt, so dass
f (x) = max{f (y) : y ∈ D mit |y − x| < ε}
f (x) = min{f (y) : y ∈ D mit |y − x| < ε}
bzw.
gilt. Man nennt dann x eine lokale Maximal- bzw. Minimalstelle.
Maxima und Minima nennt man auch Extrema, Maximal- und Minimalstellen
entsprechend Extremalstellen.
Wir beschränken uns in diesem Abschnitt fortan auf den Fall, dass D ein
Intervall ist. Im Folgenden sei a < b.
Durch Ableiten erhält man ein notwendiges Kriterium für Extremalstellen:
Satz 6.9 Es sei f : (a, b) → R und x0 ∈ (a, b). Ist x0 eine Extremalstelle von f
und f differenzierbar in x0 , so gilt
f 0 (x0 ) = 0.
Beweis. Hat f bei x0 ein lokales Maximum, so so gibt es ein ε > 0 mit f (x) ≤
f (x0 ) für alle x ∈ D mit |x − x0 | < ε. Daher ist
f 0 (x0 ) = x→x
lim
f (x) − f (x0 )
≤0
x − x0
f 0 (x0 ) = x→x
lim
f (x) − f (x0 )
≥ 0,
x − x0
0
x>x0
und
0
x<x0
also f 0 (x0 ) = 0.
Ist x0 eine lokale Minimalstelle, so hat −f bei x0 ein lokales Maximum, weshalb −f 0 (x0 ) = 0 also auch f 0 (x0 ) = 0 ist.
Beachten Sie: Dieses Kriterium ist nicht hinreichend! So gilt z.B. für die Funktion
f : (−1, 1) → R,
f (x) = x3
f 0 (0) = 0, obwohl sie bei 0 kein lokales Extremum hat. Es ist außerdem wichtig
anzunehmen, dass x0 im offenen Intervall (a, b) liegt. Z.B. sind die Extremalstellen
von
f : [0, 1] → R,
f (x) = x
0 und 1, jedoch f 0 (0) = f 0 (1) 6= 0.
Satz 6.10 (Satz von Rolle) Es sei f : [a, b] → R stetig und in (a, b) differenzierbar. Gilt f (a) = f (b), so gibt es ein x0 ∈ (a, b) mit f 0 (x0 ) = 0.
114
Beweis. Ist f konstant, so ist die Behauptung trivial. Anderenfalls gibt es, da
nach Satz 5.10 f sein Minimum und sein Maximum in [a, b] annimmt, eine Extremalstelle x0 ∈ (a, b). Gemäß Satz 6.9 ist dann f 0 (x0 ) = 0.
Korollar 6.11 (Mittelwertsatz) Es sei f : [a, b] → R stetig und in (a, b) dif(a)
ferenzierbar. Dann gibt es ein x0 ∈ (a, b) mit f 0 (x0 ) = f (b)−f
.
b−a
Das heißt: Es gibt einen Punkt x0 ∈ (a, b), so dass die Steigung f 0 (x0 ) der
(a)
Tangente an den Graphen von f durch (x0 , f (x0 )) gerade die Steigung f (b)−f
b−a
der Sekante durch (a, f (a)) und (b, f (b)) ist.
Beweis. Setze g : [a, b] → R,
g(x) = f (x) −
f (b) − f (a)
(x − a),
b−a
so dass insbesondere g(b) = g(a) ist. Nach dem Satz 6.10 von Rolle gibt es ein
x0 ∈ (a, b) mit
f (b) − f (a)
0 = g 0 (x0 ) = f 0 (x0 ) −
,
b−a
womit x0 die Behauptung des Satzes erfüllt.
Korollar 6.12 (Schrankensatz) Es sei f : [a, b] → R stetig und in (a, b) differenzierbar. Setze m = inf{f 0 (x) : x ∈ (a, b)} und M = sup{f 0 (x) : x ∈ (a, b)}.
Dann gilt
m(y − x) ≤ f (y) − f (x) ≤ M (y − x)
für alle x, y ∈ [a, b] mit x ≤ y.
Beweis. Wendet man den Mittelwertsatz (Korollar 6.11) auf das Intervall [x, y]
an, so folgt für ein x0 ∈ (x, y)
f (y) − f (x)
= f 0 (x0 ) ∈ [m, M ].
y−x
Korollar 6.13 Es sei f : [a, b] → R stetig und in (a, b) differenzierbar. Gilt
f 0 (x) = 0 für alle x ∈ (a, b), so ist f konstant.
Beweis. Nach dem Schrankensatz (mit m = M = 0) ist f (x) = f (y) für alle
x, y ∈ [a, b].
Eine weitere Folgerung aus dem Satz von Rolle ist eine verallgemeinerte Form
des Mittelwertsatzes.
115
Satz 6.14 (Verallgemeinerter Mittelwertsatz) Es seien f, g : [a, b] → R
stetig und in (a, b) differenzierbar, wobei g 0 (x) 6= 0 für alle x ∈ (a, b) sei. Dann
gibt es ein x0 ∈ (a, b) mit
f (b) − f (a)
f 0 (x0 )
= 0
.
g(b) − g(a)
g (x0 )
(Insbesondere ist g(a) 6= g(b).)
Beweis. Wir bemerken zunächst, dass g(a) 6= g(b) ist. Anderenfalls hätte g
nämlich nach dem Satz von Rolle eine Nullstelle in (a, b). Setze nun h : [a, b] → R,
h(x) = f (x) −
f (b) − f (a)
(g(x) − g(a)),
g(b) − g(a)
so dass insbesondere h(b) = f (a) = h(a) ist. Nach dem Satz 6.10 von Rolle gibt
es ein x0 ∈ (a, b) mit
0 = h0 (x0 ) = f 0 (x0 ) −
f (b) − f (a) 0
g (x0 ),
g(b) − g(a)
womit x0 die Behauptung des Satzes erfüllt.
Der verallgemeinerte Mittelwertsatz liefert ein nützliches Kriterium zur Berechnung von Funktionengrenzwerten von Quotienten in Fällen, in denen die
Grenzwertsätze versagen.
Satz 6.15 (Regel von l’Hospital) Es seien f, g : (a, b) → R differenzierbar,
wobei g 0 (x) 6= 0 für alle x ∈ (a, b) sei. Des Weiteren gelte
lim
f (x) = 0
x→a
und
x>a
lim
g(x) = 0
x→a
x>a
oder
lim
f (x) = ±∞
x→a
und
x>a
lim
g(x) = ±∞.
x→a
x>a
Falls nun der Grenzwert lim x→a
x>a
es ist
lim
x→a
x>a
f 0 (x)
g 0 (x)
existiert, so existiert auch lim x→a
x>a
f (x)
g(x)
und
f (x)
f 0 (x)
= lim
.
x→a
g(x)
g 0 (x)
x>a
Analoge Aussagen gelten für x → b. Dies gilt auch noch für a = −∞ oder
b = +∞, da sich diese Fälle durch eine geeignete Substitution (y = ∓ x1 ) auf den
Fall endlicher Intervallgrenzen zurückführen lassen.
Beweis. 1. Im ersten Fall können wir f und g durch f (a) := g(a) := 0 stetig bei
a ergänzen. Ist nun (xn ) eine Folge in (a, b) mit xn → a, so gibt es nach dem
116
verallgemeinerten Mittelwertsatz Punkte ξn ∈ (a, xn ) (und damit auch ξn → a)
mit
f (xn )
f (xn ) − f (a)
f 0 (ξn )
f 0 (x)
=
= 0
→ lim
.
x→0 g 0 (x)
g(xn )
g(xn ) − g(a)
g (ξn )
x>a
0
f (x)
zu gegebenem ε > 0 ein
2. Im zweiten Fall wählen wir für c = lim x→a
0
x>a g (x)
δ > 0, so dass
f 0 (x)
− c < ε für x ∈ (a, a + δ)
0
g (x)
gilt. Für alle x, y ∈ (a, a + δ) gibt es nun nach dem verallgemeinerten Mittelwertsatz ein ξ zwischen x und y mit
f (x)
f 0 (ξ)
f (x) − f (y) 1 − g(y)/g(x)
= 0
=
·
d(x, y)
g(x)
g(x) − g(y) 1 − f (y)/f (x)
g (ξ)
{z
}
|
=:d(x,y)
und daher wegen ξ ∈ (a, a + δ)
f 0 (ξ)
f (x)
−
c
=
d(x,
y)
−
c
0
g(x)
g (ξ)
f 0 (ξ)
− c d(x, y) + c d(x, y) − 1 = 0
g (ξ)
≤ ε|d(x, y)| + |c| |d(x, y) − 1|,
wobei die rechte Seite für x → a gegen ε konvergiert, da ja dann d(x, y) → 1 gilt.
Indem wir 0 < δ 0 < δ hinreichend klein wählen, folgt also
f (x)
− c < 2ε
g(x)
für x ∈ (a, a + δ 0 ). Hieraus folgt lim x→a
x>a
Beispiele.
f (x)
g(x)
= c.
1. Für α > 0 ist im Grenzwert x → 0
x−1
log x
lim
x log x = lim
= − lim
= α−1 lim
xα = 0.
x→0 αx−α−1
x→0
x→0
x→0 x−α
x>0
x>0
x>0
x>0
α
2. Zweimalige Anwendung der l’Hospitalschen Regel zeigt
tan x − x
cos−2 x − 1
2 cos−3 x sin x
1
=
lim
=
lim
= ,
3
2
x→0
x→0
x→0
x
3x
6x
3
lim
da ja limx→0
sin x
x
= 1 ist.
117
6.3
Monotonie, Extrema und Konvexität
Eine weitere direkte Folgerung aus dem Mittelwertsatz gestattet es, das Monotonieverhalten von f in Termen der Ableitung f 0 zu beschreiben, was uns schließlich
bei der genaueren Untersuchung von Extremalstellen von f nützlich sein wird.
Das Vorzeichen der lokalen Änderungsrate gibt Auskunft darüber, ob die
Funktionswerte mit wachsendem Argument lokal zu- oder abnehmen. Genauer
gilt:
Satz 6.16 Es seien [a, b] ⊂ R ein Intervall und f : [a, b] → R eine stetige
Funktion, die in (a, b) differenzierbar sei. Dann gilt:
(i) f 0 (x) ≥ 0 für alle x ∈ (a, b) ⇔ f ist monoton wachsend,
(ii) f 0 (x) > 0 für alle x ∈ (a, b) ⇒ f ist streng monoton wachsend,
(iii) f 0 (x) ≤ 0 für alle x ∈ (a, b) ⇔ f ist monoton fallend,
(iv) f 0 (x) < 0 für alle x ∈ (a, b) ⇒ f ist streng monoton fallend.
Beachten Sie: Die Umkehrungen in (ii) und (iv) gelten nicht, wie die Beispiele
f : (−1, 1) → R mit f (x) = x3 bzw. f (x) = −x3 zeigen.
Beweis. (i) ‘⇒’: Für x, x0 ∈ [a, b] mit x < x0 gibt es nach dem Mittelwertsatz ein
x0 ∈ (x, x0 ) mit
f (x0 ) − f (x)
= f 0 (x0 ) ≥ 0.
0
x −x
‘⇐’: Ist f monoton wachsend, so gilt für jedes x0 ∈ (a, b)
f 0 (x) = x→x
lim
0
x>x0
f (x) − f (x0 )
≥ 0.
x − x0
(ii) Dies folgt analog zu ‘⇒’ in (i) mit > statt ≥.
(iii) & (iv) Diese Aussagen ergeben sich aus (i) und (ii) durch Übergang zu
−f .
Als Anwendung dieses Satzes kommen wir nun auf die Untersuchung der trigonometrischen Funktionen zurück.
Beispiele.
1. Der Cosinus ist streng monoton fallend auf [0, π]. Nach Satz 5.40 nämlich
ist (cos x)0 = − sin x < 0 für 0 < x < π. Wegen cos(0) = 1 und cos(π) = −1
ist daher
[0, π] → [−1, 1],
x 7→ cos x
bijektiv. Die Umkehrfunktion hiervon wird als Arcuscosinus (oder auch als
der Hauptzweig des Arcuscosinus) arccos : [−1, 1] → [0, π] bezeichnet. Nach
118
Satz 6.6 und der Beziehung sin y = ±
x ∈ (−1, 1)
(arccos x) =
p
1 − cos2 y für alle y ∈ R gilt für
1
1
1
= ∓√
= ∓p
.
− sin(arccos x)
1 − x2
1 − cos2 (arccos x)
Beachtet man noch, dass auch arccos monoton fällt, so ergibt sich
arccos0 x = − √
1
.
1 − x2
Nach Satz 5.40 und Korollar 5.39 ist nun cos auf jedem Intervall der Form
[nπ, (n + 1)π], n ∈ Z, streng monoton, so dass man die Cosinusfunktion
auch auf ein solches Intervall einschränken und die Umkehrfunktion hierzu
betrachten kann. Dies führt für n 6= 0 auf die sogenannten Nebenzweige des
Arcuscosinus.
2. Nach dem ersten Beispiel und Korollar 5.39 ist
h π πi
→ [−1, 1],
x→
7 sin x
− ,
2 2
streng monoton wachsend und bijektiv. Die Umkehrfunktion hiervon wird
als Arcussinus (oder als auch der Hauptzweig des Arcussinus) arcsin :
[−1, 1] → [− π2 , π2 ] bezeichnet. Nach Satz 6.6 und der Beziehung cos y =
p
± 1 − sin2 y für alle y ∈ R gilt für x ∈ (−1, 1)
(arcsin x)0 =
1
1
1
√
= ±p
=
±
.
cos(arcsin x)
1 − x2
1 − sin2 (arcsin x)
Beachtet man noch, dass auch arcsin monoton wächst, so ergibt sich
arcsin0 x = √
1
.
1 − x2
Analog wie für den Arcuscosinus sind die Nebenzweige des Arcussinus definiert.
3. Die Tangensfunktion erfüllt
tan0 x =
1
= 1 = tan2 x > 0
cos2 x
für alle x ∈ (− π2 , π2 ). Wegen cos x > 0 auf (− π2 , π2 ), sin(− π2 ) = −1, sin( π2 ) = 1
und cos(± π2 ) = 0 gilt außerdem
lim tan x = −∞
x→− π
2
x> π
2
und
119
lim tan x = +∞,
x→+ π
2
x< π
2
so dass also tan : (− π2 , π2 ) → R monoton wachsend und bijektiv ist. Die
Umkehrfunktion, der sogenannte (Hauptzweig des) Arcustangens
π π
arctan : R → (− , )
2 2
ist dann ebenfalls streng wachsend mit
arctan0 x =
1
1
=
.
1 + tan (arctan x)
1 + x2
2
Wieder gibt es analog zum Arcuscosinus auch Nebenzweige des Arcustangens. Ganz analog erhält man auch die Umkehrfuntion des Cotangens: den
streng fallenden Arcuscotangens arccot : R → (0, π).
Wir leiten nun ein hinreichendes Kriterium für lokale Extrema her.
Satz 6.17 Es seien f : (a, b) → R, x0 ∈ (a, b). Ist f in x0 zweimal differenzierbar
mit
f 0 (x0 ) = 0
und
f 00 (x0 ) > 0 oder f 00 (x0 ) < 0,
so hat f bei x0 ein lokales Minimim bzw. Maximum.
Beweis. Ist
f 00 (x0 ) = lim
x→x0
f 0 (x) − f 0 (x0 )
> 0,
x − x0
so gibt es ein ε > 0 mit
f 0 (x) − f 0 (x0 )
>0
x − x0
für alle x ∈ (x0 − ε, x0 + ε). Wegen f 0 (x0 ) = 0 ist daher
f 0 (x) < 0 für x ∈ (x0 − ε, x0 )
und
f 0 (x) > 0 für x ∈ (x0 , x0 + ε),
so dass f nach Satz 6.16 auf [x0 − ε, x0 ] streng monoton fällt und auf [x0 , x0 + ε]
streng monoton wächst. Dies zeigt, dass f bei x0 ein Minimum hat.
Den Fall f 00 (x0 ) < 0 behandelt man analog oder indem man das eben Gezeigte
auf −f anwendet.
Beachten Sie: Das Kriterium ist nicht notwendig, wie das Beispiel (−1, 1) →
R, x 7→ x4 zeigt.
Bemerkung. Der Beweis zeigt, dass in x0 sogar eine isolierte Extremalstelle
vorliegt: Es gibt ein ε > 0, so dass für x ∈ (x0 − ε, x0 + ε) mit x 6= x0 sogar die
strikte Ungleichung
f (x0 ) < f (x)
bzw.
f (x0 ) > f (x).
erfüllt ist.
Wir untersuchen nun noch eine Eigenschaft von Funktionen, die in vielen
Anwendungen und in der Analysis selbst eine wichtige Rolle spielt.
120
Definition 6.18 Es sei D ⊂ R ein Intervall. Eine Funktion f : D → R heißt
(i) konvex, wenn für alle x1 , x2 ∈ D und alle λ ∈ [0, 1] gilt
f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ),
(ii) strikt konvex, wenn für alle x1 , x2 ∈ D mit x1 6= x2 und alle λ ∈ (0, 1) gilt
f (λx1 + (1 − λ)x2 ) < λf (x1 ) + (1 − λ)f (x2 ),
(iii) (strikt) konkav, wenn −f (strikt) konvex ist.
Geometrisch bedeutet die (strikte) Konvexität, dass der Graph von f im Intervall (x1 , x2 ) (echt) unterhalb der Sekante durch die Punkte (x1 , f (x1 )) und
(x2 , f (x2 )) liegt.
Da für x1 < x2 die Punkte x = λx1 + (1 − λ)x2 mit λ ∈ [0, 1] gerade die
Punkte x ∈ [x1 , x2 ] sind, lässt sich die Konvexitätsungleichung äquivalent auch
als
x2 − x
x − x1
f (x) ≤
f (x1 ) +
f (x2 )
x2 − x1
x2 − x1
(mit strikter Ungleichung für x ∈
/ {x1 , x2 } im Falle strikter Konvexität) schreiben.
−x
1
(Beachte, dass x = λx1 + (1 − λ)x2 ⇔ λ = xx22−x
⇔ 1 − λ = xx−x
.)
1
2 −x1
Bemerkung. Konvexe Funktionen sind stetig. (Übung!)
Beispiel. Die Funktion f : R → R, f (x) = |x| ist konvex: Für x1 , x2 ∈ R und
0 ≤ λ ≤ 1 ist
|λx1 + (1 − λ)x2 | ≤ λ|x1 | + (1 − λ)|x2 |
nach der Dreiecksungleichung. (Insbesondere müssen konvexe Funktionen nicht
unbedingt differenzierbar sein.)
Lemma 6.19 Es seien D ⊂ R ein Intervall, f : D → R eine Funktion, x, x1 , x2 ∈
D mit x1 < x < x2 . Dann sind äquivalent
(i) f (x) ≤
x2 −x
f (x1 )
x2 −x1
(ii)
f (x)−f (x1 )
x−x1
(iii)
f (x2 )−f (x1 )
x2 −x1
(iv)
f (x)−f (x1 )
x−x1
≤
≤
≤
+
x−x1
f (x2 ),
x2 −x1
f (x2 )−f (x1 )
,
x2 −x1
f (x2 )−f (x)
x2 −x
und
f (x2 )−f (x)
.
x2 −x
Dies gilt auch, wenn man in diesen Ungleichungen jeweils ≤ durch < ersetzt.
121
Beweis. (i) ⇔ (ii): (i) ist äquivalent zu
f (x) − f (x1 ) ≤ −
x − x1
x − x1
(x − x1 )(f (x2 ) − f (x1 ))
f (x1 ) +
f (x2 ) =
,
x2 − x1
x2 − x1
x2 − x1
was wiederum zu (ii) äquivalent ist.
(i) ⇔ (iii): (i) ist äquivalent zu
f (x) − f (x2 ) ≤
x2 − x
x2 − x
(x2 − x)(f (x1 ) − f (x2 ))
f (x1 ) −
f (x2 ) =
,
x2 − x1
x2 − x1
x2 − x1
was wiederum zu (iii) äquivalent ist.
(i) ⇔ (iv): (i) ist äquivalent zu
(x2 − x + x − x1 )f (x) ≤ (x2 − x)f (x1 ) + (x − x1 )f (x2 )
und damit zu
(x2 − x)(f (x) − f (x1 )) ≤ (x − x1 )(f (x2 ) − f (x)),
was wiederum zu (iv) äquivalent ist.
Damit ist der Satz vollständig bewiesen.
Satz 6.20 Es seien (a, b) ⊂ R ein Intervall und f : (a, b) → R eine zweimal
differenzierbare Funktion. Dann gilt:
(i) f 00 (x) ≥ 0 für alle x ∈ (a, b) ⇔ f ist konvex,
(ii) f 00 (x) > 0 für alle x ∈ (a, b) ⇒ f ist strikt konvex.
Natürlich gelten entsprechende Aussagen für konkave Funktionen.
Beweis. Gilt f 00 (x) ≥ 0 (bzw. > 0) für alle x ∈ (a, b), so ist f 0 nach Satz 6.16
(streng) monoton wachsend. Sind nun x, x1 , x2 ∈ (a, b) mit x1 < x < x2 gegeben,
so folgt aus dem Mittelwertsatz
f (x) − f (x1 )
f (x2 ) − f (x)
= f 0 (ξ1 ) ≤ f 0 (ξ2 ) =
x − x1
x2 − x
für geeignete ξ1 ∈ (x1 , x) und ξ2 ∈ (x, x2 ), wobei die Ungleichung im Fall f 00 > 0
strikt ist. Nach Lemma 6.19 ist f demnach (strikt) konvex.
Ist nun umgekehrt f als konvex vorausgesetzt, so folgt für x1 < x2 aus Lemma
6.19 (ii) und (iii)
f 0 (x1 ) = x→x
lim
1
x>x1
f (x) − f (x1 )
f (x2 ) − f (x1 )
f (x) − f (x2 )
≤
≤ x→x
lim
= f 0 (x2 ).
2
x − x1
x 2 − x1
x − x2
x<x2
f 0 ist also monoton. Nach Satz 6.16 folgt hieraus aber f 00 ≥ 0.
122
Beispiele.
1. Die Funktion f : R → R, f (x) = x2 ist strikt konvex.
2. exp : R → R ist strikt konvex.
3. log : (0, ∞) → R ist strikt konkav, denn log00 (x) = − x12 < 0 für alle x > 0.
Als Anwendung leiten wir nun einige Ungleichungen her, die für viele Untersuchungen in der Analysis von großer Bedeutung sind.
Satz 6.21 (Die Youngsche Ungleichung) Es seien p, q ∈ (1, ∞) mit
1. Dann gilt für alle a, b ≥ 0
ap bq
+ .
ab ≤
p
q
1
p
+ 1q =
Beweis. Die Behauptung ist klar für a = 0 oder b = 0. Gilt a, b 6= 0, so folgt aus
der Konkavität des Logarithmus
1
1 q 1
1
p
log a + b ≥ log(ap ) + log(bq )
p
q
p
q
und hieraus, indem man auf beiden Seiten die Exponentialfunktion anwendet,
1
1
ap b q
+ ≥ (ap ) p (bq ) q = ab.
p
q
Hieraus ergeben sich zwei grundlegende Ungleichungen für Vektoren im Rn
(oder Cn ) (also n-Tupel von reellen bzw. komplexen Zahlen). Zunächst führen
wir die folgende Notation ein.
Definition 6.22 Für x = (x1 , . . . , xn ) ∈ Rn (oder Cn ) und p ∈ [1, ∞) definieren
wir die p-Norm von x durch
kxkp :=
X
n
p
|xk |
p1
.
k=1
Für p = ∞ setzt man
kxk∞ := max |xk |
1≤k≤n
(:= max{|xk | : k = 1, . . . , n}).
Satz 6.23 (Die Höldersche Ungleichung) Es seien p, q ∈ [1, ∞] mit p1 + 1q =
1
1, wobei hier ∞
= 0 zu lesen ist. Dann gilt für x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈
n
C
n
X
|xk yk | ≤ kxkp kykq .
k=1
123
Beweis. O.B.d.A. (d.h. ‘ohne Beschränkung der Allgemeinheit’) nehmen wir an,
dass kxk, kyk =
6 0 ist. (Anderenfalls ist x = 0 oder y = 0 und die Aussage trivial.)
1. Fall: p, q ∈ (1, ∞). Indem wir für k = 1, . . . , n die Youngsche Ungleichung
|xk |
|yk |
jeweils mit a = kxk
und b = kyk
anwenden, ergibt sich
p
q
n
n n
X
X
X
1
|xk |p
|yk |q
1 1
|xk | |yk |
·
≤
= + = 1.
|xk yk | =
p +
q
kxkp kykq k=1
kxkp kykq
pkxkp qkykq
p q
k=1
k=1
Nach Multiplikation mit kxkp kykq folgt hieraus die Behauptung.
2. Fall: {p, q} = {1, ∞}. O.B.d.A. sei p = 1 und q = ∞. (Ansonsten vertausche
man die Rollen von p und q.) Es folgt
n
n
X
X
|xk yk | ≤ max |yk |
|xk | = kyk∞ kxk1 .
1≤k≤n
k=1
k=1
Bemerkung. Speziell für p = 2 ergibt sich die Cauchy-Schwarzsche Ungleichung
n
n
auf
von x und y ist x · y :=
Pn
Pn dem R (oderPCn ): Das euklidische Skalarprodukt
k=1 xk yk ). Wegen |x · y| ≤
k=1 |xk yk | folgt nun
k=1 xk yk (bzw.
|x · y| ≤ kxk2 kyk2 .
Satz 6.24 (Die Minkowskische Ungleichung) Es sei p ∈ [1, ∞]. Dann gilt
für x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Cn
kx + ykp ≤ kxkp + kykp .
(Hierbei bezeichnet x + y = (x1 + y1 , . . . , xn + yn ) die komponentenweise zu
bildende Vektorsumme von x und y.)
Beweis. 1. Fall: p ∈ (1, ∞). Nach der Hölderschen Ungleichung ist für p1 + 1q = 1,
p
also q = p−1
,
kx +
ykpp
=
≤
n
X
k=1
n
X
|xk + yk | · |xk + yk |p−1
p−1
|xk | · |xk + yk |
+
k=1
≤ kxkp
∞
X
|yk | · |xk + yk |p−1
k=1
X
n
|xk + yk |(p−1)q
1q
+ kykp
k=1
k=1
= kxkp + kykp
X
n
X
n
|xk + yk |p
k=1
= kxkp + kykp kx + ykpp−1 .
124
p1 pq
|xk + yk |(p−1)q
1q
Division durch kx + ykp−1
ergibt die Behauptung
p
2. Fall: p = 1: Für p = 1 folgt direkt aus der Dreiecksungleichung
kx + yk1 =
n
X
k=1
|xk + yk | ≤
n
X
|xk | +
k=1
n
X
|yk | = kxk1 + kyk1 .
k=1
3. Fall: p = ∞: Für p = ∞ schließlich erhält man die Behauptung, da mit
|xk | ≤ kxk∞ und |yk | ≤ kyk∞ für alle k auch |xk + yk | ≤ kxk∞ + kyk∞ für alle k
ist.
125
Kapitel 7
Das Integral
Rb
In diesem Kapitel definieren wir das Integral a f (x) dx für geeignete Funktionen
f : [a, b] → R und und untersuchen dessen wichtigste Eigenschaften. Das Integral
misst die (signierte) Fläche zwischen Funktionsgraph und x-Achse. Heuristisch
erhält man das Integral, indem man die Strecke [a, b] in unendlich viele unendlich
feine Intervalle [x, x+dx) aufteilt und die entsprechend unendlichRvielen unendlich
dünnen Rechtecke mit signierter Fläche f (x) dx aufsummiert: f (x) dx. Daher
auch das stilisierte S als Integrationszeichen. Unsere erste Aufgabe wird es sein,
diese heuristischen Ideen in sinnvolle Mathematik zu überfüren: Das geschieht in
Abschnitt 7.1.
Der Integrationsbegriff ist von grundlegender Bedeutung für die gesamte Analysis und viele weitere Bereiche innerhalb der Mathematik und den Anwendungen.
Vor allem der Zusammenhang zur Differentiation ist fundamental: Wir werden
sehen, dass die Integration in gewisser Hinsicht eine zur Differentiation inverse
Operation darstellt.
7.1
Definition des Integrals
Die Strategie zur Definition des Integrals ist die folgende: Zunächst betrachten
wir besonders einfache Funktionen, für die man das Integral einfach hinschreiben
kann. Dann verwenden wir einen Grenzprozess, um die Klasse der integrierbaren
Funktionen soweit auszudehnen, dass sie für all unsere Belange ausreicht und
insbesondere alle stetigen Funktionen beinhaltet. Für diesen Grenzprozess gibt
es in der mathematischen Literatur mehrere Ansätze, die zu Integralbegriffen
unterschiedlicher Allgemeinheit führen. Wir werden hier vor allem das RiemannIntegral behandeln und später noch kurz auf das sogenannte Regelintegral eingehen. Beide dieser Ansätze haben ihre Vorzüge und Nachteile, der Begriff des
Riemann-Integrals ist aber wohl der anschaulichere. Das wesentlich allgemeinere
Lebesgue-Integral werden wir erst in der Analysis 3 behandeln.
126
Das Integral für Treppenfunktionen
Es sei [a, b] ⊂ R ein kompaktes Intervall.
Definition 7.1 Eine Funktion f : [a, b] → R heißt Treppenfunktion, wenn es
eine Unterteilung a = x0 < x1 < . . . < xn = b derart gibt, dass f |(xi−1 ,xi ) konstant
ist für alle i = 1, . . . , n. Eine solche Unterteilung heiße f zugehörig. Die Menge
der Treppenfunktionen auf [a, b] wird mit T [a, b] bezeichnet.
(Sind M, N Mengen, f : M → N eine Abbildung und U ⊂ M , so bezeichnet
f |U : U → N die Einschränkung von f auf U , die durch f |U (x) = f (x) für x ∈ U
gegeben ist.)
Lemma 7.2 Sind f, g ∈ T [a, b] und λ ∈ R, so sind auch f + g und λf Treppenfunktionen.
Beweis. Es seien
Z : a = x0 < x1 < . . . < xn = b
Z 0 : a = x00 < x01 < . . . < x0m = b
und
Zerlegungen, so dass f auf allen (xi−1 , xi ) und g auf allen (x0j−1 , x0j ) konstant ist.
Die gemeinsame Verfeinerung von Z und Z 0 ist dann die Unterteilung
Z 00 : a = x000 < x001 < . . . < x00l = b
mit {x000 , . . . , x00l } = {x0 , . . . , xn } ∪ {x00 , . . . , x0m }. Da f + g und λf auf allen Intervallen (x00k−1 , x00k ) konstant sind, ergibt sich die Behauptung.
Bemerkung. Da die Menge R[a,b] aller Abbildungen von [a, b] nach R ein Vektorraum ist und offensichtlich 0 ∈ T [a, b] gilt, besagt dieses Lemma gerade, dass
T [a, b] ein Vektorraum ist. Man spricht daher auch vom Raum der Treppenfunktionen auf [a, b].
Definition 7.3 Es sei f ∈ T [a, b] mit f (x) = ci für x ∈ (xi−1 , xi ), i = 1, . . . , n,
für die f zugehörige Unterteilung a = x0 < x1 < . . . < xn = b. Das Integral von
f ist dann definiert durch
Z b
n
X
f (x) dx :=
ci (xi − xi−1 ).
a
i=1
Wir schreiben auch manchmal nur kurz
Rb
a
f.
Wir müssen zeigen, dass dieser Begriff wohldefiniert ist, also nicht von der speziell
gewählten Zerlegung abhängt.
Beweis. Es seien
Z : a = x0 < x1 < . . . < xn = b
und
127
Z 0 : a = x00 < x01 < . . . < x0m = b
zu f gehörige Zerlegungen, so dass f die Werte ci bzw. c0j auf den entsprechenden
Intervallen annehme. Enthält etwa Z 0 nur einen zusätzlichen Punkt x0 , der im
Intervall (xk−1 , xk ) liegt, so ist
m
X
c0j (x0j − x0j−1 )
j=1
=
k−1
X
ci (xi − xi−1 ) + ck (x0 − xk−1 ) + ck (xk − x0 ) +
i=1
=
n
X
n
X
ci (xi − xi−1 )
i=k+1
ci (xi − xi−1 ),
i=1
so dass diese Unterteilungen zum gleichen Integral führen. Daraus ergibt sich
induktiv der Fall, dass Z 0 eine Verfeinerung von Z ist, d.h., dass jeder Unterteilungspunkt von Z auch einer von Z 0 ist, induktiv. Der allgemeine Fall folgt dann,
indem man die Werte für Z und Z 0 mit dem der gemeinsamen Verfeinerung Z 00
vergleicht.
Lemma 7.4 Das Integral ist linear und monoton auf T [a, b]:
(i) Für f, g ∈ T [a, b], λ ∈ R gilt
Z
a
b
Z
b
Z
f (x) dx +
f (x) + g(x) dx =
a
Z b
Z b
λf (x) dx = λ
f (x) dx.
a
b
g(x) dx
sowie
a
a
(ii) Für f, g ∈ T [a, b] mit f ≤ g ist
Z
b
Z
f (x) dx ≤
a
b
g(x) dx.
a
Beweis. Indem wir ggf. zur gemeinsamen Verfeinerung übergehen, dürfen wir
alle Integrale bezüglich einer sowohl zu f als auch zu g gehörigen Unterteilung
angeben. Die Behauptungen sind dann klar.
Das Riemann-Integral
Wir kommen nun zur wesentlichen Idee der Riemann-Integration: der Approximation von oben und unten durch Treppenfunktionen.
128
Definition 7.5 Ist f : [a, b] → R beschränkt, so definieren wir das Ober- und
Unterintegral von f durch
Z
∗
b
Z
ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≥ f
f (x) dx := inf
,
a
Z
Z
b
ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≤ f
f (x) dx := sup
∗
bzw.
.
a
Ist f selbst schon eine Treppenfunktion, so gilt natürlich
Z ∗
Z
Z b
f (x) dx = f (x) dx =
f (x) dx.
∗
a
Des Weiteren ist offenbar für jedes f
Z
Z ∗
f≤
f
und
Z
∗
Z
f =−
∗
(−f ).
∗
Lemma 7.6 Es seien f, g : [a, b] → R beschränkt und λ ≥ 0. Dann gilt:
(i) Subadditivität des Oberintegrals:
Z
Z ∗
(f + g) ≤
∗
Z
∗
g.
f+
(ii) Superadditivität des Unterintegrals:
Z
Z
Z
(f + g) ≥ f + g.
∗
∗
∗
(iii) Positive Homogenität des Ober- und Unterintegrals:
Z ∗
Z ∗
Z
Z
λf = λ
f
und
λf = λ f.
∗
∗
Beweis. (i) Es sei ε > 0. Wähle Treppenfunktionen ϕ, ψ mit ϕ ≥ f , ψ ≥ g und
R∗
Rb
R∗
Rb
f ≥ a ϕ − 2ε sowie
g ≥ a ψ − 2ε . Nach Lemma 7.4 ist dann
Z
∗
Z
(f + g) ≤
b
Z
(ϕ + ψ) =
a
b
Z
Z
ψ≤
ϕ+
a
b
a
Da ε beliebig war, folgt die Behauptung.
R
R∗
(ii) Das folgt direkt aus (i) und ∗ f = − (−f ).
129
∗
Z
f+
∗
g + ε.
(iii) Der Fall λ = 0 ist trivial, so dass wir λ > 0 annehmen. Zu ε > 0 wähle
R∗
Rb
eine Treppenfunktion ϕ mit ϕ ≥ f und
f ≥ a ϕ − λε . Da λf ≤ λϕ gilt, ergibt
sich
Z ∗
Z b
Z ∗
Z ∗
Z b
ε
λϕ = λ
ϕ≤λ
=λ
f + ε.
λf ≤
f+
λ
a
a
Wieder weil ε beliebig war, folgt daraus nun
Z ∗
Z
λf ≤ λ
∗
f
und damit – angewendet auf λ−1 – auch
Z ∗
Z ∗
Z
−1
−1
f =λ
λ λf ≤ λλ
λ
∗
Z
λf =
∗
λf.
Die analoge Aussage für Unterintegrale ergibt sich nun wieder durch Übergang
von f zu −f .
Definition 7.7 Eine beschränkte Funktion f : [a, b] → R heißt (Riemann-)integrierbar, wenn
Z ∗
Z
f= f
∗
gilt. Ist f Riemann-integrierbar, so definiert man das (Riemann-)Integral von f
durch
Z b
Z b
Z ∗
f :=
f (x) dx :=
f (x) dx.
a
a
Die Menge der Riemann-integrierbaren Funktionen auf [a, b] bezeichnen wir mit
R[a, b].
Natürlich kann man statt
für die IntegrationsvaR b x auch
R b andere RBezeichnungen
b
riable benutzen, etwa a f = a f (t) dt = a f (y) dy . . .
Beachte, dass dieses Integral für Treppenfunktionen mit dem zuvor definierten
Integral übereinstimmt.
Beispiel: Es seien a = 0, b = 1 und f (x) = x. Für jedes n ∈ N sind die Funktionen ϕ, ψ mit
1
1
ϕn (x) = ψn (x) +
ψn (x) = bnxc ,
n
n
Treppenfunktionen mit ψn ≤ f ≤ ϕn und Integralen
Z
0
1
n−1
X
i 1
n−1
ψn (x) dx =
· =
,
n
n
2n
i=0
Z
1
Z
ϕ(x) dx =
0
130
1
ψn (x) dx +
0
1
n+1
=
.
n
2n
Daher ist für alle n
n−1
≤
2n
Z
Z
∗
f (x) dx ≤
f (x) dx ≤
∗
n+1
.
2n
Mit n → ∞ folgt f ∈ R[0, 1] und
1
Z
0
1
x dx = .
2
Direkt aus der Definition ergibt sich das folgende Kriterium.
Lemma 7.8 Eine Funktion f : [a, b] → R liegt genau dann in R[a, b], wenn es
zu jedem ε > 0 Treppenfunktionen ψ, ϕ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und
Z
b
b
Z
ψ≤ε
ϕ−
a
a
gibt.
Beweis. Klar.
Integrierbare Funktionen
Satz 7.9 Die Menge der Riemann-integrierbaren Funktionen R[a, b] bildet einen
Vektorraum. Das Riemann-Integral ist eine monotone lineare Abbildung von R[a, b]
nach R:
(i) Für f, g ∈ R[a, b], λ ∈ R sind auch f + g und λf ∈ R[a, b] mit
Z
a
b
Z
b
Z
f (x) dx +
f (x) + g(x) dx =
a
Z b
Z b
λf (x) dx = λ
f (x) dx.
a
b
g(x) dx
sowie
a
a
(ii) Für f, g ∈ R[a, b] mit f ≤ g gilt
Z
b
Z
f (x) dx ≤
a
b
g(x) dx.
a
Beweis. (i) Die Additivität folgt aus Lemma 7.6. Demnach ist
Z
b
Z
Z
g≤
f+
a
b
a
Z
(f + g) ≤
∗
∗
Z
(f + g) ≤
Z
f+
a
131
b
b
g,
a
so dass hier sogar Gleichheit gilt. Damit ist f + g integrierbar und das Integral
ist
Z b
Z b
Z ∗
Z b
g.
f+
(f + g) =
(f + g) =
a
a
a
Die positive Homogenität ergibt sich auch direkt aus Lemma 7.6. Dann gilt aber
auch für λ < 0
Z
Z ∗
Z
Z b
Z ∗
Z ∗
Z
λf,
f = λ f = − (−λf ) =
f =λ
(−λf ) = λ
λf = −
∗
∗
a
∗
Rb
Rb
also λf ∈ R[a, b] mit a λf = λ a f .
(ii) Für jedes ϕ ∈ T [a, b] mit ϕ ≥ g ist auch ϕ ≥ f . Daher ist
Z
b
Z
∗
∗
Z
f≤
f=
Z
g=
a
b
g.
a
Des Weiteren erfüllt R[a, b] die folgenden Eigenschaften.
Satz 7.10 Sind f, g ∈ R[a, b], so sind auch
(i) f+ , f− ∈ R[a, b],
(ii) |f |α ∈ R[a, b] für alle α > 0 und
(iii) f g ∈ R[a, b].
Hierbei bezeichnet f± die Funktionen
(
f (x), falls f (x) ≥ 0,
f+ (x) =
0,
falls f (x) < 0
(
−f (x), falls f (x) ≤ 0,
f− (x) = (−f )+ (x) =
0,
falls f (x) > 0.
und
Beweis. (i) Für jedes ε > 0 gibt es ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und
ε. Dann aber sind auch ϕ± und ψ± Treppenfunktionen, die
ψ+ ≤ f+ ≤ ϕ+
ϕ− ≤ f− ≤ ψ−
und
erfüllen. Die Behauptung folgt dann aus Lemma 7.8 mit
Z b
Z b
Z b
ϕ+ −
ψ+ ≤
(ϕ − ψ) < ε,
a
a
a
132
Rb
a
ϕ−
Rb
a
ψ<
denn es ist ϕ+ − ψ+ ≤ ϕ − ψ, und
Z b
Z b
Z b
ψ− −
ϕ− ≤
(ϕ − ψ) < ε,
a
a
a
denn es ist ψ− − ϕ− = (−ψ)+ − (−ϕ)+ ≤ −ψ − (−ϕ) = ϕ − ψ.
(ii) Wir überlegen uns zunächst, dass es zu jedem η > 0 und M > 0 eine
Konstante C gibt, so dass
|y α − xα | ≤ η + C|y − x| ∀ x, y ∈ [0, M ]
gilt. Dazu muss man nur beachten, dass es wegen der gleichmäßigen Stetigkeit der
Abbildung t 7→ tα auf [0, M ] ein δ > 0 gibt, so dass |y α − xα | ≤ η für |y − x| ≤ δ
α
gilt. Setzt man dann C = Mδ , so gilt diese Abschätzung für alle x, y ∈ [0, M ].
ε
.
Es sei ε > 0 beliebig. Setze M = max{|f (x)| : x ∈ [a, b]} und η = 2(b−a)
Rb
Rb
ε
Wähle ϕ, ψ ∈ T [a, b] mit 0 ≤ ψ ≤ |f | ≤ ϕ ≤ M und a ϕ − a ψ < 2C
.
α
α
(Nach (i) ist |f | = f+ + f− ∈ R[a, b].) Dann sind einerseits ϕ , ψ ∈ T [a, b] mit
ψ α ≤ |f |α ≤ ϕα . Andererseits gilt
Z b
Z b Z b
Z b
Z b
ε
α
α
ϕ−
ψ < ε.
ϕ −
ψ ≤
(η + C(ϕ − ψ)) = + C
2
a
a
a
a
a
(iii) Dies folgt aus (ii) und f g = 14 (|f + g|2 − |f − g|2 ).
Als direkte Folgerung halten wir noch eine elementare aber wichtige Abschätzung
fest.
Korollar 7.11 Ist f Riemann-integrierbar, so auch |f |. Dabei gilt
Z b
Z b
≤
f
(x)
dx
|f (x)| dx.
a
a
Beweis. Dies folgt direkt aus der Monotonie des Integrals und aus f, −f ≤ |f |. In Abhängigkeit vom Integrationsbereich ergibt sich das folgende Lemma.
Lemma 7.12 Es sei a < b < c. Genau dann ist f ∈ R[a, c], wenn f |[a,b] ∈ R[a, b]
und f |[b,c] ∈ R[b, c] ist. In diesem Falle gilt
Z c
Z b
Z c
f=
f+
f.
a
a
b
Beweis. Klar.
Vereinbarungsgemäß setzen wir noch
Z a
Z b
f := −
f
b
a
für a < b.
Besonders wichtig ist es nun natürlich zu wissen, ob gegebene Funktionen
integrierbar sind. Der folgende Satz garantiert dies für alle stetigen Funktionen.
133
Satz 7.13 Jede stetige Funktion f : [a, b] → R ist Riemann-integrierbar.
Wir zeigen hierzu ein auch für sich genommen interessantes Lemma über die
Approximierbarkeit von stetigen Funktionen durch Treppenfunktionen.
Lemma 7.14 Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ − ψ ≤ ε.
Beweis. Da f auf [a, b] gleichmäßig stetig ist, können wir zu gegebenem ε > 0 ein
δ > 0 finden, so dass |f (x) − f (y)| ≤ ε für alle x, y ∈ [a, b] mit |x − y| ≤ δ ist.
Es sei nun Z : a = x0 < x1 < . . . < xn = b eine Zerlegung mit max{xk − xk−1 :
k = 1, . . . , n} < δ, z.B. die äquidistante Zerlegung mit xk = a + nk (b − a) mit
xk − xk−1 = b−a
für hinreichend große n. Wir definieren dann Treppenfunktionen
n
ψ, ϕ durch
ψ(x) = min{f (ξ) : ξ ∈ [xi−1 , xi ]},
ϕ(x) = max{f (ξ) : ξ ∈ [xi−1 , xi ]}
für x ∈ [xi−1 , xi ) und ψ(b) = ϕ(b) = f (b). Dann gilt ψ ≤ f ≤ ϕ und ϕ − ψ ≤ ε.
Beweis von Satz 7.13. Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es nach
ε
.
Lemma 7.14 Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ − ψ < b−a
Dann aber ist auch
Z b
Z b
Z b
ε
ϕ−
ψ≤
dx = ε,
a
a
a b−a
und die Behauptung folgt aus Lemma 7.8.
1
Bemerkungen.
1. Es gibt noch mehr integrierbare Abbildungen. Eine weitere Klasse ist die
der monotonen Funktionen: Jede monotone Funktion f : [a, b] → R ist
Riemann-integrierbar. (Übung!)
2. Ohne Beweis und Relevanz für unsere weiteren Untersuchungen geben wir
noch ein notwendig und hinreichendes Kriterium für die Riemann-Integrierbarkeit an. Man nennt eine Teilmenge M ⊂ [a, b] eine Lebesguesche Nullmenge, wenn es zu jedem ε > 0 eine Folge von Intervallen (ai , bi ) gibt, die
M überdecken, d.h.
[
M ⊂ (ai , bi )
gilt, und die
X
(bi − ai ) < ε
i
erfüllen. (Solche Mengen sind also in gewissem Sinne sehr klein.) Man kann
dann zeigen, dass eine beschränkte Funktion f : [a, b] → R genau dann
Riemann-integrierbar ist, wenn sie außerhalb einer Lebesgueschen Nullmenge stetig ist.
1
Die zweite Bemerkung wurde in der VL weggelassen.
134
Riemannsche Summen
Ist f : [a, b] → R eine Funktion,
Z : a = x0 < x1 < . . . < xn = b
eine Zerlegung von [a, b] und ξk ∈ [xk−1 , xk ], k = 1, . . . , n, so nennt man
n
X
f (ξk )(xk − xk−1 )
k=1
eine Riemannsche Summe. Man definiert die Feinheit von Z durch
ρ(Z) := max{xk − xk−1 : k = 1, . . . , n}.
In der Tat konvergieren Riemannsche Summen gegen das Integral von f , wenn
die Feinheit der Zerlegung gegen 0 strebt:
Satz 7.15 Es sei f : [a, b] → R stetig. Dann gibt es zu jedem ε > 0 ein δ > 0,
so dass für jede Unterteilung Z : a = x0 < x1 < . . . < xn = b mit ρ(Z) ≤ δ und
jede Wahl von Stützstellen ξk ∈ [xk−1 , xk ], k = 1, . . . , n,
Z
n
b
X
f (x) dx −
f (ξk )(xk − xk−1 ) < ε
a
k=1
gilt.
Bemerkung: Der Satz gilt sogar für alle f ∈ R[a, b], was wir hier aber nicht
beweisen.
Beweis. Zu gegebenem ε > 0 definieren wir genau wie im Beweis von Lemma 7.14
ε
(nur mit b−a
an Stelle von ε) zu einer Zerlegung Z : a = x0 < x1 < . . . < xn = b
mit ρ(Z) ≤ δ die Treppenfunktionen ψ und ϕ. Es ist dann einerseits
b
Z
Z
ψ≤
a
b
Z
b
f≤
a
b
Z
ϕ≤
ψ + ε.
a
a
Andererseits ergibt sich wegen ψ(x) ≤ f (ξk ) ≤ ϕ(x) für x ∈ [xk−1 , xk ) auch
Z
b
ψ≤
a
n
X
Z
f (ξi )(xi − xi−1 ) ≤
Z
ϕ≤
a
i=1
b
b
ψ + ε.
a
Hieraus folgt die Behauptung.
Als Anwendung dieses Satzes können wir nun die Hölder- und die MinkowskiUngleichung vom Rn auf Funktionen übertragen.
135
Definition 7.16 Für f ∈ R[a, b] und 1 ≤ p < ∞ definiert man die p-Norm von
f durch
Z b
p1
kf kp :=
|f (x)|p dx .
a
Satz 7.17 Es sei f : [a, b] → R stetig.
1
p
(i) Höldersche Ungleichung: Für p, q ∈ (1, ∞) mit
+
1
q
= 1 ist
kf gk1 ≤ kf kp kgkq .
(ii) Minkowski-Ungleichung: Für p ∈ [1, ∞) ist
kf + gkp ≤ kf kp + kgkp .
Beweis. Wir zerlegen das Intervall [a, b] äquidistant in n ∈ N Strecken der Länge
∆n = b−a
und wählen entsprechende Stützstellen ξ1 , . . . , ξn . Indem man die
n
1/p
Höldersche Ungleichung für den Rn auf die Vektoren ∆n (f (ξ1 ), . . . , f (ξn )) und
1/q
∆n (g(ξ1 ), . . . , g(ξn )) anwendet, ergibt sich
n
X
|f (ξk )g(ξk )|∆n ≤
k=1
n
X
! p1
|f (ξk )|p ∆n
k=1
n
X
! 1q
|g(ξk )|q ∆n
.
k=1
Die hier auftretenden Summen sind nun Riemannsche Summen, so dass sich die
Behauptung (i) mit n → ∞ ergibt.
Ähnlich sieht man mit der Minkowski-Ungleichung für den Rn angewendet
1/p
1/p
auf die Vektoren ∆n (f (ξ1 ), . . . , f (ξn )) und ∆n (g(ξ1 ), . . . , g(ξn ))
n
X
i=1
! p1
|f (ξk ) + g(ξk )|p ∆n
≤
n
X
! p1
|f (ξk )|p ∆n
k=1
+
n
X
! p1
|g(ξk )|p ∆n
,
k=1
so dass sich im Limes n → ∞ auch (ii) aus Satz 7.15 ergibt.
Bemerkung: Auch dieser Satz gilt sogar auf R[a, b].
Integration vektorwertiger Funktionen
Die Integration vektorwertiger Funktionen f : [a, b] → Rn , insbesondere die Integration komplexwertiger Funktionen f : [a, b] → C kann ganz einfach auf die
Integration reeller Funktionen zurückgespielt werden, indem man das Integral
komponentenweise definiert:
136
Definition 7.18 Eine Funktion f : [a, b] → Rn , x 7→ f (x) = (f1 (x), . . . , fn (x))
heißt Riemann-integrierbar, wenn jede Komponente fk : [a, b] → R, k = 1, . . . , n,
Riemann-integrierbar ist. Wir schreiben dann f ∈ R([a, b]; Rn ) und setzen
Z b
Z b
Z b
fn (x) dx .
f (x) dx :=
f1 (x) dx, . . . ,
a
a
a
Für eine komplexwertige Funktion f : [a, b] → C, x 7→ f (x) = u(x) + iv(x)
mit u, v : [a, b] → R erhält man gemäß C ∼
= R2 , dass f Riemann-integrierbar ist
(d.h. f ∈ R([a, b]; C)), wenn u, v ∈ R[a, b] ist. Es ist dann
Z
b
Z
f (x) dx :=
a
b
Z
u(x) dx + i
a
v(x) dx.
a
137
b
Literaturverzeichnis
[Br] Th. Bröcker: Analysis I Spektrum Akademischer Verlag, 1995.
[Fo] O. Forster: Analysis 1. Vieweg + Teubner, Wiesbaden, 2011.
[He] H. Heuser: Lehrbuch der Analysis, Teil 1. Vieweg + Teubner, Wiesbaden,
2009.
[Hi] S. Hildebrandt: Analysis 1. Springer, Berlin, 2006.
[Kö] K. Königsberger: Analysis 1. Springer, Berlin, 2004.
[La] S. Lang: Undergraduate Analysis. Springer, New York, 1997.
138

Analysis 1 - math.uni

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können