Vorlesungsskript Analysis I und II

Werbung
Vorlesungsskript Analysis I und II
Prof. Bernd Ammann
Wintersemester 2013/14
Sommersemester 2014
Universität Regensburg
Version: 16. Mai 2017
1
Inhaltsverzeichnis
Warnungen
6
Kapitel 1. Elementare Logik und Grundlagen der Mathematik
1. Die Struktur des mathematischen Denkens
2. Aussagenlogik
3. Mengen und Quantoren
4. Relationen, funktionale Relationen, Abbildungen
5. Das Russellsche Paradoxon
6. Axiomatische Mengenlehre
Literatur für das bisherige Kapitel
7
7
9
14
22
30
31
33
Kapitel 2. Zahlen
1. Die natürlichen Zahlen
1.1. Die Peano-Axiome
1.2. Vollständige Induktion und rekursive Definition
1.3. Ordnung der natürlichen Zahlen
2. Die ganzen Zahlen
3. Die rationalen Zahlen
4. Geordnete Körper
5. Die reellen Zahlen
5.1. Unzulänglichkeit von Q
5.2. Die Supremumseigenschaft
5.3. Axiome der reellen Zahlen
5.4. Folgen, Konvergenz und Cauchy-Folgen
Mehr zu Äquivalenzrelationen
5.5. Existenz und Eindeutigkeit der reellen Zahlen
5.6. Mehr zu R und R-wertigen Folgen
6. Die komplexen Zahlen
35
35
35
37
41
43
45
46
50
50
51
53
55
63
64
68
73
Kapitel 3. Reihen und Funktionen
1. Motivation von Reihen: Dezimal-Darstellung reeller Zahlen
2. Reihen
2.1. Definition und elementare Eigenschaften
79
79
81
81
3
4
INHALTSVERZEICHNIS
2.2. Konvergenzkriterien
2.3. Absolute Konvergenz
2.4. Alternierende Reihen
2.5. Umordnung von Reihen
3. Einige klassische Funktionen
3.1. Exponentialfunktion
3.2. Sinus- und Kosinus-Funktion
3.3. Eulersche Zahl
3.4. Exponentialfunktion, Teil 2
83
87
88
90
95
96
98
100
101
Kapitel 4. Stetigkeit und Grenzwert von Funktionen
1. Stetigkeit
2. Zwischenwertsatz
3. Metrische Räume und Grundbegriffe der Topologie
4. Grenzwert von Funktionen
5. Punktweise und gleichmäßige Konvergenz
6. Anwendungen auf exp, cos und sin
6.1. Stetigkeit dieser Funktionen
6.2. Die reelle Exponentialfunktion
6.3. Sinus und Kosinus
105
105
108
110
114
116
119
119
120
121
Kapitel 5. Differential-Rechnung für Funktionen einer Veränderlichen
1. Definition und elementare Eigenschaften
2. Lokale Extrema
3. Mittelwertsätze
4. Höhere Ableitungen und Taylorscher Satz
5. Differentiation von Folgen und Reihen
123
123
127
128
129
133
Kapitel 6. Integral-Rechnung für Funktionen einer Veränderlichen
1. Partitionen und Treppenfunktionen
2. Das Riemann-Integral
3. Monotone Funktionen sind Riemann-integrierbar
4. Stetige Funktionen sind Riemann-integrierbar
5. Hauptsatz der Differential- und Integralrechnung
6. Uneigentliche Riemann-Integrale
139
139
140
144
145
146
152
Kapitel 7. Topologische Räume
1. Normierte Vektorräume
2. Mehr zu metrischen Räumen
3. Topologische Räume
4. Zusammenhang und Wegzusammenhang
5. Folgenkompaktheit
Exkurs: Abzählbarkeit
155
155
158
160
163
165
168
INHALTSVERZEICHNIS
5
Wiederholung: Häufungspunkte von Folgen und Mengen
6. Kompaktheit
7. Kontraktionen und Banachscher Fixpunktsatz
168
169
175
Kapitel 8. Differential-Rechnung für Funktionen in mehreren Veränderlichen
1. Vorbemerkungen
2. Differenzierbarkeit in mehreren Variablen
3. Höhere Ableitungen
3.1. Satz von Schwarz
3.2. Satz von Taylor
3.3. Einschub: Quadratische Formen
3.4. Lokale Extrema
4. Lokale Umkehrung differenzierbarer Abbildungen
5. Der Satz über implizit definierte Funktionen
6. Untermannigfaltigkeiten
7. Extrema mit Nebenbedingungen
177
177
178
189
189
192
194
197
199
204
208
214
Kapitel 9. Gewöhnliche Differentialgleichungen
1. Motivation
2. Definition und Reduktion auf autonome Gleichungen erster Ordnung
3. Der Satz von Picard-Lindelöf
4. Picard-Lindelöf für gewöhnliche Differentialgleichungen höherer Ordnung
5. Differentialgleichungen mit getrennten Variablen
6. Lineare gewöhnliche Differentialgleichungen
7. Einige Beispiele von linearen gewöhnlichen DGln
8. Stabilität und Verhalten in der Nähe von kritischen Punkten
217
217
219
223
234
234
236
241
241
Anhang A. Anhänge
Überblick über algebraische Strukturen
245
245
Anhang.
Literaturverzeichnis
247
Anhang.
Stichworte
249
6
INHALTSVERZEICHNIS
Warnungen
Legen Sie das Skript nicht in eine Ecke mit dem ruhigen Gewissen, es ja später lesen und durcharbeiten zu können. Beginnen Sie sobald wie möglich, die Lücken zu schließen. Schwierige Beweise
durchschauen Sie am besten, wenn Sie sich überlegen, was der Beweis in konkreten Beispielen
macht.
Bilder, Skizzen und Abschnitte die mit USW angedeutet werden, in der Vorlesung behandelt wurden, aber aus Zeitgründen noch nicht getext wurden, sind selbstverständlich auch relevant für
mündliche und schriftliche Prüfungen.
KAPITEL 1
Elementare Logik und Grundlagen der Mathematik
1. Die Struktur des mathematischen Denkens
Die natürlichen Zahlen werden seit Jahrtausenden intuitiv benutzt und untersucht. Sie sind uns vertraut,
ohne dass wir aber wirklich wissen, was sie charakterisiert. So ähnlich war es mit vielen mathematischen
Konzepten, zum Beispiel dem mathematischen Konzept der unendlichen Summe. Man nutzte viele Konzepte lange in einer vagen Bedeutung, ohne sich zu überlegen, wie man sie definiert. Leider führte dies
zu wachsenden Problemen. Es gab unter anderem viele Diskussionen, was denn der Wert der unendlichen
Summe
1 + (−1) + 1 + (−1) + . . .
sei, manche Mathematiker vertraten die Ansicht es sei 0: mit der Begündung
(1 + (−1)) + (1 + (−1)) + (1 + (−1)) + . . . = 0 + 0 + 0 + . . . = 0.
Dies erscheint überzeugend. Mit derselben Logik kann man aber auch begründen, dass man den Wert 1
erhält:
1 + ((−1) + 1) + ((−1) + 1) + . . . = 1 + 0 + 0 + . . . = 1.
Derartige Probleme motivierten die Mathematiker, die Mathematik auf solide Grundlagen zu stellen. Diese
Bewegungen, die man Axiomatik nennen kann, begann im Bereich der Geometrie bereits mit Euklid von
Alexandria (ca. 300 v. Chr.) und Aristoteles (384–322 v. Chr.). Wichtige Fortschritte in der Axiomatik der
Geometrie und insgesamt der Axiomatik wurden im 19. Jahrhundert vollbracht.
Das Ziel der Axiomatik ist es, die gesamte Mathematik aus wenigen Grundaussagen, sogenannten Axiomen,
herzuleiten.
Nehmen wir mal an, ich überlege mir, ob ich überhaupt existiere oder nicht. Mein Leben und meine Person
könnte ja auch nur das Ergebnis einer Simulation eines gigantischen Großrechners sein. Was könnte ich
tun, um diese Frage zu lösen? Ich kann mir selbst wehtun, ich empfinde Schmerz, also sollte ich existieren!
Falsch, das könnte Teil der gigantischen Simulation sein. Ich könnte einen Studenten in der hinteren Reihe
fragen, ob ich exitiere, er sagt ja. Ist dadurch meine Existenz bewiesen? Nein, denn er könnte Teil derselben
Simulation sein. Sie sehen, ich kann meine eigene Existenz nicht zeigen, ohne andere Grundannahmen zu
machen. Dennoch ist es sehr sinnvoll anzunehmen, dass ich existiere. Solche Probleme beschäftigen die
Philosophen schon seit Jahrhunderten oder besser Jahrtausenden.
Genauso wie aber unser elementares Denken Grundannahmen braucht, benötigt auch die Mathematik
bestimmte Grundannahmen, und diese Grundannahmen nennt man Axiome. Im Prinzip sollte in der
heutigen Mathematik alles auf den Axiomen der Mengenlehre aufbauen. Daraus konstruiert man sich dann
7
16.10.
8
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
alle Objekte des mathematischen Denkens: Zahlen, Vektorräume, Matrizen, und vieles mehr. Oft versieht
man Teilgebiete mit eigenen Axiomen, wie zum Beispiel die Axiome der klassischen Geometrie.
Axiome sind nicht mehr weiter beweisbar, sie werden einfach als gegeben hingenommen, als Grundannahmen unseres Denkens. Die Axiome erscheinen sinnvoll, entweder weil man sie als evident, also offensichtlich
ansieht, oder weil man sie als Kennzeichen der Theorie ansieht. Aus diesen Axiomen werden dann Schlussfolgerungen gezogen, die ebenfalls durch weitere Axiome geregelt sind. Durch erlaubte Kombination von
bereits bekannten wahren Aussagen erhält man neue wahre Aussagen. Eine Sammlung von so aufeinander
aufbauenden wahren Aussagen, nennt man Beweis. Falls eine so erhaltene Aussage interessant erscheint,
nennt man sie Theorem, Lemma, Korollar, Proposition, Satz, Hilfssatz, Folgerung oder ähnlich. Hierbei
ist im allgemeinen ein Satz oder ein Theorem eine wichtige Aussage, ein Lemma oder ein Hilfssatz eine
Aussage, die nur als Zwischenschritt dient, und eine Proposition hat eine Mittelstellung. Erhält man eine
Aussage nahezu unmittelbar aus einem Theorem oder Satz, so nennt man dies eine Folgerung oder ein
Korollar.
Damit die Aussagen nicht immer länger und länger werden, macht man Definitionen. Hierbei gibt man
mathematischen Objekten oder mathematischen Sachverhalten einen Namen.
Die Mathematiker sind im Prinzip recht frei in der Wahl ihrer Definitionen. So könnte man die folgende
Definition machen: Ein Auto ist eine Menge, in der die Elemente 1, 2 und 3 enthalten sind. Ein Hund ist
eine Menge, in der die Elemente 1 und 2 enthalten sind. Man schließt daraus, dass jedes Auto einen Hund
enthält. Diese Definitionen sind natürlich sehr irreführend, aber prinzipiell erlaubt. Wir Mathematiker
bemühen uns die Dinge so zu benennen, dass sie möglichst etwas mit der wirklichen Welt“ zu tun haben.
”
Um Koordinaten auf einer Kugel anzugeben, definiert man den Begriff einer Karte“, und ein Atlas“ ist
”
”
dann definiert als Menge von Karten, so dass alles überdeckt wird. Diese Begriffe sind dann zwar nicht
genau das, was man damit umgangssprachlich meint, aber auch nicht völlig ohne Zusammenhang. Die
mathematischen Begriffe Halm“ oder Garbe“ der Mathematik haben aber keinerlei Anwendungen in der
”
”
Landwirtschaft. Die Knoten“ der Mathematik sind aber wiederm nahe an dem, was man alltagssprachlich
”
als Knoten bezeichnet.
Um den Unterschied zwischen Definitionen und Aussagen klar zu unterscheiden, nutzen wir die folgende
Notation: a = 1, 234 ist die Aussage a ist gleich 1, 234“. Hingegen ist a := 1, 234 eine Definition, a ist ab
”
sofort eine kurze Schreibweise für 1, 234.
Viele Definitionen werden von allen Mathematikern gleich gemacht, es herrscht Konsens. Man ist sich
aber nicht einig, ob die Definition der natürlichen Zahlen die Null einschließen soll oder nicht. Für unsere
Vorlesung gilt: die natürlichen Zahlen sind
N = {1, 2, . . .}.
Die Menge N0 := N ∪ {0} bezeichnen wir als natürliche Zahlen mit Null. Dies ist eine der üblichen
Definitionen. Viele Mathematiker definieren hingegen die Menge der natürlichen Zahlen als {0, 1, 2 . . .}.
Das ist nicht weiter schlimm. Ob Null eine natürliche Zahl ist oder nicht, ist Definitionssache. Man schaut
sich die Definition des Autors an und weiß, was er meint.
In zentralistischen Ländern wie Frankreich ist klar geregelt: Null ist eine natürliche Zahl. In Deutschland
besagt DIN 5473 ebenfalls, dass Null eine natürliche Zahl ist. Lehrer in der Schule sollten sich an diese
DIN-Norm halten. An den deutschen Universitäten definiert man aber zumeist die natürlichen Zahlen ohne
Null, und daran halten wir uns hier auch.
2. AUSSAGENLOGIK
9
Anders ist es bei der Zahl π. Dass der Wert dieser Zahl zwischen 3,1415 und 3,1416 liegt ist eine Aussage
und keine Definition. Deswegen ist es lächerlich, dass der US-Bundesstaat Indiana 1897 den Wert von π
auf 3, 2 gesetzlich festlegen wollte, um Berechnungen zu vereinfachen und um es den Schülern einfacher zu
machen.
In der Vorlesung können wir nun aber leider nicht alles streng axiomatisch einführen, da dies viel zu lange
dauern würde. Wir müssen einen Kompromiss zwischen der nötigen Strenge und angemessener Kürze
finden.
Der Plan ist deswegen, nun Begriffe wie Mengen, Abbildungen, logische Operationen und viele ähnliche
Begriffe zunächst intuitiv einzuführen. Ich kann dies hier nicht in der oben angesprochenen logische Strenge
tun, möchte aber dennoch in einem Abschnitt einen kleinen Überblick geben, wie ein sinnvoller Satz von
Axiomen für die Mengenlehre aussehen kann.
Nachdem dieser einführende Teil beendet ist, wenden wir uns dem eigentlichen Inhalt der Analysis zu:
den reellen Zahlen, Folgen, Reihen, Differentiation und Integration. Zunächst einmal für Funktionen von R
nach R, später wird dies aber auf mehr-dimensionale Räume verallgemeinert, wir wollen dann zum Beispiel
die Funktion (x, y) 7→ x2 + y 2 differenzieren.
Ab diesem Zeitpunkt wird jede neue Aussage streng aus den bereits bewiesenen Aussagen und Axiomen
hergeleitet. Wenn Sie die Mengenlehre ebenfalls axiomatisch verstehen wollen, so ist es am besten, wenn
Sie begleitend sich etwas selbst durcharbeiten, z.B. das Buch [15], aber auch da werden letztendlich Fragen
zurückbleiben. Wenn Sie die Mengenlehre “richtig” verstehen wollen, sollten Sie später mit einer gewissen
mathematischen Reife, also in zwei oder drei Semester, die Logik nochmals systematisch studieren, z.B. an
Hand der Bücher [11] oder [17].
2. Aussagenlogik
Was ist eine Aussage?
Beispiele 2.1. Die folgenden Ausdrücke sind Aussagen
A1 : 2 ∗ 3 = 6
A2 : 2 + 2 = 1 + 3
A3 : Die Zahl 27 hat 4 Teiler.
A4 : Alle natürliche Zahlen haben eine Primfaktor-Zerlegung
A5 : Am 13.6.2013 hatte die Donau in Regensburg Hochwasser
A6 : Jürgen Trittin wurde im September 2013 zum Bundeskanzler gewählt
Wir gehen davon aus, dass wir eine Sprache haben, die aus Zeichenketten besteht. Manche Zeichenketten ergeben keinen Sinn, zum Beispiel hejekl“ oder Hund Maus Loch“, wir nennen sie
”
”
10
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
syntaktisch nicht sinnvoll. Wenn die Zeichenkette eine sinvolle Aussage macht, nennen wir sie
syntaktisch sinnvoll. 1
Definition 2.2. Eine Aussage ist eine syntaktisch sinnvolle Zeichenkette, die wahr (w) oder falsch
(f) ist.
Eine dritte Möglichkeit gibt es nicht, tertium non datur“.
”
A1 bis A6 sind Aussagen, A1 bis A5 sind wahr, A6 ist falsch. Wenn eine Aussage wahr ist, so sagen
wir auch: Die Aussage gilt.“
”
Bemerkung 2.3. Es gibt Wissenschaftsbereiche, in den neben das tertium non datur“ nicht gilt,
”
in denen also neben wahr“ und falsch“ weitere Möglichkeiten zugelassen werden. Z.B. in der
”
”
Quantenmechanik (Schrödingers Katze), Aussagen in der Wahrscheinlichkeitstheorie, Philosophie,
Teilgebiete der Logik. Für uns sind aber nur Aussagen zulässig, die entweder wahr oder falsch sind.
Man kann Aussagen durch elementare logische Operationen verknüpfen. Man kann diese zum
Beispiel durch Wahrheitstafeln definieren.
Definition 2.4 (Negation). Die Negation ¬ wird durch die folgende Wahrheitstafel definiert
A
w
f
¬A
f
w
LEMMA 2.5. Für alle Aussagen A gilt ¬(¬A) = A
Beweis. Wir unterscheiden zwei Fälle.
1. Fall: A ist wahr
A ist wahr =⇒ ¬A ist falsch
=⇒
¬(¬A) ist wahr
2. Fall: A = f
A ist falsch =⇒
=⇒
¬(¬A) ist falsch
¬A ist wahr
2
Definition 2.6 (Aussagenlogische Verknüpfungen). Die Und-Verknüpfung ∧, die Oder-Verknüpfung ∨, die Entweder-Oder-Verknüpfung Y, die Implikation (Wenn-Dann-Beziehung) →, die umgekehrte Implikation (Dann-Wenn-Beziehung2) ← und die Äquivalenz (Genau-Dann-Wenn-Beziehung)
↔ sind durch die folgende Wahrheitstafel definiert
1Dies soll hier nicht genauer definiert und spezifiziert werden, da es für unsere Zwecke unwichtig ist.
2Beispiel: (Die Straße wird nass.) ← (Es regnet.). In Worten: Die Straße wird (dann) nass, wenn es regnet.
Man kann logisch äquivalent auch sagen: Es regnet nur dann, wenn die Straße nass wird.
2. AUSSAGENLOGIK
A
w
w
f
f
B
w
f
w
f
A∧B
w
f
f
f
A∨B
w
w
w
f
AYB
f
w
w
f
11
→ ←
w w
f
w
w f
w w
↔
w
f
f
w
Ist die Aussage A ↔ B wahr, so sagen wir auch A und B sind äquivalent.
In zusammengesetzen Ausdrücken sind Negationen zuerst auszuführen, ansonsten muss man durch
Klammern die Reihenfolge klären sofern nötig. Zum Beispiel gilt
¬A ∧ B = (¬A) ∧ B
und dies ist im allgemeinen nicht dasselbe wie ¬(A ∧ B). Man darf aber die Klammern weglassen,
wenn das Resultat nicht von der Reihenfolge abhängt, Beispiele später.
Bisher haben wir nun angenommen A, B seien feste Aussagen. Oft steht der Wahrheitswert von
einem Ausdruck noch gar nicht fest, z.B.
A: Am 1.2.2014 wird es ein Erbeben in Japan geben
Um auch solche Ausdrücke behandeln zu können, deren Wahrheitswert noch nicht festgelegt ist,
führen wir aussagenlogische Variablen ein. Aussagenlogische Variablen sind Buchstaben und ähnliches (A, B, A1 , A2 ,..), denen wir später den Wert wahr (w) oder falsch (f) zuordnen können.
Definition 2.7 (Aussagenlogische Formel). Alle aussagenlogische Variablen und alle Aussagen
sind aussagenlogische Formel. Sind A und B aussagenlogische Formeln, dann sind auch ¬A und
die aussagenlogischen Verknüpfungen (A ∧ B), (A ∨ B), (A Y B), (A → B), (A ← B) und (A ↔ B)
aussagenlogische Formeln. Ausdrücke, die hieraus nicht nach endlich vielen Schritten entstehen,
sind keine aussagenlogische Formeln.
Man darf auch aussagenlogische Variablen in einer aussagenlogischen Formel durch eine aussagenlogische Formel ersetzen. Beispiel: Wenn wir in (A ∨ B) ∧ A die Variable A durch C → D ersetzen,
so erhalten wir ((C → D) ∨ B) ∧ (C → D).
PROPOSITION 2.8. Für alle Belegungen von A, B und C mit Wahrheitswerten w und f sind die
folgenden Aussagen wahr:
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
A ∨ ¬A (Tertium non datur)
¬(A ∧ ¬A) (Widerspruchsfreiheit)
A∨w
¬(A ∧ f )
(A ∨ f ) ↔ A
(A ∧ w) ↔ A
A ∨ B ↔ B ∨ A (Kommutativität von ∨)
A ∧ B ↔ B ∧ A (Kommutativität von ∧)
(A ∨ (B ∨ C)) ↔ ((A ∨ B) ∨ C) (Assoziativität von ∨)
18.10.
12
(j)
(k)
(l)
(m)
(n)
(o)
(p)
(q)
(r)
(s)
(t)
(u)
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
(A ∧ (B ∧ C)) ↔ ((A ∧ B) ∧ C) (Assoziativität von ∧)
(A ∨ B) ↔ (¬(¬A ∧ ¬B)) (de Morgansche Regeln)
(A ∧ B) ↔ (¬(¬A ∨ ¬B)) (de Morgansche Regeln)
(A ∧ (B ∨ C)) ↔ ((A ∧ B) ∨ (A ∧ C)) (Distributivgesetze)
(A ∨ (B ∧ C)) ↔ ((A ∨ B) ∧ (A ∨ C)) (Distributivgesetze)
(A → B) ↔ (B ← A)
(A → B) ↔ (¬A ∨ B) (Kontraposition)
(A ← B) ↔ (A ∨ ¬B)
(A → B) ↔ (¬B → ¬A)
(A ↔ B) ↔ ((¬A ∨ B) ∧ (A ∨ ¬B))
(A ↔ B) ↔ (¬(A Y B))
(A ∧ B) → A
Definition 2.9. Wir nennen zwei aussagenlogische Formeln äquivalent, wenn für alle Belegungen
der aussagenlogischen Variablen mit Wahrheitswerten, die daraus erhaltenen Aussagen äquivalent
sind.
Beispiel 2.10. Proposition 2.8 (g) besagt, dass A ∨ B äquivalent zu B ∨ A ist.
Proposition 2.8 (t) besagt, dass A ↔ B äquivalent zu ¬(A Y B) ist.
Diese Proposition wird in den Übungsgruppen bewiesen. Die obigen Äquivalenzen, d.h. die obigen
Aussagen in der Form D ↔ E, beweist man oft am besten, in dem man mit Hilfe einer Wahrheitstabelle D und E für alle Belegungen von A, B und C berechnet und dann vergleicht. Nachdem
man einige Aussagen gezeigt hat, kann man durch deren Kombination weitere erhalten.
Es folgt, dass A ∧ B ∧ C ein syntaktisch sinnvoller Ausdruck ist, da das Ergebnis nicht von der
Klammerung abhängt.
LEMMA 2.11. Die Aussagen E1 := A → (B → C) und E2 := (A → B) → C sind nicht äquivalent.
(Präziser gesagt: Es ist nicht richtig, dass für alle Wahlen von A, B und C die Aussagen E1 und
E2 äquivalent sind).
Deshalb ist also A → B → C kein syntaktisch sinnvoller Ausdruck, man muss hier Klammern
setzen.
Beweis. Angenommen, die Ausdrücke E1 und E2 wären für alle A, B und C äquivalent, so wären
sie insbesondere äquivalent im Fall, dass A, B und C falsch sind. Dann sind A → B und B → C
wahr und somit ist E1 wahr und E2 falsch. Somit haben wir einen Widerspruch zur obigen Annahme
erhalten. Die Annahme war also falsch. Also ist das Lemma bewiesen.
2
Der obige Beweis ist ein Widerspruchsbeweis. Um eine Aussage F zu zeigen, nimmt man zunächst
¬F an und leitet daraus einen Widerspruch her.
Hierbei ist
2. AUSSAGENLOGIK
13
F : Für alle Wahlen von A, B und C sind die Aussagen E1 und E2 äquivalent.
Ein anderer Typ von Widerspruchsbeweis ist noch häufiger. Man möchte eigentlich die Aussage
E → F zeigen. Man nimmt nun ¬F an und leitet daraus ¬E her. Man hat somit ¬F → ¬E gezeigt.
Dies ist aber mit Proposition 2.8 (r) äquivalent zu E → F .
Bemerkung 2.12. Die Symbole ⇐⇒ und =⇒ nutzen wir ähnlich wie die Symbole ↔ und →,
jedoch mit kleinen Unterschieden:
• ⇐⇒ und =⇒ werden nach ↔, →, ←, ∧,. . . ausgeführt.
Beispiel: Die Aussage
3 + 4 = 7 ⇐⇒ A ∨ ¬A
ist als (3 + 4 = 7) ⇐⇒ (A ∨ ¬A) zu lesen.
• Wir lesen Implikationsketten wie zum Beispiel A =⇒ B =⇒ C als (A impliziert B) und
”
(B impliziert C)“. Als Beispiel betrachte man den Beweis von Lemma 2.5. Der Ausdruck
A → B → C ist hingegen syntaktisch gar nicht sinnvoll, da Klammern benötigt werden.
Analog sind Äquivalenzketten zugelassen und zu interpretieren, zum Beispiel:
(l)“
”
¬(A ∨ ¬B) ∧ A ⇐⇒
(¬A ∧ B) ∧ A
(j)
⇐⇒ ¬A ∧ (B ∧ A)
(h)
⇐⇒ ¬A ∧ (A ∧ B)
(j)
⇐⇒ (¬A ∧ A) ∧ B
(b)“
”⇐⇒ f ∧ B
(f)“
”
⇐⇒
f
Bei jedem ⇐⇒ findet eine Äquivalenzumformung statt, die direkt aus bereits bekannten
Aussagen folgt. Die Buchstaben über den ⇐⇒-Pfeilen geben an, welche Eigenschaft in
Proposition 2.8 verwendet wurde. Die Anführungszeichen in der ersten und den beiden
letzten Zeilen deuten an, dass man leicht modifizierte Versionen der zitierten Punkte hernehmen muss. Die Verwendung des Zeichens ⇐⇒ wäre natürlich auch ohne die Erklärungen darüber gestattet. Die obige Umformungskette ist somit ein Beweis3 der Tatsache,
dass die Aussage ¬(A ∨ ¬B) ∧ A für alle Belegungen von A und B mit Wahrheitswerten
falsch ist.
¬(A ↔ B) ⇐⇒ ¬A ↔ B
⇐⇒ A ↔ ¬B
⇐⇒ A Y B
⇐⇒ ¬A Y ¬B
3Die Worte beweisen“ und zeigen“ haben in der Mathematik nahezu dieselbe Bedeutung.
”
”
14
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Die obigen Zeilen sind eine recht effektive Art und Weise darzustellen, dass die obigen
Ausdrücke alle paarweise äquivalent sind. Allerdings muss man hier etwas arbeiten“ um
”
jeweils von der linken Seite von ⇐⇒ zur rechten zu kommen. Dies geht in diesem Beispiel
mit einer Wahrheitstafel sehr gut.
• Um Missverständnisse zu vermeiden, verbieten wir es, Ausdrücke, die ⇐⇒ und =⇒ enthalten, durch weitere aussagenlogische Verknüpfungen zu verbinden. Das heißt beispielsweise, dass wir A ⇐⇒ (B =⇒ C) als syntaktisch nicht sinnvoll betrachten, also vergleichbar
zu jjkwdh“. 4
”
Beispiel: Proposition 2.8 (s) und (t) ergeben dann zusammen
A ↔ B ⇐⇒ (¬A ∨ B) ∧ (A ∨ ¬B) ⇐⇒ ¬(A Y B).
Bemerkung 2.13. Man könnte zunächst auch nur ¬ und ∧ durch Tabelle definieren und alle
anderen aussagenlogischen Verknüfungen durch Formeln in Proposition 2.8 erst dann definieren,
z.B. A ∨ B := ¬(¬A ∧ ¬B).
3. Mengen und Quantoren
Beschreibung 3.1 (Georg Cantor, 1845–1918). Unter einer Menge verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten unserer Anschauung oder unseres
Denkens (welche Elemente von M genannt werden) zu einem Ganzen.
Hier wird erklärt, was eine Menge ist. Auch eine Definition erklärt, was ein neuer Begriff bedeutet.
Dennoch ist die obige Erklärung keine mathematische Definition, sondern eine intuitive Erklärung.
Wenn man in der Mathematik sauber definieren will, was eine Menge ist, darf man nur Worte
und Strukturen benutzen, die zuvor schon ein klare Bedeutung haben. Es ist nun aber doch etwas
unklar, was die Worte Zusammenfassung“, “bestimmten“, “wohlunterschieden“ bedeuten.
”
Die obige Beschreibung“ sagt uns also lediglich, was wir uns unter einer Menge vorstellen sollen.
”
Definition 3.2. x ∈ M ist definiert als x ist ein Element von M“
”
x 6∈ M ist definiert als x ist kein Element von M“
”
x 6∈ M
⇐⇒
¬(x ∈ M )
Beispiele 3.3.
(1) {a, b, c}
(2) Bildliche Darstellung derselben Menge
4Wichtige Bemerkung an die Wiederholer: Die Unterscheidung zwischen ↔ und ⇐⇒ in dieser Vorlesung hat
so gut wie keine Gemeinsamkeiten mit der Unterscheidung dieser Symbole in der Vorlesung von Prof. Bunke. Unser
↔ entspricht aber ungefähr dem ⇐⇒ in der Vorlesung von Prof. Bunke.
3. MENGEN UND QUANTOREN
a
15
b
c
(3) Die Menge aller natürlichen Zahlen: N = {1, 2, 3, . . . , }. Übliche Formulierung: Die Menge N
der natürlichen Zahlen.
(4) Die Menge R der reellen Zahlen 5
(5) Die Menge R+ der positiven reellen Zahlen. (Die Null ist weder positiv noch negativ). Manchmal schreibt man auch R>0 , da in dieser Schreibweise deutlicher wird, dass die Null hierin
nicht enthalten ist.
Konvention: {a, b, a} = {a, b}. Man darf Elemente mehrfach aufzählen, sie sind dann aber nur
einmal in der Menge. Ein Element kann in einer Menge sein, oder nicht darin sein, es kann aber
nicht mehrfach in M enthalten sein.
Definition 3.4. Die Menge, die keine Elemente hat, heißt die leere Menge, und wird notiert als ∅
oder {}.
!ACHTUNG!. ∅ =
6 {∅} und 1 6= {1} =
6 {{1}}.
Bei Aussagen und aussagenlogischen Formeln schreiben ab sofort :⇐⇒ für ist definiert als“.
”
Definition 3.5 (Teilmenge).
(1) Die Menge N ist eine Teilmenge von M , genau dann wenn (x ∈ N ) → (x ∈ M ) wahr ist. In
Formeln: N ⊂ M :⇐⇒ (x ∈ N ) → (x ∈ M ).
(2) Die Menge N ist eine echte Teilmenge von M , genau dann wenn N eine Teilmenge M ist und
von M verschieden ist. Wir schreiben hierfür N ( M .
Beispiele 3.6.
(1) {1, 2} ⊂ {1, 2, 3} und {1, 2} ( {1, 2, 3}.
(2) Für alle Mengen M gilt: ∅ ⊂ M
(3) Für alle Mengen M gilt: M ⊂ M
23.10.
Definition 3.7 (Aussageformen). Sei M eine Menge. Eine auf M definierte Aussageform P ordnet
jedem Element von M einen Wahrheitswert zu.
Später (d.h. sobald wir in Abschnitt 4 den Begriff Abbildung“ eingeführt haben), ist eine Aussa”
geform also eine Abbildung
P
M −→ {w, f}.
Eine aussagenlogische Formel in einer Variablen ist also eine auf {w, f} definierte Aussageform.
5Achtung: Was eine reelle Zahl ist, müssen wir eigentlich noch zuerst lernen!
16
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Die Verknüpfungen ¬, ∧, ∨, . . . , ⇐⇒ und das Definitionszeichen :⇐⇒ werden wie bisher verwendet.
Beispiel 3.8. R −→ {w, f}, x 7→ x2 = 4 ist eine auf R definierte Aussageform.
Definition 3.9. Ist P eine auf M definierte Aussageform, so definieren wir
{x ∈ M | P (x)}
als die Teilmenge aller Elemente x von M , für die P (x) wahr ist.
Es gilt somit für alle y ∈ M :
y ∈ {x ∈ M | P (x)}
⇐⇒
P (y)
Zu Beispiel 3.8: {x ∈ R | x2 = 4} = {−2, 2}
Umgekehrt: Ist N eine Teilmenge von M , so ist
(
P (x) :=
w
f
falls x ∈ N
falls (x ∈ M ) ∧ x 6∈ N
eine auf M definierte Aussage und es gilt dann
N = {x ∈ M | P (x)}.
Beispiel 3.10. Die Menge der geraden natürlichen Zahlen ist
2N := {n ∈ N | n/2 ∈ N}.
Sei k ∈ N. Die Menge der durch k teilbaren ganzen Zahlen ist
kZ := {n ∈ Z | n/k ∈ Z}.
Analog kN.
Die Menge der Primzahlen ist
{n ∈ N | n besitzt genau zwei Teiler}.
Definition 3.11. Seien M und N Mengen. Wir definieren hieraus neue Mengen
(a) den Schnitt (oder die Schnittmenge) von M und N als
M ∩ N := {x ∈ M | x ∈ N } = {x ∈ N | x ∈ M }.
Man kann auch sagen, es ist die Menge, so dass gilt:
x∈M ∩N
⇐⇒
(x ∈ M ) ∧ (x ∈ N ).
(b) die Vereinigung(smenge) von M und N als
x∈M ∪N
:⇐⇒
(x ∈ M ) ∨ (x ∈ N ).
3. MENGEN UND QUANTOREN
17
(c) das Komplement von N in M als
M r N := {x ∈ M | x 6∈ N }
oder dazu äquivalent
x∈M rN
⇐⇒
(x ∈ M ) ∧ x 6∈ N
Beispiel 3.12. Sei A := {1, 2, 3} und B := {3, 4, 5}. Dann ist A ∩ B = {3}, A ∪ B = {1, 2, 3, 4, 5}
und A r B = {1, 2}.
BILDER ZUR VERANSCHAULICHUNG
Definition 3.13. Zwei Mengen M und N heißen disjunkt, falls M ∩ N = ∅.
Es gelten viele zu Proposition 2.8 analoge Aussagen.
PROPOSITION 3.14. Seien P und Q Teilmengen von M . Dann gilt
(a)
(b)
(c)
(d)
(e)
(f)
(g)
P
P
P
P
P
P
P
∪ (M r P ) = M
∩ (M r P ) = ∅
∪M =M
∩∅=∅
∪∅=P
∩M =P
∪ Q = Q ∪ P (Kommutativität von ∪)
...
Diese Gesetze entsprechen den Gesetzen in Proposition 2.8.
ÜBUNG 3.15. Übersetzen Sie die restlichen Aussagen aus Proposition 2.8 (h) bis (n) in Aussagen
über Mengen. Beweisen Sie all diese Aussagen.
Aussagen6 in der Art Für alle Elemente x ∈ M ist die Aussage A(x) wahr.“ und Es gibt (min”
”
destens) ein Element x ∈ M , für das A(x) wahr ist.“ sind sehr häufig. Man schreibt kurz hierfür
∀x ∈ M : A(x) und ∃x ∈ M : A(x). Man nennt ∀ den Allquantor und ∃ den Existenzquantor. Als
Beispiel betrachten wir die Definition von Stetigkeit, ein zentraler Begriff der Analysis, auch wenn
wir noch nicht alles hier verstehen sollten.
Definition 3.16. Eine Abbildung f : R −→ R ist stetig in x0 , genau dann wenn
∀ ∈ R+ : ∃δ ∈ R+ : ∀x ∈ R : (|x − x0 | < δ) → (|f (x) − f (x0 )| < )
{z
}
|
A(x,x0 ,δ,f,)
6Natürlich erlauben wir hier auch aussagenlogische Formeln und Aussageformen
18
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
A(x, x0 , δ, f, ) ist eine auf R × R × R+ × Abb(R, R) × R+ definierte Aussageform. Da wir Produkte
wie R × R × R+ × Abb(R, R) × R+ erst am Ende dieses Abschnitts einführen, stellt man sich unter
A am besten eine Aussageform vor, die nicht nur von einer, sondern von 5 Variablen abhängt.
Das folgende ist intuitiv klar:
¬(∃x ∈ M : A(x)) ⇐⇒ ∀x ∈ M : ¬A(x).
Klammerregel: Sei A(x, y) eine Aussage die von den Parametern x ∈ X und y ∈ Y , dann ist
∀/∃x ∈ X : ∀/∃y ∈ Y : A(x, y)
zu lesen als
∀/∃x ∈ X :
∀/∃y ∈ Y : A(x, y) .
Es gilt offensichtlich
∀x ∈ X : ∀y ∈ Y : A(x, y) ⇐⇒ ∀y ∈ Y : ∀x ∈ X : A(x, y)
∃x ∈ X : ∃y ∈ Y : A(x, y) ⇐⇒ ∃y ∈ Y : ∃x ∈ X : A(x, y)
Man sagt kurz: zwei af. (aufeinanderfolgende) Allquantoren vertauschen miteinander“, oder man
”
sagt zwei af. Allquantoren kommutieren“. Analog kommutieren zwei af. Existenzquantoren.
”
!ACHTUNG!. Allquantoren kommutieren nicht mit Existenzquantoren!
Beispiel 3.17. Die Aussage
(3.18)
∀x ∈ R : ∃y ∈ R : x > y
ist wahr. Denn für ein gegebenes x ∈ R können wir die Zahl y := x − 1 hernehmen und diese erfüllt
y < x. Deswegen ist für alle x ∈ R die Aussage ∃y ∈ R x > y wahr, also auch (3.18).
Die Aussage
(3.19)
∃y ∈ R : ∀x ∈ R : x > y
ist falsch. Denn für ein gegebenes y ∈ R gilt nicht für alle x ∈ R die Ungleichung x > y. Die
Ungleichung gilt zum Beispiel nicht für x := y. Also gibt es kein y ∈ R, so dass ∀x ∈ R : x > y
wahr ist. Also ist (3.19) falsch.
REGEL 3.20. Quantoren für eine Variable müssen stehen, bevor diese Variable gebraucht werden
darf. 7
Beispiel 3.21. Ausdrücke in der Art Es gilt 2x = x + x für alle x ∈ R“ erklären wir ab sofort
”
und bis auf weiteres als syntaktisch nicht sinnvoll. Erlaubt sind nur Sätze wie Für alle x ∈ R gilt
”
2x = x + x.“
7In späteren Semestern wird diese Regel nicht mehr befolgt, wenn keine Missverständnisse zu erwarten sind.
3. MENGEN UND QUANTOREN
19
Die Regel ist deswegen wichtig, damit nicht unklar bleibt, wie die folgende Aussage verstanden
werden soll:
Für alle x ∈ R gilt x > y für ein y ∈ R.
Diesen Ausdruck könnte man als die wahre Aussage (3.18) oder als die falsche Aussage (3.19) verstehen. Deswegen legen wir durch die obige Regel fest, dass Ausdrücke wie das obige A syntaktisch
nicht sinnvoll sind.
Frage 3.22. Ist die folgende Aussage A wahr?
∀x ∈ ∅ : x = x + 1.
A :⇐⇒
Das didaktische Problem hier ist: obwohl uns bisher intuitiv klar war, was ∀x ∈ M : A(x) bedeutet,
ist ∀x ∈ ∅ : A(x) nicht intuitiv klar. In studentischen Lösungen der Aufgabenblätter steht oft in
so einem Fall: Da die Aussage x = x + 1 für kein einziges Element in ∅ gilt, gilt sie natürlich auch
”
nicht für alle Elemente in ∅.“ Das ist ein weit verbreiteter Fehler.
REGEL 3.23. In der Mathematik ist die Aussage
∀x ∈ ∅ : A(x)
für alle Aussageformen A(x) immer wahr und die Aussage
∃x ∈ ∅ : A(x)
für alle Aussageformen A(x) immer falsch.
Diese Regel ist letztendlich eine Definition, man könnte auch sagen eine Konvention. Wenn wir
hier aber eine andere Konvention wählen würden, hätten wir viele Ausnahmen zu berücksichtigen.
Zum Beispiel erscheint uns die folgende Äquivalenz intuitiv klar:
∀x ∈ M : A(x)
⇐⇒
{x ∈ M | ¬A(x)} = ∅.
Die rechte Seite ist für M = ∅ offensichtlich wahr.
Notation 3.24. Man schreibt auch oft ∃x : A(x). Dies bedeutet, es existiert eine Menge, in der ein
Element existiert, für das A(x) wahr ist. Beispiel: die Aussage ∃x : x ∈ M ist äquivalent zu M 6= ∅.
Analog heißt ∀x : A(x), dass für alle Mengen und alle Elemente darin die Aussage A(x) wahr ist.8
Analog hierzu: ist A(x) eine auf allen Elementen von allen Mengen definierte Aussageform, so
bezeichnet {x | A(x)} die Menge aller Elemente, für die A(x) wahr ist. Diese Bezeichnungen sind
vor allem in axiomatischen aufgebauten Logik-Büchern wie [11] üblich, sind aber gefährlich: zum
Beispiel ist {x | A(x)} oft gar keine Menge, siehe Abschnitt 5.
Definition 3.25. Ist M eine Menge, so ist P(M ) die Menge aller Teilmengen von M . Man nennt
P(M ) die Potenzmenge von M .
8Bei dieser Notation“ handelt es sich eigentlich auch um eine Definition; es ist die Definition einer Schreibweise.
”
Wir verwenden hier den Begriff Notation, um anzudeuten, dass hier kein neuer Begriff eingeführt wird, sondern eine
neue Schreibweise.
20
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
x ∈ P(M )
⇐⇒
x⊂M
Beispiele 3.26.
(1) P({1, 2}) = {∅, {1}, {2}, {1, 2}}
(2) P(∅) = {∅} =
6 ∅
Definition 3.27. Sei X eine Menge. Ein Mengensystem über einer Menge X ist eine Teilmenge
von P(X). Dies bedeutet, dass M genau dann ein Mengensystem ist, wenn alle Elemente von M
eine Teilmenge von X sind.
Wir definieren dann
[
M := {x | ∃m ∈ M : x ∈ m} = {x ∈ X | ∃m ∈ M : x ∈ m}
und falls zusätzlich M 6= ∅ definieren wir
\
M := {x | ∀m ∈ M : x ∈ m}.
Offensichtlich gilt
S
M ⊂ X und
T
M ⊂ X.
Beispiele 3.28.
T
T
Für M := {{1, 2, 3},S{3, 5, 7},
T {1, 3, 5}} gilt M = {1, 2, 3, 5, 7} und M = {3}.
Für M := {A} gilt M
S = M = A.
T
Für M := {A, B} gilt M = A ∪ B und M = A ∩ B.
Sei
M := {X ∈ P(Z) | ∃k ∈ N : X = kZ} = {Z, 2Z, 3Z, 4Z, . . .}.
S
T
Dann gilt M = Z und M = {0}.
T
Bemerkung 3.29.
∅ ist nicht definiert worden, denn jedes Element von irgendeiner Menge ist
auch ein Element von K := {x | ∀m ∈ ∅ : x ∈ m}. Dieses K ist so groß, dass es gar keine Menge
mehr ist, siehe Abschnitt 5.
(1)
(2)
(3)
(4)
25.10.
Paare und kartesische Produkte.
Es gilt {1, 2} = {2, 1}. Eine Menge mit genau zwei Elementen heißt ungeordnetes Paar. In der
Mathematik brauchen aber auch (geordnete) Paare9. Wir wollen an einem Beispiel erklären, wieso
sie gebraucht werden, und uns dann um eine saubere Defintion kümmern.
Réné Descartes (1596–1650):
Nach Wahl eines Ursprungs und einer Basis beschreibt man Punkte auf einer Geraden durch eine
reelle Zahl, Punkte in einer Ebene durch zwei reelle Zahlen und Punkte im Raum durch drei reelle
Zahlen.
BILD
9Ein Paar ist immer ein geordnetes Paar, es sei denn wir sagen explizit ‘ ungeordnet“ dazu.
”
3. MENGEN UND QUANTOREN
21
{ Punkte in der Ebene } ∼
= { geordnete Paare von zwei reellen Zahlen } ∼
= R×R ∼
= R2
Paar := geordnetes Paar
Definition“ 3.30. Sind M und N Mengen, so definieren wir wir
”
M × N := {(m, n) | m ∈ M, n ∈ N }
wobei (m, n) ein Paar aus m und n ist. Man nennt M ×N das (kartesische) Produkt von M und N .
Für Paare gilt z.B. (3, 4) 6= (4, 3).
Das problematische an obiger Definition“ ist, dass wir den Begriff Paar“ noch gar nicht definiert
”
”
haben. Ein formal korrekter, aber unanschaulicher Ausweg ist die folgende Definition, die auf den
Mathematiker Kuratowski zurückgeht. Sie macht aus dem obigen Definitions-Versuch ( Definiti”
on“ 3.30) eine richtge Definition.10
Definition 3.31. Wir definieren das Paar von m und n als
(m, n) := {{m}, {m, n}}.
Diese Definition ist unanschaulicher als sie zunächst aussieht, wie das folgende Beispiel zeigt:
Beispiel 3.32. Für M = N = N und m = n = 1 gilt (m, n) = {{1}}.
Aus diesem Grund wählen manche Bücher andere Definitionen, die aber wieder andere Probleme
haben. Wichtig ist für uns aber letztendlich gar nicht, was Produkte wirklich sind“, sondern nur
”
welche Eigenschaften erfüllt sind. Deswegen versteht man Paare und Produkte besser, wenn man
die folgende wichtige Eigenschaften der Paarbildung ansieht.
LEMMA 3.33.
(m, n) = (m̃, ñ)
⇐⇒
m = m̃ und n = ñ.
Beweis. Die Richtung ⇐=“ ist offensichtlich.
”
Zu =⇒“: Sei (m, n) = (m̃, ñ). Also gilt nach Definition
”
(3.34)
{{m}, {m, n}} = {{m̃}, {m̃, ñ}}.
Wir wissen bereits, dass {{m}, {m, n}} ein oder zwei Elemente besitzt. Wir müssen zwei Fälle
unterscheiden.
1. Fall: Die Menge {{m}, {m, n}} besitzt ein Element.
In diesem Fall ist dann {m} das einzige Element und somit {m} = {m, n} und desweegn m = n.
Wegen (3.34) hat auch {{m̃}, {m̃, ñ}} nur ein Element, also ergibt sich analog m̃ = ñ. Es gilt nun
{m} = {{m}, {m, n}} = {{m̃}, {m̃, ñ}} = {m̃}.
Es folgt m = n = m̃ = ñ.
10Wir können dann also die Anführungsstriche weglassen.
22
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
2. Fall: Die Menge {{m}, {m, n}} besitzt zwei Elemente.
Es gilt also {m} 6= {m, n} und somit m 6= n. Analog enthält {{m̃}, {m̃, ñ}} die Elemente {m̃}
und {m̃, ñ} . Da {m} und {m̃} genau ein Element enthalten, und da {m, n} genau zwei Elemente
enthält, folgt aus (3.34), dass {m} = {m̃} und somit m = m̃. Außerdem gilt dann {m, n} = {m̃, ñ}.
Da diese Menge außer m = m̃ noch genau ein weiteres Element enthält, gilt auch n = ñ.
2
Definition 3.35. Falls M1 , M2 , . . . , Mk Mengen sind, so definieren das k-fache kartesische Produkt
hiervon als
M1 × M2 × · · · × Mk := M1 × (M2 × (· · · Mk−1 × Mk )) · · · ).
Elemente hiervon nennen wir k-Tupel. Wir schreiben sie in der Form (x1 , x2 , . . . , xk ), wobei xi ∈
Mi . Ein Paar ist also ein 2-Tupel. Ein 3-Tupel nennt man auch Tripel . 4-Tupel sind Quadrupel ,
5-Tupel sind Quintupel. Wir nutzen auch die Schreibweise
Mk = M × M × · · · × M .
{z
}
|
k-mal
Beispiel: R3 = R × (R × R)
4. Relationen, funktionale Relationen, Abbildungen
Definition 4.1. Eine Menge R heißt Relation, wenn jedes Element von R ein Paar ist.
Beispiele 4.2.
(1) ∅ ist eine Relation
(2) {∅, (1, 2)} ist keine Relation, da ∅ kein Paar ist.
(3) Ist M eine Menge, so ist ∆M := {(x, y) ∈ M 2 | x = y} eine Relation. 11 Man nennt sie die
Diagonale in M × M . BILD zur Erklärung der Diagonalen.
(4) ≤R := {(x, y) ∈ R2 | x ≤ y} ist eine Relation.
(5) =R := {(x, y) ∈ R2 | y = 3x2 + 2} ist eine Relation.
(6) M = {1, 2, 3}. Wir definieren die Relationen R1 ⊂ M × M und R2 ⊂ M × M durch das
folgende Bild oder sagen R1 := {(1, 1), (1, 3), (2, 1), (3, 1)} und R2 := {(1, 2), (3, 2)}
BILD
Definition 4.3. Ist R eine Relation, so schreiben wir auch xRy für die Aussage(form) (x, y) ∈ R.
12
Sei M eine Menge und sei R ⊂ M × M . Die Relation heißt
(1) reflexiv auf M :⇐⇒ ∀x ∈ M : xRx,
11Wenn wir ganz korrekt sind, müssen wir eigentlich zuerst definieren was {(x, y) ∈ M 2 | A(x, y)} bedeutet.
Wir definieren dies als {z ∈ M 2 | ∃x ∈ M : ∃y ∈ M : z = (x, y) ∧ A(x, y)}.
12Wir betrachten ab sofort eine aussagenlogische Formel in k Variablen als eine auf {w, f }k definierte Aussageform. Jede Aussage und jede aussagenlogische Formel ist also auch eine Aussageform.
4. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN
23
(2) symmetrisch :⇐⇒ ∀x ∈ M : ∀y ∈ M : xRy → yRx,
|
{z
}
∀x,y∈M :
antisymmetrisch :⇐⇒ ∀x, y ∈ M : (xRy ∧ yRx) → x = y,
transitiv :⇐⇒ ∀x, y, z ∈ M : (xRy ∧ yRz) → xRz,
Äquivalenzrelation auf M , falls R reflexiv auf M , symmetrisch und transitiv ist.
Ordnung(srelation) auf M oder partielle Ordnung(srelation) auf M , falls R reflexiv, antisymmetrisch und transitiv ist.
(7) Erfüllt eine Ordnungsrelation R auf M zusätzlich die Eigenschaft
(3)
(4)
(5)
(6)
∀x, y ∈ M : xRy ∨ yRx
dann nennt man R eine totale Ordnung(srelation).13
Beispiele 4.4. Zu den Beispielen 4.2:
∆M ist reflexiv auf M , symmetrisch, und transitiv, also eine Äquivalenzrelation auf M . ∆M ist
ein wichtiges Beispiel einer Äquivalenzrelation.
=R ist reflexiv auf R, symmetrisch und transitiv, also eine Äquivalenzrelation.
≤R ist reflexiv auf R, antisymmetrisch und transitiv, also eine Ordnungsrelation auf M . Diese
Ordnung ist total.
Ist M eine Menge, so definieren wir
⊂M := {(A, B) ∈ P(M )2 | A ⊂ B}.
⊂M ist eine Ordnungsrelation auf P(M ). Sie ist keine totale Ordnung, wenn M mindestens 2
Elemente besitzt. 14
Ein Beispiel, das in der (Linearen) Algebra wichtig ist. 15 Zu k ∈ N definieren wir die Relation
R := {(x, y) ∈ Z2 | x − y ∈ kZ}. Dies ist eine Äquivalenzrelation. Betrachte den Spezialfall k = 10,
x, y ∈ N. Es gilt dann xRy genau dann, wenn die letzte Ziffer in der Dezimaldarstellung von x mit
der von y übereinstimmt.16
WEITERES BEISPIEL: BILD MIT PFEILEN
M := {a, b, c, d, e, f }.
13Manche Quellen nennen solche eine Relation eine lineare Ordnungsrelation. Andere Quellen wiederum bezeichnen unsere Ordnungsrelationen“ als Halbordnungen“ und unsere totalen Ordnungen“ als Ordnungen“.
”
”
”
”
14Bei Ordnungsrelation
werden immer zwei Objekte verglichen: Ist eine Zahl größer als eine andere? Ist eine
Menge in der anderen enthalten? Etc. Insofern sind ≤R und ⊂M ganz wichtige Beispiele. ∆M ist auch antisymmetrisch, also auch eine Ordnungsrelation. Sobald M mindestens 2 Elemente besitzt, ist es keine totale Ordnungsrelation. Dennoch ist ∆M ein atypisches Beispiel, denn ∆M ist die einzige symmetrische Ordnungsrelation auf M .
Analoges gilt für =R = ∆R .
15
Wird in der am 29.10. Zentralübung diskutiert.
16Äquivalenzrelationen werden in der Mathematik dann verwendet, wenn zwei Objekte in einem manchmal
recht groben Sinne gleich“ sind — oder mathematisch korrekter ausgedrückt — wenn sie äquivalent im durch R
”
definierten Sinne sind.
24
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Es gelte xRy, genau wenn x = y oder wenn man von x nach y kommt, in dem man den Pfeilen in
der angegebenen Richtung folgt.
Es gelte xQy, genau wenn x = y oder wenn man von x nach y kommt, in dem man den Pfeilen in
irgendeiner Richtung folgt.
Dann ist R eine Ordnungsrelation und Q eine Äquivalenzrelation.
17
Definition 4.5. Eine Relation F nennen wir eine funktionale Relation, falls gilt:
∀x : ∀y : ∀z : (x, y) ∈ F ∧ (x, z) ∈ F → y = z.
Zu jedem x gibt es also höchstens ein y mit xF y. Wir sagen dann: x wird durch F auf y abgebildet
und schreiben x 7→ y oder y = F (x).
Beispiele (1), (3) und (5) sind funktionale Relationen. Beispiel (4) ist keine funktionale Relation.
In Beispiel (6) ist R2 funktional, aber R1 ist nicht funktional.
BILD mit zwei Mengen und Pfeilen von links nach rechts
Definition 4.6. Ist R eine Relation, so definieren wir:
D(R) := {x | ∃y : xRy},
Definitionsbereich von R;
B(R) := {y | ∃x : xRy},
Bild der Relation R;
18
30.10.
Zu jeder Relation R gibt es eine Menge M , so dass R ⊂ M × M . Wir können zum Beispiel
M := D(R) ∪ B(R) setzen.
Definition 4.7. Eine Abbildung ist ein Tripel (f, X, Y ), bestehend aus einer funktionalen Relation f und Mengen X und Y , wobei D(f ) = X und B(f ) ⊂ Y . Zumeist schreibt man Abbildungen
f
als f : X −→ Y oder X −→ Y .19 Man nennt X den Definitionsbereich der Abbildung f : X −→ Y ,
man nennt Y den Zielbereich der Abbildung und man nennt f den Graphen der Abbildung. Eine
Abbildung von X nach Y ist eine Abbildung mit Definitionsbereich X und Zielbereich Y . Die Menge aller Abbildungen von X nach Y notieren wir als Abb(X, Y ) oder als Y X . Die Notation x 7→ y
bedeutet, dass x auf y abgebildet wird, d.h. (x, y) ist ein Element der funktionalen Relation.
Abbildungen mit Zielbereich R nennt man oft auch (reell-wertige) Funktionen.
17Äquivalenz- und Ordnungsrelationen werden nach Absprache mit Prof. Kerz in der Linearen Algebra I vertieft
besprochen, und in der Analysis I nur kurz. Damit alle, insbesondere diejenigen, die Lineare Algebra I (noch?) nicht
hören, viele Beispiele sehen, werden wir in der Zentralübung am 29.10. einige Beispiele sehen.
18Viele Bücher, z.B. [15] bezeichnen B(R) als Wertebereich oder Wertemenge. Es gibt aber auch Bücher, die
den Begriff Wertebereich im Sinne des unten definierten Zielbereichs definieren. Wir werden aus diesem Grund die
Begriffe Wertebereich“ und Wertemenge“ vermeiden.
”
”
19Der
Abildungspfeil ist länger als der Implikationspfeil, damit Sie sie besser unterscheiden können.
4. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN
25
Beispiele 4.8.
(a) f := {(x, y) ∈ [0, 5] × R | y = x2 } ist eine funktionale Relation mit D(f ) = [0, 5] und B(f ) =
[0, 25]. Dann ist f : [0, 5] −→ [−4, 40] eine Abbildung. Wir schreiben derartige Abbildungen
als
f : [0, 5]
x
−→
7→
[−4, 40]
x2
Alternativ kann man die zweite Zeile auch durch f (x) = x2 oder f (x) := x2 ersetzen.
(b) Sei f wie oben. Die Abbildungen F1 := (f, [0, 5], [0, 25]) und F2 := (f, [0, 5], [−4, 40]) sind
verschieden, obwohl die selbe funktionale Relation f zu Grunde liegt.
(c) Die Identität idM von M ist die Abbildung (∆M , M, M ), die wir (dem obigen Beispiel folgend)
auch als M −→ M , x 7→ x schreiben können.
(d) Ist M eine Teilmenge von N , so nennen wir die Abbildung (∆M , M, N ) die Inklusion von M
in N oder genauer Inklusion der Menge M in die Menge N . 20
Bemerkung 4.9. Aus Ihrer jetzigen Sicht ist der essentielle Unterschied zwischen einer funktionalen Relation und einer Abbildung, dass im Begriff der Abbildung auch der Zielbereich festgelegt
ist, während eine funktionale Relation keinen Zielbereich hat. Später werden der Definitionsbereich
und der Zielbereich zusätzliche Struktur tragen: z.B. eine Vektorraumstruktur, eine Gruppenstruktur oder eine Abstandsfunktion. Da wichtige Eigenschaften von Abbildungen wie z.B. Linearität
und Stetigkeit von solcher Zusatzstruktur abhängt, wird es dann hilfreich sein, dass auch der
Definitionsbereich im Tripel einer Abbildung enthalten ist.
21
Bemerkung 4.10. Zur Interpretation: Äquivalenz- und Ordnungs-Relationen auf der einen Seite
und funktionale Relationen sind zwar ähnlich definiert (als Relationen und somit als Mengen, deren
Elemente Paare sind). Dennoch interpretiert man sie anders: Äquivalenz- und Ordnungsrelationen
vergleichen zwei Objekte. Beispiel: die Relation ≤R , gibt an, ob die links stehende Zahl kleiner oder
gleich der rechts stehenden ist. Die Interpretation von funktionalen Relationen ist dynamischer,
x 7→ x2 ordnet x den Wert x2 zu, so wie ein(e) Platzanweiser(in) im Theater jedem Zuschauer sagt,
in welchem Stockwerk er den Theatersaal betreten darf: im Parkett (0. Stockwerk) oder im k-ten
Rang (k-tes Stockwerk): jedem Zuschauer wird ein Stockwerk zugeordnet. Aus diesem Grund ist
die Schreibweise xRy für Ordnungs- und Äquivalenzrelationen üblich, wohingegen die Schreibweise
y = R(x) für funktionale Relationen üblich ist. Beides ist defniert als (x, y) ∈ R.
20wichtig ist hier die Konjugation von die Menge“: Genitiv (bzw. von-Konstruktion), dann Akkusativ
”
21Vergleich zu anderen Lehrbüchern: Es
herrscht Uneinigekeit in der Literatur, ob eine Abbildung Informa-
tion über den Zielbereich trägt oder nicht. Das Lehrbuch [10] unterscheidet in diesem Zusammenhang zwischen
Funktionen“, die wie unsere funktionale Relationen“ definiert sind, und Funktionen von X nach Y “, die im
”
”
”
wesentlichen unseren Abbildungen“ entsprechen. In [15] bedeuten die Begriffe funktionale Relation“, Funktion“
”
”
”
und Abbildung“ dasselbe, es bleibt aber dort unklar, ob die oben definierten Abbildungen F1 und F2 in diesem
”
Buch gleich oder verschieden sind. Wir werden in der Vorlesung die obigen Definitionen nutzen und zulassen, um
innerhalb unserer Analysis I Klarheit zu schaffen.
26
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Definition 4.11. Sei f : X −→ Y eine Abbildung.
(1) Für M ⊂ X definieren wir die Einschränkung oder Restriktion von f : X −→ Y auf M
als die Abbildung (f |M , M, Y ), wobei
f |M := {(x, y) ∈ X × Y | x ∈ M ∧ y = f (x)} = {(x, y) ∈ M × Y | (x, y) ∈ f },
(2) Ist g : Y −→ Z eine weitere Abbildung, so definieren wir die Verkettung, die Komposition
oder die Verknüpfung von g : Y −→ Z mit f : X −→ Y als die Abbildung (g ◦ f, X, Z),
wobei
g ◦ f := {(x, z) ∈ X × Z | ∃y ∈ Y : y = f (x) ∧ z = g(y)}.
Es gilt dann also g ◦ f (x) = g(f (x)). Man liest g ◦ f als g nach f“.
”
Definition 4.12.
(1) Eine funktionale Relation f bzw. eine Abbildung f : X −→ Y heißt injektiv , falls gilt
∀x1 , x2 ∈ X : f (x1 ) = f (x2 ) → x1 = x2 .
Dies bedeutet, dass jedes Element in X unter f auf ein anderes Element in Y abgebildet wird.
(2) Eine Abbildung f : X −→ Y heißt surjektiv , falls B(f ) = Y .
(3) Eine Abbildung f : X −→ Y heißt bijektiv , falls sie injektiv und surjektiv ist.
BILDER HIERZU MIT Menge links und Menge rechts und Pfeilen.
Wenn f eine funktionale Relation ist, so ist f : D(f ) −→ B(f ) eine surjektive Abbildung, die wir
die von f definierte Abbildung auf B(f ) nennen.
Beispiele 4.13.
(a) Die Abbildung R −→ R, x 7→ x2 ist weder injektiv noch surjektiv.
(b) Die Abbildung R+ −→ R, x 7→ x2 ist injektiv, aber nicht surjektiv.
(c) Die Abbildung R+ −→ R+ , x 7→ x2 ist bijektiv.
Um das obige Beispiel der/s Platzanweisers/in nochmals weiter zu entwickeln: Wenn der Platzanweiser nicht nur das Stockwerk zuordnet, sondern auch den konkreten Sitzplatz, so ist zu hoffen,
dass diese Abbildung injektiv ist, da sonst zwei Leute auf dem selben Platz sitzen müssen. Der
Kassenwart des Theaters hingegen hofft, dass die Abbildung von der Menge der Zuschauer auf die
Menge der Sitzplätze auch surjektiv ist, da dann das Theater voll besetzt ist.
Definition 4.14. Ist R eine Relation und R ⊂ M × M , dann definieren wir
R−1 := {(y, x) | xRy},
Man nennt R−1 die Umkehrung von R.
ÜBUNG 4.15.
4. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN
27
(a) Sei f eine funktionale Relation. Dann ist f −1 genau dann eine funktionale Relation, wenn f
injektiv ist.
(b) Ist f : X −→ Y eine Abbildung, so ist f −1 : Y −→ X genau dann eine Abbildung, wenn
f : X −→ Y bijektiv ist.
(c) Ist f : X −→ Y eine bijektive Abbildung, so gilt f −1 ◦ f = ∆X und f ◦ f −1 = ∆Y .
Man nennt dann f −1 : Y −→ X die Umkehrabbildung von f : X −→ Y .
Definition 4.16. Sei A eine auf M definierte Aussageform und sei f : M −→ N eine Abbildung.
Wir führen die folgenden Methoden ein, Mengen zu definieren:
{f (x) | x ∈ M } := {y ∈ N | ∃x ∈ M : f (x) = y} = B(f )
und
{f (x) | x ∈ M : A(x)} := {y ∈ N | ∃x ∈ M : (f (x) = y ∧ A(x))} = B(f |{x∈M |A(x)} )
Die obere Menge ist die Menge aller Elemente der Form f (x), wobei x ∈ M . Somit ist diese Menge
gleich dem Bild der Abbildung f : M −→ N . Die untere Menge ist die Menge aller Elemente
der Form f (x), wobei x ∈ M gilt und zusätzlich A(x) wahr ist. Somit ist diese Menge gleich
B(f |{x∈M |A(x)} ).
Beispiele 4.17.
(a) Für k ∈ N gilt: kZ = {km | m ∈ Z}.
(b) {n2 | n ∈ Z} ist die Menge der Quadratzahlen.
Ist f : X −→ Y eine Abbildung und M ⊂ X, so definieren wir
f# (M ) := {y ∈ Y | ∃x ∈ M : y = f (x)} = {f (x) | x ∈ M }.
Man nennt f# (M ) das Bild von M unter f . Wir erhalten eine Abbildung
P(X) −→
M
7→
P(Y )
f# (M )
Analog definiert man für N ⊂ Y :
f # (N ) := {x ∈ X | f (x) ∈ N }.
Man nennt f # (N ) das Urbild von N unter f . Wir erhalten eine Abbildung
P(Y ) −→
N
7→
P(X)
f # (N )
Die funktionalen Relationen f# bzw. f # werden in der Literatur (und auch in der Linearen Algebra I) oft mit f bzw. f −1 bezeichnet. Wir wählen die Bezeichnung wie oben, um Missverständnisse
zu vermeiden.
28
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
ÜBUNG 4.18. Sei f : X −→ Y eine Abbildung, A, B ⊂ X und M, N ⊂ Y . Zeigen Sie
(1) f# (A ∩ B) ⊂ f# (A) ∩ f# (B). Geben Sie ein Beispiel an, das zeigt, dass diese Teilmenge
manchmal eine echte Teilmenge ist.
(2) f# (A ∪ B) = f# (A) ∪ f# (B).
(3) A ⊂ B → f# (A) ⊂ f# (B).
(4) f # (M ∩ N ) = f # (M ) ∩ f # (N ).
(5) f # (M ∪ N ) = f # (M ) ∪ f # (N ).
(6) M ⊂ N → f # (M ) ⊂ f # (N ).
(7) A ⊂ f # (f# (A)). Geben Sie ein Beispiel an, das zeigt, dass diese Teilmenge manchmal
eine echte Teilmenge ist.
(8) f# (f # (M )) ⊂ M . Geben Sie ein Beispiel an, das zeigt, dass diese Teilmenge manchmal
eine echte Teilmenge ist.
Familien.
Definition 4.19. Seien I und M Mengen. Eine (I-indizierte) Familie von Elementen von M ist
dasselbe wie eine Abbildung von I nach M . Wenn man eine Abbildung f : I −→ M als Familie
interpretiert, so schreiben wir sie als (f (i))i∈I oder als (f (i) | i ∈ M ). Die Menge aller I-indizierten
Familien von Elementen von M ist also M I = Abb(I, M ). Eine Familie (f (i))i∈I heißt nicht-leer,
falls I nicht die leere Menge ist. Die Menge I heißt Indexmenge.
Beispiele 4.20. (a) Eine (reell-wertige) Folge ist definiert als N-indizierte Familie von reellen Zahlen. Eine solche Folge ist also ein Abbildung N −→ R, die wir als (ai )i∈N schreiben. Alternativ
darf man diese Folge auch in der Form (a1 , a2 , a3 , . . .) schreiben.
(b) Sei M eine Menge. Ein k-Tupel (a1 , a2 , . . . , ak ) ∈ M k definiert dann die Familie (aj )j∈{1,2,...,k} .
Wir erhalten eine bijektive Abbildung F : M k −→ M {1,...,k} , (a1 , a2 , . . . , ak ) 7→ (aj )j∈{1,2,...,k} .
Die Elemente von M k wurden ganz anders definiert“ als die Elemente von M {1,...,k} . Den”
noch haben die Elemente von M k und die von M {1,...,k} nahezu identische Eigenschaften: beide
sind durch eine geordnete Liste mit k Elementen von M beschreibbar. Damit uns die Formalien nun nicht erdrücken, ist es nun sinnvoll so zu tun, als wäre (a1 , a2 , . . . , ak ) dasselbe wie
(aj )j∈{1,2,...,k} . Man sagt dazu (a1 , a2 , . . . , ak ) wird mit (aj )j∈{1,2,...,k} identifiziert. Dadurch
identifizieren wir auch automatisch M k mit M {1,...,k} . Um zu unterstreichen, dass dieses Identifizieren von obigem F abhängt sagen wir: wir identifizieren M k mit M {1,...,k} vermöge F .
Wer das Wort vermöge“ nicht mag, kann auch mit Hilfe von“ sagen. 22
”
”
(c) Die Basis eines Vektorraums ist ein Familie von Vektoren, die linear unabhängig sind und den
Vektorraum erzeugen.
Bemerkung 4.21. Wenn Sie eine ähnliche Aussage oder Definition wie das obige (b) in der Schule gesehen haben, so stand dort wahrscheinlich nicht eine Familie von Vektoren“, sondern eine
”
22Es stellt sich hier unweigerlich die Frage, wieso wir nicht gleich Elemente in M × M als Abbildungen von
{1, 2} −→ M definiert haben. Dies geht aber leider nicht, da wir zur Einführung von Abbildungen bereits wissen
mussten, was ein Paar und was ein kartesisches Produkt ist.
4. RELATIONEN, FUNKTIONALE RELATIONEN, ABBILDUNGEN
29
Menge von Vektoren“. Dies ist aber aus mehreren Gründen problematisch, z.B. erhalten wir mit
”
dieser Mengendefinition, dass
1
0
1
B :=
,
,
0
1
0
eine Basis von R2 ist. Man beachte, dass B genau zwei Elemente enthält, da zwischen obigen
Klammern zweimal derselbe Vektor steht.
Die Aussage
Seien v1 und v2 Vektoren in R2 . Dann ist {v1 , v2 } eine Basis von R2 genau dann wenn {v1 , v2 }
”
linear unabhängig sind.“
ist falsch, denn im Fall v = w 6= 0 ist {v1 , v2 } = {v1 } und somit linear unabhängig. Aber {v1 } ist
keine Basis von R2 . Korrekt ist hingegen die Aussage:
Seien v1 und v2 Vektoren in R2 . Dann ist (vi )i∈{1,2} eine Basis von R2 genau dann wenn
”
(vi )i∈{1,2} linear unabhängig ist.“
Anschaulich gilt: Familien registrieren Mehrfachnennungen. Über {1, 2 . . . , k} oder über N indizierte Mengen registrieren auch die Ordnung der Elemente.
Definition 4.22. Ist (Mi )i∈I eine Familie von Mengen, (d.h. jedes Mi ist eine Menge), so definieren
wir
[
[
(Mi | i ∈ I) := {Mi | i ∈ I} = {x | ∃i ∈ I : x ∈ Mi }
und falls (Mi )i∈I nicht-leer ist
\
\
(Mi | i ∈ I) := {Mi | i ∈ I} = {x | ∀i ∈ I : x ∈ Mi }.
S
S
T
T
Wir schreiben auch i∈I Mi für (Mi | i ∈ I) und i∈I Mi für (Mi | i ∈ I).
Kartesische Produkte von Mengenfamilien.
Wir haben bereits M k mit M {1,...,k} identifiziert. Die Elemente von M N sind also eine Art un”
endliches kartesisches Produkt“. Solche Produkte sind seit Ende des 19. Jahrhunderts in vielen
Bereichen der Mathematik ganz wichtig. Dieser Begriff soll deswegen präzisiert werden. Wir wollen
auch gleich Produkte in der Form M1 × M2 × . . . zulassen, d.h. die Mi (genannt Faktoren) dürfen
verschieden sein.
Definition 4.23 (Kartesische Produkte von Mengenfamilien). Gegeben sei eine Familie (Mi )i∈I
von Mengen, d.h.
S gegeben sei eine Indexmenge I und für jedes i ∈ I eine Menge Mi . Wir definieren
zunächst M := i∈I Mi . Das kartesische Produkt der Familie (Mi )i∈I ist definiert als
Y
Mi := (mi )i∈I ∈ M I | ∀i ∈ I : mi ∈ Mi
i∈I
6.11.
30
Beispiele 4.24.
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
Q
i∈I
M = MI
Analog zu Beispiele 4.20 (b) kann man
Q
i∈{1,...,k}
Mi mit M1 × · · · × Mk identifizieren.
Ein Mi in der obigen Definition nennt man den i-ten Faktor oder die i-te Komponente. Für ein
fixiertes i0 ∈ I nennt man die Abbildung
Y
Mi −→ Mi0
i∈I
(mi )i∈I
7→
mi0
die i0 -te kanonische Projektion.
5. Das Russellsche Paradoxon
(Auch Russellsche Antinomie genannt. Vorläufer sind die Cantorsche Antinomie und das BuraliForti-Paradoxon, siehe Wikipedia.)
Am Anfang der Vorlesung haben wir gesagt, dass unser Ziel ist, eine axiomatisch aufgebaute
Mathematik zu erhalten. Diesem Anspruch sind wir bisher nicht gerecht geworden. Immer wieder
wurde die Intuition genutzt, um Objekte zu definieren, anstatt wirklich saubere mathematische
Definitionen hinzuschreiben. Das Vorgehen war bis weit ins 19. Jahrhundert ganz ähnlich. Das
intuitive Verwenden des Mengenbegriffs führte dann aber zu dem Russellschen Paradoxon.
Frage 5.1. Gibt es die Menge aller Mengen?
Stand der Mathematik gegen Ende des 19. Jahrhunderts: Nach Cantors Beschreibung (Beschreibung 3.1) sollte es die Menge M aller Mengen geben. Das Elementzeichen ∈ ist dann eine auf
E × M definierte
Aussageform, wobei E die Menge aller Elemente irgendeiner Menge bezeichne,
S
also E = M.
E ×M
−→
{w, f }
(x, M )
7→
x∈M
Russell bildete nun daraus
N := {x ∈ M | x 6∈ x}.
Gilt nun N ∈ N ? Für alle Mengen x gilt
x∈N
⇐⇒
x 6∈ x
und wenn wir x := N setzen, so erhalten wir
N ∈N
⇐⇒
N 6∈ N .
Aussagen in der Form A ↔ ¬A sind aber immer falsch, also haben wir einen Widerspruch erhalten.
6. AXIOMATISCHE MENGENLEHRE
31
Um die Mengenlehre und somit die Mathematik sauber auf Axiomen aufzubauen, müssen wir also
viel genauer als bisher vorgehen und intuitive Argumente durch formal korrekte Beweise ersetzen.
Wie löst man dieses Paradoxon auf: Nicht jede Zusammenfassung von bestimmten wohlunterschie”
denen Objekten“ ist eine Menge. Die Axiome sollen regeln, wann solche eine Zusammenfassung eine
Menge ist. Insbesondere ist die Zusammenfassung“ M aller Mengen selbst keine Menge, sondern
”
etwas größeres, das wir Klasse nennen wollen. Analog sind auch N und E keine Mengen, sondern
Klassen.
6. Axiomatische Mengenlehre
Wir wollen nun skizzieren, wie man die Mengenlehre sauber auf Axiomen aufbauen kann. Man
nimmt hierzu mehrere Axiomen an, all diese Axiome zusammen nennt man dann ein AxiomenSystem. Historisch sind hier wichtige Fortschritte zu Ende zu 19. Jahrhunderts und zu Beginn
des 20. Jahrhunderts gemacht worden. Nun haben verschiedene Mathematiker verschiedene Axiomensysteme entwickelt und benutzt. Das wohl bekannteste Axiomensystem heißt ZFC nach den
Mathematikern Zermelo und Fraenkel und C für Axiom of Choice“ (= Auswahlaxiom). Wir stel”
len ein anderes vor (NBG), das sehr ähnliche Eigenschaften hat. Man kann zeigen, dass man mit
ZFC und NBG dieselben Sätze über Mengen herleiten kann. Die Axiome von ZFC machen oft
rein mengentheoretische Argumente einfacher, während die Axiome von NBG für das praktische
Arbeiten oft besser geeignet sind.
Grundlegende Ideen:
• Man will gar nicht mehr erklären, was eine Menge ist, sondern fordert axiomatische
Eigenschaften für Mengen.
• Man nimmt an, dass auch alle Elemente von Mengen ebenfalls Mengen sind. In anderen
Worten: jede Menge ist ein Mengensystem über einer geeigneten Menge. In der Notation
des letzten Abschnitts gilt also nun M = E. Die Zusammenfassung aller Regensburger
Autos ist dann keine Menge. Der Satz Es existiert kein Auto“ ist also in einer streng
”
axiomatisch aufgebauten Vorlesung über Logik und Mengenlehre eine wahre Aussage,
denn ein Auto ist ja keine Menge von Mengen.
• Trotz dieser Einschränkungen kann man immer noch natürliche, ganze, rationale und
reelle Zahlen und vieles mehr als Mengen definieren. Die Zahl π ist also eine Menge,
deren Elemente wieder Mengen sind, deren Elemente wieder Mengen sind, . . . . Siehe
dazu auch die Peano-Axiome in Abschnitt 1.1 in Kapitel Zahlen“.
”
Die Axiome übernehme ich aus [15], siehe auch [21]. Zum Vergleich zu ZFC verweise ich auf [11].
AXIOME 6.1 (Axiome der Mengenlehre nach von Neumann, Bernays, Gödel (NBG)).
• Es gibt zwei Sorten von Objekten, Mengen und Klassen. Außerdem gibt es noch die Beziehung ∈, die besagt, wann eine Klasse das Element einer anderen Klasse ist.
• Jede Menge ist eine Klasse.
32
1. ELEMENTARE LOGIK UND GRUNDLAGEN DER MATHEMATIK
• Alle Elemente von Klassen sind Mengen.
• Extensionalität. Zwei Klassen sind genau dann gleich, wenn sie dieselben Elemente enthalten.
• Komprehension. Ist C eine auf allen Mengen definierte Aussagenform, die nach strikt
festgelegten Regeln aufgebaut ist, die wir hier der Kürze halber nicht genauer diskutieren.23
Dann ist
x ist eine Menge C(x)
eine Klasse.
• Die leere Klasse ∅ := {x ist eine Menge | x 6= x} ist eine Menge.
• Aussonderungsmengenaxiom. Jede Teilklasse einer Menge ist eine Menge.
Benutzt wurde hierbei die folgende Definition: Eine Klasse A ist eine Teilklasse einer
Klasse B, wenn jedes Element von A ein Element von B ist.
• Paarmengenaxiom. Sind A und B Mengen, so ist auch {A, B} eine Menge.
• Vereinigungsaxiom. Ist A eine Menge, so ist auch
[
A := x ∃y ∈ A : x ∈ y
eine Menge, die Vereinigungsmenge von A.
• Potenzmengenaxiom. Ist A eine Menge, so ist auch P(A) := {x | x ⊂ A} eine Menge,
die Potenzmenge von A.
• Fundierungsaxiom. Ist A 6= ∅, so gibt es ein x ∈ A mit x ∩ A = ∅.
• Ersetzungsaxiom.Sind X und Y Klassen und ist F eine funktionale Relationsklasse“ 24
”
mit D(F ) = X und B(F ) ⊂ Y . Ist die Teilklasse A ⊂ X eine Menge, so ist auch B(F |A )
eine Menge.
• Unendlichkeitsaxiom. Es gibt eine induktive Menge; eine Menge A heißt induktiv, wenn
∅ ∈ A und wenn für alle x ∈ A auch x ∪ {x} ∈ A ist.
• Auswahlaxiom. SeiQI eine nicht-leere Menge und (Mi )i∈I eine Familie von nicht-leeren
Mengen. Dann ist i∈I Mi nicht die leere Menge.
Bemerkungen 6.2.
(a) Q
Besonders interessant ist das Auswahlaxiom. Es folgt bereits aus
Q den Axiomen zuvor, dass
endlich
ist,
so
gilt
offensichtlich
i∈I Mi eine Menge ist. Falls I
i∈I Mi 6= ∅. Für unendliche
Q
Indexmengen kann man aber i∈I Mi 6= ∅ im allgemeinenQnicht aus den anderen Axiomen
herleiten. Wenn man es annimmt, weiß“ man zwar, dass i∈I M
Qi mindestens ein Element
”
besitzt, es kann aber vorkommen, dass kein einziges Element von i∈I Mi angegeben werden
kann.
Es ist nun ganz lehrreich, zu untersuchen, welche Aussagen der Mathematik nur unter Hinzunahme des Auswahlaxioms gezeigt werden können, und für welche Aussagen, das Auswahlaxiom nötig ist. Angenommen wir hätten nur die Axiome bis zum Unendlichkeitsaxiom. Dann
23Siehe hierzu [15] und [11]. Gemeint ist eine Aussagenform 1. Stufe, in der nicht über Klassenvariable quantifiziert wird.
24Unter einer Relationsklasse verstehen wir eine Klasse, deren Elemente Paare sind. Man kann dann die üblichen
Begriffe einer Relation definieren, z.B. funktional“, Definitionsbereich, Bild, etc.
”
LITERATUR FÜR DAS BISHERIGE KAPITEL
33
kann man zeigen, dass das Auswahlaxiom äquivalent zur Aussage Jeder Vektorraum besitzt
”
eine Basis“ ist.
Wenn wir das Auswahlaxiom annehmen, dann gibt es einen Vektorraum, der zwar eine Basis
besitzt, aber zugleich kann keine Basis angegeben werden.
Das Auswahlaxiom ist auch äquivalent zur Aussage: Sind X und Y Mengen, dann gibt es eine
”
injektive Abbildung f : X −→ Y oder es gibt eine injektive Abbildung f : Y −→ X“.
(b) Man kann aus den Axiomen der Mengenlehre nicht folgern, dass die Mengenlehre widerspruchsfrei ist! (Zweiter Gödelscher Unvollständigkeitssatz). Die Mathematik beruht auf der Annahme,
dass die Axiome der Mengenlehre widerspruchsfrei sind.
(c) Es gibt Aussagen, von denen gezeigt werden kann, dass weder diese Aussage noch die Negation
dieser Aussage beweisbar ist. Die Cantorsche Kontinuumshypothese ist solch eine Aussage:
Sei M eine Menge, so dass es keine injektive Abbildung M −→ N gibt.
”
Dann gibt es eine injektive Abbildung R −→ M .“
Solche Aussagen gibt es in jedem hinreichend großen logischen System (Erster Gödelscher
Unvollständigkeitssatz).
Aus den obigen Axiomen kann man nun Schritt für Schritt die ganze Mathematik heraus herleiten.
Literatur für das bisherige Kapitel
Das Buch [10] ist eine recht ausführliche und leicht lesbare Einführung in die mengentheoretischen
Grundlagen der Mathematik. Das Buch [15] ist deutlich kürzer und beschränkt sich mehr auf das
wesentliche, aber für manche Anfänger vielleicht etwas zu dicht geschrieben. Es fokussiert sich
auch mehr auf besonders interssante Aspekte. Die wichtigsten Begriffe in Kürze finden sich auch
im recht gut ausgearbeiteten Skript der Analysis-Vorlesung von D. Grieser [16]. Weitere Literatur
ist das Buch von Halmos in einer deutschen und englischen Fassung [17]. Einen deutlich tiefer
gehenden Einstieg in die Mengenlehre findet man in [11].
KAPITEL 2
Zahlen
1. Die natürlichen Zahlen
1.1. Die Peano-Axiome. Die natürlichen Zahlen wurden von Dedekind (1888) und Peano
(1889) axiomatisiert. Siehe [15, Kapitel 3 und 4], [17], oder [11, Kapitel V] für mehr Details.
AXIOME 1.1 ( Axiome“ der natürlichen Zahlen (Peano-Axiome)). Gegeben sei
”
• eine Menge N ,
• ein (ausgewähltes) Element in N , das wir 1 nennen,
• eine Abbildung s : N −→ N , x 7→ s(x), genannt die Nachfolger-Abbildung.
Wir sagen, dass (N, 1, s) die Peano-Axiome erfüllt, falls gilt:
(P1) 1 6∈ B(s)
(P2) Die Abbildung s : N −→ N ist injektiv.
(P3) (Induktionsaxiom) Erfüllt T ⊂ N die Bedingungen 1 ∈ T und s# (T ) ⊂ T , dann gilt bereits
T = N.
Wenn (N, 1, s) die Peano-Axiome erfüllt, sagt man (N, 1, s) ist ein Modell der natürlichen Zahlen.
PROPOSITION 1.2. Es gibt eine Menge N ein Element 1 ∈ N und eine Nachfolger-Abbildung
s : N −→ N , so dass (N, 1, s) die Peano-Axiome erfüllt.
Beweis folgt unten.
e, e
b, b
PROPOSITION 1.3. Wenn (N
1, se) und (N
1, sb) die Peano-Axiome erfüllen, dann gibt es eine
e
b
bijektive Abbildung F : N −→ N , so dass F (e
1) = b
1 und F ◦ se = sb ◦ F .
e, e
b, b
Man sagt dann oft: (N
1, se) und (N
1, sb) sind kanonisch isomorph.
Beweis später.
Die letzte Gleichung schreibt man am besten als Diagramm, ein sogenanntes kommutatives Diagramm
35
36
2. ZAHLEN
e
N
F
se
e
N
b
N
sb
F
b
N
Alles, was man üblicherweise mit natürlichen Zahlen macht (Addition, Multiplikation, Teilbarkeit,
Primzahlen, etc.) beruht letztendlich auf dem Tripel (N, 1, s) und den Peano-Axiomen. Deswegen
besagt Prop. 1.3, dass alle Eigenschaften von (N, 1, s) die man aus den Peano-Axiomen herleiten
kann, entweder in allen Modellen gelten oder in keinem. Beispiele: In jedem Modell gibt es unendlich
e, e
viele Primzahlen, n ist eine Zahl mit 4 Teilern in (N
1, se) genau dann wenn F (n) eine Zahl mit 4
b
b
Teilern in (N , 1, sb) ist. Es kann uns also egal sein, welches Modell die natürlichen Zahlen beschreibt,
wichtig sind allein die Peano-Axiome.
Bemerkung 1.4. Sind die Peano-Axiome weitere Axiome? Oder eine Definition? Oder Aussagen?
Es gibt hier zwei verschiedene Sichtweisen. Je nach Anwendung und Dozent wird die eine oder
andere bevorzugt.
(a) Die mengentheoretische Sichtweise: Die Peano-Axiome sind eine Definition.
Proposition 1.2 besagt: Es gibt mindestens ein Tripel (N, 1, s), das die Peano-Axiome erfüllt.
e, e
b, b
e, e
b, b
Und: Erfüllen (N
1, se) und (N
1, sb) die Peano-Axiome, so sind (N
1, se) und (N
1, sb) im
”
wesentlichen gleich“ (Proposition 1.3).
(b) Die axiomatische Sichtweise: wir wollen im mathematischen Teilgebiet Theorie der natürlichen
”
Zahlen“ annehmen, dass es eine Menge N , ein 1 ∈ N und eine Nachfolger-Abbildung gibt und
nehmen die Peano-Axiome als Axiome dieses Teilgebiets. Proposition 1.2 besagt dann,
dass es ein mengentheoretisches Modell gibt, das die Axiome erfüllt. Wie dieses Modell aber
aussieht, ist für unsere weiteren Überlegungen irrelevant, da wir nur die Axiome für weitere
Schritte nutzen.
Beweis von Proposition 1.2. Wiederholung: eine Menge A heißt induktiv , wenn ∅ ∈ A und wenn
für alle x ∈ A auch x ∪ {x} ∈ A ist.
Nach dem Unendlichkeitsaxiom gibt es eine induktive Menge A. Wir setzen 1 := ∅. Wir definieren
nun die Nachfolger-Abbildung
se : A −→ A, x 7→ x ∪ {x}.
Das Tripel (A, 1, se) erfüllt offensichtlich (P1).
Für (P2) muss etwas gearbeitet werden, wir beweisen die Injektivität von se : A −→ A mit einem
Widerspruchsbeweis.
Angenommen die Abbildung sei nicht injektiv. Dies bedeutet:
(1.5)
∃x, y ∈ A : x 6= y ∧ se(x) = se(y)
1. DIE NATÜRLICHEN ZAHLEN
37
Es folgt x ∪ {x} = y ∪ {y} und hieraus folgen wiederum die Aussagen
x ∈ y ∨ x ∈ {y}
(1.6)
und
y ∈ x ∨ y ∈ {x}.
(1.7)
Nun ist aber x ∈ {y} gleichbedeutend mit x = y und dies haben wir oben ausgeschlossen. Somit
erhalten wir aus (1.6) dann x ∈ y, und analog erhalten wir y ∈ x aus (1.7).
Wir definieren nun B := {x, y}. Wegen B 6= ∅ ergibt das Fundierungsaxiom die Existenz eines
b ∈ B mit b ∩ B = ∅. Im Fall b = x erhalten wir x ∩ {x, y} ⊃ {y} also b ∩ B 6= ∅. Im Fall
b = y zeigen wir b ∩ B 6= ∅ analog. Wir haben einen Widerspruch erhalten, da wir gleichzeitig
b ∩ B 6= ∅ und b ∩ B = ∅ erhalten haben. Also war eine Annahme (1.5) falsch. Wir haben mit einem
Widerspruchsbeweis die Injektivität von se gezeigt.
Es verbleibt aber unklar, ob (A, 1, se) auch (P3) erfüllt.
Wir setzen nun
N :=
\
{B ∈ P(A) | B ist induktiv}.
Der Schnitt dieser induktiven Mengen ist wieder induktiv. Das Tripel (N, 1, se|N ) erfüllt offensichtlich (P1) und (P2). Erfüllt T die Voraussetzungen in (P3), so ist T induktiv und es gilt
T ∈ P(N ) ⊂ P(A). Also folgt N ⊂ T , somit T = N . Wir erhalten (P3).
2
Beispiel 1.8. Die Konstruktion liefert dann 1 = ∅, 2 = s(1) = {∅}, 3 = s(2) = {∅, {∅}}, 4 =
s(3) = {∅, {∅}, {∅, {∅}}}.
1.2. Vollständige Induktion und rekursive Definition. In diesem Abschnitt nehmen wir
an, dass (N, 1, s) die Peano-Axiome erfüllt. Die Notation n + 1 ist im Sinne von s(n) zu lesen. Die
Addition + ist noch nicht definiert! Wir schreiben 2 für 1 + 1, 3 für 2 + 1 etc.. Weiter gebe es ein
0 6∈ N , und wir setzen N0 := N ∪ {0}. 0 + 1 := 1.
SATZ 1.9 (Vollständige Induktion). Sei A( · ) eine auf N definierte Aussageform. Wir setzen
voraus, dass Induktionsanfang und Induktionsschritt erfüllt sind:
Induktionsanfang: A(1) ist wahr.
Induktionsschritt: Für alle n ∈ N gilt: (A(n) =⇒ A(n + 1))).
Dann gilt für alle n ∈ N die Aussage A(n).
Im Induktionsschritt nennt man A(n) die Induktionsvoraussetzung.
Beweis. Sei
T := {n ∈ N | A(n)}.
Auf Grund des Induktionsanfangs ist 1 in T . Der Induktionsschritt besagt: wenn n ∈ T , dann ist
auch n + 1 in T . Die Menge T erfüllt also die Eigenschaften in Peano-Axiom (P3) und somit gilt
T = N.
2
38
2. ZAHLEN
Viele Variation hiervon, z.B.
SATZ 1.10 (Vollständige Induktion, Starke Version). Sei A(n) eine auf N definierte Aussage. Wir
setzen voraus, dass Induktionssanfang und der modifizierte Induktionsschritt erfüllt sind:
Induktionsanfang: A(1) ist wahr.
Modifizierter Induktionsschritt: Für alle n ∈ N gilt: Aus A(1) ∧ A(2) ∧ . . . ∧ A(n) folgt A(n + 1)).
Dann gilt für alle n ∈ N die Aussage A(n).
Beweis. Angenommen es gelte der Induktionsanfang und der modifizierte Induktionsschritt für
A(n). Für beliebiges n ∈ N definieren wir B(n) :⇐⇒ A(1) ∧ A(2) ∧ . . . ∧ A(n). Wir zeigen ∀n ∈ N :
B(n) durch Induktion nach n. Wegen A(1) ⇐⇒ B(1) ist der Induktionsanfang für B( · ) erfüllt.
Der modifizierte Induktionsschritt für A( · ) ergibt den Induktionsschritt für B( · ). Somit folgt
∀n ∈ N : B(n) durch Induktion, also auch ∀n ∈ N : A(n).
2
SATZ 1.11 (Dedekindscher Rekursionssatz). Sei M eine Menge, m ∈ M und g : M −→ M eine
Abbildung. Dann gibt es genau eine Abbildung f : N −→ M so dass f (1) = m und
∀n ∈ N : f (n + 1) = g(f (n)).
Wenn eine Abbildung auf diese Art und Weise definiert wird, nennen wir dies eine rekursive Definition.
Beweis. Wir beweisen zunächst durch vollständige Induktion die folgende Aussage A(n), n ∈ N:
Es gibt eine eindeutige1 Abbildung fn : {1, 2, . . . , n} −→ M mit den Eigenschaften2
fn (1) = m und ∀i ∈ {1, 2, . . . , n − 1} : fn (i + 1) = g(fn (i)).
Induktionsanfang: n = 1. Die Abbildung f1 : {1} −→ M , 1 7→ m ist solch eine Abbildung. Und
es ist offensichtlich die einzige.
Induktionsschritt:
Induktionsvoraussetzung: A(n)
Also wir haben eine Abbildung fn wie oben.
Wir definieren dann
(
fn (i)
falls i ∈ {1, 2, . . . , n},
fn+1 (i) :=
g(fn (n)) falls i = n + 1.
1 eindeutig“ bedeutet: es gibt so eine Funktion, und dies ist die einzige Funktion, die das erfüllt!
2”
Man muss sich an dieser Stelle eigentlich Gedanken machen, was hier mit {1, 2 . . . , n} gemeint ist. Es ist die
Menge Kn mit den Eigenschaften
(1) 1 ∈ Kn ,
(2) s# (Kn r {n}) ⊂ Kn ,
(3) Ist T eine Menge mit 1 ∈ T und s# (T r {n}) ⊂ T , dann gilt Kn ⊂ T .
Dann ist zu zeigen dass s(n) 6∈ Kn und Kn+1 = Kn ∪ {s(n)}. Man sieht also, dass Kn genau das ist, was wir uns
unter {1, 2, . . . , n} vorstellen.
1. DIE NATÜRLICHEN ZAHLEN
39
Diese Abbildung erfüllt die in A(n + 1) genannte Eigenschaft und man sieht leicht, dass es die
einzige ist.
Wir setzen nun: f (n) := fn (n). Die so definierte Abbildung f : N −→ M erfüllt die Eigenschaften
des Satzes.
2
Bemerkung 1.12. Analoges gilt, wenn wir N0 statt N und 0 statt 1 hernehmen:
Sei M eine Menge, m ∈ M und g : M −→ M eine Abbildung. Dann gibt es genau eine Abbildung
f : N0 −→ M so dass f (0) = m und
∀n ∈ N0 : f (n + 1) = g(f (n)).
Beispiele 1.13.
(1) Addition: Sei M = N0 , g := s, m ∈ N0 . Also g : N0 −→ N0 . Wir erhalten eine Abbildung
am : N0 −→ N0 mit am (0) = m und mit ∀n ∈ N0 : am (n + 1) = s(am (n)). Wir schreiben
m + n := am (n). Für n = 1 stimmt dies mit der bisherigen Definition von m + 1 überein.
(2) Multiplikation: Sei M = N0 , i ∈ N0 , g : N0 −→ N0 , n 7→ n + i. Wir erhalten eine
Abbildung mi : N0 −→ N0 mit mi (1) = i und mit ∀n ∈ N0 : mi (n + 1) = mi (n) + i. Wir
schreiben i · n := mi (n).
(3) Potenzieren: Sei M = N0 , i ∈ N0 , g : N0 −→ N0 , n 7→ n · i. Wir erhalten eine Abbildung
pi : N −→ N0 mit pi (1) = i und mit ∀n ∈ N : pi (n + 1) = pi (n) · i. Wir schreiben
in := pi (n). Außerdem setzen wir für i ∈ N : i0 := 1. (00 ist noch nicht definiert!)
(4) Fakultät: Wir definieren die Abbildung ! : N0 −→ N0 durch 0! := 1 und (n + 1)! :=
n! · (n + 1). Also n! = 1 · 2 · · · · · n. (Genau genommen benötigt man hier eine etwas
modifizierte Version des Rekursionssatzes.3)
SATZ 1.14. (N, +, ·) erfüllt die folgenden Eigenschaften:
(Aa) Addition ist assoziativ.
Für alle x, y, z ∈ N0 gilt
(x + y) + z = x + (y + z).
(An) Addition hat neutrales Element.
Es gibt ein Element 0 ∈ N0 , so dass für alle x ∈ N0 gilt
x + 0 = 0 + x = x.
Man nennt 0 das neutrale Element der Addition.
(Ak) Addition ist kommutativ.
Für alle x, y ∈ N0 gilt
x + y = y + x.
3Modifizierte Version des Rekursionssatzes: Sei M eine Menge, m ∈ M und g : N × M −→ M eine Abbildung.
Dann gibt es genau eine Abbildung f : N −→ M so dass f (1) = m und
∀n ∈ N : f (n + 1) = g(n, f (n)).
40
2. ZAHLEN
(Ma) Multiplikation ist assoziativ.
Für alle x, y, z ∈ N0 gilt
(x · y) · z = x · (y · z).
(Mn) Multiplikation hat neutrales Element.
Es gibt ein Element 1 ∈ N0 , so dass für alle x ∈ N0 gilt
x · 1 = 1 · x = x.
Man nennt 1 das neutrale Element der Multiplikation.
(Mk) Multiplikation ist kommutativ.
Für alle x, y ∈ N0 gilt
x · y = y · x.
(AMd) Addition und Multiplikation erfüllen das Distributivgesetz.
Für alle x, y, z ∈ N0 gilt
x · (y + z) = x · y + x · z
(y + z) · x = y · x + z · x
Den Beweis kann man mit vollständiger Induktion durchführen, die wir im nächsten Abschnitt
kennenlernen werden. Es ist eine gute Übung, einmal die Kommutativität der Addition durch
vollständige Induktion oder direkt aus den Peano-Axiomen herzuleiten. Dies ist etwas mühsam,
aber prinzipiell möglich.
Summen- und Produktzeichen
Oft ist es sinnvoll über Ausdrücke der Form
a1 + . . . + an
zu reden. Um dies exakt zu machen, führen wir ein Symbol ein. Man definiert rekursiv
1
X
aj := a1
j=1
und
n+1
X


n
X
aj := 
aj  + an+1 .
j=1
j=1
Analog hierzu
1
Y
aj := a1
j=1
und
n+1
Y
j=1

aj := 
n
Y
j=1

aj  · an+1 .
1. DIE NATÜRLICHEN ZAHLEN
41
Beweis von Prop. 1.3. Wir definieren rekursiv F (e
1) = b
1 und für n ∈ N : F (e
s(n)) = sb(F (n)). Dies
e
b
b −→ N
e durch G(b
ergibt eine Abbildung F : N −→ N . Analog definiert man eine G : N
1) = e
1
und G(b
s(n)) = se(G(n)). Man zeigt nun durch Induktion G ◦ F = ∆Ne und F ◦ G = ∆Nb , d.h.
b −→ N
e ist die Umkehrfunktion von F : N
e −→ N
b und somit ist F : N
e −→ N
b bijektiv. Die
G:N
übrigen Eigenschaften dieser Abbildung folgen direkt aus der Definition von F .
2
13.11.
Notation 1.15. Im folgenden bezeichnet N eine Menge, 1 ∈ N ein ausgewähltes Element, und
s : N −→ N eine injektive Abbildung, so dass (N, 1, s) die Peano-Axiome erfüllt. Wir nennen N die
Menge der natürlichen Zahlen. Wir fixieren 0 6∈ N und versehen dann N0 = N ∪ {0} mit der oben
definierten Addition und Multiplikation.
LEMMA 1.16 (Kürzungsregel). Seien n, m, k ∈ N0 mit n + k = m + k. Dann gilt auch m = n.
In anderen Worten
∀n, m, k ∈ N0 : n + k = m + k =⇒ m = n.
Der Beweis folgt durch Induktion nach k.
LEMMA 1.17. Jede von 1 verschiedene natürliche Zahl ist Nachfolger einer natürlichen Zahl.
Beweis. Angenommen k ∈ N, k 6= 1 und k 6∈ s# (N). Definiere T := N r {k}. Dann gilt 1 ∈ T und
s# (T ) ⊂ T und somit erhalten wir den Widerspruch T = N.
2
Analog ist jede natürliche Zahl Nachfolger von einer natürlichen Zahl oder von Null.
LEMMA 1.18. Sind n, m ∈ N0 . Es gelte n + m = 0. Dann gilt n = m = 0.
Beweis. (Widerspruchsbeweis) Wir nehmen an, dass n 6= 0 oder m 6= 0. Da der Fall m 6= 0 ganz
analog zum Fall n 6= 0, genügt es den Fall n 6= 0 zu betrachten. 4 Dann gibt es eine Zahl k ∈ N0 mit
n = s(k). Es folgt 0 = s(k) + m = s(k + m), was der Tatsache widerspricht, dass 0 kein Nachfolger
einer natürlichen Zahl ist.
2
1.3. Ordnung der natürlichen Zahlen.
Wir definieren nun eine Relation:
≤:= {(n, m) ∈ N0 × N0 | ∃k ∈ N0 : m = n + k}.
LEMMA 1.19. Diese Relation ≤ ist eine totale Ordnung auf N0 . Es gilt:
(1) Reflexivität auf N0 : Für alle m in N0 ist m ≤ m wahr.
4Da Sätze in dieser Art oft vorkommen, sagt man Ohne Beschränkung der Allgemeinheit (OBdA) gilt n 6= 0.“
”
42
2. ZAHLEN
(2) Antisymmetrie: Für alle n und m in N0 gilt
n ≤ m ∧ m ≤ n =⇒ n = m.
(3) Transitivität: Für alle n, m und k in N0 gilt:
n ≤ m ∧ m ≤ k =⇒ n ≤ k.
(4) Totalität: Für alle n und m in N0 gilt
n≤m∨m≤n
(5) Für alle n ∈ N0 gilt n ≤ n + 1.
Beweis. Aussagen (1), (3) und (5) sind offensichtlich.
Zu (2) (Antisymmetrie): Es gelte n ≤ m und m ≤ n. Dann gibt es k1 , k2 ∈ N0 mit m = n + k1 und
n = m + k2 . Daraus folgt
n = m + k2 = n + k1 + k2 .
Mit der Kürzungsregel folgt k1 + k2 = 0 und mit Lemma 1.18 ergibt sich k1 = k2 = 0. Also n = m.
Zu (4) (Totalität): Die Aussage ist offensichtlich, falls n = 0 oder falls m = 0. Zu n ∈ N definieren
wir
Tn := {m ∈ N | m ≤ n ∨ n ≤ m}.
Man zeigt mit etws Aufwand 1 ∈ Tn und s# (Tn ) ⊂ Tn . Mit (P3) folgt Tn = N, also die Behauptung.
2
Definition 1.20. Sei R eine (partielle) Ordnungsrelation auf M . Ein Minimum (beziehungsweise
Maximum) ist ein Element m ∈ M , so dass für alle n ∈ M gilt: mRn (bzw. nRm).
Bemerkung. Wegen der Antisymmetrie gibt es höchstens ein Minimum.
Beispiele: Das offene Intervall ]0, 1[ in R hat kein Minimum bezüglich ≤.
Die Menge M := {{a}, {b}, {a, b}} trägt die Ordnungsrelation ⊂. Es existiert kein Minimum in M .
PROPOSITION 1.21. Sei A eine nichtleere Teilmenge von N, dann besitzt A ein Minimum.
Beweis. Wir nehmen an, A besäße kein Minimum. Definiere
T
:= {n ∈ N | ∀k ∈ A : k > n}
=
{n ∈ N | ∀k ∈ N : (k ≤ n =⇒ k 6∈ A)}
=
{n ∈ N | ¬(∃k ∈ N : (k ≤ n ∧ k ∈ A))}.
Offensichtlich gilt 1 ∈ T , da sonst 1 ∈ A und dann wäre 1 ein Minimum.
Wir zeigen nun
(1.22)
(n ∈ T ) =⇒ (n + 1 ∈ T ).
2. DIE GANZEN ZAHLEN
43
Daraus folgt dann mit (P3) die Aussage T = N, also A = ∅.
Um (1.22) zu zeigen, nehmen wir an, es gebe ein n ∈ T mit n + 1 6∈ T . Daraus folgt dann n + 1 ∈ A,
und aus n ∈ T folgt mit der Totalität dann, dass n + 1 ein Minimum ist. Dies ist ein Widerspruch
zur obigen Annahme.
2
5
Bemerkung 1.23. Sei R eine totale Ordnung auf einer Menge M . Wir sagen, R ist eine Wohlordnung oder (M, R) ist eine wohlgeordnete Menge, wenn jede nicht-leere Teilmenge A ein Minimum
besitzt. Die letzte Proposition besagt also, dass (N, ≤) wohlgeordnet ist. Hingegen ist (R, ≤) nicht
wohlgeordnet. Man kann aber zeigen:
Zu jeder Menge M gibt es eine Wohlordnung auf M .
Diese Aussage ist zum Auswahlaxiom äquivalent, wenn wir die übrigen Axiome der Mengenlehre
annehmen.
2. Die ganzen Zahlen
Der nächste Schritt ist nun, die Menge der uns bekannten Zahlen Schritt für Schritt zu erweitern:
N0 ⊂ Z ⊂ Q ⊂ R ⊂ C
Jede dieser Strukturen kann man durch Eigenschaften charakterisieren.
Bei einem formal ausgearbeiteten Zugang wären für jede Struktur zwei Probleme zu lösen:
• Gibt es eine mengentheoretische Konstruktion, die diese Eigenschaften erfüllt? Gibt es
ein Modell?
Im Falle von N wurde dies von Proposition 1.2 beantwortet.
• Ist die Struktur dadurch im wesentlichen festgelegt?
Im Falle von N wurde dies von Proposition 1.3 beantwortet.
Man kann durch Verwendung von Äquivalenzrelationen und den natürlichen Zahlen ein Modell
für die ganzen Zahlen Z konstruieren. Mit einer ähnlichen Konstruktion kann man aus den ganzen
Zahlen die rationalen Zahlen Q konstruieren. Die Konstruktion von Q aus Z wurde in der Linearen
5Alternativer Beweis: Wir nehmen an, A besitze kein Minimum. Zu zeigen ist, dass A die leere Menge ist. Wir
zeigen induktiv die Aussage
P (n) :⇐⇒ {1, 2, . . . , n} ∩ A = ∅,
woraus die Aussage folgt.
Induktionsanfang: Angenommen 1 wäre in A. Dann ist 1 das Minimum. Da es aber kein Minimum in A gibt, folgt
1 6∈ A, also P (1).
Induktionsschritt: Es gelte P (n). Falls n + 1 ∈ A, so ist n + 1 ein Minimum von A. Da es aber kein Minimum gibt,
gilt n + 1 6∈ A, und somit P (n + 1).
2
44
2. ZAHLEN
Algebra diskutiert. Wir beschränken uns deswegen hier auf das Wichtigste und verweisen den näher
interessierten Hörer auf Kapitel 4 in [15].
Wir schreiben
Z := {. . . , −2, −1, 0, 1, 2, . . .} ⊇ N0
für die ganzen Zahlen. Die Addition und die Multiplikation kann man zu Abbildungen
+ : Z × Z −→ Z,
· : Z × Z −→ Z,
(a, b) 7→ a + b
(a, b) 7→ a · b
erweitern, so dass die Eigenschaften (Aa), (Ak), (An), (Ma), (Mk), (Mn) und (AMd) gelten weiterhin, wenn man N0 durch Z ersetzt. Außerdem gilt
(Ai) Addition hat inverse Elemente.
Zu jedem x ∈ Z gibt es ein y ∈ Z, so dass
x + y = y + x = 0.
Man nennt y das Inverse von x bezüglich der Addition und schreibt normalerweise −x
anstelle von y.
Schreibweise
x − y := x + (−y).
Hinzu kommt eine Eigenschaft, die anschaulich besagt, dass die ganzen Zahlen die kleinste Er”
weiterung“ der natürlichen Zahlen sind, die diese Eigenschaften erfüllt. Präzise ausgedrückt:
(MEZ) Minimale Erweiterung.
Ist T eine Teilmenge von Z mit N ⊂ T und gilt
∀x, y ∈ T : x + y ∈ T
und
∀x ∈ T : −x ∈ T,
dann gilt bereits T = Z.
Auch die Ordnung setzt sich auf Z fort und die Eigenschaften (1)–(5) in Lemma 1.19 gelten weiter.
Eine mit Addition und Mulitplikation versehene Menge, die die Eigenschaften (Aa), (Ak), (An),
(Ai), (Ma), und (AMd) erfüllt, nennt man Ring. Gilt zusätzlich (Mn), so spricht man von einem
Ring mit Eins. Ein Ring, der zusätzlich (Mk) erfüllt, nennt man einen kommutativen Ring.
e ·), der die natürlichen Zahlen
Somit ist (Z, +, ·) ein kommutativer Ring mit Eins. Ein Ring (R, +,e
enthält und (MEZ) erfüllt, stimmt im wesentlichen“ mit den ganzen Zahlen überein. Präziser: es
”
gibt eine bijektive Abbildung b : Z −→ R mit
e
∀x, y ∈ Z : b(x + y) = b(x)+b(y)
und b(x · y) = b(x)e·b(y).
3. DIE RATIONALEN ZAHLEN
45
Solche eine bijektive Abbildung, die Addition und Multiplikation erhält, nennt man einen (Ring)e ·) ist isomorph (als Ring) zu
Isomorphismus oder Isomorphismus von Ringen. Wir sagen: (R, +,e
∼
e
(Z, +, ·) und schreiben (R, +,e·) = (Z, +, ·).
Notation. Den Ring der ganzen Zahlen schreiben wir zumeist als Z an Stelle von (Z, +, ·), da die
Addition und die Multiplikation aus dem Kontext heraus klar sind.
3. Die rationalen Zahlen
Die rationalen Zahlen sind6
Q :=
Hierbei gilt
o
nz z ∈ Z, n ∈ N .
n
z
y
=
⇐⇒ zm = yn.
n
m
Die Addition und die Multiplikation setzen sich zu Abbildungen
+ : Q × Q −→ Q, (a, b) 7→ a + b
· : Q × Q −→ Q,
(a, b) 7→ a · b
fort, und die Eigenschaften (Aa), (Ak), (An), (Ai), (Ma), (Mk), (Mn) und (AMd) gelten weiterhin
für (Q, +, ·). Außerdem gilt
(Mi) Multiplikation hat inverse Elemente.
Zu jedem x ∈ Q r {0} gibt es ein y ∈ Q, so dass
x · y = y · x = 1.
Man nennt y das Inverse von x bezüglich der Multiplikation und schreibt normalerweise
x−1 anstelle von y.
Anschaulich: Die rationalen Zahlen sind die kleinste Erweiterung von N, die diese Eigenschaften
hat.
Präzise Bedeutung:
(MEQ) Minimale Erweiterung.
Ist T eine Teilmenge von Q mit N ⊂ T und gilt
∀x, y ∈ T : x − y ∈ T
∀x ∈ T : ∀x ∈ T r {0} : x · y −1 ∈ T,
dann gilt bereits T = Q.
6An dieser Stelle müsste eigentlich gesagt werden, wie z definiert ist. Dies wurde in der Linearen Algebra
n
diskutiert und wird deswegen hier nicht erklärt.
46
2. ZAHLEN
Auch die Ordnung setzt sich fort. Die Ordnung auf Q ist auch total.
Mit Addition und Multiplikation versehene Mengen mit mindestens 2 Elementen nennt man
Körper , falls die Eigenschaften (Aa), (Ak), (An), (Ai), (Ma), (Mk), (Mn), (Mi) und (AMd) erfüllt
sind.
Also ist (Q, +, ·) ein Körper. Wie bei den ganzen Zahlen schreiben wir oft Q für (Q, +, ·). Jeder Körper, der die natürlichen Zahlen enthält und (MEQ) erfüllt, ist isomorph zum Körper der
rationalen Zahlen.
ÜBUNG 3.1. Versehe F2 := {0, 1} mit der folgenden Addition und Multiplikation:
+
0
1
0
0
1
1
1
0
·
0
1
0
0
0
1
0
1
e +,e
e ·)
Zeigen Sie, dass (F2 , +, ·) ein Körper ist. Man nennt ihn den Körper mit 2 Elementen. Ist (K,
e
e
e
ein Körper, und hat K genau zwei Elemente, dann ist (K, +,e·) isomorph zu (F2 , +, ·).
In jedem Körper K gilt 0 6= 1. Denn angenommen, wir hätten 0 = 1, so folgt für alle x ∈ K:
x = 1 · x = 0 · x = 0. Also K = {0}. Dies widerspricht der Forderung, dass K mindestens zwei
Elemente hat.
4. Geordnete Körper
15.11.
Definition 4.1. Eine geordneter Körper ist ein Quadrupel (K, +, ·, ≤), so dass die folgenden
Eigenschaften erfüllt sind:
(a)
(b)
(c)
(d)
(K, +, ·) ist ein Körper,
≤ ist eine totale Ordnung auf K,
∀x, y, z ∈ K : (x ≤ y =⇒ x + z ≤ y + z),
∀x, y, z ∈ K : (x ≤ y ∧ z ≥ 0 =⇒ x · z ≤ y · z).
Beispiel 4.2. (Q, +, ·, ≤) ist ein geordneter Körper.
Wir definieren zunächst, wann eine Zahl größer oder gleich Null ist:
m
∀m ∈ Z : ∀n ∈ N : 0 ≤
⇐⇒ 0 ≤ m · n
n
Dann definieren wir die Relation ≤ für beliebige Zahlen:
∀a, b ∈ Q : a ≤ b ⇐⇒ 0 ≤ b − a
Nicht-Beispiel: Sei (F2 , +, ·) der Körper mit zwei Elementen aus Übung 3.1. Dann gibt es keine
totale Ordnung ≤ auf F2 , so dass (F2 , +, ·, ≤) ein geordneter Körper ist.
Im Rest dieses Abschnitts sei (K, +, ·, ≤) ein geordneter Körper.
4. GEORDNETE KÖRPER
47
Notation 4.3.
x<y
:⇐⇒
x ≤ y ∧ x 6= y
x≥y
:⇐⇒
y≤x
x>y
:⇐⇒
y<x
x ist positiv
:⇐⇒
x>0
x ist negativ
:⇐⇒
x<0
K≤a
:=
⇐⇒
¬(y ≤ x)
{x ∈ K | x ≤ a}
K≥a , K<a , K>a analog.
ÜBUNG 4.4. Sei a ∈ K. Dann gilt:
(a)
(b)
(c)
(d)
a ist genau dann positiv, wenn −a negativ ist.
1>0
Ist z > 0, dann auch z −1 > 0.
Ist z < 0, dann gilt auch z −1 < 0 und dann gilt für alle x, y ∈ K:
x≤y
⇐⇒
x · z ≥ y · z.
Beweis: siehe Hausaufgabe
Wir definieren rekursiv eine Abbildung iN : N −→ K, 1 7→ 1, iN (n + 1) = iN (n) + 1.
LEMMA 4.5.
(a) iN : N −→ K ist injektiv,
(b) ∀n ∈ N : iN (n) > 0,
(c) iN erhält Addition und Multiplikation, d.h. für alle n, m ∈ N gilt:
(4.6)
iN (n + m) = iN (n) + iN (m)
iN (n · m) = iN (n) · iN (m)
Beweis. Man zeigt ∀n ∈ N : i(n) > 0 und (4.6) durch Induktion.
Zur Injektivität: Gegeben seien n, m ∈ N mit iN (n) = iN (m). O.B.d.A. gelte m ≤ n. Sei k :=
n − m ∈ N0 . Aus (4.6) folgt iN (m) = iN (n) = iN (m) + iN (k), also iN (k) = 0. Mit (a) ergibt dies
k = 0, und somit m = n.
2
LEMMA 4.7. Sei (K, +, ·, ≤) ein geordneter Körper. Dann gibt es eine injektive Abbildung iQ :
Q −→ K, so dass iQ |N = iN und so dass für alle n, m ∈ Q (4.6) mit iQ an Stelle von iN gilt.
Außerdem gilt für a, b ∈ Q
a ≤ b ⇐⇒ iQ (a) ≤ iQ (b).
Beweisskizze: Für m ∈ N, n ∈ N definieren wir
m
iN (m)
:=
iQ
n
iN (n)
48
2. ZAHLEN
−m
iN (m)
iQ
:= −
n
iN (n)
0
iQ
:= 0
n
Man muss nun zeigen, dass diese Definition Sinn ergibt. Wir dürfen einer rationalen Zahl nicht
zwei verschiedene Werte zuweisen. Zu überprüfen ist zunächst
p
iN (m)
iN (p)
m
=
=⇒
=
n
q
iN (n)
iN (q)
für alle relevanten m, n, p, q. Man sagt dann, die Abbildung iQ ist wohldefiniert. Danach kann man
die anderen Eigenschaften leicht prüfen.
Wir identifizieren nun Q mit B(iQ ) vermöge iQ , das heißt wir machen keinen Unterschied mehr
zwischen r ∈ Q und iQ (r) ∈ K.
Definition 4.8. Ein geordneter Körper (K, +, ·, ≤) heißt archimedisch,
7
falls
∀a ∈ K : ∃n ∈ N : a ≤ n.
m
Beispiele 4.9. (a) Q ist archimedisch: Man zeigt leicht für m, n ∈ N: m
n ≤ m und − n ≤ m und
0
n ≤ 1.
(b) Später sehen wir: R ist archimedisch
(c) Der Körper der rationalen Funktionen mit rationalen Koeffizienten
p(x)
K := x 7→
| p und q sind Polynome mit rationalen Koeffizienten, q 6= 0} .
q(x)
Wir definieren Addition und Multiplikation wie bei den rationalen Zahlen:
p(x)q̃(x) + p̃(x)q(x)
p(x) p̃(x)
p(x) · p̃(x)
p(x) p̃(x)
+
:=
·
:=
.
q(x) q̃(x)
q(x) · q̃(x)
q(x) q̃(x)
q(x) · q̃(x)
Dann ist (K, +, ·) ein Körper. Ein Polynom p wie oben schreiben wir im Fall p 6= 0 als p(x) =
a0,p + a1,p x + a2,p x2 . . . + ak,p xk , k ∈ N0 , ak,p 6= 0. Dann heißt deg(p) := k ∈ N0 der Grad des
Polynoms. Wir definieren nun
p(x)
P :=
∈ K | adeg(p),p · adeg(q),q > 0
q(x)
Weiter definieren für r, s ∈ K:
r<s
:⇐⇒
s − r ∈ P.
Man kann leicht zeigen, dass (K, +, ·, ≤) ein geordneter Körper ist.
Angenommen, er wäre archimedisch geordnet. Dann gibt es ein n ∈ N mit x ≤ n < n + 1.
Dann wäre also x − (n + 1) < 0. Dies ist aber ein Widerspruch zu x − (n + 1) = x−(n+1)
∈ P.
1
Also ist dieser geordnete Körper nicht archimedisch.
7Man sagt manchmal auch: Der Körper erfüllt das Archimedische Axiom. Diese Sprechweise vermeiden wir
aber, da die archimedische Eigenschaft in dem von uns gewählten Zugang kein Axiom ist.
4. GEORDNETE KÖRPER
49
Sei weiterhin (K, +, ·, ≤) ein geordneter Körper.
Definition 4.10. Die Betragsfunktion | · | : K −→ K ist definiert durch


falls a > 0
a
|a| := max{a, −a} = −a falls a < 0


0
falls a = 0
Man nennt |a| auch den Absolutbetrag von a.
LEMMA 4.11.
|a| ≥ 0; |a| = 0 ⇐⇒ a = 0;
|−a| = |a|;
|a · b| = |a| · |b|; ab = |a|
|b| falls b 6= 0;
2
2
2
|a | = |a| = a ≥ 0
|a + b| ≤ |a| + |b|;
|a1 + · · · +
ak | ≤ |a
1 | + · · · + |ak |;
(g) |a − b| ≥ |a| − |b|
(a)
(b)
(c)
(d)
(e)
(f)
Beweis. (a)-(d) folgen direkt aus den Definitionen 4.1 und 4.10.
(e): ±a ≤ |a| und ±b ≤ |b| ergeben ±(a + b) ≤ |a| + |b|.
(f): durch Induktion.
(g): Wir setzen ã := a − b. Dann gilt
| ã + b | ≤ |ã| + |b| = |a − b| + |b|
| {z }
a
Also
(4.12)
|a − b| ≥ |a| − |b|
Durch Vertauschen von a und b erhalten wir
(4.13)
|a − b| = |b − a| ≥ |b| − |a|.
Aus (4.12) und (4.13) erhalten wir das zu Beweisende.
2
SATZ 4.14. Seien a1 , . . . , an ∈ K, ai ≥ 0. Dann
n
a1 + a2 + . . . + an
a1 · a2 · . . . · an ≤
.
n
Bemerkung 4.15. Wenn wir in K die n-te Wurzel ziehen können (in Q nicht erlaubt!), bedeutet
dies
√
a1 + a2 + . . . + an
n
a1 · a2 . . . an
.
≤
|
{z
}
n
|
{z
}
geometrisches Mittel arithmetisches Mittel
50
2. ZAHLEN
Beweis des Satzes. Wir beweisen den Satz durch Induktion nach n.
Induktionsanfang: n = 1 ist offensichtlich richtig.
Induktionsschritt von n − 1 nach n für n ≥ 2:
Seien a1 , . . . , an .
O.B.d.A. a1 = min{a1 , . . . , an }, a2 = min{a1 , . . . , an }.
n
. =⇒ a1 ≤ M ≤ a2
M := a1 +...+a
n
Wir setzen d := a1 + a2 − M Dann
M d − a1 a2 = M ((a1 + a2 ) − M ) = (a2 − M )(M − a1 ) ≥ 0
=⇒ a1 · a2 ≤ M d
(4.16)
Das arithmetische Mittel von d, a3 , a4 , . . . , an ist M , denn
d + a3 + a4 + . . . + an = a1 + a2 + . . . + an − M = (n − 1)M.
Es folgt
(4.16)
a1 a2 · · · an ≤ M
da3 · · · an
= Mn
| {z }
≤ M n−1
nach Annahme
2
5. Die reellen Zahlen
20.11.
Da die reellen Zahlen R für die Analysis eine zentrale Rolle spielen, wollen wir hier wieder formal
vollständiger vorgehen.
5.1. Unzulänglichkeit von Q. Wieso reichen uns die rationalen Zahlen nicht aus?
Problem 1 (Algebraisch):
Sei p eine Primzahl. Dann ist x2 = p in Q nicht lösbar.
Angenommen es gäbe eine Lösung x = m/n, m ∈ Z, n ∈ N. O.B.d.A. m, n teilerfremd.
Wir erhalten
m2
n2
= x2 = p, also m2 = pn2 .
Es folgt p|m und daraus p2 |m2 = pn2 , was wiederum p|n impliziert. Also haben wir einen Widerspruch zur Teilerfremdheit von m und n.
Problem 2 (Geometrisch):
BIlD Kreis
Umfang
π=
= 3, 14159265... 6∈ Q
Durchmesser
5. DIE REELLEN ZAHLEN
51
Wichtige geometrische Funktionen können in Q nicht beschrieben werden, zum Beispiel sin(60◦ ) 6∈
Q.
BIlD Quadrat mit Diagonale runtergedreht
Problem 3 (Physikalisch):
BILD mit Pendel und zwei Kräften
5.2. Die Supremumseigenschaft. In diesem Abschnitt werden wir eine Eigenschaft kennenlernen, die im Körper der rationalen Zahlen Q nicht gilt, aber im Körper der reellen Zahlen R.
Zunächst ein paar Vorbemerkungen.
Wir nennen eine Menge M 6= ∅ endlich, falls es ein n ∈ N und Elemente m1 , . . . , mn gibt mit
M = {mi | i ∈ {1, 2, . . . , n}}. Sind die mi paarweise verschieden (d.h. i 7→ mi ist injektiv), dann
sagen wir M hat n Elemente und wir schreiben #M = n. Wir definieren auch #∅ = 0, die leere
Menge ist auch endlich (per Definition).
Wdh.: Sei ≤ eine partielle Ordnung auf einer Menge M . Sei x ∈ A ⊂ M .
x = min A
⇐⇒
∀y ∈ A : x ≤ y.
(Maximum analog mit ≥).
LEMMA 5.1. Gegeben sei eine totale Ordnung auf einer endlichen Menge A, dann besitzt A ein
Maximum und ein Minimum.
Beweis: durch Induktion über #M .
Definition 5.2. Sei ≤ eine partielle Ordnung auf einer Menge M . Eine Teilmenge A ⊂ M heißt
nach oben beschränkt in M (bzw. nach unten beschränkt in M ), falls es ein r ∈ M gibt, so dass
für alle a ∈ A die Aussage a ≤ r (bzw. a ≥ r) gilt. Ein solches r heißt obere Schranke (bzw. untere
Schranke) von A. Wir sagen A ist beschränkt in M , wenn A nach oben und unten beschränkt ist.
Besitzt die Menge
S(A, M ) := {r ∈ M | r ist obere Schranke von A}
ein Minimum, so nennen wir min S(A, M ) das Supremum von A in M .
Besitzt die Menge
S(A, M ) := {r ∈ M | r ist untere Schranke von A}
ein Maximum, so nennen wir max S(A, M ) das Infimum von A in M .
Kurzschreibweise sup A und inf A
Beispiele 5.3. (a) M = Q, A = {2, 4, 8}. Dann ist r obere Schranke, gdw r ≥ 8. Und r ist untere
Schranke, gdw r ≤ 2. Wir haben max A = sup A = 8 und min A = inf A = 2.
52
2. ZAHLEN
(b) Falls A ein Maximum besitzt, so ist dieses Maximum auch das Supremum. Denn sei a = max A,
dann folgt
S(A, M ) = {r ∈ M | r ≥ a} =: M≥a .
Also a = min S(A, M ) = sup A.
(c) M = Q, A = {x ∈ Q | 0 < x < 1} besitzt kein Minimum. Denn für alle x ∈ A gilt:
x
2 < x. Ähnlich zeigt man, dass A kein Maximum besitzt.
S(A, M ) = Q≥1
x
2
∈ A und
S(A, M ) = Q≤0
sup A = 1 und inf A = 0.
Definition 5.4. Sei ≤ eine partielle Ordnung auf M . Wir sagen (M, ≤) erfüllt die Supremumseigenschaft (S) falls gilt
(S) Supremumseigenschaft
Sei A ⊂ M nicht-leer und nach oben beschränkt in M . Dann besitzt A ein Supremum
in M .
Beispiel 5.5. (Q, ≤) erfüllt die Supremumseigenschaft nicht: Die Menge
A := {x ∈ Q | x2 ≤ 2}
ist nach oben beschränkt.
S(A, Q) := {x ∈ Q | x > 0 und x2 ≥ 2}.
Da es keine rationale Zahl x mit x2 = 2 gibt, folgt
S(A, Q) := {x ∈ Q | x > 0 und x2 > 2}.
Zu gegebenem x ∈ S(A, Q) definieren wir nun
y := x −
x2 − 2
,
2x
und man zeigt leicht 0 < y < x. Weiter gilt
x2 − 2
y = x − 2x
+
2x
2
2
x2 − 2
2x
2
> x2 − (x2 − 2) = 2,
also auch y ∈ S(A, Q). Da es zu jedem Element in S(A, Q) ein kleineres in S(A, Q) gibt, kann es
in S(A, Q) kein Minimum geben. Also besitzt A kein Supremum in Q.
SATZ 5.6. Ist (K, +, ·, ≤) ein geordneter Körper, der die Supremumseigenschaft erfüllt, dann ist
er archimedisch.
Die Umkehrung gilt nicht: Beispiel K = Q.
5. DIE REELLEN ZAHLEN
53
Beweis. Angenommen, er sei nicht archimedisch. Dann gibt es ein a ∈ K mit
∀n ∈ N : a > n.
Das heißt N ist in K nach oben beschränkt. Wenn die Supremumseigenschaft erfüllt ist, gibt es
also ein Supremum s von N in K. Für ein beliebiges n gilt also s ≥ n + 1 also s − 1 ≥ n. Also ist
auch s − 1 ein obere Schranke von N. Dann ist aber s nicht das Minimum aller oberen Schranken,
was ein Widerspruch zur Wahl von s ist. Da wir einen Widerspruch erhalten haben, muss die obige
Annahme falsch gewesen sein. Wir haben dadurch gezeigt, dass (K, +, ·, ≤) archimedisch ist. 2
5.3. Axiome der reellen Zahlen.
PROPOSITION 5.7. Es gibt einen geordneten Körper, der die Supremumseigenschaft erfüllt.
Beweis folgt unten.
PROPOSITION 5.8. Seien (R1 , +, ·, ≤) und (R2 , +, ·, ≤) zwei geordnete Körper, die die Supremumseigenschaft erfüllen, dann gibt es eine eindeutige bijektive Abbildung F : R1 −→ R2 , die
Addition, Multiplikation, und die Ordnung erhält.
F erhält die Addition: ∀x, y ∈ R1 : F (x + y) = F (x) + F (y)
F erhält die Multiplikation: ∀x, y ∈ R1 : F (x · y) = F (x) · F (y)
F erhält die Ordnung: ∀x, y ∈ R1 : x ≤ y =⇒ F (x) ≤ F (y)
Man sagt dann oft: (R1 , +, ·, ≤) und (R2 , +, ·, ≤) sind kanonisch isomorph und F nennt man einen
Isomorphismus. 8.
Beweis später.
Definition 5.9. Ein Modell der reellen Zahlen ist ein geordneter Körper (R, +, ·, ≤), der die
Supremumseigenschaft erfüllt.
Bemerkung. Als Axiome der reellen Zahlen bezeichnet man deswegen die folgenden Eigenschaften:
• (R, +, ·, ≤) ist ein geordneter Körper,
• die Supremumseigenschaft.
8Isomorph hat hier eine andere Bedeutung als bei den natürlichen Zahlen. Isomorph“ kommt aus dem Grie-
”
chischen und heißt von gleicher Gestalt“. Es gibt in der Mathematik viele Strukturen und zu jeder eine eigene
”
Definition von isomorph“. Bei der Abbildung F oben im Text handelt es sich um einen Isomorphismus von ge”
ordneten Körpern: dies ist eine bijektive Abbildung, die Addition, Multiplikation und die Ordnung erhält. Sobald
es einen Isomorphismus von A nach B gibt, nennt man A und B isomorph. Das Wort kanonisch ist nicht ganz so
leicht zu erklären. Es bedeutet hier, dass es einen Isomorphismus gibt, der sich aus der Struktur bereits ergibt und
nicht von zusätzlichen Wahlen abhängt. In der obigen Proposition gilt F (0) = 0 und F (1) = 1 und hierdurch ist der
Isomorphismus F bereits festgelegt. Er ist also bereits durch die Struktur festgelegt und deswegen kanonisch.
54
2. ZAHLEN
Um zu zeigen, wie wir die Supremumseigenschaft nutzen können, betrachten wir das folgende
Lemma.
LEMMA 5.10. Ist (R, +, ·, ≤) ein Modell der reellen Zahlen, und a ∈ R, a ≥ 0, n ∈ N, so gibt es
genau ein r ∈ R mit rn = a und r ≥ 0.
Beweis. Die Aussage ist klar für n = 1 und klar für a = 0. Sei nun n ≥ 2 und a > 0.
Eindeutigkeit. Hierzu genügt es zu zeigen:
∀x, y ∈ R : 0 < x < y =⇒ xn < y n
Dies folgt aus der folgenden Umformung
y n − xn = (y − x)
n−1
X
y i xn−i−1 > 0,
i=0
da
Pn−1
i=0
i n−i−1
yx
als Summe positiver Zahlen positiv ist.
Existenz. Wir betrachten die Menge A := {x ∈ R | xn ≤ a}. Die Menge A ist nach oben
beschränkt: max{1, a} ist eine obere Schranke von A. Man zeigt leicht, dass
S(A, R) = {x ∈ R | 0 < x ∧ xn ≥ a}.
Da A nicht-leer ist, existiert s := sup A = min S(A, R). Offensichtlich gilt s > 0 und sn ≥ a.
Wir nehmen nun an sn > a. Für eine Zahl δ ∈ R mit 0 < δ < 1, die wir später festlegen, rechnen
wir (s(1 − δ))n ≥ sn (1 − nδ), wobei wir Übungsblatt 5, Aufgabe 2 a) mit x := −δ nutzen. Wir
würden gerne δ so wählen, dass
(5.11)
sn (1 − nδ) ≥ a.
Dann gilt s > s(1 − δ) ∈ S(A, R). Somit ist dann s kein Minimum von S(A, R). Wir haben dann
einen Widerspruch zur Annahme sn > a gefunden, und haben deswegen sn = a, was die Existenz
liefert.
Man zeigt mit Standard-Umformungen, dass (5.11) äquivalent zu
1
a
δ=
1− n
n
s
ist, und die rechte Seite ist zwischen 0 und 1. Wenn wir das δ also so wählen, können wir wie oben
angegeben schließen.
2
Bemerkung. Wenn nun (R, +, ·, ≤) ein Modell der reellen Zahlen ist, und b ∈ R, b > 0, dann
können wir jetzt alle Potenzen der Form bt , mit t ∈ Q bilden. Wir schreiben hierzu t = p/q mit
p ∈ Z, q ∈ N. Wenn wir das vorangehende Lemma für a := bp und n := q anwenden, dann besagt
dieses Lemma, dass es genau eine Zahl r ∈ R>0 gibt, so dass rq = bp . Wir würden nun gerne
definieren at := r für dieses r. Damit dies eine sinnvolle Definition ist, muss man überprüfen,
dass r unahängig davon ist, wie wir t als Bruch schreiben. Dazu muss man die folgende Aussage
5. DIE REELLEN ZAHLEN
55
überprüfen:9 Es gelte t = p/q = p̃/q̃, p, p̃ ∈ Z, q, q̃ ∈ N. Wir wählen r, r̃ ∈ R>0 mit rq = bp und
r̃q̃ = bp̃ . Dann gilt r = r̃.
Man beachte, dass wir den Ausdruck bt für eine positive reelle Zahl b und eine reelle, nicht-rationale
Zahl t noch nicht definieren können.
Man kann aus dem bisher Bekannten nun auch leicht zeigen, dass für b, b̃ ∈ R>0 , t, t̃ ∈ Q gilt:
(bb̃)t = bt b̃t
bt+b̃ = bt bb̃
22.11.
Zur Konstruktion eines Modells der reellen Zahlen, das heißt zum Beweis von Proposition 5.8, gibt
es verschiedene Methoden, zum Beispiel:
• Die Konstruktion als Dezimalzahlen. Hier muss man zum Beispiel darauf achten, dass
1, 49 = 1, 5. Geht genauso im Binärsystem oder bezüglich anderer Basen.
• Die Konstruktion durch Intervallschachtelungen. Recht beliebt in Schulen, da anschaulich
und unabhängig davon, ob man in der Basis 10 (=Dezimaldarstellung), in der Basis
2 (=Binärdarstellung) oder noch einer anderen Basis arbeitet. Siehe zum Beispiel [19,
Abschnitt 2.3].
• Dedekindsche Schnitte. Mathematisch elegant und kürzer als Intervallschachtelung und
Cauchy-Folgen.
• Cauchy-Folgen. Dies führt unter anderem zum Begriff der Vollständigkeit, der nicht nur in
diesem Kontext wichtig ist, sondern auch zum Beispiel bei Hilbert- und Banach-Räumen.
Solche Räume sind z.B. wichtig, um partielle Differentialgleichungen zu lösen und um
Quantenmechanik zu beschrieben. Im Interesse der Physiker und aller die an der Lösung
partieller Differentialgleichungen interessiert sind, wählen wir diesen Zugang. Wir werden
also etwas länger benötigen, aber lernen dann gleich viele Ideen und Konzepte kennen,
die wir sowieso benötigen.
5.4. Folgen, Konvergenz und Cauchy-Folgen. Wiederholung: Sei M eine Menge. Eine
(M -wertige) Folge ist eine Abbildung von N nach M .
N-indizierte Familie von Elementen von M
=
M -wertige Folge
Wir schreiben im folgenden zumeist K für einen geordneten Körper (K, +, ·, ≤). Und |a| ∈ K≥0
sei (wie immer) der Betrag von a ∈ K. 10
9Diese Überprüfung sollten Sie inzwischen selbst tun können.
10Tipp zum Lesen: Stellen Sie sich beim ersten Lesen immer den Fall K = Q vor. Der nächste wichtige Fall ist
K = R, genauer gesagt: wenn (K, +, ·, ≤) ein Modell der reellen Zahlen ist. Insbesondere interessieren uns vor allem
die archimedischen geordneten Körper, auch wenn wir die nicht-archimedischen nicht ausschließen wollen.
56
2. ZAHLEN
Definition 5.12. Eine K-wertige Folge (ai )i∈N heißt beschränkt 11 ,
:⇐⇒ {ai | i ∈ N} ist (nach oben und unten) beschränkt in K
⇐⇒ ∃r1 , r2 ∈ K : ∀i ∈ N : r1 ≤ ai ≤ r2
⇐⇒ ∃r ∈ K : ∀i ∈ N : |ai | ≤ r
⇐⇒ {|ai | | i ∈ N} ist beschränkt in K
Bemerkung 5.13. Falls K archimedisch ist, so gilt auch:
(ai )i∈N ist beschränkt in K
⇐⇒
∃n ∈ N : ∀i ∈ N : |ai | ≤ n.
Die Implikation ⇐= ist klar, und =⇒ folgt direkt aus der archimedischen Eigenschaft
Definition 5.14 (Konvergenz von Folgen). Eine K-wertige Folge (ai )i∈N konvergiert 12 gegen
a ∈ K, falls gilt
∀ ∈ K>0 : ∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤ ).
Man nennt a den Grenzwert der Folge (ai )i∈N und schreibt a = limi→∞ ai oder ai → a für i → ∞.
Wir sagen (ai )i∈N konvergiert, falls es ein derartiges a ∈ K gibt. Folgen, die gegen 0 konvergieren,
nennt man Nullfolgen. Falls eine Folge nicht konvergiert, so sagen wir dazu sie divergiert.
!ACHTUNG!. Wenn wir a = limi→∞ ai schreiben, so bedeutet dies immer:
• der Grenzwert existiert, und
• der Grenzert ist a.
Bemerkungen 5.15.
(a) Falls eine Folge einen Grenzwert besitzt, so ist dieser eindeutig bestimmt. Seien a und a0 zwei
Grenzwerte von (ai )i∈N . Zu einem gegebenen ∈ K>0 gilt also:
∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤ ).
∃i00 ∈ N : ∀i ∈ N : (i ≥ i00 =⇒ |ai − a0 | ≤ ).
Wähle nun so ein i0 und i00 . Dann gilt für alle i ≥ max{i0 , i00 }:
|a − a0 | ≤ |a − ai | + |ai − a0 | ≤ + = 2.
11Wenn man hier ganz exakt sein will, sollte man hier besser beschränkt in K“ oder K-beschränkt“ sagen,
”
”
denn ob eine Folge beschränkt ist, hängt von K ab. Beispiel: Die Folge (i)i∈N ist unbeschränkt in Q, aber beschränkt
im Körper der rationalen Funktionen mit rationalen Koeffizienten. Sind aber K1 und K2 archimedische geordnete
Körper, so sieht man mit der unten stehenden Bemerkung, dass K1 -Beschränktheit und K2 -Beschränktheit die
gleiche Bedeutung haben.
12Wenn man hier ganz exakt sein will, sollte man hier besser K-konvergiert“ sagen, denn ob eine Folge
”
konvergiert, hängt von K ab. Beispiel: Die Folge (1/i)i∈N Q-konvergiert in Q gegen 0, aber nicht im Körper der
rationalen Funktionen mit rationalen Koeffizienten. Sind aber K1 und K2 archimedische geordnete Körper, so sieht
man mit einer der unten stehenden Bemerkungen, dass K1 -Konvergenz und K2 -Konvergenz die gleiche Bedeutung
haben.
5. DIE REELLEN ZAHLEN
57
Dies gilt für alle ∈ K>0 . Angenommen wir haben a 6= a0 , so gilt dies insbesondere für
:= |a − a0 |/3 > 0. Also folgt 3 ≤ 2 und somit ergibt sich der Widerspruch ≤ 0. Die
Annahme a 6= a0 war also falsch, d.h. es gilt a = a0 .
(b) Falls (ai )i∈N konvergiert, so ist (ai )i∈N beschränkt. Um dies zu zeigen, wählen wir zu := 1
ein passendes i0 . Es gilt somit für alle i ∈ N mit i ≥ i0 :
|ai | ≤ |ai − a| + |a| ≤ |a| + 1.
Nun setzen wir
r := max{|a1 |, |a2 |, . . . , |ai0 −1 |, |a| + 1}.
Dann gilt für alle i ∈ N: |ai | ≤ r. Somit ist (ai )i∈N beschränkt.
(c) Ist K archimedisch, so gilt
a = lim ai
i→∞
⇐⇒
∀n ∈ N : ∃i0 ∈ N : ∀i ∈ N : (i ≥ i0 =⇒ |ai − a| ≤
1
).
n
Die Implikation =⇒ ist klar, und ⇐= folgt aus Lemma 5.16.
LEMMA 5.16. Ist K archimedisch, dann gibt es für alle ∈ K>0 ein n ∈ N mit ≥ (1/n).
Beweis. Zu 1/ ∈ K gibt es ein n ∈ N mit 1/ ≤ n, und dies ist äquivalent zu ≥ (1/n).
2
Beispiele 5.17. (a) Eine Folge (ai )i∈N heißt konstant, falls a1 = a2 = a3 = . . .. Konstante Folgen
sind beschränkt und konvergieren. a1 = limi→∞ ai .
(b) Sei K = Q. Dann ist ( 1i )i∈N eine Nullfolge. (Nutze z.B. Bem. 5.15 (c) und setze i0 := n).
(c) Die Folge (−1)i i∈N hat 1 als obere und −1 als untere Schranke und ist somit beschränkt.
Wir werden bald sehen, dass sie nicht konvergiert.
Definition 5.18. Sei (ai )i∈N eine Folge von Elementen ai ∈ M . Sei f : N → N eine Abbildung
mit der Eigenschaft
∀i, j ∈ N : i < j =⇒ f (i) < f (j)
(Man sagt zu dieser Eigenschaft: f ist streng monoton wachsend .) Dann nennt man (af (k) )k∈N eine
Teilfolge von (ai )i∈N .
Beispiel 5.19. Die Folge (i)i∈N hat folgende Teilfolgen:13
• sich selbst,
• die Folge der ungeraden Zahlen (1, 3, 5, 7, . . .),
• die Folge der Primzahlen (2, 3, 5, 7, . . .).
Konvergiert (ai )i∈N gegen a, so konvergiert jede Teilfolge ebenfalls gegen a.
LEMMA 5.20. Die Folge (−1)i i∈N aus Beispiele 5.17 (c) divergiert.
13Diese Folge hat natürlich noch viel mehr Teilfolgen. U.a. gibt es sogar Teilfolgen, die man gar nicht beschrei-
ben kann. Wieso es nicht beschreibbare Teilfolgen gibt, kann erst später erklärt werden.
58
2. ZAHLEN
Beweis. Angenommen, die Folge (−1)i i∈N konvergiert gegen ein a ∈ K. Dann konvergieren auch
die Teilfolgen (−1)2k k∈N = (1)k∈N und (−1)2k+1 k∈N = (−1)k∈N gegen a. Da diese Teilfolgen
konstant sind, erhalten wir a = 1 und a = −1, was in K nicht möglich ist, denn es gilt ja
−1 < 0 < 1.
2
ÜBUNG 5.21. Seien (ai )i∈N und (bi )i∈N konvergente Folgen. Dann gilt:
lim (ai + bi ) = lim ai + lim bi
i→∞
i→∞
i→∞
lim (ai − bi ) = lim ai − lim bi
i→∞
i→∞
i→∞
lim (ai · bi ) = lim ai · lim bi
i→∞
i→∞
i→∞
Gilt zusätzlich: ∀i ∈ N : bi 6= 0, und ist (bi )i∈N keine Nullfolge, so gilt auch
lim ai
ai
= i→∞ .
lim
i→∞ bi
lim bi
i→∞
Die Beweise sind ähnlich wie in der folgenden Proposition.
Definition 5.22. Eine K-wertige Folge (ai )i∈N heißt Cauchy-Folge,14 falls
∀ ∈ K>0 : ∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0 ) =⇒ |ai − aj | ≤ .
PROPOSITION 5.23.
(1) Jede konvergente Folge ist eine Cauchy-Folge.
(2) Jede Cauchy-Folge ist beschränkt.
(3) Seien (ai )i∈N und (bi )i∈N Cauchy-Folgen. Dann sind (ai + bi )i∈N , (ai − bi )i∈N und (ai · bi )i∈N
ebenfalls Cauchy-Folgen.
(4) Zusätzlich zu den Voraussetzungen
in (3) gelte ∀i ∈ N : bi 6= 0, und die Folge (bi )i∈N sei keine
ai
Nullfolge. Dann ist auch bi
eine Cauchy-Folge.
i∈N
Um die Proposition zu zeigen, nutzen wir ein Lemma.
LEMMA 5.24. Sei A( • ) eine auf K>0 definierte Aussageform, und q ∈ K>0 . Dann gilt
∀ ∈ K>0 : A()
⇐⇒
∀ ∈ K>0 : A(q)
Das Lemma gibt es vielen Variationen. Wichtiger als die Aussage des Lemmas ist es, zu verstehen,
wie man das Lemma (oder eine Variation davon!) kurz beweist.
14Genau genommen müsste man hier wieder sagen: eine K-Cauchy-Folge, da die Definition zuächst von K
abhängt. Die Bedeutung ist dann aber für alle archimedischen Körper dieselbe.
5. DIE REELLEN ZAHLEN
Beweis des Lemmas.
=⇒“: Es gelte
”
(5.25)
59
∀b
∈ K>0 : A(b
).
Für ein gegebenes > 0 wollen wir nun A(q) zeigen. Wir wenden (5.25) für b
:= q an, und haben
dann das gewünschte.
⇐=“: Analog mit b
:= q −1 ”
2
Beweis der Proposition.
(1): Es gelte limi→∞ ai = a. Das heißt: für alle ∈ K>0 gibt es ein i0 ∈ N, so dass für alle
natürlichen Zahlen i ≥ i0 gilt: |ai − a| ≤ .
Für solch ein und ein passendes i0 nehmen wir nun natürliche Zahlen i ≥ i0 und j ≥ i0 und
rechnen nach:
|ai − aj | ≤ |ai − a| + |a − aj | ≤ + = 2.
Wir haben nun also gezeigt:
∀ ∈ K>0 : A(2),
wobei A(·) die folgende auf K>0 definierte Aussageform ist
A(˜
)
:⇐⇒
∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0 ) =⇒ |ai − aj | ≤ ˜
Nach dem obigen Lemma ist dies äquivalent zu
∀ ∈ K>0 : A()
und dies ist gerade die Definition einer Cauchy-Folge.
(2): Ähnlich wie Bemerkung 5.15 (b).
(3): Angenommen (ai )i∈N und (bi )i∈N seien Cauchy-Folgen. Dies bedeutet, dass wir für jedes ∈
K>0 die folgenden Aussagen haben:
∃i0 ∈ N : ∀i, j ∈ N : (i ≥ i0 ∧ j ≥ i0 ) =⇒ |ai − aj | ≤ ∃j0 ∈ N : ∀i, j ∈ N : (i ≥ j0 ∧ j ≥ i0 ) =⇒ |bi − bj | ≤ Wir wählen nun solch ein i0 und solch ein j0 . Wir setzen k0 := max{i0 , j0 }. Dann gilt für dieses
k0 :
∀i, j ∈ N : (i ≥ k0 ∧ j ≥ k0 ) =⇒ |ai − aj | ≤ ∧ |bi − bj | ≤ .
Wir rechnen für i, j ≥ k0 :
|(ai + bi ) − (aj + bj )| = |(ai − aj ) + (bi − bj )| ≤ |ai − aj | + |bi − bj | ≤ + = 2.
Also ergibt sich insgesamt
∀ ∈ K>0 : ∃k0 ∈ N : ∀i, j ∈ N : (i ≥ k0 ∧ j ≥ k0 ) =⇒ |(ai + bi ) − (aj + bj )| ≤ 2.
Nach dem obigen Lemma können wir auch hier 2 durch ersetzen. Dann steht hier gerade die
Definition, dass (ai + bi )i∈N eine Cauchy-Folge ist.
27.11.
60
2. ZAHLEN
Der Beweis für (ai − bi )i∈N ist völlig analog.
Für das Produkt (ai · bi )i∈N muss man etwas anders vorgehen. Zunächst nutzen wir die Tatsache,
dass (ai )i∈N und (bi )i∈N beschränkt sind. Also gibt es ein r ∈ K mit
∀i ∈ N : |ai | ≤ r ∧ |bi | ≤ r
Dann argumentieren wir wie bei der Summe, rechnen dann aber:
|ai bi − aj bj | = |ai (bi − bj ) + (ai − aj )bj | ≤ |ai ||bi − bj | + |ai − aj ||bj | ≤ r + r = 2r.
Nun argumentiert man wie bei der Summe, wobei man das Lemma mit q := 2r nutzt.
(4): Es reicht zu zeigen: Sei (bi )i∈N eine Folge wie oben, dann ist ( b1i )i∈N ebenfalls eine CauchyFolge. Die eigentliche Aussage folgt dann mit (3).
Wir zeigen zunächst durch Widerspruch, dass ( b1i )i∈N beschränkt ist. Angenommen ( b1i )i∈N sei
nicht beschränkt, dann gilt
1
∀r ∈ K : ∃n ∈ N : > r.
bn
Dies impliziert
∀r ∈ K>0 : ∃n ∈ N : |bn | <
1
r
und dies ergibt
∀δ ∈ K>0 : ∃n ∈ N : |bn | < δ,
(5.26)
wobei die folgende Variation des obigen Lemmas benutzt wurde
∀r ∈ K>0 : A(1/r)
⇐⇒
∀δ ∈ K>0 : A(δ).
Die Folge (bi )i∈N ist eine Cauchy-Folge. Zu einem gegebenen ∈ K>0 gibt es also ein i0 ∈ N, so
dass gilt
∀i, j ∈ N : i ≥ i0 ∧ j ≥ i0 =⇒ |bi − bj | ≤ (5.27)
Wir wählen nun zu diesem i0 :
min{, |b1 |, |b2 |, . . . , |bi0 |}
.
2
Mit (5.26) erhalten wir ein n ∈ N mit |bn | < δ. Auf Grund der Definition von δ gilt n > i0 . Mit
(5.27) folgt:
∀j ∈ N : j ≥ i0 =⇒ |bn − bj | ≤ δ :=
und mit der Rechnung
|bj | ≤ |bj − bn | + |bn | ≤ +
≤ 2
2
folgt
∀ ∈ K>0 : ∃i0 ∈ N : ∀j ∈ N : j ≥ i0 =⇒ |bj − 0| ≤ 2.
5. DIE REELLEN ZAHLEN
61
Dies ergibt unter Nutzung des Lemmas für q = 2, dass (bj )j∈N eine Nullfolge ist. Dies ist ein
Widerspruch zur Annahme. Also haben wir die Beschränktheit gezeigt, d.h.
1
∃r ∈ K : ∀n ∈ N : ≤ r.
bn
Nun sei wiederum > 0 und i0 wie oben. Wir rechnen dann
1
− 1 ≤ bj − bi ≤ |bj − bi | ≤ r2 bi
bj bi bj |bi ||bj |
Unter Nutzung des Lemmas für q = r2 erhalten wir, dass ( b1i )i∈N eine Cauchy-Folge ist.
2
Definition 5.28. Wir sagen K ist vollständig, falls jede K-wertige Cauchy-Folge in K konvergiert.
Definition 5.29. Sei A( • ) eine auf N definierte Aussageform.
Für fast alle i ∈ N gilt A(i)
:⇐⇒ Es gibt ein i0 ∈ N, so dass für alle i ∈ N: i ≥ i0 =⇒ A(i)
⇐⇒ Die Menge {i ∈ N | ¬A(i)} ist endlich
Beispiel: limi→∞ ai = a ⇐⇒ Für alle ∈ K>0 gilt für fast alle i ∈ N: |ai − a| ≤ ⇐⇒
6
Für fast
alle i ∈ N gilt für alle ∈ K>0 : |ai − a| ≤ Notation: Da wir immer wieder Ausdrücke der Art
∀i ∈ N : i ≥ i0 =⇒ A(i)
haben, schreiben wir hierfür kurz
∀i ∈ {i0 , i0 + 1, . . .} : A(i).
LEMMA 5.30. Besitzt eine Cauchy-Folge eine konvergente Teilfolge, so ist die Cauchy-Folge bereits konvergent.
Beweis. Sei nun (ai )i∈N eine Cauchy-Folge, sei f : N −→ N eine streng monotone wachsende
Abbildung, und sei (af (n) )n∈N eine konvergente Teilfolge mit Grenzwert a.
Es gilt für ein zunächst fixiertes ∈ K>0 :
(5.31)
∃i0 ∈ N : ∀i, j ∈ {i0 , i0 + 1, . . .} : |ai − aj | ≤ .
und
(5.32)
∃n0 ∈ N : ∀n ∈ {n0 , n0 + 1, . . .} : |af (n) − a| ≤ .
Für solche i0 und n0 setzen wir k0 := max{i0 , f (n0 )}. Da f streng monoton wachsend ist, können
wir ein n ∈ {n0 , n0 + 1, . . .} wählen mit f (n) ≥ k0 . 15 Wir wählen dann j := f (n) und haben somit
für alle i ∈ {i0 , i0 + 1, . . .} erhalten:
|ai − a| ≤ |ai − af (n) | + |af (n) − a| ≤ + ≤ 2.
15Man zeigt dazu zunächst f (a + b) ≥ f (a) + b. Dann sieht man, dass es für n := n + (k − f (n )) erfüllt ist.
0
0
0
62
2. ZAHLEN
Wir haben also insgesamt gezeigt:
∀ ∈ K>0 : ∃i0 ∈ N : ∀i ∈ {i0 , i0 + 1, . . .} : |ai − a| ≤ 2.
Und wenn wir Lemma 5.24 verwenden mit q = 2, erhalten wir limi→∞ ai = a.
2
SATZ 5.33. Sei K ein geordneter Körper. Dann sind äquivalent:
(1) K erfüllt die Supremumseigenschaft
(2) K ist archimedisch und vollständig
Beweis. (1) =⇒ (2)“: Angenommen K erfülle die Supremumseigenschaft. Wir haben bereits
”
gesehen, dass dann K archimedisch ist.
Sei nun (ai )i∈N eine Cauchy-Folge. Wir definieren
M
:= {x ∈ K | Für fast alle i ∈ N gilt: x ≤ ai },
=
{x ∈ K | ∃i0 ∈ N : ∀i ∈ {i0 , i0 + 1, . . .} : x ≤ ai }.
Jede Cauchy-Folge ist beschränkt. Es gibt also r1 , r2 mit ∀i ∈ N : r1 ≤ ai ≤ r2 . Dann gilt r1 ∈ M
und r2 ist eine obere Schranke von M . Da M nicht-leer und nach oben beschränkt ist, existiert
a := sup M ∈ K.
Wir wollen zeigen: limi→∞ ai = a.
Sei ∈ K>0 . Dann ist a + 6∈ M , denn sonst wäre a keine obere Schranke von M . Also
(5.34)
∀i0 ∈ N : ∃i ∈ {i0 , i0 + 1, . . .} : a + > ai .
Andererseits gilt: x0 ≤ x ∈ M =⇒ x0 ∈ M . Wäre a − 6∈ M wahr, dann wäre auch a − eine obere
Schranke, also a nicht das Supremum. Somit wissen wir a − ∈ M . Wir erhalten
(5.35)
∃k0 ∈ N : ∀k ∈ {k0 , k0 + 1, . . .} : a − ≤ ak .
Sei nun j0 ∈ N gegeben. Wir wählen ein k0 wie in (5.35). Wende (5.34) mit i0 := max{k0 , j0 } an.
Dann existiert ein i ∈ {i0 , i0 + 1, . . .} mit a + > ai und a − ≤ ai , also mit |ai − a| ≤ . Wir
haben gezeigt
(5.36)
∀ ∈ K>0 : ∀j0 ∈ N : ∃i ∈ {j0 , j0 + 1, . . .} : |ai − a| ≤ .
Wir definieren nun f : N −→ N rekursiv. Wähle f (1) := 1. Ist f (n) gewählt, so wenden wir (5.36)
mit := 1/(n + 1) und j0 := f (n) + 1 an. Für das so erhaltene i setzen wir f (n + 1) := i. Dann
ist (af (n) )n∈N eine Teilfolge und |af (n) − a| ≤ 1/n. Daraus folgt a = limn→∞ af (n) . Da (ai )i∈N eine
Cauchy-Folge mit einer konvergenten Teilfolge ist, folgt mit Lemma 5.30 dann limi→∞ ai = a.
(2) =⇒ (1)“: Angenommen K ist archimedisch und vollständig. Sei ∅ 6= M ⊂ K, r ∈ K, ∀x ∈
”
M : x ≤ r. Für jedes q ∈ N finden wir ein p ∈ N mit qr ≤ p. Die Menge
p
Aq := {p ∈ Z | ist obere Schranke von M }
q
5. DIE REELLEN ZAHLEN
63
ist somit nicht-leer. Zu einem x ∈ M bestimme nun s ∈ Z mit s ≤ qx < s + 1 (analog zu Aufgabe
4a) auf Übungsblatt 6). Dieses s ist untere Schranke von Aq ⊂ Z. Jede nach unten beschränkte
nicht-leere Teilmenge von Z hat ein Minimum. 16 Somit existiert
pq := min Aq ∈ Z.
p −1
p
Dann ist also aq := qq ∈ Q eine obere Schranke von M , wohingegen qq keine obere Schranke
von M ist, d.h. es gibt ein xq ∈ M mit aq − (1/q) < xq . Es folgt für alle q, i ∈ N: aq − (1/q) ≤ ai
und dies wiederum besagt |aq − ai | ≤ max{1/q, 1/i}. Deswegen ist (ai )i∈N eine Cauchy-Folge, die
auf Grund der Annahme gegen ein a ∈ K konvergiert. Man sieht leicht, dass der Grenzwert von
oberen Schranken wieder eine obere Schranke ist. Ebenso sind alle ai − (1/i) keine obere Schranke,
und da K archimedisch ist, gibt es keine kleinere obere Schranke von M . Mit anderen Worten: a
ist die kleinste obere Schranke von M , also a = sup M .
2
Mehr zu Äquivalenzrelationen. Wir besprechen hier Äquivalenzrelationen noch etwas detailierter als zuvor. Derartige Sachverhalte wurden bereits in der Linearen Algebra I im Detail
behandelt. Wir wiederholen sie in der Zentralübung am 26.11.2013, u.a. um sicherzustellen, dass
auch diejenigen folgen können, die die Lineare Algebra I nicht hören.
ÜBUNG 5.37. Seit f : M −→ N eine Abbildung. Wir definieren
Rf := {(x, y) ∈ M × M | f (x) = f (y)}.
Zeigen Sie, R ist eine Äquivalenzrelation.
Sei R eine Äquivalenzrelation auf M .
Für x ∈ M definieren wir die Äquivalenzklasse von x als
[x] := {y ∈ M | xRy}.
Man sagt auch x ist ein Repräsentant von [x] oder x repräsentiert [x].
ÜBUNG 5.38. Zeigen Sie, dass für alle x, y ∈ M gilt:
(a)
y ∈ [x] ⇐⇒ [x] = [y]
(b)
[x] = [y]
Y
[x] ∩ [y] = ∅.
ÜBUNG 5.39. Sei Rf wie oben definiert. Bestimmen Sie die Äquivalenzklassen.
16Denn ist A solche eine Teilmenge und s eine unter Schranke dann ist {p − s | p ∈ A} ⊂ N und hat deswegen
0
nach Proposition 1.21 ein Minimum. Dann aber auch A.
64
2. ZAHLEN
Ist R eine Äquivalenzrelation auf M , so definieren wir den Quotient von M nach R als
M/R := {[x] | x ∈ M }.
Die Abbildung [ • ] : M → M/R, x 7→ [x] nennt man die kanonische Projektion.
ÜBUNG 5.40. Sei eine Abbildung F : M −→ X gegeben und R eine Äquivalenzrelation auf M .
Zeigen Sie, es gibt genau dann eine Abbildung Fb : M/R −→ X, so dass Fb ◦ [ • ] = F , falls für alle
x, y ∈ M gilt
xRy =⇒ F (x) = F (y).
b
Die Abbildung F : M/R −→ X ist daraus eindeutig bestimmt.
M
F
X
[•]
Fb
M/R
Gilt sogar
xRy ⇐⇒ F (x) = F (y),
dann wissen wir noch zusätzlich, dass Fb injektiv ist.
Beispiel: Sei f : M −→ N , Rf wie oben. Dann gibt es eine eindeutige Abbildung fb : M/Rf −→ N ,
so dass
f
M
N
[•]
fb
M/Rf
kommutiert. Außerdem ist fb injektiv. Wir erhalten eine bijektive Abbildung fb : M/Rf −→ B(f ).
29.11.
5.5. Existenz und Eindeutigkeit der reellen Zahlen. Wir wollen zeigen, dass es mindestens ein Modell der reellen Zahlen gibt (Existenzaussage), und dass je zwei Modelle (kanonisch)
isomorph sind (Eindeutigkeitsaussage). Wie so oft in der Mathematik ist es am besten mit der
Eindeutigkeitsaussage anzufangen, denn der Beweis der Eindeutigkeit liefert entscheidende Ideen für den Beweis der Existenz. Die verwendete Technik heißt Vervollständigung und ist in leicht
veränderter Form für viele Anwendungen der Mathematik (partielle Differentialgleichungen, Quantenmechanik, Allgemeine Relativitätstheorie,. . . ) sehr wichtig.
5. DIE REELLEN ZAHLEN
65
Sei CF die Menge aller Q-wertigen Cauchy-Folgen.
Angenommen (R, +, ·, ≤) sei ein Modell der reellen Zahlen, d.h. (R, +, ·, ≤) ist ein geordneter
Körper mit Supremumseigenschaft. Wir betrachten wieder die injektive Abbildung iQ : Q −→ R,
die Addition, Multiplikation und die Ordnung erhält, siehe Lemma 4.7. Für (ai )i∈N ∈ CF ist dann
(iQ (ai ))i∈N eine Cauchy-Folge in R. Da R die Supremumseigenschaft hat, existiert f ((ai )i∈N ) :=
limi→∞ iQ (ai ). Wir erhalten eine Abbildung f : CF −→ R.
Nun definieren wir eine Addition und Multiplikation auf CF :
+ : CF × CF → CF
(ai )i∈N + (bi )i∈N := (ai + bi )i∈N
·:
(ai )i∈N · (bi )i∈N := (ai · bi )i∈N
CF × CF → CF
Man sieht leicht, dass (CF, +, ·) ein kommutativer Ring mit Eins ist. Hierbei ist (0)i∈N das neutrale Element der Addition und (1)i∈N das neutrale Element der Multiplikation. Es ist aber kein
Körper, denn die Cauchy-Folge (0, 1, 1, 1, . . .) besitzt kein multiplikatives Inverses. Außerdem besagt Übung 5.21, dass f Addition und Multiplikation erhält.
Die Abbildung f ist nicht injektiv. Es gilt:
f ((ai )i∈N ) = f ((bi )i∈N )
⇐⇒
(ai − bi )i∈N ist eine Nullfolge.
Definition 5.41. Für (ai )i∈N , (bi )i∈N ∈ CF definieren wir die Relation ∼⊂ CF × CF durch
(ai )i∈N ∼ (bi )i∈N
⇐⇒
(ai − bi )i∈N ist eine Nullfolge.
Auf R := CF/ ∼ definieren wir Addition und Multiplikation wie folgt:
+: R×R→R
[(ai )i∈N ] + [(bi )i∈N ] := [(ai + bi )i∈N ]
·:
[(ai )i∈N ] · [(bi )i∈N ] := [(ai · bi )i∈N ]
R×R→R
Die Ordnung definieren wir wie folgt:
[(ai )i∈N ] > [(bi )i∈N ]
:⇐⇒
∃ ∈ Q>0 : für fast alle i ∈ N gilt ai ≥ bi + .
Man kann sich überlegen, dass hierdurch eine totale Ordnung auf R definiert wird.
PROPOSITION 5.42. Die Addition und Multiplikation auf R sind wohldefiniert 17 und (R, +, ·, ≤)
ist ein geordneter Körper. Die Abbildung [ • ] : CF −→ R, (aj )j∈N 7→ [(aj )j∈N ] bewahrt die Addition, die Multiplikation und sendet die Eins von CF auf die Eins von R. (Man nennt dies einen
Homomorphismus von Ringen mit Eins.)
Beweisskizze. Der Beweis ist nun einfach, nur die Existenz eines multiplikativen Inversen ist etwas
trickreich. Das Null-Element ist [(0)i∈N ] =: 0.
17 Wohldefiniert“ bedeutet hier: die Definition hängt nur von der Äquivalenzklasse ab und nicht von der Wahl
”
des Repräsentanten. Da wir ja eine Abbildung definieren wollen, die einer Äquivalenzklasse etwas zurodnet, ist diese
Eigenschaft das, was wir zeiugen müssen, um zu sehen, dass diese Definitionen von + und · sinnvolle Definitionen
sind.
66
2. ZAHLEN
Sei [(bi )i∈N ] 6= 0. Dann ist (bi )i∈N keine Nullfolge. Das heißt:
∃ ∈ Q>0 : ∀i0 ∈ N : ∃i ∈ {i0 , i0 + 1, . . .} : |bi | ≥ Wir
18
zeigen zunächst, dass {i ∈ N | bi = 0} endlich ist.
19
Angenommen {i ∈ N | bi = 0} wäre unendlich groß, dann gibt es eine injektive Funktion f : N −→
N mit ∀n ∈ N : bf (n) = 0. Dies bedeutet, dass (bi )i∈N eine Cauchy-Folge mit einer konvergenten
Teilfolge ist. Wenn wir nun Lemma 5.30 anwenden, folgt daraus, dass (bi )i∈N eine Nullfolge ist. Das
heißt wir erhalten den Widerspruch [(bi )i∈N ] = 0. Wir haben somit gesehen, dass {i ∈ N | bi = 0}
endlich ist.
Nun definieren wir
(
bi
b̃i :=
1
falls bi 6= 0
falls bi = 0
Für fast alle i ∈ N gilt bi = b̃i , und somit bekommen wir auch [(bi )i∈N ] = [(b̃i )i∈N ]. Auf die Folge
(b̃i )i∈N können wir nun Proposition 5.23 (4) anwenden. Wir sehen, dass
(
(bi )−1 falls bi 6= 0
1
=
ci :=
1
falls bi = 0
b̃i
eine Cauchy-Folge ist.
Es gilt dann für fast alle i ∈ N: ci · bi = 1, und deswegen gilt
[(ci )i∈N ] · [(bi )i∈N ] = [(ci )i∈N ] · [(b̃i )i∈N ] = [(1)i∈N ].
2
Man beachte: die obige Definition, die obige Proposition und der Beweis benötigen die Existenz
eines Modells nicht.
Beweis der Eindeutigkeit bis auf Isomorphie. Nehmen wir also wieder wie oben an, dass ein
Modell (R, +, ·, ≤) existiert. Dann gibt es genau eine Abbildung F : R −→ R, so dass das folgende
Diagramm kommutiert20
f
CF
[•]
R
F
R
18Beweis ab hier etwas anders als in der Vorlesung auf Grund einer Nachfrage
19Die leere Menge ist auch endlich, ist also hier nicht ausgeschlossen.
20 kommutiert“ bedeutet hier F ◦ [ • ] = f .
”
5. DIE REELLEN ZAHLEN
67
Alle Abbildungen hier erhalten Addition und Multiplikation und bilden die Eins auf die Eins ab.
Außerdem ist F injektiv und erhält die Ordnung. Da R archimedisch geordnet ist, erhalten wir aus
Aufgabe 4d) von Übungsblatt 6, dass f : CF −→ R und somit F : CF −→ R surjektiv ist. Also
ist F : CF −→ R ein Isomorphismus von geordneten Körpern und Proposition 5.8 folgt im Fall
R1 = R. Wenn nun (R1 , +, · ≤) und (R2 , +, · ≤) zwei Modelle der reellen Zahlen sind, so erhalten
wir Isomorphismen F1 : R −→ R1 und F2 : R −→ R2 . Dann ist auch F2 ◦ F1−1 : R1 −→ R2 ein
Isomorphismus und Proposition 5.8 ist für alle R1 gezeigt.
2
Wie bereits in Lemma 4.7 gesehen, gibt es nun eine injektive Abbildung iQ : Q −→ R, die Addition,
Multiplikation und die Ordnung erhält. Es gilt hier iQ (a) = [(a)i∈N ], d.h. die rationalen Zahlen
werden von konstanten Cauchy-Folgen repräsentiert.
Beweis Existenz. Wir zeigen, dass (R, +, ·, ≤) archimedisch und vollständig ist. Dann haben wir
also ein Modell, d.h. Proposition 5.7 ist gezeigt.
Zur archimedischen Eigenschaft: Sei ein Element x ∈ R gegeben. Zu zeigen ist: es gibt ein n ∈ N
mit x ≤ iN (n). Es gibt nun eine Q-wertige Cauchy-Folge (ai )i∈N mit x = [(ai )i∈N ]. Die CauchyFolge ist beschränkt, d.h. es gibt ein r ∈ Q mit ∀i ∈ N : |ai | ≤ r. Da Q archimedisch ist, gibt es
ein n ∈ N mit r ≤ n. Man zeigt dann leicht, dass
x = [(ai )i∈N ] ≤ [(n)i∈N ] = iN (n).
Zur Vollständigkeit: Sei (xi )i∈N eine R-wertige Cauchy-Folge. Falls es ai ∈ Q gibt mit xi = iQ (ai ) =
(ai )n∈N ,21 dann (ai )i∈N ∈ CF und es gilt dann
lim xi = [(ai )i∈N ].
i∈N
Der allgemeine Fall ist ein bisschen aufwändiger und soll nur skizziert werden. Wir schreiben
xi = [(ai,n )n∈N ].
Man nutzt nun die Tatsache, dass sowohl (xi )i∈N eine Cauchy-Folge in R ist als auch dass für alle
i ∈ N die Folge (ai,n )n∈N eine Cauchy-Folge in Q ist, und konstruiert damit eine streng monoton
wachsende Abbildung f : N −→ N,22 so dass wiederum (ai,f (i) )i∈N eine Cauchy-Folge ist. Man
nennt solch eine Folge eine Diagonalfolge. Außerdem kann man nun
lim xi = [(ai,f (i) )i∈N ]
i∈N
zeigen.
Ab jetzt identifizieren wir Q mit seinem Bild in R vermöge iQ .
21Hier ist kein Druckfehler. Gemeint ist die konstante Folge, die konstant a ist.
i
22Hier steckt etwas Konstruktionsarbeit, die wir (momentan) überspringen.
2
68
2. ZAHLEN
5.6. Mehr zu R und R-wertigen Folgen. Im folgenden bezeichne R immer ein Modell
der reellen Zahlen, das heißt einen angeordneten Körper, der die Supremumseigenschaft erfüllt.
Dies kann das oben konstruierte R sein, aber jedes andere Modell der reellen Zahlen wäre völlig
gleichwertig für unsere Zwecke.
Zusammenfassung: Sei (ai )i∈N eine R-wertige Folge.
(ai )i∈N konvergiert in R
⇐⇒
ai ∈Q
(ai )i∈N Cauchy-Folge in R
⇐⇒
(ai )i∈N Cauchy-Folge in Q
⇐=
(ai )i∈N konvergiert in R und lim ai ∈ Q
⇐⇒
(ai )i∈N konvergiert in Q
i→∞
23
Außerdem ist Q dicht in R:
4.12.
Zu jeder reellen Zahl x gibt es eine Q-wertige Folge (ai )i∈N mit limi→∞ ai = x.
Definition 5.43. (M, ≤) ist partiell geordnete Menge :⇐⇒ M ist eine Menge und ≤ ist eine
partielle Ordnung auf M . x <M y ⇐⇒ x ≤M y ∧ x 6= y.
Seien (M, ≤M ) und (N, ≤N ) partiell geordnete Mengen. Eine Abbildung f : M → N ist
• monoton wachsend :⇐⇒ f erhält die Ordnung
:⇐⇒ ∀x, y ∈ M : x ≤M y =⇒ f (x) ≤N f (y) ,
• streng monoton wachsend :⇐⇒ ∀x, y ∈ M : x <M y =⇒ f (x)<N f (y) ,
• monoton fallend :⇐⇒ ∀x, y ∈ M : x ≤M y =⇒ f (y) ≤N f (x) ,
• streng monoton fallend :⇐⇒ ∀x, y ∈ M : x <M y =⇒ f (y) <N f (x) ,
• monoton :⇐⇒ f ist monoton wachsend oder monoton fallend,
• streng monoton :⇐⇒ f ist streng monoton wachsend oder streng monoton fallend.
Monoton wachsende (bzw. fallende) Folgen (ai )i∈N haben a1 als Minimum (bzw. Maximum), sind
also immer nach unten (bzw. oben) beschränkt.
Beispiele 5.44.
(1) R −→ R, x 7→ x3 ist streng monoton wachsend,
(2) (n)n∈N und (1 − n1 )n∈N sind streng monoton wachsende Folgen.
(3) (b n2 c)n∈N ist monoton wachsend, aber nicht streng monoton.
23Bei der dritten bis fünften Zeile wird hier immer ∀i ∈ N : a ∈ Q vorausgesetzt, siehe Vorlesung. Es ist mir
i
derzeit nicht klar, wie ich dies mit vertretbarem Aufwand ähnlich mit latex umsetzen kann.
5. DIE REELLEN ZAHLEN
69
(4) Ist (M, ≤M ) total geordnet, (N, ≤N ) partiell geordnet und ist f : M −→ N streng monoton,
dann ist f : M −→ N injektiv. Denn seien x, y ∈ M . Es gilt x <M y, x = y oder x >M y. Falls
f streng monoton wachsend ist und falls x <M y, dann folgt f (x) <N f (y), also f (x) 6= f (y).
Die anderen Fälle sind analog.
PROPOSITION 5.45. Beschränkte monotone R-wertige Folgen konvergieren (in R).
24
Beweis. Sei (ai )i∈N eine beschränkte monotone Folge, oBdA monoton wachsend, ai ∈ R. Definieren
A := {ai | i ∈ N}, a := sup A. Zu jedem ∈ R>0 gibt es ein i0 ∈ N mit ai0 > a − , denn sonst
wäre a − eine obere Schranke von A.
Also gilt für alle i ∈ {i0 , i0 + 1, . . .}: a − < ai ≤ a. Daraus ergibt sich |a − ai | ≤ . Wir erhalten
a = limi→∞ ai .
2
Nach unseren bisherigen Definition besitzen zum Beispiel die folgenden Teilmenge von R weder
Supremum noch Infimum: ∅, Z, Q, R, . . ..
Notation 5.46. Wir definieren sup ∅ := −∞, inf ∅ := ∞. Und sup M := ∞, falls M nicht nach
oben beschränkt. Und inf M := −∞, falls M nicht nach unten beschränkt.
Fortsetzung der Ordnung auf R := R ∪ {−∞, +∞}.
∀x ∈ R : −∞ ≤ x ≤ ∞.
Man nennt R die erweiterten reellen Zahlen.
Intervalle 25: Seien a, b ∈ R, a ≤ b
(a; b) := {x ∈ R | a < x < b}
[a; b) := {x ∈ R | a ≤ x < b}
(a; b] := {x ∈ R | a < x ≤ b}
[a; b] := {x ∈ R | a ≤ x ≤ b}
offenes Intervall
halboffenes Intervall
halboffenes Intervall
abgeschlossenes Intervall
Definition 5.47. Sei (ai )i∈N eine R-wertige Folge.
(1) Wir definieren den Limes inferior als
lim inf ai := sup{x ∈ R | Für fast alle i ∈ N: x ≤ ai } ∈ R.
i→∞
24Nochmal um klarzustellen, was hier in R“ bedeutet: Wenn wir sagen, eine K-wertige Folge (a )
i i∈N konvergiert
”
(Definition 5.14), dann geht hier der Körper K an zwei Stellen ein: 1.) bei den möglichen , 2.) bei den möglichen
Grenzwerten. In Bemerkung 5.15 (c) haben wir aber gesehen, dass man für archimedische Körper die möglichen
∈ K>0 auch durch 1/n, n ∈ N ersetzen kann. Ist also a ∈ Q, dann konvergiert (ai )i∈N genau dann in Q gegen a,
wenn sie in R gegen a konvergiert. Wenn aber eine Folge (in R) gegen a ∈ R r Q konvergiert, dann konvergiert sie
nicht in Q. In Q ist es dann eine nicht-konvergente Cauchy-Folge.
25An Stelle von (0; 1] schreibt man in Schulen oft ]0, 1]. Dies ist in der Mathematik in den Universitäten
weniger üblich, da eine Klammer ] am Ende eines einzuklammernden Ausdrucks stehen sollte. In den meisten
Büchern schreibt man deswegen (0, 1]. Wir wählen hier die Notation von [19], da man somit das Paar (0, 1) ∈ R2
vom Intervall (0; 1) ⊂ R klar unterscheiden kann.
70
2. ZAHLEN
(2) Der Limes superior 26 ist
lim sup ai := − lim inf (−ai ) = inf{x ∈ R | Für fast alle i ∈ N: x ≥ ai } ∈ R.
i→∞
i→∞
Beispiel 5.48. lim inf i→∞ (−1)i = −1, lim supi→∞ (−1)i = 1
LEMMA 5.49.
lim inf ai ≤ lim sup ai
i→∞
i→∞
Beweis. Angenommen lim inf i→∞ ai > lim supi→∞ ai . Dann gibt es z1 , z2 ∈ R mit lim inf i→∞ ai >
z1 > z2 > lim supi→∞ ai Dann gibt es nur endlich viele i ∈ N mit z1 > ai und nur endlich viele
i ∈ N mit z2 < ai , also nur endlich vielen Elemente in N. Ein Widerspruch!
2
LEMMA 5.50.
trivial
lim inf ai > −∞ ⇐⇒ inf{ai | i ∈ N} > −∞ ⇐⇒ (ai )i∈N ist nach unten beschränkt.
i→∞
trivial
lim sup ai < ∞ ⇐⇒ sup{ai | i ∈ N} < ∞ ⇐⇒ (ai )i∈N ist nach oben beschränkt.
i→∞
Beweis. Zu den ersten ⇐⇒-Pfeilen. Eine obere (bzw. untere) Schranke bleibt eine Schranke, wenn
endlich viele Elemente aus der Folge gestrichen werden. Also ist ⇐=“ klar.
”
Nun betrachten wir die Richtung =⇒“: Sei o.B.d.A. lim inf i→∞ ai > −∞. Dies bedeutet, dass ein
”
x in R existiert, so dass für fast alle i ∈ N: x ≤ ai . Wähle ein i0 ∈ N, so dass ∀i ∈ {i0 , i0 + 1, . . .} :
x ≤ ai . Setze
r := min{x, a1 , a2 , . . . , ai0 }.
Dann ist r eine untere Schranke.
2
Definition 5.51. Sei (ai )i∈N eine R-wertige Folge, a ∈ R. Wir sagen a ist ein Häufungspunkt der
Folge (ai )i∈N , falls eine Teilfolge existiert, die gegen a konvergiert.
SATZ 5.52. Sei (ai )i∈N eine R-wertige Folge.
(1) Gilt b := lim inf ai ∈ R, dann ist b ein Häufungspunkt von (ai )i∈N .
i→∞
(2) Gilt b := lim sup ai ∈ R, dann ist b ein Häufungspunkt von (ai )i∈N .
i→∞
(3) Ist b ein Häufungspunkt der Folge (ai )i∈N gilt
lim inf ai ≤ b ≤ lim sup ai .
i→∞
i→∞
(4) Gilt b := lim inf ai = lim sup ai ∈ R, dann konvergiert (ai )i∈N gegen b.
i→∞
i→∞
26Der Limes superior wird in der Vorlesung Mathematische Methoden“ (für Bachelor Physik) als oberen limes
limi→∞ ai bezeichnet.
”
5. DIE REELLEN ZAHLEN
71
Beweis.
Zu (1): Definiere
M := {x ∈ R | Für fast alle i ∈ N: x ≤ ai },
b := lim inf ai = sup M.
i→∞
Aus b ∈ R folgt dass M nicht-leer und nach oben beschränkt ist. Völlig analog zum Beweis von
Satz 5.33 (1) =⇒ (2) erhalten wir eine Teilfolge (af (n) )n∈N mit b = limn→∞ af (n) .
Zu (2): Analog.
Zu (3): Angenommen (af (i) )i∈N ist eine Teilfolge mit b = limn∈N af (n) . Zu gegebener Zahl ∈ R>0
gilt: es gibt ein n0 ∈ N, so dass für alle n ∈ {n0 , n0 + 1, . . .}: af (n) ≤ b + < b + 2. Für alle y ∈ R>b
besitzt also die Menge
{n ∈ N | y ≤ af (n) }
nur endlich viele Elemente. Somit hat also
{n ∈ N | y > af (n) }
27
unendlich
viele Elemente. Da f injektiv ist, haben auch {f (n) ∈ N | y > af (n) } und somit
{i ∈ N | y > ai } unendlich viele Elemente. Wir haben für die in (1) definierte Menge M also
R>b ∩ M = ∅, b ist also obere Schranke von M und somit b ≥ lim inf i→∞ ai . Die Behauptung
b ≤ lim supi→∞ ai zeigt man ganz analog.
Zu (4): Sei ∈ R>0 gegeben. Wegen b − < lim inf i→∞ ai ist b − ∈ M für das obige M . Also
gilt für fast alle i ∈ N: b − ≤ ai . Analog bekommen wir aus b + > lim supi→∞ ai , dass für fast
alle i ∈ N: b + ≥ ai . Da beide Ungleichungen mit höchstens endlich vielen Ausnahmen gelten,
erhalten wir für fast alle i ∈ N: |b − ai | ≤ . Dies ist gerade die Definition von limi→∞ ai = b. 2
Aus dem Satz folgt unmittelbar:
KOROLLAR 5.53 (Satz von Bolzano-Weierstraß). Jede beschränkte reell-wertige Folge besitzt eine
(in R) konvergente Teilfolge.
In anderen Worten: Jede beschränkte reell-wertige Folge besitzt einen Häufungspunkt in R.
Uneigentliche Konvergenz.
Definition 5.54. Sei (an )n∈N eine reell-wertige Folge. Wir sagen
(an )n∈N konvergiert gegen unendlich
:⇐⇒
an → ∞ für n → ∞
:⇐⇒
lim inf an = ∞
⇐⇒
∀x ∈ R : ∃n0 ∈ N : ∀n ∈ {n0 , n0 + 1, . . .} : x ≤ ai
n→∞
27Zur Erinnerung bzw. Klärung. Man definiert: Eine Menge hat unendlich viele Elemente, wenn sie nicht endlich
viele Elemente besitzt.
6.12.
72
2. ZAHLEN
Man sagt, (an )n∈N konvergiert gegen −∞, wenn (−an )n∈N gegen +∞ konvergiert. Dies ist also
äquivalent zu lim supn→N an = −∞. Konvergenz gegen ∞ und −∞ nennt man uneigentliche Konvergenz .28 Wir sagen, dass ∞ (bzw. −∞) ein Häufungspunkt von (an )n∈N ist, falls eine Teilfolge
gegen ∞ (bzw. −∞) konvergiert.
Beispiel 5.55. Sei k ∈ Q>0 . Dann gilt:
lim nk = ∞.
n→N
!ACHTUNG!. Wenn wir sagen: die reell-wertige Folge konvergiert, dann ist hier immer die Konvergenz im eigentlichen Sinne gemeint, d.h. gegen eine reelle Zahl. Uneigentlich konvergente Folgen
sind somit immer divergent. 29 Wenn wir a = limn→N an schreiben, so bedeutet dies ab jetzt:
• der Grenzwert existiert im eigentlichen oder uneigentlichen Sinn,
• der Grenzwert ist a ∈ R.
Wir definieren nun die Abbildung ϕ : [−1; 1] −→ R,

1
1

 1−x − 1+x für x ∈ (−1; 1)
ϕ(x) = ∞
für x = 1


−∞
für x = −1
Diese Abbildung ist streng monoton und bijektiv. Sei ψ := ϕ−1 : R −→ [−1; 1].
PROPOSITION 5.56. Sei (an )n∈N eine R-wertige Folge. Es gilt für alle a ∈ R:
a = lim an
⇐⇒
ψ(a) = lim ψ(an )
a Häufungspunkt von (an )n∈N
⇐⇒
ψ(a) Häufungspunkt von (ψ(an ))n∈N
n→∞
n→∞
ψ(lim inf an )
=
lim inf ψ(an )
ψ(lim sup an )
=
lim sup ψ(an )
n→∞
n→∞
n→∞
n→∞
BILD
In wenigen Wochen haben wir die starke Hilfsmittel, um diese Proposition ganz einfach zu zeigen.
Der Beweis wird deswegen hier ausgelassen.
Es ergeben sich nun aus der Proposition eine Reihe von Aussagen, die zu den obigen Aussagen
analog sind.
SATZ 5.57. [Analog zu Satz 5.52] Sei (ai )i∈N eine R-wertige Folge.
28In manchen Büchern, z.B. [12] wird der Begriff
uneigentliche Konvergenz“ durch bestimmte Divergenz“
”
”
ersetzt.
29Aber wir haben schon gesehen, dass es divergente Folgen gibt, die nicht uneigentlich konvergieren, z.B.
((−1)n )n∈N .
6. DIE KOMPLEXEN ZAHLEN
73
(1) lim inf ai und lim sup ai sind Häufungspunkte von (ai )i∈N in R.
i→∞
i→∞
(2) Ist b ∈ R ein Häufungspunkt der Folge (ai )i∈N , dann
lim inf ai ≤ b ≤ lim sup ai .
i→∞
i→∞
(3) Gilt b := lim inf ai = lim sup ai ∈ R, dann konvergiert (ai )i∈N gegen b.
i→∞
i→∞
KOROLLAR 5.58. Jede reell-wertige Folge besitzt einen Häufungspunkt in R.
6. Die komplexen Zahlen
Motivation. x2 = −1 besitzt keine reelle Lösung.
Idee: Erweitere die reelle Zahlengerade zu einer Ebene, der Gaußschen Zahlenebene. Die Elemente
dieser Ebene sind komplexe Zahlen.
Ein Modell für die komplexen Zahlen.
Definition 6.1. Auf C := R2 definieren wir die folgenden Verknüpfungen:
Addition: + : C × C −→
((x1 , y1 ), (x2 , y2 ))
7→
Multiplikation: · : C × C −→
((x1 , y1 ), (x2 , y2 ))
7→
C
(x1 , y1 ) + (x2 , y2 ) := (x1 + x2 , y1 + y2 )
C
(x1 , y1 ) · (x2 , y2 ) := (x1 x2 − y1 y2 , x1 y2 + x2 y1 )
Die Abbildung iR : R ,→ C, a 7→ (a, 0) ist injektiv und erhält Addition und Multiplikation. Wir
identifizieren a mit (a, 0). Wir schreiben i := (0, 1). Dann gilt für x, y ∈ R:
x + iy = (x, 0) + (0, 1) · (y, 0) = (x, 0) + (0, y) = (x, y).
Man nennt dann x den Realteil von z = x + iy und y den Imaginärteil , geschrieben x = Re z und
y = Im z.
C = {x + iy | x, y ∈ R}.
2
Wir haben i = (0 − 1) + (0 + 0)i = −1.
Komplexe Zahlen z = x + iy, x, y ∈ R heißen
• imaginär , falls y = Im z 6= 0,
• rein imaginär , falls x = Re z = 0 und y = Im z 6= 0.
LEMMA 6.2. (C, +, ·) ist ein Körper.
74
2. ZAHLEN
Beweis. Assoziativität und Kommutativität von Addition und Multiplikation ist einfach nachzurechnen: (Aa), (Ak),(Ma), (Mk). Ebenso das Distributivgesetz (AMd). Das neutrale Element der
Addition (bzw. Multiplikation) ist 0 = 0 + i0, (bzw. 1 = 1 + i0), (An) bzw. (Mn). Das additive
Inverse von x + iy ist (−x) + i(−y), (Ai).
(Mi): Gegeben sei z := x + iy ∈ C r {0}. Es folgt dann x 6= 0 ∨ y 6= 0 und somit x2 + y 2 ∈ R>0 .
Wir benötigen ein multiplikatives Inverses von z, also ein w ∈ C mit wz = 1. Wir zeigen: Es gibt
genau ein solches w ∈ C.30
Zur Eindeutigkeit: Angenommen wz = 1 mit z = x + iy und w = a + ib. Multipliziere beide Seiten
mit x − iy:
(x − iy) = (a + ib)(x + iy)(x − iy) = (a + ib)(x2 + y 2 ) = a(x2 + y 2 ) + ib(x2 + y 2 ).
Hieraus folgt x = a(x2 + y 2 ) und y = b(x2 + y 2 ), also
x
(6.3)
,
a =
x2 + y 2
y
b =
(6.4)
.
x2 + y 2
Zur Existenz: Wir a und b wie in (6.3). Die Definition ergibt Sinn, da x2 + y 2 > 0.
2
11.12.
Für x, y ∈ R definieren wir
x + iy := x − iy.
Wir erhalten eine R-lineare bijektive Abbildung C −→ C, z 7→ z, die komplexe Konjugation genannt
wird.
Die Abbildung
C −→ R,
x + iy 7→ |x + iy| :=
q
p
x2 + y 2 = (x + iy)(x + iy)
heißt die Betragsfunktion der komplexen Zahlen.
Eigenschaften: Seien z, z1 , z2 ∈ C.
z1 ± z2 = z1 ± z2
z1 · z2 = z1 · z2
z1 /z2 = z1 /z2
|z1 + z2 | ≤ |z1 | + |z2 |
|z1 z2 | = |z1 | · |z2 |
Es gelten auch die anderen in Lemma 4.11 aufgezählten Eigenschaften mit Ausnahme von (d), den
man wie folgt abändern muss
|a2 | = |a|2 = aa ≥ 0.
30man muss eigentlich hier gar nicht die Eindeutigkeit zeigen, die Existenz reicht aus. Wenn man sich aber die
eindeutigkeit anschaut, bekommt man eine Idee, wie man die Existenz zeigen kann.
6. DIE KOMPLEXEN ZAHLEN
75
Es gibt keine Ordnung auf C, die aus C einen geordneten Körper macht. Denn in einem geordneten
Körper ist jede von Null verschiedene Quadratzahl positiv.
Veranschaulichung von C.
31
BILDER
Schreibe z1 , z2 , z3 in Polar-Darstellung
zn = rn (cos ϕn + i sin ϕn ),
rn ∈ R>0 ,
ϕn ∈ R.
rn := |zn |; ϕn = arg(zn ), falls ϕn ∈ [0; 2π).
Dann ist z3 = z1 · z2 äquivalent zu
r3 = r1 · r2
und
ϕ3 − (ϕ2 + ϕ1 )
∈Z
2π
(Beweis: kommendes Übungsblatt)
Polynome.
Definition 6.5. Sei K ein Körper mit unendlich vielen Elementen,32 z.B. K = Q, R oder C. Ein
Polynom mit Koeffizienten in K ist eine Abbildung33
P : K −→ K,
P (z) := an z n + an−1 z n−1 + · · · + a0
mit n ∈ N, a0 , . . . , an ∈ K. Wenn n minimal gewählt wird und wenn P 6= 0, dann gilt an 6= 0.
Dieses minimale n nennt man den Grad deg(P ) des Polynoms P , siehe auch Beispiel 4.9 (c). Man
nennt dann an den Leitkoeffizient. Polynome, deren Leitkoeffizient 1 ist, nennt man normierte
Polynome. Weiter definiert man deg(0) := −∞. Das Polynom X ist definiert durch X(z) := z. Die
Menge aller Polynome nennen wir K[X].
31Die logische Stellung dieser Veranschaulichung hat zu einer Verunsicherung und Nachfragen geführt, die hier
beantwortet werden sollen: um eine geometrische Vorstellung zu entwickeln, wie man komplexe Zahlen multipliziert,
wurde hier die Polar-Darstellung eingeführt, obwohl wir eigentlich zum jetzigen Zeitpunkt noch gar nicht wissen, was
sin und cos bedeuten. Die Übungsaufgabe (Aufgabe 1 auf Blatt 9), die mit dieser Veranschaulichung verbunden ist,
nutzt die Additionstheoreme für Sinus und Cosinus, die wir ebenfalls als noch nicht bewiesen anzusehen haben. Für
einen exakten und streng logischen Aufbau ist diese Veranschaulichung und die oben genannte Aufgabe deswegen
am besten hier zu streichen und erst dann zu behandeln, wer wir all dies eingeführt haben. Da es aber mindestens
genauso wichtig ist, dass Sie möglichst bald eine gute Vorstellung von den komplexen Zahlen entwickeln, ist es
dennoch richtig hier und nicht später diese Veranschaulichung zu behandeln.
32Die Bedingung, dass K unendlich viele Element besitzen sollte, wird erst in der Linearen Algebra II oder
Algebra deutlich werden.
33Diese Defintion wird in der LAII oder Algebra etwas modifiziert werden müssen. Man nennt dann das, was
wir hier Polynom definiert haben eine polynomiale Funktion“. Über unendlichen Körper, als inbesondere wenn die
”
Koeffizienten in Q, R oder C liegen, stimmt die algebraische Defnition im wesentlichen mit der unserigen überein.
76
2. ZAHLEN
Zu P, Q ∈ K[X] definiert man
(P + Q)(z)
:= P (z) + Q(z)
(P · Q)(z)
:= P (z) · Q(z)
(P ◦ Q)(z)
:= P (Q(z))
z ∈ K heißt Nullstelle von P , falls P (z) = 0.
THEOREM 6.6 (Fundamentalsatz der Algebra). Sei P ∈ C[X] von Grad n ≥ 1. Dann besitzt P
mindestens eine Nullstelle.
Mindestens einen Beweis dieses Theorems lernen wir in der Analyis III kennen.
KOROLLAR 6.7. Zu jedem Polynom P ∈ C[X] von Grad n ≥ 1 gibt es komplexe Zahlen b1 , . . . , bn
mit
∀z ∈ C : P (z) = an (z − b1 )(z − b2 ) · · · (z − bn ).
Die Lösungsmenge der komplexen Zahlen z, die P (z) = 0 erfüllen, ist somit
{bj | j ∈ {1, . . . , n}}
und hat deswegen höchstens n Elemente und mindestens 1 Element.
Beweis. Man zeigt zuerst die Zerlegung P (z) = an (z − b1 )(z − b2 ) · · · (z − bn ) durch Induktion
über n.
Induktionsanfang.
Ist P ein Polynom von Grad 1, dann gilt P (z) = a1 z + a0 mit a1 6= 0. Daraus ergibt sich
a0
P (z) = a1 z +
,
a1
also die Aussage mit b1 = −a0 /a1 .
Induktionsschritt.
Sei n ≥ 2 gegeben, und ein Polynom P von Grad n. Das Korollar gelte für n − 1. Nach dem
Fundamentalsatz der Algebra gibt es eine Nullstelle bn von P . Wir dividieren P (z) durch (z − bn ):
P (z) = Q(z)(z − bn ) + R(z),
wobei Q ein Polynom von Grad n − 1 ist und R ein Polynom ist, das den Divisionsrest angibt.
Nun gilt deg(R) < deg(z − bn ) = 1, also deg(R) = 0 oder R = 0. Da offensichtlich R(bn ) = 0, folgt
R = 0. Die Polynome Q und P haben denselben Leitkoeffizient, den wir a nennen. Wir wenden
nun die Induktionsvoraussetzung auf Q an und schreiben:
Q(z) = a(z − b1 ) · · · (z − bn−1 ),
woraus wir
P (z) = a(z − b1 ) · · · (z − bn )
erhalten.
6. DIE KOMPLEXEN ZAHLEN
77
Nun rechnet man leicht P (bj ) für alle j ∈ {1, . . . , n} nach. Umgekehrt, sieht man für z 6∈ {bj | j ∈
{1, . . . , n}} leicht, dass P (z) als Produkt von nicht-verschwindenden34 Faktoren ebenfalls nichtverschwindet.
2
Folgen.
Obwohl C nicht geordnet werden kann, können viele Definition und Aussagen für R-wertige Folgen
direkt auf C-wertige Folgen übernommen werden, z.B. Definition 5.14 (Konvergenz von Folgen),
Nullfolgen, konstante Folgen, Bemerkung 5.15. Eine C-wertige Folge (an )n∈N ist beschränkt, falls
{|an | | n ∈ N} eine nach oben beschränkte Teilmenge von R ist. Definition 5.22 (Cauchy-Folge)
und ihre Eigenschaften in Proposition 5.23. Häufungspunkt.
Es gilt
(an )n∈N ist konvergiert in C
⇐⇒
(an )n∈N ist Cauchy-Folge in C
⇐⇒
(Re an )n∈N und (Im an )n∈N konvergieren in C
Uneigentliche Konvergenz ist (ohne Modifikationen) nicht auf C übertragbar, ebenso nicht: inf,
sup, lim inf, lim sup, Intervalle.
SATZ 6.8 (Satz von Bolzano-Weierstraß in C). Jede beschränkte C-wertige Folge besitzt eine (in C)
konvergente Teilfolge.
Beweis. Sei (an )n∈N eine beschränkte Folge, an ∈ C. Dann sind auch (Re an )n∈N und (Im an )n∈N
beschränkt. Es gibt somit eine streng monotone Abbildung f1 : N −→ N, so dass (Re af1 (n) )n∈N
konvergiert. Da auch (Im af1 (n) )n∈N beschränkt ist, gibt es eine streng monotone Abbildung
f2 : N −→ N, so dass auch (Im af1 ◦f2 (n) )n∈N konvergiert. Wir folgern, dass (af1 ◦f2 (n) )n∈N in
C konvergiert.
2
34 nicht-verschwindend“ ist eine noblere Form für ungleich 0“
”
”
KAPITEL 3
Reihen und Funktionen
1. Motivation von Reihen: Dezimal-Darstellung reeller Zahlen
Notationen.
Kürzerer Sprachgebrauch: Eine Folge in K ist eine K-wertige Folge.
Ist I eine endliche Menge, und f : {1, 2, . . . , k} −→ I bijektiv so defineren wir für eine Familie
(ai )i∈I von Zahlen, Vektoren, oder sonstigen Elementen einer kommutativen Gruppe:
X
k
X
an :=
af (m) .
m=1
n∈I
˙ 2 , dann folgt
Falls I = I1 ∪U
X
an =
n∈I
X
X an +
an .
n∈I1
n∈I2
Eine Dezimal-Darstellung einer positiven reellen Zahl x ist eine Z-indizierte Familie (an )n∈Z von
Ziffern an ∈ {0, 1, . . . , 9}, so dass für fast alle n ∈ N gilt: an = 0. Außerdem soll gelten
X
x=
10n · an .
n∈Z
Nun sind mehrere Punkte ungeklärt:
• Was ist solch eine unendliche Summe? Die großen (positiven)
n sind kein Problem, da
P
an = 0 für genügend große n. Die Frage ist, wie man n∈Z<0 10n · an interpretieren soll.
1
1Wir werden diese Frage im folgenden nicht vollständig beantworten. Dazu müssten wir noch summierbare
Familien wie in [19, Abschnitt 6.3] einführen, was wir aus Zeitgründen nicht tun wollen. Wir wollen deswegen diesen
Ausdruck so definieren:
∞
X
X
10n · an :=
10−m · a−m .
n∈Z<0
m=1
Die rechte Seite dieser definierenden Gleichung ist dann ab Abschnitt 2.1 sauber definiert.
79
80
3. REIHEN UND FUNKTIONEN
• Hängt solch eine unendliche Summe von der Reihenfolge ab?
• Hat jede positive reelle Zahl eine Dezimal-Darstellung?
• Wenn ja, ist sie eindeutig?
Sobald dies geklärt ist, kann man schreiben“
”
x = a` a`−1 . . . a0 , a−1 a−2 . . .
wobei ` := max({n ∈ N | an 6= 0} ∪ {0}).
Beispiele 1.1.
(1)
1
= 0, 142857142857 . . . = 0, 142857
7
1
= 0, 076923
13
1
= 0, 0588235294117647
17
1
= 0, 03571428
28
3, 14159265 . . .
(2) Die Dezimal-Darstellung ist periodisch, genau dann wenn die dadurch beschriebene zugehörige reelle Zahl eine rationalen Zahl ist.
Problem: Man kann im allgemeinen nicht alle Ziffern hinschreiben, da es ja unendlich viele sind.
ÜBUNG 1.2. Gegeben sei die Dezimal-Darstellung (an )n∈Z einer positiven rationalen Zahl pq ,
p, q ∈ N teilerfremd. Wir zerlegen
q = 2a 5b q1c1 · · · qrcr
wobeiQq1 , . . . , qr verschiedene Primzahlen sind, a, b, c1 , . . . , cr ∈ N. Dann teilt die Periodenlänge die
r
Zahl i=1 (qi − 1)qici −1 . Die Zahl der Ziffern zwischen dem Komma und dem Beginn der Periode
ist max{a, b}.
Der Beweis ist Inhalt des Schulwissens. Tipp: Einen Beweis erhält man eigentlich schon, wenn man
sich genau anschaut, wie man in der 4. Klasse das Dividieren lernt. Wenn man es nicht gleicht
sieht oder es formaler machen will, sind Kongruenzen hilfreich. Ein Web-Link hierzu ist auch
http://m.schuelerlexikon.de/mobile mathematik/Endliche und periodische Dezimalbrueche.htm
Im aktuellen Abschnitt wollen wir nun solche unendlichen Summen einführen. Man benutzt aber
das Wort Reihe“ an Stelle des Wortes Unendliche Summe“.
”
”
LEMMA 1.3. (a) Jede Dezimal-Darstellung beschreibt“ eine reelle Zahl.
”
(b) Jede positive reelle Zahl besitzt eine Dezimal-Darstellung.
(c) Die Dezimal-Darstellung ist nicht eindeutig. Sind (an )n∈Z und (bn )n∈Z verschiedene DezimalDarstellung derselben Zahl, so gilt (für fast alle m ∈ N: a−m = 9) oder (für fast alle m ∈ N:
b−m = 9). Also hat eine der beiden Zahlen hat eine Periode 9.
2. REIHEN
81
Zu (a): Im nächsten Abschnitt wird klar werden, was hier mit beschreibt“ gemeint ist, nämlich
”
der Grenzwert einer konvergenten Reihe. Die Aussage wird auch im nächsten Abschnitt gezeigt.
Zu (b) und (c): Dies sollte nach dem nächsten Abschnitt jeder als Übungsaufgabe beweisen können.
Tipp zu (b): Zunächst mal überlegt man sich zu einer gegebenen reellen Zahl x, wie eine Dezimaldarstellung aussehen muss, wenn sie existiert. Danach überlegt man sich, dass diese Darstellung
tatsächlich die gegebene Zahl x beschreibt. Man muss hier u.a. die Supremums-Eigenschaft von R
nutzen.
Beispiele 1.4.
(1) 0, 9 und 1, 0 sind Dezimal-Darstellungen von 1
(2) Jede positive reelle Zahle hat also eine eindeutige Periode-9-freie Dezimal-Darstellung.
13.12.
PROPOSITION 1.5. Es gibt keine surjektive Abbildung von N nach R.
Beweis. Angenommen es gibt eine surjektive Abbildung f : N −→ R.
Für k ∈ N schreiben f (k) als Dezimalzahl
f (k) = ±ak`k . . . ak0 , ak−1 ak−2 . . .
O.B.d.A. können wir annehmen, dass j(k) keine Periode 9 hat. Wir definieren h : {0, 1, . . . , 9} −→
{0, 1, . . . , 9} durch
(
1 für m = 2
h(m) :=
2 für m 6= 2
Also h(m) 6∈ {m, 9, 0}. Für k ∈ N setze nun b−k := h(ak−k ), und dann
x := 0, b−1 b−2 b−3 . . .
Nun ist x 6= f (k), den die beiden reellen Zahlen haben in ihrer Periode-9-freien Darstellung eine
verschiedene Ziffer an der (−k)-ten Stelle. Also gilt x ∈
6 B(f ). Somit ist f gar nicht surjektiv,
entgegen der Annahme.
2
2. Reihen
2.1. Definition und elementare Eigenschaften. Ziel: Definiere
P∞
i=1
ai
Alle Folgen in diesem Abschnitt sind Folgen in R oder in C, also R-wertige oder C-wertige Folgen.
Beachte im folgenden: eine Folge (an )n∈N ist genau dann eine Nullfolge, wenn (|an |)n∈N eine Nullfolge ist.
82
3. REIHEN UND FUNKTIONEN
Definition 2.1. Sei (aj )j∈N eine Folge. Unter der (unendlichen) Reihe
∞
X
j=1
aj = lim
n→∞
n
X
P∞
j=1
aj versteht man
aj ,
j=1
| {z }
sn :=
falls der
P∞Grenzwert existiert. Man nennt sn die n-te Partialsumme oder die n-te Teilsumme. Man
sagt j=1 aj konvergiert bzw. divergiert, falls limn→∞ sn konvergiert bzw. divergiert. Bei reellwertigen Folgen definiert man analog die uneigentliche Konvergenz.
P∞
!ACHTUNG!.
j=1 aj hat zwei Bedeutungen:
P∞
1.) die Folge der Partialsummen. Dann ist j=1 aj ∈ Abb(N, C)
P∞
2.) der Limes dieser Folge (falls er existiert). Dann ist j=1 aj ∈ C
WelchePBedeutung gemeint ist, wird immer aus dem Kontext heraus deutlich. Wenn man sagt: die
∞
Reihe j=1 aj konvergiert oder divergiert, dann ist immer die Folge der Partialsummen gemeint.
P∞
Wenn man 5 = j=1 aj schreibt, dann ist der Limes der Folge der Partialsummen gemeint (und es
ist dann implizit klar, dass wir fordern, dass dieser dann existieren muss). Um diesen Unterschied
deutlicher zu machen, schreiben wir in den nächsten Zeilen aus didaktischen Gründen
1.) die Folge der Partialsummen immer in dieser Farbe
2.) den Limes dieser Folge immer in dieser Farbe
∞
X
aj konvergent
j=1
⇐⇒
n
X
∃s ∈ R oder s ∈ C : ∀ ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : |(
aj ) − s| ≤ j=1
⇐⇒
∀ ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀m ∈ N≥n : |
m
X
aj | ≤ (Cauchy-Kriterium)
j=n+1
2
Jede Folge kann realisiert werden als Partialsummenfolge. Denn sei (sn )n∈N gegeben. Definiere
dann a1 := s1 und für n ≥ 2: an = sn − sn−1 . Dann ist sn die n-te Partialsumme von (an )n∈N .
P∞
1
Beispiele 2.2. (a) Konvergente geometrische Reihe: r=0 z r = 1−z
für |z| < 1.
Denn wir rechnen:
(z 0 + z 1 + z 2 + · · · + z n )(1 − z) = 1 − z n+1 ,
|
{z
}
sn
Nun ist (z
n+1
)n∈N0 eine Nullfolge, da (|z|n+1 )n∈N0 ebenfalls eine Nullfolge ist.
2Hier gilt die Konvention Pn
j=n+1 aj = 0
2. REIHEN
83
P∞
(b) Divergente geometrische Reihe: r=0 z r divergiert für |z| ≥ 1: siehe unten (Prop. 2.3) und
beachte, dass (z r )r∈N keine
P∞Nullfolge ist.
(c) Die harmonische Reihe r=1 1r divergiert: USW
(d)
P∞
1
r=1 r 2
konvergiert: USW
PROPOSITION 2.3. Wenn
P∞
j=1
aj konvergiert, dann ist (aj )j∈N eine Nullfolge.
Die Umkehrung dieser Aussage ist falsch: Die Reihe
P∞
1
r=1 r
divergiert, aber ( 1r )r∈N ist Nullfolge.
EIGENSCHAFTEN 2.4.
P∞
P∞
(a) Wenn j=1 aj und j=1 bj konvergieren, dann gilt
∞
X
j=1
(aj ± bj ) =
∞
X
j=1
aj ±
∞
X
bj .
j=1
(b) In einer konvergenten Reihe dürfen Klammern gesetzt werden (Übergang zu einer Teilfolge der
Partialsummen). Man darf im allgemeinen Klammern nicht weglassen:
1 − 1 + 1 − 1 + 1 · · · divergiert, aber (1 − 1) + (1 − 1) + (1 − 1) · · · konvergiert gegen 0 und
1 + (−1 + 1) + (−1 + 1) · · · konvergiert gegen 1.
(c) Es gelte für alle rP∈ N: ar ∈ R ∧ ar ≥ 0. Dann ist (sn )n∈N monoton wachsend. Also ist nach
∞
Proposition 5.45 r=1 ar genau dann konvergent, wenn (sn )n∈N beschränkt ist.
2.2. Konvergenzkriterien.
PROPOSITION 2.5 (Majoranten-Kriterium). Sei (ar )r∈N eine Folge
(br )r∈N eine
P∞ in R oder C und P
∞
Folge in R≥0 , so dass für fast alle r ∈ N: |ar | ≤ br . Konvergiert r=1 br , dann auch r=1 ar .
Man nennt in diesem Fall
P∞
r=1 br
eine konvergente Majorante.
Beweis. Für alle ∈ R>0 existiert n0 ∈ N so dass für alle n ∈ N≥n0 :
|an+1 + · · · + am | ≤ |an+1 | + · · · + |am | ≤ bn+1 + · · · + bm ≤ 2
84
3. REIHEN UND FUNKTIONEN
18.12.
P∞
P∞
Das Majoranten-Kriterium
P∞ liefert sofort: Divergiert r=1 ar , so divergiert auch r=1 br . In diesem
Pn Fall gilt dann: r=1 br = ∞ (uneigentliche Konvergenz), da die Folge der Partialsummen
( r=1 br )r∈N monoton wachsend ist.
P∞ 1
P∞ 1
Beispiele 2.6. (a)
r=1 r k konvergiert für k ≥ 2, dennP r=1 r 2 ist eine konvergente Majorante.
P∞ 1
∞ 1
√
(b)
r=1 r divergiert, denn es ist eine Majorante von
r=1 r .
P∞
P
P
∞
∞
1
1
1
(c)
r=1 r! konvergiert, weil
r=2 (r−1)2 =
k=1 k2 eine konvergente Majorante ist.
P∞
PROPOSITION 2.7 (Quotienten-Kriterium). Sei j=1 aj eine Reihe in R oder in C, so dass für
fast alle j ∈ N: aj 6= 0.
P∞
a (a) Gilt lim supj→∞ aj+1
< 1 dann konvergiert j=1 aj .
j
P∞
a (b) Gilt lim inf j→∞ aj+1
> 1, dann divergiert j=1 aj .
j
LEMMA 2.8. Sei (bj )j∈N eine Folge in R.
(i) lim inf j→∞ bj > 1 genau dann, wenn es ein q ∈ R , q > 1, gibt, so dass für fast alle j ∈ N:
bj ≥ q.
(ii) lim supj→∞ bj < 1 genau dann, wenn es ein q ∈ R, q < 1 gibt, so dass für fast alle j ∈ N:
bj ≤ q.
Beweis des Lemmas. Zu (i):
M := {x ∈ R | Für fast alle n ∈ N: bn ≥ x}.
α := sup M ∈ (1; ∞]
Für q ∈ (1; α) folgt:
1 < q ∈ M.
Hieraus folgt die Aussage =⇒“ für den Limes inferior.
”
Wenn es ein q ∈ R, q > 1 wie auf der rechten Seite gibt, dann ist auch jeder Häufungspunkt von
(bj )j∈N mindestens q und damit lim inf j→∞ bj ≥ q > 1.
Zu (ii) Die Aussagen für den Limes superior zeigt man ganz analog.
2
Beweis der Proposition. Zu (a): Es gelte für ein j0 ∈ N und q < 1:
aj+1 <1
∀j ∈ N≥j0 : aj 6= 0 und ∀j ∈ N≥j0 : aj n−j0
n−j0
Dann zeigt man durch Induktion
|aj0 |)n∈N eine
P∞ für n ∈ N≥j0 : |an | ≤Pq∞ |aj0 |. Somit ist (q
konvergente Majorante von j=1 aj und deswegen ist j=1 aj konvergent.
2. REIHEN
85
Zu (b): Man geht ähnlich vor wie oben und erhält |an | ≥ q n−j0 |aj0 | für q > 1. Daraus P
folgt, dass
∞
(|an |)n∈N keine Nullfolge ist, damit auch nicht (an )n∈N und somit divergiert die Reihe n=1 an .
2
Beispiel 2.9. Sei t ∈ Q, x ∈ C.
3
Betrachte die Reihe
P∞
n=1
an für an = nt xn .
t
an+1
n+1
=
·x
an
n
an+1 = |x|
lim n→∞ an Also ist
P∞
n=1
nt xn konvergent für |x| < 1; und
P∞
n=1
nt xn ist divergent für |x| > 1.
PROPOSITION 2.10 (Wurzel-Kriterium). Sei (ar )r∈N eine Folge.
p
P∞
(a) Wenn lim supr→∞ r |ar | < 1, dann
konvergiert
a .
r=1
p
P∞r
r
1, dann ist r=1 ar divergent.
(b) Gilt für unendlich viele
p r ∈ N: |ar | ≥P
∞
(c) Wenn lim supr→∞ r |ar | > 1, dann ist r=1 ar divergent.
Beweis. Zu (a): Unter Benutzung des Lemmas gilt für ein geeignetes q und fast alle r ∈ N
p
r
|ar | ≤ q < 1.
P
P∞
∞
r
r
Also |ar | ≤ q . Also ist r=1 q eine konvergente Majorante von r=1 ar .
p
|ar | ≥ 1. Gilt dies für unendlich viele r, dann ist (ar )r∈N keine
Zu (b): r |ar | ≥ 1 P ⇐⇒
∞
Nullfolge, also kann r=1 ar nicht konvergent sein.
p
p
Zu (c): Im Fall lim supr→∞ r |ar | > 1 gibt es eine Teilfolge (af (n) )n∈N so dass limn→∞ n |af (n) | =
p
p
lim supr→∞ r |ar | > 1. Es gilt dann n |af (n) | > 1 für fast alle n ∈ N. Also gibt es unendlich viele
r ∈ N mit |ar | > 1.
2
Beispiele 2.11. Eine Reihe der Form
(a) Sei x ≥ 0 und ar ≥ 0
P∞
r=0
ar xr nennt man eine Potenzreihe in x.
4
∞
X
lim sup
r→∞
√
r
ar xr
r=0
ar xr = x lim sup
√
r
ar
r→∞
3Wir beschränken uns hier auf rationale t, da wir bisher für eine reelle Zahl n genau dann nt bereits definiert
√
haben, wenn t rational ist: nämlich im Fall von t = p/q, p ∈ Z, q ∈ N als nt := q np .
4Wdh: Für x ∈ C definieren wir x ≥ 0 als: x ∈ R und x ≥ 0. Es ist hier im Text also implizit die Information
enthalten, dass x ∈ R und ar ∈ R.
86
3. REIHEN UND FUNKTIONEN
lim sup
√
r
a r xr = ∞
=⇒
r→∞
0 < lim sup
∀x ∈ R>0 :
∞
X
ar xr divergiert
r=0
√
r

a r xr < ∞
r→∞
lim sup
√
r
ar xr = 0
r→∞

∞
X
1
:
=⇒ ∀x ∈ 0;
ar xr konvergiert
√
lim sup r ar
r=0
r→∞


∞
X
1
:
;
∞
∀x ∈ 
ar xr divergiert
√
lim sup r ar
r=0
=⇒
r→∞
∞
X
∀x ∈ R≥0 :
ar xr konvergiert
r=0
BILD
Wir definieren

1


√


sup r ar

 lim
r→∞
ρ := 0





∞
falls lim sup
r→∞
falls lim sup
√
r
ar = ∞
√
r
ar = 0
r→∞
P∞
ar xr konvergiert für x < ρ und divergiert für x > ρ.
ρ heißt Konvergenzradius der Potenzreihe.
(b) Sei nun x ∈ C und ai ∈ C. Wir definieren dann
r=0
ρ :=
20.12.

1

p


r

lim
sup
|ar |

 r→∞
0




∞
falls lim sup
p
r
|ar | = ∞
p
r
|ar | = 0
r→∞
falls lim sup
r→∞
P∞
Dann konvergiert r=0 ar xr im Fall |x| < ρ und divergiert im Fall |x| > ρ.
Die Begründung kann man völlig analog zu Beispiel (a) führen, wenn man |x| an Stelle
von x und |ar | an Stelle von ar schreibt. Alternativ kann die Konvergenz auch aus (a) mit
dem Majoranten-Kriterium gezeigt werden.
P∞
P∞
(c) Für |x| = ρ kann keine Aussage getroffen werden. Die Potenzreihen r=0 rxr und r=1 r12 xr
√
√
√
r
besitzen beide Konvergenzradius 1, denn lim r r = 1 und lim r−2 = ( lim r r)−2 = 1.
r→∞
r→∞
r→∞
2. REIHEN
87
P∞
r
(Details hier5) Nun ist für x ∈ C, |x| = 1 die Reihe r=0
für x ∈ C, |x| = 1 offensichtlich
Prx
∞
divergent. Wir haben gesehen, dass für x = 1 die Reihe r=1 r12 xr konvergiert (Beispiel (2.2)
(d)), und auf Grund des Majoranten-Kriteriums konvergiert diese Reihe dann für alle x ∈ C
mit |x| = 1.
LEMMA 2.12. Sei ar ∈ C r {0}. Dann gilt
lim sup
p
n
|an | ≤ lim sup
n→∞
n→∞
|an+1 |
.
|an |
6
Beweis. Sei α := lim supn→∞
superior) für fast alle n ∈ N:
|an+1 |
|an | .
Fixiere ein β > α. Es gilt also (nach Definition des Limes
|an+1 |
≤ β.
|an |
(2.13)
Bestimme also ein n0 ∈ N, so dass für alle n ∈ N≥n0 die Ungleichung (2.13) gilt.
|an | ≤ β n−n0 |an0 |
p
p p
n
|an | ≤ n β n n β −n0 |an0 |
| {z } |
{z
}
β=
→1
Daraus folgt also
lim sup
p
n
|an | ≤ β.
n→∞
2
Da dies für alle β > α gilt, folgt die Aussage.
Bemerkung 2.14. Das Wurzel-Kriterium ist also stärker als das Quotienten-Kriterium, denn es
zeigt dieselbe Aussage mit einer schwächeren Voraussetzung.
2.3. Absolute Konvergenz.
Definition 2.15
P∞ (Absolute Konvergenz). Seien ar ∈ C. Wir sagen die Reihe
absolut, falls r=1 |ar | konvergiert.
P∞
r=1
ar konvergiert
√
5Wir wollen zeigen, dass lim √
r
r = 1. Hierzu ist zu zeigen, dass xr := r r − 1 eine Nullfolge ist. Man rechnet
r→∞
nun mit der binomischen Formel nach, dass (xr + 1)r ≥
| {z }
r=
r(r−1) 2
xr .
2
Also 0 ≤ x2r ≤ 2/(r − 1).
6Die Aussage wurde als Übungsaufgabe auf Blatt 8, Aufgabe 2 gezeigt und wird deswegen in der Vorlesung
übersprungen.
88
3. REIHEN UND FUNKTIONEN
Das Majoranten-Kriterium für br := |ar | impliziert also: Jede absolut konvergente Reihe ist konvergent.
Majoranten-Kriterium, Quotienten-Kriterium und Wurzel-Kriterium liefern nicht nur die Konvergenz einer Reihe,
sogar ihre absolute Konvergenz, siehe unten.7 Insbesondere ist eine
P∞ sondern
n
Potenzreihe n=1 an x absolut konvergent, wenn |x| kleiner als der Konvergenzradius ist.
8
PROPOSITION 2.16 (Majoranten-Kriterium mit absoluter Konvergenz). Sei (ar )r∈N
P∞eine Folge
undP(br )r∈N eine Folge in R≥0 , so dass für fast alle r ∈ N: |ar | ≤ br . Konvergiert r=1 br , dann
∞
ist r=1 ar absolut konvergent.
P∞
PROPOSITION 2.17 (Quotienten-Kriterium mit absoluter Konvergenz). Sei j=1 aj eine Reihe,
so dass für fast alle j ∈ N: aj 6= 0.
P∞
a (a) Gilt lim supj→∞ aj+1
< 1, dann konvergiert j=1 aj absolut.
j
(b) wie zuvor.
PROPOSITION 2.18 (Wurzel-Kriterium mit absoluter Konvergenz). Sei (ar )r∈N eine Folge.
p
P∞
(a) Wenn lim supr→∞ r |ar | < 1, dann konvergiert r=1 ar absolut.
(b) und (c) wie zuvor.
Definition 2.19. Eine alternierende Reihe ist eine Reihe in der Form
∞
X
(−1)n an
n=1
oder9
∞
X
(−1)n+1 an ,
n=1
wobei ∀n ∈ N : an ∈ R≥0 .
2.4. Alternierende Reihen.
PROPOSITION 2.20 (Regel von Leibniz). Sei (an )n∈N eine monoton fallende Nullfolge, an ≥ 0.
Dann konvergiert die Reihe
∞
X
(−1)n an .
n=1
7Die Beweise sind wortwörtlich gleich
8Wenn wir nichts anderes hinschreiben, ist unter einer Folge immer eine Folge in C gemeint, und eine Folge in
R ist auch eine Folge in C.
9Wir betrachten ab jetzt immer nur den ersten Fall, um die Notation einfach zu halten
2. REIHEN
89
Beweis. Gegeben seien natürliche Zahlen m, n, n0 mit m ≥ n ≥ n0 .
Idee (noch nicht präzise):
Um das Cauchy-Kriterium anzuwenden, wollen wir
(−1)n+1 an+1 + (−1)n+2 an+2 + · · · + (−1)m am
kontrollieren.
Präzise Ausführung der Idee:
an+1 + (−1)an+2 + · · · + (−1)m−n+1 am

(a
−a
) + · · · + (am−1 − am ) ≥ 0


| n+1 {z n+2}
|
{z
}

≥0
=
=
Also
|
m
X
≥0

(an+1 − an+2 ) + · · · + am ≥ 0


|{z}
{z
}
|
≥0
falls m − n gerade
falls m − n ungerade
≥0
an+1 + (−1)an+2 + · · · + (−1)m−n+1 am

≤0
≤0

z
}|
{
z }| {




an+1 + ((−1)an+2 + an+3 ) + · · · + (−1)am



≤ an+1
falls m − n gerade
≤0
≤0



}|
{
z
}|
{
z



((−1)a
)
+
a
)
+
·
·
·
+
((−1)a
+
a
)
a
+

n+2
n+3
m−1
m
n+1


≤ an+1
falls m − n ungerade
(−1)k ak | = |(−1)n+1 an+1 + (−1)n+2 an+2 + · · · + (−1)m am | ≤ |an+1 |.
k=n+1
Da (an ) eine Nullfolge ist, haben wir gezeigt:
∀ ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀m ∈ N≥n : |
m
X
(−1)k ak | ≤ .
k=n+1
2
Beispiele 2.21.
(a) Die harmonische alternierende Reihe
∞
X
(−1)n
n=1
konvergiert.
1
n
90
3. REIHEN UND FUNKTIONEN
(b) Die Reihe
P∞
n
n=1 (−1) an
mit
(
an :=
1
n
1
n2
für n gerade
für n ungerade
divergiert. Denn sei
α :=
∞
X
1
.
(2k + 1)2
k=0
(Anschaulich ist α die unendliche Summe der an über alle ungeraden n.)
Dann gilt
2r
r
X
X
1
an ≥ (
)−α
2r
n=1
k=1
und dies konvergiert uneigentlich gegen ∞ für r → ∞, da die harmonische Reihe konvergiert.
2.5. Umordnung von Reihen.
P∞
Definition
2.22. Sei n=1 an eine Reihe. Ein Umordnung dieser Reihe ist eine Reihe der Form
P∞
n=1 af (n) , wobei f : N −→ N eine Bijektion ist.
P∞
SATZ 2.23 (Umordnungssatz).
Ist n=1 an eine absolut konvergente Reihe in R oder C, so ist
P∞
jede Umordnung n=1 af (n) dieser Reihe ebenfalls absolut konvergent und es gilt
∞
X
n=1
an =
∞
X
af (n) .
n=1
Beweis später.
SATZ 2.24 (Riemannsche Umordnungssatz). Ist
absolut konvergiert.
P∞
n=1
an eine konvergente Reihe in R, die nicht
(1) Sei α ∈ R gegeben. Dann gibt es eine Umordnung dieser Reihe, die gegen α eigentlich oder
uneigentlich konvergiert.
(2) Es gibt eine Umordnung, die beschränkt und divergent ist.
Beispiel: die Folge
P∞
n1
n=1 (−1) n
ist konvergent, aber nicht absolut konvergent.
Beweis. Wir beweisen (1) im Fall α ∈ R. Die anderen Fälle und Ausage (2) beweist man ähnlich,
wir geben hierfür aus Zeitgründen aber keine Details.
P∞
Zu (1) für α ∈ R: Sei n=1 an eine konvergente Reihe, die nicht absolut konvergiert. Wir definieren
I+ := {n ∈ N | an ≥ 0}
und
I− := {n ∈ N | an < 0}.
Angenommen I+ oder I− wären endlich, dann wäre die Reihe abolut konvergent. Widerspruch.
2. REIHEN
91
Somit existieren streng monotone Abbildungen f± : N → N, mit B(f± ) = I± . Wdh: B(f+ ) ist das
Bild von f+ .
P∞
P∞
n=1 af+ (n) ist die (Teil-)Reihe der nicht-negativen Glieder, und
n=1 af− (n) die (Teil-)Reihe der
negativen Glieder. Für jede dieser Teilreihen gilt
beschränkt ⇐⇒ konvergent ⇐⇒ absolut konvergent.
P∞
Wenn genau eine dieser beiden Teilreihen nicht beschränkt, dann ist n=1 an nicht beschränkt,
also nicht konvergent. Widerspruch.
P∞
Wenn beide Teilreihen beschränkt sind, dann ist n=1 an absolut konvergent. Widerspruch.
Also sind beide Teilreihen unbeschränkt. Wir setzen nun bn := af+ (n) , cn := af− (n) .
Zwischen-Ergebnis:
lim
`→∞
`
X
bn = ∞
lim
`
X
`→∞
n=1
cn = −∞.
n=1
8.1.
Bestimme nun das kleinste r1 ∈ N mit
b1 + b2 + · · · + br 1 ≥ α
Bestimme nun das kleinste s1 ∈ N mit
b1 + b2 + · · · + br1 + c1 + c2 · · · + cs1 < α
Dann gilt b1 + b2 + · · · + br1 + c1 + c2 · · · + cs1 −1 ≥ α.
10
Hieraus folgt |α − (b1 + · · · + cs1 )| ≤ |cs1 |
Bestimme nun das kleinste r2 ∈ N>r1 mit
b1 + b2 + · · · + br1 + c1 + c2 · · · + cs1 + br1 +1 + br1 +2 + · · · + br2 ≥ α
Wir erhalten |α − (b1 + · · · + br2 )| ≤ br2 . Wir machen so weiter11 und erhalten letztendlich eine
Reihe
∞
X
dn := b1 + · · · + br1 + c1 · · · + cs1 + br1 +1 + · · · + br2 + cs1 +1 + · · · + cs2 + · · · .
n=1
Diese Reihe hat die Eigenschaft: Für alle i ∈ N gibt es ein `0 ∈ N, so dass für alle ` ∈ N≥`0
α + csi ≤
`
X
dn ≤ α + bsi .
n=1
10Im Fall s = 1 ist dies zu lesen als b + b + · · · + b ≥ α.
r1
1
1
2
11Genau genommen werden nun alle r und s rekursiv definiert und alle Aussagen dann rekursiv gezeigt
i
i
92
3. REIHEN UND FUNKTIONEN
Da nun (bn )n∈N und (cn )n∈N Nullfolgen sind, sind auch deren Teilfolgen (bri )i∈N und (csi )i∈N
Nullfolgen und deswegen gilt
α = lim (α + csi ) = lim
i→∞
`
X
`→∞
|
dn = lim (α + bsi ).
i→∞
n=1
{z
∞
P
}
dn
n=1
2
P∞
Beweis von Satz 2.23. Sei n=1 an absolut konvergent. Dies bedeutet nach dem Cauchy-Kriterium:
Zu jedem ∈ R>0 gibt es ein n0 ∈ N so dass für alle n, ñ ∈ N mit n0 ≤ n ≤ ñ gilt12 :
Pñ
j=n+1 |aj | ≤ .
P∞
Wir fixieren nun und ein passendes n0 . Sei nun n=1 af (n) eine Umordnung dieser Reihe. Insbesondere sei f : N → N als bijektiv vorausgesetzt. Wir setzen nun
m0 := max f # ({1, 2, . . . , n0 }) := max{f −1 (1), f −1 (2), . . . , f −1 (n0 )}.
BILD
Dies bedeutet, für alle ` > m0 gilt f (`) > n0 . Somit gilt für m, m̃ ∈ N mit m0 ≤ m < m̃:
m̃
X
N
X
|af (`) | ≤
`=m+1
|aj | ≤ j=n0 +1
wobei N ∈ N eine “genügend große” natürliche Zahl ist, zum Beispiel
(2.25)
N := max f# ({m + 1, m + 2, . . . , m̃}) = max{f (m + 1), f (m + 2), . . . , f (m̃)} > n0
oder jede ZahlP
die mindestens so groß wie dieses Maximum
P∞ ist. Dann ist also das Cauchy-Kriterium
∞
für die Reihe n=1 |af (n) | erfüllt, in anderen Worten n=1 af (n) ist absolut konvergent.
Wir wissen
dass die Reihen (absolut) konvergieren, und wir studieren nun deren GrenzP∞ nun also,P
∞
werte n=1 an und n=1 af (n) . Wir wählen zu ∈ R>0 passende Zahlen n0 und m0 wie oben.
Außerdem definieren wir
N0 := max{f (1), f (2), . . . , f (m0 )} = f# ({1, 2, . . . , m0 }).
Für alle n, ñ ∈ N mit n0 ≤ n ≤ ñ gilt
(2.26)
|
ñ
X
j=1
aj −
n
X
j=1
aj | = |
ñ
X
j=n+1
aj | ≤
ñ
X
|aj | ≤ j=n+1
12Ja, die Betragsstriche sind hier um den richtigen Ausdruck, denn es handelt sich um absolute Konvergenz!
2. REIHEN
93
und dies impliziert im Limes ñ → ∞ für n := N0 (≥ n0 )
|
∞
X
aj −
j=1
N0
X
aj | ≤ .
j=1
Wenn wir N wie in (2.25) definieren ergibt sich analog:
|
m̃
X
af (`) −
`=1
m0
X
af (`) | = |
`=1
m̃
X
N
X
af (`) | ≤
|aj | ≤ j=n0 +1
`=m0 +1
und somit im Limes m̃ → ∞
m0
∞
X
X
|
af (`) −
af (`) | ≤ .
`=1
`=1
Außerdem
N
X
aj −
j=1
m0
X
af (`)
=
X
aj
j∈I
`=1
wobei I := {1, 2, . . . , N } r f# ({1, 2, . . . , m0 }). Nach Konstruktion von m0 sind I und {1, 2, . . . , n0 }
disjunkt13. Es folgt mit (2.26)
|
X
aj | ≤
j∈I
X
j∈I
|aj | ≤
N
X
|aj | ≤ .
j=n0 +1
Dies ergibt
X
X
X
X
m0
∞
N
∞
X
X
X
X
m0
N
∞
∞
a
a
−
a
a
−
+
+
a
a
−
a
≤
a
−
≤ 3
j
j
j
j
f
(`)
f
(`)
f
(`)
f
(`)
j=1
j=1
j=1
j=1
`=1
`=1
`=1
`=1
{z
}
{z
} |
{z
} |
|
≤
≤
≤
Da diese Aussage für alle ∈ R>0 gilt, sind die Grenzwerte gleich.
2
Es gibt nun viele Variationen des Umordnungssatzes. Eine davon liegt der nun folgende Multiplikation von Reihen zu Grunde. Wenn man diese (verallgemeinerten) Umordnungen systematischer
verstehen will, sollte man sich mit summierbaren Familien und dem Großen Umordnungssatz (z. B.
[19, Abschnitt 6.3]) beschäftigen. Wir überspringen aber aus Zeitgründen diesen Aspekt und konzentrieren uns auf die für uns wichtige Multiplikation.
13Denn sei j ∈ I ∩ f ({1, 2, . . . , m }), dann ist f −1 (j) > m und somit j = f (f −1 (j)) > n .
0
0
0
#
94
3. REIHEN UND FUNKTIONEN
Multiplikation von Reihen.
P∞
P∞
Definition 2.27. Seien n=1 an und n=1 bP
N × N, n 7→
n Reihen in R oder in C. Wenn N →P
∞
∞
(k
,
`
)
bijektiv
ist,
so
nennen
wir
die
Reihe
a
b
eine
Produktreihe
von
n=1 kn `n
n=1 an und
Pn∞ n
b
.
n=1 n
Beispiele 2.28.
(a) Anordnung nach Quadraten
(b) Anordnung nach Diagonalen
BILD FÜR BEIDE FÄLLE
P∞
P∞
SATZ 2.29
Sind n=1 an und n=1 bn absolut konvergent, so ist jede ProduktP(Produktreihen).
P
∞
∞
reihe von n=1 an und n=1 bn absolut konvergent und hat den Grenzwert
! ∞ !
∞
X
X
an
bn
n=1
n=1
Beweis.
1.) pn := akn b`n , rn := max{k1 , . . . , kn }, tn := max{`1 , . . . , `n } Dann gilt für alle n ∈ N



rn
tn
X
X
|p1 | + |p2 | + · · · + |pn | ≤ 
|aj | 
|bj |
j=1
j=1



∞
∞
X
X
|bj |
|aj | 
≤ 
j=1
j=1
P∞
Somit sind die Partialsummen der Reihe n=1 |pn | beschränkt, sie bilden also eine beschränkte
monoton wachsende Folge, die somit konvergiert.
Wir haben somit gesehen, dass alle Produktreihen absolut konvergieren.
2.) Wir betrachten nun zunächst den Spezialfall, dass die Produktreihe nach Quadraten geordnet
ist.
Dann erhalten wir
p 1 + p 2 + · · · + p n2



n
n
X
X
bj  .
= 
aj  
j=1
j=1
|
{z
}|
P
→ ∞
j=1 aj
→
{z
P∞
j=1
}
bj
3. EINIGE KLASSISCHE FUNKTIONEN
95
Wir haben somit eine Teilfolge der Partialsummen, die gegen
! ∞ !
∞
X
X
an
bn
n=1
n=1
konvergiert. Da die Folge der Partialsummen konvergiert, konvergiert sie ebenfalls gegen diese Zahl.
Die Aussage für diese spezielle Anordnung ist somit gezeigt.
3.) Durch eine Umordnung im Sinne von Definition 2.22 kann man jede Produktreihe in eine
nach Quadraten angeordnete Produktreihe umformen. Deswegen ist jede Produktreihe absolut
konvergent.
2
Aus der Anordnung nach Diagonalen ergibt sich durch Klammersetzen14 das folgende:
P∞
P∞
KOROLLAR 2.30 (Satz vom Cauchy-Produkt). Sind n=0 an und n=0 bn absolut konvergent,
und setzen wir
n
X
cn :=
ak bn−k ,
k=0
dann ist auch
P∞
n=0 cn absolut konvergent und
∞
X
cn =
n=0
∞
X
n=0
!
an
∞
X
!
bn
n=0
10.1.
Anwendung auf Potenzreihen:
P∞
P∞
Seien n=0 an xn und n=0 bn xn , Potenzreihen anP
, bn ∈ C mit Konvergenzradien ρa und ρb . Sei
n
z ∈ C gegeben mit |z| <Pmin{ρa , ρb }. Wieder cn := k=0 ak bn−k . Dann ist |z| auch kleiner als der
∞
n
Konvergenzradius von n=0 cn x .
(a0 + a1 z + a2 z 2 + · · · )(b0 + b1 z + b2 z 2 + · · · )
=
(a0 b0 ) + (a0 b1 + a1 b0 ) z + (a0 b2 + a1 b1 + a2 b0 ) z 2 + · · ·
| {z } |
{z
}
|
{z
}
c0
c1
c2
Anschaulich: Man darf hier nach Potenzen in z ordnen. Alle Grenwerte existieren und es gilt
Gleichheit.
3. Einige klassische Funktionen
Sei z ∈ C. Potenzreihen definieren mehrere wichtige Funktionen:
14dies ist erlaubt, vergleiche Eigenschaften 2.4 (b)
96
3. REIHEN UND FUNKTIONEN
3.1. Exponentialfunktion.
exp z :=
∞
X
1 n
z .
n!
n=0
Diese Reihe nennt man die Exponentialreihe.
Wir bestimmen den Konvergenzradius: Wir wenden hierzu das Quotientenkriterium an
an+1 z n+1 |z|
an z n = n + 1
an+1 = lim |z| = 0 < 1
lim sup an n→∞ n + 1
n→∞
Die Exponentialreihe konvergiert also absolut für alle z ∈ C. Wir sagen sie konvergiert (absolut)
auf C. 15 Der Konvergenzradius muss dann ρ = ∞ sein, denn angenommen wir hätten ρ < ∞,
dann würde die Reihe für z := ρ + 1 divergieren, was einen Widerspruch ergibt.
Wir erhalten eine Funktion16 exp : C −→ C, z 7→ exp(z), die komplexe Exponentialfunktion.
Ist z ∈ R, so ist auch exp(z) ∈ R. Wir erhalten somit eine Funktion exp : R −→ R, x 7→ exp x, die
reelle Exponentialfunktion. 17
PROPOSITION 3.1 (Funktionalgleichung der Exponentialfunktion). Für alle x, w ∈ C gilt
exp(z + w) = exp z · exp w
Beweis. Wir rechnen:
n
n n
X
1
1 X n k n−k X
1 k
1
1
(z + w)n =
z k wn−k =
z
wn−k
z w
=
k
n!
n!
k! (n − k)!
k! (n − k)!
k=0
k=0
k=0
Wende den Satz vom Cauchy-Produkt an für
an :=
1 n
z
n!
und bn :=
1 n
w
n!
und cn :=
1
(z + w)n .
n!
2
15Das Wort absolut wird hier normalerweise weggelassen, denn wenn sie auf C konvergiert, dann folgt ja bereits,
dass sie auf C absolut konvergiert. Wieso?
16Wie gesagt: wir nutzen den Begriff Funktion“ gleichbedeutend zum Begriff Abbildung“, allerdings ist es
”
”
üblich, dass Funtionen den Zielbereich R oder C hat.
17Die Relation, die der reellen Exponentialfunktion unterliegt, erhält man durch Restriktion der Relation,
die der komplexen Exponentialfunktion unterliegt. Es handelt sich also um zwei verschiedene Relationen, die gemäß
unseren Definitionen im ersten Kapitel auch verschiedene Symbole haben sollte. Wir benutzen aber dennoch dasselbe
Symbol exp, da dies so üblich ist und in der Praxis nur selten zu Missverständnissen führt.
3. EINIGE KLASSISCHE FUNKTIONEN
Spezialfall: exp(0) :=
P∞
n=0
97
= 00 + 01 + 02 + . . . = 00 =?
Man definiert immer 00 := 1.
18
Also exp 0 = 1.
Es folgt dann auch
1 = exp 0 = exp(z − z) = (exp z)(exp(−z))
Also
exp(−z) =
1
.
exp z
Klammer- Regel“ für exp und die demnächst definierten Funktionen sin und cos.
”
Man lässt bei exp und anderen wichtigen Funktionen die sonst bei Funktionen üblichen Klammern
weg. Man schreibt also exp z und nicht exp(z). Nun stellt sich die Frage, ob bei Ausdrücken in der
Art exp ab und exp a + b zuerst exp ausgeführt wird oder zuerst verknüpft wird.
Die Antwort ist leider: das ist nicht ganz so klar geregelt. Im allgemeinen reiht man — wenn
keine Klammern stehen — aber wie folgt, wobei die oben stehenden Operationen zuerst ausgeführt
werden:
(1)
(2)
(3)
(4)
Potenzen,
Produkte,
exp, sin, cos,
Addition und Vorzeichen
Oft steht jedoch (3) vor (2) oder hinter (4). Also lieber großzügig Klammern setzen!
exp it = exp(it)
cos 2a = cos(2a)
exp a + b = (exp a) + b meistens!
sin a sin b =? Nach den obigen Regeln hätten wir dann sin(a(sin b)). Das interpretiert aber niemand
so. Solch ein Ausdruck wird immer als (sin a)(sin b) interpretiert.
Besser treffend wäre also
(1) Potenzen,
(2) Produkte mit kurzen Faktoren
18Wieso nicht 00 , denn Nullhoch irgendwas ist doch immer Null? Stimmt nicht ganz 0−1 ist ja nicht mal
definiert, das Argument zählt nicht. Ttasächlich
ist 00 eine sehr sinnvolle Definition, denn wir wollen ja, dass die
Pn
n
n
k
n−k
binomische Formel (a + b) = k=0
a b
für alle n ∈ N0 gilt. Wenn nun aber b = n = 0 ist, dann ergibt
k
P
0
dies 1 = a0 = (a + 0)0 = 0k=0
ak 0n−k = a0 00 = 1 · 00 = 00 .
k
98
3. REIHEN UND FUNKTIONEN
(3) exp, sin, cos,
(4) Produkten mit langen Faktoren
(5) Addition und Vorzeichen
Nur: was ist lang und was ist kurz? Ab wann wird exp abcdef ghijklm · · · lang?
Die Verwirrung wird noch schlimmer: Da man ja für Funktionen f : M −→ M immer definiert
f 2 (x) := f (f (x))
würde dann sin2 a als sin(sin(a)) zu lesen sein. Das macht aber auch niemand. Solch ein Ausdruck
wird immer als (sin a)2 interpretiert.
Um das Durcheinander zu beseitigen, würde nur eine von der Kultusminister-Konferenz eingesetzte
Experten-Kommission helfen, die sich zuerst mit europäischen Instanzen zusammenschließt und
nach reiflicher, mehrjähriger Diskussion eine DIN-Norm erlässt.19 Das wäre Bürokratismus pur.
Und selbst, wenn die DIN erlassen wäre, ginge es dieser Reform vielleicht nicht anders als mit der
neuen Rechtschreibung: manche Bundesländer würden sie einführen, andere ablehnen. Etc. Oder
es gibt sie und niemand kennt sie. 20
Und jedem guten Mathematiker sind solche Diskussionen sowieso lästig.
Also: da leben wir lieber mit etwas Durcheinander und setzen ein paar Klammern mehr.
3.2. Sinus- und Kosinus-Funktion. Betrachte nun (i2 = −1)
∞
∞
∞
X
X
X
1
1
1
(iz)n =
(iz)n +
(iz)n
exp iz =
n!
n!
n!
n=0
n=0
n=0
n gerade
n ungerade
21
Wir definieren den Kosinus
∞
∞
∞
X
X
X
1
1
1
1
1
cos z :=
(iz)n =
(iz)2k =
(−1)k z 2k = 1 − z 2 + z 4 − · · ·
n!
(2k)!
(2k)!
2
24
n=0
k=0
n gerade
k=0
Was ist der Konvergenzradius dieser Reihe?
1
n gerade: | n!
(iz)n | ≤
n ungerade: 0 ≤
1
n
n! |z|
1
n
n! |z|
19Gibt es vielleicht sogar?
20Vielleicht ist es sogar so?
21Hier handelt es sich rechts um zwei Reihen, wo eigentlich an den ungeraden bzw. geraden Stellen n eine Null
steht. Nullen in einer Reihen haben keinen Einfluss auf den Grenzwert einer Reihe, sieP
können beliebig hinzugefügt
P
oder gestrichen werden. Mit dieser Interpretation ist die letzte Gleichung eine Folge von n=0 (an +bn ) = n=0 an +
P
n=0 bn
3. EINIGE KLASSISCHE FUNKTIONEN
99
Nach dem Majoranten-Kriterium und der Konvergenz der Exponentialfunktion, konvergiert die
Kosinusreihe auf ganz C. Der Konvergenzradius ist also ∞.
Wir definieren den Sinus
sin z
∞
X
1
i
:=
∞
1X
1
1
(iz)n =
(iz)2k+1
n!
i
(2k + 1)!
n=0
n ungerade
∞
X
=
k=0
k=0
1
1
1 5
(−1)k z 2k+1 = z − z 3 +
z − ···
(2k + 1)!
6
120
Der Konvergenzradius ist ebenfalls ∞.
exp iz = cos z + i sin z
cos(−z) = cos z
sin(−z) = − sin z
cos z + i sin z + cos z − i sin z
exp iz + exp(−iz)
=
= cos z
2
2
exp iz − exp(−iz)
= sin z
2i
Ist x reell, dann sind auch cos x und sin x reell. Dann gilt also
cos x = Re exp ix
sin x = Im exp ix.
Man überlegt sich auch leicht, dass für jede Reihe in C gilt
∞
X
n=0
an =
∞
X
an ,
n=0
| exp(ix)|2
Re
∞
X
n=0
an =
∞
X
Rean ,
Im
n=0
∞
X
n=0
an =
∞
X
Iman
n=0
=
exp ix exp ix = exp ix exp(−ix)
=
(cos x + i sin x)(cos x − i sin x) = (cos x)2 + (sin x)2
PROPOSITION 3.2 (Additionstheoreme). Für alle a, b ∈ C gilt
cos(a + b) = cos a cos b − sin a sin b
sin(a + b) = sin a cos b + cos a sin b
100
3. REIHEN UND FUNKTIONEN
Wir geben zunächst einen Beweis für a, b ∈ R und dann einen für a, b ∈ C. Der erste Beweis ist also
aus Sichtweise des logischen Aufbaus der Vorlesung unnötig. Allerdings ist der erste Beweis viel
besser zu merken und die Additionstheoreme sind vor allem für reelle a und b wichtig. Deswegen
ist der erste für unser Verständnis der wichtigere.
Beweis für reelle a und b.
cos(a + b)
sin(a + b)
=
Re exp i(a + b) = Re ((exp ia)(exp ib))
=
Re ((cos a + i sin a)(cos b + i sin b)) = cos a cos b − sin a sin b
= Im exp i(a + b) = Im ((exp ia)(exp ib))
= Im ((cos a + i sin a)(cos b + i sin b)) = cos a sin b + sin a cos b
2
Beweis für alle a und b.
exp i(a + b) + exp(−i(a + b))
exp ia exp ib + exp(−ia) exp(−ib)
cos(a + b) =
=
2
2
cos a cos b =
exp ia exp ib + exp ia exp(−ib) + exp(−ia) exp ib + exp(−ia) exp(−ib)
4
sin a sin b =
exp ia exp ib − exp ia exp(−ib) − exp(−ia) exp ib + exp(−ia) exp(−ib)
−4
Der Beweis der Formel für sin(a + b) geht völlig analog.
15.1.
2
22
3.3. Eulersche Zahl. Die Eulersche Zahl ist
∞
X
1
1 1
e := exp(1) =
> 1 + 1 + + = 2, 6666 . . .
n!
2
6
n=0
Numerisch23: e = 2, 7182818 . . .
22Wir hätten gerne natürlich noch ganz andere Eigenschaften: zum Beispiel, dass sin und cos die üblichen
geometrischen Eigenschaften haben, und dass sie periodisch sind, genauer dass cos(z + 2π) = cos z und sin(z + 2π) =
sin z. Das können wir aber noch nicht sagen, denn wir müssen ja erst mal π definieren. Man definiert π/2 als die
erste positive Nullstelle von sin, aber wir können leider noch gar nicht zeigen, dass die oben definierte Funktion
überhaupt eine positive Nullstelle beseitzt.
23Dieser Wert ist hier nicht vollständig angegeben, kann auch nicht vollständig als Dezimalzahl angegeben
werden. Der Wert ist nicht begründet, wird im folgenden auch nicht wirklich gebraucht und sollte auch von Ihnen
nicht gebraucht werden. Er dient allein der Anschauung und dem Vergleich zu anderer Literatur!
3. EINIGE KLASSISCHE FUNKTIONEN
101
Wdh: Für t ∈ R>0 , n ∈ N0 , m ∈ N ist definiert:
n
t√
: rekursiv
m
t: durch
√ Lemma 5.10.
tn/m := m tn .
1
t−n/m := tn/m
:
LEMMA 3.3. Für alle q ∈ Q gilt
eq = exp(q)
Beweis. Durch Induktion zeigt man zunächst für alle n ∈ N0 und alle z ∈ C: exp(nz) = exp(z)n .
Es ergibt sich exp(n) = exp(n · 1) = en > 0. Man sieht dann auch, dass
∞
X
1 n j
>0
exp(n/m) :=
j! m
j=0
die Relation
exp(n/m)m = exp(mn/m) = en
erfüllt. Somit ist x := exp(n/m) eine positive reelle Zahl, die xm = en erfüllt. Also x = en/m . Wir
haben die Aussage für alle q ∈ Q>0 gezeigt. Die Aussage ist trivial für q = 0 und folgt direkt aus
der Funktionalgleichung der Exponentialfunktion (Proposition 3.1) für q ∈ Q<0 .
2
Definition 3.4. Für z ∈ C: ez := exp(z).
Funktionalgleichung: ez+w = ez · ew
Bemerkung 3.5. Die Eulersche Zahl ist irrational. Sie ist sogar transzendent, d.h. ist p(x) =
ad xd + · · · + a0 x0 , p 6≡ 0, 24 ein Polynom mit rationalen Koeffizienten, dann gilt p(e) 6= 0. (Ohne
Beweis)
3.4. Exponentialfunktion, Teil 2. In diesem Abschnitt studieren wir die reelle Exponentialfunktion exp : R −→ R.
SATZ 3.6.
(a) ∀r ∈ R : exp r > 0, also exp# (R) ⊂ R>0 .
(b) Die reelle Exponentialfunktion exp : R −→ R ist streng monoton wachsend.
(c) Sie wächst schneller als jedes Polynom im folgenden Sinn: Für jedes Polynom p(x) = ad xd +
· · · + a0 x0 , p 6≡ 0, gilt:
p(x) ≤
∀ ∈ R>0 : ∃x0 ∈ R : ∀x ∈ R≥x0 : exp(x) 24Für eine Funktion f : M → R bedeutet f ≡ 0, dass für alle x ∈ M gilt f (x) = 0. Oben gilt dann also
p 6≡ 0
.
⇐⇒
¬(p ≡ 0)
⇐⇒
¬(ad = ad−1 = · · · = a0 = 0)
102
3. REIHEN UND FUNKTIONEN
Insbesondere: ist (ak )k∈N eine Folge, die uneigentlich gegen ∞ konvergiert, dann ist
p(ak )
exp(ak ) k∈N
eine Nullfolge.
Beweis.
Zu (a): bereits gezeigt.
Zu (b): Es gelte x, y ∈ R, x < y.
∞
X
exp y
1
= exp(x − y) = 1 +
(y − x)n > 1.
| {z }
exp x
n!
n=1
>0
Zu (c): Sei ∈ R>0 gegeben. Wir setzen
x0 :=
max{1! |a0 |, 2! |a1 |, . . . , (d + 1)! |ad |}
> 0.
Somit haben wir für ∀x ∈ R≥x0
`
a` x ≤
|x0 | · |x` | ≤
x`+1 ,
(` + 1)!
(` + 1)!
|p(x)| = |ad xd + · · · + a0 x0 | ≤ d+1
X
1 n
x < exp(x).
n!
n=1
2
KOROLLAR 3.7. Konvergiert (ak )k∈N uneigentlich gegen ∞, dann konvergiert exp(−ak ) → 0 und
exp(ak ) → ∞.
Frage 3.8. Ist exp(R) = R>0 ?
Es erscheint uns, dass die Antwort ja sein sollte, obwohl wir es noch nicht zeigen können. Die Frage
ist auch wichtig, weil wir gerne den (natürlichen) Logarithmus als Umkehrfunktion der reellen
Exponentialfunktion definieren wollen, und der Logarithmus sollte auf allen positiven reellen Zahlen
definiert sein.
Beispiel 3.9. Betrachte die Funktion f : R −→ R
(
exp x
x≤0
f (x) :=
1 + exp x x > 0
BIlD
Diese Funktion erfüllt alle Eigenschaften in Satz 3.6 und Korollar 3.7. Aber f# (R) = (0; 1]∪(2; ∞) 6=
R>0 .
3. EINIGE KLASSISCHE FUNKTIONEN
103
Anschaulich: Da exp : R −→ R keine Sprünge macht“, sollte jeder Wert zwischen 0 und ∞ von
”
der Funktion einmal angenommen werden.
Uns fehlt also ein wichtiges Hilfsmittel. Unsere Aufgabe: Kläre, was es bedeutet, dass eine Funktion
keine Sprünge macht“. Dies führt zum Begriff Stetigkeit“.
”
”
KAPITEL 4
Stetigkeit und Grenzwert von Funktionen
1. Stetigkeit
Im folgenden sei: D ⊂ C, x0 ∈ D, f : D −→ C
Stellen Sie sich am besten zunächst den Speziallfall D ⊂ R vor und nehmen Sie zunächst f# (D) ⊂ R
an. Wenn Sie diesen Fall richtig verstanden haben, betrachten Sie den Fall D ⊂ C. In diesem etwas
allgemeineren Kontext werden einige Konzepte von Abschnitt refoffen.abgeschlossen deutlich. In
späteren Semestern werden aber wesentlich allgemeinere Definitionsbereiche D zugelassen, zum
Beispiel 4-dimensionale gekrümmte Raumzeiten oder topologische Räume“ und wir wollen die
”
jetzt gemachten Definitionen möglichst so wählen, dass sich alles auf diesen allgemeineren Kontext
verallgemeinert.
Frage 1.1. Sind Funktionen mit Grenzwert verträglich. Es gelte an → x0 . Folgt dann f (an ) →
f (x0 )?
Definition 1.2. Eine Funktion f : D −→ C heißt folgenstetig in x0 , falls gilt:
(1.3)
Ist (an )n∈N eine Folge in D mit limn→∞ an = x0 , dann folgt limn→∞ f (an ) = f (x0 ).
Beispiele 1.4.
(a) Konstante Funktionen sind folgenstetig. Die Identitäten idR : R → R und idC : C → C sind
folgenstetig.
e ⊂ D, dann ist auch f | e : D
e −→ C in x0
(b) Ist f : D → C folgenstetig in x0 und x0 ∈ D
D
1
folgenstetig.
(c) Die Funktion f : R → R
(
0 x≤0
f (x) :=
1 x>0
BILD
ist nicht folgenstetig in 0. Denn die Folge (1/n)n∈N konvergiert gegen 0, aber f (1/n) = 1
konvergiert nicht gegen f (0) = 0. Anderseits ist f in allen anderen x0 folgenstetig. Denn ist
zum Beispiel x0 > 0, und gilt an → x, dann folgt für fast alle n ∈ N: an > 0, also f (an ) = 1,
und somit f (an ) → f (x0 ) = 1. Der Fall x0 < 0 ist analog.
1Denn: Wenn man D verkleinert, muss man weniger Folgen überprüfen.
105
106
4. STETIGKEIT UND GRENZWERT VON FUNKTIONEN
Pd
(d) Ist p : C −→ C, x 7→ k=0 bk xk ein Polynom, so ist p in jedem x0 ∈ R folgenstetig. Es gelte
limn→∞ an = x0 . Dann
lim p(an ) =
n→∞
d
X
k=0
lim bk (an )k =
n→∞
d
X
bk ( lim an )k = p(x0 ).
n→∞
k=0
Siehe Kapitel 2, Abschnitt 5.5.4 für Details.
(e) Die Funktion f aus Beispiel 3.9 ist in 0 nicht folgenstetig. Denn für an := n1 gilt: f (an ) > 2,
f (0) = f (lim an ) = 1; deswegen kann f (an ) nicht gegen f (lim an ) konvergieren. 2
Definition 1.5.
(a) Eine Funktion f : D −→ C heißt stetig in x0 , falls gilt:
(1.6)
∀ ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈ D : (|x − x0 | < δ =⇒ |f (x) − f (x0 )| < ).
(b) f : D −→ C heißt stetig, wenn f in jedem x0 ∈ D stetig ist.
BILD
LEMMA 1.7. x0 ∈ D ⊂ C, f : D −→ C
f ist folgenstetig in x0
⇐⇒
f ist stetig in x0 .
In anderen Worten: (1.3) ⇐⇒ (1.6).
Beweis.
Zu =⇒“: Sei f nicht stetig in x0 . Dann gilt
”
∃ ∈ R>0 : ∀δ ∈ R>0 : ∃x ∈ D : (|x − x0 | < δ ∧ |f (x) − f (x0 )| ≥ ).
Wir fixieren solch ein ∈ R>0 . Für ein n ∈ N setzen wir δ := 1/n, und wählen ein an ∈ D mit
|an − x0 | < 1/n und |f (an ) − f (x0 )| ≥ .
Dann konvergiert (an )n∈N gegen x0 , aber (f (an ))n∈N konvergiert nicht gegen f (x0 ).
Zu ⇐=“: Sei f stetig in x0 , und (an ) sei eine Folge in D, die gegen x0 konvergiert.
”
Zu zeigen ist: f (an ) → f (x0 ), d.h.: 3
(1.8)
∀ ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : |f (an ) − f (x0 )| < Wir fixieren also ein ∈ R>0 . Wir wählen ein dazu passendes δ ∈ R>0 wie in (1.6), d.h. es gilt:
(1.9)
∀x ∈ D : (|x − x0 | < δ =⇒ |f (x) − f (x0 )| < ).
2Achtung: Diese Aussage ist — so wie sie steht — korrekt. Wir haben noch nicht gezeigt, dass f (a ) konvergiert,
n
denn wir wissen noch nicht, ob die Exponentialfunktion stetig in 0 ist. Wir haben aber auch nicht behauptet, dass
diese Folge konvergiert!
3Bisher hatten wir in der Definition von Konvergenz von Folgen ≤ . Es ist aber klar, dass man hier auch < schreiben kann.
1. STETIGKEIT
107
Wegen an → x0 gibt es ein n0 ∈ N mit
∀n ∈ N≥n0 : |an − x0 | < δ
(1.10)
Die Aussagen (1.9) und (1.10) zusammen ergeben
(1.11)
∀n ∈ N≥n0 : |f (an ) − f (x0 )| < Insgesamt haben wir nun (1.8) verifiziert.
2
17.1.
Sprachgebrauch: Wir nennen (1.3) das Folgen-Kriterium für Stetigkeit und (1.6) das -δ-Kriterium
für Stetigkeit.
Wiederholung: Folgenstetig=stetig.
Wir haben bereits die folgende Tatsache letztes Mal erwähnt und im letzten Beispiel auch teilweise
benutzt:
LEMMA 1.12. Seien f, g : D −→ C in x0 stetige Funktionen, a, b ∈ C. Dann sind auch die
folgenden Funktionen D −→ C stetig in x0 :
(a · f + b · g)(x) := a · f (x) + b · g(x)
(f · g)(x) := f (x) · g(x)
Gilt außerdem 0 6∈ B(g), dann ist auch
f (x)
f
(x) :=
g
g(x)
stetig in x0 .
Das Lemma ist eine direkte Folgerung aus Übung 5.21 in Kapitel 2.
e −→ C stetig in y0 ∈ D.
e Es gelte
LEMMA 1.13. Sei f : D −→ C stetig in x0 ∈ D und sei g : D
e Dann ist g ◦ f : D −→ C ebenfalls stetig in x0 .
f (x0 ) = y0 und B(f ) = f# (D) ⊂ D.
Beweis. Wir überprüfen das Folgenkriterium. Es gelte für n → ∞: an → x0 . Aus den Voraussetzungen folgt zunächst f (an ) → f (x0 ) = y0 und daraus dann g(f (an )) → g(y0 ), also
(g ◦ f )(an ) → (g ◦ f )(x0 ). Somit ist g ◦ f folgenstetig in x0 .
2
ÜBUNG 1.14 (Übungsblatt 12, 2. Aufgabe). Sei D ⊂ C, x0 ∈ D und f : D → C eine Funktion,
und sei r ∈ R>0 fixiert. Wir definieren Br (x0 ) := {z ∈ C | |z − x0 | < r}. Zeigen Sie: f ist stetig in
x0 genau dann, wenn f |D∩Br (x0 ) stetig in x0 ist.
Wir sagen hierzu: Stetigkeit ist eine lokale Eigenschaft.
108
4. STETIGKEIT UND GRENZWERT VON FUNKTIONEN
2. Zwischenwertsatz
In diesem Abschnitt ist der Definitionsbereich D von f eine Teilmenge von R, f : D −→ R.
SATZ 2.1 (Zwischenwertsatz). Sei f : [a; b] −→ R ein stetige Funktion, und sei f (a) ≤ y ≤ f (b)
oder f (a) ≥ y ≥ f (b). Dann gibt es ein c ∈ [a; b] mit f (c) = y.
Wir haben dann also
[f (a); f (b)] ⊂ f# ([a; b]) oder [f (b); f (a)] ⊂ f# ([a; b])
BILD
Beweis. O.B.d.A. f (a) ≤ y ≤ f (b).
Wir definieren rekursiv die Folgen (an ) und (bn ).
a0 := a, b0 := b.
Seien an−1 und bn−1 definiert. Setze
zn−1 :=
an−1 + bn−1
2
Wir definieren dann an und bn wie folgt:
• Im Fall f (zn−1 ) ≤ y setzen wir an := zn−1 und bn := bn−1 .
• Im Fall f (zn−1 ) > y setzen wir an := an−1 und bn := zn−1 .
Die Folge (an ) ist monoton wachsend und beschränkt. Also existiert c := limn→∞ an . Da bn − an =
(b − a)/2n → 0 haben wir auch c = limn→∞ bn . Mit der Folgenstetigkeit von f in c sehen wir:
f (c) = lim f (an ) ≤ y und f (c) = lim f (bn ) ≥ y.
n→∞
n→∞
2
Beispiel 2.2. Sei a > 0. f : R −→ R, x 7→√xn − a. Dann besitzt f eine positive Nullstelle. Dies ist
ein alternativer Beweis der Existenz von n a.
KOROLLAR 2.3. Sei I ⊂ R ein Intervall und f : I −→ R stetig. Dann ist f# (I) ebenfalls ein
Intervall.
Beachte: Intervalle können hier offen, halboffen oder abgeschlossen sein!
Vorüberlegung: Eine Teilmenge J von R ist genau dann ein Intervall, wenn gilt:
∀u, v ∈ J : u ≤ v =⇒ [u, v] ⊂ J
2. ZWISCHENWERTSATZ
109
Beweis. Seien u, v ∈ f# (I). Wir schreiben u = f (a), v = f (b). O.B.d.A. a ≤ b. Nach dem
Zwischenwertsatz gilt
[u; v] = [f (a); f (b)] ⊂ f# ([a; b]) ⊂ f# (I).
Also ist f# (I) ein Intervall.
2
SATZ 2.4. Sei I ⊂ R ein Intervall, und f : I −→ R eine streng monotone, stetige Funktion,
J := f# (I). Dann ist f −1 : J −→ I wohldefiniert und stetig.
Beweis. Da f : I −→ J eine bijektive Funktion ist, ist die Umkehrfunktion f −1 : J −→ I
wohldefiniert.
BILD
Wir zeigen nun die Stetigkeit von f −1 in einem beliebigen y0 ∈ J. O.B.d.A. sei f streng monoton
wachsend.4 Zu zeigen ist:
∀ ∈ R>0 : ∃δ ∈ R>0 : ∀y ∈ J : (|y − y0 | < δ =⇒ |f −1 (y) − f −1 (y0 )| < ).
Setze x0 := f −1 (y0 ).
1. Fall: inf J < y0 < sup J. Dies ist äquivalent zu inf I < x0 < sup I. In Worten anschaulich: y0
liegt nicht am Rand des Intervalls J.
Sei ∈ R>0 gegeben. Setze
˜ := min{, (x0 − inf I)/2, (sup I − x0 )/2} > 0
Dann inf I < x0 −˜
< x0 < x0 +˜
< sup I. Setze y± := f (x0 ±˜
) und δ := min{(y+ −y0 ), (y0 −y− )}.
Da f streng monoton wachsend ist, gilt für alle y ∈ (y0 − δ; y0 + δ):5
x0 − ≤ x0 − ˜ = f −1 (y− ) ≤ f −1 (y0 − δ) ≤ f −1 (y) ≤ f −1 (y0 + δ) ≤ f −1 (y+ ) = x0 + ˜ ≤ x0 + .
2. Fall: inf J = y0 oder sup J = y0 . Anschaulich: y0 ist am Rand des Intervalls J.
Geht ganz ähnlich. Man muss dabei nur eine der Seiten weglassen.
2
Beispiel 2.5. f : (−1; 1) −→ R x 7→ x2 . Dann ist f# ((−1; 1)) = B(f ) = [0; 1). Wir haben hier ein
Intervall erhalten. Das Bild-Intervall ist nicht mehr offen, sondern nur noch halb-offen.
Beispiele 2.6. Die folgenden Funktionen sind streng monoton, stetig und surjektiv und haben
deswegen eine stetige Umkehrabbildung:
f : R −→ R,
f : R −→ R,
f (x) := x3 + x
f (x) = x2n+1 , n ∈ N0
4Dies bedeutet: Wir betrachten nur den Fall, dass f streng monoton wachsend ist. Der Fall, dass f streng
monoton fallend ist, folgt dann durch Vorzeichenwechsel.
5Das heißt: für alle y ∈ J mit y − δ < y < y + δ
0
0
110
4. STETIGKEIT UND GRENZWERT VON FUNKTIONEN
f : R≥0 −→ R≥0 , f (x) = xn , n ∈ N
√
√
Also sind die Wurzelfunktionen n : R≥0 −→ R≥0 und 2n+1 : R −→ R stetig.
22.1.
3. Metrische Räume und Grundbegriffe der Topologie
Der Begriff der Stetigkeit“ ist eng verbunden mit dem Begriff Topologie“, so wie lineare Abbil”
”
”
dungen“ mit dem Begriff Vektorräume“ verbunden ist. Wenn wir Sie nun in Ihrem Studium immer
”
wieder von stetigen Abbildungen hören, werden solche topologischen Begriffe immer wichtiger.
In diesem Abschnitt lernen wir einige Grundbegriffe der Topologie kennen: Stetigkeit in einem etwas
allgemeineren Sinn, offene Mengen, abgeschlossene Mengen, Häufungspunkte und Umgebungen.
Diese Begriffe werden (in noch allgemeinerer Form) Ihnen häufig im Studium begegnen. Zum
Beispiel benötigt eine präzise Formulierung selbst einfacher quantenmechanischer Systeme wie
dem Wasserstoff-Atom solche topologischen Grundbegriffe.
Definition 3.1. Ein metrischer Raum ist ein Paar (M, d), wobei M eine Menge ist und d :
M × M −→ R≥0 eine Abbildung ist mit folgenden Eigenschaften, die für alle x, y, z ∈ M gelten
sollen:
(a) d(x, y) = 0 ⇐⇒ x = y (Definitheit)
(b) d(x, y) = d(y, x) (Symmetrie)
(c) d(x, y) ≤ d(x, z) + d(z, y) (Dreiecks-Ungleichung)
Man nennt d eine Metrik auf M .
Beispiele 3.2.
(1) Sei M ⊂ R oder M ⊂ C. Für z, w ∈ M definieren wir
p
d(z, w) := |z − w| = (Re(z − w))2 + (Im(z − w))2 .
(2) Sei M ⊂ Rn . Zu x = (x1 , x2 , . . . , xn ) ∈ M ⊂ Rn und y = (y1 , y2 , . . . , yn ) ∈ M ⊂ Rn
definiere wir den euklidischen Abstand als
p
deukl (x, y) := kx − yk = (x1 − y1 )2 + (x2 − y2 )2 + · · · + (xn − yn )2 .
In beiden Beispielen sind (a) und (b) klar. Für (1) wurde (c) schon diskutiert. Die Ungleichung (c)
für (2) wird in der Linearen Algebra I (oder dem vergleichbaren Kurs für Physiker) gezeigt.
Beispiel 3.3. Ist (M, d) ein metrischer Raum und N ⊂ M . Dann ist (N, d|N ×N ) ebenfalls ein
metrischer Raum. Wir nennen dN ×N die von (M, d) auf N induzierte Metrik .
e metrische Räume, dann
f eine Abbildung und sind (M, d) und (M
f, d)
Schreibweise: Sei f : M −→ M
e
f
schreiben wir hierfür oft f : (M, d) −→ (M , d).
3. METRISCHE RÄUME UND GRUNDBEGRIFFE DER TOPOLOGIE
111
e bijektiv und gilt für alle x, y ∈ M : d(x, y) = d(f
e (x), f (y)),
f, d)
Ist eine Abbildung f : (M, d) −→ (M
dann nennt man die Abbildung eine Isometrie. Man sieht sofort, dass (x, y) 7→ x+iy eine Isometrie
von (R2 , deukl ) nach (C, d) ist, wobei d die Metrik im obigen Beispiel ist. Da wir oft R2 mitC
identifizieren, schreiben wir ebenfalls deukl für diese Metrik auf C.
Definition 3.4 (-δ-Kriterium für Stetigkeit für Abbildungen zwischen metrischen Räumen). f :
e ist stetig in x0 ∈ M , falls gilt:
f, d)
(M, d) −→ (M
(3.5)
∀ ∈ R>0 : ∃δ ∈ R>0 : ∀x ∈ M : (d(x, x0 ) < δ =⇒ d(f (x), f (x0 )) < ).
f stetig ⇐⇒ f stetig in allen x0 ∈ M .
Im Fall M ⊂ C, d(z, w) = |z − w| stimmt diese Definition offensichtlich mit Definition 1.5 überein.
Definition 3.6. Sei (M, d) ein metrischer Raum, x ∈ M , r ∈ R>0 . Der (offene) Ball von Radius r
um x in (M, d) ist die Menge
Br (x) := {y ∈ M | d(y, x) < r}.
Eine Teilmenge U ⊂ M heißt Umgebung von x in (M, d), falls es ein r ∈ R>0 gibt, so dass
Br (x) ⊂ U .
Definition 3.7. Eine Teilmenge O von M heißt offen in (M, d), wenn für jeden Punkt x ∈ O
gilt, dass O eine Umgebung von x in (M, d) ist. Eine Teilmenge A von M heißt abgeschlossen in
(M, d), falls M r A offen ist.
Beispiele 3.8.
(a) Die leere Menge und M sind offen in (M, d). Diese beiden Mengen sind auch abgeschlossen.
(b) O offen ⇐⇒ ∀x ∈ O; ∃r ∈ R>0 : Br (x) ⊂ O.
BILD
(c) Alle offenen Intervalle in R sind offen in (R, deukl ). Alle abgeschlossenen Intervalle in R sind
abgeschlossen in (R, deukl ).
(d) Die Menge (0; 1) × (0; 1) ist offen in (R2 , deukl )
(e) Für alle r ∈ R>0 und alle x ∈ M ist Br (x) eine offene Teilmenge von (M, d). Begründung
Dreiecks-Ungleichung.
(f) Ist U Umgebung von x und U ⊂ V ⊂ M , dann ist V ebenfalls Umgebung von x.
LEMMA 3.9. Sei x ∈ M und U ⊂ M . Dann ist U eine Umgebung von x, genau dann wenn es
ein O ⊂ M gibt, das
• in (M, d) offen ist, und
• so dass x ∈ O ⊂ U .
Solch ein O ist also eine offene Umgebung von x.
112
4. STETIGKEIT UND GRENZWERT VON FUNKTIONEN
Beweis.
=⇒“: klar, da offene Bälle offen sind.
”
⇐=“: Wenn O offen ist und x ∈ O, dann ist O eine Umgebung von x. Aus O ⊂ U ergibt sich,
”
dass U Umgebung von x ist.
2
PROPOSITION 3.10.
(a) Sei x ∈ M und seien U1 und U2 Umgebungen von x in (M, d). Dann ist auch U1 ∩ U2 eine
Umgebung von x.
(b) Sind O1 und O2 offene Teilmengen von (M, d), so ist O1 ∩ O2 offen.
(c) Sei (Oj )j∈I eine Familie offener Teilmengen von (M, d), dann ist auch
[
Oj
j∈I
eine offene Teilmenge.
Beweis.
Zu (a): Da U1 und U2 offen sind, gibt es r1 , r2 ∈ R>0 mit Br1 (x) ⊂ U1 und Br2 (x) ⊂ U2 . Für
r := min{r1 , r2 } gilt Br (x) ⊂ U1 ∩ U2 .
Zu (b): Gegeben sei ein x ∈ O1 ∩ O2 ist. Da O1 und O2 offen sind, sind sie Umgebungen von x.
Aus (a) folgt, dass O1 ∩ O2 ebenfalls Umgebung von x ist. Da dies für jedes x ∈ O1 ∩ O2 gilt, ist
O1 ∩ O2 offen.
S
Zu (c): Sei x ∈ Oj . FixiereSein k ∈ I mit x ∈ OSk . Da Ok offen ist, ist Ok eine Umgebung
von
S
x in (M, d), und damit auch Oj ⊃ Ok . Also ist Oj eine Umgebung von jedem x ∈ Oj , also
offen.
2
!ACHTUNG!.
• Für n ∈ N ist (−1/n; 1/n) offen in R, aber nicht offen in C.
• Proposition 3.10 besagt: endliche Durchschnitte offener Mengen sind offen und beliebige (also auch unendliche!) Vereiningung offener Mengen sind auch wieder offen. Allerdings
ist ein unendlicher Durchschnitt offener Mengen im allgemeinen nicht mehr offen:
T
(−1/n;
1/n) = {0} ist nicht offen!
n∈N
• Abgeschlossen“ ist nicht das Gegenteil zu offen“.
”
”
PROPOSITION 3.11 (Umgebungskriterium für Stetigkeit). Gegeben sei eine Abbildung f : (M, d) −→
e und ein x0 ∈ M . Diese Abbildung ist stetig in x0 genau dann wenn gilt:
f, d)
(M
e gilt: f # (U ) ist eine Umgebung von x0 in (M, d).
f, d)
für alle Umgebungen U von f (x0 ) in (M
Beweis. Die umrahmte Aussage ist eine Umformulierung des -δ-Kriteriums unter Nutzung des
oben definierten Begriffs Umgebung“.
2
”
3. METRISCHE RÄUME UND GRUNDBEGRIFFE DER TOPOLOGIE
113
Kurz kann man hierfür sagen: Urbilder von Umgebungen sind Umgebungen.
e ist genau dann stetig, wenn für alle
f, d)
PROPOSITION 3.12. Eine Funktion f : (M, d) −→ (M
#
e gilt: f (O) ist offen in (M, d).
f, d)
offenen Teilmengen O von (M
Kurz kann man hierfür sagen: Urbilder offener Mengen sind offen.
ÜBUNG 3.13. Beweisen Sie diese Proposition.
Definition 3.14. Eine Folge (an )n∈N konvergiert in (M, d) gegen x0 ∈ M , falls für jede Umgebung U von x0 gilt:
∃n0 ∈ N : ∀n ∈ N≥n0 : an ∈ U.
Die Folge konvergiert in (M, d), wenn es in M solch ein x0 gibt.
Diese Definition verallgemeinert die Konvergenz von Folgen in R und C. Man definiert limn→∞
und die Folgenstetigkeit gleich wie zuvor. Folgenstetigkeit und Stetigkeit sind wieder äquivalente
Eigenschaften. Um dies beweisen ersetze man im Beweis von Lemma 1.7 |x − x0 | < δ durch
d(x, x0 ) < δ und so weiter.
Bemerkung 3.15. R := R ∪ {−∞, ∞}. In der Diskussion vor Kapitel 2 Proposition 5.56 haben
wir eine bijektive Abbildung ϕ : [−1; 1] −→ R definiert,

1
1

 1−x − 1+x für x ∈ (−1; 1)
ϕ(x) = ∞
für x = 1


−∞
für x = −1
Wir versehen nun R mit der Metrik
dR (x, y) := ϕ−1 (x) − ϕ−1 (y) .
Dann ist (R, dR ) ein metrischer Raum. Für eine reell-wertige Folge (an )n∈N und ein a ∈ R gilt
Für
im klassischen Sinn
im Sinn metrischer Räume
a∈R
limn→∞ an = a
im eigentlichen Sinn
⇐⇒
limn→∞ an = a
im metrischen Raum (R, dR )
a = ±∞
limn→∞ an = a
im uneigentlichen Sinn
⇐⇒
limn→∞ an = a
im metrischen Raum (R, dR )
Diejenigen Aussagen in Proposition 5.56, die bisher noch nicht bewiesen wurden, folgen nun unmittelbar.
!ACHTUNG!. Wir wollen für die Zukunft erlaubte und unerlaubte Sprechweisen klären an Hand
des Beispiels an := n2 .
Erlaubt: (an )n∈N konvergiert uneigentlich gegen ∞.
(an )n∈N konvergiert in (R, dR ) gegen ∞.
Nicht erlaubt: (an )n∈N konvergiert gegen ∞.
24.1
114
4. STETIGKEIT UND GRENZWERT VON FUNKTIONEN
Definition 3.16. Sei X Teilmenge eines metrischen Raums (M, d). Wir nennen x0 ∈ M einen
Häufungspunkt von X (in (M, d)), falls jede Umgebung von x0 unendlich viele Punkte von X
enthält.
Beispiele 3.17.
(a)
(b)
(c)
(d)
Endliche Mengen haben keine Häufungspunkte.
Die Mengen N und Z haben keine Häufungspunkte in R und C.
Die Menge aller Häufungspunkte von Q in C ist R.
Seien a, b ∈ R, a < b. Die Menge aller Häufungspunkte von (a; b) in R (oder in C) ist die Menge
[a; b].
LEMMA 3.18. Sei X Teilmenge eines metrischen Raums (M, d), und sei x0 ∈ M . Äquivalent
sind dann:
(1) x0 ist Häufungspunkt von X
⇐⇒
(2) Ist U Umgebung von x0 , dann gilt U ∩ X r {x0 } =
6 ∅
⇐⇒
(3) Es gibt eine Folge (an ) in X r {x0 } mit limn→∞ an = x0
⇐⇒
(4) Es gibt eine Folge in X r {x0 }, so dass x0 H äufungspunkt dieser Folge ist.
Beweis.
(1)=⇒(2)“: klar.
”
(2)=⇒(3)“: B1/n (x0 ) ∩ X besitzt ein Element an 6= x0 . Dann d(an , x0 ) ≤ 1/n → 0.
”
(3)=⇒(1)“: Sei (an )n∈N eine Folge wie in (2), und U eine Umgebung von x0 . Es gibt ein n0 ∈ N,
”
so dass ∀n ∈ N≥n0 : an ∈ U . Wenn P := {d(an , x0 ) | n ∈ N≥n0 } nur endlich viele Elemente
enthält, dann ist inf{d(an , x0 ) | n ∈ N} > 0. Widerspruch. Somit hat P unendlich viele Elemente
und deswegen auch U ∩ X.
(3)⇐⇒(4)“: siehe Definition5.51 in Kapitel 2.
”
2
!ACHTUNG!. Die Definitionen von Häufungspunkt einer Menge“ (siehe oben) und Häufungs”
”
punkt einer Folge“ (Definition 5.51 in Kapitel 2) sind zwar verwandt, aber haben den folgenden
wichtigen Unterschied: Die reell-wertige Folge (an )n∈N mit an := 1 hat den Häufungspunkt 1, aber
die Menge {an | n ∈ N} hat keine Häufungspunkte.
4. Grenzwert von Funktionen
e metrische Räume, D ⊂ M , und x0 ∈ M ein Häufungspunkt
LEMMA 4.1. Seien (M, d) und (N, d)
von D. Zu jeder Abbildung f : D → N gibt es höchstens eine Abbildung F : D ∪ {x0 } → N , so dass
• F |Dr{x0 } = f |Dr{x0 }
• und so dass F stetig in x0 ist.
4. GRENZWERT VON FUNKTIONEN
115
Definition 4.2. Wenn solch ein F existiert, so sagen wir der Grenzwert oder Limes
lim f (s)
x→x0
existiert. Wir nennen F (x0 ) den Grenzwert oder Limes von f in x0 und schreiben
lim f (x) := F (x0 ).
x→x0
Bemerkung 4.3. Es sind die Fälle x0 ∈ D und x0 6∈ D zugelassen. Im Fall x0 ∈ D muss nicht
f (x0 ) = F (x0 ) gelten.
Beweis des Lemmas. Wähle eine Folge (an )n∈N in D r {x0 } mit an → x0 . Wenn ein F wie oben
existiert, dann gilt
F (x0 ) = F ( lim an ) = lim F (an ) = lim f (an ).
n→∞
n→∞
n→∞
2
Offensichtlich gibt es nur höchstens ein solches F .
Definition 4.4. Sei D ⊂ R, und sei x0 ∈ D ein Häufungspunkt von D ∩ [x0 ; ∞). Dann definiert
man den rechtsseitigen Grenzwert/Limes als
lim f (x) := lim (f |D∩[x0 ,∞) ).
x→x0
x&x0
Wenn wir [x0 ; ∞) durch (−∞; x0 ] ersetzen, erhalten wir die Definition des linksseitigen Grenzwerts/Limes
lim f (x).
x%x0
Für x0 ∈ D ⊂ R, x0 Häufungspunkt von D ∩ [x0 , ∞) und D ∩ (−∞, x0 ]:
f : D → R ist stetig in x0
⇐⇒
⇐⇒
lim f (x) existiert und lim f (x) = f (x0 )
x→x0
x→x0
lim f (x) und lim f (x) existieren und lim f (x) = lim f (x) = f (x0 )
x&x0
x%x0
x&x0
x%x0
Beispiel 4.5. Definiere f : R −→ R.


 1 für x > 0
f (x) :=
0 für x = 0


−1 für x < 0
limx→0 f (x) existiert nicht. Hingegen existieren limx&0 f (x) = 1 und limx%0 f (x) = −1.
Bemerkung 4.6 (Zentralübung). Wir versehen N ∪ {∞} mit der Metrik
1
1
dinv (x, y) = − ,
x y
116
4. STETIGKEIT UND GRENZWERT VON FUNKTIONEN
1
:= 0 setzen. Dieses dinv ist eine Metrik auf N ∪ {∞}. Sei
wobei wir in diesem6 Zusammenhang ∞
(an ) eine Folge in (M, d), und sei f : N −→ M die Abbildung mit f (n) = an . Dann gilt
lim an = a im Sinne von Kap. 2
n→∞
⇐⇒
lim f (n) = a im Sinne des aktuellen Abschnitts
n→∞
29.5.
5. Punktweise und gleichmäßige Konvergenz
Definition 5.1. Eine Folge von Funktionen besteht aus einer Menge D, einem metrischen Raum
(Y, d), und einer Folge (fn )n∈N , wobei wir für jedes n ∈ N eine Funktion fn : D −→ Y haben.
Sei f : D −→ Y eine weitere Funktion. Wir sagen dann: (fn ) konvergiert punktweise gegen f :
D −→ Y , falls für alle x ∈ D gilt:
lim fn (x) = f (x).
n→∞
Der Begriff der punktweisen Konvergenz erscheint ein naheliegender Begriff für die Konvergenz
von solchen Funktionen.
P∞
Beispiel 5.2. Y := C. Gegeben sei eine Potenzreihe p(x) := j=0 aj xj mit Konvergenzradius ρ.
Sei D = BR (0) ⊂ C, wobei 0 < R < ρ.
fn (x) :=
n
X
aj xj .
j=0
Dann konvergiert (fn : BR (0) −→ C)n∈N punktweise gegen p : BR (0) −→ C.
Da nun alle fn stetig sind, kann man hoffen, dass wir dadurch zeigen können, dass die komplexe Exponentialfunktion stetig ist. Hierbei tritt aber ein Problem auf, das am folgenden Beispiel
deutlich wird.
Beispiel 5.3. D = [0; 1], Y := R, fn (x) := xn .
BILD
(
fn (x) → f (x) :=
0
1
für x < 1
für x = 1
(fn ) konvergiert punktweise gegen f . Alle Funktionen fn : [0; 1] → R sind stetig. Dennoch ist die
Grenzfunktion f nicht stetig.
6Wenn wir es brauchen, wird 1 jedesmal neu definiert, denn man kann diese Definition nicht so machen,
∞
dass alle ülichen Rechenregeln gelten. Man kommt dann immer wieder zu Fragen wie: 10 = ∞ oder 01 = −∞. Ist
∞ − ∞ = 0 oder ∞ − ∞ = 17? Beweis“ der letzten Aussage: ∞ + 17 = ∞. Löse diese Gleichung nach 17 auf. Das
”
geht natürlich alles gründlich schief.
5. PUNKTWEISE UND GLEICHMÄSSIGE KONVERGENZ
117
Lösung des Problems: Gleichmäßige Konvergenz.
Überblick: Bisher hatten wir
(1) Limes einer Folge in R, C, R oder (M, d); Konvergenz in metrischen Räumen
(2) Limes einer Funktion f in einem x0 , x0 Häufungspunkt von D(f )
(2) verallgemeinert (1), siehe Bemerkung 4.6.
Nun führen wir ein
(3) Limes einer Folge von Funktionen f : D −→ C; Gleichmäßige Konvergenz
Um von (1) zu (3) zu kommen, setzen wir nicht M = R oder M = C (wie am Anfang der Vorlesung)
sondern M = Abb(D, C) (oder M = Abb(D, R)) und wir müssen noch eine geeignete Metrik auf
Abb(D, C) definieren. Übrigens: Wir führen im folgenden alles für Abb(D, C) aus, wir könnten
aber auch Abb(D, R) oder Abb(D, Rk ) hernehmen, und alles ginge analog.
Nach dem kurzen Überblick wollen wir nun gleichmäßige Konvergenz erklären.
Definition 5.4. Die Supremums-Norm auf Abb(D, C) ist definiert wie folgt: für f ∈ Abb(D, C).
n
o
kf k∞ := sup |f (x)| = sup |f (x)| x ∈ D ∈ [0; ∞]
x∈D
Man überlegt sich leicht, dass
d∞ (f, g) := min{kf − gk∞ , 289},
f, g ∈ Abb(D, C)
eine Metrik7 auf der Menge Abb(D, C) ist.
Definition 5.5. Sei (fn : D −→ C)n∈N eine Folge von Funktionen. Wir definieren
(fn ) konvergiert gleichmäßig gegen f : D −→ C
:⇐⇒ (fn ) konvergiert gegen f im metrischen Raum (Abb(D, C), d∞ )
⇐⇒ kfn − f k∞ → 0 für n → ∞
⇐⇒ ∀ ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : kfn − f k∞ ≤ ⇐⇒ ∀ ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀x ∈ D : |fn (x) − f (x)| ≤ Logische Verknüpfung
∃x ∈ M : ∀y ∈ N : A(x, y)
=⇒
∀y ∈ N : ∃x ∈ M : A(x, y)
7Man kann hier natürlich 289 durch jede andere positive reelle Zahl ersetzen. Und wenn man in Kauf nimmt,
dass eine Metrik nicht nur Werte in [0, ∞) annehmen muss, sondern auch zusätzlich den Wert ∞ annehmen darf,
kann man sogar d∞ (f, g) := kf − gk∞ hernehmen.
118
4. STETIGKEIT UND GRENZWERT VON FUNKTIONEN
Somit:
∀ ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : ∀x ∈ D : |fn (x) − f (x)| ≤ =⇒ ∀x ∈ D : ∀ ∈ R>0 : ∃n0 ∈ N : ∀n ∈ N≥n0 : |fn (x) − f (x)| ≤ Gleichmäßige Konvergenz =⇒ Punktweise Konvergenz
!ACHTUNG!. Die Umkehrung ist falsch. Punktweise Konvergenz impliziert nicht gleichmäßige.
Von nun an sei D ein metrischer Raum, zum Beispiel eine Teilmenge von Rn oder Cn mit der
induzierten Metrik.
SATZ 5.6. Sei (fn : D −→ C)n∈N eine Folge von stetigen Funktionen, die gleichmäßig gegen
f : D −→ C konvergiert. Dann ist auch f : D −→ C stetig.
P∞
Beispiel 5.7 (Fortsetzung Beispiel 5.2). Sei wieder ρ der Konvergenzradius von p(x) = j=0 aj xj ,
0 < R < ρ. Definiere die Partialsummen
n
X
fn (x) :=
aj xj .
j=0
Dann gilt für x ∈ BR (0):
|fn (x) − exp(x)| = |
∞
X
aj xj | ≤
j=n+1
P∞
∞
X
|aj ||x|j ≤
j=n+1
∞
X
|aj |Rj → 0.
j=n+1
j
Wir haben Konvergenz gegen 0, da j=0 aj R absolut konvergiert. Also konvergiert (fn : BR (0) −→
C)n∈N gleichmäßig gegen p : BR (0) −→ C. 8 Wir sehen also somit, dass exp |BR (0) : BR (0) −→ C
stetig ist.
e metrische Räume sind, kann man diese Resultate auf
Bemerkung 5.8. Wenn (X, d) und (Y, d)
e
stetige Funktionen f : (X, d) −→ (Y, d) verallgemeinern. Wir setzen
d∞ (f, g) := min{sup d(f (x), g(x)), 2014}.
x∈X
d∞ ist Metrik auf Abb(X, Y ). Wenn nun eine Folge (fn ) von stetigen Funktionen in (Abb(X, Y ), d∞ )
konvergiert, (also gleichmäßig konvergiert), dann ist auch die Grenzfunktion f = lim fn stetig.
Beweis des Satzes. Wir zeigen die Stetigkeit von f in x0 . Sei ∈ R>0 gegeben. Wir wählen hierzu
ein n0 ∈ N, so dass für alle natürlichen Zahlen n ≥ n0 gilt:
kf − fn k∞ < ˜ :=
3
8Achtung: Für viele Potenzreihen konvergiert f 0 : B (0) → C nicht gleichmäßig. Erst nach Einschränkung auf
ρ
n
einen etwas kleineren Ball B R (0) erhalten wir gleichmäßige Konvergenz.
6. ANWENDUNGEN AUF exp, cos UND sin
119
Da fn0 stetig in x0 stetig ist, gibt es ein δ ∈ R>0 , so dass
|x − x0 | < δ =⇒ |fn (x) − fn (x0 )| < ˜.
Wir schließen, dass für x ∈ D mit |x − x0 | < δ gilt:
|f (x) − f (x0 )| ≤ |f (x) − fn (x)| + |fn (x) − fn (x0 )| + |fn (x0 ) − f (x0 )| < 3˜
= .
Wir haben also die Stetigkeit von f in x0 geprüft. Da x0 ein beliebiges Element von D ist, ist f
stetig (auf ganz D).
2
6. Anwendungen auf exp, cos und sin
6.1. Stetigkeit dieser Funktionen. BR (x) := {y ∈ C | |x − y| < R}
∞
X
1 n
x
exp x =
n!
n=0
Potenzreihen mit Konvergenzradius ∞. Die Partialsummen bilden eine Folge von Funktionen, z.B.
fk (x) :=
k
X
1 n
x
n!
n=0
Als Zielbereich wählen wir C. Wir müssen noch den Definitionsbereich D angeben, dann erhalten
wir eine Folge von Funktionen (fk : D −→ C)k∈N0 . Für jedes D ⊂ C ist diese Folge punktweise
konvergent.
LEMMA 6.1.
(1) Ist D eine beschränkte Teilmenge von C (oder von R), dann konvergiert (fk : D −→
C)k∈N0 gleichmäßig gegen exp : D −→ C.
(2) Falls D = R oder D = C, dann konvergiert (fk : D −→ C)k∈N0 nicht gleichmäßig.
Beweis.
Zu (1): Falls D ⊂ C eine beschränkte Menge ist, dann gibt es ein R ∈ R>0 mit D ⊂ BR (0). Wegen
R < ∞ bekommen wir die gleichmäßige Konvergenz aus den Beispielen 5.2 und 5.7.
Zu (2): Wenn die Folge gleichmäßig konvergiert, dann gegen exp (wegen punktweiser Konvergenz
gegen exp). Sei nun [0; ∞) ⊂ D.
exp x − fk (x) =
∞
X
n=k+1
1 n
1
x x
x
x ≥
xk+1 = · · · ·
≥ x,
n!
(k + 1)!
1 2
k+1
falls x ≥ k + 1. Also k exp −fk k∞ = ∞ für alle k ∈ N, also k exp −fk k 6→ 0.
2
120
4. STETIGKEIT UND GRENZWERT VON FUNKTIONEN
Analoges gilt auch für
∞
X
(−1)n 2n
x
cos x =
(2n)!
n=0
sin x =
∞
X
(−1)n 2n+1
x
(2n + 1)!
n=0
KOROLLAR 6.2. Die komplexe und die reelle Exponentialfunktion, die komplexe und reelle Sinusfunktion und die komplexe und reelle Kosinusfunktion sind stetig.
Beweis. exp |BR (0) ist stetig für alle R ∈ R>0 . Mit Übung 1.14 sehen wir, dass exp : C −→ C in
x0 ∈ C stetig ist, falls |x0 | < R. Andere Fälle analog.
2
6.2. Die reelle Exponentialfunktion. Mit dem Zwischenwertsatz folgt exp# (R) = R>0 .
KOROLLAR 6.3. Die reelle Exponentialfunktion exp : R −→ R>0 ist streng monoton, stetig und
bijektiv.
2
Definition 6.4. Die Umkehrfunktion von exp : R −→ R>0 nennt man den (natürlichen)9 Logarithmus log : R>0 −→ R.
Wegen Satz 2.4 ist der Logarithmus stetig.
log(rs) = log r + log s
log 1 = 0, log e = 1
LEMMA 6.5. Sei r ∈ R>0 und z ∈ C. Es gilt
rz = exp(z log r)
in den folgenden Fällen.
(1) r = e und z ∈ C
(2) r ∈ R>0 und z ∈ Q
Für alle anderen Kombination von r ∈ R>0 und z ∈ C wurde rz noch gar nicht definiert.10
9In der Mathematik wird der natürliche Logarithmus fast immer mit log bezeichnet. In technischen und vielen
alltäglichen Bereichen wird der natürliche Logarithhmus mit dem Symbol ln bezeichnet und das Symbol log wird
dann – anders als in unserer Vorlesung – für den Zehner-Logarithmus, also den Logarithmus zur Basis 10 genutzt.
Im Mathematik-Studium wird aber nur der natürliche Logarithmus eine Rolle spielen. Deswegen wird der ZehnerLogarithmus hier weder definiert, noch mit einem Symbol versehen.
10Wir haben auch schon (−1)3 und (1 + i)−2 definiert, aber es interessieren uns derzeit nur r ∈ R .
>0
6. ANWENDUNGEN AUF exp, cos UND sin
Beweis.
(1) folgt direkt aus Definition 3.4 in Kapitel 4.
(2) Die Aussage ist klar für z = 1. Dann folgt (2) ganz analog wie Lemma 3.3 in Kapitel 4.
121
2
Für r ∈ R>0 und z ∈ C definiert man nun
rz := exp(z log r)
Auf Grund des obigen Lemmas verallgemeinert dies also bisherige Definitionen von rz in den beiden
obigen Fällen.
rz+w = rz rw
(rs)z = rz sz
log rs = log exp(s log r) = s log r
für r, s ∈ R>0 , z, w ∈ C. Es gilt auch
(rs )t = rst
für r ∈ R>0 und s, t ∈ R.
6.3. Sinus und Kosinus.
cos x =
∞
X
(−1)n
n=0
1
x2n
(2n)!
| {z }
an
Für x ∈ (0; 2] und n ≥ 1 gilt an > 0 und
an+1
x2
≤ 1.
=
an
(2n + 1)(2n + 2)
Also
x2
cos x = a0 − a1 + (a2 − a3 ) + (a4 − a5 ) . . . ≥ a0 − a1 = 1 −
| {z } | {z }
2
≥0
≥0
x2
x4
cos x = a0 − a1 + a2 + (−a3 + a4 ) + (−a5 + a6 ) . . . ≤ a0 − a1 + a2 = 1 −
+
| {z } | {z }
2
24
≤0
≤0
Also für x ∈ [0; 2]
1−
x2
2
≤ cos x ≤ 1 −
x2
2
Ganz ähnlich
x−
x3
6
≤ sin x ≤ x
+
x4
24
31.1.
122
4. STETIGKEIT UND GRENZWERT VON FUNKTIONEN
cos 0 = 1,
cos 2 ≤ 1 − 2 +
2
1
=− <0
3
3
Aus dem Zwischenwertsatz folgt:
A := {x ∈ [0; 2] | cos x = 0} =
6 ∅.
Setze α := inf A. Zu jedem n ∈ N wähle ein xn ∈ A mit xn ≤ α + n1 . Dann gilt xn → α für n → ∞
und
cos α = cos( lim xn ) = lim cos xn = 0.
n→∞
n→∞ | {z }
0
π := 2α ∈ [0; 4].
Definition 6.6. Die Kreiszahl π ist definiert als das doppelte der ersten positiven Nullstelle der
reellen Kosinusfunktion.
π = 3, 14159265...
Es folgt aus den bisher bewiesenen Eigenschaften in Abschnitt 3.2 nun durch einfach Rechnung:
cos π/2 = 0, sin π/2 = 1, sin(x + (π/2)) = cos x, cos(x + (π/2)) = − sin x, cos(2π + x) = − cos(π +
x) = cos x, sin(2π + x) = − sin(π + x) = sin x, e2πi = cos 2π + i sin 2π = 1
Aus
cos x − cos y = −2 sin
folgt cos x > cos y für 0 ≤ x < y ≤ 2.
BILD
x−y
x+y
sin
2
2
KAPITEL 5
Differential-Rechnung für Funktionen einer Veränderlichen
1. Definition und elementare Eigenschaften
Ab sofort nutzen wir > 0 oft im Sinne von ∈ R>0 , falls aus dem Kontext heraus klar ist,
dass eine reelle Zahl ist. Wir betrachten in den folgenden Abschnitten nur Funktionen der Form
f : D −→ R, D ⊂ R.
Definition 1.1. Sei D ⊂ R offen, x0 ∈ D.1 Eine Funktion f : D −→ R nennt man differenzierbar
in x0 , wenn der Grenzwert
f (x) − f (x0 )
lim
x→x0
x − x0
existiert. Wenn er existiert, so nennt man
f 0 (x0 ) := lim
x→x0
f (x) − f (x0 )
x − x0
die Ableitung von f an der Stelle x0 . Die Funktion f ist differenzierbar, wenn sie in jedem x0 ∈ D
differenzierbar ist. Den Quotient
f (x) − f (x0 )
x − x0
nennt man den Differenzenquotient.
BILD
Beispiele 1.2.
(1) Die Identität idR : R −→ R, x 7→ x ist differenzierbar und f 0 (x0 ) = 1 für alle x0 ∈ R.
(2) Konstante Funktionen R → R, x 7→ a sind differenzierbar und f 0 (x0 ) = 0 für alle x0 ∈ R.
(3) Differenzierbarkeit ist eine lokale Eigenschaft: Ist U eine Umgebung von x0 , enthalten in
den Defintionsbereichen von f und fe, und gilt f |U = fe|U , dann ist f differenzierbar in
x0 genau dann, wenn fe in x0 differenzierbar ist. Dann gilt f 0 (x0 ) = fe0 (x0 ).
1Damit diese Definition sinnvoll ist, reicht hier eigentlich bereits, dass D eine Umgebung von x , oder sogar
0
nur, dass x0 ein Häufungspunkt von D ist.
123
124
5. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
(4) Die Funktion f : R r {0} → R r {0}, x 7→ x−1 ist differenzierbar und es gilt
1
f 0 (x0 ) = − 2 .
x0
Denn:
1
1
x0 − x
−1
1
x − x0
für x → x0
=
=
→− 2
x − x0
xx0 (x − x0 )
xx0
x0
Interpretation: Die Zahl f 0 (x0 ) gibt an, wie stark der Graph der Funktion an der Stelle (x0 , f (x0 ))
ansteigt.
Alternative Bezeichnungen:
∂f
df
(x0 ) =
(x0 ) = Df (x0 )
dx
∂x
Die Ableitung von f existiert in x0
f 0 (x0 ) =
f differenzierbar in x0
⇐⇒
⇐⇒
f 0 (x0 ) existiert
Umformungen:
f 0 (x0 ) existiert
f (x) − f (x0 )
0
− f (x0 ) < ⇐⇒ ∀ > 0 : ∃δ > 0 : ∀x ∈ D r {x0 } : |x − x0 | < δ =⇒ x − x0
⇐⇒ ∀ > 0 : ∃δ > 0 : ∀x ∈ D r {x0 } : (|x − x0 | < δ =⇒ |f (x) − f (x0 ) − f 0 (x0 )(x − x0 )| ≤ (x − x0 ))
Interpretation: Differenzierbarkeit = gute“ Approximierbarkeit durch eine lineare Funktion
”
BILD
SATZ 1.3. Seien D und f wie oben. Ist f differenzierbar in x0 , so ist auch f stetig in x0 .
Die Umkehrung gilt nicht, siehe Übungen.
Beweis. Definiere
f (x) − f (x0 )
für x 6= x0
x − x0
lim ((x − x0 )g(x)) = ( lim (x − x0 ))( lim g(x)) = 0 · f 0 (x0 ) = 0
g(x) :=
x→x0
x→x0
x→x0
2
f (x) = f (x0 ) + (x − x0 )g(x)
für x 6= x0
2Hier haben wir benutzt: sind g : D −→ R und h : D −→ R Funktionen, x ein Häufungspunkt von D und
0
existieren limx→x0 g(x) und limx→x0 h(x), dann existiert auch limx→x0 (g(x)h(x)) und es gilt
lim (g(x)h(x)) =
lim g(x)
lim h(x) .
x→x0
x→x0
x→x0
Dies ist eine leichte Übungsaufgabe. Analoges gilt für Summen, Differenzen und, falls limx→x0 h(x) 6= 0, auch für die
Quotientenfuntion x 7→ g(x)/h(x) nach Einschränkung des Definitionsbereichs auf D ∩ h# (R r {0}) = D r h# ({0}).
1. DEFINITION UND ELEMENTARE EIGENSCHAFTEN
125
Also
lim f (x) = f (x0 ) + 0 · f 0 (x0 ) = f (x0 ).
x→x0
2
Somit ist f stetig in x0 .
REGELN 1.4. Im folgenden sei D offen in R, f, fj , g : D −→ R.
(1) Sind fj differenzierbar in x0 , aj ∈ R für j ∈ {1, 2, . . . , r}, dann gilt

0
r
r
X
X

aj fj  (x0 ) =
aj fj0 (x0 ).
j=1
j=1
Solche Aussagen sind immer so zu verstehen, dass alle angegebenen Ableitungen in x0
existieren und die obige Gleichung für die so erhaltenen Zahlen gilt.
(2) Produktregel.
Sind f und g differenzierbar in x0 , dann gilt
(f · g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).
Die Existenz der Ableitungen ist wieder eine implizite Teilaussage der obigen Formelzeile.
Begründung:
f (x)(g(x) − g(x0 )) (f (x) − f (x0 ))g(x0 )
(f · g)(x) − (f · g)(x0 )
=
+
x − x0
x − x0
x − x0
→ f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 )
für x → x0 .
(3) Quotientenregel.
Sind f und g differenzierbar in x0 , g(x0 ) 6= 0, dann gilt
0
f
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) =
.
g
g(x0 )2
Begründung 1: Ähnlich wie oben, siehe [19].
Begründung 2: Folgt unten aus Kettenregel
(4) Kettenregel.
Sei f : D −→ R, g : E −→ R mit B(f ) ⊂ E. Sei f in x0 ∈ D differenzierbar und sei g in
f (x0 ) differenzierbar. Dann gilt
(g ◦ f )0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ).
Begründung: für y0 := f (x0 ) Wir rechnen
(g ◦ f )(x) − (g ◦ f )(x0 )
g(f (x)) − g(y0 ) f (x) − f (x0 )
=
·
x − x0
f (x) − y0
x − x0
Aus
lim
y→y0
g(y) − g(y0 )
= g 0 (y0 )
y − y0
5.2.
126
5. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
und Lemma 1.13 in Kapitel 4 folgt
lim
x→x0
g(f (x)) − g(y0 )
= g 0 (y0 )
f (x) − y0
Wir erhalten
lim
x→x0
(g ◦ f )(x) − (g ◦ f )(x0 )
= g 0 (y0 )f 0 (x0 )
x − x0
Begründung der Quotientenregel: Sei h(x) := 1/x. Dann
0
1
1
g 0 (x0 )
(x0 ) = (h ◦ g)0 (x0 ) = −
g
g(x0 )2
0
f
1
1
0
0
(x0 ) = f (x0 )
+ f (x0 ) −
g (x0 )
g
g(x0 )
g(x0 )2
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
=
g(x0 )2
Bemerkung 1.5. Sei D offen, f : D −→ R injektiv und stetig. Dann ist B(f ) ebenfalls offen. Denn
sei y ∈ B(f ), dann schreibe y = f (x), wähle a, b ∈ D so dass y ∈ (a; b) ⊂ D. Wegen Aufgabe 4b)
auf Übungsblatt 14 ist f |(a;b) streng monoton, o.B.d.A. streng monoton wachsend (ersetze sonst
x 7→ f (x) durch x 7→ f (−x)). Somit gilt y ∈ (f (a); f (b)) ⊂ B(f ).
Bemerkung 1.6. Sei D offen, f : D −→ R injektiv und stetig. Ist f differenzierbar in x0 und f −1
differenzierbar in f (x0 ), dann gilt
1 = id0D (x0 ) = (f −1 )0 (f (x0 )) (f 0 (x0 )).
Also f 0 (x0 ) 6= 0.
PROPOSITION 1.7. Ableitung der Umkehrfunktion. Sei D offen, f : D −→ R injektiv und stetig,
und sei f differenzierbar in x0 ∈ D, f 0 (x0 ) 6= 0. Dann ist f −1 differenzierbar in y0 := f (x0 ) und
(f −1 )0 (y0 ) =
1
f 0 (x
0)
.
Beweis. Wähle a, b ∈ D, so dass x0 ∈ (a; b) ⊂ D. Dann ist f |(a;b) streng mononton, o.B.d.A.
streng monoton fallend. y = f (x), y0 = f (x0 ).
x − x0
f −1 (y) − f −1 (y0 )
1
y→y0
=
,
−→ 0
y − y0
f (x) − f (x0 )
f (x0 )
denn mit y → y0 geht auch x → x0 , da f −1 stetig ist (Satz 2.4 und Lemma 1.13 in Kapitel 4). 2
2. LOKALE EXTREMA
127
Beispiel 1.8. Sei f : R>0 −→ R, f (x) = xa , a ∈ Q. Dann gilt
f 0 (x0 ) = axa−1
.
0
(1.9)
Dies zeigt man
• für a ∈ N ∪ {0} mit id0R (x0 ) = 1 und der Produktregel.
√
• für a = 1/n, n ∈ N mit Umkehrfunktion. Sei f (x) = xa = n x. Dann f = g −1 mit
g(x) = xn .
1
(1−n)/n
= ax0
= axa−1
.
0
n( x0 )n−1
0 ))
√
mit der Kettenregel xp/q = q xp .
mit der Quotientenregel
f 0 (x0 ) =
• Dann für a ∈ Q≥0
• Dann für a ∈ Q<0
1
g 0 (f (x
=
√
n
Ein anderer Beweis gilt sogar für alle a ∈ C:
exp(x + h) − exp(x)
exp(h) − exp(1)
= lim (exp x)
h→0
h→0
(x + h) − x
h
∞
X 1
exp h − exp 1
= (exp x) lim
hn−1
= (exp x) lim
h→0
h→0
h
n!
n=1
exp0 (x) = lim
= exp x.
Es folgt
log(x) =
1
1
= ,
exp log x
x
daraus dann
d(xa )
d(exp(a log(x)))
1
=
= exp0 (a log(x))a = axa−1
dx
dx
x
und somit (1.9) für alle a ∈ C.
2. Lokale Extrema
Definition 2.1. Sei (M, d) ein metrischer Raum, f : M −→ R, x0 ∈ M . Wir sagen f hat ein
lokales Maximum (bzw. lokales Minimum) in x0 , falls es eine Umgebung U von x0 gibt, so dass
∀x ∈ U : f (x) ≤ f (x0 )
lokales Extremum in x0
:⇐⇒
(bzw. f (x) ≥ f (x0 )).
lokales Maximum oder Minimum in x0
SATZ 2.2. Sei D ⊂ R offen, f : D −→ R, f differenzierbar in x0 ∈ D. Wenn f ein lokales
Extremum in x0 besitzt, so gilt f 0 (x0 ) = 0.
128
5. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
Beweis. OBdA lokales Maximum in x0 .
f (x) − f (x0 )
≤0
x − x0
f (x) − f (x0 )
≥0
x − x0
für x > x0 ,
x∈U
für x < x0 ,
x∈U
Somit f 0 (x0 ) = 0.
2
3. Mittelwertsätze
LEMMA 3.1. Sei A eine abgeschlossen und beschränkte Teilmenge von R. Dann nimmt f ein
Maximum und ein Minimum an, d.h. es gibt x1 , x2 ∈ A, so dass für alle x ∈ A:
f (x1 ) ≤ f (x) ≤ f (x2 ).
Beweis: siehe Kapitel 7 Korollar 5.6.
SATZ 3.2 (Satz von Rolle). Sei a < b. Sei f : [a; b] −→ R differenzierbar3 auf (a; b) und stetig auf
[a; b] und f (a) = f (b). Dann existiert ein c ∈ (a; b) mit f 0 (c) = 0.
Beweis. A := [a; b], wähle x1 und x2 wie im Lemma.
1. Fall: x1 ∈ {a, b} und x2 ∈ {a, b}. Dann gilt
f (a) = f (b) = max f# ([a; b]) = min f# ([a; b])
0
Also f konstant, also f (x0 ) = 0 für alle x0 ∈ (a; b).
2. Fall: x1 ∈ (a; b) oder x2 ∈ (a; b), oBdA x1 ∈ (a; b). Dann f 0 (x1 ) = 0.
2
SATZ 3.3 (1. Mittelwertsatz). Sei a < b. Sei f : [a; b] −→ R differenzierbar auf (a; b) und stetig
auf [a; b]. Dann existiert ein c ∈ (a; b) mit
f (b) − f (a) = (b − a)f 0 (c).
Beweis.
f (b) − f (a)
(x − a)
b−a
F (a) = f (a) = F (b). Wende den Satz von Rolle an.
F (x) := f (x) −
0 = F 0 (c) = f 0 (c) −
f (b) − f (a)
b−a
3Differenzierbar auf A (bzw. stetig auf A) bedeutet differenzierbar (bzw. stetig) in allen x ∈ A.
2
4. HÖHERE ABLEITUNGEN UND TAYLORSCHER SATZ
129
SATZ 3.4 (2. Mittelwertsatz). Sei a < b. Seien f, g : [a; b] −→ R differenzierbar auf (a; b) und
stetig auf [a; b]. Ferner gelte für alle x ∈ (a; b): g 0 (x) 6= 0. Dann existiert ein c ∈ (a; b) mit
f 0 (c)
f (b) − f (a)
= 0 .
g(b) − g(a)
g (c)
Beweis. Satz von Rolle liefert: g(b) 6= g(a). Definiere
F (x) := f (x) − f (a) −
f (b) − f (a)
(g(x) − g(a)).
g(b) − g(a)
Also F (a) = F (b) = 0. Nach dem Satz von Rolle gibt es ein c ∈ (a; b) mit
0 = F 0 (c) = f 0 (c) −
f (b) − f (a) 0
g (c).
g(b) − g(a)
2
7.2.2014
KOROLLAR 3.5. Sei f : (a; b) −→ R differenzierbar, so gilt:
f 0 (x) > 0 für alle x ∈ (a; b) =⇒ f ist streng monoton wachsend
f 0 (x) < 0 für alle x ∈ (a; b) =⇒ f ist streng monoton fallend
f 0 (x) ≥ 0 für alle x ∈ (a; b) ⇐⇒ f ist monoton wachsend
f 0 (x) ≤ 0 für alle x ∈ (a; b) ⇐⇒ f ist monoton fallend
f 0 (x) = 0 für alle x ∈ (a; b) ⇐⇒ f ist konstant
Beweis. Die =⇒-Pfeile folgen direkt aus dem Mittelwertsatz. Sei nun f monoton wachsend, dann
(x0 )
gilt f 0 (x0 ) = limx→x0 f (x)−f
≥ 0. Und analog folgt aus monoton fallend“ dann f 0 (x0 ) ≤ 0.
x−x0
”
Der dritte ⇐⇒-Pfeil folgt aus den beiden ersten.
2
4. Höhere Ableitungen und Taylorscher Satz
Sei I ⊂ R ein offenes Intervall.
C 0 (I) := {f : I −→ R | f stetig}
Ist f auf I differenzierbar, so erhalten wir f 0 : I −→ R, x 7→ f 0 (x).
Falls zusätzlich f 0 stetig ist, so nennen wir f stetig differenzierbar .
Ist f 0 differenzierbar, so nennt man f zweimal differenzierbar.. . . . Ist f 0 k-mal differenzierbar, so
nennt man f (k + 1)-mal differenzierbar.
f (0) := f , f (1) := f 0 , f (k+1) := (f 0 )(k) .
130
5. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
Für k ∈ N:
C k (I) := {f : I −→ R | f ist differenzierbar und f 0 ∈ C k−1 (I)}.
Die Menge der k-mal stetig differenzierbaren Funktionen.
T
C ∞ (I) := k∈N C k (I), die Menge der unendlich oft differenzierbaren Funktionen, glatt = unendlich
oft differenzierbar.
PROPOSITION 4.1. Sei f : (a; b) −→ R differenzierbar auf (a; b) und 2-mal differenzierbar in
x0 ∈ (a; b).
(1)
(2)
(3)
(4)
Es gelte f 0 (x0 ) = 0 und f 00 (x0 ) < 0. Dann besitzt f in x0 ein lokales Maximum.
Es gelte f 0 (x0 ) = 0 und f 00 (x0 ) > 0. Dann besitzt f in x0 ein lokales Minimum.
Besitzt f in x0 ein lokales Maximum, so gilt f 0 (x0 ) = 0 und f 00 (x0 ) ≤ 0.
Besitzt f in x0 ein lokales Minimum, so gilt f 0 (x0 ) = 0 und f 00 (x0 ) ≥ 0.
Beweis.
Zu (1): Die Funktion
f 0 (x)−f 0 (x0 )
x−x0
f 00 (x0 )
(
g(x) :=
für x 6= x0
für x = x0
ist stetig in x0 . Aus f 00 (x0 ) < 0 folgt dann mit dem -δ-Kriterium: Zu := |f 00 (x0 )|/2 gibt es dann
ein δ > 0, so dass für alle x ∈ (x0 − δ, x0 + δ) gilt x ∈ (a; b) und
0
f (x) − f 0 (x0 )
00
− f (x0 ) < .
x − x0
Daraus folgt
f 0 (x) − f 0 (x0 )
1
< f 00 (x0 ) + = f 00 (x0 ) < 0.
x − x0
2
Also gilt f 0 (x) < 0 für x ∈ (x0 ; x0 +δ) und f 0 (x) > 0 für x ∈ (x0 −δ; x0 ). Dies impliziert, zusammen
mit der Differenzierbarkeit von f , dass f (x0 ) = max f# ((x0 − δ, x0 + δ)).
Zu (2): Analog.
Zu (3). Wenn f 00 (x0 ) > 0 wäre, so hätte f in x0 ein lokales Maximum und Minimum, wäre also
konstant auf einer Umgebung von x0 . Somit f 00 (x0 ) = 0. Widerspruch.
Zu (4): Analog.
SATZ 4.2 (Satz von Taylor). Sei f : (a; b) −→ R (n + 1)-mal differenzierbar, x, x0 ∈ (a; b).
Definiere Rn (x, x0 ) durch
f (x) = f (x0 ) + (x − x0 )f 0 (x0 ) +
=
n
X
(x − x0 )j
j=0
Dann gilt:
j!
(x − x0 )2 (2)
(x − x0 )n (n)
f (x0 ) + · · · +
f (x0 ) + Rn (x, x0 )
2!
n!
f (j) (x0 ) + Rn (x, x0 )
4. HÖHERE ABLEITUNGEN UND TAYLORSCHER SATZ
131
f (n+1) (x0 )
Rn (x, x0 )
existiert
und
ist
gleich
.
x→x0 (x − x0 )n+1
(n + 1)!
f (n+1) (x0 + ϑ(x − x0 ))
Rn (x, x0 )
=
für ein ϑ ∈ (0; 1).
(2)
n+1
(x − x0 )
(n + 1)!
Lagrangesche Restglieddarstellung
(1) lim
Bemerkung: n = 0 ist der Mittelwertsatz.
Beweis. Wir fixieren ein x0 . Setze g(x) := Rn (x, x0 ), x 6= x0 . Man rechnet nach g(x0 ) = g 0 (x0 ) =
g (2) (x0 ) = · · · = g (n) (x0 ) und g (n+1) (x0 ) = f (n+1) (x0 ).
Rn (x, x0 )
(x − x0 )n+1
=
2.M W S
=
=
2.M W S
=
g(x) − g(x0 )
(x − x0 )n+1 − (x0 − x0 )n+1
g 0 (ξ1 )
(n + 1)(ξ1 − x0 )n
g 0 (ξ1 ) − g 0 (x0 )
(n + 1)(ξ1 − x0 )n − (n + 1)(x0 − x0 )n
g (2) (ξ2 )
n(n + 1) (ξ2 − x0 )n−1
..
.
=
2.M W S
=
g (n) (ξn ) − g (n) (x0 )
(n + 1)! (ξn − x0 )
g (n+1) (ξn+1 )
f (n+1) (ξn+1 )
=
(n + 1)!
(n + 1)!
für geeigenete ξj , mit x0 < ξn+1 < ξn < · · · < ξ1 < x oder x0 > ξn+1 > ξn > · · · > ξ1 > x. Hieraus
folgt Teil (2) des Satzes.
In der zweitletzten Zeile der Umformung steht (bis auf den Faktor (n + 1)!) der Differenzenquotient
von g (n) , der für ξn → x0 gegen
1
1
g (n+1) (x0 ) =
f (n+1) (x0 )
(n + 1)!
(n + 1)!
konvergiert.
Wegen |ξn − x0 | ≤ |x − x0 | haben wir dieselbe Aussage auch im Limes x → x0 . Somit
lim
x→x0
Somit gilt auch (1).
Rn (x, x0 )
1
=
f (n+1) (x0 )
(x − x0 )n+1
(n + 1)!
2
132
5. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
Definition 4.3. Sei f : (a; b) −→ R (n + 1)-mal differenzierbar, x0 ∈ (a; b). Dann nennt man
Tn (f, x0 )(x) :=
n
X
f (j) (x0 )
j=0
j!
(x − x0 )j
das Taylor-Polynom n-ten Grades von f mit Entwicklungspunkt x0 . Ist f ∈ C ∞ ((a; b)), dann nennt
man
∞
X
f (j) (x0 )
(x − x0 )j
T (f, x0 )(x) =
j!
j=0
die Taylorreihe von f mit Entwicklungspunkt x0 .
Anwendung: Potenzreihendarstellung der Logarithmus-Funktion.
log0 (x) = x1 ,
log(j) (x) = (−1)j−1 (j−1)!
xj
log(1) = 0, log(j) (1) = (−1)j−1 (j − 1)!
Tn (log, 1)(x) =
Pn
log(1)
(x − 1)0 + j=1
0!
|
{z
}
(−1)j−1 (j−1)!
(x
j!
− 1)j =
Pn
j=1
(−1)j−1
(x
j
− 1)j
0
Fragen 4.4.
• Konvergiert die Potenzreihe T (log, 1)(x) für manche x 6= 1? In anderen Worten: ist der
Konvergenzradius der Reihe positiv?
• Falls ja: gilt im Konvergenzbereich log(x) = T (log, 1)(x)?
Antwort: Ja für x ∈ (0; 2).
Wir wollen die Aussage für x ∈ [1; 2) zeigen. Für x ∈ (0; 1) kann man die Ausage mit einer
anderen Version des Satzes von Taylor zeigen, der Cauchysche Restglieddarstellung, siehe [1, Kap.
IV, Korollar 3.8 und Anwendungen].
Nach dem Satz von Taylor existiert ein ϑ ∈ (0; 1) mit
(x − 1)n+1
log(n+1) (1 + ϑ(x − 1))
(n + 1)!
n!
(x − 1)n+1
= (−1)n
(n + 1)! (1 + ϑ(x − 1))n+1
log x − Tn (log, 1)(x) = Rn (x, 1) =
Also
(x − 1)n+1
n!
≤ 1
| log x − Tn (log, 1)(x)| = n+1
n+1
(n + 1)! (1 + ϑ(x − 1))
Also Tn (log, 1)(x) −→ log(x) für x ∈ [1; 2).
5. DIFFERENTIATION VON FOLGEN UND REIHEN
133
PROPOSITION 4.5. Die Taylorreihe von log : R>0 → R mit Entwicklungspunkt 1 ist
∞
X
(−1)j−1
T (log, 1)(x) =
(x − 1)j .
j
j=1
Die Reihe konvergiert für |x − 1| < 1, also für insbesondere für x ∈ (0; 2). Außerdem gilt für alle
x ∈ (0; 2):
log x = T (log, 1)(x).
Beweis. Dass die Reihe für |x − 1| < 1 konvergiert, folgt (z.B.) aus dem Quotientenkriterium.
Dass die Reihe für x ∈ [1; 2) gegen log x konvergiert, wurde oben gezeigt. Die Aussage, dass die
Reihe für x ∈ (0; 1] gegen log x konvergiert, zeigen wir aus Zeitgründen nicht mehr.
2
Übrigens: In der Analysis III werden Sie Sätze kennenlernen, die besagen: wenn log x = T (log, 1)(x)
für alle x ∈ [1; 2) gilt, dann auch für alle x ∈ (0; 1).
VORLESUNGSENDE ANALYSIS I und VORLESUNGSBEGINN ANALYSIS II
5. Differentiation von Folgen und Reihen
Sei fn : (a; b) −→ R eine Folge differenzierbarer Funktionen, die gleichmäßig gegen f : (a; b) −→ R
konvergiert.
Frage 5.1. Ist dann f ebenfalls differenzierbar?
Bevor wir die Frage beantworten, wollen wir nochmals gleichmäßig Konvergenz von Folgen von
Funktionen betrachten.
Wdh: (Supremums-Norm). Sei f : D → R
kf k∞ := sup{|f (x)| | x ∈ D} ∈ [0; ∞]
Dann haben wir
kf1 + f2 k∞ ≤ kf1 k∞ + kf2 k∞ .
LEMMA 5.2. Sei D eine Menge und fn : D → R eine Folge von Funktionen. Dann sind die
folgenden Aussagen äquivalent:
(1) (fn )n∈N konvergiert gleichmäßig (gegen eine Funktion D → R)
(2)
∀ ∈ R>0 : ∃n0 ∈ N : ∀j, k ∈ N≥n0 : kfj − fk k∞ ≤ (3)
∀ ∈ R>0 : ∃n0 ∈ N : ∀j, k ∈ N≥n0 : ∀x ∈ D : |fj (x) − fk (x)| ≤ Im Fall D = {x0 } steht hier: (fn (x0 )) konvergiert genau dann, wenn (fn (x0 )) eine Cauchy-Folge
ist.
7.4.2014
134
5. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
(2)⇐⇒(3)“ folgt direkt aus der Definition von k . k∞ .
”
(1)=⇒(2)“: Es konvergiere (fn )n∈N gleichmäßig, f := limn→∞ fn . Sei > 0 gegeben. Hierzu
”
existiert ein n1 ∈ N, so dass für alle j ∈ N≥n1 gilt:
Beweis.
kfj − f k∞ ≤ Es folgt dann für j, k ∈ N≥n1 :
kfj − fk k∞ ≤ kfj − f k∞ + kf − fk k∞ ≤ + = 2.
Wir haben (2) gezeigt.
(3)=⇒(1)“: Wegen (3) ist (fn (x)) eine Cauchy-Folge, sei f (x) := limn→∞ fn (x), f : D → R. Zu
”
gegebenem > 0 wähle man ein n0 wie in (3). Für j ∈ N≥n0 :
|f (x) − fj (x)| = | lim fk (x) − fj (x)| = lim |fk (x) − fj (x)| ≤ k→∞
k→∞
Da dies für alle x ∈ D gilt, haben wir
kf − fj k∞ ≤ .
Wir haben also gezeigt:
∀ ∈ R>0 : ∃n0 ∈ N : ∀j ∈ N≥n0 : kfj − f k∞ ≤ 2
und dies ist (1).
Nun wenden wir uns Frage 5.1 zu.
Beispiele 5.3.
q
(1) fn (x) := x2 + n1 konvergiert gleichmäßig gegen f (x) = |x|.
Denn für reelle Zahlen a, b ∈ R gilt
a2 + b2 ≤ |a|2 + |b|2 + 2|a| |b| = (|a| + |b|)2
und somit
p
a2 + b2 ≤ |a| + |b|.
√
Wenden wir dies auf a := x und b := 1/ n an, so erhalten wir
1
|x| ≤ fn (x) ≤ |x| + √ .
n
Also |fn (x) − f (x)| ≤ √1n .
Nun sind alle Funktionen fn differenzierbar (auf R), aber f ist in 0 nicht differenzierbar. Siehe
auch [19, Abschnitt 9.5].
5. DIFFERENTIATION VON FOLGEN UND REIHEN
135
(2) Wir betrachten die Reihe
fn : R → R,
fn (x) :=
n
X
1
sin(`2 x)
`2
`=1
(fn : R → R)n∈N konvergiert gleichmäßig, denn
|fj (x) − fk (x)| = |
j
j
∞
X
X
X
1
1
1
2
sin(`
≤
→0
x)|
≤
`2
`2
`2
`=k+1
`=k+1
für j ≥ k,
k→∞
`=k+1
Gliedweises Differenzieren liefert:
fn0 (x)
=
n
X
cos(`2 x)
`=1
Diese Reihe ist divergent, u.a. da für viele x ∈ R, z.B. für x = 1 die Folge (cos(`2 x))` keine
Nullfolge ist.
THEOREM 5.4. Seien a, b, x0 ∈ R mit a < x0 < b. Sei fn : (a; b) −→ R eine Folge von differenzierbaren Funktionen, so dass
(1) (fn (x0 ))n∈N konvergiert (Konvergenz in einem Punkt)
(2) (fn0 )n∈N konvergiert gleichmäßig
Dann gilt:
(i) fn : (a; b) −→ R konvergiert gleichmäßig gegen eine Funktion, die wir f : (a; b) −→ R nennen.
(ii) f ist differenzierbar auf (a; b)
(iii) fn0 konvergiert gegen f 0
Beweis. Sei x1 ∈ (a; b) und j, k ∈ N.
(
[x0 ; x1 ] falls x1 ≥ x0 ,
I :=
[x1 ; x0 ] falls x1 < x0 .
Wir wenden den 1. Mittelwertsatz auf die Funktion I → R, x 7→ fj (x) − fk (x) an: Es existiert ein
ξ ∈ I ⊂ (a; b), so dass
(fj (x0 ) − fk (x0 )) − (fj (x1 ) − fk (x1 )) = (x0 − x1 )(fj0 (ξ) − fk0 (ξ)).
Dies ergibt
|fj (x1 ) − fk (x1 )| ≤ |x0 − x1 | |fj0 (ξ) − fk0 (ξ)| + |fj (x0 ) − fk (x0 )|
Wir wählen für eine gegebenes > 0 die Zahl n0 so groß, dass für alle j, k ∈ N≥n0 gilt: |fj (x0 ) −
fk (x0 )| ≤ /2. Dies ist möglich, da (fn (x0 ))n∈N eine Cauchy-Folge ist, siehe (1).
136
5. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
Wir wählen nun eine Zahl n1 , so dass für alle j, k ∈ N≥n1 , so das für alle x ∈ (a; b) gilt:
|fj0 (x) − fk0 (x)| <
.
2(b − a)
Dies ist möglich, da fj0 gleichmäßig konvergiert, siehe (2).
Somit gilt für n2 := max{n0 , n1 } für alle j, k ∈ N≥n2 und alle x1 ∈ (a; b) die Ungleichung
|b − a|
|fj (x1 ) − fk (x1 )| ≤ |x0 − x1 | |fj0 (ξ) − fk0 (ξ)| + |fj (x0 ) − fk (x0 )| <
+ =
{z
} 2(b − a) 2
{z
} |
|
< 2(b−a)
</2
Also kfj − fk k∞ ≤ .
Lemma 5.2 besagt nun, dass (fn )n∈N gleichmäßig konvergiert gegen eine Funkion f : (a; b) → R.
Es folgt Aussage (i).
Sei nun g(x) := limn→∞ fn0 (x). Wähle zu gegebenem > 0 ein n3 ∈ N, so dass für j, k ∈ N≥n3 gilt:
kfj0 − fk0 k∞ ≤ und kfj0 − gk∞ ≤ .
Für solche j und k wenden wir ähnlich wie oben wieder den 1. Mittelwertsatz auf die Funktion
x 7→ fj (x) − fk (x) an.
(fj (x) − fk (x)) − (fj (x2 ) − fk (x2 )) 1. MWS 0
=
|fj (ξ) − fk0 (ξ)| ≤ .
x − x2
Im Grenzwert k → ∞ erhalten wir
(fj (x) − f (x)) − (fj (x2 ) − f (x2 )) ≤ .
(5.5)
x − x2
Diese Abschätzung gilt für alle x ∈ (a; b), x 6= x2 , j ≥ n3 ; und n3 hängt nicht von x ab, sondern
nur von . Manchmal schreibt man hierfür kurz n3 = n3 (), um auszudrücken, dass n3 nur von abhängt, auch wenn diese Formulierung leicht falsch verstanden werden kann.
Da die Funktion fj in x2 differenzierbar ist, gibt es 4 zu oben gegebenem > 0 und j ≥ n3 () ein
δj > 0, so dass für alle x ∈ (x2 − δj ; x2 + δj ) gilt:
fj (x) − fj (x2 )
0
(5.6)
−
f
(x
)
2 ≤ .
j
x − x2
Aus (5.5), (5.6) und kfj0 − gk∞ ≤ folgt für j ≥ n3 ()
f (x) − f (x2 )
(5.7)
∀x ∈ (x2 − δj ; x2 + δj ) : − g(x2 ) ≤ 3.
x − x2
4Achtung: wir behaupten hier: für jedes j gibt es solch ein δ . Man muss hier aber davon ausgehen, dass dieses
j
δj von j abhängen kann.
5. DIFFERENTIATION VON FOLGEN UND REIHEN
137
Wir haben gezeigt: Für jedes > 0 haben wir ein j gefunden, und dann dazu ein δj > 0, so dass
(5.7) gilt. Dies ergibt
f (x) − f (x2 )
lim
= g(x2 )
x→x2
x − x2
und somit die Aussagen (ii) und (iii).
2
SATZ 5.8.
P∞
j=0
aj xj , aj ∈ R eine Potenzreihe mit Konvergenzradius ρ > 0. Dann ist die Funktion
f : (−ρ; ρ) → R,
x 7→
∞
X
aj xj
j=0
differenzierbar und
f 0 (x) =
∞
X
jaj xj−1 .
j=1
Man kann also in dieser Situation die Ableitung in die unendliche Summe hineinziehen“. Obige
”
Beispiele zeigen aber, dass dies eben nicht für alle gleichmäßig konvergenten Reihen von Funktionen
gilt.
Beweis.
Wähle ein R ∈ (0; ρ). Wir wollen Theorem 5.4 anwenden für: fn : (−R, R) → R, fn (x) =
Pn
j
a
x
, x0 = 0. Hierzu überprüfen wir, dass fn0 : (−R, R) → R gleichmäßig konvergiert. 5
j
j=0
Wir rechnen
fn0 (x) =
n
X
jaj xj−1
j=0
Pn
Diese Summe konvergiert für n → ∞ genau dann, wenn hn (x) := j=0 jaj xj konvergiert. Wir
P∞
berechnen den Konvergenzradius ρ0 der Potenzreihe j=0 jaj xj .
q
q
p
j
j
j
j
lim sup |aj |
lim sup j|aj | = lim
j→∞
j→∞
j→∞
|
{z
}
=1
0
P∞
jaj xj−1 ist ρ.
P∞
Wegen Beispiel 5.7 in Kapitel 4 konvergiert die Potenzreihe j=0 jaj xj−1 auf (−R; R) gleichmäßig.
Damit ist die folgende Aussage gemeint: Wir definieren die folgende Folge von Funktionen
n
X
gn : (−R; R) → R,
x 7→
jaj xj−1 .
Also ρ = ρ, das heißt der Konvergenzradius von
j=0
j=0
Diese Folge konvergiert gleichmäßig gegen eine Funktion g : (−R; R) → R.
2
5Achtung: Für viele Potenzreihen konvergiert f 0 : (−ρ, ρ) → R nicht gleichmäßig. Erst nach Einschränkung auf
n
ein etwas kleineres Intervall (−R, R) erhalten wir gleichmäßige Konvergenz. Siehe die analoge Fussnote in Kapitel 4,
Abschnitt 5.
138
5. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
Beispiele 5.9.
(1) exp : R → R, x 7→
P∞
1 j
j=0 j! x
ist differenzierbar und
exp0 (x) =
(2) sin : R → R, x 7→
∞
∞
j−1
X
j j−1 X (j − 1)!
x
=
= exp(x)
j!
x
j=1
j=1
P∞
1
2j+1
j
j=0 (−1) (2j+1)! x
sin0 (x) =
ist differenzierbar und
∞
X
j=0
1 2j
x = cos(x)
(2j)!
FOLGERUNG 5.10. Potenzreihen mit Konvergenzradius ρ > 0 sind auf dem Intervall (−ρ, ρ)
glatt, d.h. unendlich oft differenzierbar. Die Taylorreihe mit Entwicklungspunkt 0 von einer Potenzreihe ist wieder genau diese Potenzreihe.
∞
∞
X
X
T(
aj xj , 0)(x) =
aj xj .
j=0
j=0
2
9.4.2014
Vereinfachte Notationen ab jetzt:
•
•
•
•
Quantoren hinter Aussagen sind erlaubt, falls keine Missverständnisse zu erwarten
Wir schreiben im(f ) für B(f ),
f (A) für f# (A),
und f −1 (A) für f # (A).
KAPITEL 6
Integral-Rechnung für Funktionen einer Veränderlichen
Ziel: Integration von Funktionen. Flächeninhalt unter dem Graphen einer Funktion.
BILD
1. Partitionen und Treppenfunktionen
Sei I eine Menge. (Partielle) Ordnung auf Abb(I, R) = RI 3 f, g:
f ≤g
:⇐⇒
∀x ∈ I : f (x) ≤ g(x).
Definition 1.1. Eine Zerlegung von I = [a, b], a, b ∈ R ist ein Tupel (t0 , t1 , . . . , tk ) ∈ Rk+1 mit
a = t0 < t1 < · · · < tk = b. Wir schreiben Z = {t0 < t1 < · · · < tk }. Man nennt Z1 = {s0 <
s1 < · · · < s` } eine Verfeinerung von Z2 = {t0 < t1 < · · · < tk }, wenn Z1 durch Hinzufügen von
Punkten aus Z2 entsteht, in anderen Worten falls
{ti | i = 0, 1, . . . , k} ⊂ {si | i = 0, 1, . . . , `}.
Zu zwei Zerlegungen Z1 und Z2 von [a, b] gibt es Zerlegung Z3 die feiner als Z1 und feiner als Z2
ist: vereinige hierzu die Mengen der Zerlegungspunkte und ordne sie.
Definition 1.2. Eine Funktion f : [a, b] → R heißt Treppenfunktion, falls es eine Zerlegung
Z = {t0 < t1 < · · · < tk } gibt, so dass f |(tj−1 ;tj ) konstant ist für alle j ∈ {1, 2, . . . , k}. Wir nennen
dieses Z eine Zerlegung, die zu der Treppenfunktion passt. Jede Verfeinerung einer passenden
Zerlegung passt ebenfalls. Die Menge der Treppenfunktionen [a, b] → R nennen wir T [a; b].
Treppenfunktionen sind beschränkt, da sie nur endlich viele Werte annehmen.
LEMMA 1.3. Sind f, f1 , f2 ∈ T [a; b], λ1 , λ2 ∈ R dann folgt auch
(a) λ1 f1 + λ2 f2 ∈ T [a; b], d.h. T [a; b] ist ein Vektorraum.1
(b) f1 f2 ∈ T [a; b], d.h. T [a; b] ist ein Ring bzw. eine Algebra.2
(c) max{f1 , f2 } ∈ T [a; b] und min{f1 , f2 } ∈ T [a; b] 3
1Hier wird wieder wie immer definiert (λ f + λ f )(x) := λ f (x) + λ f (x).
1 1
2 2
1 1
2 2
2Hier wird wieder wie immer definiert (f f )(x) := f (x)f (x).
1 2
1
2
3Hier wird wieder wie immer definiert max{f , f }(x) :=
1
2
min{f1 (x), f2 (x)}
139
max{f1 (x), f2 (x)} und min{f1 , f2 }(x) :=
140
6. INTEGRAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
(d) |f | = max{f, −f } ∈ T [a; b]
Beweis klar.
Definition 1.4. Für eine Treppenfunktion f ∈ T [a; b] mit passender Zerlegung Z = {t0 < t1 <
· · · < tk } definieren wir das Integral
Z b
k
X
tj−1 + tj
(Z) f (x) dx :=
∈ R.
(tj − tj−1 ) f
2
a
j=1
BILD
Wenn Z1 und Z2 zu einer Treppenfunktion f passen, so gilt
Z b
Z b
(Z1 ) f (x) dx = (Z2 ) f (x) dx.
a
a
Wir schreiben hierfür deswegen ab sofort einfach
Z b
f (x) dx.
a
PROPOSITION 1.5. Die Abbildung
Rb
a
: T [a; b] → R ist
1) linear, d.h.
b
Z
∀f1 , f2 ∈ T [a; b] : ∀λ1 , λ2 ∈ R :
b
Z
Z
(λ1 f1 (x) + λ2 f2 (x)) dx = λ1
a
f1 (x) dx + λ2
a
b
f2 (x) dx
a
2) monoton, d.h.
∀f1 , f2 ∈ T [a; b] :
Z
f1 ≤ f2
b
Z
f1 (x) dx ≤
=⇒
a
b
f2 (x) dx
a
Beweis klar aus der Konstruktion des Integrals.
2. Das Riemann-Integral
f ∈ R[a;b] ist nach oben beschränkt ⇐⇒ ∃g ∈ T [a; b] : g ≥ f ⇐⇒ (T [a; b])≥f 6= ∅
f ∈ R[a;b] ist nach unten beschränkt ⇐⇒ ∃g ∈ T [a; b] : g ≤ f ⇐⇒ (T [a; b])≤f 6= ∅
Definition 2.1. Sei f : [a; b] → R eine beschränkte Funktion. Wir definieren das Riemannsche
Oberintegral als
(Z
)
Z b
b
f (x) dx := inf
g(x) dx g ∈ (T [a; b])≥f
a
a
2. DAS RIEMANN-INTEGRAL
und das Riemannsche Unterintegral als
(Z
Z b
f (x) dx := sup
b
a
a
141
g(x) dx g ∈ (T [a; b])≤f
)
Für die beschränkte Funktion f gilt
b
Z
−∞ <
b
Z
f (x) dx ≤
a
f (x) dx < ∞
a
Ist f ∈ T [a; b], so gilt
Z
b
Z
f (x) dx =
a
b
b
Z
f (x) dx =
a
f (x).
a
Definition 2.2. Man nennt f ∈ R[a;b] Riemann-integrierbar , falls f beschränkt ist und falls
Z b
Z b
f (x) dx = f (x) dx.
a
a
In diesem Fall nennt man
Z
b
Z
f (x) dx :=
b
f (x) dx
a
a
das Riemann-Integral von f .
R[a; b] := {f ∈ R[a;b] | f ist Riemann-integrierbar}
LEMMA 2.3. Sei f ∈ R[a;b] . Dann gilt
Z
f ∈ R[a; b]
⇐⇒
b
∀ ∈ R>0 : ∃gu , go ∈ T [a; b] : ( gu ≤ f ≤ go )∧
go (x) dx −
a
Für gu und g0 wie oben gilt dann wegen der Monotonie
Z b
Z b
Z
gu (x) dx ≤
f (x) dx ≤
a
a
Z
b
!
gu (x) dx ≤ .
a
b
go (x) dx.
a
BILD
Beweis.
=⇒“: Auf Grund der Definition des Oberintegrals gibt es eine Treppenfunktion go ≥ f mit
”
Rb
Rb
g (x) dx ≤ a f (x) dx + /2. Auf Grund der Definition des Unterintegrals gibt es eine Treppena o
Rb
Rb
funktion gu ≤ f mit a gu (x) dx ≥ a f (x) dx−/2. Da da Oberintegral von f mit dem Unterintegral
übereinstimmt, gilt
Z b
Z b
go (x) dx −
gu (x) dx ≤ a
a
142
6. INTEGRAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
⇐=“: Gilt die rechte Seite, so haben wir für jedes > 0:
”
Z b
Z b
Z b
Z
f (x) dx ≤
go (x) dx −
0 ≤ f (x) dx −
a
a
a
b
gu (x) dx ≤ .
a
2
Daraus folgt die Riemann-Integrierbarkeit.
LEMMA 2.4. Sind f, f1 , f2 ∈ R[a; b], λ1 , λ2 ∈ R dann folgt auch
(a)
(b)
(c)
(d)
λ1 f1 + λ2 f2 ∈ R[a; b], d.h. R[a; b] ist ein Vektorraum.
f1 f2 ∈ R[a; b], d.h. R[a; b] ist ein Ring bzw. eine Algebra.
max{f1 , f2 } ∈ R[a; b] und min{f1 , f2 } ∈ R[a; b]
|f | = max{f, −f } ∈ R[a; b]
Beweis.
(a): Übungsaufgabe.
(c): Wir zeigen zunächst: Ist f ∈ R[a; b], dann auch f + := max{f, 0}.
Rb
Sei also f ∈ R[a; b] und > 0 gegeben. Wir nehmen g, h ∈ T [a; b] mit g ≤ f ≤ h und a h(x) dx −
Rb
g(x) dx ≤ . Wir setzen g + := max{g, 0} ∈ T [a; b] und h+ := max{h, 0} ∈ T [a; b]. Dann gilt
a
+
g ≤ f + ≤ h+ und
h(x) − g + (x) falls h(x) ≥ 0
h+ (x) − g + (x) =
≤ h(x) − g(x)
0
falls h(x) < 0
Also
Z
b
h+ (x) dx −
a
Z
b
g + (x) dx ≤
a
Z
b
Z
h(x) dx −
a
b
g(x) dx ≤ .
a
Also ist dann f + ∈ R[a; b].
Wegen max{f1 , f2 } = f2 + max{f1 − f2 , 0} und min{f1 , f2 } = f2 − max{f2 − f1 , 0} folgt dann (c).
(b): Der Fall f1 ≥ 0 und f2 ≥ 0 ist ebenfalls Übungsaufgabe. Der allgemeine Fall folgt dann aus
der Gleichung
f1 f2
=
max{f1 , 0} max{f2 , 0} − max{−f1 , 0} max{f2 , 0}
− max{f1 , 0} max{−f2 , 0} + max{−f1 , 0} max{−f2 , 0}.
2
(d): folgt direkt aus (c).
PROPOSITION 2.5. Die Integration
Rb
a
: R[a; b] → R ist linear und monoton.
Der Beweis ist nicht schwer, wenn man Proposition 1.5 nutzt. Dies sollten nun alle selbst ausführen
können.
2. DAS RIEMANN-INTEGRAL
PROPOSITION 2.6. Für f ∈ R[a; b] gilt:
Z
Z b
f (x) dx ≤
143
b
|f (x)| dx ≤ kf k∞ (b − a)
a
a
Beweis. Wegen f = max{f, 0} − max{−f, 0} und |f | = max{f, 0} + max{−f, 0} folgt
Z b
Z b
Z b
max{f (x), 0} dx −
f (x) dx ≤ max{−f (x), 0} dx
a
a
a
|
{z
} |
{z
}
≥0
∗
Z
b
≤
≥0
Z
max{f (x), 0} dx +
max{−f (x), 0} dx
a
Z
b
a
b
|f (x)| dx,
=
a
wobei wir an der Stelle * die Dreiecks-Ungleichung |a − b| ≤ |a| + |b| benutzt haben.
Wegen |f (x)| ≤ kf k∞ folgt
Z
b
Z
b
|f (x)| dx ≤
kf k∞ dx ≤ kf k∞ (b − a).
a
a
2
14.4.2014
LEMMA 2.7. Seien a, b, c ∈ R mit a < b < c, und f : [a; c] → R. Dann gilt
f ∈ R[a; c]
⇐⇒
f |[a;b] ∈ R[a; b] und f |[b;c] ∈ R[b; c]
und wenn f Riemann-integrierbar ist, so gilt
Z c
Z b
Z
f (x) dx =
f |[a;b] (x) dx +
a
a
c
f |[b;c] (x) dx.
b
Beweis. Man wählt wieder geeignete Treppenfunktionen oberhalb und unterhalb von f und setzt
diese zusammen oder durchtrennt sie an der Stelle b.
2
Notation 2.8. Die Integrationsvariable (bis jetzt immer x) kann durch jede andere noch nicht
vergebene Variable ersetzt werden:
Z b
Z b
Z b
f (x) dx =
f (y) dy = · · · =
f (t) dt
a
a
a
aber zum Beispiel
Z
b
f (a) da
a
144
6. INTEGRAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
ist nicht erlaubt. Gilt [a; b] ⊂ [c; d] und f ∈ R[c; d], dann schreiben wir
Z b
Z b
f (x) dx :=
f |[a;b] (x) dx.
a
a
Gilt a > b, und f ∈ R[b; a], so definieren wir
Z
Z b
f (x) dx := −
a
f (x) dx.
b
a
Insbesondere gilt für alle reelle Zahlen a, b, c ∈ [d; e] ⊂ R und für alle f ∈ R[d; e]:
Z c
Z b
Z c
f (x) dx.
f (x) dx +
f (x) dx =
b
a
a
3. Monotone Funktionen sind Riemann-integrierbar
SATZ 3.1. Sei a, b ∈ R, a < b, und f : [a; b] → R eine monotone Funktion. Dann ist f ∈ R[a; b].
Beweis. O.B.d.A. sei f monoton wachsend. Sei ∈ R>0 gegeben. Zu einer Zahl k ∈ N, die wir
noch geeignet wählen werden, definieren wir:
tj := a + j
b−a
.
k
Insbesondere ist {t0 < t1 < · · · < tk } eine Zerlegung von [a; b]. Wir definieren die Treppenfunktionen go , gu ∈ T [a; b], so dass für alle j ∈ {1, 2, . . . k} und alle x ∈ [tj−1 ; tj ) gilt
go (x) = f (tj ),
gu (x) = f (tj−1 );
und go (b) = gu (b) = f (b).
BILD
Da f monoton wachsend ist gilt gu ≤ f ≤ go . Außerdem
X
Z b
k
k
X
b−a
tj−1 + tj
go (x) dx =
(tj − tj−1 ) go
=
f (tj ),
2
k
a
j=1
j=1
Z
b
gu (x) dx
a
=
X
k
k
X
b−a
tj−1 + tj
=
f (tj−1 ).
(tj − tj−1 ) gu
2
k
j=1
j=1
Somit
Z
b
Z
go (x) dx −
a
b
gu (x) dx
a
=


k
k−1
X
b − a X
b−a
f (tj ) −
f (t` ) =
(f (b) − f (a))
k
k
j=1
`=0
4. STETIGE FUNKTIONEN SIND RIEMANN-INTEGRIERBAR
145
Wenn wir also bei der obigen Konstruktion der tj , die Zahl k ∈ N so groß wählen, dass
k≥
dann gilt
Rb
a
go (x) dx −
Rb
a
b−a
(f (b) − f (a)),
gu (x) dx ≤ . Mit Lemma 2.3 folgt die Riemann-Integrierbarkeit.
2
4. Stetige Funktionen sind Riemann-integrierbar
LEMMA 4.1. Sei f : [a; b] → R stetig. Dann ist f auch gleichmäßig stetig, d.h.
(4.2)
∀ ∈ R>0 : ∃δ ∈ R>0 : ∀x, y ∈ [a; b] : |x − y| ≤ δ =⇒ |f (x) − f (y)| ≤ .
Beweis. Angenommen f ist nicht gleichmäßig stetig. Es gibt dann ein > 0, so dass
(4.3)
∀δ ∈ R>0 : ∃x, y ∈ [a; b] : |x − y| ≤ δ ∧ |f (x) − f (y)| > .
Zu jedem n ∈ N, und δ := δn := 1/n wählen wir xn , yn ∈ [a; b] wie in (4.3). Auf Grund des Satzes
von Bolzano-Weierstraß (Korollar 5.53 in Kapitel 2) gibt es eine Teilfolge (xnk )k∈N , so dass
lim xnk
k→∞
existiert. Sei x := limk→∞ xnk ∈ [a; b]. Wegen |xnk − ynk | ≤ 1/nk gilt auch x = limk→∞ ynk . Da f
stetig ist gilt dann auch
f (x) = lim f (xnk ) = lim f (ynk ),
k→∞
k→∞
also
lim (f (xnk ) − f (ynk )) = 0.
k→∞
Dies widerspricht jedoch der obigen Wahl von xnk und ynk , denn diese haben wir so gewählt, dass
für alle k ∈ N die Ungleichung |f (xnk ) − f (ynk )| > gilt.4
Wir haben gezeigt, dass die Annahme, f sei nicht gleichmäßig stetig, einen Widerspruch impliziert.
Also muss f gleichmäßig stetig sein.
2
SATZ 4.4. Sei f : [a; b] → R stetig. Dann ist f Riemann-integrierbar. In anderen Worten:
C 0 ([a; b]) ⊂ R[a; b].
Beweis. Zu einem gegebenen > 0 wähle δ > 0 wie in (4.2). Dann wählen wir k so groß, dass
(b − a)/k < δ. Definiere ähnlich wie oben
tj := a + j
4Und natürlich für das feste oben gewählte > 0!
b−a
.
k
146
6. INTEGRAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
Wir definieren die Treppenfunktionen go , gu ∈ T [a; b], so dass für alle j ∈ {1, 2, . . . k} und alle
x ∈ [tj−1 ; tj ) gilt
go (x) = sup{f (x) | x ∈ [tj−1 , tj )},
gu (x) = inf{f (x) | x ∈ [tj−1 , tj )}
und go (b) = gu (b) = f (b). Dann gilt 0 ≤ go (x) − gu (x) ≤ , und deswegen
Z b
Z b
go (x) dx −
gu (x) dx ≤ (b − a),
a
a
und offensichtlich gu ≤ f ≤ go . Mit Lemma 2.3 folgt die Riemann-Integrierbarkeit.
2
!ACHTUNG!. Wenn eine Funktion f : (a; b) → R stetig ist, so kann man daraus nicht schließen,
dass f Riemann-integrierbar ist. Beispiel: Die Funktion f : (0; 1) → R, x →
7 1/x, ist stetig, aber
nicht beschränkt und somit auch nicht Riemann-intergierbar.
5. Hauptsatz der Differential- und Integralrechnung
SATZ 5.1 (Hauptsatz der Differential- und Integralrechnung, Teil I). Sei f ∈ R[a; b], γ ∈ [a; b].
Definiere
Z x
F : [a; b] → R,
F (x) :=
f (t) dt.
γ
Dann gilt
(1) F ist stetig auf [a; b]
(2) Ist f stetig in x0 ∈ (a; b), so ist F differenzierbar in x0 , und F 0 (x0 ) = f (x0 ).
Beweis.
(1) f ∈ R[a; b], also f beschränkt, somit
sup
< ∞.
im |f |
| {z }
={f (x)|x∈[a;b]}
Sei x, x0 ∈ [a; b].
Z
F (x) − F (x0 ) = x
x0
Z
f (t) dt ≤ x
x0
|f (t)| dt ≤ |x − x0 | sup(im |f |)
Zu gegebenem > 0 wählen wir nun δ := /(sup(im |f |)) > 0 und dann ist das -δ-Kriterium
für Stetigkeit in x0 erfüllt.
5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG
147
(2)
F (x) − F (x0 )
−
f
(x
)
0 x − x0
Z
1 x
(f
(t)
−
f
(x
))
dt
= 0
x − x0
x0
Z x
1 ≤ |(f
(t)
−
f
(x
))|
dt
0
x − x0
x0
o
n
≤ sup |f (t) − f (x0 )| t ∈ [x, x0 ] bzw. t ∈ [x0 , x]
Wir fixieren nun ein > 0. Da f in x0 stetig gibt es zu diesem > 0 ein δ > 0, so dass für alle
t ∈ [a; b] mit |t − x0 | ≤ δ gilt:
|f (t) − f (x0 )| ≤ ,
insbesondere gilt für x ∈ [a; b] ∩ [x0 − δ; x0 + δ]:
n
o
F (x) − F (x0 )
≤
sup
|f
(t)
−
f
(x
)|
−
f
(x
)
0 t ∈ [x; x0 ] bzw. t ∈ [x0 ; x] ≤ .
0 x − x0
Daraus ergibt sich
F (x) − F (x0 )
− f (x0 )
x→x0
x − x0
und somit die Behauptung im zweiten Teil.
lim
=0
2
16.4.2014
◦
Ist A ⊂ R, so definieren wir das Innere A von A als
◦
A := R r (R r A),
wobei B der Abschluss von B ist (siehe Übungsblatt 1, Aufgabe 2).
◦
◦
Bsp: I := [a; b], I = (a; b). J offen in R, J = J.
Definition 5.2. Sei A ein Intervall oder eine offene Teilmenge von R, und f : A → R. Wir
sagen F : A → R ist eine Stammfunktion von f , wenn F stetig ist, F |A◦ differenzierbar ist und
◦
F 0 (x) = f (x) für alle x ∈ A.
Beispiele 5.3.
(1) Der Hauptsatz der Diff.- und Int.-Rechnung I besagt, dass stetige Funktionen f : [a; b] →
R immer eine Stammfunktion haben.
(2) Auch stetige Funktionen fR : (c; d) → R besitzen immer eine Stammfunktion: wähle
x
γ ∈ (c; d), dann ist F (x) = γ f (t) dt eine Stammfunktion.
(3) Ist U ⊂ R offen und f : U → R stetig, dann besitzt f ebenfalls eine Stammfunktion.
S Denn
ist U ⊂ R offen, dann gibt es eine Familie offener Intervalle (Ui )i∈I , so dass U = i∈I Ui ,
Ui ∩ Uj = ∅ für i 6= j 5. Man konstruiert nun auf jedem Ui die Stammfunktion wie in (2).
5Man sagt zu letzterer Eigenschaft: (U )
i i∈I ist eine Familie von paarweise disjunkten offenen Intervallen
148
6. INTEGRAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
(4) Wie in der Zentralübung besprochen, gibt es Riemann-integrierbare Funktionen ohne
Stammfunktion und nicht-Riemann-integrierbare Funktionen mit Stamm-Funktion.
SATZ 5.4 (Hauptsatz der Differential- und Integralrechnung, Teil II). Sei f : [a; b] → R Riemannintegierbar, und F sei eine Stammfunktion von f . Dann gilt für x, y ∈ [a; b]:
Z x
f (t) dt = F (x) − F (y).
(5.5)
y
Beweis.
1. Fall: f Rist stetig.
x
F0 (x) := a f (t) dt ist eine Stammfunktion, und deswegen F (x) = F0 (x) + F (a). Daraus folgt die
Aussage.
2. Fall: allgemein
O.B.d.A. y < x. Sei go ∈ T [y; x], go ≥ f , und sei Z = {t0 < t1 < . . . < tk } eine zu go passende
Zerlegung von [y; x].
F (x) − F (y)
=
k
X
(F (tj−1 ) − F (tj ))
j=1
1.M W S
=
k
X
(tj − tj−1 )F 0 (ξj )
j=1
für geeignete ξj ∈ (tj−1 ; tj ). Wir rechnen weiter
F (x) − F (y)
=
k
X
(tj − tj−1 )f (ξj )
j=1
≤
k
X
(tj − tj−1 )go (ξj )
j=1
Z x
=
go (t) dt
y
Da dies für alle Treppenfunktionen oberhalb von f gilt, folgt durch Infimumsbildung:
Z x
F (x) − F (y) ≤
f (t) dt
y
Die Gleichung
Z
F (x) − F (y) ≥
x
f (t) dt
y
zeigt man ganz analog. Da f Riemann-integrierbar ist, folgt die Aussage.
2
5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG
149
Beispiele 5.6.
Pn
(1) P
Eine Stammfunktion der Funktion f : R → R, x 7→ k=0 ak xk ist F : R 7→ R, x 7→
n
ak k+1
.
k=0 k+1 x
(2) Die Stammfunktion der Funktion
1
f : R → R,
x 7→ 2
x +1
ist F = arctan : R → (−π/2; π/2) ⊂ R, die Umkehr-Funktion des Tangens. Denn mit
1
sin2 y + cos2 y
=
= tan2 y + 1
cos2 y
cos2 y
und mit Proposition 1.7 in Kapitel 5 sieht man
1
1
.
= 2
arctan0 (x) =
x +1
tan2 (arctan(x)) + 1
tan0 (y) =
(3) Es gibt viele Tabellen mit vielen Stammfunktionen, siehe zum Beispiel:
http://de.wikipedia.org/wiki/Tabelle_von_Ableitungs-_und_Stammfunktionen
Notation 5.7.
b
F (x)
:= F (b) − F (a)
x=a
Dann schreibt sich (5.5) als
Z
a
b
b
f (x) dx = F (x)
.
x=a
Wdh.: Sei I ein offenes6 Intervall. Wir haben definiert:
C 0 (I) := {f : I → R | f stetig}
Für k ∈ N:
C k (I) := {f : I → R | f differenzierbar und f 0 ∈ C k−1 (I)}
Wir weiten diese Definition auf beliebige Intervalle I aus, also zum Beispiel I = [a; b]:
C 0 (I) = {f : I → R | f stetig}
Für k ∈ N:
C k (I)
:=
n
f : I → R f stetig, f |I◦ differenzierbar
o
und es gibt ein g ∈ C k−1 (I) mit f |0◦ = g|I◦
I
Es ist nicht schwer zu zeigen, dass für ein offenes Intervall J ⊃ I gilt:
C k (I) = {h|I | h ∈ C k (J)}.
6In einer früheren Version habe ich in Kapitel 5 das Wort offen” leider vergessen. Um präzise zu sein, muss
”
man es aber dazufügen, denn wir haben die Differenzierbarkeit von f : D → R in x0 ∈ D nur dann definiert, wenn
D offen ist.
150
6. INTEGRAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
Die Aussage ⊃ ist hierbei offensichtlich. Für die Aussage ⊂ muss man ein f ∈ C k (I) zu einer
Funktion h ∈ C k (J) erweitern, man kann hierzu das k-te Taylor-Polynom im Rand von I nutzen.
Für alle Intervalle definiert man dann
\
C ∞ (I) =
C k (I)
k∈N
Für f ∈ C k (I) ist f 0 ∈ C k−1 (I).
7
SATZ 5.8 (Partielle Integration). Seien a, b ∈ R, a < b und f, g ∈ C 1 ([a; b]). Dann
Z b
Z b
b
0
f (x)g 0 (x) dx
−
f (x)g(x) dx = f (x)g(x)
x=a
a
a
Beweis. x 7→ f (x)g(x) ist Stammfunktion von x 7→ f 0 (x)g(x) + f (x)g 0 (x).
2
Rb
Beispiel 5.9. Zu berechnen ist A := a cos3 x dx. Setze f (x) = sin x und g(x) = cos2 x. Es folgt
mit dem Satz zur partiellen Integration:
Z b
Z b
b
A=
f 0 (x)g(x) dx = sin x cos2 x
−
(sin x)(−2) sin x cos x dx
x=a
a
a
Wenn wir nun sin2 x = 1 − cos2 x nutzen, so ergibt sich
Z b
b
A = sin x cos2 x
+2
cos x dx − 2A.
x=a
a
Also
A=
1
2
(sin b cos2 b − sin a cos2 a) − (sin b − sin a).
3
3
SATZ 5.10 (Integration durch Substitution). Seien a, b, c, d ∈ R, a < b und c < d. Gegeben sei
• f ∈ C 0 ([a; b]),
• ϕ ∈ C 1 ([c; d]) mit ϕ([c; d]) ⊂ [a; b]
Dann gilt
Z
ϕ(d)
Z
f (s) ds =
ϕ(c)
d
f (ϕ(t))ϕ0 (t) dt.
c
7Wenn man wieder ganz präzise sein will, so ist f 0 zunächst nur auf I◦ definiert, kann dann aber auf eindeutige
Art und Weise zu einer stetigen Funktion I → R fortgesetzt werden,die wir ebenfalls mit f 0 bezeichnen.
5. HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG
151
Beweis. Die Integranden, d.h. die Funktionen f und t 7→ f (ϕ(t))ϕ0 (t) =: f˜(t) sind stetig, also
Riemann-integrierbar und besitzen Stammfunktionen. Sei F : [a; b] → R eine Stammfunktion
von f , dann ist nach Kettenregel F ◦ ϕ : [c; d] → R eine Stammfunktion von f˜.
Z ϕ(d)
Z d
f (s) ds = F (ϕ(d)) − F (ϕ(c)) =
f (ϕ(t))ϕ0 (t) dt.
ϕ(c)
c
2
Merkregel: Die Leibnizsche Differentialschreibweise (= Verwendung von den unendlich kleinen“
”
Zahlen ds, dt) liefert eine gute Merkregel. 8
s = ϕ(t),
also auch f (ϕ(t)) = f (s). Schreibe
s̃ − s
ds
ϕ(t̃) − ϕ(t)
= lim
=
dt
t̃ − t
t̃ − t
t̃→t
ϕ0 (t) = lim
Man löst auf
ds = ϕ0 (t) dt
Und man hat die Subsitutionsformel.
Typische Anwendungen.
1.)
Z 2
1 b s
1 2 1 2
e ds = eb − ea
2
2
2
2
a
a
Hier wurde f (s) = es und ϕ(t) = t2 genutzt.
Z
2.)
Z b
a
1
dt =
(et − 1)(et + 1)
Hier wurde f (s) =
Z
a
b
b
2
tet dt =
1
et dt =
et (et − 1)(et + 1)
1
s(s−1)(s+1)
Z
eb
ea
1
ds = siehe Zentralübung
s(s − 1)(s + 1)
und ϕ(t) = et genutzt.
Ostern
23.4.2014
Interpretation9.
γ ∈ (a; b). Wir haben lineare Abbildungen
D : C 1 ((a; b)) → C 0 ((a; b)),
und
Z
γ
•
: C 0 ((a; b)) → C 1 ((a; b)),
f 7→
f 7→ f 0
Z x
x 7→
f (t) dt
γ
|
{z
}
∈C 1 ((a;b))
8Sie ist nicht mathematisch präzise, denn es bleibt ja unklar, was eine unendlich kleine Zahl denn sein soll. Sie
ist aber sehr effizient als Merkregel.
9Dieser Abschnitt ist hilfreich, aber nicht notwendig und musste aus Zeitgründen übersprungen werden.
152
6. INTEGRAL-RECHNUNG FÜR FUNKTIONEN EINER VERÄNDERLICHEN
R•
Dann gilt D ◦ γ = idC 0 ((a;b)) , Die Differentiation ist Linksinverses zur Integration. Es ist außerdem
Rechtsinverses bis auf Konstante“ 10. Damit ist gemeint:
”
Z •
◦D (f ) = f − f (γ)
γ
wobei f (γ) als konstante Funktion (a; b) → R, x 7→ f (γ) zu lesen ist.
6. Uneigentliche Riemann-Integrale
Wdh.: F : R → R, a ∈ R
a = lim F (x)
x→∞
⇐⇒
∀ ∈ R>0 : ∃x0 ∈ R : ∀x ∈ R≥x0 : |F (x) − a| < Analog für F : [a; ∞) → R und andere Defintionsbereiche.
Definition 6.1 (Uneigentliches Riemann-Integral, rechtes Ende). Sei a ∈ R, b ∈ R ∪ {∞}, a < b,
f : [a; b) → R.
Wir sagen f ist (am rechten Ende) uneigentlich Riemann-integrierbar falls f |[a;β] ∈ R[a; β] für alle
β ∈ (a; b) und falls
Z b
Z β
(6.2)
f (x) dx := lim
f (x) dx
β%b
a
existiert. Wir sagen dazu auch
Rb
falls a |f (x)| dx konvergiert.
Rb
a
a
f (x) dx konvergiert. Wir sagen: das Integral konvergiert absolut,
Man beachte: die linke Seite von (6.2) ist eine Definition!
Spezialfall: Wenn b < ∞ und falls f = f˜[a;b) für ein f˜ ∈ R[a; b] ist, dann gilt wegen dem Hauptsatz
der Differential- und Integralrechnung11:
Z b
Z β
˜
f (x) dx = lim
f˜(x) dx
β→b
a
a
In diesem Fall gilt also
Z
a
b
f˜(x) dx =
Z
b
f (x) dx.
a
Definition 6.3 (Uneigentliches Riemann-Integral, linkes Ende und an beiden Enden). Sei a ∈
R ∪ {−∞}, b ∈ R, a < b, f : (a; b] → R.
Wir sagen f ist (am linken Ende) uneigentlich Riemann-integrierbar falls f |(α;b] ∈ R[α; b] für alle
α ∈ (a; b) und falls
Z b
Z b
(6.4)
f (x) dx := lim
f (x) dx
a
α&a
α
10Dies ist in Anführungsstrichen, da die Bedeutung bisher nicht genau definiert wurde.
11Die folgende Zeile ist keine Definition, sondern eine Aussage!
6. UNEIGENTLICHE RIEMANN-INTEGRALE
153
existiert.
Sei a ∈ R ∪ {−∞}, b ∈ R ∪ {∞}, a < b, f : (a; b) → R. Wir sagen f ist (an beiden Enden)
uneigentlich Riemann-integrierbar, falls für ein γ ∈ (a; b) die Summe
Z b
Z γ
Z b
(6.5)
f (x) dx :=
f (x) dx +
f (x) dx
a
a
γ
12
existiert.
Beispiele 6.6.
R∞
(1) 1 xa dx konvergiert genau dann, wenn a < −1. Denn
(
Z r
1
(ra+1 − 1) für a 6= −1
a
x dx = a+1
F (r) :=
log r
für a = −1
1
Im Limes r → ∞ gilt
(
F (r) →
(2)
R1
0
∞
1
− a+1
für a ≥ −1
für a < −1
xa dx konvergiert genau dann, wenn a > −1.
12Hierzu müssen beide Integrale der rechten Seite von (6.5) konvergieren. Die Existenz und der Wert von
Rb
a
f (x) dx ist dann unabhängig von γ.
KAPITEL 7
Topologische Räume
Als Literatur in diesem Kapitel emfehle ich das erste Kapitel von [28] (normierte Vektorräume
und metrische Räume) und Kapitel VI von [7] (inklusive topologische Räume).
1. Normierte Vektorräume
K = R oder K = C.
Definition 1.1. Sei V ein K-Vektorraum. Eine Norm auf V ist eine Abbildung k • k : V → R, so
dass für alle x, y ∈ V , λ ∈ K gilt:
(a) Definitheit der Norm: k0k = 0 und für x 6= 0 gilt kxk > 0,
(b) Homogenität der Norm: kλxk = |λ| kxk
(c) Dreiecksungleichung der Norm: kx + yk ≤ kxk + kyk
Man nennt dann (V, k • k) einen normierten Vektorraum.
Beispiele 1.2.
(1) Sei h • , • i ein Skalarprodukt auf dem K-Vektorraum V , wie in der LA I behandelt.1 Dann
ist
p
x 7→ kxk := hx, xi
eine Norm auf V .
Ist h • , • i das Standardskalarprodukt auf Kn , so nennt man die zugehörige Norm die
Standardnorm auf Kn .
(2) Supremums-Norm auf Kn = Abb({1, 2, . . . , n}, K), vergleiche Definition 5.4 in Kapitel 4.
Für z = (z1 , . . . , zn ) ∈ Kn definieren wir die ∞-Norm
kzk∞ := max{|z1 |, |z2 |, . . . , |zn |} ∈ R≥0 .
Definitheit, Homogenität und Dreiecksungleichung sind leicht zu prüfen.
1Siehe Kapitel 12 der LA I von Prof. Kerz, dort wurde ( • , • ) an Stelle von h • , • i benutzt.
155
156
7. TOPOLOGISCHE RÄUME
(3) Sei p ∈ [1; ∞), n ∈ N. Für z = (z1 , . . . , zn ) ∈ Kn definieren wir die p-Norm

1/p
n
X
kzkp := 
|zj |p 
∈ R≥0 .
j=1
Dann ist k • k2 die Standardnorm auf Kn aus Beispiel (1).
Es ist ein Norm für alle p ∈ [1; ∞): Definitheit und Homogenität von k • kp werden
in Übungsblatt 3, Aufgabe 4 gezeigt. Die Dreiecksungleichung wird in der Zentralübung
gezeigt.
(4) Ist k • k eine Norm auf einem C-Vektorraum V . Dann ist V auch ein R-Vektorraum, und
k • k ist dann auch eine Norm auf V im Sinn von R-Vektorräumen.
Bemerkung 1.3. Ist (V, k • k) ein normierter Raum, so definiert
d(x, y) := kx − yk
eine Metrik auf V . Insbesondere: Eine V -wertige Folge (x(k))k∈N konvergiert gegen a in (V, k • k),
falls kx(k) − ak → 0 für k → ∞. Aus der Dreiecksungleichung sieht man leicht: Konvergiert x(k)
gegen a, so konvergiert kx(k)k gegen kak. 2
Ein Folge (x(k))k∈N heißt beschränkt im normierten Raum (V, k • k), falls es ein C ∈ R>0 gibt, so
dass für alle k ∈ N gilt: kx(k)k ≤ C.
LEMMA 1.4 (Bolzano-Weierstraß auf (Rn , k, · k1 )). Ist (x(k))k∈N eine beschränkte Folge in (Rn , k, · k1 ),
dann besitzt diese Folge eine konvergente Teilfolge.
Der folgende Beweis würde das Ergebnis auch für alle anderen p-Normen liefern. Diese Verallgemeinerung folgt aber bald ganz einfach.
Beweis. Schreibe x(k) = (x1 (k), . . . , xn (k)). |xj (k)| ≤ kx(k)k1 . Dann ist (xj (k))k∈N eine beschränkte R-wertige Folge. Nach dem Satz von Bolzano-Weierstraß (Korollar 5.53 in Kapitel 2) besitzt die Folge (x1 (k))k∈N eine (in R) konvergente Teilfolge (x1 (f1 (k)))k∈N . Weiter besitzt (x2 (f1 (k)))k∈N
eine konvergente Teilfolge (x2 (f1 ◦ f2 (k)))k∈N . Und so weiter. Nachdem wir n-mal zu einer derartigen Teilfolge übergegangen sind, konvergiert
(xj (f1 ◦ f2 ◦ · · · ◦ fn (k)))k∈N
{z
}
|
f :=
für alle j. Sei aj := limk→∞ xj (f (k)). Dann ka − x(f (k))k1 → 0 für k → ∞.
2
Definition 1.5. Zwei Normen k • k und ||| • ||| auf einem Vektorraum V nennt man äquivalent,
falls es ein C ∈ R>0 gibt, so dass für alle x ∈ V gilt:
kxk ≤ C|||x|||
2Denn |kx(k)k − kak| ≤ kx(k) − ak.
und
|||x||| ≤ Ckxk.
1. NORMIERTE VEKTORRÄUME
157
SATZ 1.6. Alle Normen auf Rn sind äquivalent.
Beweis. Es reicht den Satz zu zeigen für k • k = k • k1 und eine weitere Norm ||| • |||. Sei (e1 , . . . , en )
die Standardbasis von R.
X
X
n
n
|xj ||||ej ||| ≤ kxk1 max{|||e1 |||, . . . , |||en |||} .
xj ej ≤
|||x||| = |
{z
}
j=1
j=1
α:=
Dies liefert nun die rechte der zu zeigenden Ungleichungen.
Angenommen, die Normen sind nicht äquivalent, d.h. es gibt kein C wie oben. Dann gibt es eine
Folge (x(k))k∈N in R mit kx(k)k1 > k|||x(k)|||. O.B.d.A. kx(k)k1 = 1 (sonst ersetze x(k) durch
x(k)/kx(k)k1 ). Wir können auch annehmen, dass diese Folge konvergiert, da wir gegebenenfalls
zu einer in (Rn , k • k) konvergenten Teilfolge übergehen können (siehe Lemma 1.4). Sei a der
Grenzwert. Wegen |||x(k) − a||| ≤ αkx(k) − ak → 0 ist a auch der Grenzwert bezüglich der ||| • |||Norm. Es folgt kak1 = limk→∞ kx(k)k1 = 1 und wegen |||x(k)||| < k1 auch |||a||| = limk→∞ |||x(k)||| =
0. Also a = 0, was kak1 = 1 widerspricht.
2
Der obige Satz gilt wegen Beispiele 1.2 (4) auch, wenn wir Rn durch Cn ersetzen.
Wiederholung/Definition: Eine V -wertige Folge (xk )k∈N konvergiert gegen a ∈ V in dem normierten
Raum (V, k • k), falls
lim kxk − ak = 0.
k→∞
Sind zwei Normen k • k und ||| • ||| äquivalent, so gilt
lim kxk − ak = 0
⇐⇒
(xk )k∈N beschränkt in (V, k • k)
⇐⇒
k→∞
lim |||xk − a||| = 0.
k→∞
(xk )k∈N beschränkt in (V, ||| • |||).
Da jeder endlich-dimensionale K-Vektorraum (als Vektorraum) isomorph zu Kn für ein geeignetes
m ∈ N ∪ {0} ist, folgt hieraus unmittelbar das folgende Korollar.
KOROLLAR 1.7. Sei V ein endlich-dimensionaler K-Vektorraum. Dann sind alle Normen auf V
zueinander äquivalent. Und jede beschränkte V -wertige Folge besitzt eine konvergente Teilfolge.
Bemerkung 1.8. Auf unendlich-dimensionalen Vektorräumen gibt es nicht-äquivalente Normen.
Als Beispiel hierzu betrachte man den Vektorraum V = R[a; b]. Wir definieren die folgenden
Normen: f ∈ R[a; b]
Z b
kf k1 :=
|f (x)| dx,
kf k∞ := sup{|f (x)| | x ∈ [a; b]}.
a
Die Normen k • k1 und k • k∞ sind nicht äquivalent. Es gilt zwar kf k1 ≤ (b − a)kf k∞ . Es gibt
aber keine Konstante C ∈ R>0 mit
kf k∞ ≤ Ckf k1 .
28.4.2014
158
7. TOPOLOGISCHE RÄUME
Um dies zu zeigen, betrachte man für n ≥ 1/(b − a) die Funktion
(
1 falls a ≤ x ≤ a + n1
fn : [a; b] → R, f (x) :=
0 falls a + n1 < x ≤ b
BILD
Es gilt kfn k∞ = 1 und kfn k1 = 1/n → 0. Die Folge (fn )n∈N ist also eine Nullfolge in (R[a; b], k • k1 ),
aber nicht in (R[a; b], k • k∞ ). Die Folge (fn )n∈N besitzt keine konvergente Teilfolge in (R[a; b], k • k∞ ).
2. Mehr zu metrischen Räumen
Wiederholung:
Ein metrischer Raum ist ein Paar (M, d), wobei die Metrik d : M × M −→ R≥0 die folgenden
Eigenschaften für alle x, y, z ∈ M erfüllen möge
(a) d(x, y) = 0 ⇐⇒ x = y (Definitheit)
(b) d(x, y) = d(y, x) (Symmetrie)
(c) d(x, y) ≤ d(x, z) + d(z, y) (Dreiecks-Ungleichung)
lim xn = a
n→∞
⇐⇒
lim d(xn , a) = 0
n→∞
Beispiel 2.1. Ist (V, k • k) ein normierter Vektorraum, so definiert d(x, y) := kx − yk eine Metrik
auf V . Man nennt sie die von k • k induzierte Metrik auf V .
Beispiel 2.2. Die diskrete Metrik auf M :
(
1
ddisc (x, y) =
0
falls x 6= y
falls x = y
ist eine Metrik auf M .
Spezialfall M = R: Die Folge ( n1 )n∈N konvergiert nicht in (R, ddisc ).
Beispiel 2.3. Ist (M, d) ein metrischer Raum und N eine Teilmenge. Dann ist d|N ×N eine Metrik
auf N , die von (M, d) auf N induzierte Metrik.
Definition 2.4. Sei (M, d) ein metrischer Raum. Ein M -wertige Folge (xn )n∈N ist eine CauchyFolge in (M, d), falls gilt
∀ ∈ R>0 : ∃n ∈ N : ∀i, j ∈ N≥n : d(xi , xj ) ≤ .
Ein metrischer Raum (M, d) ist vollständig, falls jede Cauchy-Folge in (M, d) konvergiert.
Beispiel 2.5. Ist (V, k • k) ein endlich-dimensionaler normierter Vektorraum und ist d die induzierte Metrik auf V , so ist (V, d) vollständig.
2. MEHR ZU METRISCHEN RÄUMEN
159
Definition 2.6. Einen normierten Vektorraum (V, k • k) nennt man einen Banach-Raum oder
einen vollständigen normierten Vektorraum, falls die induzierte Metrik auf V vollständig ist. Einen
euklidischen
p oder unitären Vektorraum (V, h • , • i) nennt man einen Hilbert-Raum, wenn (V, x 7→
kxk := hx, xi) ein Banach-Raum ist.
Hilbert-Räume und Banach-Räume sind unter anderem von zentraler Bedeutung
• in der Quantenmechanik
• in der konkreten Berechung von aufwändigen mathematischen Probleme mit Hilfe des
Computers (Numerik von partiellen Differentialgleichungen)
ÜBUNG 2.7. Sei N eine Teilmenge eines metrischen Raumes (M, d) und sei d˜ die induzierte
Metrik auf N .
˜ vollständig, so ist N abgeschlossen in M .
(a) Ist (N, d)
(b) Ist (M, d) vollständig, so gilt
˜ vollständig
(N, d)
⇐⇒
N abgeschlossen in M.
Bemerkung 2.8. Jeder metrische Raum besitzt eine Vervollständigung. 3 D.h. zu jedem metrischen
e mit M ⊂ M
e M ×M = d.
f, d)
f und d|
Raum (M, d) gibt es einen vollständigen metrischen Raum (M
Die Konstruktion dieser Vervollständigung ist nahezu identisch zu der Konstruktion von R aus Q
in Kapitel 2 Abschnitt 5.5. Man konstruiert ganz analog eine Äquivalenzrelation auf der Menge
aller Cauchy-Folgen.
Wir definieren in einem metrischen Raum (M, d), U ⊂ M , x ∈ M
Br(M,d) (x) := Br (x) := {y ∈ M | d(x, y) < r}
U ist Umgebung von x in (M, d)
U ist offen in (M, d)
⇐⇒
⇐⇒
∃r > 0 : Br (x) ⊂ U.
U ist Umgebung von allen y ∈ U.
Offensichtlich sind ∅ und M offen in (M, d). Wir haben gesehen (Proposition 3.10 in Kapitel 4):
Sind U1 und U2 offen, dann auch U1 ∩ U2 .
Ist (Ui )i∈I einen Familie offener Mengen, so ist
S
i∈I
Ui ebenfalls offen.
OM,d := {U ⊂ M | U offen in (M, d)}
3In der Vorlesung aus Zeitgründen übersprungen.
160
7. TOPOLOGISCHE RÄUME
3. Topologische Räume
Definition 3.1. Sei X eine Menge und O ⊂ P(X). Man nennt O eine Topologie auf X, falls gilt:
• ∅ ∈ O, X ∈ O,
• Aus U1 ∈ O und U2 ∈ O folgt U1 ∩ U2 ∈ O,
S
• Ist (Ui )i∈I eine Familie, Ui ∈ O, dann gilt auch i∈I Ui ∈ O.
Ein topologischer Raum ist ein Paar (X, O), wobei O eine Topologie auf X ist. Man sagt: U ist
eine offene Menge in (X, O) genau dann, wenn U ∈ O.
Beispiele 3.2.
(a) Ist (M, d) ein metrischer Raum, so ist OM,d eine Topologie auf M . Man nennt sie die von d
induzierte Topologie.
(b) O := P(X) ist eine Topologie auf X, die sogenannte diskrete Topologie. Sie wird von der
diskreten Metrik induziert.
(c) Ist O eine Topologie auf X. Sei Y ⊂ X. Dann ist
OY := {U ∩ Y | U ∈ O}
eine Topologie auf Y , genannt die Spurtopologie auf Y oder einfach die auf Y induzierte
Topologie.
BILD
(d) Sind k • k und ||| • ||| äquivalente Normen auf dem Vektorraum V , so induzieren sie dieselbe
Topologie auf V . Denn angenommen es gilt für alle x ∈ V
kxk ≤ C|||x|||
und
|||x||| ≤ Ckxk.
Dann folgt für x ∈ V , r > 0:
(V,||| • |||)
Br(V,k • k) (x) ⊂ BCr
(V,k • k)
Br(V,||| • |||) (x) ⊂ BCr
(x),
(x).
Also für U ⊂ V :
U offen in (V, k • k)
⇐⇒
U offen in (V, ||| • |||).
Umgekehrt gilt: Nicht-äquivalente Normen induzieren verschiedene Topologien.
Definition 3.3. Ein topologischer Raum (X, O) wird Hausdorff-Raum genannt, falls die HausdorffEigenschaft gilt:
für alle x, y ∈ X mit x 6= y gibt es offene Mengen Ux und Uy , so dass x ∈ Ux , y ∈ Uy und
Ux ∩ Uy = ∅.
BILD
4
4Der Hausdorff-Raum ist nach Felix Hausdorff bennannt, ein Blick in die Biographie wird empfohlen, http:
//de.wikipedia.org/wiki/Felix_Hausdorff.
3. TOPOLOGISCHE RÄUME
161
LEMMA 3.4. Jeder metrische Raum ist ein Hausdorff-Raum.
Beweis. Seien x, y ∈ X, x 6= y. Zu r := d(x, y)/3 definiere die offenen Mengen
Ux := Br (x)
Uy := Br (y).
Wegen der Dreiecksungleichung gilt Ux ∩ Uy = ∅.
2
U Umgebung von x :⇐⇒ Es existiert eine offene Menge W mit x ∈ W ⊂ U .
A ⊂ X heißt abgeschlossen in (X, O) :⇐⇒ X r A offen in (X, O).
Definition 3.5. Sei (X, O) ein Hausdorff-Raum, (xi )i∈N eine Folge in X, a ∈ X.
a = lim xi
i→∞
⇐⇒
Für jede Umgebung U von a gilt xi ∈ U für fast alle i ∈ N
⇐⇒
Zu jeder Umgebung U von a gibt es ein i0 ∈ N, so dass für alle i ≥ i0 : xi ∈ U .
Grenzwerte in Hausdorff-Räumen sind eindeutig, falls sie existieren. Denn angenommen a und b
wären Grenzwert der Folge (xi )i∈N , a 6= b. Da X ein Hausdorff-Raum ist, gibt es offene Mengen Ua
und Ub mit a ∈ Ua , b ∈ Ub und Ua ∩ Ub = ∅. Da Ua eine Umgebung von a ist, gibt es ein i0 ∈ N, so
dass für i ≥ i0 gilt: xi ∈ Ua . Analog dazu gibt es ein j0 ∈ N, so dass für i ≥ j0 gilt: xi ∈ Ub . Dann
gilt für k ≥ max{i0 , j0 } sogar xk ∈ Ua ∩ Ub = ∅, was offensichtlich nicht möglich ist. Also war die
Annahme falsch, dass es zwei verschiedene Grenzwerte gibt. 5
Bemerkung 3.6. Nicht jede Topologie wird von einer Metrik induziert.
Beispiel: O := {∅, X} ist eine Topologie auf X, die sogenannte Klumpentopologie oder indiskrete
Topologie auf X. Im Fall #X ≥ 2 ist (X, O) kein Hausdorff-Raum, also nicht von einer Metrik
induziert. 6
Bemerkung 3.7. Ist X ein Hausdorff-Raum, x ∈ X. Dann ist {x} abgeschlossen. (Begründung:
Ist y ∈ X r{x}, so liefert die Hausdorff-Eigenschaft eine offene Umgebung Uy von y, die in X r{x}
enthalten ist. Also ist X r {x} offen.)
Definition 3.8. Ist N eine Teilmenge eines topologischen Raumes (X, O), dann definieren wir:
den Abschluss oder die abgeschlossene Hülle von N als
N :=
\
{A ⊂ X | N ⊂ A und A abgeschlossen in X} ,
das Innere von N oder den inneren Kern von N als
5Man kann Konvergenz auch topologischen Räumen betrachten, die nicht mehr hausdorffsch sind. Dazu benötigt
man die Theorie der Filter“, das ist aber doch recht aufwändig im Vergleich zum Nutzen.
”
6Es gibt auch Hausdorff-Räume,
die nicht von einer Metrik induziert werden. Man kann genau sagen, welche
topologischen Räume von einer Metrik induziert werden. Dies besagt der Metrisierungssatz von Bing, Nagata und
Smirnow, siehe [25, Satz 10.14]. Der Beweis ist ein schönes Stück Mathematik, aber gebraucht habe ich bisher den
Satz leider noch nie. Wenn man sich jedoch zu dem Satz durcharbeitet, lernt mal sehr viele nützliche Hilfsmittel
kennen.
30.4.2014
162
7. TOPOLOGISCHE RÄUME
◦
N :=
[
{U ⊂ N | U offen in X} ,
den Rand von N als
◦
∂N := N r N.
LEMMA 3.9.
◦
◦
N = X r (X r N ),
z }| {
N = X r (X r N )
◦
x ∈ N ⇐⇒ N Umgebung von x
x ∈ N ⇐⇒ für alle Umgebungen U von x gilt: U ∩ N 6= ∅
x ∈ ∂N ⇐⇒ für alle Umgebungen U von x gilt: U ∩ N 6= ∅ und U ∩ (X r N ) 6= ∅.
2
Beweis. Übungsblatt
Beispiel 3.10. N = [0; 1] × (0; 1) ⊂ R2 , Standard-Norm.
◦
N = (0; 1) × (0; 1)
N = [0; 1] × [0; 1]
∂N = ([0; 1] × {0, 1}) ∪ ({0, 1} × [0; 1])
BILD
Definition 3.11. Eine Teilmenge N ⊂ X heißt dicht, falls N = X.
Beispiel 3.12. Q ist dicht in R (Standard-Norm).
Definition 3.13. Seien (X, OX ) und (Y, OY ) topologische Räume, und f : X → Y eine Abbildung,
x0 ∈ X. Man nennt f stetig in x0 , falls gilt:
Für jede Umgebung U von f (x0 ) in Y ist f −1 (U ) eine Umgebung von x0 .
Man nennt f stetig, falls gilt:
Für alle U ∈ OY gilt f −1 (U ) ∈ OX .
(Kurz: Urbilder offener Mengen sind offen.)
Man sieht leicht: f ist genau dann stetig, wenn es in allen x0 ∈ X stetig ist.
Diese Definition verallgemeinert alle bisherigen Definitionen von Stetigkeit.
!ACHTUNG!. Es gibt eine Abbildung f : X → Y , X und Y topologische Räume, mit den
folgenden Eigenschaften
4. ZUSAMMENHANG UND WEGZUSAMMENHANG
163
• f ist folgenstetig, d.h. für xi , x ∈ X folgt aus x = limi→∞ xi auch f (x) = limi→∞ f (xi ).
• f ist nicht stetig
Da solche exotischen“ Beispiele in der Vorlesung keine Rolle spielen werden, wird diese Tatsache
”
nur im Skript kurz erwähnt. Wenn jedoch X und Y metrische Räume sind, so ist f : X → Y genau
dann stetig, wenn es folgenstetig ist, Beweis genau wie in Lemma 1.7 in Kap. 4.
4. Zusammenhang und Wegzusammenhang
Schreibweise: X für (X, OX ), wenn klar ist, welche Topologie auf X zu wählen ist. Beispiel: Rn
trägt (fast immer) die von der Standard-Norm induzierte Topologie.
•
Schreibweise: Disjunkte Vereinigung U ∪ V = X bedeutet U ∪ V = X und U ∩ V = ∅.
Definition 4.1. Ein topologischer Raum X heißt nicht zusammenhängend , wenn es nicht-leere of•
fene Mengen U, V ⊂ X mit U ∪ V = X gibt. Zusammenhängend := nicht nicht zusammenhängend.
Ist A ⊂ X und ist OX eine Topologie auf X, dann definiert man auch :
A ist zusammenhängend :⇐⇒ (A, OA ) ist zusammenhängend
Hierbei ist OA die auf A induzierte Topologie (Spurtopologie).
Beispiele 4.2.
(a) Die Menge {0, 1} ⊂ R ist nicht zusammenhängend.7 Denn {0} = B1/2 (0) ∩ {0, 1} ist offen in
{0, 1}. Analog ist {1} offen in {0, 1}. Und
•
{0, 1} = {0} ∪ {1}.
(b) BILD mit zwei Bällen in R2 . Nicht zusammenhängend.
(c) Sei Q mit der Standardtopologie (d.h. mit der von d(x, y) = |x−y|
verse√
√ induzierte Topologie)
hen. Dann ist Q nicht zusammenhängend. Definiere U := (−∞; 2)∩Q und V := ( 2; ∞)∩Q.
•
Die Mengen U und V sind offen in Q. 8 U ∪ V = X.
(d) eine Teilmenge A von R ist zusammenhängend, gdw A ein Intervall ist. (Aufgabe 4 auf Übungsblatt 1)
PROPOSITION 4.3. Seien X und Y topologische Räume, f : X → Y stetig und X zusammenhängend. Dann ist f (X) (mit der Spurtopologie von Y versehen) ebenfalls zusammenhängend.
Beweis. Angenommen f (X) ist nicht zusammenhängend. Dann gibt es Mengen U und V mit den
folgenden Eigenschaften:
7Wenn nichts anderes angegeben ist, hat R immer die Standard-Topologie und eine Teilmenge von R die
induzierte Topologie. In diesem Spezialfall ist die diskrete Topologie auf {0, 1}.
8Sie sind nicht offen in R, aber offen in Q. Wer dies nicht versteht, muss nochmals genau die Definition der
Spurtopologie lesen.
164
7. TOPOLOGISCHE RÄUME
•
• U ∪ V = f (X),
e von Y mit U = Y ∩ U
e (siehe
• U offen in f (X), d.h. es gibt eine offene Teilmenge U
Definition der Spurtopologie),
• V offen in f (X), d.h. es gibt eine offene Teilmenge Ve von Y mit V = Y ∩ Ve (siehe
Definition der Spurtopologie).
• U 6= ∅ und V 6= ∅
e ) = f −1 (U ) offen, und offensichtlich gilt f −1 (U ) 6= ∅. Analog für
Da f stetig ist, ist auch f −1 (U
•
f −1 (V ). Außerdem haben wir X = f −1 (U ) ∪ f −1 (V ).
2
Beispiel 4.4. Ist f : X → R stetig und X zusammenhängend. Dann ist f (X) ein Intervall.
Wenn wir den Spezialfall betrachten, dass X = I ein Intervall ist, und Y = R, so erhalten wir
wieder die folgende Aussage, die wir als Korollar 2.3 in Kapitel 4 bereits bewiesen haben
KOROLLAR 2.3 in Kap. 4. Sei I ⊂ R ein Intervall und f : I −→ R stetig. Dann ist f (I) ebenfalls
ein Intervall.
Aus diesem Korollar erhält man auch den Zwischenwertsatz. Proposition 4.3 verallgemeinert also
den Zwischenwertsatz.
Definition 4.5. Sei X ein topologischer Raum, x, y ∈ X. Ein Weg von x nach y in X ist eine
stetige Abbildung s : [0; 1] → X mit s(0) = x und s(1) = y.
Ein topologischer Raum X ist wegzusammenhängend , wenn es zu allen Punkten x, y ∈ X einen
Weg von x nach y gibt.
PROPOSITION 4.6. Ist X wegzusammenhängend, so ist X auch zusammenhängend.
•
Beweis. Angenommen X ist nicht zusammenhängend, sagen wir also X = U ∪ V , wobei U und
V offen und nicht-leer in X. Wähle ein x ∈ U und y ∈ V . Wenn X wegzusammenhängend ist,
dann gibt es einen Weg von x nach y, also eine stetige s : [0; 1] → X mit s(0) = x und s(1) = y.
•
Dann ist [0; 1] = s−1 (U ) ∪ s−1 (V ) eine Zerlegung in offene Teilmengen. Außerdem 0 ∈ s−1 (U ) und
1 ∈ s−1 (V ). Solch eine Zerlegung ist aber nicht möglich, da [0; 1] zusammenhängend ist.
2
Beispiel 4.7. Eine Menge A ⊂ Rn heißt sternförmig bezüglich x0 ∈ A, falls gilt: ist x ∈ A und
t ∈ [0; 1], dann haben wir auch (1 − t)x0 + tx ∈ A.
BILD
Sternförmige Mengen sind wegzusammenhängend, also auch zusammenhängend.
Bemerkung 4.8. Wir betrachten die folgende Teilmenge von R2
M := {0} × [−1; 1] ∪ {(x, sin(π/x)) | x ∈ R>0 }
5. FOLGENKOMPAKTHEIT
165
und versehen M mit der von der Standardtopologie auf R2 induzierten Topologie. BILD. Die Menge
M ist zusammenhängend, aber nicht wegzusammenhängend.
ÜBUNG 4.9. Ist X wegzusammenhängend und f : X → Y stetig. Dann ist auch f (X) wegzusammenhängend.
5.5.2014
5. Folgenkompaktheit
Definition 5.1. Sei (X, OX ) ein Hausdorff-Raum. Wir sagen, (X, OX ) ist folgenkompakt, wenn
jede Folge in X eine (in (X, OX )) konvergente Teilfolge besitzt. Eine Teilmenge A ⊂ X nennt man
folgenkompakt, wenn (A, OA ) folgenkompakt ist, wobei OA die Spurtopologie auf A ist.
SATZ 5.2. Sei (V, k • k) ein endlich-dimensionaler reeller oder komplexer Vektorraum. Wir versehen V mit der von k • k induzierten Topologie. Eine Teilmenge A von V ist genau dann folgenkompakt, wenn sie abgeschlossen und beschränkt ist.
Wir definieren hier: A beschränkt ⇐⇒ ∃C ∈ R≥0 : ∀x ∈ A : kxk ≤ C
Beispiele 5.3. Ein Intervall I ist genau dann folgenkompakt, wenn es a, b ∈ R, a ≤ b gibt mit
I = [a; b]. Dagegen ist R abgeschlossen, aber nicht beschränkt, also nicht folgenkompakt. Das
Intervall (0; 1) ist beschränkt und nicht abgeschlossen, also auch nicht folgenkompakt. Die Menge
[0; 1] ∪ [2; 3] ist ebenfalls folgenkompakt.
Die folgenden Teilmengen von V = Rn sind folgenkompakt:
Abgeschlossene Bälle B r (x0 ) := {x ∈ V | kx − x0 k ≤ r} bezüglich beliebiger Normen.
Quader [a1 ; b1 ] × [a2 ; b2 ] × · · · × [an , bn ].
Wdh: Ist (V, k • k) ein normierter Vektorraum, x = limi→∞ xi , dann gilt
kxk − kxi k ≤ kx − xi k → 0.
Also ist die Norm folgenstetig und somit stetig.
Beweis von Satz 5.2. O.B.d.A. V = Rn .
9
=⇒“: Sei A folgenkompakt.
”
A abgeschlossen.
Wir zeigen zunächst, dass jede A-wertige Folge (xi )i∈N , die in Rn konvergiert, ihren Grenzwert in
A besitzt. Dann folgt mit Aufgabe 1 von Übungsblatt 1 die Abgeschlossenheit von A.
9In einer früheren Version haben wir hier noch das folgende geschrieben. Es ist korrekt, wird aber nicht benötigt,
und deswegen kann es gestrichen werden: Da alle Normen auf Rn äquivalent sind, hängen die Begriffe abgeschlos”
sen“, beschränkt“ und folgenkompakt“ nicht von der verwendeten Norm ab, also o.B.d.A. sei k • k die Standard”
”
n
norm auf R .
166
7. TOPOLOGISCHE RÄUME
Sei limi→∞ ai =: x ∈ V . Da A folgenkompakt ist, gibt es eine Teilfolge (af (i) )i∈N die in A konvergiert.
A 3 lim af (i) = x.
i→∞
also x ∈ A.
A beschränkt.
Angenommen A ist nicht beschränkt. Dann gibt es eine Folge (ai ) mit kai k → ∞. Angenommen
eine Teilfolge (af (i) ) konvergiert gegen y ∈ A. Es folgt
kyk = lim kaf (i) k = ∞.
i→∞
Widerspruch.
⇐=“: Ist A beschränkt, so ist jede A-wertige Folge (ai )i∈N beschränkt. Nach dem Satz von
”
Bolzano-Weierstraß (Lemma 1.4 bzw. Korollar 1.7) besitzt die Folge eine konvergente Teilfolge
(af (i) )i∈N mit Grenzwert a. Wenn A zusätzlich abgeschlossen ist, so konvergiert die Teilfolge in A
gegen a. Somit ist A folgenkompakt.
2
PROPOSITION 5.4. Seien X, Y Hausdorff-Räume und sei f : X → Y folgenstetig10. Ist X
folgenkompakt, dann ist auch B := im(f ) (versehen mit der Spurtopologie) folgenkompakt.
11
Beweis. Sei (an )n∈N eine Folge in B. Wähle bn ∈ X mit f (bn ) = an . Wähle eine konvergente
Teilfolge (bj(n) ), b := limn→∞ bj(n) . Da f stetig ist, haben wir
f (b) := lim f (bj(n) ) .
n→∞ | {z }
=aj(n)
Somit ist eine konvergente Teilfolge von (an )n∈N gefunden. Wir haben die Folgenkompaktheit von B
überprüft.
2
Beispiel 5.5. Ist f : [a; b] → R stetig, dann ist f ([a; b]) ein folgenkompaktes Intervall, d.h.
f ([a; b]) = [c; d] für geeignete c, d ∈ R.
KOROLLAR 5.6. Ist X ein folgenkompakter Hausdorff-Raum und f : X −→ R (folgen-)stetig.
Dann nimmt f ein Maximum und ein Minimum an, d.h. es gibt x1 , x2 ∈ X, so dass für alle x ∈ X:
f (x1 ) ≤ f (x) ≤ f (x2 ).
Schreibweise: max f := max f (X) = max{f (x) | x ∈ X}. min f analog.
10Die Proposition ist natürlich auch richtig, wenn wir folgenstetig“ durch stetig“ ersetzen, denn jede stetige
”
”
Funktion ist folgenstetig.
11Für metrische Räume wird die Proposition in der Vorlesung zweimal gezeigt, denn — zumindest für metrische
Räume — folgt sie auch direkt aus Proposition 6.6 und Theorem 6.7.
5. FOLGENKOMPAKTHEIT
Beweis. Schreibe das folgenkompakte Intervall im(f ) als [a1 ; a2 ]. Wähle xi mit f (xi ) = ai .
167
2
Bemerkung 5.7. Kompakte metrische Räume sind vollständig. Denn besitzt eine Cauchy-Folge
eine Teilfolge, die gegen x0 konvergiert, so konvergiert die gesamte Cauchy-Folge gegen x0 .
Den Rest des Abschnitts wollen wir in der Vorlesung aus Zeitgründen überspringen. Die Resultate
werden später im Beweis von folgenkompakt =⇒ kompakt“ in Theorem 6.7 nutzen, den wir in
”
der Vorlesung auch in Teilen überspringen. Ambitionierten Hörern wird aber dringend empfohlen,
diesen Teil noch zu lesen.
LEMMA 5.8. Sei (X, d) ein folgenkompakter metrischer Raum, und > 0. Dann gibt es k ∈ N∪{0}
und {x1 , x2 , . . . xk } ⊂ X, so dass
X = B (x1 ) ∪ B (x2 ) ∪ · · · ∪ B (xk ).
Beweis. OBdA X 6= ∅. Wähle ein x1 ∈ X. Wähle nun weitere xi rekursiv: Falls x1 , x2 ,. . . xj
gewählt sind, so setze
Uj := X r (B (x1 ) ∪ B (x2 ) ∪ · · · ∪ B (xj )).
Im Fall Uj = ∅ ist die Behauptung gezeigt. Andernfalls wähle ein xj+1 ∈ Uj .
Wenn die Aussage des Lemmas nicht gilt, so erhalten wir eine Folge (xi )i∈N mit d(xi , xj ) ≥ für
alle i 6= j. Solch eine Folge besitzt keine konvergente Teilfolge. Also ist X nicht folgenkompakt. 2
FOLGERUNG 5.9. Ist X ein folgenkompakter metrischer Raum, so existiert eine Folge (xi )i∈N ,
so dass {xi | i ∈ N} dicht ist. In anderen Worten: X besitzt eine abzählbare dichte Teilmenge.
Beweis. Zu n ∈ N wähle kn ∈ N und xni ∈ X, so dass
X=
kn
[
B1/n (xni ).
i=1
Wir nehmen nun die Folge
(xi )i∈N = (x11 , . . . x1k1 , x21 , . . . , x2k2 , x31 , . . .)
Sei nun ein beliebiges y ∈ X gegeben. Zu zeigen ist, dass y im Abschluss von A := {xi | i ∈ N}
liegt. Zu jedem n ∈ N wähle ein in so dass y ∈ B1/n (xnin ) , also d(y, xin ) < . Also ist (xin )n∈N
eine Folge in A, die gegen y konvergiert. Somit y ∈ A.
2
168
7. TOPOLOGISCHE RÄUME
Exkurs: Abzählbarkeit
Man definiert für eine Menge M
M abzählbar
:⇐⇒
Es gibt eine injektive Abbildung M → N
⇐⇒
Es gibt eine surjektive Abbildung N → M
Die Umformung der letzten Zeile gilt für M 6= ∅.
Man nennt M abzählbar unendlich, wenn M abzählbar und nicht endlich ist. Zu jeder abzählbar
unendlichen Menge M gibt es eine Bijektion M → N.
Die abzählbare Vereinigung abzählbarer Mengen ist abzählbar. Genauer: Ist
S (Ai )i∈I eine Familie
von Mengen, so dass sowohl alle Ai als auch I abzählbar sind, dann ist auch i∈I Ai abzählbar. Die
Mengen N, Z, Q und die Menge aller Computerprogramme“ (= Die Mengen aller Zeichenketten
”
aus endlich oder abzählbar vielen Buchstaben) sind abzählbar. [15]
Hingegen ist R nicht abzählbar: Denn angenommen es gäbe eine surjektive Abbildung N → R,
n 7→ an . Schreibe die Zahlen an als Dezimalzahl: bn ∈ N ∪ {0}, cjn ∈ {0, 1, . . . , 9}.
a1 = ±b1 , c11 c21 . . .
a2 = ±b2 , c12 c22 . . .
und so weiter. Wähle dn := 1, falls cnn 6= 1 und dn := 2, falls cnn = 1. Dann überlegt man sich leicht,
dass die reelle Zahl
0, d1 d2 d3 . . .
in der obigen Liste der an ’s nicht erscheint.
Wiederholung: Häufungspunkte von Folgen und Mengen
(wird in der Vorlesung übersprungen, aber wird zum Nacharbeiten empfohlen)
Wir wiederholen zunächst Definition 3.16 und Lemma 3.18 aus Kapitel 4.
Definition 5.10. Sei X ein metrischer Raum,
12
A ⊂ X, x0 ∈ X.
(1) x0 ist Häufungspunkt von A
(def)
⇐⇒
(2) Ist U Umgebung von x0 , dann hat U ∩ A unendlich viele Elemente
⇐⇒
(3) Ist U Umgebung von x0 in X, dann gilt U ∩ A r {x0 } =
6 ∅
⇐⇒
(4) Es gibt eine Folge (bn )n∈N in A r {x0 } mit limn→∞ bn = x0
12Die Hörer, die die Vorlesung genau verstehen wollen, sollten hier beachten, dass hier große Vorsicht geboten
ist, wenn X ein Hausdorff-Raum ist, der nicht von einer Metrik induziert wird. In beliebigen Hausdorff-Räumen gilt
zwar (2)⇐⇒(3) und (4)=⇒(2), aber es gibt Beispiele von Hausdorff-Räumen X, A ⊂ X und x0 ∈ X, die (2) aber
nicht (4) erfüllen. Wir betrachten aber nur metrische Räume und haben deswegen hier alle genannten Äquivalenzen.
6. KOMPAKTHEIT
169
LEMMA 5.11. Besitzt A keine Häufungspunkte in X, dann ist A abgeschlossen in X und A ist
eine diskrete 13 Teilmenge.
Beweis. Jedes x0 ∈ A r A erfüllt (3); also A = A abgeschlossen in X. Außerdem ist dann die
auf A induzierte Topologie die diskrete, denn jedes a ∈ A besitzt eine (offene) Umgebung U mit
U ∩ A = {a}. Somit ist {a} offen in A (bezüglich der Spurtopologie auf A).
2
Definition 5.12. Sei X ein metrischer Raum, (an )n∈N eine Folge in X und x0 ∈ X.
(1) x0 ist Häufungspunkt von (xn )n∈N
(def)
⇐⇒
(2) Ist U Umgebung von x0 , dann hat {n ∈ N | an ∈ U } unendlich viele Elemente
⇐⇒
(4) Es gibt eine Teilfolge (af (n) )n∈N mit limn→∞ af (n) = x0
14
LEMMA 5.13. Sei X ein metrischer Raum, x0 ∈ X und (an )n∈N eine Folge in X. Ist x0 ein
Häufungspunkt von {an | n ∈ N}, dann ist x0 auch ein Häufungspunkt von (an )n∈N .
Beweis. Nach der Bedingung (4) in Definition 5.10 gibt es eine Folge (bn )n∈N in A r {x0 } mit
limn→∞ bn = x0 . Bestimme eine Funktion h : N → N mit bn = ah(n) . Diese15 Funktion h ist nicht
beschränkt, denn sonst wäre {bn | n ∈ N} endlich und hieraus könnte man einen Widerspruch zu
limn→∞ bn = x0 konstruieren. 16
Nun wähle rekursiv eine streng monotone Folge (ni )∈N , mit h(ni+1 ) > h(ni ) für alle i ∈ N.
Somit sind i 7→ ni und i 7→ f (i) := h(ni ) streng monotone Funktionen N → N und somit ist
(bni )i∈N = (af (i) )i∈N eine Teilfolge von (bn ) und (an ). Somit ist (af (i) )i∈N eine gegen x0 konvergente
Teilfolge.
2
6. Kompaktheit
Wir führen nun eine andere Eigenschaft ein, die sich Kompaktheit“ nennt, und werden dann die
”
erstaunliche und weitreichende Tatsache beweisen, dass metrische Räume genau dann kompakt
sind, wenn sie folgenkompakt sind.
Definition 6.1. Sei X ein topologischer Raum.
13 diskret“ bedeutet: die Spurtopologie auf A ist die diskrete Topologie
14”
Auch hier ist zu beachten: in metrischen Räumen gilt (2)⇐⇒(4). In beliebigen Hausdorff-Räumen gilt immer
noch (4)=⇒(2). Es gibt aber wieder Beispiele in Hausdorff-Räume, die (2) erfüllten, aber nicht (4). Dies ist ein recht
häufige Quelle sehr subtiler Fehler. Wir betrachten in diesem Zusammenhang aber nur metrische Räume und haben
deswegen hier alle genannten Äquivalenzen.
15Wir sind noch nicht am Ziel, denn h ist im allgemeinen nicht streng monoton wachsend
16Der Widerspruch geht im Detail so: Da {b | n ∈ N} endlich ist, ist die Menge abgeschlossen, also ist dann
n
x0 = bn für ein n ∈ N. Widerspruch.
170
7. TOPOLOGISCHE RÄUME
S
(1) Eine offene Überdeckung von X ist eine Familie (Ui )i∈I von offenen Mengen17 mit X = i∈I Ui .
(2) Wir sagen X erfüllt die Heine-Borel-Eigenschaft, falls gilt:
Zu jeder offenen Überdeckung (Ui )i∈I von X gibt es ein k ∈ N ∪ {0} und i1 , i2 , . . . , ik ∈ I mit
X = Ui1 ∪ Ui2 ∪ · · · ∪ Uik .
18
Man nennt eine solche Überdeckung eine endliche Teilüberdeckung.19
(3) Man nennt X kompakt, falls X ein Hausdorff-Raum ist und die Heine-Borel-Eigenschaft erfüllt.20
LEMMA 6.2. Wir versehen X mit der diskreten Topologie. Dann ist X kompakt, genau dann
wenn X endlich ist.
Beweis. Offensichtlich ist jede endliche Menge kompakt.
Angenommen X ist kompakt und diskret (d.h. mit der diskreten Topologie versehen). Für x ∈ X
ist Ux := {x} offen. Also ist (Ux )x∈X eineSoffene Überdeckung von X. Da X kompakt ist, gibt es
eine endliche Menge J ⊂ X, so dass X = x∈J Ux = J. Also ist bereits X endlich.
2
PROPOSITION 6.3. Sei X ein kompakter topologischer Raum und sei A eine abgeschlossene
Teilmenge. Dann ist A ebenfalls kompakt.
Beweis. Sei (Ui )i∈I eine offene Überdeckung von A. Da A die Spurtopologie von X trägt, gibt es
ei , offen in X mit Ui = A ∩ U
ei . Sei i0 6∈ I, J := I ∪ {i0 }, U
ei := X r A. Dann ist (U
ei )i∈J
Mengen U
0
eine offene Überdeckung von X. Da X kompakt ist, gibt es eine endliche Menge K ⊂ J, so dass
ei )i∈K bereits X überdeckt. Dann überdeckt (Ui )i∈Kr{i } bereits A.
(U
2
0
PROPOSITION 6.4. Sei X ein Hausdorff-Raum und A eine kompakte Teilmenge
abgeschlossen.
21
. Dann ist A
7.5.2014
17Gemeint ist damit natürlich: alle U sind offen in X.
i
18Man wundert sich vielleicht wieso wir nicht k ∈ N genommen haben. Dies liegt am Spezialfall X = ∅,
der (Ui )i∈∅ als offene Überdeckung hat. Für ihn erhält man k = 0. Die leere Menge erfüllt also die Heine-BorelEigenschaft und ist kompakt.
19
Teilüberdeckung bedeutet hier nicht, dass der Raum nur zum Teil überdeckt wird. Er wird ganz überdeckt. Die
Aussage ist vielmehr: Man kann alle bis auf endlich viele der Ui ’s weglassen und hat immer noch eine Überdeckung.
Man überdeckt mit einem endlichen Teil der offenen Mengen.
20Achtung: Manche Mathematiker nennen einen topologischen Raum kompakt, sobald er die Heine-BorelEigenschaft erfüllt, ohne die Hausdorff-Eigenschaft einzuschließen (z.B. Analysis-Vorlesung von Prof. Bunke). Wenn
Sie ein Buch oder Skript zu diesem Thema in die Hand nehmen, müssen Sie immer überprüfen, welche Definition
nun benutzt wird. Ähnlich wie in der Frage, ob 0 eine natürliche Zahl ist oder nicht, gibt es hier eben verschiedene
übliche Konventionen.
21wie immer: bezüglich der Spur-Topologie
6. KOMPAKTHEIT
171
Beweis. Wir zeigen, dass X r A offen ist. Sei y ∈ X r A. Zu jedem x ∈ A gibt es auf Grund
der Hausdorff-Eigenschaft disjunkte offene Mengen Ux und Uyx , so dass x ∈ Ux und y ∈ Uyx .
Achtung: Wie die Notation ja bereits andeutet, hängt Uyx von x ab! Nun ist (A ∩ Ux )x∈A eine
offene Überdeckung von A. Auf Grund der Kompaktheit von A gibt es x1 , . . . , xk ∈ A mit
A = (A ∩ Ux1 ) ∪ . . . ∪ (A ∩ Uxk )
Wir setzen
Vy :=
k
\
Uyxi
offen in X.
i=1
Also ist X r A =
S
y∈XrA
Vy ebenfalls offen.
2
ÜBUNG 6.5. (Zentralübung) Zeigen Sie, dass Lemma 6.2 und Proposition 6.3 auch dann gelten,
wenn man kompakt“ durch folgenkompakt“ ersetzt. Zeigen Sie, dass auch das folgende Analogon
”
”
von Proposition 6.4 gilt: Ist X ein metrischer Raum und A eine folgenkompakte Teilmenge, so ist
A abgeschlossen in X.
PROPOSITION 6.6. Seien X, Y Hausdorff-Räume und sei f : X → Y stetig. Ist X kompakt,
dann ist auch das Bild im(f ) = f (X) (versehen mit der Spurtopologie) kompakt.
Beweis. Sei (Ui )i∈I eine offene Überdeckung von f (X), Ui offen in f (X). Dann ist (f −1 (Ui )i∈I
eine offene Überdeckung von X. Wegen der Kompaktheit von X gibt es eine endliche Menge J, so
dass bereits (f −1 (Ui )i∈J die Menge X überdeckt. Wegen f (f −1 (Ui )) = Ui ∩ f (X) = Ui folgt, dass
(Ui )i∈J bereits f (X) überdeckt.
2
THEOREM 6.7. Sei X ein metrischer Raum. Dann ist X genau dann folgenkompakt, wenn X
kompakt ist.
Beweis des Theorems.
kompakt =⇒ folgenkompakt“: Sei X kompakt. Sei (an )n∈N eine Folge in X.
”
1. Fall: A := {an | n ∈ N} besitzt keinen Häufungspunkt in X
Also ist A abgeschlossen, und somit kompakt. Außerdem ist die Topologie auf A diskret. Wegen
Lemma 6.2 ist dann A endlich. Nach dem Schubfach-Prinzip 22 gibt es also ein a ∈ A, so dass
I := {n ∈ N | an = a} unendlich ist. Dann ist (an )n∈I eine Teilfolge23 von (an )n∈N , die konstant
gleich a ist und somit gegen a konvergiert.
22Das sogenannte Schubfach-Prinzip besagt anschaulich: wenn ich unendlich viele Kugeln in endlich viele Schub-
laden einsortieren, dann habe ich einer Schublade (= Schubfach) unendlich viele Kugeln. Mathematisch präziser:
Ist eine Funktion g : N → A, gegeben mit A endlich, so gibt es ein a ∈ A mit unendlichem g −1 (a). Es sollte Ihnen
inzwischen klar sein, wie man des Schubfach-Prinzips beweist.
23Wir schreiben hier Teilfolgen zum ersten Mal auf eine andere Art und Weise. Wenn man die eindeutige streng
monoton wachsende Bijektion f : N → I wählt, so ist mit (an )n∈I die Teilfolge (af (n) )n∈N gemeint.
172
7. TOPOLOGISCHE RÄUME
2. Fall: {an | n ∈ N} besitzt einen Häufungspunkt x0 in X
Es folgt mit Lemma 5.13 die Existenz einer konvergenten Teilfolge.
folgenkompakt =⇒ kompakt“:
”
Sei X folgenkompakt. Gegeben sei eine offene Überdeckung (Ui )i∈I von X.
Wir zeigen in einem ersten Schritt, dass es eine abzählbare Menge J ⊂ I gibt, so dass (Ui )i∈J eine
(offene) Überdeckung ist. 24. In einem zweiten Schritt zeigen wir dann, dass es eine endliche Menge
K ⊂ J gibt, so dass (Ui )i∈K eine (offene) Überdeckung ist.
1. Schritt:
Sei D eine abzählbare dichte Teilmenge von X, die es auf Grund von Folgerung 5.9 in X gibt.
Dann ist
B := {B1/n (p) | n ∈ N, p ∈ D}
eine abzählbare Menge offener Mengen. Man sieht schnell, dass jede offene Menge in X eine Vereinigung geeigneter Elemente von B ist. Sei nun
B 0 := {U ∈ B | ∃i ∈ I : U ⊂ Ui }
und zu jedem U ∈ B 0 wählen wir solch ein i = f (U ), also U ⊂ Ui(U ) , f : B 0 → I. Sei J := f (B 0 ).
Da B abzählbar ist, ist es auch B 0 und somit J.
Wir müssen für diesen Schritt noch zeigen, dass (Ui )i∈J überdeckt. Sei also x ∈ X. Dann gibt es
i ∈ I mit x ∈ Ui . Wähle n ∈ N, so dass B2/n (x) ⊂ Ui . Wähle ein p ∈ D mit d(p, x) < 1/(2n).
Dann gilt x ∈ B1/n (p) ⊂ B2/n (x) ⊂ Ui und B1/n (p) ∈ B 0 . Also auch x ∈ Uf (B1/n (p)) .
2. Schritt:
Sei nun also (UiS
)i∈J eine offene Überdeckung mit J abzählbar. O.B.d.A. J = N. Wir nehmen
n
an, dass Vn := i=1 Ui eine echte Teilmenge von X ist25 für alle n ∈ N. Wähle xn ∈ X r Vn .
Wähle eine konvergente Teilfolge (xf (n) )n∈N der Folge (xn )n∈N . Es gibt nun ein j ∈ N, so dass
limn→∞ xf (n) ∈ Uj . Da Uj offen ist, liegt für fast alle n ∈ N dann xf (n) ∈ Uj . Unter anderem gibt
es ein n ∈ N, f (n) ≥ j, mit xf (n) ∈ Uj , was offensichtlich ein Widerspruch zur Konstruktion der
xj ist.
Also gibt es ein Vn mit Vn = X.
2
Bemerkung 6.8. Es gibt Hausdorff-Räume, die kompakt, aber nicht folgenkompakt sind. Es gibt
auch Hausdorff-Räume, die folgenkompakt, aber nicht kompakt sind. Siehe im Buch [26], oder
auf der Web-Seite http://austinmohr.com/home/?page_id=146 (kompakt=compact, folgenkompakt=sequentially compact).
Mehr zum Thema folgenkompakte/kompakt inklusive schöner Bilder findet man hier: http://
simomaths.wordpress.com/2013/02/24/topology-sequentially-compact-spaces-and-compact-spaces
24Der erste Schritt wird in der Vorlesung übersprungen
25Erinnerung: A echte Teilmenge von X“ bedeutet: A ⊂ X und A 6= X.
”
6. KOMPAKTHEIT
173
Beispiel 6.9. Für eine Teilmenge A eines endlich-dimensionalen normierten Vektorraums sind
äquivalent:
(1) A ist beschränkt und abgeschlossen
(2) A ist kompakt
(3) A ist folgenkompakt
Definition 6.10. Seien X und Y topologische Räume. Eine Abbildung f : X → Y nennt man
Homöomorphismus, falls gilt:
• f ist stetig
• f ist bijektiv
• f −1 : Y → X ist stetig
In anderen Worten: f ist eine Bijektion mit der Eigenschaft
U offen in X
⇐⇒
f (U ) offen in Y.
Existiert ein Homöomorphismus von X nach Y , so nennt man X und Y homöomorph. Homöomorphie ist eine Äquivalenzrelation auf der Klasse 26 aller topologischer Räume.
SATZ 6.11. Ist X ein kompakter topologischer Raum, Y ein Hausdorff-Raum und f : X → Y
bijektiv und stetig, dann ist f ein Homöomorphismus.
Beweis. Auch: Übungsaufgabe auf Blatt 6.
Zu zeigen ist: Falls U offen in X ist, ist f (U ) offen in Y .
Ist U offen, dann ist X r U eine abgeschlossene Teilmenge des kompakten Raums X, also ist X r U
kompakt. Somit ist auch f (X r U ) kompakt, und deswegen abgeschlossen. Wir wissen deshalb,
dass f (U ) = Y r f (X r U ) offen in Y ist.
2
Definition 6.12. Sind (M, dM ) und (N, dN ) metrische Räume. Eine Abbildung f : M → N heißt
gleichmäßig stetig, falls
(6.13)
∀ ∈ R>0 : ∃δ ∈ R>0 : ∀x, y ∈ M : dM (x, y) ≤ δ =⇒ dN (f (x), f (y)) ≤ .
LEMMA 6.14. Sind (M, dM ) und (N, dN ) metrische Räume, und f : M → N stetig. Ist M
kompakt, so ist f gleichmäßig stetig.
Der Beweis stimmt wörtlich mit dem Beweis von Lemma 4.1 in Kapitel 6 überein, wenn man
|x − y| durch dM (x, y) und |f (x) − f (y)| durch dN (f (x), f (y)) ersetzt und analoges für xnk und
ynk durchführt.
2
174
7. TOPOLOGISCHE RÄUME
12.5.2014
Sei (X, d) ein metrischer Raum und Y ⊂ X, x ∈ X. Definiere
d(x, Y ) := inf{d(x, y) | y ∈ Y }
Dann gilt d(x, Y ) = 0 ⇐⇒ x ∈ Y .
d(x1 , y) ≤ d(x1 , x2 ) + d(x2 , y)
Nehme das Infimum über y ∈ Y :
d(x1 , Y ) ≤ d(x1 , x2 ) + d(x2 , Y )
und analoges gilt, wenn wir x1 und x2 vertauschen. Es folgt
|d(x1 , Y ) − d(x2 , Y )| ≤ d(x1 , x2 ).
Daraus folgt, dass x 7→ d(x, Y ), X → R stetig ist.
d(x, X r U ) ≥ r
⇐⇒ Br (x) ⊂ U
PROPOSITION 6.15. Sei (X, d) ein kompakter metrischer Raum und (Ui )i∈I eine offene Überdeckung. Dann gibt es ein > 0 mit der folgenden Eigenschaft: Zu jedem x ∈ X gibt es ein i ∈ I
mit B (x) ⊂ Ui .
Solch ein nennt man eine Lebesguesche Zahl .
BILD
Beweis. Da X kompakt ist, gibt es eine endliche Teilüberdeckung (Ui )i∈J . O.B.d.A. J = {1, 2, . . . , k}.
Die Funktion
k
1X
f : X → R, x 7→
d(x, X r Ui )
k i=1
ist stetig. Gilt x ∈ Ui , so ist d(x, X r Ui ) > 0. Da jedes x ∈ X in U1 ∪ . . . ∪ Uk enthalten ist, gilt
f (x) > 0. Da X kompakt ist, nimmt f sein Minimum in einem Punkt x0 ∈ X an.
Setze
:= min f = f (x0 ) > 0.
Aus f (x) ≥ folgt, dass es mindestens ein i ∈ {1, 2, . . . , k} gibt mit d(x, X r Ui ) ≥ , also
B (x) ⊂ Ui .
2
26Die Gesamtheit aller topologischer Räume ist so groß, dass es keine Menge mehr ist, sondern eine Klasse.
Siehe den Anfang der Analysis I.
7. KONTRAKTIONEN UND BANACHSCHER FIXPUNKTSATZ
175
7. Kontraktionen und Banachscher Fixpunktsatz
Sei (X, d) ein metrischer Raum, Y ⊂ X, f : Y → X.
Definition 7.1. Man nennt x ∈ Y einen Fixpunkt von f , falls f (x) = x. Die Abbildung f : Y → X
wird Kontraktion genannt, falls es ein L ∈ [0; 1) gibt, so dass für alle y, z ∈ Y gilt:
d(f (y), f (z)) ≤ Ld(y, z).
Beispiel 7.2. a ∈ (−1; 1), b ∈ R, X = Y = R. Dann ist f (x) = ax + b eine Kontraktion mit
L = |a|.
Kontraktionen sind immer stetig.
Kontraktionen besitzen höchstens einen Fixpunkt. Denn sind x1 und x2 Fixpunkte, so gilt d(x1 , x2 ) ≤
Ld(x1 , x2 ), also d(x1 , x2 ) = 0.
Beispiel 7.3. X = Y = R r {0}. Dann ist f (x) = x/2 eine Kontraktion ohne Fixpunkte.
SATZ 7.4 (Banachscher Fixpunktsatz). Sei X ein nichtleerer, vollständiger metrischer Raum,
Y ⊂ X und f : Y → X eine Kontraktion mit f (Y ) ⊂ Y . Dann besitzt f genau einen Fixpunkt.
Beweis. Wähle ein x0 ∈ X und definiere dann rekursiv
xn+1 = f (xn )
d(xn+1 , xn ) = d(f (xn ), f (xn−1 )) ≤ Ld(xn , xn−1 )
Für k ∈ N:
d(xn+k , xn ) ≤
k
X
d(xn+j , xn+j−1 ) ≤ (L + L2 · · · + Lk )d(xn , xn−1 ) ≤
j=1
Ld(xn , xn−1 )
Ln d(x1 , x0 )
≤
.
1−L
1−L
Hieraus sieht man sofort, dass (xn )n∈N eine Cauchy-Folge ist. Da X vollständig ist, ist sie konvergent in X.
x := lim xn = lim f (xn−1 ) ∈ f (Y )
n→∞
n→∞
f (x) = f ( lim xn ) = lim f (xn ) = lim xn+1 = x
n→∞
n→∞
n→∞
Also ist x ein Fixpunkt, und nach obiger Bemerkung der einzige.
2
Beispiel 7.5. Betrachte die Funktion f : [1; 2] → R, f (x) = x + 12 cos x. Dann gilt f 0 (x) =
1− 21 sin x ≥ 1/2, also ist f streng monoton wachsend. Auf Grund der Ergebnisse in Abschnitt 6.3 in
Kapitel 4 gilt cos 1 ≥ 1/2, also f (1) ≥ 5/4, und cos 2 < 0, also f (2) < 2. Es folgt f ([1; 2]) ⊂ [5/4; 2].
Wegen sin x ≥ x − x3 /6 gilt für alle x ∈ [1; 2] die Ungleichung sin x ≥ 2/3 und somit
1 2
2
f 0 (x) ≤ 1 −
= .
2 3
3
176
7. TOPOLOGISCHE RÄUME
Mit dem Mittelwertsatz ergibt sich daraus |f (x) − f (y)| ≤ (2/3)|x − y| für x, y ∈ [1; 2], d.h. f ist
eine Kontraktion. Da [1; 2] vollständig ist, konvergiert nach dem Banachschen Fixpunktsatz (und
desen Beweis) die rekursiv definierte Folge
x0 := 1,
xn+1 := f (xn )
gegen den eindeutigen Fixpunkt a von f . Wegen π/2 ∈ [1; 2] folgt a = π/2 und wir bekommen
n
2
|π/2 − xn | ≤
.
3
Hiermit könnte man ein Computer-Programm zur Berechnung von π schreiben. Es gibt aber deutlich effizientere Verfahren zur Berechnung von π.
Allgemein gilt: wenn man Nullstellen einer Funktion h sucht, ist es oft hilfreich Fixpunkte der
Funktion f (x) = x + ah(x) für ein geeignetes a zu suchen. Dies führt zum sogenannten NewtonVerfahren, mit dem man zum Beispiel Nullstellen von Polynomen recht effizient näherungsweise
berechnen kann (inklusive einer oberen Schranke für die Abweichung des Näherungswerts vom
richtigen Wert).
KAPITEL 8
Differential-Rechnung für Funktionen in mehreren
Veränderlichen
1. Vorbemerkungen
In diesem Kapitel versehen wir Rn mit irgendeiner Norm k • k. Die davon induzierte Topologie ist
die Standard-Topologie, denn alle Normen auf Rn sind äquivalent.
Standard-Basis von Rn : (e1 , e2 , . . . , en ).
L(Rn , Rk )
:=
Lineare Abbildungen von Rn nach Rk
∼
=
{k × n-Matrizen}
=:
Rk×n
Bei Prof. Kerz wurde M (k × n; R) an Stelle von Rk×n verwendet.
abweichend von unserer bisherigen Schreibweise, übernehmen wir von nun an die in der Linearen
Algebra übliche Konvention, dass Elemente von Rn als Spaltenvektoren geschrieben werden. Wir
schreiben auch


x1
 x2 
 
x = (x1 , x2 , . . . , xn )T =  .  ∈ Rn
 .. 
xn
LEMMA 1.1. Ist A : Rn → Rk eine lineare Abbildung, dann ist A stetig.
Beweis. Schreibe x = (x1 , . . . , xn )T =
Pn
j=1
Ax =
xj ej ∈ Rn und
k X
n
X
i=1 j=1
177
aij xj ei .
178
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
Da alle Normen auf Rn und Rk äquivalent sind, reicht es, die Behauptung für die Supremumsnorm
zu zeigen.


n
X
kAxk∞ ≤  max
|aij | kxk∞ ≤ Ckxk∞ .
i∈{1,2...,k}
|
j=1
{z
C:=
}
Zu gegebenem > 0 setze δ := /C. Dann gilt
d∞ (x, y) = kx − yk∞ < δ
=⇒
d∞ (Ax, Ay) = kAx − Ayk∞ = kA(x − y)k∞ < .
2
KOROLLAR 1.2. Sind V und W endlich-dimensionale normierte Vektorräume, und A : V → W
linear, dann ist A stetig.
Bemerkung 1.3. Sei V ein Vektorraum mit Basis (bn | n ∈ N), den wir mit der zugehörigen
Supremumsnorm
`
X
k
xn bn k∞ := max |xn |
n=1
n∈{1,...,`}
versehen. Dann gibt es genau eine lineare Abbildung A : V → R mit A(bn ) = n. Diese Abbildung
ist nicht stetig. Denn setzen wir an := √1n bn ∈ V , dann ist (an )n∈N eine Nullfolge in (V, k • k∞ ),
√
aber f (an ) = n → ∞ für n → ∞.
Bemerkung 1.4. Das meiste, was wir in diesem Kapitel machen, gilt ebenso (mit denselben
Beweisen), wenn man
• Rn , Rk und ähnliche Räume durch beliebige (auch unendlich-dimensionale) Banachräume1
ersetzt und
• lineare Abbildungen (und endliche Matrizen) durch stetige lineare Abbildungen ersetzt.
Für Details verweise wir auf das Buch [2]. Der mathematische Mehraufwand ist gering. In der
Vorlesung schränken wir uns auf Räume Rn , Rk ,. . . ein, damit klar ist, dass dies die wichtigen
Beispiele sind, die Sie möglichst gründlich verstehen müssen. Durch Wahl von Basen folgt dann
auch unmittelbar2, dass alle von uns bewiesenen Aussagen dann auch in endlich-dimensionalen
normierten Vektorräumen gelten.
2. Differenzierbarkeit in mehreren Variablen
14.5.2014
1also vollständige normierte Vektorräume
2Das heißt hier: ohne nochmals in die Beweise schauen zu müssen.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN
179
Definition 2.1. Sei U ⊂ Rn offen, p ∈ U . Wir sagen, f : U → Rk ist total differenzierbar in p
oder differenzierbar in p, falls es eine lineare Abbildung A : Rn → Rk gibt mit
(2.2)
lim
h→0
f (p + h) − f (p) − Ah
= 0.
khk
Wir sagen, f ist differenzierbar auf W ⊂ U , wenn f in allen p ∈ W differenzierbar ist. Und f ist
differenzierbar, wenn f auf U differenzierbar ist.
3
PROPOSITION 2.3. Sei f , U , p wie oben. Dann gibt es höchstens ein A ∈ Rk×n , für das (2.2)
gilt.
Falls f differenzierbar in p ist, dann nennt man das obige (eindeutig bestimmte) A die (totale)
Ableitung oder das (totale) Differential von f in p und schreibt sie als Dp f := A und f 0 (p) := A.
PROPOSITION 2.4. Ist f differenzierbar in p, dann ist f stetig in p.
Beweis der beiden vorangehenden Propositionen. (2.2) ist äquivalent zu der Aussage: Es gibt eine
in p stetige Funktion r : U → Rk mit r(p) = 0 und
für alle h ∈ Rn mit p + h ∈ U.
f (p + h) = f (p) + Ah + r(p + h)khk
Wir schreiben x für p + h. Die Funktionen U 3 x 7→ f (p) ∈ Rk , x 7→ A(x − p) und x 7→ r(x)kx − pk
sind stetig in p und somit auch x 7→ f (x). Angenommen (2.2) gilt für A := A1 ∈ Rk×n und
A := A2 ∈ Rk×n . O.B.d.A. sei U ⊃ B (p0 ). Bestimme nun zugehörige ri zu Ai . Es gilt für
x = p + h ∈ U:
A1 h + r1 (p + h)khk = A2 h + r2 (p + h)khk
Wenn wir nun für t ∈ [0; 1] die Variable h durch th ersetzen, ergibt sich
t(A1 − A2 )(h) = (A1 − A2 )(th) = (r2 (p + th) − r1 (p + th)) kthk = (r2 (p + th) − r1 (p + th)) tkhk.
Wir dividieren durch t und bekommen:
(A1 − A2 )h = (r2 (p + th) − r1 (p + th)) khk → 0
{z
}
|
→0
für t → 0. Da dies für alle h ∈ B (0) gilt, gilt es insbesondere für h := 2 e` , also (A1 − A2 )(e` ) = 0.
Es folgt A1 = A2 .
2
3So wie die Definitionen bisher gewählt sind, ist das Wörtchen total“ ein erlaubtes Vorwörtchen, hat aber keine
”
inhaltliche Bedeutung. Später werden wir auch den Begriff partiell differenzierbar“ kennen lernen. Man benutzt
”
dann das Vorwörtchen “total“ um nochmals zu betonen, dass hier nicht partiell differenzierbar“ gemeint ist. Aber
”
selbst dann ist die Bedeutung von differenzierbar“ und total differenzierbar“ die gleiche.
”
”
180
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
Beispiel 2.5. Die Funktion f : R2 → R, (x1 , x2 )T 7→ x1 x2 ist stetig in jedem Punkt p = (p1 , p2 )T .
Denn wenn wir A := (p2 , p1 ) setzen4, so gilt für x = (x1 , x2 )T h = (h1 , h2 )T
f (p + h) − f (p) − Ah = (p1 + h1 )(p2 + h2 ) − p1 p2 − (p2 h1 + p1 h2 ) = h1 h2 = r(p + h)khk,
wobei wir für h ∈ R2 r {0} definieren
r(p + h) :=
h1 h2
khk
und r(p) = 0. Es gilt im Fall k • k = k • k∞ :
h1 h2 khk∞ khk∞ ≤
khk∞ khk∞ ≤ khk∞ ,
das heißt in diesem Fall haben wir limh→0 r(p + h) = 0 = r(p). Wegen der Äquivalenz aller
Normen auf gilt diese Aussage auch für beliebige Normen k • k. Also ist f differenzierbar in p und
Dp f = f 0 (p) = (p2 , p1 ).
Bemerkung 2.6. Differenzierbarkeit ist eine lokale Eigenschaft. D.h. ist U offen in Rn , p ∈ U und
stimmen die Funktionen g, f : U → Rk auf einer Umgebung von p überein, dann gilt:
(a) f ist genau dann in p differenzierbar, wenn g in p differenzierbar ist.
(b) Wenn f in p differenzierbar ist, dann gilt f 0 (p) = g 0 (p).
Bemerkung 2.7. Schreibe f : U → Rk in Komponenten f (x) = (f1 (x), f2 (x), . . . , fk (x))T mit
fi : U → R. Sei p ∈ U
f ist stetig in p
⇐⇒
f1 , f2 ,. . . und fk sind stetig in p


lim f1 (p + h)
h→0


 lim f2 (p + h)
h→0

lim f (p + h) = 

..


h→0
.


lim fk (p + h)
h→0
Diese Zeile ist so zu lesen: wenn eine der beiden Seiten exitiert, dann auch die andere und dann
sind die Werte gleich.
f ist differenzierbar in p
⇐⇒
f1 , f2 ,. . . und fk sind differenzierbar in p
 0 
f1 (p)
f20 (p)


f 0 (p) =  .  ∈ Rk×n
 .. 
fk0 (p)
Also: fi0 (p) ∈ R1×n ist eine Zeile der Matrix f 0 (p).
4kein Tippfehler bei A: es ist ein Zeilenvektor!
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN
181
Bemerkung 2.8. Sind V und W Vektorräume, dim V = n, dim W = k, U offen in V , f : U → W .
Die Wahl von Basen liefert Isomorphismen ϕ : Rn → V und ψ : Rk → W .
Wir sagen: f ist differenzierbar in p ∈ U gdw f˜ := ψ −1 ◦ f ◦ ϕ ist differenzierbar in ϕ−1 (p).
Diese Definition ist unabhängig von der Wahl der Basen. Man erhält ein
f 0 (p) ∈ L(V, W )
das ebenfalls unabhängig von der Basis definiert ist, und
ψ −1 ◦ f 0 (p) ◦ ϕ = f˜0 (ϕ−1 (p)).
Bemerkung 2.9. Ist f : U → Rk differenzierbar, so erhalten wir eine Abbildung f 0 : U →
L(Rn , Rk ) ∼
= Rk×n ∼
= Rkn . Ist f 0 wieder differenzierbar (also f zweimal differenzierbar), so erhalten
wir
2
f 00 : U → L(Rn , L(Rn , Rk )) ∼
= L(Rn , Rkn ) = Rn k
Ist f r-mal differenzierbar, dann
f (r) : U → Rn
r
k
Wie berechnet man die Koeffizienten von f 0 (p)?
Definition 2.10. Sei U offen in Rn , f : U → Rk , p ∈ U ,
(1) Zu v ∈ Rn r{0} wähle > 0 so klein, dass fp,v : (−; ) → Rk , fp,v (t) := f (p+tv) wohldefiniert
ist. Wir sagen: f ist differenzierbar in p in Richtung v, falls fp,v in 0 differenzierbar ist. Wir
nennen dann
0
∂p,v f := fp,v
(0)
die Richtungsableitung von f an der Stelle p in Richtung v.
(2) Wir sagen f ist in p partiell differenzierbar falls f in Richtung ei differenzierbar ist für alle
i ∈ {1, 2, . . . , n}. Schreibweise p = (p1 , . . . , pn ). Man nennt
d
∂f
0
(p) := fp,e
(0) = |t=0 t 7→ f (p1 , p2 , . . . , pi−1 , pi + t, pi+1 , . . . , pn )
i
∂xi
dt
die i-te partielle Ableitung von f an der Stelle p.
LEMMA 2.11. f , U , n, k, p wie oben. Ist f (total) differenzierbar in p, dann ist f in p in jede
Richtung differenzierbar.
Beweis. Gegeben sei ein v ∈ Rn r {0}. Wähle > 0 so klein, dass für t ∈ (−; ) gilt: tv ∈ U . Mit
t → 0 gilt dann auch tv → 0. Es gelte
lim
h→0
f (p + h) − f (p) − Ah
=0
khk
182
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
für A ∈ L(Rn , Rk ). Dann gilt auch
f (p + tv) − f (p) − A(tv)
1
=
t→0
ktvk
kvk
0 = lim
f (p + tv) − f (p)
− A(v) .
t→0
t
lim
Also existiert die Richtungsableitung und nimmt den folgenden Wert an:
0
∂p,v f = fp,v
(0) = lim
t→0
f (p + tv) − f (p)
= A(v)
t
2
KOROLLAR 2.12. Ist f in p differenzierbar, dann ist die Ableitung in p:
∂f
∂f
∂f
(p)
(p)
.
.
.
(p)
∈ Rk×n
f 0 (p) = ∂x
∂x2
∂xn
1
Also ist
∂f
∂xi (p)
die i-te Spalte der Matrix f 0 (p).
Bemerkung 2.13. Es gilt also für U , p, n, k, f wie oben:
f diffbar in p
=⇒
f diffbar in jede Richtung in p
=⇒
f partiell diffbar in p.
Aber man kann durch Beispiele zeigen, dass die Umkehrungen nicht gelten:
f diffbar in p
⇐=
6
⇐=
6
f diffbar in jede Richtung in p
Beispiel 2.14.
(
2
f : R → R,
f (x, y) :=
f ist in 0 partiell differenzierbar und
∂f
(0) = 0,
∂x
2xy
x2 +y 2
0
f partiell diffbar in p.
falls (x, y) 6= 0
falls x = y = 0
∂f
(0) = 0.
∂y
Aber für v := √12 (1, 1)T ist t 7→ f (tv) nicht einmal stetig in 0. Denn f (tv) = 1 für t 6= 0 und
f (0) = 0. Also ist f in 0 nicht in Richtung v differenzierbar. Dadurch ist f auch nicht total
differenzierbar in 0.
f ist also partiell differenzierbar in 0. Nach einem Basiswechsel ist f aber nicht mehr partiell
differenzierbar.
BILD
19.5.2014
PROPOSITION 2.15. f , U , n, k, p wie oben. Äquivalent sind:
(1) f auf U partiell differenzierbar und alle partiellen Ableitungen
∂f
: U → Rk ,
∂xi
sind stetig.
i ∈ {1, 2, . . . , n}
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN
183
(2) f auf U total differenzierbar und
f 0 : U → L(Rn , Rk ) ∼
= Rk×n
ist stetig
Ist (1) bzw. (2) erfüllt, so sagen wir f ist stetig differenzierbar .
Sei U offen in Rn .
C 1 (U, Rk ) := {f : U → Rk | f ist stetig differenzierbar}.
C r+1 (U, Rk ) := {f ∈ C 1 (U, Rk ) | f 0 ∈ C r (U, L(Rn , Rk )) = C r (U, Rk×n )}
Elemente in C r (U, Rk ) nennt man r-mal stetig differenzierbar.
Beweis der Proposition.
(2) =⇒ (1)“ folgt direkt aus dem oben gesagten.
”
(1) =⇒ (2)“:
”
Zu zeigen ist die Differenzierbarkeit in einem beliebigen p ∈ U . Die Stetigkeit der Ableitung
ergibt sich dann direkt aus der Stetigkeit der partiellen Ableitungen. Sobald wir wissen, dass f
differenzierbar ist, so erhalten wir aus den partiellen Ableitungen die totale Ableitung
∂f
∂f
∂f
(p) ∂x
(p) . . . ∂x
(p) ∈ Rk×n
(2.16)
A = ∂x
1
2
n
Da man die Differenzierbarkeit komponentenweise überprüfen kann, können wir ohne Beschränkung
der Allgemeinheit annehmen, dass k = 1.
Zu > 0 wähle ein δ > 0, so dass für alle η ∈ Rn mit kηk∞ < δ gilt:
∂f
∂f
p + η ∈ U und für i ∈ {1, 2, . . . , n} gilt (p + η) −
(p) < .
∂xi
∂xi n
Zu h = (h1 , . . . , hn )T ∈ Rn mit khk∞ < δ setze
q (0)
:= p = (p1 , . . . , pn )T
q (1) := (p1 + h1 , p2 , . . . , pn )T ,
..
..
.
.
q (`) := (p1 + h1 , . . . , p` + h` , p`+1 , . . . , pn )T
..
..
.
.
q (n)
f (q (i) ) − f (q (i−1) )
:= p + h = (p1 + h1 , . . . , pn + hn )T
1.M W S
=
hi
∂f
(p1 + h1 , . . . , p`−1 + h`−1 , p` + ϑi h` , p`+1 , . . . , pn )
{z
}
∂xi |
=:ξ (i)
184
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
für ein geeignetes ϑi ∈ [0; 1].
5
Mit kξ (i) − pk∞ < δ, folgt
(i)
f (q ) − f (q (i−1) ) − hi ∂f (p) < |hi | ∂xi n
Es ergibt sich, wenn wir A durch (2.16) definieren
n X
(i)
f (q ) − f (q (i−1) ) − hi ∂f (p) < khk∞ .
|f (p + h) − f (p) − Ah| ≤
∂xi i=1
Wir haben das -δ-Kriterium für den Grenzwert überprüft, und diese Existenz besagt gerade, dass
f in p differenzierbar mit Ableitung A ist. 6
2
PROPOSITION 2.17 (Summenregel). Seien U , n, k, p, wie oben. Seien f, g : U → Rk , a, b ∈ R,
v ∈ Rn r {0}. Sind f und g in p differenzierbar (bzw. in Richtung v differenzierbar, bzw. partiell
differenzierbar), dann ist af + bg : U → Rk ebenfalls in p differenzierbar (bzw. in Richtung v
differenzierbar, bzw. partiell differenzierbar). Es gilt dann
(af + bg)0 (p) = af 0 (p) + bg 0 (p)
bzw.
∂p,v (af + g) = a∂p,v f + b∂p,v g
bzw.
∂(af + bg)
∂f
∂g
(p) = a
(p) + b
(p).
∂xi
∂xi
∂xi
2
Beweis. Offensichtlich.
Definition 2.18. Sei f = (f1 , . . . , fk )T : U → Rk in p ∈ U partiell differenzierbar. Dann nennt
man
∂fi
(p) i∈{1,2,...,k}
∂xj
j∈{1,2,...,n}
die Jacobi-Matrix von f in p. Ist f in p differenzierbar, so ist es die Matrix von f 0 (p) ∈ L(Rn , Rk )
(bezüglich der Standardbasis von Rn bzw. Rk ).
SATZ 2.19 (Kettenregel). Sei U offen in Rn , V offen in Rm , f : U → Rm , g : V → Rr , f (U ) ⊂ V .
Ist f differenzierbar in p und g differenzierbar in q := f (p), dann ist g ◦ f differenzierbar in p und
(g ◦ f )0 (p) = g 0 (q) · f 0 (p).
5Wir wenden den 1. MWS auf die Funtion t 7→ f (p + h , . . . , p
1
1
i−1 − hi−1 , t, pi+1 , . . . , pn ), t ∈ [pi ; pi + hi ] bzw.
t ∈ [pi + hi ; pi ] an.
6Ist Ihnen klar, wieso es hilfreich war, uns auf den Fall k = 1 einzuschränken? Der Grund ist, dass wir den
1. Mittelwertsatz nutzen, den wir nur für Funktionen I → R, I ein Intervall, bewiesen haben; also für k = 1. Wir
werden eine Verallgemeinerung des Mittelwertsatz auf Funktionen f : U → R, U offen in Rn zwar bald kennenlernen,
eine Verallgemeinerung auf Funktionen nach Rk , k > 1 ist jedoch nicht möglich, siehe Beispiel 2.24.
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN
185
Man kann g 0 (q) · f 0 (p) als Verkettung der linearen Abbildungen f 0 (p) ∈ L(Rn , Rm ) und g 0 (q) ∈
L(Rm , Rr ) ansehen, 7 oder f 0 (p) und g 0 (q) als Matrizen betrachten (also als Jacobi-Matrizen!) und
dann gilt f 0 (p) ∈ Rm×n , g 0 (q) ∈ Rr×m , g 0 (q) · f 0 (p) ∈ Rr×n .
!ACHTUNG!. Es gilt nicht g 0 (q) · f 0 (p) = f 0 (p) · g 0 (q). Die rechte Seite ist für r 6= n gar nicht
definiert, und auch im Fall n = r gilt hier im allgemeinen keine Gleichheit.
Beweis der Kettenregel.
f (p + h) = f (p) + f 0 (p) · h + khk(h),
g(q + k) = g(q) + g 0 (q) · k + kkkδ(k),
lim (h) = 0
h→0
lim δ(k) = 0
k→0
Für h → 0 geht auch k := f (p + h) − f (p) gegen Null.
g(f (p + h))
= g(f (p)) + g 0 (f (p)) (f 0 (p) · h + khk(h)) + kkkδ(k)
kkkδ(k)
= g(q) + g 0 (q) · f 0 (p) · h + khk g 0 (q)(h) +
khk
Die Funktion h 7→ γ(h) := g 0 (q) · (h) ist die Verkettung der in 0 stetigen Funktion mit der
linearen (und somit stetigen) Funktion k 7→ g 0 (q) · k. Also ist γ stetig in 0 und γ(0) = 0.
Mit h → 0 gilt auch δ(k) → 0. Wir zeigen, dass es eine Konstante C > 0 gibt, so dass kkk/khk ≤ C
für alle h in einer Umgebung von 0 gilt. Es reicht, dies für die Supremums-Norm auf Rn und Rm
zu zeigen (da alle Normen auf Rn und Rm äquivalent).
Für A ∈ Rm×n und h ∈ R gilt
kAhk∞ ≤ nkAk∞ khk∞
Also
kkk∞
khk∞
kf 0 (p) · h + khk∞ (h)k∞
khk∞
nkf 0 (p)k∞ khk∞ + khk∞ k(h)k∞
≤
khk∞
≤ nkf 0 (p)k∞ + k(h)k∞
=
2
KOROLLAR 2.20 (Produktregel). Sei U offen in Rn , f, g : U → R. Sind f und g differenzierbar
in p ∈ U , dann auch f · g : U → R, x 7→ f (x) · g(x), und es gilt
(f · g)0 (p) = g(p)f 0 (p) + f (p)g 0 (p)
7Bei dieser Interpretation wäre es eigentlich sauberer g 0 (q) ◦ f 0 (p) an Stelle von g 0 (q) · f 0 (p) zu schreiben.
Da wir aber sowieso lineare Abbildungen mit Matrizen identifizieren, ist es auch sinnvoll die Verkettung linearer
Abbildungen mit Matrizen-Multiplikation zu identifizieren.
186
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
Beweis. Betrachte
2
F :U →R ,
F (x) :=
f (x)
.
g(x)
Nach Voraussetzung ist F differenzierbar in p.
0 f (p)
F 0 (p) =
∈ R2×n .
g 0 (p)
Die Abbildung ϕ : R2 → R, (x1 , x2 )T 7→ ϕ(x) = x1 x2 ist (überall) differenzierbar und es gilt
ϕ0 (x1 , x2 ) = (x2 , x1 ) ∈ R1×2 , siehe Beispiel 2.5 oder berechne es über die partiellen Ableitungen.
f ·g =ϕ◦F
Also ist nach Kettenregel f · g in p differenzierbar und es gilt
0 f (p)
(f · g)0 (p) = ϕ0 (F (p)) · F 0 (p) = (g(p), f (p)) ·
= g(p)f 0 (p) + f (p)g 0 (p).
g 0 (p)
2
KOROLLAR 2.21 (Quotientenregel). Sei U offen in Rn , f : U → R, g : U → R r {0}. Sind f
und g differenzierbar in p ∈ U , dann auch f /g : U → R, x 7→ f (x)/g(x), und es gilt
0
g(p)f 0 (p) − f (p)g 0 (p)
f
.
(p) =
g
g(p)2
Beweis. Ähnlich wie oben, aber mit ϕ : R × (R r {0}) → R, (y, z) 7→ y/z.
ϕ0 (y, z) = (1/z, −y/z 2 )
0
0 f
g(p)f 0 (p) − f (p)g 0 (p)
f (p)
0
0
2
.
(p) = ϕ (F (p)) · F (p) = (1/g(p), −f (p)/g(p) ) 0
=
g (p)
g
g(p)2
2
Bemerkungen 2.22.
(1) Produktregel, Quotientenregel, Summenregel richtig für Richtungsableitungen,
für partielle Ableitungen
(2) Die Kettenregel gilt nicht mehr für alle partiell differenzierbare Funktionen.
betrachte man die differenzierbare Funktion
x+y
1 1
x
1
h : R2 → R2 ,
h(x, y) =
=
·
,
h0 (x, y) =
x−y
1 −1
y
1
insbesondere
Als Beispiel8
1
−1
8In Beispielen wie diesem benutzen wir die Notation h(x, y) als alternative, kürzere Schreibweise für h
x
y
2. DIFFERENZIERBARKEIT IN MEHREREN VARIABLEN
187
und die Funktion f : R2 → R aus Übungsblatt 7, Aufgabe 1. Dann ist f in 0 partiell differenzierbar und es gilt
∂f
∂f
(0) =
(0) = 0
∂x
∂y
Aber
(x2 − y 2 )
2(x + y)(x − y)
=
,
(f ◦ h)(x, y) =
(x + y)2 + (x − y)2
x2 + y 2
also
∂(f ◦ h)
∂(f ◦ h)
(0) = 1,
(0) = −1.
∂x
∂x
1 1
(0, 0) ·
= (0, 0) 6= (1, −1)
1 −1
Wenn die Kettenregel gültig wäre, so würde sie besagen, dass die linke und die rechte Seite
gleich sind. Also ist dies ein Gegenbeispiel.
21.5.2014
Übersicht: Wichtigste Methoden, um Differenzierbarkeit zu erhalten.
Sei f : Rn → Rk von der Form f (x) = Ax + b, A ∈ Rk×n , b ∈ Rk . Dann ist f überall differenzierbar
und es gilt f 0 (x) = A überall. f 00 (x) = 0 ∈ L(Rn , L(Rn , Rk )).
Ist f : U → Rk (k-mal) differenzierbar und V ⊂ U offen, dann ist auch f |V (k-mal) differenzierbar.
Summen-, Produkt-, Quotienten-, Kettenregel.
Polynome in mehreren Variablen sind glatt (= beliebig oft differenzierbar), z.B.
R3 → R, (x, y, z)T 7→ x3 + x2 y 4 + 3xyz.
Ebenso Funktionen wie
f : R3 → R,
f (x) = eihξ,xi ,
ξ ∈ R3 .
Mittelwertsatz.
Der Mittelwertsatz für Funktionen Rn ⊃ U → R ergibt sich direkt aus dem der Analysis I.
PROPOSITION 2.23 (Mittelwertsatz). Sei U offen in Rn , p, q ∈ U mit
[p; q] := {p + t(q − p) | t ∈ [0; 1]} ⊂ U.
Die Funktion f : U → R sei stetig auf [p; q] und differenzierbar auf
{p + t(q − p) | t ∈ (0; 1)}.
188
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
Dann gibt es ein ϑ ∈ (0; 1) mit
f (q) = f (p) + f 0 (p + ϑ(q − p)) · (q − p).
Beweis. ϕ : [0; 1] → Rn , t 7→ p + t(q − p).
f ◦ ϕ stetig auf [0; 1] und differenzierbar auf (0; 1). Aus dem Mittelwertsatz (Satz 3.3 aus Kapitel 5)
folgt die Existenz eines ϑ ∈ (0; 1) mit
MWS
f (q) − f (p) = (f ◦ ϕ)(1) − (f ◦ ϕ)(0) = (f ◦ ϕ)0 (ϑ) = f 0 (ϕ(ϑ)) · ϕ0 (ϑ) = f 0 (p + ϑ(q − p)) · (q − p).
2
!ACHTUNG!. Man kann hier nicht ohne weiteres die Zielmenge R durch Rk ersetzen. Wenn wir
f = (f1 , . . . , fk )T schreiben, kann man zwar den Mittelwert-Satz für jedes fi anwenden, und wir
erhalten jedesmal ein ϑi ∈ [0; 1] mit
fi (q) = fi (p) + fi0 (p + ϑi (q − p)) · (q − p).
Man findet aber kein ϑ ∈ [0; 1] mit
f (q) = f (p) + f 0 (p + ϑ(q − p)) · (q − p).
Beispiel 2.24. f : R → R2 , f (t) = (cos t, sin t)T , p = 0, q = 2π. Dann gilt f (p) = f (q), aber
f 0 (t) = (− sin t, cos t)T 6= 0 ∈ R2 . Es kann also kein solches ϑ geben.
Definition 2.25. Sei X ein topologischer Raum und Y eine Menge. Eine Funktion f : X → Y
heißt lokalkonstant, wenn jedes x ∈ X eine Umgebung U in X besitzt, so dass f |U konstant ist.
Konstante Funktionen sind lokal konstant. Ist X diskret (zum Beispiel X = {1, 2, 3} ⊂ R), dann
ist jede Funktion f : X → Y lokal konstant.
Ist f : X → Y lokal konstant und A ⊂ X, dann ist f |A lokal konstant.
LEMMA 2.26. Ist f : A → Y lokal konstant und ist A zusammenhängend, dann ist f konstant.
Beweis. Sei a ∈ A gegeben. Dann folgt aus der lokalen Konstantheit, dass U1 := {x ∈ A | f (x) =
•
f (a)} offen in A ist und dass U2 := {x ∈ A | f (x) 6= f (a)} offen ist. Aus A = U1 ∪ U2 , U1 =
6 ∅
und A zusammenhängend folgt U2 = ∅.
2
Aus dem Mittelwertsatz ergibt sich das folgende Korollar:
KOROLLAR 2.27. Sei f : U → R wie oben. Dann gilt
f 0 (x) = 0 für alle x ∈ U
⇐⇒
f ist lokal konstant.
3. HÖHERE ABLEITUNGEN
189
Beweis.
⇐=“ ist klar.
”
=⇒“: Zu p ∈ U wähle > 0 mit B (p) ⊂ U . Für jedes q ∈ B (p) gibt es ein ϑ ∈ [0; 1] mit
”
f (q) = f (p) + f 0 (p + ϑ(q − p)) · (q − p) = f (p) + 0.
2
Also ist f |B (p) konstant.
Definition 2.28. Eine Teilmenge G ⊂ Rn nennt man Gebiet, wenn G offen und zusammenhängend
ist.
KOROLLAR 2.29. Sei f : U → R wie oben, und U ein Gebiet.
f 0 (x) = 0 für alle x ∈ U
⇐⇒
f ist konstant.
3. Höhere Ableitungen
3.1. Satz von Schwarz. Sei U offen in Rn , f : U → Rk .
Die i-te partielle Ableitung ist
∂f
: U → Rk .
∂xi
Ableitung in der i-ten Variable.
Oft verwendet man x, y, z an Stelle von x1 , x2 , x3 . Dann
∂f ∂f ∂f
,
,
.
∂x ∂y ∂z
9
Wenn wir nun nach j partiell ableiten, erhalten wir
∂2f
∂
∂f
:=
: U → Rk
∂xj ∂xi
∂xj ∂xi
Zu i1 , i2 , . . . , i` ∈ {1, 2, . . . , n} definieren wir:
9Bei physikalischen Anwendungen ist oft die Reihenfolge der Variablen unklar, und bestimmte Buchstaben
bedeuten immer bestimmte Größen. Eine gewisse Menge Gas soll bei einer Temperatur T und einem Volumen V den
Druck p haben. Dann ist p eine Funktion in T und V , also p : R2>0 → R>0 , (T, V ) 7→ p(T, V ) oder (V, T ) 7→ p(V, T ).
Welches von beiden, weiß man eben nicht so recht, und ist aber irrelevant. Jedenfalls ist in beiden Fällen klar, was
mit ∂p/∂V gemeint ist. Hier ist die eingeführte Notation sehr effektiv und ungefährlich. Gefährlich wird es aber in
der Physik, wenn wir nun den Blickwinkel wechseln und sagen, der Druck des Gases hängt von dem Volumen V und
der im Gas enthaltenen Enthalpie H ab, (V, H) 7→ p(V, H). Dann erhält ∂p/∂V eine andere Bedeutung, denn nun ist
damit die infinitesimale Änderung des Drucks bei Volumenänderung und konstanter Enthalpie gemeint, wohingegen
zuvor damit die infinitesimale Änderung des Drucks bei Volumenänderung und konstanter Temperatur gemeint war.
Dieser Sachverhalt hat in der Thermodynamik mich damals als Student etwas verwirrt.
190
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
∂`f
∂
:=
∂xi1 ∂xi`
∂xi1
∂ `−1 f
∂xi2 · · · ∂xi`
: U → Rk .
Die Anzahl der partiellen Ableitungen von der Ordnung ` ist n` . Sind alle diese Ableitungen
verschieden?
Spezialfall: Im Fall k = 1 und ` = 2 haben wir f 00 (p) ∈ L(Rn , L(Rn , R)), das bedeutet f 00 (p) ist
eine bilineare Abbildung Rn × Rn → R. Solche bilineare Abbildungen drückt man (mit Hilfe der
Standard-Basis durch n × n-Matrizen aus.
Konkreter ergibt sich:
00
f (p) =
∂`f
(p)
.
∂xi ∂xj
i,j
Und die zugehörige bilineare Abbildung ist

  
x1
y1
n
X
∂`f
 ..   .. 
,
→
7
xi
(p) yj
 .   . 
∂xi ∂xj
i,j=1
xn
yn
Hessf (p) : Rn × Rn → R,
Man nennt
∂`f
(p)
∂xi ∂xj
i,j
die Hesse-Matrix von f in p. Es ist die Matrix der bilinearen Abbildung Hessf (p).
SATZ 3.1 (Satz von Schwarz). Sei f : U → Rk , U offen in Rn , p ∈ U , ` ≥ 2. Ist f (` − 1)mal differenzierbar auf U und `-mal differenzierbar im Punkt p, dann sind die `-ten partiellen
Ableitungen in p unabhängig von der Reihenfolge der Ableitungen.
10
Zum Beispiel: Ist f zweimal differenzierbar, dann gilt
∂2f
∂2f
(x1 , . . . , xn ) =
(x1 , . . . , xn )
∂xj ∂xi
∂xi ∂xj
Beweis. O.B.d.A. ` = 2.11 O.B.d.A. k = 1 (komponentenweise Argumentation). O.B.d.A. k • k =
k • k2 . Wähle ρ > 0 so, dass
B3ρ (p) = {x ∈ Rn | kx − pk2 < 3ρ} ⊂ U.
10Nach Hermann Amandus Schwarz (1843-1921) siehe http://de.wikipedia.org/wiki/Hermann_Amandus_
Schwarz
11Wenn wir zwei Ableitungen vertauschen können, dann können wir alle Ableitungen miteinander sukzessive
vertauschen.
3. HÖHERE ABLEITUNGEN
191
Wähle u, v ∈ Rn mit 0 < kuk2 = kvk2 ≤ ρ. Definiere
g : [0; 1] → R,
g(t) := f (p + tu + v) − f (p + tu).
Der 1. Mittelwertsatz ergibt die Existenz von ϑ ∈ (0; 1) mit:
g(1) − g(0) = g 0 (ϑ)
g 0 (ϑ)
f 0 (p + ϑu + v) − f 0 (p + ϑu) u
=
f 0 (p + ϑu + v) − f 0 (p) − (f 0 (p + ϑu) − f 0 (p)) u
=
Da f 00 (p) existiert, wissen wir, dass
kf 0 (p + ϑu + v) − f 0 (p) − (ϑu + v)T f 00 (p)k ≤ kϑu + vk ≤ (kuk + kvk),
falls ρ > 0 genügend klein gewählt wurde.
0
0
12
Und analog erhalten wir für genügend kleines ρ > 0:
kf (p + ϑu) − f (p) − (ϑu) f 00 (p)k ≤ kϑuk ≤ (kuk + kvk).
T
Wir erhalten unter Benutzung der Cauchy-Schwarz-Ungleichung13
∀x, y ∈ Rn : xT y = hx, yi ≤ kxk2 kyk2
|g 0 (ϑ) − v T f 00 (p)u| ≤ 2 (kuk + kvk)kuk ≤ 2 (kuk + kvk)2 .
g (ϑ) = g(1) − g(0) = f (p + u + v) − f (p + u) − f (p + v) + f (p)
Dieser Ausdruck ändert sich nicht, wenn wir u und v vertauschen. Also
0
|v T f 00 (p)u − uT f 00 (p)v| ≤ 4(kuk + kvk)2 .
Wir setzen u := λei , v = λej , λ > 0 genügend klein.
2
2 ∂2f
2 ∂ f
≤ 4λ2 (1 + 1)2 .
λ
(p)
−
λ
(p)
∂xj ∂xi
∂xi ∂xj 2
∂ f
∂2f
∂xj ∂xi (p) − ∂xi ∂xj (p) ≤ 16.
Da wir > 0 beliebig klein14 wählen können15, ergibt sich
∂2f
∂2f
(p) =
(p).
∂xj ∂xi
∂xi ∂xj
12Genaue Logik: zu > 0 gibt es ein ρ ∈ (0; ρ] , so dass die Aussage für 0 < kuk = kvk ≤ ρ gilt. Im
1
2
2
1
nächsten Schritt erhalten wir dann ein ρ2 ∈ (0; ρ1 ] mit analogen Eigenschaften.
13Dies ist wieder Hermann Amandus Schwarz, allerdings ist es fraglich, ob hier der Name Schwarz so angebracht
ist. Schwarz wurde 1843 geboren, obwohl der Satz von Cauchy-Schwarz in Rn bereits 1821 von Cauchy veröffentlicht
wurde. Die Integral-Version stammt von Buniakovsky (1859), siehe http://jeff560.tripod.com/c.html. Dennoch
sollte man die Ungleichung die Cauchy-Schwarz-Ungleichung nennen, denn nur mit diesem seit ca. 1930 üblichen
Namen weiß man, welche Ungleichung gemeint ist.
14Hier bedeutet beliebig klein“ beliebig nahe an 0“
”
”
15
und dann eben auch ρ, λ etc klein, aber positiv wählen
192
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
2
16
Beispiel 3.2. Sei f : R2 → R,
(
(x, y) 7→
2
2
xy xx2 −y
+y 2
0
falls (x, y) 6= (0, 0),
falls (x, y) = (0, 0).
Man rechnet nach, dass f zweimal partiell differenzierbar ist. Aber es gilt
∂2f
(0, 0) = −1,
∂y ∂x
∂2f
(0, 0) = 1
∂x ∂y
26.5.2014
3.2. Satz von Taylor. In diesem Abschnitt sei U offen in Rn , und sei f : U → R eine
(mindestens) `-mal differenzierbare Funktion, p ∈ U .
f (p) ∈ R
f 0 (p) = Dp f ∈ L(Rn , R) ∼
= R1×n
Dp f (h) := f 0 (p) · h linear
Dp f : Rn → R,
f 0 = Df : U → L(Rn , R)
f 00 (p) = Dp (Df ) ∈ L(Rn , L(Rn , R))
Dp2 f : Rn × Rn → R,
Dp2 f (h1 , h2 ) := (Dp (Df )(h1 ))(h2 ) bilinear
f 00 = D2 f : U → L(Rn , L(Rn , R)) ∼
= {bilineare Abb. Rn × Rn → R}
..
.
Dp` f : Rn × · · · × Rn → R, Dp` f (h1 , . . . , h` ) := (Dp (D`−1 f )(h1 ))(h2 , . . . , h` ) `-linear
{z
}
|
`-mal
f (`) = D` f : U → {`-lineare Abb. Rn × · · · × Rn → R}
|
{z
}
`-mal
16Kommentar zu den Quellen: verschiedene Beweise in der Literatur benutzen etwas andere Voraussetzungen.
Die obige Version kenne ich von einem Vorlesungsskript Prof. Helmut Klingen, Freiburg, WS 1988/89. In Königsberger [20] benötigt man andere Voraussetzungen an Stelle der `-fachen Differenzierbarkeit in p, nämlich (im Fall
2
f
` = 2), dass eine der ∂x∂ ∂x
für ein festes i und j stetig in p sein soll. Es folgt dann ebenfalls die obige Gleichj
i
heit. Die Königsbergerschen Voraussetzungen sind weder schwächer noch stärker als unsere. Viele Bücher nehmen
2-mal stetig differenzierbar an, und erhalten dann eine Aussage, die echt schwächer als unsere obige und als die
Königsbergersche ist.
3. HÖHERE ABLEITUNGEN
193
Der Satz von Schwarz besagt, dass die k-lineare Abbildung Dpk f mit k ≤ ` in allen Einträgen
symmetrisch ist.17
SATZ 3.3 (Taylor). Seien U und f wie oben, p, x ∈ U mit [p; x] ⊂ U , p = (p1 , . . . , pn )T , x =
(x1 , . . . , xn )T . Die Funktion f sei `-mal differenzierbar auf U und (` + 1)-mal differenzierbar auf
{p + t(x − p) | t ∈ (0; 1)}.
Wir definieren das Restglied R` (x, p) so, dass gilt:
f (x)
=
=
`
X
1 j
Dp f (x − p, x − p, . . . , x − p) + R` (x, p)
|
{z
}
j!
j=0
j -mal
n
n
X
1 X
∂2f
∂f
(p) (xi1 − pi1 )(xi2 − pi2 )
f (p) +
(p) (xi − pi ) +
∂xi
2! i ,i =1 ∂xi1 ∂xi2
i=1
1
+··· +
1
`! i
n
X
1 ,i2 ,...,i`
2
`
∂ f
(p) (xi1 − pi1 )(xi2 − pi2 ) · · · (xi` − pi` )
∂x
∂x
i1
i2 · · · ∂xi`
=1
+R` (x, p)
Dann gibt es ein ϑ ∈ (0; 1) mit
=
=
R` (x, p)
1
D`+1
f (x − p, . . . , x − p)
(` + 1)! p+ϑ(x−p)
n
X
1
∂ `+1 f
(` + 1)! i
1 ,i2 ,...,i`+1 =1
∂xi1 ∂xi2 · · · ∂xi`+1
(p + ϑ(x − p)) (xi1 − pi1 ) · · · (xi`+1 − pi`+1 )
Beweis. Wir wenden den Satz von Taylor aus Analysis I auf die folgende Funktion an:
g(t) := f (p + t(x − p)).
(3.4)
g(t) =
`
X
tj
j=0
mit
r` (t, 0) =
j!
g (j) (0) + r` (t, 0)
t`+1 (`+1)
g
(ϑt)
(` + 1)!
für ein ϑ ∈ (0; t). Man rechnet leicht nach
j
g (j) (t) = Dp+t(x−p)
f (x − p, . . . , x − p)
17Das heißt, man darf die Einträge in der Reihenfolge tauschen, also zum Beispiel D k f (h , h , . . . , h ) =
1
2
k
p
Dpk f (h2 , h1 , h3 , . . . , hk )
= Dpk f (hk , hk−1 , . . . , h1 )
194
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
Nun setzen wir t = 1 in (3.4) und erhalten mit R` (x, p) := r` (1, 0) die Behauptung.
2
Notation 3.5 (Multi-Indizes). N0 = N ∪ {0}. Sei α = (α1 , . . . , αn ) ∈ Nn0 , h = (h1 , . . . , hn ) ∈ Rn .
Dann definieren wir
α! := α1 ! α2 ! · · · αn !
|α| := α1 + · · · + αn
αn
1
hα := hα
1 · · · hn
∂ |α| f
∂ α1 +···+αn f
:=
∂xα
∂x1 · · · ∂x1 · · · ∂xn · · · ∂xn
| {z } |
{z
}
α1 -mal
αn -mal
Wenn wir nun den Satz von Schwarz benutzen, gleiche Terme in der obigen Taylorschen Formel
zusammenfassen, und elementare Formeln der Kombinatorik nutzen18, dann erhalten wir den folgenden Satz.
FOLGERUNG 3.6 (Satz von Taylor in Multi-Index-Notation). Sei U , p, x, f wie oben.
Wir definieren das Restglied R` (x, p) so, dass gilt:
f (x)
=
X 1 ∂ |α| f
(p)(x − p)α + R` (x, p)
α! ∂xα
α∈Nn
0
|α|≤`
Dann gibt es ein ϑ ∈ (0; 1) mit
R` (x, p)
=
X
α∈Nn
0
|α|=`+1
1 ∂ |α| f
(p + ϑ(x − p)) (x − p)α
α! ∂xα
3.3. Einschub: Quadratische Formen. Um den Term 2. Ordnung in der Taylor-Entwicklung
genauer zu verstehen, betrachten wir quadratische Formen.
Definition 3.7. Sei K ein Körper mit 2 6= 0, z.B. K ∈ {Q, R, C}. Sei V ein K-Vektorraum. Eine
quadratische Form ist eine Abbildung Q : V → K in der Form
Q(x) = b(x, x)
für eine K-bilineare Abbildung b : V × V → K.
Bemerkungen 3.8.
18um abzuzählen bzw. zu berechnen, wie oft jeder Term vorkommt
3. HÖHERE ABLEITUNGEN
195
(1) Die Bilinearform b in obiger Definition kann symmetrisch gewählt werden. Denn für eine beliebige bilineare Abbildung b : V × V → K schreiben wir
b± (x, y) :=
b(x, y) ± b(y, x)
.
2
Also b(x, y) = b+ (x, y) + b− (x, y). Nun ist b+ ist symmetrisch: b+ (x, y) = b+ (y, x). Und b− ist
antisymmetrisch b− (x, y) = −b− (y, x). Wegen b− (x, x) = −b− (x, x) = 0 gilt b(x, x) = b+ (x, x).
(2) Für Q(x) = b(x, x) gilt
Q(x + y) − Q(x − y) = b(x + y, x + y) − b(x − y, x − y) = 2b(x, y) + 2b(y, x) = 4b+ (x, y).
Der symmetrische Anteil von b ist also durch Q eindeutig festgelegt.
Definition 3.9. Sei K = R. Eine quadratische Form Q auf V heißt
positiv definit :⇐⇒ ∀x ∈ V r {0} : Q(x) > 0
negativ definit :⇐⇒ ∀x ∈ V r {0} : Q(x) < 0
positiv semi-definit :⇐⇒ ∀x ∈ V : Q(x) ≥ 0
negativ semi-definit :⇐⇒ ∀x ∈ V : Q(x) ≤ 0
indefinit :⇐⇒ Q ist weder positiv semi-definit noch negativ semi-definit
⇐⇒ Es existieren x+ , x− ∈ V mit Q(x+ ) > 0 und Q(x− ) < 0.
Nun sei V = Rn . Jede quadratische Matrix A ∈ Rn×n definiert ein quadratische Form
QA (x) = xT Ax.
Umgekehrt kann man zu einer gegebenen quadratische Abbildung Q : Rn → R definieren:
aij :=
Q(ei + ej ) − Q(ei − ej )
,
4
AQ := (aij )ij ∈ Rn×n
Wir erhalten eine Bijektion
{Quadratische Formen auf Rn }
→
Q 7→
QA
←[
{A ∈ Rn×n | AT = A}
AQ
A
Wir nennen eine quadratische Matrix A positiv definit (bzw. positiv semi-definit, negativ (semi-)
definit, indefinit), falls A symmetrisch ist und QA die gleichnamige Eigenschaft hat.
Alle symmetrische Matrizen sind diagonalisierbar. Man sieht dann leicht, dass für symmetrische
Matrizen gilt:
196
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
A ist positiv (bzw. negativ) definit :⇐⇒ alle Eigenwerte von A sind positiv (bzw. negativ)
A ist positiv (bzw. negativ) semi-definit :⇐⇒ alle Eigenwerte sind nicht-negativ (bzw. nicht-positiv)
A ist indefinit :⇐⇒ A hat positive und negative Eigenwerte
BILDER/BEISPIELE: siehe auf der Webseite http://de.wikipedia.org/wiki/Paraboloid.
Die Menge P1 der Punkte mit z = x2 + y 2 ist der Graph der Funktion f1 (x, y) = x2 + y 2 . Man
nennt P1 ein elliptisches Paraboloid. Die Funktion f1 ist die quadratische Form zum euklidischen
Skalarprodukt auf R2 . Sie ist positiv definit. Die zugehörige symmetrische Matrix ist die Matrix
1 0
.
0 1
Die Menge P2 der Punkte mit z = x2 − y 2 ist der Graph der Funktion f2 (x, y) = x2 − y 2 . Man
nennt P2 ein hyperbolisches Paraboloid. Die Funktion f2 ist die quadratische Form zur bilinearen Abbildung b : R2 × R2 → R, b((x, y)T , (x̃, ỹ)T ) = xx̃ − y ỹ. Sie ist indefinit. Die zugehörige
symmetrische Matrix ist
1 0
.
0 −1
Wir versehen nun Rn×n mit einer beliebigen Norm k • k, und erhalten so eine Topologie auf Rn×n ,
die unabhängig von der Norm ist.
LEMMA 3.10. Sei A ∈ Rn×n eine quadratische Matrix, so dass QA positiv definit (bzw. negativ
definit, bzw. indefinit) ist. Dann gibt es eine Umgebung U von A in Rn×n , so dass für alle B ∈ U
auch QB positiv definit (bzw. negativ definit, bzw. indefinit) ist.
28.5.2014
Ersetzt man definit durch semi-definit, so ist das Lemma nicht mehr gültig!
Im indefiniten Fall zeigen wir sogar etwas mehr:
ZUSATZ 3.11. Gilt QA (x+ ) > 0 und QA (x− ) < 0, dann gibt es eine Umgebung U von A in Rn×n ,
so dass für alle B ∈ U gilt: QB (x+ ) > 0 und QB (x− ) < 0.
19
19Dagegen ist die folgende Aussage falsch: Ist Q indefinit, dann gibt es eine Umgebung U von A in Rn×n ,
A
so dass gilt
∀B ∈ U : ∀x ∈ Rn : (QA (x) > 0 =⇒ QB (x) > 0).
Wie so oft ist hier die Reihenfolge der Quantoren zu beachten! Wahr ist: für alle x mit QA (x) > 0, gibt es eine
Umgebung U so dass . . . . Falsch ist hingegen: Es gibt ein U so dass für alle x mit QA (x) > 0 gilt, . . . . In anderen
Worten: das U kann nicht unabhängig von x gewählt werden.
3. HÖHERE ABLEITUNGEN
197
Beweis. Angenommen es gebe ein x ∈ Rn r {0} mit xT Ax > 0. Indem wir x durch x/kxk2
ersetzen, können wir annehmen, dass
x ∈ S n−1 := {x ∈ Rn | kxk2 = 1}
Da die Abbildung F : S n−1 × Rn→n → R, (y, B) 7→ y T By stetig ist, gibt es zu jedem x wie oben
ein (x) > 0, so dass:
(3.12)
∀y ∈ S n−1 : ∀B ∈ Rn×n : kx − yk2 < (x) ∧ kB − Ak < (x) =⇒ F (y, B) > 0.
Das (x) hängt natürlich von x ab!
Eine analoge Konstruktion geht auch im Fall QA (x, x) < 0.
1. Fall: Ist nun QA indefinit, dann existieren x+ , x− ∈ S n−1 mit QA (x+ ) > 0 und QA (x− ) < 0.
Dann gilt für kB − Ak < min{(x+ ), (x− )}: QB (x+ ) > 0 und QB (x− ) < 0.
2. Fall: Ist QA positiv definit, dann wähle zu jedem x ∈ S n−1 ein (x) > 0 wie in (3.12). Dann ist
(B(x) (x) ∩ S n−1 )x∈S n−1 eine offene Überdeckung von S n−1 . Da S n−1 kompakt ist, kann man zu
dieser Überdeckung eine Lebesguesche Zahl > 0 wählen (die nun nicht mehr von x abhängt!).
Dies bedeutet, dass es zu jedem y ∈ S n−1 ein x ∈ S n−1 gibt mit B (y) ∩ S n−1 ⊂ B(x) (x) ∩ S n−1 .
Es gilt20 dann
∀B ∈ Rn×n : ∀y ∈ S n−1 : kB − Ak < =⇒ F (y, B) = QB (y) > 0.
Also ist für solche B die quadratische Form QB positiv definit.
3. Fall: negativ analog. Folgt durch Vorzeichenwechel aus dem 2. Fall.
2
3.4. Lokale Extrema.
Wiederholung.
Sei (M, d) ein metrischer Raum, f : M → R, p ∈ M . Wir sagen f hat ein lokales Maximum (bzw.
lokales Minimum) in p, falls es eine Umgebung U von p gibt, so dass
∀x ∈ U : f (x) ≤ f (p)
lokales Extremum in p
:⇐⇒
(bzw. f (x) ≥ f (p)).
lokales Maximum oder Minimum in p
LEMMA 3.13. Sei U ⊂ Rn offen, f : U → R. Die Funktion f habe lokales Minimum in p ∈ U .
(1) Wenn die Richtungsableitung ∂p,v f existiert, so gilt ∂p,v f = 0.
(2) Wenn f in p differenzierbar ist, so gilt f 0 (p) = 0.
(3) Wenn f auf einer Umgebung von p differenzierbar ist und in p zweimal differenzierbar ist, so
ist f 00 (p) = Hessf (p) positiv semi-definit.
20Wir schließen auch hieraus, dass alle zu y so gewählten x die Ungleichung ≤ (x) erfüllen. Achtung: Wir
haben aber nicht behauptet ∀x ∈ S n−1 : ≤ (x).
198
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
Bei lokalen Maxima in p gilt alles analog, wenn wir positiv semi-definit durch negativ semi-definit
ersetzen.
Beweis. Wenn f ein lokales Minimum in p hat, dann hat fp,v , fp,v (t) := f (p + tv) ein lokales
0
Minimum in 0. Es folgt ∂p,v f = fp,v
(0) = 0, falls es existiert. Es folgt f 0 (p) = 0 falls es existiert.
00
Weiter gilt (falls f (p) existiert):
00
v T f 00 (p)v = Dp2 f (v, v) = fp,v
(0) ≥ 0.
2
Lokales Maximum analog.
Definition 3.14. Man nennt p einen kritischen Punkt oder einen stationären Punkt von f , falls
f 0 (p) = 0.
Also
lokales Extremum in p =⇒ p kritischer Punkt
SATZ 3.15. Sei U offen in Rn , f ∈ C 2 (U, R) (d.h. f : U → R ist zweimal stetig differenzierbar).
Sei p ein kritischer Punkt von f .
(1) Ist f 00 (p) positiv definit, dann hat f ein lokales Minimum in p.
(2) Ist f 00 (p) negativ definit, dann hat f ein lokales Maximum in p.
(3) Ist f 00 (p) indefinit, dann hat f weder ein lokales Maximum noch ein lokales Minimum in p.
!ACHTUNG!. Keine derartige Aussage möglich, falls f 00 (p) semi-definit ist.
Beweis. Ist f 00 (p) positiv definit (bzw. negativ definit), so gibt es wegen Lemma 3.10 und der
Stetigkeit von U → Rn×n , x 7→ f 00 (x) eine Umgebung V von p in U , so dass f 00 (q) ebenfalls positiv
definit (bzw. negativ definit) für alle q ∈ V ist. Wir wenden die Taylorformel für ` = 1 an:
f (p + h) = f (p) +
n
1 X ∂2f
1
(p + ϑh)hi hj = f (p) + hT f 00 (p + ϑh)h,
2 i,j=1 ∂xi ∂xj
2
falls [p; p + h] ⊂ V , h 6= 0. Also ist f (p + h) > f (p) (bzw. f (p + h) < f (p)) für alle p + h ∈ V r {p}.
Der indefinite Fall ist ähnlich. Wir wählen h+ , h− ∈ Rn mit hT+ f 00 (p)h+ > 0 und hT− f 00 (p)h− < 0.
Nach Zusatz 3.11 gibt es eine Umgebung V um p in U , so dass hT+ f 00 (q)h+ > 0 und hT− f 00 (q)h− < 0
für alle q ∈ U . Es folgt dann für genügend kleines λ > 0:
f (p + λh+ ) > f (p)
f (p + λh− ) < f (p).
2
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN
199
Beispiel 3.16. f : R2 → R, f (x, y) = x3 − 4x − xy + 12 y 2 .
f 0 (x, y) = (3x2 − 4 − y, −x + y). Die kritische Punkte sind also p1 := (−1, −1) und p2 := (4/3, 4/3).
Wir rechnen weiter
00
f (x, y) =
6x
−1
−1
.
1
Es ist also f 00 (p1 ) indefinit: dies ist ein Sattelpunkt. Und f 00 (p2 ) ist positiv definit: dies ist ein
lokales Minimum.
2.6.2014
4. Lokale Umkehrung differenzierbarer Abbildungen
Frage:
Sei ∅ 6= U ⊂ Rn offen, f : U → Rk stetig, V := f (U ) offen in Rk . Wann besitzt f eine (stetige)
Umkehrfunktion g : V → U ?
Teil-Antwort:
Fall: n 6= k. Dann hat keine Funktion f wie oben eine Umkehrfuntion! Beweis nicht ganz einfach
(In der Vorlesung Topologie I).
Ab jetzt n = k.
Wenn U = Rn und wenn f eine lineare Abbildung ist, sagen wir f (x) = Ax, A ∈ Rn×n , dann
wurde diese Frage intensiv in der Linearen Algebra diskutiert:
f besitzt eine Umkehrfunktion
⇐⇒
f besitzt eine lineare Umkehrfunktion
⇐⇒
f ist injektiv
⇐⇒
f ist surjektiv
⇐⇒
detf 6= 0
⇐⇒
A ist eine invertierbare Matrix
Hierbei detf = detA.
Notation für die Einheitsmatrix:

1 0 0
0 1 0


11n = 0 0 1
 .. ..
. .
0 0 0
...
...
..
.
...

0
0

0
 ∈ Rn×n
.. 
.
1
GL(n, R) := {A ∈ Rn×n | detA 6= 0}.
200
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
Ab jetzt sei f differenzierbar (aber wir nehmen nicht mehr an, dass f linear sein muss).
LEMMA 4.1. Sei U offen in Rn und f : U → Rn differenzierbar. Sei V := f (U ) offen in Rn und
g : V → Rn ebenfalls differenzierbar mit g ◦ f = idU . Dann gilt für alle x ∈ U :
g 0 (y) · f 0 (x) = 11n , wobei y = f (x)
Insbesondere ist dann f 0 (x) eine invertierbare Matrix.
2
Beweis. Kettenregel.
Aus Kapitel 5 wissen wir (Proposition 1.7 und einige verbundene Aussagen):
PROPOSITION. Sei (a; b) ein Intervall, f : (a; b) → R differenzierbar, mit f 0 (x) 6= 0 für alle
x ∈ (a; b). Dann ist f injektiv und f ((a; b)) ist auch ein offenes Intervall. Die Umkehrfunktion
g := f −1 : f ((a; b)) → (a; b)
existiert, ist differenzierbar und es gilt für alle x ∈ (a; b)
−1
g 0 (y) = f 0 (x)
, wobei y = f (x)
Ein ähnlicher Satz ist nicht nur für n = 1, sondern für alle n ∈ N richtig. Es gibt aber zwei
entscheidende Unterschiede
• Keine globale Aussage für Umkehrung, nur eine lokale Aussage.
• Wir benötigen stetige Differenzierbarkeit.
Definition 4.2. Sei U offen in Rn , p ∈ U und f : U → Rn . Wir sagen f ist bei p lokal umkehrbar ,
falls es eine offene Umgebung V von p in U und eine offene Umgebung W von f (p) in Rn gibt, so
dass f |V : V → W bijektiv ist.
SATZ 4.3 (Lokaler Umkehrsatz). Sei U offen in Rn , p ∈ U . Sei f ∈ C ` (U, Rn ), ` ≥ 1. Ist
det(f 0 (p)) 6= 0, dann gibt es offene Umgebung V von p in U und eine offene Umgebung W von
f (p) in Rn , so dass gilt
(1) f |V : V → W bijektiv. Somit ist f lokal umkehrbar bei p.
−1
(2) (f |V ) : W → V ⊂ Rn ist `-mal stetig differenzierbar. 21
h
i0
−1
−1
(3) (f |V )
(y) = (f 0 (x)) , für alle x ∈ V , wobei y = f (x)
Beispiele 4.4.
(1) Ist f linear, sagen wir f (x) = Ax, mit A ∈ Rn×n , dann ist f 0 (p) = A. Falls A ∈ GL(n, R),
dann kann man V = W = Rn wählen und f −1 ist durch A−1 gegeben.
21In anderen Worten (f | )−1 ∈ C ` (W, Rn ).
V
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN
201
(2) Wir betrachten die komplexe Exponentialfunktion exp : C → C mit Hilfe von C ∼
= R2 als
2
2
Funktion f : R → R ,
x
Re exp(x + iy)
e cos y
f (x, y) =
=
Im exp(x + iy)
ex sin y
x
e cos y −ex sin y
x cos y − sin y
f 0 (x, y) =
=
e
ex sin y ex cos y
sin y
cos y
detf 0 (x, y) = e2x · 1 6= 0.
Es gilt also D(f ) = R2 ist zusammenhängend, f 0 (p) invertierbar für alle p ∈ D(f ), aber
dennoch ist f nicht injektiv. Deswegen: nur lokale Umkehrung möglich.
Beweis.
O.B.d.A. p = 0, f (p) = 0, f 0 (p) = 11n .
Wenn f dies nicht erfüllt, dann definiere
g(x) = f (x + p) − f (p)
und
fˆ(x) = g 0 (0)−1 g(x).
Dann haben wir fˆ(0) = 0 und fˆ0 (0) = 11n . Und wenn wir den lokalen Umkehrsatz für fˆ in 0 zeigen,
dann folgt hieraus unmittelbar der lokale Umkehrsatz für f in p.
Zu (1); Teil (i): Bestimmung von V und W .
Im folgenden sei k • k immer die Supremumsnorm auf Rn und auf Rn×n , d.h.
 
a1  a2 
 
(aij )i,j∈{1,...,n} = max{|a11 , a12 |, . . . , |a1n |, |a21 |, . . . , |ann |}.
 ..  = max{|a1 |, . . . , |an |},
 . 
an Also kAxk ≤ nkAk kxk für x ∈ Rn , A ∈ Rn×n .
Definiere ϕ(x) = x − f (x). also ϕ0 (0) = 0.
Bestimme r > 0 so, dass22
(a) B2r (0) = {x ∈ Rn | kxk < 2r} ⊂ U
1
(b) kϕ0 (x)k < 2n
für alle x ∈ B2r (0)
22Eine kleine Bemerkung zu den hier verwendeten Bällen“ B (p). Es sind Bälle nicht — wie zumeist üblich
r
”
— bezüglich der Standardnorm, sondern bezüglich der Supremumsnorm. Deswegen ist BR (p) eigentlich ein achsenparalleler Würfel mit Seitenlänge 2R und mit Schwerpunkt p.
202
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
(b) ist möglich, da ϕ stetig differenzierbar ist23.
Für x, y ∈ Br (0) = {x ∈ Rn | kxk ≤ r}, wenden wir nun den Mittelwertsatz auf die j-te Komponente ϕj von ϕ an24 und erhalten für ein ϑ ∈ (0; 1):
n
|ϕj (y) − ϕj (x)| = |ϕ0j (x + ϑ(y − x)) · (y − x)| ≤ kϕ0 (z) · (y − x)k ≤ nkϕ0 (z)k ky − xk ≤
ky − xk.
|
{z
}
2n
z:=
Daraus ergibt sich dann
1
ky − xk.
2
Setze nun W := Br/2 (0) und V := Br (0) ∩ f −1 (W ). Letzteres ist eine offene Umgebung von 0. Wir
haben
f (V ) ⊂ f (f −1 (W )) ⊂ W
kϕ(y) − ϕ(x)k ≤
Zu (1); Teil (ii): f |V : V → W ist bijektiv.
f |V injektiv: Seien x, y ∈ V mit f (x) = f (y). Dann gilt x − ϕ(x) = y − ϕ(y), also
1
ky − xk = kϕ(y) − ϕ(x)k ≤ ky − xk
2
Also y = x.
f |V surjektiv: Gegeben sei w ∈ W . Wir definieren
ψw : Br (0) → Rn ,
x 7→ w + ϕ(x).
Die Abbildung ist eine Kontraktion, denn
kψw (y) − ψw (x)k = kϕ(y) − ϕ(x)k ≤
1
ky − xk.
2
Es gilt ψw (Br (0)) ⊂ Br (0), denn:
=0
z}|{
kψw (x)k ≤ kwk + kϕ(x) − ϕ(0) k < r.
{z
}
|{z} |
<r/2
≤r/2
Da Br (0) vollständig ist, gibt es nach dem Banachschen Fixpunktsatz25 ein z ∈ Br (0) mit ψw (z) =
z und man sieht dann z ∈ Br (0).26 Es gilt also
z = ψw (z) = w + ϕ(z) = w + z − f (z),
also f (z) = w. Daraus folgt dann auch z ∈ f −1 (W ), d.h. z ∈ V .
23und da Urbilder offener Mengen unter stetigen Abbildungen wieder offen sind
24Also ϕ : U → R, ϕ(x) = (ϕ (x), . . . , ϕ (x))T
n
1
j
25angewendet auf f := ψ und Y := X := B (0)
w
26Denn es ist ja im Bild von ψ .
w
r
4. LOKALE UMKEHRUNG DIFFERENZIERBARER ABBILDUNGEN
−1
Zu (2); Teil (i): (f |V )
203
: W → V ⊂ Rn ist differenzierbar auf W .
Überprüfe Differenzierbarkeit in w ∈ W , w = f (p̃). Zu h mit p̃ + h ∈ V wähle ein k mit
f (p̃ + h) = w + k.
Wir können hier aber auch h als Funktion in k betrachten, da f |V bijektiv.
k = f (p̃ + h) − f (p̃) = f 0 (p̃) · h + (h)khk,
lim (h) = 0
h→0
Wir multiplizieren diese vektorielle Gleichung mit (f 0 (p̃))−1 , falls es existiert.
(f 0 (p̃))−1 k
=
h + khk(f 0 (p̃))−1 (h)
=
(p̃ + h) − p̃ − khk(f 0 (p̃))−1 (h)
=
f −1 (w + k) − f −1 (w) + kkkδ(k)
wobei wir definieren
δ(k) = −
khk 0
(f (p̃))−1 (h)
kkk
Wir rechnen:
ϕ(p̃ + h) − ϕ(p̃) = p̃ + h − f (p̃ + h) − p̃ + f (p̃) = h − k
Also
khk ≤ kϕ(p̃ + h) − ϕ(p̃)k + kkk ≤
1
khk + kkk.
2
Es folgt khk ≤ 2kkk und somit
lim δ(k) = 0.
k→0
Wir haben gezeigt: ist f 0 (p̃) invertierbar, dann ist (f |V )
(3).
−1
Die Umgebung V wurde so gewählt, dass kϕ0 (p̃)k <
ϕ0 (p̃) = 11n − f 0 (p̃), somit
für alle p̃ ∈ V . Aus ϕ(x) = x − f (x) folgt
1
2n
differenzierbar in w = f (p̃) und es gilt
4.6.2014
kf 0 (p̃) · xk ≥ kxk − kϕ0 (p̃) · xk ≥ kxk − nkϕ0 (p̃)k kxk ≥ kxk −
Also ist f 0 (p̃) eine invertierbare Matrix. Somit ist (f |V )
−1
differenzierbar auf W .
Zu (2); Teil (ii): `-fache stetige Differenzierbarkeit.
Die Komposition
W
(f |V )−1
f0
inv
−→ V −→ GL(n, R) −→ GL(n, R)
h
i0
−1
bildet w ∈ W auf (f |V )
(w) ab. Da die Inversen-Abbildung
inv : GL(n, R) → GL(n, R),
n
1
kxk ≥ kxk.
2n
2
A 7→ A−1
204
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
glatt ist,27 folgt durch Induktion aus der `-fachen stetigen Differenzierbarkeit von f auch die `-fache
−1
stetige Differenzierbarkeit von (f |V ) .
2
Definition 4.5. Sind U und V offene Mengen in Rn . Dann nennt man f : U → V einen Diffeomorphismus (von U auf V ), falls f : U → V bijektiv ist und sowohl f als auch f −1 sind
stetig differenzierbar. Sind f und f −1 sogar `-mal stetig differenzierbar, dann nennt man f einen
C ` -Diffeomorphismus.
Der lokale Umkehrsatz liefert:
LEMMA 4.6. Sei U offen in Rn und f : U → Rn eine Funktion, V := f (U ). Dann ist f genau
dann Diffeomorphismus von U auf V , wenn
• f ∈ C 1 (U, Rn ),
• detf 0 (x) 6= 0 für alle x ∈ U ,
• f injektiv ist.
2
5. Der Satz über implizit definierte Funktionen
Motivation: Gegeben sei eine Funktion F : R2 → R. Wir wollen alle Lösungen von
F (x, y) = 0
bestimmen. Am liebsten wäre es uns, wenn wir eine Lösungsfunktion hätten, d.h. eine differenzierbare Funktion f : (a; b) → R, so dass F (x, f (x)) = 0 und so dass alle oder möglichst viele Lösungen
von der Form (x, f (x)) sind.
Beispiele 5.1.
(1) F (x, y) := y − x3 + x2 − 1 = 0. Dann ist f (x) = x3 − x2 + 1 solche eine Lösungsfunktion.
BILD
∂F
= 1 6= 0
in allen Lösungen (x, y)
∂y
(2) F (x, y) := y 2 − x2 − 1 = 0. Dann benötigen wir zwei Funktionen, um die Lösungen zu
beschreiben
p
p
f+ (x) = x2 + 1,
f− (x) = − x2 + 1,
f± : R → R.
BILD
∂F
= 2y 6= 0
∂y
in allen Lösungen (x, y)
27Die Formel für A−1 , die Sie aus der Linearen Algebra inzwischen kennen sollten, hat Einträge, die rationale
Funktionen in den Koeffizienten von A sind. Die Nenner dieser rationalen Funktionen sind nicht Null, da die Matrix
invertierbar ist.
5. DER SATZ ÜBER IMPLIZIT DEFINIERTE FUNKTIONEN
205
(3) F (x, y) = x − y 2 = 0. BILD
Eine Beschreibung der Lösungen
√ in der Form√(x, f (x)) ist schwierig, da wir zum einen
zwei Funktionen benötigen (x 7→ x und x 7→ − x) und da die Wurzelfunktion in 0 nicht
differenzierbar ist.
∂F
= 2y 6= 0
in allen Lösungen außer in (0, 0)
∂y
Problemlos möglich, wenn wir x und y vertauschen. Sei g : R → R, g(y) = y 2 . Die
Lösungsmenge von x − y 2 = 0 ist
{(g(y), y) | y ∈ R}.
∂F
= 1 6= 0
in allen Lösungen
∂x
(4) F (x, y) = x − y 3 = 0. BILD
Eine Beschreibung
der Lösungen in der Form (x, f (x)) ist möglich durch die Kubik√
wurzel x 7→ 3 x, aber sie ist in 0 nicht differenzierbar.
∂F
= 3y 2 6= 0
in allen Lösungen außer in (0, 0)
∂y
Die Differenzierbarkeit ist aber wiederum gegeben, wenn wir zunächst x und y vertauschen. Sei g : R → R, g(y) = y 3 . Die Lösungsmenge von x − y 3 = 0 ist
{(g(y), y) | y ∈ R}.
∂F
= 1 6= 0
in allen Lösungen
∂x
2
2
(5) F (x, y) = x − y = 0 Zwei Lösungsfunktionen f± (x) = ±x, die sich schneiden
BILD
∂F
= −2y 6= 0
in allen Lösungen außer in (0, 0)
∂y
(6) F (y, x) = x2 + y 2 = 0. Lösungsmenge {(0, 0)}. Nur ein Punkt!
∂F
(0, 0) = 0
∂y
Vermutung: Es geht gut, wenn ∂F
∂y (x, y) 6= 0 für alle Lösungen (x, y). Der Satz über implizite
Funktionen macht genau solch eine Aussage.
Notation.
Von nun an sei U 6= ∅ offen in Rn+m und F : U → Rm stetig differenzierbar. Punkte in Rn+m
schreiben wir zumeist als (x, y) mit x = (x1 , . . . , xn )T ∈ Rn , y = (y1 , . . . , ym )T ∈ Rm , F (x, y) =
(F1 (x, y), . . . , Fm (x, y)).
∂F
(x, y) :=
∂x
∂Fi
(x, y)
∈ Rm×n
∂xj
i=1,...,m
j=1,...,n
206
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
∂F
(x, y) :=
∂y
∂Fi
(x, y)
∂yj
i=1,...,m
j=1,...,m
∈ Rm×m
Ziel: Finde Funktionen
y1
= y1 (x1 , . . . , xn )
y2 = y2 (x1 , . . . , xn )
..
..
.
.
ym
= ym (x1 , . . . , xn )
so dass (x, y(x)) Lösungen von F (x, y) = 0.
SATZ 5.2 (Satz über implizite Funktionen). Sei ∅ 6= U ⊂ Rn+m offen, und F : U → Rm stetig
differenzierbar. In einem Punkt (x̂, ŷ) ∈ U soll F (x̂, ŷ) = 0 und det ∂F
∂y (x̂, ŷ) 6= 0 gelten. Dann gibt
es
• eine offene Umgebung V von x̂ in Rn ,
• eine offene Umgebung W von ŷ in Rm ,
• eine Funktion f : V → W
mit den folgenden Eigenschaften
(a) V × W ⊂ U
(b) {(x, y) ∈ V × W | F (x, y) = 0} = {(x, f (x)) | x ∈ V }
(c) f ist stetig differenzierbar und es gilt
−1
∂F
∂F
0
f (x) = −
(x, f (x))
(x, f (x))
∂y
∂x
Bemerkung 5.3. Zu gegebenem F , U , x̂ und ŷ liefert der Satz: f , V , W . Diese sind nicht eindeutig,
z.B. kann man V verkleinern und dann f einschränken. Erfüllen f˜, Ṽ , W̃ ebenfalls den Satz und
setzen wir Z := V ∩ Ṽ ∩ f −1 (W ∩ W̃ ), dann gilt f |Z = f˜|Z .
Bemerkung 5.4. Sei U ⊂ Rm offen und f : U → Rm stetig differenzierbar. Wenn wir den Satz
über implizite Funktionen auf F : Rm × U → Rm , F (x, y) := x − f (y) anwenden (n = m), so
erhalten wir den lokalen Umkehrsatz.
11.6.2014
Definition 5.5. Die Funktion f nennt man eine durch F (x, y) = 0 implizit definierte Funktion.
Bemerkung 5.6. Aussage (b) besteht eigentlich aus zwei Teilen: zum einen (x, f (x)) ist einen
Lösung, also F (x, f (x)) = 0 für alle x ∈ V . Zum anderen sind lokal (d.h. heißt hier in V × W ) alle
Lösungen von dieser Form.
Bemerkung 5.7. Oft kann man implizite Funktionen nicht explizit angeben. Explizit angeben“
”
heißt hier durch einen Formelausdruck, der sich aus Standard-Operationen zusammensetzt.
5. DER SATZ ÜBER IMPLIZIT DEFINIERTE FUNKTIONEN
207
ZUSATZ 5.8 (zum Satz über implizite Funktionen). Sei ` ≥ 1. Ist F `-mal stetig differenzierbar,
so ist f ebenfalls `-mal stetig differenzierbar.
Beispiel 5.9. Wir betrachten die Funktion
F : Rn+1 → R,
F (z) := hz, zi − 1.
F ∈ C ∞ (Rn+1 , R). Dann ist die Lösungsmenge die n-dimensionale Sphäre
S n := {z ∈ Rn+1 | F (z) = 0} = {z ∈ Rn+1 | kzk2 = 1}.
Wir schreiben z = (x, y) mit x ∈ Rn und y ∈ R. Nun ist (∂F/∂y)(x, y) = 2y und dies ist für
y 6= 0 nicht Null. Zu jedem (x̂, ŷ) ∈ S n mit ŷ 6= 0 kann man den Satz über implizite Funktionen
anwenden.
Wir beschränken uns auf den Fall ŷ > 0. Dann sind mögliche Wahlen:
p
V := B1 (0, Rn ) := {x ∈ Rn | kxk < 1}, W := (0; ∞), f (x) := 1 − kxk22
Eine andere Wahl wäre falls kx̂k < 1 − δ:
p
V := B1−δ (0, Rn ), W := (0; ∞), f (x) := 1 − kxk22
p
V := B1 (0, Rn ), W := (0; 1, 001), f (x) := 1 − kxk22
Nicht erlaubt sind
V := B1 (0, Rn ), W := (0; 1), (W zu klein)
V := B1 (0, Rn ), W := R, (W zu groß)
BILDER
Beweis des Satzes über implizite Funktionen
und
des Zusatzes. Sei F wie im Satz gegeben. Wir
x
definieren: G : U → Rn+m , G(x, y) :=
. Wir haben G ∈ C ` (U, Rm+n ) und
F (x, y)
11n
0
0
G (x, y) =
∗ ∂F
∂y
Also det G0 (x̂, ŷ) 6= 0. Wende den lokalen Umkehrsatz auf G im Punkt p := (x̂, ŷ) an. Es gibt dann
eine offene Umgebung V̂ von p in U und eine offene Umgebung Ŵ von G(p) in Rn+m , so dass
G|V̂ : V̂ → Ŵ bijektiv ist und so dass (G|V̂ )−1 ∈ C ` (Ŵ, Rn+m ). Offenichtlich hat (G|V̂ )−1 die
Form
x
(G|V̂ )−1 (x, y) :=
ψ(x, y)
für ein ψ ∈ C ` (Ŵ, Rm ). Durch Differenzieren von idV̂ = (G|V̂ )−1 ◦ GV̂ erhalten wir
0
11n
0
11n
0
(5.10)
11n+m = (G|V̂ )−1 (x, F (x, y)) ◦ G0 (x, y) =
.
∂ψ
∂F
∗
∗
∂y (x, y)
∂y (x, F (x, y))
208
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
Aus-Multiplizieren und Vergleichen des rechten unteren Blocks auf beiden Seiten ergibt
∂ψ
∂F
11m =
(x, F (x, y))
(x, y) .
∂y
∂y
O.B.d.A. können wir annehmen,28 dass V̂ die Gestalt V̂ = V0 × W hat mit V0 offen in Rn und W
offen in Rm . Die Abbildung ψ bildet Ŵ in W ab, und ψ(x̂, ŷ) = (x̂, 0)T . Auf Grund der Stetigkeit
von ψ finden wir eine offene Umgebung V von x̂ mit V ⊂ V0 und V ×{0} ⊂ Ŵ . Dann ist f : V → W ,
f (x) := ψ(x, 0) eine wohldefinierte C ` -Abbildung und F (x, f (x)) = 0. Wir haben somit (a) und
⊃“ in (b).
”
Ist (x, y) ∈ V × W mit F (x, y) = 0, dann ist G(x, y) = (x, 0)T , also (G|V̂ )−1 (x, 0) = (x, y)T . Dies
impliziert f (x) = y. Wir erhalten ⊂“ in (b).
”
Wenn wir die Stern-Einträge in (5.10) berücksichtigen, sieht man
0=
∂ψ
∂F
∂ψ
(x, F (x, y)) +
(x, F (x, y))
(x, y),
∂x
∂y
∂x
also
∂ψ
∂F
∂ψ
(x, 0) = −
(x, 0)
(x, f (x)) = −
f (x) =
∂x
∂y
∂x
0
∂F
(x, f (x))
∂y
−1
∂F
(x, f (x)).
∂x
2
6. Untermannigfaltigkeiten
Definition 6.1. Sei U offen in Rk , F : U → Rm `-mal stetig differenzierbar, ` ≥ 1. Wir sagen
y ∈ Rm ist ein regulärer Wert von F , falls gilt
∀p ∈ F −1 ({y}) : F 0 (p) hat Rang m.
Ist y kein regulärer Wert, so nennt man y einen singulären Wert.
Bemerkung 6.2. (Wiederholung aus Linearen Algebra) Sei A ∈ Rm×k und m ≤ k, z.B. obiges
F 0 (x). Dann gilt
A hat Rang m
⇐⇒
A hat maximalen Rang
⇐⇒
Die Abbildung Rk → Rm ,
m
k
→R ,
x 7→ Ax ist surjektiv
x 7→ AT x ist injektiv
⇐⇒
Die Abbildung R
⇐⇒
Nach Umordnen der Spalten von A, bilden die letzten m Spalten eine invertierbare Matrix
28Wenn dies nicht der Fall ist, ersetzen wir einfach V̂ durch eine kleinere offene Umgebung von p, die die
gewünschte Produktgestalt hat, und Ŵ ist dann entsprechend zu verkleinern.
6. UNTERMANNIGFALTIGKEITEN
209
Beispiel:
1 2 4
A :=
3 1 2
Die letzten beiden Spalten sind linear abhängig. Nach Vertauschen der ersten und dritten Spalte
haben wir
4 2 1
.
2 1 3
Wegen
2 1
det
= 5 6= 0
1 3
sehen wir, dass A Rang 2 besitzt.
Beispiel 6.3. Wir betrachten (ähnlich wie in Beispiel 5.9) die Funktion
F : Rn+1 → R,
F (z) := hz, zi.
0
F (z) = 2z T .
Dann ist 0 kein regulärer Wert, aber jedes y ∈ R r {0} ist ein regulärer Wert. Für y < 0 ist
√
F −1 ({y}) = ∅ und dann ist y ein regulärer Wert.29 Für y > 0 gilt kF 0 (z)k2 = 2 y falls F (z) = y.
In diesem Fall hat also F 0 (z) Rang 1.
S n := F −1 ({1}) = {z ∈ Rn+1 | kzk2 = 1}.
Definition 6.4. Sei ` ≥ 1, k ≥ n. Sei M eine Teilmenge von Rk . Wir nennen M eine ndimensionale Untermannigfaltigkeit von Rk mit Regularität C ` , falls jedes p ∈ M eine offene
Umgebung U in Rk besitzt und eine Funktion F ∈ C ` (U, Rk−n ) existiert, so dass 0 regulärer Wert
von F ist und F −1 ({0}) = U ∩ M .
Untermannigfaltigkeit mit Regularität C ` = C ` -Untermannigfaltigkeit
Untermannigfaltigkeit= C 1 -Untermannigfaltigkeit
Beispiele 6.5.
(1) S n ist eine Untermannigfaltigkeit von Rn+1 mit Regularität C ∞ .
(2) Ist U offen in Rn , f ∈ C ` (U, Rm ). Dann ist der Graph von f
Mf := {(x, f (x)) | x ∈ U }
eine Untermannigfaltigkeit von Rn+m mit Regularität C ` . Denn
F : U × Rm → Rm ,
(x, y) 7→ f (x) − y
ist eine `-mal stetig differenzierbare Abbildung und jedes z ∈ Rm ist ein regulärer Wert von F ,
insbesondere ist 0 regulärer Wert.
16.6.2014
29Lassen Sie sich nicht von den Bezeichnungen täuschen. Wenn y ein regulärer Wert von F , so impliziert dies
nicht dass y ein Wert von F ist. Letzteres bedeutet y ist im Bild von F . Nein, es gilt sogar: Ist y kein Wert, so ist
es ein regulärer Wert.
210
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
PROPOSITION 6.6. Sei M eine Teilmenge von Rk , ` ≥ 1. Dann gilt:
M ist n-dimensionale Untermannigfaltigkeit von Rk mit Regularität C `
⇐⇒
Zu jedem p ∈ M gibt es offene Mengen U, V ⊂ Rk und einen C ` -Diffeomorphismus
Φ : U → V , so dass p ∈ U und Φ(U ∩ M ) = V ∩ (Rn × {0}).
Solch ein Φ nennt man eine Untermannigfaltigkeits-Karte.
Anschaulich: Eine Untermannigfaltigkeit ist eine Teilmenge, die man lokal durch Diffeomorphismen
gerade biegen kann.
BILD
Beweis.
⇐=“: Zu p ∈ M sei eine Untermannigfaltigkeits-Karte Φ gegeben. Sei π : Rk → Rk−n die
”
Projektion auf die letzten k −n Komponenten. Dann ist F := π ◦Φ : U → Rk−n eine C ` -Abbildung,
0 ist regulärer Wert denn F 0 (p) = π 0 (Φ(p))Φ0 (p), und F −1 ({0}) = Φ−1 (V ∩ (Rn × {0})) = U ∩ M .
=⇒“: Zu p ∈ M sei eine offene Umgebung U in Rk gegeben, und eine Abbildung F ∈ C ` (U, Rk−n ),
”
so dass 0 regulärer Wert ist und F −1 ({0}) = U ∩ M . Insbesondere F (p) = 0, also hat F 0 (p) Rang
m := k − n. Nach Umordnen der Komponenten in Rk , können wir annehmen, dass die hintersten
m Spaltenvektoren in F 0 (p) ∈ Rm×k eine invertierbare Matrix bilden.
Wir definieren wie im Beweis des Satzes über implizite Funktionen
x
n+m
G:U →R
,
G(x, y) :=
F (x, y)
mit x ∈ Rn , y ∈ Rm . Also ist wiederum G0 (p) eine invertierbare k × k-Matrix. Wir finden nach
b und Vb von Rk , mit p ∈ U
b ⊂ U und Φ := G| b : U
b → Vb
dem lokalen Umkehrsatz offene Mengen U
U
`
ist ein C -Diffeomorphismus.
b ∩ M ⇐⇒ F (x, y) = 0 und (x, y) ∈ U
b ⇐⇒ Φ(x, y) ∈ Vb ∩ (Rn × {0}).
(x, y) ∈ U
2
Äquivalenz von Untermannigfaltigkeitseigenschaft und Existenz lokaler Parametrisierungen.
Beispiele 6.7.
(1) Sei M ⊂ Rk ein n-dimensionaler Untervektorraum (mit n ≤ k). Wähle eine Basis
(v1 , . . . , vn ) von M . Nach Lineare Algebra I existieren Vektoren vn+1 , . . . , vk im Rk so,
dass (v1 , . . . , vn , vn+1 , . . . , vk ) eine Basis von Rk ist. Betrachte die lineare Abbildung
Φ : Rk → Rk , vi 7→ ei , wobei ei der i-te kanonische Basisvektor ist. Dann ist Φ ein
linearer Isomorphismus, insbesondere ein C ∞ -Diffeomorphismus mit
6. UNTERMANNIGFALTIGKEITEN
211
= Φ(Span{v1 , . . . , vn })
= Span{e1 , . . . , en }
= Rk ∩ (Rn × {0}).
Aus Proposition 6.6 folgt, dass M eine n-dimensionale Untermannigfaltigkeit der
Regularität C ∞ von Rk ist.
(2) Ist M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit der Regularität C ` , so ist auch
jede offene Teilmenge M 0 von M eine n-dimensionale C ` -Untermannigfaltigkeit des Rk :
schränke jede Untermannigfaltigkeits-Karte von M auf M 0 ein (Zentralübung).
Φ(M )
Definition 6.8. Sei M ⊂ Rk eine Teilmenge. Eine n-dimensionale lokale Parametrisierung von M
ist eine C ` -Abbildung F : W −→ Rk mit:
(a) W ⊂ Rn ist offen,
(b) F 0 (p) ∈ Rk×n hat Rang n für alle p ∈ W ,
(c) F (W ) = U ∩ M für eine offene Teilmenge U von Rk ,
(d) F : W −→ F (W ) ist ein Homöomorphismus.
PROPOSITION 6.9. Sei M ⊂ Rk eine Teilmenge. Dann sind äquivalent:
(a) M ist eine n-dimensionale C ` -Untermannigfaltigkeit.
(b) Für alle p ∈ M existiert eine n-dimensionale lokale Parametrisierung von M der Regularität
C ` , deren Bild p enthält.
Beweis. (a) =⇒ (b)“ Sei p ∈ M beliebig. Nach Proposition 6.6 existieren offene Teilmengen U und
”
V im Rk sowie ein C ` -Diffeomorphismus Φ : U −→ V mit p ∈ U und Φ(U ∩ M ) = V ∩ (Rn × {0}).
Definiere W := V ∩(Rn ×{0}) und F := (Φ−1 )|W : W −→ Rk . Dann ist W offen im Rn , F ist C ` (da
Φ C ` ) mit F 0 (x) = (Φ−1 )0 (x)|Rn injektiv ∀x ∈ W , es gilt F (W ) = Φ−1 (W ) = U ∩M und F : W −→
F (W ) ist die Einschränkung eines Homöomorphismus, ist also selbst ein Homöomorphismus.
(b) =⇒ (a)“ Sei p ∈ M beliebig. Sei F : W −→ Rk eine C ` -Abbildung mit p ∈ F (W ) eine lokale
”
Parametrisierung von M um p. Setze p̂ := F −1 (p) ∈ W . Da F 0 (p̂) maximalen Rang n hat, sind
∂F
∂F
(p̂), . . . , ∂x
(p̂) linear unabhängig im Rk . Deswegen existieren k − n Vektoren
die Vektoren ∂x
1
n
∂F
∂F
vn+1 , . . . , vk im Rk so, dass ∂x
(p̂), . . . , ∂x
(p̂), vn+1 , . . . , vk eine Basis von Rk ist. Betrachte
1
n
nun die Abbildung
Ψ : W × Rk−n −→ Rk , (x, α) 7−→ F (x) +
k
X
αj vj ,
j=n+1
wobei x ∈ W und α = (αn+1 , . . . , αk ) ∈ Rk−n . Dann ist Ψ C ` mit invertierbarem Differential
0
an
der Stelle (p̂, 0): die Matrix der linearen Abbildung Ψ (p̂, 0) in den Basen (e1 , . . . , en ) und
∂F
∂F
∂x1 (p), . . . , ∂x1 (p̂), vn+1 , . . . , vk
ist die Einheitsmatrix. Nach dem lokalen Umkehrsatz existieren
eine offene Umgebung von (p̂, 0), oBdA der Form W × W 0 (mit p̂ ∈ W, 0 ∈ W 0 ), eine offene
Umgebung V 0 von Ψ(p̂, 0) = p in Rk , so dass Ψ|W ×W 0 : W × W 0 −→ U 0 ein C ` -Diffeomorphismus
ist. Ist Ũ ⊂ Rk offen mit Ũ ∩ M = F (W ), so setze U := U 0 ∩ Ũ . Dann ist U offen im Rk mit
212
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
F (W ) = U ∩ M (wegen F (W ) = Ψ(W × {0}) ⊂ U 0 ). Die Abbildung Φ := (Ψ|W ×W 0 )−1 : U −→
Φ(U ) = (Ψ|W ×W 0 )−1 (U ) ist ein C ` -Diffeomorphismus auf die offene Teilmenge V = Φ(U ) von Rk ,
welche W × {0} enthält. Desweiteren gilt
V ∩ (Rn × {0}) ⊂ (W × W 0 ) ∩ (Rn × {0}) = W × {0} ⊂ V ∩ (Rn × {0})
und damit V ∩ (Rn × {0}) = W × {0}. Es folgt
Φ(U ∩ M ) = Φ(F (W )) = W × {0} = V ∩ (Rn × {0}).
2
Daraus folgt, dass Φ eine Untermannigfaltigkeits-Karte von M um p ist.
Beispiele 6.10.
(1) Sei U ⊂ Rn offen und f ∈ C ` (U, Rm ). Betrachte
Mf := {(x, f (x)) | x ∈ U } ⊂ Rn × Rm = Rn+m .
Dann ist die Abbildung F : U −→ Rn+m , x 7−→ (x, f (x))T eine n-dimensionale
11n ,
globale Parametrisierung von M : die Abbildung F ist C ` , es gilt F 0 (x) =
f
f 0 (x)
∀x ∈ U , wobei 11n die n × n Einheitsmatrix bezeichnet — insbesondere gilt rg(F 0 (x)) = n
— und F (U ) = Mf , wobei F : U −→ Mf ein Homöomorphismus ist mit Umkehrabbildung
Mf −→ U , (x, f (x)) 7−→ x (Projektion auf die n ersten Koordinaten).
(2) Sei M := p
S n ⊂ Rn+1 . Sei U := {x ∈ Rn : kxk2 < 1} ⊂ Rn . Definiere
F+ : U −→ Rn+1 ,
p
T
n+1
2
, F− (x) := (x, − 1 − kxk22 )T . Dann sind
x 7−→ (x, 1 − kxk2 ) sowie F− : U −→ R
F+ und F− n-dimensionale lokale Parametrisierungen von S n .
18.6.2014
Definition 6.11. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit und p ∈ M ein Punkt.
Der Tangentialraum an M im Punkt p ist
Tp M := {v ∈ Rk | ∃ ε > 0
c(0) = p
und c : (−ε; ε) −→ Rk ist C 1 -Kurve mit c((−ε; ε)) ⊂ M,
und c0 (0) = v} ⊂ Rk .
PROPOSITION 6.12. Sei M ⊂ Rk eine Untermannigfaltigkeit und p ∈ M ein Punkt.
(a) Sei Φ : U −→ V eine Untermannigfaltigkeits-Karte von M um p. Dann gilt Tp M =
Φ0 (p)−1 (Rn × {0}).
(b) Sei U ⊂ Rk offene Umgebung von p und g : U −→ Rk−n C ` mit 0 als regulärem Wert
und g −1 ({0}) = U ∩ M . Dann gilt
Tp M = ker(g 0 (p)).
(c) Sei F : W −→ Rk eine n-dimensionale lokale Parametrisierung von M um p. Sei p̂ :=
F −1 (p) ∈ W . Dann gilt
Tp M = F 0 (p̂)(Rn ).
6. UNTERMANNIGFALTIGKEITEN
213
Insbesondere ist Tp M ein n-dimensionaler Untervektorraum von Rk .
Beweis: (a) Sei v ∈ Tp M . Dann existiert c : (−ε; ε) −→ Rk C 1 (für ein ε > 0) mit c((−ε; ε)) ⊂ M ,
c(0) = p und c0 (0) = v. Bis auf Verkleinerung von ε können wir annehmen, dass c((−ε; ε)) ⊂ U
gilt. Dann gilt, ∀ t ∈ (−ε; ε): Φ ◦ c(t) ∈ Rn × {0}. Da Φ ◦ c : (−ε; ε) −→ Rn × {0} C 1 ist, ist
Φ ◦ c differenzierbar mit (Φ ◦ c)0 (0) ∈ Rn × {0}, d.h. Φ0 (c(0) ) · c0 (0) ∈ Rn × {0}. Dies zeigt
|{z}
p
v = c0 (0) ∈ Φ0 (p)−1 (Rn × {0}) und damit Tp M ⊂ Φ0 (p)−1 (Rn × {0}).
Umgekehrt sei v ∈ Φ0 (p)−1 (Rn × {0}). Betrachte q := Φ(p) ∈ Rn × {0} sowie w := Φ0 (p) · v ∈ Rn ×
c̃
{0}. Die Abbildung R −→ Rk , t 7−→ q + tw, ist C 1 mit c̃(0) = q, c̃0 (0) = w und c̃(0) ∈ Rn × {0} ∀ t.
Desweiteren existiert ein ε > 0 so, dass c̃((−ε; ε)) ⊂ V gilt (Stetigkeit an der Stelle t = 0). Nun
erfüllt c := Φ−1 ◦ c̃ : (−ε; ε) −→ U ⊂ Rk folgendes: c ist C 1 , c(0) = Φ−1 (q) = p, c((−ε; ε)) ⊂
Φ−1 (Rn × {0}) ⊂ M und c0 (0) = Φ0 (p)−1 (w) = v. Daraus folgt Tp M ⊃ Φ0 (p)−1 (Rn × {0}) und
damit Tp M = Φ0 (p)−1 (Rn × {0}).
(b) Sei v ∈ Tp M und c : (−ε; ε) −→ Rn wie in der Definition 6.11. Bis auf Verkleinerung von
ε können wir annehmen, dass c((−ε; ε)) ⊂ U gilt. Dann gilt g ◦ c(t) = 0 ∀t ∈ (−ε; ε); da g ◦
c : (−ε; ε) −→ Rk−n differenzierbar ist, folgt 0 = (g ◦ c)0 (0) = g 0 (c(0) ) · v und damit v ∈ ker(g 0 (p)).
|{z}
p
Da nach (a) Tp M ein n-dimensionaler Untervektorraum von Rk ist, folgt aus Tp M ⊂ ker(g 0 (p))
und dim(Tp M ) = n = dim(ker(g 0 (p)) bereits Tp M = ker(g 0 (p)).
(c) Sei w ∈ Rn . Dann existiert ein ε > 0 mit c̃(t) := p̂ + tw ∈ W ∀t ∈ (−ε; ε). Die Abbildung
c := F ◦ c̃ : (−ε; ε) −→ Rk ist dann C 1 mit c((−ε; ε)) ⊂ F (W ) ⊂ M , c(0) = F (p̂) = p und
c0 (0) = F 0 (p̂) · w ∈ Tp M . Es folgt F 0 (p̂)(Rn ) ⊂ Tp M . Da aber sowohl F 0 (p̂)(Rn ) als auch Tp M
n-dimensionale Untervektorräume von Rk sind, folgt Tp M = F 0 (p̂)(Rn ).
Beispiele 6.13.
(1) Sei M eine nichtleere offene Teilmenge von Rk . Dann ist nach Proposition 6.6 M eine
k-dimensionale C ∞ -Untermannigfaltigkeit des Rk : wähle U = V = M und Φ := IdM als
Untermannigfaltigkeits-Karte. Aus Proposition 6.12 folgt, ∀p ∈ M :
Tp M = Rk .
(2) Sei M := Mf wie in den Beispielen 6.5. Dann ist F : U −→ Rk , x 7−→ (x, f (x))T eine
globale Parametrisierung von Mf nach den Beispielen 6.10. Nach Proposition 6.12 gilt
dann, für p = (p̂, f (p̂))T ∈ Mf :
Tp M = F 0 (p̂)(Rn )
= {(v, f 0 (p̂) · v)T | v ∈ Rn }
= Graph(f 0 (p̂))
(= Mf 0 (p̂) ).
(3) Sei M := S n−1 ⊂ Rn . Sei g : Rn −→ R, x 7−→ kxk22 −1. Dann ist 0 ∈ R regulärer Wert von
g mit g −1 ({0}) = S n−1 . Aus Proposition 6.12 folgt, für jedes p ∈ S n−1 : Tp M = ker(g 0 (p)),
214
8. DIFFERENTIAL-RECHNUNG FÜR FUNKTIONEN IN MEHREREN VERÄNDERLICHEN
mit g 0 (p) = 2pT , d.h.,
Tp M
= {v ∈ Rn | pT v = 0}
= {v ∈ Rn | hp, vi = 0}
= p⊥ (Orthogonales Komplement von p).
7. Extrema mit Nebenbedingungen
Definition 7.1. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit von Rk und U ⊂ Rk eine
offene Umgebung von M im Rk . Sei f : U −→ R eine Funktion.
(a) Ist f differenzierbar, so heißt ein Punkt p ∈ M stationärer (oder kritischer) Punkt von
f|M : M −→ R, wenn f 0 (p)|Tp M = 0 gilt.
(b) Ein Punkt p ∈ M heißt lokales Maximum (bzw. Minimum) von f |M : M −→ R, wenn
eine offene Umgebung V von p in M so existiert, dass f (p) ≥ f (q) (bzw. f (p) ≤ f (q)) für
alle q ∈ V gilt.
(c) Ein Punkt p ∈ M heißt lokales Extremum von f|M : M −→ R, wenn p ein lokales Minimum
oder ein lokales Maximum von f |M ist.
PROPOSITION 7.2. Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit, U ⊂ Rk eine offene
Umgebung von M und f : U −→ R differenzierbar. Ist p ∈ M lokales Extremum von f|M , so ist p
ein stationärer Punkt von f|M .
Beweis. Sei v ∈ Tp M . Dann existieren ε > 0 und eine C 1 -Abbildung c : (−ε; ε) −→ Rk mit
c((−ε; ε)) ⊂ M , c(0) = p und c0 (0) = v. Die Abbildung f ◦ c : (−ε; ε) −→ R ist dann C 1 mit
f ◦ c(0) = f (p). Da p ein lokales Extremum von f|M ist, ist 0 ∈ (−ε; ε) ebenfalls ein lokales
Extremum von f ◦ c. Daraus folgt (f ◦ c)0 (0) = 0, d.h., mit der Kettenregel, f 0 (p) · v = 0. Damit
bekommen wir f 0 (p)|Tp M = 0, was zu beweisen war.
2
KOROLLAR 7.3 (Satz über Lagrange-Multiplikatoren). Sei M ⊂ Rk eine n-dimensionale Untermannigfaltigkeit, U ⊂ Rk eine offene Umgebung von M und f : U −→ R differenzierbar. Sei
p ∈ M ein stationärer Punkt (z.B. ein lokales Extremum) von f|M und g : V −→ Rk−n eine in
einer offenen Umgebung V von p in Rk definierte C 1 -Abbildung mit 0 ∈ Rk−n als regulärem Wert
und g −1 ({0}) = V ∩ M . Schreibe g(x) = (g1 (x), . . . , gk−n (x)) ∀x ∈ V . Dann gibt es eindeutige
reelle Zahlen λ1 , . . . , λk−n mit
k−n
X
f 0 (p) =
λj gj0 (p).
j=1
Diese Zahlen λ1 , . . . , λk−n heißen Lagrange-Multiplikatoren von f unter den Nebenbedingungen
g1 , . . . , gk−n an der Stelle p.
ZUSATZ 7.4. Umgekehrt gilt: existieren solche Lagrange-Multiplikatoren, dann ist p ein stationärer Punkt von f |M .
7. EXTREMA MIT NEBENBEDINGUNGEN
215
Beweis des Korollars. Nach Voraussetzung gilt f 0 (p)|Tp M = 0 (im Fall, wo p ∈ M ein lokales
Extremum von f|M ist, folgt dies aus Proposition 7.2). Nach Proposition 6.12 gilt aber


g10 (p)






.
0
0
..
Tp M = ker(g (p)) mit g (p) = 





0
gk−n (p)
k−n
T
ker(gj0 (p)).
=
j=1
Mit
ker(gj0 (p))
folgt Tp M =
k−n
T
j=1
= {v ∈ Rk |gj0 (p) · v = 0} = {v ∈ Rk |hgj0 (p)T , vi = 0}
= (gj0 (p)T )⊥
0
(gj0 (p)T )⊥ = Span{g10 (p)T , . . . , gk−n
(p)T }⊥ (siehe LA II). Die Bedingung f 0 (p)|Tp M =
0 ist zu hf 0 (p)T , vi = 0 ∀v ∈ Tp M äquivalent, d.h. zu f 0 (p)T ∈ (Tp M )⊥ ⊂ Rk . Insgesamt folgt
0
0
f 0 (p)T ∈ (Span{g10 (p)T , . . . , gk−n
(p)T }⊥ )⊥ = Span{g10 (p)T , . . . , gk−n
(p)T },
d.h., ∃ λ1 , . . . , λk−n ∈ R mit f 0 (p)T =
k−n
P
j=1
λj gj0 (p)T , d.h., f 0 (p) =
k−n
P
j=1
0
λj gj0 (p). Da gj0 (p), . . . , gk−n
(p)
linear unabhängig sind, sind λ1 , . . . , λk−n eindeutig mit dieser Eigenschaft.
Der Zusatz kann mit denselben Methoden bewiesen werden.
2
KAPITEL 9
Gewöhnliche Differentialgleichungen
Literatur zu diesem Kapitel.
•
•
•
•
•
[13], Kapitel 2 (gut zu lesen)
[6], Kapitel 14 (Rolle des Banachschen Fixpunktsatzes klarer)
[9] (umfassender, tiefer gehend)
[20]Mehr zu Stabilität
[29]noch mehr zu Stabilität, deutlich ausführlicher und umfassender als [20], sehr gut
lesbar.
• [23]
• [4]
1. Motivation
BIlD UND ERKLÄRUNG: aufwändig zu texen, siehe Vorlesung. Aber dennoch wichtig! ϕ : R → R
g
ϕ00 (t) = − sin(ϕ(t))
`
wobei g = 9, 81N/kg die Gravitationskonstante, ` die Pendellänge und ϕ der Auslenkungswinkel
ist.
(1.1)
Wichtige physikalische Fragen:
• Beschreibt dieses Modell die physikalische Situation? (Problematisch: Reibung, Drehenergie des Körpers, Masse des Stabes, Störeinflüsse, ...)
• Wie genau sind die Ausgangswerte ϕ(0), ϕ0 (0) und die Parameter g, `,...?
Dies ist nicht das Thema der Vorlesung!
Wichtige mathematische Fragen:
• Gibt es Funktionen ϕ : R → R, die (1.1) lösen? (Wenn nicht, dann ist dies sicher kein
gutes Modell!) Wir werden sehen: es gibt Lösungen!
217
23.6.2014
218
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
• Wenn ja, wieviele Lösungen gibt es? Wir werden sehen: zu gegebenem ϕ(0) und ϕ0 (0)
gibt es genau eine Lösungsfunktion. Die Gleichung (1.1) hat also einen zwei-dimensionalen
Lösungsraum.1
• Gibt es Lösungen ϕ : (a; b) → R, die sich nicht zu Lösungen auf ganz R fortsetzen lassen?
Wir werden sehen: Nein“ für diese Gleichung, aber bei vielen physikalischen Systemen
”
Ja“.
”
• Sind alle Lösungen periodisch? Man kann zeigen: viele, aber nicht alle. 2
• Kann man die Lösungen explizit angeben? Antwort: Es geht noch mit großem Aufwand.
Man braucht elliptische Integrale“, siehe http://en.wikipedia.org/wiki/Pendulum_
”
(mathematics). Bei komplizierteren physikalischen Systemen nahezu unmöglich.
• Wie lang ist die Periodenlänge von periodischen Lösungen? Antwort: Als Potenzreihe
angebbar. Bei komplizierteren Gleichungen nicht explizit berechenbar.
• Hängt sie von der maximalen Auslenkung ab? Antwort: Die Periodenlänge wird länger,
wenn die maximale Auslenkung länger wird.
• Erhaltungsgrößen? Antwort: Energieerhaltung, Drehimpulserhaltung (beim räumlichen
Pendel),. . .
Ziel: Möglichst großes systematisches Verständnis solcher Gleichungen. Beschreibung des qualitativen Verhaltens, falls die Lösungen nicht explizit zu finden sind.
Oft hilfreich: Linearisierte Gleichung. Ersetze nicht-lineare Terme durch das Taylorpolynom ersten
Grades. Im Pendel-Beispiel: ersetze
sin ϕ =
∞
X
1
(−1)j 2j+1
ϕ
= 0 + ϕ + 0 · ϕ2 − ϕ3 + · · ·
(2j
+
1)!
6
j=0
durch ϕ. Wir erhalten
g
ϕ00 (t) = − ϕ(t)
`
Viel leichter zu lösen:
r r g
g
t + b sin
t
ϕ(t) = a cos
`
`
Beschreiben die Lösungen der vereinfachten Gleichung auch hinreichend gut die Lösungen der
ursprünglichen Gleichung?
1Den Begriff
zwei-dimensional“ haben wir hier noch gar nicht sauber definiert. Der Lösungsraum ist eine
”
zwei-dimensionale Untermannigfaltigkeit des unendlich-dimensionalen Vektorraums C ∞ (R, R). Die obige Aussage
interpretieren Sie am besten so, dass der Lösungsraum durch die beiden Anfangswert ϕ(0) und ϕ0 (0) parametrisiert
wird.
2Alle Lösungen, deren Gesamtenergie unterhalb von E := mg` liegt, können keine Überschläge (=loopings)
0
machen, sie sind periodisch. Lösungen ϕ mit Gesamt-Energie größer als E0 sind im Sinne von Funktionen ϕ :
R → R nicht periodisch. Die zugehörige räumliche Bewegungskurve R → R3 , t 7→ (` sin ϕ(t), 0, −` cos ϕ(t))T ist
aber periodisch. Ist die Gesamtenergie gleich E0 , dann ist weder ϕ noch die zugehörige räumliche Bewegungskurve
periodisch. Dann gilt limt→±∞ ϕ(t) = ±π und die räumliche Bewegungskurve konvergiert in beide Richtungen gegen
(0, 0, −`)T .
2. DEFINITION UND REDUKTION AUF AUTONOME GLEICHUNGEN ERSTER ORDNUNG
219
2. Definition und Reduktion auf autonome Gleichungen erster Ordnung
Definition 2.1. Seien m, n, k ∈ N. Gegeben sei
U ⊂ R × (Rn )k+1 = R × Rn × · · · × Rn
{z
}
|
k+1-mal
und eine Funktion F : U → Rm . Wir sagen ϕ : (a; b) → Rn , a, b ∈ R, a < b eine Lösung der
durch F gegebenen gewöhnlichen Differentialgleichung, falls gilt:
(1) ϕ ist k-mal differenzierbar
(2) (t, ϕ(t), ϕ0 (t), . . . , ϕ(k) (t)) ∈ U für alle t ∈ (a; b)
(3) Für alle t ∈ (a; b) gilt
F (t, ϕ(t), ϕ0 (t), . . . , ϕ(k) (t)) = 0.
(2.2)
Man nennt (a; b) das Lösungsintervall der Lösung. Eine Gleichung der Form (2.2) nennt man eine
gewöhnliche Differentialgleichung von Ordnung ≤ k.3 Wir nennen F die definierende Funktion der
gewöhnlichen Differentialgleichung. Wir sagen, die gewöhnliche Differentialgleichung ist autonom,
falls die definierende Gleichung nicht von t abhängt. Wir schreiben dann oft
F (ϕ(t), ϕ0 (t), . . . , ϕ(k) (t)) = 0,
d.h. F : U → Rm , U ⊂ (Rn )k+1 .
Beispiele 2.3.
(1) Pendel: m = n = 1, k = 2, U = R4 ,
F (t, ϕ0 , ϕ1 , ϕ2 ) = ϕ2 +
g
sin ϕ0
`
(2) Linearisiertes Pendel: wie oben aber
F (t, ϕ0 , ϕ1 , ϕ2 ) = ϕ2 +
g
ϕ0
`
(3) m = n = k = 1, U = R3 . Sei a ∈ R
F (t, ϕ0 , ϕ1 ) = ϕ1 − aϕ0
Wir erhalten die Differentialgleichung
ϕ0 (t) = aϕ(t).
Dann ist ϕ(t) = eat eine Lösung.
(4) Sei g : (a; b) → R. Wir definieren
F (t, ϕ0 , ϕ1 ) = ϕ1 − g(t).
Dann ist G eine Lösung von
F (t, G(t), G0 (t)) = 0,
3Man sagt, die Ordnung ist gleich k, falls F tatsächlich von ϕ(k) abhängt.
220
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
genau dann, wenn G eine Stammfunktion zu g ist.
(5) Sei f : R2 → R. Für
F (t, ϕ0 , ϕ1 ) = ϕ1 − f (t, ϕ0 ).
haben wir die DGl
ϕ0 (t) = f (t, ϕ(t)).
(2.4)
Die ersten drei Beispiele sind autonom, die letzten beiden nicht.
Bemerkungen 2.5. Wichtig sind auch Differentialgleichungen, in denen Funktionen in mehreren
Veränderlichen gesucht werden, so dass die definierende Funktion von partiellen Ableitungen in
mehreren Veränderlichen abhängt. Solche Differentialgleichungen nennt man partielle Differentialgleichung. Geauer gesagt: eine partielle Differentialgleichung ist eine Differentialgleichung, die
keine gewöhnliche Differentialgleichung ist.
Zum Beispiel sei V offen in R` und ϕ : V → Rn . Wir definieren den Laplace-Operator ∆ :
C 2 (V, Rn ) → C 0 (V, Rn )
∆ϕ :=
`
X
∂2
ϕ
∂x2`
i=1
Dann ist ∆ϕ = 0 eine partielle Differentialgleichung, die in vielen Bereichen der Anwendungen
(Physik, Chemie, Biologie, Finanzmathematik,. . . ) sehr wichtig ist.
Wir behandeln in dieser Vorlesung nur gewöhnliche Differentialgleichungen. Die Lösungstheorie
partieller Differentialgleichungen wird in fortgeschritteneren Vorlesungen behandelt.
Bemerkung 2.6.
(1) Man kann jede gewöhnliche Differentialgleichung von k-ter Ordnung in eine Differentialgleichung erster Ordnung überführen. Hierzu definieren wir für ϕ : (a; b) → Rn die
Funktionen ψi (t) := ϕ(i) (t) und fassen diese Funktionen zu Ψ : (a; b) → (Rn )k als
Ψ(t) := (ψ0 (t), ψ1 (t), . . . , ψk−1 (t)) zusammen. Wir haben genau dann eine Lösung von
Gleichung (2.2), falls wir eine Lösung von
0
0
= F (t, ψ0 (t), ψ1 (t), . . . , ψk−1 (t), ψk−1
(t))
0 = ψ00 (t) − ψ1 (t)
..
.
. = ..
0
0
= ψk−2
(t) − ψk−1 (t)
2. DEFINITION UND REDUKTION AUF AUTONOME GLEICHUNGEN ERSTER ORDNUNG
221
haben. Wir können nun die gesamte rechte Seite in der Form Fe(t, Ψ(t), Ψ0 (t)) schreiben,
e → Rm × (Rn )k−1 für eine geeignete Teilmenge U
e von R × (Rn )k × (Rn )k .
wobei Fe : U


0
F (t, ψ0 (t), ψ1 (t), . . . , ψk−1 (t), ψk−1
(t))

ψ00 (t) − ψ1 (t)


Fe(t, Ψ(t), Ψ0 (t)) = 
 ∈ Rm+(k−1)n .
..


.
0
ψk−2
(t) − ψk−1 (t)
Wir haben eine gewöhnliche Differentialgleichung von k-ter Ordnung für ϕ : (a; b) →
Rn durch eine gewöhnliche Differentialgleichung erster Ordnung für Ψ : (a; b) → Rnk
ausgedrückt.
Im Beispiel des Pendels führen wir also eine Funktion ρ : (a; b) → R ein4 und lösen
das System
g
0 = ρ0 (t) + sin ϕ(t)
`
0 = ϕ0 (t) − ρ(t)
Wir definieren dann
ϕ
ϕ̂
ρ̂ + g` sin ϕ
Fe(t,
,
)=
∈ R2 .
ρ
ρ̂
ϕ̂ − ρ
Die dadurch definierte gewöhnliche Differentialgleichung ist
0
ϕ(t)
ϕ(t)
ρ (t) + g` sin ϕ(t)
∈ R2 .
0 = Fe(t,
, 0
)=
ϕ0 (t) − ρ(t)
ρ(t)
ρ (t)
Dies ist eine gewöhnliche Differentialgleichung erster Ordnung.
(2) Man kann jede gewöhnliche Differentialgleichung in eine autonome Differentialgleichung
überführen, indem wir ähnlich wie oben Ψ(t) := (t, ϕ(t)), Ψ : V → Rn+1 setzen und dann
die definierenden Funktion F : U → Rm durch eine weitere Komponente t0 = 1 zu einer
Funktion Fe : U → Rm+1 ergänzen.5
Wir betrachten dazu Beispiel 2.3 (5). Wir überführen die bisherige gewöhnliche Differentialgleichung für ϕ(t) in eine für Ψ(t) = (τ (t), ϕ(t)). Dazu definieren wir
τ0
τ1
τ1 − 1
e
F
,
=
u0
u1
u1 − f (τ0 , u0 ).
(2.7)
Diese Funktion definiert die autonome gewöhnliche Differentialgleichung
( 0
τ (t) = 1
u0 (t) = f (τ (t), u(t))
4Also ψ (t) = ϕ(t), ψ (t) = ρ(t) in der Notation von oben.
0
1
5Der Definitionsbereich von F ändert sich nicht, aber die Interpretation der t-Variable.
222
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Ist u eine Lösung von (2.4), dann istΨ(t) := (t, u(t)) eine Lösung von (2.7). Ist umgekehrt
Ψ(t) = (τ (t), u(t)) eine Lösung von (2.7). Dann folgt τ (t) = t + t0 für eine Konstante
t0 ∈ R. Wir setzen dann ũ(t) := u(t − t0 ). Dann gilt
ũ0 (t) = u0 (t − t0 ) = f (t, u(t − t0 )) = f (t, ũ(t)).
Also ist ũ eine Lösung von (2.4).
25.6.2014
Wir haben diskutiert:
• Jede gewöhnliche Differentialgleichung kann auf eine Differentialgleichung erster Ordnung
reduziert werden (gezeigt)
• Jede gewöhnliche Differentialgleichung kann auf eine autonome Differentialgleichung (der
gleichen Ordnung) reduziert werden (Beweis oben, in Vorlesung nur erwähnt)
Viele (gewöhnliche)6 Differentialgleichungen haben keine Lösung oder können nur schwer gelöst
werden. Zum Beispiel hat
(ϕ(t)2 + (ϕ0 (t) − 1)2 = 0
keine Lösung ϕ : (a; b) → R.
In guten Situationen kann man Differentialgleichungen erster Ordnung nach ϕ0 (t) auflösen, und
dann sind die Gleichungen besser zu behandeln:
ϕ0 (t) = f (t, ϕ(t))
oder
ϕ0 (t) = f (ϕ).
Man nennt dies eine explizite gewöhnliche Differentialgleichung.
Definition 2.8. Sei U offen in Rn . Ein (glattes) Vektorfeld ist eine (glatte) Abbildung f : U → Rn .
Vorstellung: Im Punkt x hängt der Pfeil, der durch f (x) beschrieben wird
BILD
Definition 2.9. Eine Flusslinie oder Integralkurve des Vektorfeldes f : U → Rn ist eine Lösung
von
ϕ0 (t) = f (ϕ(t)).
Definition 2.10. Eine Erhaltungsgröße oder ein erstes Integral zum Vektorfeld f ist eine Funktion
E : U → R, so dass t 7→ E(ϕ(t)) entlang jeder Flusslinie von f konstant ist.
Schreibweise: schreibe auch
6Wir lassen das Wort
sind.
d
dt h
für die Ableitung von h nach t.
gewöhnlich“ nun oft weg, da alle Differentialgleichungen in der Vorlesung gewöhlich
”
3. DER SATZ VON PICARD-LINDELÖF
223
Beispiel 2.11 (Pendel). Wir betrachten die Gleichung
ϕ00 (t) = − sin ϕ(t).
(2.12)
Wir formen in eine Differentialgleichung erster Ordnung um, indem wir ρ(t) = ϕ0 (t) setzen, Ψ(t) =
(ϕ(t), ρ(t))T ∈ R2 .
0 ϕ(t)
ρ(t)
=
ρ(t)
− sin ϕ(t)
Lösung sind Flusslinien von f (ϕ, ρ) = (ρ, − sin ϕ)T . Ist Ψ(t) = (ϕ(t), ρ(t))T eine Flusslinie von f ,
so ist ϕ(t) eine Lösung von (2.12).
Multipliziere (2.12) mit ϕ0 (t),
d
1 d
((ϕ0 (t))2 ) = ϕ0 (t)ϕ00 (t) = −ϕ0 (t) sin(ϕ(t)) = (cos ϕ(t))
2 dt
dt
Wir definieren E : R2 → R E(ϕ, ρ) = 12 ρ2 − cos ϕ. Dann ist
0
1
d
(E((ϕ(t), ρ(t))T )) =
(ϕ0 (t))2 − cos ϕ(t) = 0.
dt
2
Also ist E eine Erhaltungsgröße.
BILD
3. Der Satz von Picard-Lindelöf
Ab jetzt: Sei U offen in R × Rn , f : U → Rn .
Elemente in R × Rn 3 (t, x), t ∈ R Zeit, x ∈ Rn Ort.
Definition 3.1. Sei f wie oben. Wir sagen f ist Orts-Lipschitz-stetig, falls es ein L ∈ R gibt, so
dass für alle (t, x), (t, y) ∈ U gilt:
kf (t, x) − f (t, y)k ≤ Lkx − yk.
Wir sagen auch f ist Orts-Lipschitz-stetig mit Lipschitz-Konstante L.
Wir sagen f ist lokal Orts-Lipschitz-stetig, falls jedes (t, x) ∈ U eine offene Umgebung V in U
besitzt, so dass f |V Orts-Lipschitz-stetig ist.
7
Beispiele 3.2.
7Die Eigenschaften Orts-Lipschitz-stetig und lokal Orts-Lipschitz-stetig sind unabhängig von der gewählten
Norm auf Rn . Die möglichen Konstanten L hängen aber von der Wahl der Norm ab.
224
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
(1) Sei f : U → Rn Lipschitz-stetig, das heißt, es gebe ein L ∈ R, so dass für alle (t, x), (s, y) ∈
U:
p
kf (t, x) − f (s, x)k ≤ L |t − s|2 + kx − yk2 .
Dann ist f Orts-Lipschitz-stetig. Insbesondere ist jede lineare Funktion (Orts-)Lipschitzstetig.
√
(2) f : R × R → R, f (t, x) = 3 t ist Orts-Lipschitz-stetig und stetig, aber nicht Lipschitzstetig.
(3) Lipschitz-stetige Funktionen sind stetig, aber es gibt nicht-stetige Orts-Lipschitz-stetige
Funktionen
(4) Schreibe (t, x) = (t, x1 , . . . , xn ). Angenommen die partiellen Ableitungen
∂
∂
f, . . . ,
f : U → Rn
∂x1
∂xn
existieren und sind stetig (als Funktionen U → Rn ). Sei B (t0 , x0 ) ∈ U . Wir definieren
∂
C := max
max
f (s, y)
< ∞.
i=1,...,n (s,y)∈B (t0 ,x0 ) ∂xi
∞
Das hintere Maximum wird angenommen (und ist deswegen endlich), da B (t0 , x0 ) kompakt ist. Schreibe f (t, x) = (f1 (t, x), . . . , fn (t, x)). Dann gilt nach dem Mittelwertsatz
fj (s, y) − fj (s, z) =
n
X
(yi − zi )
i=1
∂fj
(s, w)
∂xi
w auf der Strecke von y nach z. Also
|fj (s, y) − fj (s, z)| ≤ ky − zk∞ nC,
falls (s, y), (s, z) ∈ B (t0 , x0 ). Bezüglich der Norm k • k∞ ist f |B (t0 ,x0 ) also OrtsLipschitz-stetig. Es folgt, dass f lokal Orts-Lipschitz-stetig ist.
THEOREM 3.3 (Satz von Picard-Lindelöf). Seien U ⊂ R × Rn offen, f : U → Rn lokal 8 OrtsLipschitz-stetig und stetig. Sei (t0 , x0 ) ∈ U . Dann gibt es ein 0 ∈ R>0 , so dass es für jedes
∈ (0; 0 ] genau eine stetig differenzierbare Abbildung ϕ : (t0 − ; t0 + ) → Rn gibt mit:
• ϕ(t0 ) = x0 (Anfangswert)
• für alle t ∈ (t0 − ; t0 + ) gelte (t, ϕ(t)) ∈ U
• und für alle t ∈ (t0 − ; t0 + ) gelte
(3.4)
ϕ0 (t) = f (t, ϕ(t)).
Beweis. Im folgenden sei
Bδ∞ (x0 ) := {x ∈ Rn | kx − x0 k∞ < δ}.
8Die Aussage ist natürlich auch noch immer richtig, wenn wir das Wort lokal“ weglassen.
”
3. DER SATZ VON PICARD-LINDELÖF
225
Wir wählen δ > 0, so dass V := (t0 − δ; t + δ) × Bδ∞ (x0 ) ⊂ V := [t0 − δ; t + δ] × Bδ∞ (x0 ) ⊂ U .
Wenn wir δ > 0 genügend klein wählen, dann ist f |V Orts-Lipschitz-stetig, und sei L ∈ R hierzu
eine Lipschitz-Konstante. Da f stetig ist, ist f beschränkt auf der kompakten Menge V .
∈ (0; δ) wird später festgelegt.
Notation I = (t0 − ; t0 + ),
Sei E := Cb (I, Rn ) der Vektorraum der beschränkten stetigen Funktionen von I nach Rn . Für
ϕ ∈ E definiere9
|||ϕ|||∞ := sup kϕ(t)k∞
t∈I
ϕi → ϕ in (E, ||| • |||∞ )
(def)
⇐⇒
ϕi konvergiert gleichmäßig gegen ϕ
LEMMA 3.5. (E, ||| • |||∞ ) ist ein Banachraum, d.h. jede Cauchy-Folge in E konvergiert.
Beweis des Lemmas. Ist (ϕi ) eine Cauchy-Folge in E. Für jedes t ∈ I ist (ϕi (t)) eine CauchyFolge10in Rn . Setze ψ(t) := limi→∞ ϕi (t). Dann konvergiert (ϕi ) gleichmäßig11 gegen ψ, und da
alle ϕi stetig und beschränkt sind, ist ψ ebenfalls gleichmäßig und beschränkt.
2
30.6.2014
Sei ϕ0 konstant x0 , d.h. ϕ0 (t) = x0 ∀t ∈ I. Wir definieren die folgende Teilmenge von E:
Eδ, := {ϕ ∈ E | ∀t ∈ (t0 − ; t0 + ) : kϕ(t) − x0 k∞ ≤ δ} = {ϕ ∈ E | |||ϕ − ϕ0 |||∞ ≤ δ}.
Man sieht leicht, dass Eδ, eine abgeschlossene Teilmenge von (E, ||| • |||∞ ) ist. Insbesondere ist Eδ,
mit der von ||| • |||∞ induzierten Metrik ein vollständiger metrischer Raum.
Wir definieren12
Z
A : Eδ, → E,
t
A(ϕ)(t) = x0 +
f (τ, ϕ(τ )) dτ.
t0
Die Beschränktheit von A(ϕ) folgt aus der Beschränktheit von f |V .
LEMMA 3.6. A(ϕ) = ϕ genau dann, wenn ϕ eine stetig differenzierbare Lösung von (3.4) ist mit
ϕ(t0 ) = x0 .
Beweis des Lemmas. Es gelte A(ϕ) = ϕ. Dann gilt (inklusive Existenz der Ableitung!)
Z
d t
f (τ, ϕ(τ )) dτ = f (t, ϕ(t)).
ϕ0 (t) =
dt t0
9Um die Norm auf Rn und die auf E genauer zu unterscheiden, schreiben wir für letztere im Skript ||| • ||| .
∞
10Denn kϕ(t) − ϕ (t)k ≤ |||ϕ − ϕ ||| .
∞
j
i
j ∞
11Denn kϕ (t) − ψ(t)k = lim
∞
i
j→∞ kϕi (t) − ϕj (t)k∞ ≤ limj→∞ |||ϕi − ϕj |||∞ . Und deswegen |||ϕi − ψ|||∞ → 0
für i → ∞.
12Im folgenden ist immer A(ϕ)(t) als
A(ϕ) (t) zu lesen
226
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Aus dieser Formel folgt auch die stetige Differenzierbarkeit von ϕ.
Umgekehrt: ist ϕ eine stetig differenzierbare Lösung von (3.4) mit ϕ(t0 ) = x0 , dann ist
Z t
Z t
ϕ0 (τ ) dτ = ϕ(t).
f (τ, ϕ(τ )) dτ = x0 +
A(ϕ)(t) = x0 +
t0
t0
2
LEMMA 3.7. Sei f |V Orts-Lipschitz-stetig mit Lipschitz-Konstante L. Dann ist die Abbildung
A : Eδ, → E Lipschitz-stetig mit Konstante L.
Beweis des Lemmas. Seien ϕ, ψ ∈ Eδ, .
A(ϕ)(t) − A(ψ)(t)
Z t
=
f τ, ϕ(τ ) − f τ, ψ(τ ) dτ
t0
Z
A(ϕ)(t) − A(ψ)(t)
∞
≤
t
t
f τ, ϕ(τ ) − f τ, ψ(τ ) dτ
∞
Z0 t
≤ L ϕ(τ ) − ψ(τ ) ∞ dτ t0
≤ L sup kϕ(τ ) − ψ(τ )k∞
τ ∈I
Also
|||A(ϕ) − A(ψ)|||∞
≤ L|||ϕ − ψ|||∞ .
2
LEMMA 3.8. Sei C := max{kf (t, x)k∞ | (t, x) ∈ V }. Wenn wir
δ
δ
, }
(3.9)
≤ 0 := min{
2(C + δL) 2
wählen, dann gilt A(Eδ, ) ⊂ Eδ/2, .
Beweis.
|||A(ϕ0 ) − ϕ0 |||∞
≤
sup kA(ϕ0 )(t) − x0 k∞
t∈I
Z t
= sup x
+
f
(τ,
x
)
dτ
−
x
0
0
0
t∈I
=
t0
Z t
sup kf (τ, x0 )k∞ dτ t∈I
t0
≤ sup |t − t0 |C = C.
t∈I
∞
3. DER SATZ VON PICARD-LINDELÖF
227
Also gilt für beliebiges ϕ ∈ Eδ, :
|||A(ϕ) − ϕ0 |||∞
≤
|||A(ϕ) − A(ϕ0 )|||∞ + |||A(ϕ0 ) − ϕ0 |||∞
≤
L|||ϕ − ϕ0 |||∞ + C
δ
≤ Lδ + C ≤ ,
2
falls wie oben gewählt wird. Wegen ≤ 0 ≤ δ/2 folgt A(Eδ, ) ⊂ Eδ/2, .
2
Aus (3.9) folgt auch L < 1/2. Das heißt dann ist A : Eδ, → Eδ, eine Kontraktion. Es gilt
ϕ0 ∈ Eδ, 6= ∅. Nach dem Banachschen Fixpunktsatz (Satz 7.4 in Kapitel7) besitzt also A einen
eindeutigen Fixpunkt in Eδ, . Den Fixpunkt nennen13 wir ϕ . Insbesondere haben wir nun den
Existenzteil des Theorems gezeigt.
Ist nun 0 < ˜ < , dann ist
ϕ̃ := (ϕ )|(t0 −;t0 +) ∈ Eδ,˜
eine Lösung von (3.4) mit ϕ̃(t0 ) = x0 und deswegen gilt ϕ˜ = ϕ̃.
Das Theorem (=der Satz von Picard-Lindelöf) ist nun bewiesen, sobald wir das folgende Lemma
haben. Dann ist nämlich auch die im Theorem behauptete Eindeutigkeit gezeigt.
LEMMA 3.10. Sei ρ ∈ (0; 0 ] und ψ : (t0 − ρ; t0 + ρ) → Rn eine Lösung von (3.4) mit ψ(t0 ) = x0 ,
(t, ψ(t)) ∈ U ∀t. Dann gilt ψ ∈ Eδ,ρ .
Beweis. Zu zeigen ist
kψ(t) − x0 k∞ < δ.
sup
t∈(t0 −ρ;t0 +ρ)
Angenommen diese Ungleichung gilt nicht. Dann ist
n
o
T := s ∈ [0; ρ) kψ(t0 + s) − x0 k∞ = δ oder kψ(t0 − s) − x0 k∞ = δ
eine nicht-leere abgeschlossene14 Teilmenge von [0; ρ).
Setze ρ̃ := min T , und wir haben 0 < ρ̃ < ρ ≤ 0 . Für jedes ∈ (0; ρ̃) ist ψ|(t0 −;t0 +) ∈ Eδ, . Also
für t ∈ (t0 − ; t0 + ):
(3.11)
ψ(t) = ϕ0 (t).
Da ∈ (0; ρ̃) beliebig war, gilt (3.11) für t ∈ (t0 − ρ̃; t0 + ρ̃). Auf Grund der Stetigkeit von ψ und
ϕ0 folgt die Gültigkeit von(3.11) für t ∈ [t0 − ρ̃; t0 + ρ̃]. Es folgt der Widerspruch
δ
ρ̃∈T
δ = kψ(t0 ± ρ̃) − x0 k∞ = kϕ0 (t0 ± ρ̃) − x0 k∞ ≤ .
2
13Wir schreiben ϕ um klar zu machen, dass wir noch nichts darüber wissen, ob es von abhängt. Achtung: wir
haben auch noch nicht geklärt, ob die Lösung von δ abhängt. Und selbst bei L können wir verschiedene Konstanten
wählen, und die wählbaren Konstanten hängen auch wieder von der Wahl von δ ab. Kurzum: ϕ könnte noch von
vielen Wahlen abhängen, und wir werden nun sehen, dass es dies eigentlich gar nicht tut.
14Da s 7→ kψ(t + s) − x k
0
0 ∞ stetig ist und {δ} abgeschlossen in R.
228
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
2
Aus Lemma 3.10 folgt dann auch: Lösungen von (3.4) mit dem selben Anfangswert stimmen auf
dem Durchschnitt ihrer Definitionsbereiche überein.15
Der Beweis des Theorems liefert noch mehr
• Ein numerisches16 Berechnungsverfahren für die Lösung. Definiere rekursiv: ϕ0 (t) = x0 ,
ϕk+1 := A(ϕk ). Dann konvergiert ϕk gegen die Lösung. (Ohne Beweis!)
• Information darüber wie ϕ(t) vom Anfangswert x0 abhängt (siehe nach den Beispielen).
• Seien U , f , t0 und x0 wie im Satz von Picard-Lindelöf. Setze
tmax := sup{t > t0 | Es existiert > 0 und eine Lösung ϕ : (t0 − ; t) → Rn
von (3.4) mit Anfangswert x0 } ∈ (t0 ; ∞]
tmin := inf{t < t0 | Es existiert > 0 und eine Lösung ϕ : (t; t0 + ) → Rn
von (3.4) mit Anfangswert x0 } ∈ [−∞; t0 ).
Dann existiert auch eine Lösung ϕ : (tmin ; tmax ) → Rn mit Anfangswert x0 . (Beweis folgt
direkt aus Lemma 3.11 und Ersetzen von t0 durch andere Werte.) Man nennt (tmin ; tmax )
das maximale Lösungs-Intervall .
Beispiele 3.12.
(a) Ist f : U → Rn stetig differenzierbar, dann ergibt der Satz von Picard-Lindelöf zu jedem
Anfangswert ϕ(t0√
) = x0 eine eindeutige auf dem maximalen Intervall
√ definierte Lösung.
(b) n = 1, f (t, x) = 3 t ist Orts-Lipschitz-stetig. Also erfüllt ϕ0 (t) = 3 t, ϕ(t) ∈ R die Voraussetzungen des Satzes von Picard-Lindelöf. Man kann explizit die Lösung bestimmen:
ϕ(t) =
3 4/3
t .
4
15Die oben konstruierte Zahl hängt von der Wahl von δ ab. Die Lösung ϕ ist aber im folgenden Sinn von
0
δ unabhängig: Sind Lösungen zu zwei verschiedenen Wahlen von δ gegeben, so stimmen diese Lösungen auf einer
Umgebung von t0 überein.
16 Numerisch“ bedeutet: man bekommt keine explizite Formel für die Lösung heraus, dafür aber ein Verfahren,
”
das in ein Computer-Programm umsetzbar ist und das dann beliebig genaue Näherungslösungen liefert.
3. DER SATZ VON PICARD-LINDELÖF
229
√
(c) n = 1, f (t, x) = 3 x ist nicht Orts-Lipschitz-stetig. Picard-Lindelöf nicht anwendbar. Dennoch
gibt es Lösungen. Falls ϕ(t) 6= 0:
p
ϕ0 (t) = 3 ϕ(t)
ϕ0 (t)
=1
⇐⇒ p
3
ϕ(t)
d 3
⇐⇒
(ϕ(t))2/3 = 1
dt 2
3
⇐⇒ ∃c ∈ R : (ϕ(t))2/3 = t + c
2
2
⇐⇒ ∃c ∈ R : ϕ(t) = ( (t + c))3/2 .
3
Dies liefert Lösungen auf (−c, ∞). Nun ist
(
( 32 (t + c))3/2 t > −c
ϕ(t) =
0
t ≤ −c
stetig differenzierbar. Zum Anfangswert ϕ(0) = 0 gibt es viele Lösungen (zu jedem c ≥ 0 eine).
Weitere Lösungen
(
ϕ(t) =
−( 23 (t + c))3/2
0
t > −c
.
t ≤ −c
Existenz, aber keine Eindeutigkeit!
2.7.2014
Wdh. Picard-Lindelöf.
Sei U offen in R × Rn , f : U → Rn Orts-Lipschitz-stetig und stetig. Zu jedem (t0 , x0 ) gibt es
• > 0 und
• Eine eindeutige C 1 -Funktion ϕt0 ,x0 : (t0 −; t0 +) → Rn , so dass für alle t ∈ (t0 −; t0 +)
gilt:
(t, ϕt0 ,x0 (t)) ∈ U und ϕ0t0 ,x0 (t) = f (t, ϕt0 ,x0 (t))
Ab jetzt: Lösung = Lösung von ϕ0 (t) = f (t, ϕ(t)).
Wir wollen eine in der letzten Stunde kurz behandelte wichtige Folgerung im Detail diskutieren.
LEMMA 3.13. Seien U , f , t0 und x0 wie im Satz von Picard-Lindelöf. Setze
tmax := sup{t > t0 | Es existiert > 0 und eine Lösung ϕ : (t0 − ; t) → Rn
von (3.4) mit Anfangswert x0 } ∈ (t0 ; ∞]
tmin := inf{t < t0 | Es existiert > 0 und eine Lösung ϕ : (t; t0 + ) → Rn
von (3.4) mit Anfangswert x0 } ∈ [−∞; t0 ).
230
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
(1) Dann existiert auch eine Lösung ϕmax : (tmin ; tmax ) → Rn mit Anfangswert ϕmax (t0 ) = x0 .
Man nennt (tmin ; tmax ) das maximale Lösungs-Intervall.
(2) Jede Lösung ϕ : I → Rn mit demselben Anfangswert erfüllt I ⊂ (tmin ; tmax ) und ϕ = ϕmax |I .
Beweis.
1. Schritt: Sind ϕ : I → Rn und ϕ̃ : I˜ → Rn mit ϕ(t0 ) = ϕ̃(t0 ) = x0 ; I, I˜ offene Intervalle. Wir
zeigen, dass ϕ und ϕ̃ auf I ∩ I˜ übereinstimmen.
Wir definieren
T := {t ∈ I ∩ I˜ | ϕ(t) = ϕ̃(t)}.
Da h : t 7→ ϕ(t) − ϕ̃(t) stetig ist und da {0} abgeschlossen in R, ist T = h−1 ({0}) ebenfalls
˜ Wegen t0 ∈ T wissen wir T 6= ∅. Wir zeigen nun, dass T offen in I ∩ I˜ ist.
abgeschlossen in I ∩ I.
˜
Da I ∩ I zusammenhängend ist, folgt dann T = I ∩ I˜ und somit der erste Schritt.
˜ Nach Picard-Lindelöf gibt es ein
Sei also t1 ∈ T . Wähle 1 > 0 so, dass (t1 − 1 ; t1 + 1 ) ⊂ I ∩ I.
∈ (0; 1 ], so dass es genau eine Lösung ϕ̂ : J := (t1 −; t1 +) → Rn mit Anfangswert ϕ̂(t1 ) = ϕ(t1 )
gibt. Also
ϕ̂ ≡ ϕ|J ≡ ϕ̃|J .
Somit J ⊂ T . Wir haben gesehen, dass T offen ist. Der erste Schritt ist somit beendet.
2. Schritt: Wir wollen nun die Lösung ϕmax : (tmin ; tmax ) → Rn mit Anfangswert ϕmax (t0 ) = x0
definieren.
Zu t ∈ (tmin ; tmax ) wählen wir eine Lösung ϕ : I → Rn , I offenes Intervall, t0 , t ∈ I mit ϕ(t0 ) = x0 .
Dann setzen wir ϕmax (t) = ϕ(t). Der erste Schritt garantiert, dass die Definition von ϕmax (t) nicht
davon abhängt, wie wir I und ϕ gewählt haben. Und für derartige ϕ gilt dann
ϕmax |I = ϕ.
Insbesondere ist nun ϕmax auf (tmin ; tmax ) wohldefiniert und eine stetig differenzierbare Lösung.
2
Bemerkung 3.14. Sei wieder f : U → Rn , (t0 , y0 ) ∈ U wie oben. Hierzu sei δ, wie im Beweis von
Picard-Lindelöf konstruiert gewählt. Sei (s, y) ∈ U mit k(s, y) − (t0 , x0 )k∞ ≤ δ/4. Wenn man den
Beweis von Picard-Lindelöf genau anschaut, so sieht man, dass die Differentialgleichung auch eine
Lösung ϕs,y : (s − ; s + ) → Rn mit ϕs,y (s) = y gibt. Das heißt, für das im Beweis konstruierte
∈ (0; 0 ] gibt es eine Lösung mit Anfangswert
ϕs,y (s) = y.
PROPOSITION 3.15. Seien U , f , (t0 , x0 ) wie im Satz von Picard-Lindelöf. Sei ϕ eine Lösung
mit ϕ(t0 ) = x0 mit maximalem Lösungs-Intervall (tmin ; tmax ).
Gilt tmax < ∞, dann gibt es kein x∞ mit (tmax , x∞ ) ∈ U und
x∞ = lim ϕ(t).
t→tmax
3. DER SATZ VON PICARD-LINDELÖF
231
Analog für tmin > −∞.
In anderen Worten: Wenn der Grenzwert existiert, dann ist er nicht in U .17
Beweis. Wir betrachten nur die Aussage um tmax .
Angenommen solch ein x∞ existiert. Es existiert nun ein > 0 und eine Umgebung V von
(tmax , x∞ ) in R × Rn , so dass für alle (s, y) ∈ V gilt: es gibt eine Lösung ϕs,y : (s − ; s + ) → Rn
mit ϕs,y (s) = y.
Es existiert nun ein δ > 0 so dass für alle t ∈ (tmax − δ; tmax ): ϕ(t) ∈ V . Wähle nun ein t1 mit
tmax − /2 < t1 < tmax , tmax − δ < t1 .
Wir erhalten nun eine Lösung
(
ϕ(t)
für t ≤ t1
ϕ̂(t) :=
ϕt1 ,ϕ(t1 ) (t) für t ≥ t1
BILD
die auf dem Intervall [0; t1 + ) definiert ist, aber t1 + > tmax . Dies ist ein Widerspruch.
2
Bemerkung. Unter den Voraussetzung von Proposition 3.15 erhalten wir mit genau den gleichen
Argumenten wie im obigen Beweis sogar eine etwas stärkere Aussage:
Gilt tmax < ∞, dann gibt es keine Folge ti % tmax , so dass
x∞ = lim ϕ(ti )
i→∞
existiert und (tmax , x∞ ) ∈ U . Insbesondere folgt hieraus: Im Fall tmax < ∞, gilt für t0 ∈ (tmin ; tmax )
U ∩ {(t, ϕ(t)) | t0 ≤ t < tmax }
ist nicht kompakt.
Wir definieren jetzt
D ⊂ R × R × Rn
durch (t, s, y) ∈ D ⇐⇒ (s, y) ∈ U und es existiert eine Lösung ϕs,y : I → Rn mit ϕs,y (s) = y und
t ∈ I.18 Es folgt aus Bemerkung 3.14:
◦
{(t, t, y) | (t, y) ∈ U } ⊂ D
(Man kann sogar zeigen, dass D offen in R × R × Rn ist).
17Es gibt ein Beispiele für alle denkbaren Fälle: t
max < ∞ und Grenzwert existiert außerhalb U . tmax < ∞
und Grenzwert existiert nicht. Im Falle tmax = ∞ kann man keine Aussage machen. Ein uneigentlicher Grenzwert
kann nicht existieren, außerhalb von U existieren oder in U existieren. Analog für tmin .
18In anderen Worten t liegt im zugehörigen maximalen Definitionsbereich.
232
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Wir definieren nun den Fluss Φ von f wie folgt:
Φ : D → Rn ,
Φ(t, s, y) := ϕs,y (t).
Dann gilt offensichtlich
Φ(t, t, y) = y.
Außerdem
(t, s, y) ∈ D
⇐⇒
(s, t, Φ(t, s, y)) ∈ D
und
Φ(s, t, Φ(t, s, y)) = y.
Denn ist Φ(t, s, y) = ϕs,y (t), dann haben wir
ϕs,y ≡ ϕt,Φ(t,s,y) .
Wir erhalten dann an der Stelle s
y = ϕs,y (s) = ϕt,Φ(t,s,y) (s) = Φ(s, t, Φ(t, s, y)).
So ähnlich zeigt man
Φ(r, t, Φ(t, s, y)) = Φ(r, s, y),
2
falls alle Ausdrücke wohldefiniert.
PROPOSITION 3.16. Der Fluss Φ : D → Rn ist stetig.
Anschaulich: ist die Lösung ϕt0 ,x0 (t) ist nicht nur stetig in t sondern auch stetig in t0 und x0 .
Beweisskizze. (Details siehe z.B. [9, Chap. 1, Sec. 5])
Notationen ähnlich wie im Beweis von Picard-Lindelöf. Man nutzt Bemerkung 3.14 um ein gemeinsames Definitionsintervall für alle (s, y) nahe (t0 , x0 ) zu finden. Man definiert iterativ für
|t − s| < /2 (für das aus Beweis Picard-Lindelöf):
Z t
Φ0 (t, s, y) := y,
Φj+1 (t, s, y) := y +
f (τ, Φj (τ, s, y)) dτ.
s
Man zeigt iterativ, dass Φj stetig ist für alle j und zeigt dann, dass Φj lokal gleichmäßig gegen Φ
konvergiert. Die Stetigkeit ist nun für |t − s| < /2 gezeigt. Um es für alle t, s zu zeigen wählt man
Zahlen t0 , . . . , tL mit t0 = s, tL = t und |ti − ti−1 | < /2. Die Stetigkeit von Φ folgt dann aus der
Verkettung von stetigen Funktionen wie folgt
Φ(t, s, y) = Φ(tL , tL−1 , Φ(tL−1 , tL−2 , Φ(. . . , Φ(t1 , t0 , y) . . .).
2
3. DER SATZ VON PICARD-LINDELÖF
233
ZUSATZ 3.17. Ist f ∈ C k (U, Rn ), dann ist auch Φ ∈ C k (D, Rn ).
Anschaulich: ist f ∈ C k , dann ist die Lösung ϕt0 ,x0 (t) ist nicht nur C k in t sondern auch C k in t0
und x0 .19
2
Beweis. Ganz analog.
KOROLLAR 3.18. D ist offen.
Beweisskizze.20 Sei (t, s, y) ∈ D. Wir wollen eine offene Umgebung von (t, s, y) konstruieren, die in
D enthalten ist. O.B.d.A. t ≥ s. Wähle zu jedem τ ∈ [s; t] ein (τ ) > 0 mit B(τ ) ((τ, τ, y)) ⊂ D. Dies
liefert eine offene Überdeckung ((τ − (τ ); τ + (τ ))τ ∈[s;t] von [s; t]. Wähle hierzu eine Lebesguesche
Zahl, und ein m ∈ N, m > 1/. Wir definieren
i
ti := s + (t − s).
m
Wir schreiben


ϕ1 (s, y) := Φ(t1 , s, y)
ϕi (y) := Φ(ti , ti−1 , y)
2≤i≤m−1


ϕm (t, y) := Φ(t, tm−1 , y)
Wir können nun schreiben:
Φ(t̃, s̃, ỹ)
=
Φ(t̃, tm−1 , Φ(tm−1 , tm−2 , Φ(. . . Φ(t1 , s̃, ỹ)
= ϕm (t̃, ϕm−1 (ϕm−2 (. . . ϕ2 (ϕ1 (s̃, ỹ)) . . .)))
Wir betrachten beide Seiten der Gleichung als Funktion in ĩ, s̃ und ỹ, also (ĩ, s̃, ỹ) 7→ Rn . Dies
ist eine Verkettung“ von stetigen Funktionen, wobei die Funktionen nicht überall definiert sind.
”
Ist (ĩ, s̃, ỹ) im Definitionsbereich der Verkettung, dann auch in D. Im folgenden sei D(h) der
Definitionsbereich einer Funktion h. Der Definitionsbereich der Verkettung (s̃, ỹ) 7→ ϕ2 (ϕ1 (s̃, ỹ))
ist
D(ϕ1 ) ∩ (ϕ1 )−1 (D(ϕ2 )),
also der Schnitt zweier offener Menge und somit wieder offen. Man zeigt dann induktiv, dass der
Definitionsbereich der Verkettung
(s̃, ỹ) 7→ ϕm−1 (ϕm−2 (. . . ϕ2 (ϕ1 (s̃, ỹ)) . . .)))
die Menge
V := D(ϕ1 ) ∩ (ϕ1 )−1 (D(ϕ2 )) ∩ (ϕ2 ◦ ϕ1 )−1 (D(ϕ3 )) ∩ · · · (ϕm−2 ◦ · · · ◦ ϕ2 ◦ ϕ1 )−1 (D(ϕm−1 )),
als Schnitt offener Mengen offen ist. Und der Definitionsbereich
(t̃, s̃, ỹ) 7→ ϕm (t̃, ϕm−1 (ϕm−2 (. . . ϕ2 (ϕ1 (s̃, ỹ)) . . .)))
19Aber die Formulierung im Zusatz ist noch etwas stärker!
20Diese Beweisskizze wird in der Vorlesung aus Zeitgründen übersprungen.
234
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
ist dann
(R × V ) ∩ ((ϕm−1 ◦ · · · ◦ ϕ2 ◦ ϕ1 ) × idR )−1 D(ϕm ),
2
also auch offen.
KOROLLAR 3.19. Autonomer Fall: Sei U offen in Rn , f : U → Rn , ϕ0 (t) = f (ϕ(t)) und Φ :
D → Rn der zugehörige Fluss. Wir sagen f ist ein vollständiges Vektorfeld, falls D = R × R × U .
Dann ist Φ(t, s, y) = Φ(t + c, s + c, y) und Φ(t, s, • ) : U → U ist ein Homöomorphismus. (Denn
Φ(s, t, • ) : U → U ist die (stetige) Umkehrfunktion.)
2
Leicht zu prüfen.
4. Picard-Lindelöf für gewöhnliche Differentialgleichungen höherer Ordnung
Aus dem Satz von Picard-Lindelöf ergibt sich unmittelbar.
SATZ 4.1. Gegeben sei eine explizite Differentialgleichung k-ter Ordnung
ϕ(k) (t) = f (t, ϕ(t), . . . , ϕk−1 (t))
f : U → Rn stetig und lokal Orts-Lipschitz-stetig21, U ⊂ R×(Rn )k offen. Sei (t0 , ϕ0 , ϕ1 , . . . , ϕk−1 ) ∈
U , dann gibt es genau eine Lösung ϕ mit ϕ(t0 ) = ϕ0 , ϕ0 (t0 ) = ϕ1 , . . . und ϕ(k−1) (t0 ) = ϕk−1 .
7.7.2014
5. Differentialgleichungen mit getrennten Variablen
Definition 5.1. Gegeben seien offene Intervalle I und J, und g : I → R und h : J → R stetig.
Eine Differentialgleichung der Form
ϕ0 (t) = g(t)h(ϕ(t))
nennt man eine gewöhnliche Differentialgleichung mit getrennten Variablen 22. Kurzschreibweise
ϕ0 = g(t)h(ϕ).
(5.2)
Picard-Lindelöf nicht anwendbar, da
f (t, x) = g(t)h(x)
im allgemeinen
23
nicht Orts-Lipschitz-stetig ist.
Schmutzige Rechnung (streng mathematisch nicht gerechtfertigt, aber in der Praxis oft erfolgreich)
21Das heißt: Lipschitz-stetig in allen Komponenten (außer der t-Komponente), und die Lipschitz-Konstante
kann stetig in t gewählt werden.
22oder auch mit getrennten Veränderlichen“, da eine Variable dasselbe wie eine Veränderliche ist.
”
23 im allgemeinen“
heißt hier: es gibt Funktionen g und h, so dass dies nicht erfüllt ist. Beispiel g(t) = 1,
”√
3
h(x) = x.
5. DIFFERENTIALGLEICHUNGEN MIT GETRENNTEN VARIABLEN
dϕ
dt
dϕ
⇐⇒
h(ϕ)
Z
dϕ
⇐⇒
h(ϕ)
=
g(t)h(ϕ)
=
g(t) dt
Z
c + g(t) dt
=
235
Ist nun H eine Stammfunktion von 1/h und G eine Stammfunktion von g, dann sollte es eine
Konstante c ∈ R geben mit
H(ϕ(t)) = c + G(t),
−1
also ϕ(t) = H (c + G(t)).
Bestimme nun c so, dass Anfangsdaten erfüllt sind.
Jetzt eine exakte Herleitung:
SATZ 5.3 (Trennung der Variablen). Gegeben sei eine gewöhnliche Differentialgleichung mit getrennten Variablen wie in Definition 5.1, h(x) 6= 0 auf J. Sei t0 ∈ I, x0 ∈ J. Die Stammfunktion
von t 7→ g(t) sei G : I → R und die von t 7→ 1/h(x) sei H : J → R. Dann gibt es bis auf Restriktion
genau eine stetig differenzierbare Lösung von
ϕ0 = g(t)h(ϕ)
ϕ(t0 ) = x0 ,
die auf einer offenen Umgebung von t0 definiert ist, nämlich
(5.4)
ϕ(t) = H −1 (G(t) + H(x0 ) − G(t0 )).
Beweis. Offensichtlich ist t 7→ 1/h(x) stetig. Also existiert H, ist stetig differenzierbar und monoton. Somit ist K := H(J) ein offenes Intervall und H −1 : K → J existiert und ist C 1 . Wegen
G ∈ C 1 (I, R) ist die in Gleichung (5.4) definierte Funktion ϕ auf der offenen Menge
{t ∈ I | G(t) + H(x0 ) − G(t0 ) ∈ K} 3 t0
1
in C . Man rechnet leicht nach, dass ϕ eine Lösung von (5.2) mit ϕ(t0 ) = x0 ist.
Nehmen wir, dass ϕ eine Lösung von (5.2) mit ϕ(t0 ) = x0 ist. Dann
g(t) =
ϕ0 (t)
d
=
(H(ϕ(t)) ,
h(ϕ(t))
dt
also ist G(t) − H(ϕ(t)) eine Konstante, nämlich G(t0 ) − H(x0 ). Und dies ergibt (5.4).
Beispiele: Letzte Zentralübung ϕ0 = a(t)ϕ, ϕ0 = π( 21 t3 + 41 t)(4 + ϕ2 ). Nächste Zentralübung.
Übungsblatt.
Beispiel 5.5. g : R → R, g(t) = 1. h : R r {0} → R, h(x) = −x2 6= 0. Die Differentialgleichung
ϕ0 (t) = −ϕ(t)2
236
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
besitzt unter anderem die Lösung ϕ ≡ 0. Jede andere Lösung wird nie Null (Eindeutigkeit in
Picard-Lindelöf). Im Fall ϕ 6≡ 0 können wir umformulieren in
ϕ0 (t)
=1
ϕ(t)2
d 1
⇐⇒
=1
dt ϕ(t)
1
⇐⇒
=t+c
ϕ(t)
1
⇐⇒ ϕ(t) =
t+c
−
Beim Anfangswert ϕ(0) = α < 0 bekommen wir c = 1/α und das maximale Lösungs-Intervall
ist (−∞; 1/|α|). Die Lösung hört also bei 1/|α| auf zu existieren. Wir werden sehen, dass dieses
Phänomen bei den nun folgenden linearen Gleichungen nie auftreten kann.
6. Lineare gewöhnliche Differentialgleichungen
Definition 6.1. Sei I ein offenes Intervall, n ∈ N. Gegeben seien stetige Abbildungen
A0 , A1 , . . . , Ak−1 : I → Rn×n
und b : I → Rn . Eine Gleichung der Form
(6.2)
ϕ(k) (t) = Ak−1 (t)ϕ(k−1) (t) + . . . A1 (t)ϕ0 (t) + A0 (t)ϕ(t) + b(t)
nennt man eine explizite lineare gewöhnliche Differentialgleichung k-ter Ordnung; und eine Lösung
ist ein ϕ ∈ C k (J, Rn ), J ein offenes Intervall in I, so dass (6.2) für alle t ∈ J gilt. Man nennt (6.2)
homogen, falls b ≡ 0, sonst ist es inhomogen.
Reduktion auf Ordnung 1 (Wiederholung/Spezialfall)


ϕ(t)
 ϕ0 (t) 


Schreiben wir Φ(t) = 
 ∈ Rnk .
..


.
ϕ(k−1) (t))
Ist ϕ eine Lösung von (6.2), so erfüllt das oben definierte Φ die Gleichung




0
11n
0
···
0
0
 0
 0 
0
11n
···
0 




 ..

 . 
.
.
0
..
..
(6.3)
Φ (t) =  .
 Φ(t) +  ..  .




 0
 0 
0
0
···
11n 
A0 (t) A1 (t) A2 (t) · · · Ak−1 (t)
b(t)
6. LINEARE GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
237
Umgekehrt: ist Φ eine Lösung von (6.3), dann bilden die ersten n-Komponenten von Φ eine Lösung
von (6.2). Es reicht also, sich auf Gleichungen erster Ordnung einzuschränken.
Ab jetzt k = 1, d.h.
ϕ0 (t) = A(t)ϕ(t) + b(t)
(6.4)
kurz: ϕ0 = Aϕ + b
Das Wort Lösung“ benutzen wir in diesem Abschnitt immer im Sinn stetig differenzierbare
”
”
Lösung“.
SATZ 6.5. Sei J 6= ∅ ein offenes Teil-Intervall von I. Eine Lösung ϕ : J → Rn lässt sich zu einer
auf I definierten Lösung fortsetzen.
Beweis später.
Eine Möglichkeit, diesen Satz zu zeigen, ist, geeignete Abschätzungen zu machen und dann Proposition 3.15 zu verwenden. Siehe zum Beispiel [20], Abschnitt 4.3 und die Vorarbeiten zuvor.
Wir wollen einen anderen Weg beschreiten und werden sehen, dass wir bald den Satz ohne Rechenaufwand zeigen können. Unser Weg hat auch den Vorteil, dass wir dann nicht Bemerkung 3.14
nutzen, deren Beweis nur skizziert wurde.
Da wir in den folgenden Zeilen den Satz noch nicht nutzen können, müssen wir alle nun folgenden
Aussagen so formulieren, dass wir keine Probleme erhalten, falls eine Lösung nicht auf ganz I
definierbar sein sollte. Sobald dann aber Satz 6.5 gezeigt ist, können wir davon ausgehen, dass
dann alle Lösungen zu Lösungen I → Rn erweitert werden können.
Die zu (6.4) gehörende homogene Differentialgeleichung ist:
ϕ0 (t) = A(t)ϕ(t)
(6.6)
LEMMA 6.7. Sei J ein offenes Teil-Intervall von I.
(1) Sei ϕ̂ eine auf J definierte Lösungen der inhomogenen Gleichung (6.4). Dann gilt
ϕ̃ ist eine auf J definierte Lösung der homogenen Gleichung (6.6)
⇐⇒
ϕ̂ + ϕ̃ ist eine auf J definierte Lösung der inhomogenen Gleichung (6.4)
(2) Die auf J definierten Lösungen von (6.6) bilden einen Untervektorraum von C 1 (J, Rn ). Wir
nennen ihn LJ .
Beweis. Nachrechnen.
2
LEMMA 6.8. Zu jedem t0 ∈ I gibt es ein > 0, so dass gilt: zu jedem v ∈ Rn existiert genau eine
auf (t0 − ; t0 + ) definierte Lösung ϕ von (6.4) mit ϕ(t0 ) = v.
Beweis. Nach Picard-Lindelöf gibt es Zahlen ˆ > 0, 1 > 0,. . . , n > 0 und folgende Lösungen:
• Eine C 1 -Funktion ϕ̂ : (t0 − ˜; t0 + ˜) → Rn mit ϕ̂0 = Aϕ̂ + b, ϕ̂(t0 ) = 0.
238
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
• Für i ∈ {1, . . . , n}: C 1 -Funktionen ϕi : (t0 − i ; t0 + i ) → Rn mit ϕ0i = Aϕi , ϕi (t0 ) = ei .
Setze nun := min{˜
, 1 , . . . , n } > 0.
Zu jedem v = (v1 , . . . , vn )T ∈ Rn ist
ϕ := ϕ̃ +
n
X
v i ϕi
i=1
eine auf (t0 − ; t0 + ) definierte Lösung von
ϕ0 = Aϕ + b,
ϕ(t0 ) = v.
nach der Eindeutigkeitsaussage in Picard-Lindelöf ist dies die einzige Lösung.
2
Insbesondere ist die Auswertungsabbildung
ιt0 : L(t0 −;t0 +) → Rn ,
ϕ 7→ ϕ(t0 )
ein Isomorphismus (von Vektorräumen) und
dim L(t0 −;t0 +) = n.
Sind J1 , J2 Intervalle mit ∅ =
6 J1 ⊂ J2 ⊂ I, dann ist wegen der Eindeutigkeitsaussage im Satz von
Picard-Lindelöf (bzw. der daraus gefolgerten Aussage Lemma 3.13 (2)) die Restriktionsabbildung
LJ2 → LJ1 ,
24
injektiv.
(6.9)
ϕ 7→ ϕ|J1
Also
dim LJ2 ≤ dim LJ1 ≤ n.
Beweis des Satzes. Sei ϕ : (t1 ; t2 ) → Rn eine Lösung von (6.4), (t1 ; t2 ) ⊂ I.
Im Fall t2 ∈ I, werden wir zeigen, dass sich die Lösung auf ein größeres offenes Intervall fortsetzt,
das t2 enthält. Analoges gilt für t1 ∈ I. Wenn also (t1 ; t2 ) das maximale Lösungs-Intervall ist, so
muss (t1 ; t2 ) = I gelten.
Sei also t2 ∈ I. Bestimme > 0 und ϕ̃ wie im Beweis des letzten Lemmas für t0 := t2 . Dann ist
ϕ|(t2 −;t2 ) − ϕ̃|(t2 −;t2 ) ∈ L(t2 −;t2 ) .
Wegen den obigen Überlegungen (6.9) gilt
n = dim L(t2 −;t2 +) ≤ dim L(t2 −;t2 ) ≤ n.
Also gilt überall =“ und die Restriktion L(t2 −;t2 +) → L(t2 −;t2 ) ist surjektiv. Es gibt also ein
”
ψ ∈ L(t2 −;t2 +) , mit
ψ|(t2 −;t2 ) = ϕ|(t2 −;t2 ) − ϕ̃|(t2 −;t2 ) .
24Sobald der Satz gezeigt ist, steht hier überall =“.
”
6. LINEARE GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
239
Somit ist
(
ϕ(t)
t ∈ (t1 ; t2 )
ϕ̂(t) :=
ϕ̃(t) + ψ(t) t ∈ [t2 , t2 + )
eine stetig differenzierbare Lösung von ϕ0 = Aϕ + b, die auf (t1 ; t2 + ) definiert ist. Nach den
Ausführungen zu Beginn des Beweises folgt daraus der Satz.
2
FOLGERUNG 6.10.
{Auf I definierte Lösungen von ϕ0 = Aϕ + b} → Rn ,
ϕ 7→ ϕ(t0 )
ist bijektiv und dim LI = n.
FOLGERUNG 6.11. Gegeben seien ϕ1 , . . . , ϕn ∈ LI , t0 ∈ I. Dann gilt
(ϕ1 , . . . , ϕn ) ist Basis von LI
⇐⇒
det(ϕ1 (t0 ), . . . , ϕn (t0 )) 6= 0.
Diese Determinante nennt man Wronski-Determinante. Sie ist hilfreich, um zu prüfen, ob man
schon alle Lösungen der homogenen DGl gefunden hat.
Falls es eine Basis ist, so nennt man Φ = (ϕ1 , . . . , ϕn ) : I → Rn×n eine Fundamentallösung von
ϕ0 = Aϕ.
Lösungs-Strategie zur Lösung von (6.4)
1.) Bestimme die Menge aller Lösungen der homogenen DGl.
2.) Dann finde eine Lösung der inhomogenen DGl.
Mit Hilfe von Lemma 6.7 erhalten wir dann alle Lösungen der inhomogenen DGl.
Wie erhält man alle Lösungen der homogenen DGl?
n = 1: getrennte Variable
d
log |ϕ(t)| = A(t)
dt
Z t
ϕ(t) = C exp
A(τ ) dτ .
ϕ0 = Aϕ
⇐⇒
t0
Alle Lösungen sind von dieser Form mit C ∈ R.
n > 1: im allgemeinen häufig schwer lösbar.
Spezialfall: A konstant. O.B.d.A. I = R.
Dann ist die Menge der Lösungen ϕ0 = Aϕ
{t 7→ ϕ(t) = exp(At)ϕ0 | ϕ0 ∈ Rn }
240
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Hierbei ist
∞
X
1 j j
A t ∈ Rn×n .
j!
j=0
exp(At) :=
Diese Reihe konvergiert absolut: wir rechnen kABk∞ ≤ nkAk∞ kbk∞ , kAj k∞ ≤ nj−1 kAkj∞
1 j j
A t ≤ 1 nj−1 kAkj∞ |t|j := aj
j!
j!
∞
aj
n
= kAk∞ |t| → 0.
aj−1
j
d
exp(tA) = A exp(tA) = exp(tA)A.
dt
Φ(t) := exp(At) ist eine Fundamentallösung.
!ACHTUNG!. exp(A + B) = exp(A) exp(B) gilt, falls AB = BA. Sonst Gegenbeispiele.
9.7.2014
Wie erhält man eine Lösung der inhomogenen DGl?
PROPOSITION 6.12 (Variation der Konstanten). A ∈ C 0 (I, Rn×n ), b ∈ C 0 (I, Rn ), t0 ∈ I. Sei
Φ : I → Rn×n eine Fundamentallösung von ϕ0 (t) = A(t)ϕ(t). Dann ist
Z t
t 7→ Φ(t)
Φ(τ )−1 b(τ ) dτ
t0
0
eine Lösung von ϕ (t) = A(t)ϕ(t) + b(t).
Beweis.
d
dt
=
Z t
Φ(t)
Φ(τ )−1 b(τ ) dτ
Φ0 (t)
t0
Z
t
Φ(τ )−1 b(τ ) dτ + Φ(t)Φ(t)−1 b(t)
t0
Z
=
t
A(t)Φ(t)
Φ(τ )−1 b(τ ) dτ + b(t)
t0
Z t
= A(t) Φ(t)
Φ(τ )−1 b(τ ) dτ + b(t)
t0
2
8. STABILITÄT UND VERHALTEN IN DER NÄHE VON KRITISCHEN PUNKTEN
241
7. Einige Beispiele von linearen gewöhnlichen DGln
Flüsse von Vektorfelder und deren Integralkurven können auch gut durch ein Phasenportrait dargestellt werden.
Beispiele 7.1.
−2 0
(1) Phasenportrait von ϕ0 (t) =
ϕ(t).
0 −1
−2t
e
0
Lösungen: ϕ(t) =
ϕ0 , ϕ0 ∈ R2 .
0
e−t
BILD
1 0
(2) Phasenportrait von ϕ0 (t) =
ϕ(t).
0 1
t
e
0
Lösungen: ϕ(t) =
ϕ0 , ϕ0 ∈ R2 .
0 et
BILD
−2 0
0
(3) Phasenportrait von ϕ (t) =
ϕ(t).
−2t 0 1
e
0
Lösungen: ϕ(t) =
ϕ0 , ϕ0 ∈ R2 .
0
et
BILD
0 1
(4) Phasenportrait von ϕ0 (t) =
ϕ(t).
−1 0 cos t sin t
Lösungen: ϕ(t) =
ϕ0 , ϕ0 ∈ R2 .
− sin t cos t
BILD
8. Stabilität und Verhalten in der Nähe von kritischen Punkten
In diesem Abschnitt wollen wir auf einige Beweise verzichten. In der Darstellung halten wir uns
eng an [20], Abschnitt 4.5 und an [29], Kapitel VII. In diesen beiden Büchern findet man auch die
fehlenden Beweise.
Im ganzen Abschnitt sei U eine offene Teilmenge von Rn und v : U → Rn ein stetig differenzierbares
Vektorfeld.
Definition 8.1. x0 ∈ U heißt kritischer Punkt von v, falls v(x0 ) = 0. Einen kritischen Punkt x0
nennen wir stabil , falls für jede Umgebung V ⊂ U von x0 eine offene Umgebung W ⊂ V von x0
gibt, so dass jede Integralkurve ϕ von v mit ϕ(0) ∈ W auf [0; ∞) definiert werden kann, und so
dass ϕ([0; ∞)) ⊂ V . Ein kritischer Punkt x0 wird Attraktor genannt, falls er stabil ist und falls
das obige W so gewählt werden kann, dass für alle Integralkurven ϕ von v mit ϕ(0) ∈ W gilt
limt→∞ ϕ(t) = x0 .
242
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
25
Beispiele 8.2. Wir setzen die Beispiele 7.1 fort.
(1) In diesem Beispiel ist 0 ein Attraktor zum Vektorfeld
−2 0
v : x 7→
x
0 −1
0 ist kein stabiler Punkt zum Vektorfeld −v.
(2) In diesem Beispiel ist 0 kein stabiler Punkt zum
1
v : x 7→
0
Vektorfeld
0
x
1
0 ist Attraktor zum Vektorfeld −v.
(3) In diesem Beispiel ist 0 kein stabiler Punkt zum Vektorfeld
−2 0
v : x 7→
x
0 1
0 ist auch kein stabiler Punkt zum Vektorfeld −v.
(4) In diesem Beispiel ist 0 stabiler Punkt zum Vektorfeld
0 1
v : x 7→
x
−1 0
0 ist auch stabiler Punkt zum Vektorfeld −v. Aber weder Attraktor zu v noch Attraktor zu
−v.
Allgemein: 0 ist Attraktor, genau dann, wenn jeder Eigenwert von A einen negativen Realteil hat.
26
Beispiel 8.3. (aus [20])
Sei v : R → R, v(x) = −xk , k ∈ N. Der einzige kritische Punkt ist 0. Mit Trennung der Variablen
sieht man, dass ϕ0 = v(ϕ) für ϕ =
6 0 äquivalent zu
1
d
=1
dt (k − 1)ϕ(t)k−1
25Man beachte, dass die hier verwendete Definition nicht ganz mit der in [20] verwendeten übereinstimmt.
Wir haben Stabilität in die Definition des Attraktors hineingenommen, und sind damit in Übereinstimmung mit
dem Großteil der fortgeschrittenen Literatur in diesem Gebiet. Der unten zitierte Beweis des Satzes von PoincaréLjapunow in [20] zeigt aber sogar unsere (stärkere) Version des Attraktors.
26Hier wäre eigentlich ein Beweis nötig, zu dem wir keine zeit mehr haben: Falls A diagonalisierbar ist, dann ist
jede Lösung eine Linearkombination von Lösungen der Form etλ0 ϕ0 , mit Aϕ= λ0 ϕ0 . Wenn A nicht diagonalisierbar
ist, ist die Argumentation ähnlich.
8. STABILITÄT UND VERHALTEN IN DER NÄHE VON KRITISCHEN PUNKTEN
243
ist, falls k > 1. Für k = 1 ähnlich mit Logarithmus. Mit Standard-Umformungen erhält man mit
Anfangswert ϕ(0) = x0
( −t
x0 e
k=1
ϕ(t) =
x0
√
k>1
k−1
k−1
1+(k−1)x0
t)
Für x0 > 0 oder k ungerade, existiert die Lösung für alle t ∈ [0; ∞) und sie konvergiert gegen 0.
Für k gerade und x0 < 0 existiert die Lösung nur endlich lange. Deswegen ist 0 ein Attraktor, falls
k ungerade, und 0 ist nicht einmal stabil, falls k gerade ist.
BIlD
Definition 8.4. Die Linearisierung von v in x0 ∈ U ist die Abbildung Dx0 v : Rn → Rn , x 7→
v 0 (x0 )x.
Idee der folgenden Resultate: die Flusslinien (= Integralkurven) des Vektorfelds v sehen ähnlich“
”
aus wie wie Flusslinien der Linearisierung. Das Phasenportrait in einer kleinen Umgebung des
kritischen Punkt ist eine verbogene“ Version des Phasenportraits der Linearisierung.
”
THEOREM 8.5 (Poincaré-Ljapunow). Sei x0 ein kritischer Punkt von des C 1 -Vektorfelds v : U →
Rn . Für jeden komplexen Eigenwert λ der Matrix v 0 (x0 ) gelte Re λ < 0. Dann ist x0 ein Attraktor.
2
Beweis. Siehe [20], Abschnitt 4.5.
Definition 8.6. Eine Ljapunow-Funktion zum C 1 -Vektorfeld v : U → Rn und zum kritischen
Punkt x0 ist eine C 1 -Funktion L : U → R, so dass 27
• L(x0 ) = 0
• L(x) > 0, falls x ∈ U r {x0 }
• Für alle x ∈ U gilt: ∂x,v(x) L ≤ 0. Oder es gilt für alle x ∈ U : ∂x,v(x) L ≥ 0
Beispiel: Ist E eine Erhaltungsgröße, die in x0 ein absolutes Minimum hat, so ist E − E(x0 ) eine
Ljapunow-Funktion.
Konsequenz: Ist ϕ eine Flusslinie von v, dann gilt
d
L(ϕ(t)) = L0 (ϕ(t))ϕ0 (t) = ∂ϕ(t),v(ϕ(t)) L ≤ 0
dt
THEOREM 8.7 (Ljapunow). Sei v, x0 und L wie oben.
bzw. ≥ 0
(a) Falls ∀x ∈ U : ∂x,v(x) L ≤ 0, dann ist x0 ein stabiler Punkt.
(b) Falls ∀x ∈ U r {x0 } : ∂x,v(x) L < 0, dann ist x0 ein Attraktor
(c) Falls ∀x ∈ U r {x0 } : ∂x,v(x) L > 0, dann ist x0 kein stabiler Punkt.
Beweis. Siehe [20], Abschnitt 4.5.
27Im folgenden ist ∂
x,v f wieder die Richtungsableitung von f im Punkt x in Richtung v.
2
244
9. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN
Beispiel 8.8. Die Liénardsche Gleichung, siehe [20], Ende Abschnitt 4.5.
THEOREM 8.9 (Linearisierungssatz von Grobman und Hartman, 1959–1960). Sei x0 ein kritischer Punkt eines glatten Vektorfelds v : U → Rn . Wir nehmen an, dass für jeden Eigenwert λ
von v 0 (x0 ) gilt: Reλ 6= 0. Sei Dx0 v : Rn → Rn die Linearisierung von v in x0 . Dann gibt es eine
offene Umgebung V von x0 in U , eine offene Umgebung W von 0 und einen Homöomorphismus
h : V → W , h(x0 ) = 0, so dass gilt
ϕ : (a; b) → V ist Flusslinie zu v
⇐⇒
h ◦ ϕ : (a; b) → W ist Flusslinie zu Dx0 v
Der Homöomorphismus h bildet Flusslinien auf Flusslinien ab. Die Flusslinien der Linearisierung
sind die Abbildungen t 7→ eAt ϕ0 mit ϕ0 ∈ Rn , A := v 0 (x0 ).
Wir bekommen also
ϕ(t) = h−1 (eAt h(ϕ(0)))
vorausgesetzt wir sind nahe genug“ bei x0 .
”
Wenn man das Theorem von Grobman und Hartman liest, so stellt sich die Frage, ob man nicht
das Wort Homöomorphismus“ durch C k -Diffeomorphismus“ ersetzen kann, sobald v genügend
”
”
oft differenzierbar ist.
Man kann zeigen (siehe Abschnitt 2.9 von [24] für mehr Details):
• Ist v ∈ C 2 , so kann gibt es einen C 1 -Diffeomorphismus h mit den obigen Eigenschaften.
• Es gibt Vektorfelder v ∈ C ∞ , für die es keinen C 2 -Diffeomorphismus h mit den obigen
Eigenschaften gibt
ANHANG A
Anhänge
Überblick über algebraische Strukturen
(Aa) Addition ist assoziativ.
Für alle x, y, z ∈ X gilt
(x + y) + z = x + (y + z).
(An) Addition hat neutrales Element.
Es gibt ein Element 0 ∈ X, so dass für alle x ∈ X gilt
x + 0 = 0 + x = x.
Man nennt 0 das neutrale Element der Addition.
(Ai) Addition hat inverse Elemente.
Zu jedem x ∈ X gibt es ein y ∈ X, so dass
x + y = y + x = 0.
Man nennt y das Inverse von x bezüglich der Addition und schreibt normalerweise −x
anstelle von y.
(Ak) Addition ist kommutativ.
Für alle x, y ∈ X gilt
x + y = y + x.
(Ma) Multiplikation ist assoziativ.
Für alle x, y, z ∈ X gilt
(x · y) · z = x · (y · z).
(Mn) Multiplikation hat neutrales Element.
Es gibt ein Element 1 ∈ X, so dass für alle x ∈ X gilt
x · 1 = 1 · x = x.
Man nennt 1 das neutrale Element der Multiplikation.
(Mi) Multiplikation hat inverse Elemente.
Zu jedem x ∈ X r {0} gibt es ein y ∈ X, so dass
x · y = y · x = 1.
245
246
A. ANHÄNGE
Man nennt y das Inverse von x bezüglich der Multiplikation und schreibt normalerweise
x−1 anstelle von y.
(Mk) Multiplikation ist kommutativ.
Für alle x, y ∈ X gilt
x · y = y · x.
(AMd) Addition und Multiplikation erfüllen das Distributionsgesetz.
Für alle x, y, z ∈ X gilt
x · (y + z) = x · y + x · z
(y + z) · x = y · x + z · x
Literaturverzeichnis
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
H. Amann, J. Escher, Analysis I, Birkhäuser
H. Amann, J. Escher, Analysis II, Birkhäuser
H. Amann, J. Escher, Analysis III, Birkhäuser
H. Amann, DGLn???
M. Barner, F. Flohr, Analysis I, de Gruyter
M. Barner, F. Flohr, Analysis II, de Gruyter
T. Bröcker, Analysis I, Spektrum
T. Bröcker, Analysis II, BI Wissenschaftsverlag
E. A. Coddington, N. Levinson, Theory of ordinary differential equations, McGraw Hill
O. Deiser, Einführung in die Mengenlehre, Springer
H.D. Ebbinghaus, Einführung in die Mengenlehre, BI Wissenschaftsverlag
O. Forster, Analysis 1, Vieweg Studium
O. Forster, Analysis 2, Vieweg Studium
O. Forster, Analysis 3, Vieweg Studium
U. Friedrichsdorf, A. Prestel, Mengenlehre für den Mathematiker, Vieweg Studium
D. Grieser, Vorlesungsskript Analysis I, Universität Oldenburg
P. R. Halmos, Naive Mengenlehre, Vandenhoeck und Ruprecht
S. Hildebrandt, Analysis I, Springer
K. Königsberger, Analysis 1, Springer
K. Königsberger, Analysis 2, Springer
C. Löh, Vorlesungsskript Analysis I, Universität Regensburg
C. Löh, Vorlesungsskript Analysis II, Universität Regensburg
A. Peyerimhoff, Gewöhnliche Differentialgleichungen I und II, Akademische Verlagsgesellschaft Wiesbaden
L. Perko, Differential equations and dynamical systems, Third edition, Springer
B. v. Querenburg, Mengentheoretische Topologie, Springer
L. A. Steen, J. A. Seebach, Counterexamples in Topology
W. Walter, Analysis 1, Springer
W. Walter, Analysis 2, Springer
W. Walter, Gewöhnliche Differentialgleichungen, Springer
247
Stichworte
C ` -Diffeomorphismus, 204
n-dimensionale Sphäre, 207
(M -wertige) Folge, 55
Äquivalenzklasse, 63
Äquivalenzrelation, 23
äquivalent, 11, 12
äquivalente Normen, 156
beschränkt im normierten Raum, 156
Betragsfunktion, 49
Betragsfunktion der komplexen Zahlen, 74
bijektiv, 26
Bild, 27
Bild der Relation, 24
Bolzano-Weierstraß, Satz von, 71
Abbildung, 24
abgeschlossen, 111
abgeschlossene Hülle, 161
Ableitung, 123, 179
Abschluss, 161
Absolutbetrag, 49
absolute Konvergenz, 87
abzählbar, 168
Addition, 39
Allquantor, 17
alternierende Reihe, 88
Anfangswert, 224
antisymmetrisch, 23
archimedisch, 48
arithmetisches Mittel, 49
Attraktor, 241
auf Y induzierte Topologie, 160
Aussage, 9
Aussageform, 15
Aussagenlogische Verknüpfung, 10
Aussagenlogische Formel, 11
Aussonderungsmengenaxiom, 32
Auswahlaxiom, 32
autonom, 219
Axiome der Mengenlehre, 31
Axiome der reellen Zahlen, 53
Cauchy-Folge, 58
Cauchy-Folge in einem metrischen Raum, 158
Cauchy-Produkt, 95
Cauchysche Restglieddarstellung, 132
Definitheit der Norm, 155
Definitionsbereich, 24
Dezimal-Darstellung, 79
dicht, 68, 162
Diffeomorphismus, 204
Differential, 179
Differenzenquotient, 123
differenzierbar, 123, 179
disjunkt, 17
diskrete Topologie, 160
Divergenz von Folgen, 56
Dreiecksungleichung der Norm, 155
Einschränkung, 26
endlich, 51
endliche Teilüberdeckung, 170
Entwicklungspunkt, 132
Erhaltungsgröße, 222
Ersetzungsaxiom., 32
erstes Integral, 222
erweiterten reellen Zahlen, 69
euklidischen Abstand, 110
Eulersche Zahl, 100
Existenzquantor, 17
explizite lineare gewöhnliche Differentialgleichung,
236
Ball , 111
Banach-Raum, 159
beschränkt, 51, 56
249
250
Exponentialfunktion, 96
Exponentialreihe, 96
Extensionalität, 32
Fakultät, 39
fast alle, 61
Fluss, 232
Flusslinie, 222
Folge in K, 79
Folge von Funktionen, 116
folgenkompakt, 165
folgenstetig, 105
Fundamentalsatz der Algebra, 76
Fundierungsaxiom, 32
Funktion, reell-wertige, 24
Funktionalgleichung der Exponentialfunktion, 96
Gödelscher Unvollständigkeitssatz, erster, 33
Gödelscher Unvollständigkeitssatz, zweiter, 33
ganze Zahlen, 43
Gaußschen Zahlenebene, 73
Gebiet, 189
geometrische Reihe, 82
geometrisches Mittel, 49
geordneter Körper, 46
gewöhnliche Differentialgleichung, 219
gewöhnliche Differentialgleichung mit getrennten
Variablen, 234
gleichmäßig stetig, 173
gleichmäßig stetig auf [a; b], 145
Grad des Polynoms, 48
Graph, 24
Grenzwert der Folge, 56
Grenzwert von Funktionen, 115
Häufungspunkt, 168, 169
Häufungspunkt der Folge, 70
Häufungspunkt einer Menge, 114
harmonische alternierende Reihe, 89
harmonische Reihe, 83
Hauptsatz der Differential- und Integralrechnung,
146
Hausdorff-Eigenschaft, 160
Hausdorff-Raum, 160
Heine-Borel-Eigenschaft, 170
Hesse-Matrix, 190
Hilbert-Raum, 159
homöomorph, 173
Homöomorphismus, 173
homogen, 236
Homogenität der Norm, 155
STICHWORTE
Homomorphismus von Ringen mit Eins, 65
Identität, 25
imaginär, 73
Imaginärteil, 73
implizit definierte, 206
indefinit, 195
indiskrete Topologie, 161
Induktionsanfang, 37
Induktionsaxiom, 35
Induktionsschritt, 37
Induktionsvoraussetzung, 37
induktiv, 32, 36
induzierte Metrik, 110, 158
Infimum, 51
inhomogen, 236
injektiv, 26
Inklusion, 25
Innere, 161
inneren Kern, 161
Integralkurve, 222
Intervalle, 69
Isometrie, 111
isomorph (als Ring), 45
Isomorphismus von Ringen, 45
Jacobi-Matrix, 184
k-mal stetig differenzierbar, 130
Körper, 46
Körper der rationalen Funktionen, 48
kanonische Projektion, 64
Klassen, 31
Klumpentopologie, 161
kommutativen Ring, 44
kompakt, 170
Komplement, 17
komplexe Exponentialfunktion, 96
komplexe Konjugation, 74
komplexe Zahlen, 73
Komponente, 30
Komposition, 26
Komprehension, 32
Kontraktion, 175
Konvergenz von Folgen, 56
Konvergenzradius, 86
konvergiert, 113
konvergiert absolut, 87
konvergiert gegen −∞, 72
konvergiert gegen unendlich, 71
konvergiert gleichmäßig, 117
STICHWORTE
konvergiert punktweise, 116
Kosinus, 98
Kreiszahl π, 122
kritischen Punkt, 198
kritischer Punkt, 241
Lösung, 219
Lösungsintervall, 219
Lagrange-Multiplikatoren, 214
Lagrangesche Restglieddarstellung, 131
Lebesguesche Zahl, 174
leere Menge, 15
Leitkoeffizient, 75
Limes inferior, 69
Limes superior, 70
Linearisierung, 243
linksseitige Grenzwert oder Limes, 115
Lipschitz-Konstante, 223
Ljapunow-Funktion, 243
Logarithmus, 120
lokal Orts-Lipschitz-stetig, 223
lokal umkehrbar, 200
lokales Extremum, 127, 197
lokales Maximum, 127, 197
lokales Maximum oder Minimum, 127, 197
lokales Minimum, 127, 197
lokalkonstant, 188
Majorante, 83
Majoranten-Kriterium, 83
maximale Lösungs-Intervall, 228, 230
Maximum, 42
Menge, 14
Menge der natürlichen Zahlen, 41
Mengensystem, 20
Metrik, 110
metrischer Raum, 110, 158
Minimum, 42
Modell der natürlichen Zahlen, 35
Modell der reellen Zahlen, 53
monoton, 68
Multiplikation, 39
nach oben beschränkt, 51
nach unten beschränkt, 51
Nachfolger-Abbildung, 35
Natürliche Zahlen, 8
Negation, 10
negativ definit, 195
negativ semi-definit, 195
nicht zusammenhängend, 163
normierte Polynome, 75
normierten Vektorraum, 155
Nullfolgen, 56
obere Schranke, 51
Oberintegral, 140
offen, 111
offene Überdeckung, 170
offene Menge in (X, O), 160
Ordnung(srelation), 23
Ordnung, (total), 23
Orts-Lipschitz-stetig, 223
Paar, (geordnetes), 20
Paarmengenaxiom, 32
Partialsumme, 82
partiell differenzierbar, 181
partielle Ableitung, 181
partielle Differentialgleichung, 220
Peano-Axiome, 35
Polynome, 75
positiv definit, 195
positiv semi-definit, 195
Potenzieren, 39
Potenzmenge, 19
Potenzmengenaxiom, 32
Potenzreihe in x, 85
Produkt, (kartesisches), 20
Produkt, (kartesisches,) von Mengenfamilien, 29
Produktregel, 125
Produktreihe, 94
Produktreihensatz, 94
Quadrupel, 22
Quotienten-Kriterium, 84
Quotientenregel, 125
Rand, 162
rationale Zahlen, 45
Realteil, 73
rechtsseitige Grenzwert oder Limes, 115
reelle Exponentialfunktion, 96
Reelle Zahlen, 50
reflexiv auf M , 22
regulärer Wert, 208
Reihe, 82
rein imaginär, 73
rekursive Definition, 38
Relation, 22
Relation, funktionale, 24
Repräsentant, 63
251
252
repräsentiert, 63
Restriktion, 26
Richtungsableitung, 181
Riemann-Integral, 141
Riemann-integrierbar, 141
Riemannscher Umordnungssatz, 90
Ring, 44
Ring mit Eins, 44
Russellsche Paradoxon, 30
Satz vom Cauchy-Produkt, 95
Satz von Taylor, 130, 193
Schnitt, 16
singulären Wert, 208
Sinus, 99
Spurtopologie, 160
stabil, 241
stationären Punkt, 198
sternförmig bezüglich x0 ∈ A, 164
stetig, 106, 111, 162
stetig differenzierbar, 129, 183
stetig in x0 , 162
streng monoton, 68
streng monoton wachsend, 57
Summen- und Produktzeichen, 40
Supremum, 51
Supremumseigenschaft, 52
surjektiv, 26
symmetrisch, 23
Tangentialraum, 212
Taylor-Polynom, 132
Taylorreihe, 132
Teilfolge, 57
Teilsumme, 82
tertium non datur, 10
Topologie, 160
topologischer Raum, 160
total differenzierbar, 179
transitiv, 23
Treppenfunktion, 139
Tripel, 22
Umgebung, 111
Umkehrung, 26
Umordnung, 90
uneigentliche Konvergenz, 72
Uneigentliches Riemann-Integral, 152
Unendlichkeitsaxiom, 32
untere Schranke, 51
Unterintegral, 141
STICHWORTE
Untermannigfaltigkeit, 209
Untermannigfaltigkeits-Karte, 210
Urbild, 27
Vektorfeld, 222
Vereinigung, 16
Vereinigungsaxiom, 32
Verkettung, 26
Verknüpfung, 26
Vervollständigung, 64
vollständig, 61, 158
Vollständige Induktion, 37
vollständiges Vektorfeld, 234
Wahrheitstafel, 10
wegzusammenhängend, 164
wohldefiniert, 48
wohlgeordnete Menge, 43
Wohlordnung, 43
Wronski-Determinante, 239
Wurzel-Kriterium, 85
Zerlegung, 139
Zielbereich, 24
Herunterladen