PDF-Datei - Mathematisches Institut

Werbung
Ralf Gerkmann
Mathematisches Institut
Ludwig-Maximilians-Universität München
Vorlesung im Wintersemester 2016/17
Analysis einer Variablen
(Mathematik I für das gymnasiale Lehramt)
(Version vom 10. Februar 2017)
Inhaltsverzeichnis
§ 1.
Elementare Logik und Mengenlehre
............................
3
§ 2.
Relationen und Abbildungen
§ 3.
Die reellen Zahlen
.................................
19
........................................
42
§ 4.
Folgen und Reihen
........................................
76
§ 5.
Stetigkeit
§ 6.
Differenzierbarkeit
§ 7.
Integralrechnung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Literaturverzeichnis
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
§ 1.
Elementare Logik und Mengenlehre
Inhaltsübersicht
In diesem Abschnitt definieren wir zunächst, was unter einer mathematischen Aussage zu verstehen ist. Mit Hilfe von
logischen Symbolen ¬, ∧, ⇒ usw. lassen sich einfache Aussagen zu komplexeren Aussagen zusammensetzen. Die Tautologien bilden eine besonders wichtige Klasse zusammengesetzter Aussagen, weil sie für logische Schlüsse verwendet
werden können. Aus solchen Schlüssen wiederum werden mathematische Beweise aufgebaut.
Fast die gesamte moderne Mathematik basiert auf dem Begriff der Menge. Eine Menge kann durch Aufzählung ihrer
Elemente oder durch eine definierende Bedingung, ein sog. Aussagenschema, beschrieben werden. Mit Hilfe von Aussagenschemata definieren wir auch einige wichtige Mengenoperationen. Außerdem werden mit ihnen quantifizierte
Aussagen gebildet, wie sie bei der Formulierung mathematischer Sätze fast immer vorkommen. Zum Abschluss führen
wir die natürlichen Zahlen ein und besprechen das Prinzip der vollständigen Induktion.
(1.1) Definition Unter einer Aussage verstehen wir einen (sprachlich oder in mathematischer
Notation formulierten) Satz, von dem auf sinnvolle und objektive Weise gesagt werden kann,
dass er wahr oder falsch ist.
Die folgenden Sätze sind zweifellos Aussagen.
(i) Heute ist Mittwoch.
(wahr, jedenfalls am 19.10.2016)
(ii) Der Archaeopteryx war ein flugfähiges Säugetier.
(anscheinend falsch, nach vorherrschender Meinung der Paläontologen)
(iii) 1 + 1 = 2
(wahr)
(iv) Es gibt eine natürliche Zahl, die größer ist als alle anderen natürlichen Zahlen.
(Falsch. Nehmen wir an, n wäre eine natürliche Zahl. Dann müsste n > n + 1 gelten, es gilt aber n < n + 1.)
(v) Die Summe der Innenwinkel eines beliebigen Dreiecks beträgt 180◦ .
(wahr, zumindest in der „normalen“ euklidischen Geometrie)
(vi) Jede differenzierbare Funktion ist stetig.
(wahr)
(vii) Jede gerade Zahl größer als zwei kann als Summe von zwei Primzahlen dargestellt werden.
(Dies ist die sog. Goldbachsche Vermutung. Zur Zeit ist noch unbekannt, ob sie wahr oder falsch ist.)
Dagegen sind die folgenden Sätze mit Sicherheit nicht als Aussagen zu bezeichnen.
(i) Hallo!
(ii) Mach endlich Deine Hausaufgaben!
(iii) 10100 ist eine große Zahl
(iv) Die Kreiszahl π ist ungefähr gleich 3.14.
(v) x 3 − 3x 2 − 3x + 1
(vi) a2 + b2 = c 2
—–
3
—–
Offenbar ist es sinnlos, einer Begrüßung oder einer Aufforderung einen Wahrheitswert zuzuordnen. Die Sätze (iii)
und (iv) sind für eine Aussage nicht hinreichend objektiv. Der Ausdruck (v) ist ein Term (genauer gesagt, ein Polynom), für den die Feststellung wahr oder falsch ebenfalls keinen Sinn macht.
Satz (vi) ist für sich genommen keine Aussage, solange den Symbolen a, b und c keine Bedeutung zugeordnet wird.
Legt man fest, dass a = 3, b = 4 und c = 5 sein soll, erhält man eine wahre Aussage, denn es gilt 32 + 42 =
9 + 16 = 25 = 52 . Für viele andere Belegungen von a, b, c (zum Beispiel a = 1, b = 2, c = 3) erhält man dagegen
eine falsche Aussage. Legt man fest, dass a, b, c Seitenlängen eines rechtwinkligen Dreiecks sein sollen, wobei c der
längsten Seite zugeordnet ist, dann erhält man wiederum eine wahre Aussage. Einer der häufigsten Fehler bei der
Formulierung mathematischer Aussagen besteht darin, dass Bezeichnungen (wie hier a, b, c) verwendet werden, die
zuvor nicht definiert wurden!
Einfache Aussagen können umgangssprachlich, zum Beispiel durch Bindewörter wie „und“, „oder“, oder auch durch
bestimmte Symbole (∨, ∧) zu komplexeren Aussagen verknüpft werden. Der Wahrheitswert der neuen Aussage
ist dann durch die Wahrheitswerte der verknüpften Aussagen festgelegt. Wie diese Festlegung im einzelnen aussieht, kann am einfachsten durch sog. Wahrheitstabellen beschrieben werden. Seien ϕ und ψ zwei Aussagen. Die
folgenden Verknüpfungen von Aussagen sind in der Mathematik allgemein gebräuchlich.
(i) Konjunktion ϕ ∧ ψ
„Es gilt ϕ und ψ.“
ϕ
ψ
ϕ∧ψ
w
w
w
w
f
f
f
w
f
f
f
f
Die erste Zeile der Tabelle bedeutet ausformuliert: „Sind die Aussagen ϕ und ψ beide wahr, dann ist auch die
zusammengesetzte Aussage ϕ ∧ ψ eine wahre Aussage.“ Beispielsweise ist der Satz
„Heute ist Mittwoch, und es gilt 1 + 1 = 2.“
eine wahre Aussage - über den Erkenntniswert kann man geteilter Meinung sein. Wichtig hierbei ist, dass auch
die zusammengesetzten Aussage entweder wahr oder falsch ist; in der mathematischen Logik ist kein Platz für
„Halbwahrheiten“. So ist der Satz
„Heute ist Mittwoch, und es gilt 1 + 1 = 3.“
auch am Mittwoch, den 19. Oktober 2016 auf Grund des Eintrags in der zweiten Tabellenzeile eindeutig als
falsch zu bezeichnen. (Am 20. Oktober entnimmt man der vierten Tabellenzeile, dass die Aussage falsch ist,
denn in diesem Fall sind beide Teilaussagen falsch.)
—–
4
—–
(ii) Disjunktion ϕ ∨ ψ
„Es gilt ϕ oder ψ.“
ϕ
ψ
ϕ∨ψ
w
w
w
w
f
w
f
w
w
f
f
f
Zum Beispiel ist die Aussage „Es gilt 1 + 2 = 3 oder 3 + 5 = 7.“ wahr (zweite Tabellenzeile). Ebenso stimmt
für jede reelle Zahl a die Aussage „Es gilt a ≥ 0 oder a ≤ 0.“, und zwar unabhängig davon, welche konkrete
Zahl a man dort einsetzt. Hier kommt zum Beispiel für a = 0 die die erste, für a = −2 die dritte Zeile zur
Anwendung.
Zu beachten ist, dass sich beim mathematischen „oder“ die beiden Aussagen ϕ und ψ nicht gegenseitig ausschließen, wie dies beim umgangssprachlichen „entweder - oder“ der Fall ist: Die Aussage ϕ ∧ ψ ist auch dann
wahr, wenn die Aussagen ϕ und ψ beide zutreffen!
(iii) Negation ¬ϕ
„ϕ gilt nicht.“ / „ϕ ist falsch.“
ϕ
¬ϕ
w
f
f
w
Beispielsweise ist der Satz „Die Gleichung 1+1 = 3 gilt nicht.“ eine wahre Aussage (laut zweiter Tabellenzeile),
und der Satz „Die Gleichung 1 + 1 = 2 gilt nicht.“ ist falsch (laut erster Zeile).
(iv) Implikation ϕ ⇒ ψ
„Aus ϕ folgt ψ.“ / „Wenn ϕ gilt, dann gilt auch ψ.“ /
„ϕ ist eine hinreichende Bedingung für ψ.“ / „ψ ist eine notwendige Bedingung für ϕ.“
ϕ
ψ
ϕ⇒ψ
w
w
w
w
f
f
f
w
w
f
f
w
Man bezeichnet ϕ als die Prämisse, ψ als die Konklusion der Implikation ϕ ⇒ ψ. Bemerkenswert ist die
Festlegung in der vierten Zeile: Wenn die Prämisse falsch ist, dann gilt die Implikation ϕ ⇒ ψ auf jeden Fall
als wahr, unabhängig vom Wahrheitswert der Aussage Konklusion. So gesehen ist
„Wenn 1 + 1 = 3 ist, dann gilt auch 2 + 7 = 11.“
eine wahre (wenn auch nicht besonders nützliche) Aussage. Logiker verwenden dafür den Ausspruch „Ex falso
quodlibet“, d.h. aus etwas Falschem folgt alles Mögliche.
—–
5
—–
Bei der Implikation ist zu beachten, dass es zwischen den Aussagen A und B kein kausaler Zusammenhang
bestehen muss, damit die Implikation A ⇒ B zu einer wahren Aussage wird. Es kommt nur auf die Wahrheitswerte von ϕ und ψ an. Beispielsweise ist die Implikation
„Wenn 1 + 1 = 2 ist, dann beträgt die Summe der Innenwinkel aller Dreiecke 180◦ .“
wahr, obwohl die Gleichung 1 + 1 = 2 wenig bis nichts mit den geometrischen Eigenschaften irgendwelcher
Dreiecke zu tun hat. Ausschlaggebend für den Wahrheitsgehalt der Implikation ist hier nur, dass die beiden
Teilaussagen wahr sind.
Implikationen spielen in der Mathematik eine sehr wichtige Rolle; so gut wie jeder mathematische Satz wird
als Implikation formuliert. Im Mathematikunterricht werden Implikationen bereits bei ganz elementaren Vorgängen wie etwa der Umformung von Gleichungen verwendet. So verwendet man beispielsweise die Tatsache,
dass die Implikation „x + 3 = 5 ⇒ x = 2“ für alle reellen Zahlen x gültig ist, um die Gleichung x + 3 = 5 nach
x hin „aufzulösen.“
(v) Äquivalenz ϕ ⇔ ψ
„Es gilt ϕ genau dann, wenn ψ gilt.“ / „ϕ ist hinreichende und zugleich notwendige
Bedingung für ψ.“
ϕ
ψ
ϕ⇔ψ
w
w
w
w
f
f
f
w
f
f
f
w
Beim Arbeiten mit Implikationen ist es sehr wichtig, die zusammengesetzten Aussagen „ϕ ⇒ ψ“, „ψ ⇒ ϕ“ und „ϕ ⇔
ψ“ sorgfältig auseinander zu halten. Geschieht dies nicht, dann kann das bereits beim Auflösen von quadratischen
Gleichungen zu Fehlern führen. Beispielsweise ist die Implikation x = 3 ⇒ x 2 = 9 für alle reellen Zahlen x gültig,
während x 2 = 9 ⇒ x = 3 für alle reellen Zahlen x 6= −3 richtig, für x = −3 aber falsch ist: In diesem Fall ist
Prämisse x 2 = 9 wahr, die Konklusion x = 3 aber falsch, damit ist die gesamte Implikation falsch. Wendet man nun
diese fehlerhafte Implikation bei der Auflösung der Gleichung x 2 − 8x + 7 = 0 an, so erhält man
x 2 − 8x + 7 = 0
⇒
x 2 − 8x = −7
„⇒“
⇒
x −4=3
x 2 − 8x + 16 = 9
⇒
⇒
(x − 4)2 = 9
x =7
und „verliert“ somit die Lösung x = 1 der Gleichung. Der Fehler tritt an der Stelle auf, wo das Implikationszeichen
⇒ in Anführungsstriche gesetzt wurde.
—–
6
—–
Man könnte auch sagen, dass der Fehler in der Rechnung oben dadurch zu Stande kam, dass an einer Stelle eine
notwendige Bedingung mit einer hinreichenden Bedingung verwechselt wurde: Die Gleichung (x − 4)2 = 9 ist zwar
eine notwendige Bedingung dafür, dass x − 4 = 3 ist, aber eben keine hinreichende. Dieser Unterschied spielt, wie
wir noch sehen werden, bei vielen mathematischen Sätzen eine wichtige Rolle, zum Beispiel bei der Bestimmung
von lokalen Extremstellen einer Funktion.
Häufig werden durch mehrfache Anwendung der Verknüpfungssymbole nicht nur zwei, sondern mehrere Aussagen
miteinander verbunden. In welcher Reihenfolge dies geschieht, wird durch Klammern festgelegt. Beispielsweise
bedeutet (ϕ ∧ ψ) ∨ ρ, dass zuerst ϕ und ψ miteinander „und“-verknüpft und diese Aussage dann anschließend mit
der Aussage ρ noch „oder“-verknüpft wird.
Um Schreibarbeit (also Klammern) einzusparen, legt man fest, dass bestimmte Symbole stärker binden als andere,
vergleichbar mit der Konvention „Punktrechnung vor Strichrechnung“ aus der Arithmetik. Per Festlegung bindet das
Negationszeichen ¬ am stärksten, danach in absteigender Reihenfolge die Zeichen ∧, ∨, ⇒ und ⇔ Beispielsweise
ist der Ausdruck
¬ϕ ∧ ¬ψ ⇒ ϕ ⇔ ψ
gleichbedeutend mit
(((¬ϕ) ∧ (¬ψ)) ⇒ ϕ) ⇔ ψ.
Gelegentlich kann der Wahrheitsgehalt einer zusammengesetzte Aussage bestimmt werden, ohne dass man die Teilaussagen, aus denen die Aussage besteht, überhaupt kennt. Solche Aussagen wirken auf den ersten Blick eher nutzlos, bilden aber die Grundlage für das logische Schließen innerhalb einer mathematischen Beweisführung.
(1.2) Definition Eine zusammengesetzte Aussage, die unabhängig vom Wahrheitsgehalt ihrer
Teilaussagen immer wahr ist, wird Tautologie genannt.
Ein Beispiel für eine Tautologie ist die bekannte Bauernregel
„Wenn der Hahn kräht auf dem Mist, dann ändert sich das Wetter, oder es bleibt, wie es ist.“
Isolieren wir hier die Teilaussagen
ϕ
=
„Der Hahn kräht auf dem Mist.“
ψ
=
„Das Wetter ändert sich.“
und interpretieren den Satz „Das Wetter bleibt, wie es ist.“ als Negation ¬ψ von ψ, dann ist unsere Bauernregel φ
in Kurzschreibweise durch ϕ ⇒ (ψ ∨ ¬ψ) gegeben. Wir wissen bereits, dass der Wahrheitsgehalt von φ nur von den
Wahrheitswerten der Aussagen ϕ und ψ abhängt. Um zu kontrollieren, ob es sich bei φ um eine Tautologie handelt,
genügt es also, alle möglichen Kombinationen von Wahrheitswerten für ϕ und ψ in den Ausdruck φ einzusetzen.
—–
7
—–
Wir erledigen dies durch Ausfüllen einer Tabelle.
ϕ
ψ
¬ψ
ψ ∨ ¬ψ
φ
w
w
f
w
w
w
f
w
w
w
f
w
f
w
w
f
f
w
w
w
Die zusammengesetzte Aussage φ ist unabhängig von ϕ und ψ immer wahr, also eine Tautologie.
Wir sagen, die Aussage ψ folgt aus den Aussagen ϕ1 , ..., ϕn durch einen
(1.3) Definition
logischen Schluss, wenn die Implikation
ϕ1 ∧ ... ∧ ϕn ⇒ ψ
eine Tautologie ist.
Wir sehen uns nun eine Reihe von logischen Schlüssen an, die in der Mathematik häufig verwendet werden. Im
folgenden bezeichnen ϕ, φ und ψ jeweils beliebige Aussagen. Mit Hilfe von Wahrheitstabellen wird überprüft, dass
die logischen Schlüsse zulässig sind.
(i) Modus Ponens
ϕ ∧ (ϕ ⇒ ψ) ⇒ ψ
„Wenn ϕ gilt und aus ϕ die Aussage ψ folgt, dann gilt ψ.“
ϕ
ψ
ϕ⇒ψ
ϕ ∧ (ϕ ⇒ ψ)
ϕ ∧ (ϕ ⇒ ψ) ⇒ ψ
w
w
w
w
w
f
w
w
f
w
w
f
f
f
w
f
f
w
f
w
(ϕ ⇒ ψ) ⇔ (¬ψ ⇒ ¬ϕ)
(ii) Beweis durch Kontraposition
„Aus ϕ folgt ψ genau dann, wenn aus ¬ψ die Aussage ¬ϕ folgt.
ϕ
ψ
¬ϕ
¬ψ
ϕ⇒ψ
¬ψ ⇒ ¬ϕ
(ϕ ⇒ ψ) ⇔ (¬ψ ⇒ ¬ϕ)
w
w
f
f
w
w
w
w
f
f
w
f
f
w
f
w
w
f
w
w
w
f
f
w
w
w
w
w
—–
8
—–
(¬ϕ ⇒ φ ∧ ¬φ) ⇒ ϕ
(iii) Beweis durch Widerspruch
“Wenn aus ¬ϕ ein Widerspruch folgt (nämlich eine Aussage φ und zugleich auch ihr Gegenteil ¬φ),
dann ist ϕ wahr.“
ϕ
φ
¬ϕ
¬φ
φ ∧ ¬φ
¬ϕ ⇒ φ ∧ ¬φ
(¬ϕ ⇒ φ ∧ ¬φ) ⇒ ϕ
w
w
f
f
f
w
w
w
f
f
w
f
w
w
f
w
w
f
f
f
w
f
f
w
w
f
f
w
(iv) Satz vom Ringschluss
(ϕ ⇒ φ) ∧ (φ ⇒ ψ) ∧ (ψ ⇒ ϕ) ⇒ (ϕ ⇔ φ) ∧ (φ ⇔ ψ) ∧ (ψ ⇔ ϕ)
„Wenn aus ϕ die Aussage φ und aus φ die Aussage ψ und aus ψ wieder die Aussage ϕ folgt, dann
sind die drei Aussagen ϕ, φ und ψ äquivalent.“
Hier ist die Verifikation etwas aufwändiger als bei den vorherigen Regeln. Zur Abkürzung definieren wir
A = ϕ ⇒ φ, B = φ ⇒ ψ, C = ψ ⇒ ϕ, D = ϕ ⇔ φ, E = φ ⇔ ψ und F = ψ ⇔ ϕ und erhalten
ϕ
φ
ψ
A
B
C
D
E
F
A∧ B ∧ C
D∧E∧F
A∧ B ∧ C ⇒ D ∧ E ∧ F
w
w
w
w
w
w
w
w
w
w
w
w
w
w
f
w
f
w
w
f
f
f
f
w
w
f
w
f
w
w
f
f
w
f
f
w
w
f
f
f
w
w
f
w
f
f
f
w
f
w
w
w
w
f
f
w
f
f
f
w
f
w
f
w
f
w
f
f
w
f
f
w
f
f
w
w
w
f
w
f
f
f
f
w
f
f
f
w
w
w
w
w
w
w
w
w
Wir kommen nun zum zweiten großen Thema dieses Kapitels, der Mengenlehre. Fast die gesamte moderne Mathematik ist auf dem Fundament der Mengenlehre aufgebaut. Dies bedeutet, dass fast jedes mathematische Objekt, egal
ob es sich dabei um eine Zahl, eine Funktion oder ein geometrisches Gebilde handelt, letztendlich durch eine Menge
beschrieben werden kann. Desweiteren kann fast jede mathematische Aussage auf die Mengenlehre zurückgeführt
und mit den Mitteln der Mengenlehre bewiesen werden, eine ganz erstaunliche Feststellung, wenn man sich die
Vielfalt und Verschiedenartigkeit der mathematischen Strukturen vor Augen hält.
(1.4) Definition (naive Mengendefinition von Cantor)
„Eine Menge ist eine beliebige Zusammenfassung von bestimmten, wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens – welche die Elemente dieser Menge genannt
werden – zu einem Ganzen.“
—–
9
—–
Hierbei handelt es sich nicht um eine Definition im streng mathematischen Sinn; Begriffe wie „Zusammenfassung“,
„Objekt“, „Anschauung“ usw. werden ihrerseits nicht definiert, sondern rein intuitiv verwendet. Auf Grund unserer
Alltagserfahrung ist die Bedeutung der Cantorschen Definition dennoch unmittelbar klar. Jeder kann sich vorstellen,
was es heißt, „Objekte unserer Anschauung“ zu einem „Ganzen“ zusammenzufassen (z.B. die Bürger einer Gemeinde,
die Möbelstücke in einer Wohnung, die Moleküle eines Wassertropfens usw.), dasselbe gilt für die „Objekte unseres
Denkens“ wie etwa die natürlichen Zahlen oder geometrische Figuren.
Wir weisen auf zwei wichtige Punkte der Cantorschen Definition hin: Erstens sind sämtliche Objekte einer Menge
verschieden, es ist also nicht möglich, dass ein und dasselbe Objekt mehrfach in einer Menge vorkommt. Zweitens
ist jede Menge als „Zusammenfassung“ durch ihre Elemente eindeutig bestimmt. Dies bedeutet, dass zwei Mengen
genau dann gleich sind, wenn sie dieselben Elemente enthalten.
Folgende Kurzschreibweisen sind in der Mengenlehre üblich.
x∈M
Das Objekt x ist Element der Menge M .
x∈
/M
Das Objekt x ist kein Element der Menge M , in Kurzform also ¬(x ∈ M ).
M ⊆N
Jedes Element x von M ist auch ein Element von N , d.h. die Implikation
x ∈ M ⇒ x ∈ N ist für alle Objekte x erfüllt. Man bezeichnet M dann als
Teilmenge von N .
M =N
Es gilt x ∈ M ⇔ x ∈ N für alle Objekte x (äquivalent: M ⊆ N ∧ N ⊆ M ).
M ⊇N
gleichbedeutend mit N ⊆ M
M (N
M ⊆ N ∧ ¬(M = N )
M )N
gleichbedeutend mit N ( M
∅
die leere Menge
Dies ist die eindeutig bestimmte Menge die x ∈
/ ∅ für alle Objekte x erfüllt, also die Menge,
die kein einziges Objekt als Element besitzt.
Es gibt mehrere Möglichkeiten, eine Menge konkret anzugeben. Zunächst kann dies umgangssprachlich geschehen.
„Sei P die Menge aller Primzahlen.“
Eine andere Möglichkeit besteht darin, die Elemente einer Menge explizit aufzuzählen.
M = {1, 2, 3, 4, 5, 6, 7}
oder kürzer
M = {1, 2, ..., 7}
Bei der Verwendung von „ ... “ ist darauf zu achten, dass für den Leser klar ersichtlich ist, welche Elemente bei
der Aufzählung weggelassen wurden. Schreibt man etwa P = {2, 3, 5, 7, 11, 13, 17, ...}, dann ist noch einigermaßen
ersichtlich, dass die Menge der Primzahlen gemeint ist. Schwieriger wird das schon bei der Angabe
M = {1, 4, ..., 64}.
—–
10
—–
Hier ist nicht ohne weiteres klar, ob die Menge {1, 4, 16, 64} = {40 , 41 , 42 , 43 } der ersten drei Viererpotenzen oder
vielleicht {1, 4, 9, 16, 25, 36, 49, 64} = {12 , 22 , 32 , 42 , 52 , 62 , 72 , 82 }, die Menge der ersten acht Quadratzahlen, gemeint ist. Ein Vorteil der „ ... “-Schreibweise besteht aber darin, dass mit ihr auch unendliche Mengen direkt angeben
werden können, zum Beispiel die Menge N = {1, 2, 3, ...} der natürlichen Zahlen.
Um eine weitere Möglichkeit zur Definition von Mengen anzugeben, benötigen wir als neues Konzept den Begriff des
Aussagenschemas. Dabei handelt es sich um einen Satz, in dem eine Reihe von Parametern x, y, ... vorkommen und
der zu einer Aussage wird, wenn man die Parameter durch geeignete mathematische Objekte ersetzt. Beispielsweise
ist der Satz
„Die Zahl x ist eine Primzahl.“
ein Aussagenschema mit x als Parameter. Setzt man für x die Werte 4 oder 6 ein, so erhält man eine falsche Aussage.
Setzt man dagegen 2 oder 13 ein, dann erhält man eine wahre Aussage. Ein Beispiel für ein Aussagenschema mit
drei Parametern x, y, z ist die Gleichung x 2 + y 2 = z 2 . Hier erhält man durch Einsetzen von x = 3, y = 4, z = 5 eine
wahre Aussage (denn es gilt 32 + 42 = 52 ), während zum Beispiel die Kombination x = 2, y = 3, z = −4 wegen
22 + 32 6= (−4)2 eine falsche Aussage liefert.
Zu beachten ist, dass nicht im Allgemeinen natürlich nicht jede Einsetzung eine sinnvolle Aussage liefert. Zum
Beispiel würde es keinen Sinn machen, in der Gleichung x 2 + y 2 = z 2 für x die leere Menge ∅ einzusetzen, da nicht
ohne Weiteres klar ist, was der Ausdruck
∅2 + y 2
=
z2
bedeuten soll. Noch einmal sei darauf hingewiesen, dass die Verwendung von nicht klar definierten Ausdrücken eine
Hauptfehlerquelle beim Formulieren mathematischer Beweise ist!
Schauen wir uns nun an, wie Aussagenschemata zur Definition von Mengen verwendet werden können. Sei ϕ ein
Aussagenschema mit einem Parameter x und M eine Menge. Für jedes c ∈ M bezeichnen wir mit ϕ(c) den Satz, den
man erhält, wenn der Parameter x durch c ersetzt wird. Wir setzen voraus, dass ϕ(c) für jedes c ∈ M eine sinnvolle
Aussage ist. Nach Definition besteht dann die Menge
N
=
{ c ∈ M | ϕ(c)}
aus genau denjenigen Elementen c von M , für die ϕ(c) eine wahre Aussage ist. Man nennt ϕ dann auch die definierende Bedingung für die Teilmenge N von M .
Beispielsweise beschreibt {c ∈ R | c 2 < 1} die Menge derjenigen reellen Zahlen, deren Quadrat kleiner als 1 ist.
In dieser Situation ist also M = R die Grundmenge und ϕ(x) = x 2 < 1 das Aussagenschema, dass die Teilmenge
beschreibt. Offenbar ist c 2 < 1 für jedes c ∈ R eine sinnvolle, aber nur für −1 < c < 1 auch eine wahre Aussage.
—–
11
—–
Gelegentlich verwendet man auch die Notation N = { c | ϕ(c)}, ohne die Angabe einer Grundmenge für die Objekte
c. In diesem Fall besteht N aus allen mathematischen Objekten c, für die die Aussage ϕ(c) wahr ist. Strenggenommen
ist eine solche Definition für beliebige Aussagenschemta ϕ nicht zulässig, weil dies zu Widersprüchen führen kann
(Stichwort „Russelsche Antinomie“). Wir werden die Notation aber nur in Situationen einsetzen, wo solche Probleme
ausgeschlossen sind.
Aus gegebenen Mengen können durch weitere Operationen neue Mengen definiert werden. Seien A und B beliebig
vorgegebene Mengen. Folgende Mengeoperationen sind in der Mathematik allgemein gebräuchlich.
Durchschnitt
A ∩ B
=
{ a | a ∈ A∧ a ∈ B }
Vereinigung
A ∪ B
=
{ a | a ∈ A∨ a ∈ B }
Differenz
A \ B
=
{ a | a ∈ A∧ a ∈
/B}
kartesisches Produkt
A × B
=
{ (a, b) | a ∈ A ∧ b ∈ B }
Potenzmenge
P (A)
=
{ B|B⊆A}
Einige dieser Operationen lassen sich durch sog. Venn-Diagramme veranschaulichen.
Durchschnitt
Vereinigung
Differenz
Das kartesische Produkt A × B besteht aus allen Paaren (a, b), die mit Elementen a ∈ A und b ∈ B gebildet werden
können. Ist bespielsweise A = {1, 2, 3} und B = {1, 2, 4, 5}, dann erhalten wir

(1, 1), (1, 2),

A × B = {1, 2, 3} × {1, 2, 4, 5} =
(2, 1), (2, 2),

(3, 1), (3, 2),
(1, 4),
(1, 5),

(2, 4),
(2, 5),

(3, 4),
(3, 5)

(Die Elemente wurden nur zur besseren Übersicht in einem rechteckigen Schema angeordnet. Man hätte auch alle
12 Elemente direkt hintereinander schreiben können.)
Bei der Definition des kartesischen Produkts ist zu beachten, dass zwei Paare (a, b) und (c, d) von Objekten a, b, c, d
nur dann gleich sind, wenn a = c und b = d erfüllt ist. Zum Beispiel sind die Paare (3, 5) und (5, 3) verschieden. Im
Gegensatz dazu stimmen die zweielementigen Mengen {3, 5} und {5, 3} überein, da es keine Rolle spielt, in welcher
Reihenfolge die Elemente einer Menge aufgezählt werden.
—–
12
—–
Das kartesische Produkt kann auch mit mehr als zwei Mengen gebildet werden. Die Elemente bezeichnet man dann
nicht mehr als Paare, sondern als Tupel. Sind beispielsweise A, B, C drei beliebige Mengen, dann setzt man
A× B × C
=
{ (a, b, c) | a ∈ A , b ∈ B , c ∈ C}
wobei wieder (a, b, c) = (a0 , b0 , c 0 ) nur dann erfüllt ist, wenn a = a0 , b = b0 und c = c 0 gilt. Es ist also beispielsweise
(1, 2, 3) 6= (1, 3, 2) und (2, 2, 4) 6= (2, 4, 2). Häufig werden mehrfache kartesische Produkte auch mit ein- und derselp
ben Menge gebildet. Man definiert A2 = A×A, A3 = A×A×A, A4 = A×A×A×A usw. Beispielsweise ist (3, 4, 21 , 2, −9)
eine Element der Menge R5 .
Bei den Potenzmengen ist zu beachten, dass deren Elemente selbst wieder Mengen sind! Nach Definition ist für
jede beliebige Mengen A, B die Aussage B ∈ P (A) äquivalent zu B ⊆ A. Intuitiv klar ist, dass bei einer endlichen
Menge A die Potenzmenge P (A) ebenfalls nur endlich viele Elemente enthält. Ist beispielsweise A = {1, 2, 3}, dann
enthält jede Teilmenge von A entweder kein, genau ein, genau zwei oder genau drei Elemente. Dies kann für eine
systematische Aufzählung der Elemente von P (A) verwendet werden: Es gilt
P (A)
=
{ ∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3} }.
die achtelementige Potenzmenge von {1, 2, 3}
Eine häufige Fehlerquelle beim Umgang mit Mengen besteht darin, dass man zwischen einer Menge und ihren Elementen nicht klar unterscheidet. Beispielsweise wäre es falsch zu sagen, dass die 1 ein Element von P (A) ist. Lediglich die Menge {1} ist ein Element von P (A), und 1 ist ein Element der Menge {1}. Momentan klingt das noch recht
haarspalterisch; bei komplizierteren mengentheoretischen Konstruktionen (zum Beispiel Faktorstrukturen) kommt
man aber in große Schwierigkeiten, wenn man sich an diese Unterscheidung nicht gewöhnt hat.
Eine wichtige Grundtechnik beim Führen von Beweisen ist der Nachweis der Gleichheit zweier Mengen. Häufig bietet es sich an, die Aussage M = N in die folgenden beiden Teilaussagen zu zerlegen und diese einzeln zu beweisen.
(i) Ist x ein Element der Menge M , dann ist x auch ein Element von N .
(ii) Ist x ein Element der Menge N , dann ist x auch ein Element von M .
Aus der ersten Aussage folgt M ⊆ N , aus der zweiten N ⊆ M , insgesamt also M = N .
—–
13
—–
Wie die Beweise der Teilaussagen (i) und (ii) aussehen können, schauen wir uns an einem konkreten Beispiel an.
Unser Ziel ist der Beweis der Gleichung
{ (x, y, z) ∈ R3 | (x y + 1)z = 0 }
=
{ (x, y, 0) | x, y ∈ R } ∪ { (x, − 1x , z) | x ∈ R \ {0} , z ∈ R }.
Wir bezeichnen die Menge auf der linken Seite der Gleichung mit M und die Menge auf der rechten Seite der
Gleichung mit N . Die Menge N enthält also alle Tupel der Form (x, y, 0) mit x, y ∈ R und alle Tupel der Form
(x, − 1x , z) mit x, z ∈ R und x 6= 0.
Beweis der Teilaussage (i)
Sei p ∈ M . Nach Definition von M gilt p = (x, y, z) ∈ R3 mit x, y, z ∈ R und (x y + 1)z = 0. Aus dieser Gleichung
folgt x y + 1 = 0 oder z = 0, denn das Produkt zweier reeller Zahlen ist nur dann gleich Null, wenn einer der
beiden Faktoren gleich Null ist. Ist z = 0, dann hat p die Form (x, y, 0) mit x, y ∈ R, also liegt p in N . Ist dagegen
x y + 1 = 0, dann muss x 6= 0 gelten, denn ansonsten wäre x y + 1 = 0 · y + 1 = 1. Aus x y + 1 = 0 folgt x y = −1,
wegen x 6= 0 dann auch y = − 1x und somit ebenfalls p = (x, y, z) = (x, − 1x , z) ∈ N .
Beweis der Teilaussage (ii)
Sei p ∈ N . Dann gilt p = (x, y, 0) mit geeigneten x, y ∈ R oder p = (x, − 1x , z) für geeignete x ∈ R \ {0} und ein
z ∈ R. Betrachten wir zunächst den Fall p = (x, y, 0) mit x, y ∈ R. Setzen wir z = 0, dann gilt p = (x, y, z) ∈ R3 und
(x y + 1)z = (x y + 1) · 0 = 0. Daraus folgt p ∈ M . Betrachten wir nun den Fall, dass p = (x, − 1x , z) für ein x ∈ R \ {0}
und ein z ∈ R gilt. Setzen wir y = − 1x , dann liegt p = (x, y, z) in R3 . Außerdem gilt (x y + 1)z = (x · (− 1x ) + 1)z =
((−1) + 1)z = 0 · z = 0. Also liegt p auch in diesem Fall in M .
ƒ
In einfacheren Situationen lässt sich die Gleichheit zweier Mengen auch durch eine Kette von Äquivalenzumformungen beweisen. Als Beispiel betrachten wir die Mengengleichung
{ x ∈ R | x2 + x − 6 = 0 }
=
{ −3, 2 }.
Wieder sei M die Menge auf der linken und N die Menge auf der rechten Seite der Gleichung. Es gilt M = N , wenn
wir für jedes Objekt x die Äquivalenz x ∈ M ⇔ x ∈ N beweisen können. Da M und N beides Teilmengen von R
sind, genügt es, die Äquivalenz für alle x ∈ R zu beweisen, denn ansonsten sind die Aussagen x ∈ M und x ∈ N
beide falsch und die Äquivalenz damit auf jeden Fall wahr.
Sei also x ∈ R vorgegeben. Dann gilt
x∈M
⇔
⇔
x2 + x − 6 = 0
(x + 12 )2 −
⇔
€ 5 Š2
2
=0
x2 + x = 6
⇔
((x + 12 ) + 52 )((x + 21 ) − 52 ) = 0
x +3=0∨ x −2=0
⇔
⇔
x2 + x +
1
4
⇔
x = −3 ∨ x = 2
—–
14
—–
⇔
=
25
4
⇔
⇔
(x + 21 )2 =
€ 5 Š2
2
(x + 3)(x − 2) = 0
x ∈ {−3, 2}
⇔
x ∈ N.
Hier wurde nichts anderes getan, als die Gleichung durch Bildung der qudratischen Ergänzung zu lösen. Wichtig
ist bei solchen Beweisen, dass jeder einzelne Schritt genau begründet werden kann, und dass jeweils beide Implikationsrichtungen gültig sind. Beispielsweise wäre x = 3 ⇔ x 2 = 9 keine zulässige Äquivalenzumformung, weil die
Implikationsrichtung „⇐“ nicht für jede reelle Zahl x gültig ist. (Wie wir bereits oben festgestellt haben, ist sie ist
für x = −3 falsch.)
In vielen Situationen möchte man Aussagen formulieren, die die Gesamtheit der Elemente einer Menge betreffen.
Dazu verwendet man den sog. Allquantor ∀ und den Existenzquantor ∃. Sei ϕ ein Aussagenschema mit x als
Parameter, und wiederum sei M eine Menge mit der Eigenschaft, dass man für jedes c ∈ M durch Ersetzung von
x durch c eine sinnvolle Aussage ϕ(c) erhält. Dann kann man mit Hilfe von All- und Existenzquantor zwei neue
Aussagen ∀x ∈ M : ϕ und ∃x ∈ M : ϕ bilden, die man als quantifizierte Aussagen bezeichnet.
(1.5) Definition
(i) Die Aussage ∀x ∈ M : ϕ bedeutet, dass ϕ(c) für alle c ∈ M wahr ist.
Es gilt also
{c ∈ M | ϕ(c)} = M .
(ii) Die Aussage ∃x ∈ M : ϕ bedeutet, dass ϕ(c) für mindestens ein c ∈ M wahr ist.
Es gilt also
{c ∈ M | ϕ(c)} =
6 ∅.
Betrachten wir beispielsweise das Aussagenschema x ≤ 5 mit dem Parameter x über der Menge M = R der reellen
Zahlen und bezeichnen es mit ϕ.
(i) Die Aussage ∀x ∈ R : x ≤ 5 ist falsch, denn ϕ(c) ist nicht für alle c ∈ R erfüllt. Beispielsweise ist ϕ(7) falsch.
(ii) Die Aussage ∃x ∈ R : x ≤ 5 ist wahr, denn es gibt Elemente c ∈ R, für die ϕ(c) wahr ist. Zum Beispiel ist
ϕ(4) eine wahre Aussage.
Die meisten Aussagen, die wir im Laufe der Zeit beweisen werden, sind quantifizierte Aussagen, enthalten also die
Formulierungen „für alle“ oder „es gibt ein x, so dass...“. Dabei treten besonders zu Anfang häufig methodische Fehler
auf. Um eine Aussage der Form ∀x ∈ M : ϕ zu beweisen, muss die Aussage ϕ(c) für jedes c ∈ M bewiesen werden.
Dazu gibt man sich mit der Floskel „Sei c ∈ M .“ ein beliebiges Element c aus M vor und beweist anschließend die
Aussage ϕ(c). Während des Beweises darf dann nur verwendet werden, dass c ein Element der Menge M ist. Jede
Einschränkung oder Spezialisierung von c macht den Beweis ungültig.
Um andererseits eine Aussage der Form ∃x ∈ M : ϕ zu beweisen, genügt es, ein spezielles Element c ∈ M anzugeben
und die Aussage ϕ(c) nur für dieses c zu beweisen. Natürlich kann es schwierig sein, ein solches c erst einmal zu
finden. Um beispielsweise die Aussage ∃x ∈ R : x 2 + x − 6 = 0 auf diesem Weg zu beweisen, muss eine Lösung der
quadratischen Gleichung x 2 + x − 6 = 0 gefunden werden.
—–
15
—–
Gelegentlich hat man es auch mit der Negation einer quantifizierten Aussage zu tun. Auf Grund der beiden Äquivalenzen
¬∀x ∈ M : ϕ(x) ⇔ ∃x ∈ M : ¬ϕ(x)
¬∃x ∈ M : ϕ(x) ⇔ ∀x ∈ M : ¬ϕ(x)
und
kann diese aber leicht auf eine nicht-negierte Aussage zurückgeführt werden. Dass diese beiden Äquivalenzen gelten,
wird unmittelbar klar, wenn sie umgangssprachlich formuliert: Die Aussage ϕ(c) ist genau dann nicht für alle c ∈ M
wahr, wenn es (mindestens) ein c ∈ M mit ¬ϕ(c) gibt. Ebenso kann die Aussage ¬∃x ∈ M : ϕ(x) umgangssprachlich
formuliert werden durch „Es gibt kein c ∈ M mit ϕ(c).“ Dies ist offenbar gleichbedeutend damit, dass ¬ϕ(c) für alle
c ∈ M gilt.
Schließlich ist es noch möglich, mehrere Quantoren zu verschachteln. In diesem Fall benötigt man Aussagenschemata mit mehreren Parametern. Sei ϕ ein Aussagenschema mit den beiden Parametern x, y und M , N Mengen mit
der Eigenschaft, dass man für alle c ∈ M und d ∈ N eine sinnvolle Aussage ϕ(c, d) erhält, wenn man x durch c und
y durch d ersetzt. Dann ist ∀ y ∈ N : ϕ ein Aussagenschema, das nur noch vom Parameter x abhängt, und
∃x ∈ M : ∀ y ∈ N : ϕ
ist eine Aussage, mit zwei ineinander verschachtelten Quantoren. Umgangssprachlich bedeutet diese Aussage: „Es
gibt ein c ∈ M , so dass für alle d ∈ N jeweils ϕ(c, d) gilt.“
Dabei sind die Quantoren ∃ und ∀ in beliebiger Kombination zugelassen. Es ergeben sich dadurch Aussagen mit
unterschiedlicher Bedeutung.
• Der Ausdruck ∀x ∈ M : ∃ y ∈ N : ϕ bedeutet: „Für jedes c ∈ M gibt es ein d ∈ N , so dass ϕ(c, d) gilt.“
• Der Ausdruck ∃x ∈ M : ∃ y ∈ N : ϕ bedeutet: „Es gibt Elemente c ∈ M und d ∈ N , so dass ϕ(c, d) gilt.“
• Der Ausdruck ∀x ∈ M : ∀ y ∈ N : ϕ bedeutet: „Für alle c ∈ M und d ∈ N gilt ϕ(c, d).“
Man beachte, dass auch die Aussagen ∀x ∈ M : ∃ y ∈ N : ϕ und ∃ y ∈ N : ∀x ∈ M : ϕ nicht etwa gleichbedeutetend
sind, es kommt also auch auf die Reihenfolge der Quantoren an. Wir machen uns dies am Beispiel des Aussagenschemas x < y mit den Parametern x, y klar, das wir wieder mit ϕ bezeichnen. Offenbar erhält man jedes Mal eine
sinnvolle Aussage, wenn man für x und y Elemente aus R, der Menge der reellen Zahlen, einsetzt.
Die Aussage ∃x ∈ R : ∀ y ∈ R : x < y bedeutet nun: „Es gibt ein c ∈ R, so dass für alle d ∈ R jeweils c < d gilt.“
Diese Aussage ist offenbar falsch. Denn nehmen wir an, es gibt ein solches c. Dann ist d = c − 1 offenbar kleiner als
c, und nicht größer. Somit ist c < d nicht für alle d ∈ R erfüllt.
Die Aussage ∀ y ∈ R : ∃x ∈ R : x < y bedeutet andererseits, dass für jedes d ∈ R jeweils ein c ∈ R mit c < d
existiert. Diese Aussage ist wahr. Geben wir nämlich ein beliebiges d ∈ R vor, dann können wir c = d − 1 setzen,
und die Aussage c < d ist offenbar erfüllt.
—–
16
—–
Kommen wir nun zum letzten Thema dieses Kapitels, der vollständigen Induktion. Wir werden die Menge N =
{1, 2, 3, ...} der natürlichen Zahlen in Kapitel 3 als Teilmenge der reellen Zahlen definieren. Trotzdem soll an dieser
Stelle bereits mit N gearbeitet werden. Wir setzen folgende Aussagen über die Menge N als bekannt voraus. Sie sind
in der Literatur unter dem Namen Peano-Axiome bekannt, benannt nach dem italienischen Mathematiker Guiseppe
Peano (1858-1932) und lauten
(P1) Es gibt ein ausgezeichnetes Element in N, das wir mit 1 bezeichnen.
(P2) Jedes n ∈ N besitzt einen eindeutig bestimmten Nachfolger, der mit n + 1 bezeichnet wird.
(P3) Kein Element aus N besitzt die 1 als Nachfolger.
(P4) Sind m, n ∈ N mit m + 1 = n + 1, dann folgt m = n.
Hinzu kommt noch das wichtige
(P5) Induktionsprinzip:
Sei ϕ ein Aussagenschema mit folgenden Eigenschaften: Für jedes n ∈ N ist ϕ(n) eine sinnvolle Aussage,
darüber hinaus seien ϕ(1) und ∀x ∈ N : ϕ(x) ⇒ ϕ(x + 1) wahre Aussagen. Dann ist auch ∀x ∈ N : ϕ(x)
wahr.
Die Anwendung des Induktionsprinzips bezeichnet man als vollständige Induktion, es ist eines der wichtigsten
Beweisprinzipien der Mathematik. Wir werden sehen, dass in vielen Situationen die Beweise der Aussagen ϕ(1) und
∀x ∈ N : ϕ(x) ⇒ ϕ(x + 1) erheblich einfacher sind als ein direkter Beweis von ∀x ∈ N : ϕ(x).
Wie wir im nächsten Abschnitt sehen werden, kann das Induktionsprinzip zum Beispiel dafür benutzt werden, um
auf den natürlichen Zahlen die Addition und die Multiplikation zu definieren, und um die aus der Schule bekannten
Rechengesetze herzuleiten, zum Beispiel Assoziativ-, Kommutativ- und Distributivgesetz. Wir nehmen aber hier an,
dass wir die aus der Schule bekannten Zahlbereiche schon zur Verfügung haben und betrachten als Beispiel den
folgenden „Klassiker“ unter den Induktionsbeweisen.
(1.6) Satz Sei n ∈ N. Dann ist die Summe der ersten n natürlichen Zahlen gegeben durch
1 + 2 + ... + n
=
1
n(n + 1).
2
(Wir werden im nächsten Abschnitt sehen, wie sich der Ausdruck 1 + 2 + ... + n mit Hilfe des
Summenzeichens kompakter schreiben lässt.)
Beweis:
Unser Ziel besteht darin, das Induktionsprinzip auf das Aussagenschema 1 + 2 + ... + x =
1
x(x
2
+ 1)
mit dem Parameter x anzuwenden. Bezeichnen wir dieses Aussagenschema mit ϕ, dann müssen wir also ϕ(1) und
∀x ∈ N : ϕ(x) ⇒ ϕ(x + 1) beweisen. Die Aussage ϕ(1) lautet 1 =
wahr, denn tatsächlich gilt
1
2
· 1 · (1 + 1) =
1
2
· 1 · 2 = 1.
—–
17
—–
1
2
· 1 · (1 + 1). Diese Aussage ist offensichtlich
Nun beweisen wir ∀x ∈ N : ϕ(x) ⇒ ϕ(x + 1). Sei dazu n ∈ N vorgegeben. Dann ist ϕ(n) ⇒ ϕ(n + 1) zu zeigen.
Setzen wir dazu voraus, dass ϕ(n) wahr ist. Dann gilt 1 + 2 + ... + n = 21 n(n + 1). Diese Gleichung bleibt erhalten,
wenn wir auf beiden Seiten n + 1 addieren, es gilt also 1 + 2 + ... + n + (n + 1) = 12 n(n + 1) + (n + 1). Wegen
1
n(n + 1) + (n + 1)
2
= 21 n(n + 1) + 1 · (n + 1)
=
( 21 n + 1)(n + 1)
=
1
(n + 2)(n + 1)
2
= 12 (n + 1)((n + 1) + 1)
erhalten wir 1+2+...+n+(n+1) = 12 (n+1)((n+1)+1). Also gilt auch ϕ(n+1). Damit ist insgesamt die Implikation
ϕ(n) ⇒ ϕ(n + 1) bewiesen.
ƒ
In einem Induktionsbeweis über ein Aussagenschema ϕ bezeichnet man den Beweis von ϕ(1) als Induktionsanfang
und den Beweis der Implikation ϕ(n) ⇒ ϕ(n + 1) für ein beliebig vorgegebenes n ∈ N als Induktionsschritt. Die
Teilaussage ϕ(n) nennt man dabei die Induktionsvoraussetzung. Jeder Induktionsbeweis sollte so aufgeschrieben
sein, dass klar zu erkennen ist, an welcher Stelle die Induktionsvoraussetzung verwendet wird.
—–
18
—–
§ 2.
Relationen und Abbildungen
Inhaltsübersicht
Eine Relation zwischen zwei Mengen X und Y ist eine Teilmenge des kartesischen Produkts X × Y ; intuitiv kann man
sich darunter eine Beziehung zwischen den Elementen der Mengen X und Y vorstellen. Besonders einfache Beispiele
für Relationen sind die Halb- und Totalordnungen. Auch Abbildungen zwischen Mengen sind Relationen. Für diese
definieren wir die wichtigen Eigenschaften injektiv, surjektiv und bijektiv.
Mit Hilfe der bijektiven Abbildungen kann auch die Mächtigkeit einer Menge definiert werden. Ist die Menge endlich,
so handelt es sich dabei einfach um die Anzahl der Elemente. Mit Hilfe der vollständigen Induktion aus §1 leiten wir
einige Rechenregeln für die Mächtigkeit endlicher Mengen her. Außerdem behandeln wir einige Grundlagen zu unendlichen Mengen. Zum Schluss führen wir noch das Summen- und Produktzeichen ein, formulieren auch hierfür einige
Rechenregeln und diskutieren Anwendungen.
(2.1) Definition Seien X und Y Mengen. Eine Relation zwischen X und Y ist eine Teilmenge
R ⊆ X × Y . Eine Teilmenge R ⊆ X × X nennt man auch eine Relation auf der Menge X .
Intuitiv kann man sich eine Relation R als Beziehung zwischen den Elemente von X und Y vorstellen. Für beliebige
x ∈ X und y ∈ Y soll (x, y) ∈ R genau dann gelten, wenn x und y miteinander in Beziehung stehen.
Betrachten wir als erstes Beispiel die Relation | auf der Menge X = {1, 2, 3, 4, 5, 6} gegeben durch
|
=
{ (a, b) ∈ X × X | a ist Teiler von b }.
Man bezeichnet diese Relation als Teilerrelation. In ausgeschriebener Form handelt es sich um die Menge
|
=
{ (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 2), (2, 4), (2, 6), (3, 3), (3, 6), (4, 4), (5, 5), (6, 6) }
⊆
X × X.
Alternativ könnte man die Relation | auch in Tabellenform darstellen, wobei man für jedes Element von X eine Zeile
und eine Spalte vorsieht und an der Position (x, y) genau dann ein Kreuz X setzt, wenn (x, y) ∈ | gilt. Dies würde
dann folgendermaßen ausehen.
|
1
2
3
4
5
6
1
X
X
X
X
X
X
2
X
X
X
X
3
X
X
4
X
5
X
6
—–
19
—–
Natürlich kann man die Teilerrelation auch auf der gesamten Menge N der natürlichen Zahlen betrachten. Da N
aber unendlich ist, kann man die Elemente von | natürlich nicht mehr einzeln angeben, weder als Aufzählung noch
in Tabellenform.
Viele Relationen auf R lassen sich wiederum graphisch darstellen, weil es dabei um nichts anderes als eine Teilmenge
der Ebene R2 = R × R handelt. So könnte man etwa die Punkte, die zur Relation gehören, in der Ebene blau
einzeichnen. Für die Relationen
R = {(x, y) ∈ R2 | x ≤ y}
,
S = {(x, y) ∈ R2 | y = x 2 }
und
T = {(x, y) ∈ R2 | x 2 + y 2 ≤ 1}
würde man zum Beispiel die folgenden Bilder erhalten.
Relation R
Relation S
Relation T
Es sei noch darauf hingewiesen, dass eine Relation R ⊆ X × Y keine bestimmte „Bedeutung“ zu haben braucht,
sondern vollkommen willkürlich gewählt werden kann. So ist zum Beispiel auch R = {(3, 7), (19, 8), (2, 44)} eine
Relation auf N. Um allerdings zu mathematisch „interessanten“ Relationen zu kommen, beschränkt man sich auf
Relationen mit bestimmten festgelegten Eigenschaften. Die folgende Klasse von Relationen ist in ausnahmelos jedem
Teilgebiet der Mathematik zu finden.
(2.2) Definition Sei X eine Menge und ≤⊆ X × X eine Relation auf X . Für x, y ∈ X schreiben
wir x ≤ y als Abkürzung für die Aussage (x, y) ∈≤. Man nennt ≤ eine Halbordnung auf X ,
wenn folgende Bedingungen erfüllt sind.
(i) ∀x ∈ X : x ≤ x
(Reflexivität)
(ii) ∀x, y ∈ X : x ≤ y ∧ y ≤ x ⇒ x = y
(Anti-Symmetrie)
(iii) ∀x, y, z ∈ X : x ≤ y ∧ y ≤ z ⇒ x ≤ z
(Transitivität)
Zwei Elemente x, y ∈ X werden vergleichbar genannt, wenn x ≤ y oder y ≤ x gilt. Man
bezeichnet ≤ als Totalordnung, wenn zwei beliebig vorgegebene Elemente x, y ∈ X jeweils
vergleichbar sind.
—–
20
—–
Man überprüft unmittelbar, dass die gewöhnliche ≤-Relation auf N, Z, Q und R jeweils eine Totalordnung ist. Die
Eigenschaften dieser Totalordnungen werden wir im folgenden §3 genauer untersuchen.
Wir hatten bereits weiter oben die Teilerrelation | auf der Menge N der natürlichen Zahlen angesprochen. Dies ist
ein Beispiel für eine Halbordnung, die aber keine Totalordnung ist. Wir überprüfen die Halbordnungs-Eigenschaften.
Für jede Zahl n ∈ N gilt n = 1 · n, also gilt n | n. Dies zeigt, dass die Relation reflexiv ist. Zur Überprüfung der AntiSymmetrie seien m, n ∈ N mit m | n und n | m vorgegeben. Nach Definition der Teilbarkeit gibt es k, ` ∈ N mit
n = k · m und m = ` · n. Durch Einsetzen erhalten wir n = k · (` · n) = (k · `) · n, also k · ` = 1 und m = n. Damit ist die
Anti-Symmetrie nachgewiesen. Um die Transitivität zu überprüfen, seien m, n, p ∈ N mit m | n und n | p vorgegeben.
Es gibt k, ` ∈ N mit n = k · m und p = ` · n. Wegen p = ` · (k · m) = (k · `) · m folgt m | p.
Um zu zeigen, dass | keine Totalordnung ist, genügt es, zwei nicht vergleichbare Elemente m, n ∈ N anzugeben. Dies
ist beispielsweise für m = 2 und n = 3 der Fall, denn weder ist 2 ein Teiler von 3, noch umgekehrt 3 ein Teiler von 2.
Beschränkt man sich auf eine endliche Teilmenge von N, zum Beispiel auf die Menge der Teiler einer festen Zahl
n ∈ N, dann lässt sich die Teilbarkeitsrelation graphisch darstellen. Ein von unten nach oben verlaufender Weg von
einem Element x zu einem Element y soll dabei bedeuten, dass x | y erfüllt ist. Für die Fälle n = 24 und n = 27
erhält man zum Beispiel die folgenden Bilder.
Die lineare Struktur des Graphen rechts zeigt an, dass es sich bei der Relation | auf der Menge {1, 3, 9, 27} um eine
Totalordnung handelt. Die Teiler von 24 bilden aber nur eine Halbordnung.
Eine weitere wichtige Klasse von Halbordnungen erhält man durch die Inklusionsrelationen. Ist X eine beliebige
Menge, dann ist Relation ⊆ eine auf der Potenzmenge P (X ) eine Halbordnung. Denn für alle A ∈ P (X ) gilt offenbar
A ⊆ A, also ist die Relation ⊆ reflexiv. Sind A, B ∈ P (X ) mit A ⊆ B und B ⊆ A vorgegeben, dann folgt A = B, wie wir
bereits in §1 festgestellt haben. Also ist die Relation anti-symmetrisch. Für A, B, C ∈ P (X ) folgt aus A ⊆ B und B ⊆ C
offenbar A ⊆ C, also ist die Relation auch transitiv.
Enthält die Menge X allerdings mindestens zwei verschiedene Elemente a, b, dann ist ⊆ keine Totalordnung auf
P (X ), denn es gilt dann weder {a} ⊆ {b} noch {b} ⊆ {a}. Die Elemente {a} und {b} aus P (X ) sind also nicht
miteinander vergleichbar.
—–
21
—–
Wie im vorherigen Beispiel ist (zumindest bei einer endlichen Menge X ) auch eine graphische Veranschaulichung
der Relation ⊆ auf P (X ) möglich. Für die Potenzmengen {1}, {1, 2} und {1, 2, 3} ergeben sich beispielsweise die
folgenden Bilder.
Ist ≤ eine allgemeine Halbordnung auf einer beliebigen Menge X , dann verwenden wir die folgenden abkürzenden
Schreibweisen.
a≥b
für
b≤a
a<b
für
a ≤ b ∧ a 6= b
a>b
für
b ≤ a ∧ b 6= a
Wir kommen nun zu einer weiteren wichtigen Klasse von Relationen, den Abbildungen.
(2.3) Definition
Seien X , Y Mengen. Eine Relation R zwischen X und Y wird Abbildung
genannt, wenn für jedes x ∈ X genau ein y ∈ Y mit (x, y) ∈ R existiert. In Formelschreibweise:
(i) ∀x ∈ X : ∃ y ∈ Y : (x, y) ∈ R
(ii) ∀x ∈ X : ∀ y, y 0 ∈ Y : (x, y) ∈ R ∧ (x, y 0 ) ∈ R ⇒ y = y 0 .
Dabei nennt man X den Definitions- und Y den Wertebereich der Abbildung.
Für gegebenes x ∈ X bezeichnet man das eindeutig bestimmte y ∈ R mit der Eigenschaft (x, y) ∈ R mit R(x) und
nennt es das Bild von x unter R.
Die Notation R : X → Y drückt aus, dass R eine Abbildung von X nach Y , also eine Abbildung mit Definitionsbereich
X und Wertebereich Y ist. Die Schreibweise x 7→ y ist gleichbedeutend mit y = R(x); man sagt auch, dass R dem
Element x das Element y zuordnet. An Stelle des Großbuchstabens R bezeichnet man Abbildungen normalerweise
mit kleinen lateinischen oder griechischen Buchstaben (zum Beispiel f oder φ).
Ob eine Relation R auf der Menge R der reellen Zahlen eine Abbildung ist, ob also für jedes x ∈ R genau ein y ∈ R
mit (x, y) ∈ R existiert, lässt sich gut an der graphischen Darstellung von R erkennen.
—–
22
—–
Zum Beispiel ist S = {(x, y) ∈ R2 | y = x 2 } eine Abbildung, denn für jeden x-Wert (grün) gibt es genau einen
zugehörigen Punkt (x, y) ∈ S (rot), also genau ein y ∈ R mit (x, y) ∈ R. Dagegen ist T = {(x, y) ∈ R2 | x 2 + y 2 ≤ 1}
keine Abbildung, denn für einige x-Werte (zum Beispiel für x = 1,2) gibt es gar kein y mit (x, y) ∈ T . Für andere
x-Werte (zum Beispiel x = 0) gibt es dagegen gleich mehrere, sogar unendlich viele, zugehörige y-Werte, was bei
einer Abbildung ebenfalls nicht zulässig ist.
Als nächstes definieren wir zwei wichtige Operationen: die Einschränkung und die Komposition von Funktionen. Die
erste Operation läuft darauf hinaus, dass man den Definitionsbereich einer Funktion f verkleinert.
(2.4) Proposition Sind X , Y Mengen, f ⊆ X × Y eine Abbildung und U ⊆ X . Dann ist durch
f |U = {(x, y) ∈ f | x ∈ U} eine Abbildung von U nach Y definiert. Wir bezeichnen sie als die
Einschränkung von f auf die Teilmenge U.
Beweis:
Zu überprüfen ist, dass die Relation f |U ⊆ U × Y die Abbildungs-Eigenschaft besitzt. Wenn es für jedes
x ∈ X genau ein y ∈ Y mit (x, y) ∈ f gibt, dann gilt das erst recht für alle x ∈ U. Für x ∈ U ist aber (x, y) ∈ f
gleichbedeutend mit (x, y) ∈ f |U .
ƒ
(2.5) Proposition Seien X , Y, Z Mengen und f : X → Y , g : Y → Z zwei Abbildungen. Dann
ist g ◦ f = { (x, z) ∈ X × Z | ∃ y ∈ Y : (x, y) ∈ f ∧ ( y, z) ∈ g } eine Abbildung von X nach Z. Sie
wird als Komposition der Abbildungen f und g bezeichnet.
Beweis:
Zunächst zeigen wir, dass für jedes x ∈ X mindestens ein z ∈ Z mit (x, z) ∈ g ◦ f existiert. Sei dazu x ∈ X
vorgegeben. Weil f eine Abbildung ist, gibt es ein y ∈ Y mit (x, y) ∈ f . Auf Grund der Abbildungs-Eigenschaft von
g existiert auch ein z ∈ Z mit ( y, z) ∈ g. Aus (x, y) ∈ f und ( y, z) ∈ g folgt aber (x, z) ∈ g ◦ f .
—–
23
—–
Nun zeigen wir, dass es für jedes x ∈ X nicht mehr als ein z ∈ Z gibt, so dass (x, z) ∈ X × Y erfüllt ist. Sei x ∈ X
vorgegeben, und seien z1 , z2 ∈ Z mit (x, z1 ), (x, z2 ) ∈ g ◦ f . Zu zeigen ist z1 = z2 . Nach Definition von g ◦ f gibt es
y1 , y2 ∈ Y mit (x, y1 ), (x, y2 ) ∈ f und ( y1 , z1 ), ( y2 , z2 ) ∈ g. Weil aber f eine Abbildung ist, folgt aus (x, y1 ) ∈ f und
(x, y2 ) ∈ f die Gleichung y1 = y2 . Es gilt also ( y1 , z1 ), ( y1 , z2 ) ∈ g, und weil auch g eine Abbildung ist, erhalten wir
z1 = z2 wie gewünscht.
ƒ
Die Bildung der Komposition g ◦ f bedeutet praktisch formuliert einfach, dass f in g eingesetzt wird. Denn nach
Definition bedeutet z = (g ◦ f )(x) für beliebiges x ∈ X und z ∈ Z, dass ein y ∈ Y mit (x, y) ∈ f und ( y, z) ∈ g
existiert. Es gilt also y = f (x) und z = g( y), insgesamt also (g ◦ f )(x) = z = g( y) = g( f (x)).
Später werden wir häufig mit Abbildungen auf den reellen Zahlen arbeiten, zum Beispiel f : R → R, x 7→ x + 1 oder
g : R → R, x 7→ x 2 . Die Komposition von f und g ergibt in diesem Fall also
(g ◦ f )(x)
=
g( f (x))
=
g(x + 1)
=
(x + 1)2
für alle x ∈ R.
Man kann sich das Zusammenspiel von f , g und g ◦ f durch folgendes Diagramm veranschaulichen.
Eine Abbildung wirkt nicht nur auf einzelne Elemente, sondern auch auf Teilmengen ihres Definitions- und Bildbereichs. Die folgenden beiden Konzepte werden später bei der Formulierung der Ketten- und der Umkehrregel in der
Analysis eine wichtige Rolle spielen.
(2.6) Definition Seien f : X → Y eine Abbildung und U ⊆ X , V ⊆ Y .
(i) Die Teilmenge f (U) = { f (x) | x ∈ U} ⊆ Y wird die Bildmenge von U unter der Abbildung f genannt. Es handelt sich um die Elemente von Y , die man dadurch erhält, dass
man f auf ein Element aus U anwendet.
(ii) Die Teilmenge f −1 (V ) = {x ∈ X | f (x) ∈ V } ⊆ X wird die Urbildmenge von V unter f
genannt. Sie besteht aus genau den Elementen von X , die nach V abgebildet werden.
—–
24
—–
Wir betrachten als Beispiel die Abbildung f : X → Y zwischen den Mengen X = {−3, −2, −1, 0, 1, 2, 3} und Y =
{0, 1, 2, 3, 4, 9} gegeben durch f (x) = x 2 für alle x ∈ X . Seien U ⊆ X und V ⊆ Y gegeben durch U = {−1, 0} und
V = {3, 4, 9}.
Bestimmung der Bildmenge f (U)
Bestimmung der Urbildmenge f −1 (V )
Nach Definition besteht f (U) aus allen Elementen, die man durch Quadrierung von Elementen aus U = {−1, 0}
erhält, also (−1)2 = 1 und 02 = 0. Die Urbildmenge f −1 (V ) enthält alle Elemente x ∈ X , deren Quadrat in V =
{3, 4, 9} liegt. Wegen (−2)2 = 22 = 4 und (−3)2 = 32 = 9 sind dies die Zahlen −3, −2, 2, 3.
(2.7) Proposition
Sei f : X → Y eine Abbildung, U ⊆ X und V ⊆ Y . Dann gilt
(i) f ( f −1 (V )) ⊆ V
Beweis:
(ii) U ⊆ f −1 ( f (U))
zu (i) Ist y ∈ f ( f −1 (V )), dann gibt es nach Definition der Bildmenge ein x ∈ f −1 (V ) mit y = f (x). Aus
x ∈ f −1 (V ) folgt f (x) ∈ V , insgesamt also y = f (x) ∈ V .
zu (ii) Sei x ∈ U vorgegeben. Dann gilt f (x) ∈ f (U). Das Element x wird also auf ein Element aus f (U) abgebildet.
Nach Definition der Urbildmenge folgt daraus unmittelbar x ∈ f −1 ( f (U)).
ƒ
Anhand passender Beispiele werden wir uns in den Übungen klarmachen, dass die beiden Inklusionen in der Proposition im Allgemeinen keine Gleichungen sind, es braucht also weder f ( f −1 (V )) = V noch f −1 ( f (U)) = U zu
gelten. Die Operationen „Bildmenge“ und „Urbildmenge“ heben sich also nicht immer gegenseitig auf.
(2.8) Definition Sei f : X → Y eine Abbildung.
(i) Wenn für alle x 1 , x 2 aus f (x 1 ) = f (x 2 ) jeweils x 1 = x 2 folgt, dann nennt man die Abbildung injektiv.
(ii) Wenn für jedes y ∈ Y ein x ∈ X mit f (x) = y existiert, dann heißt die Abbildung
surjektiv.
(iii) Eine Abbildung f , die sowohl injektiv als auch surjektiv ist, bezeichnet man als bijektiv.
Die drei soeben definierten Eigenschaften von Abbildungen lassen sich auch mit Hilfe der Urbildmengen charakterisieren. Eine Abbildung ist genau dann injektiv, wenn f −1 ({ y}) für jedes y ∈ Y höchstens ein Element enthält. Zum
—–
25
—–
Beweis setzen wir die Injektivität voraus und geben uns ein beliebiges y ∈ Y vor. Sind nun x 1 , x 2 ∈ f −1 ({ y}), dann
gilt f (x 1 ) = y = f (x 2 ), und aus der Injektivität folgt x 1 = x 2 . Dies zeigt, dass f −1 ({ y}) keine zwei verschiedenen
Elemente enthält. Setzen wir umgekehrt voraus, dass f −1 ({ y}) für jedes y ∈ Y höchstens ein Element enthält, und
seien x 1 , x 2 ∈ X mit f (x 1 ) = f (x 2 ). Setzen wir y = f (x 1 ), dann sind x 1 , x 2 beides Elemente von f −1 ({ y}). Weil aber
f −1 ({ y}) nach Voraussetzung höchstens einelementig ist, muss x 1 = x 2 gelten. Damit ist die Injektivität bewiesen.
Auf ähnliche Weise zeigt man, dass die Surjektivität gleichbedeutend damit ist, dass f −1 ({ y}) für jedes y ∈ Y aus
mindestens einem Element besteht. Ebenfalls zur Surjektivität äquivalent ist die Gleichung f (X ) = Y , denn nach
Definition besteht f (X ) genau aus den Elementen y ∈ Y , für die ein x ∈ X mit f (x) = y existiert.
Aus den Feststellungen zur Injektivität und Surjektivität ergibt sich unmittelbar, dass eine Abbildung f : X → Y
genau dann bijektiv ist, wenn die Menge f −1 ({ y}) für jedes y ∈ Y jeweils genau ein Element enthält.
Wieder schauen wir uns die neuen Begriffe anhand einer Reihe von Beispielen an.
(i) Sei M = {1, 2, 3, 4} und N = {1, 2, 3, 4, 5}. Die Abbildung f : M → N mit f (a) = a für 1 ≤ a ≤ 4 ist injektiv.
Dafür müssen wir zeigen, dass die Aussage ∀x 1 , x 2 ∈ M : f (x 1 ) = f (x 2 ) ⇒ x 1 = x 2 gültig ist. Seien also
a1 , a2 ∈ M mit f (a1 ) = f (a2 ) vorgegeben. Dann gilt a1 = f (a1 ) = f (a2 ) = a2 , also ist die Implikation
f (a1 ) = f (a2 ) ⇒ a1 = a2 tatsächlich für alle a1 , a2 ∈ M erfüllt. Die Abbildung ist aber nicht surjektiv, denn es
gibt kein a ∈ M mit f (a) = 5.
(ii) Sei M = {1, 2, 3} und N = {1, 2}. Dann ist die Abbildung f : M → N gegeben durch 1 7→ 1, 2 7→ 2, 3 7→ 2
zwar surjektiv, aber nicht injektiv. Zwar gibt es für jedes b ∈ N = {1, 2} ein a ∈ M mit f (a) = b ( f (1) = 1,
f (2) = 2), aber die Implikation f (a1 ) = f (a2 ) ⇒ a1 = a2 ist beispielsweise für a1 = 2, a2 = 3 nicht erfüllt.
(iii) Die Abbildung f : R → R, x 7→ x 2 ist weder injektiv noch surjektiv. Die Implikation f (a1 ) = f (a2 ) ⇒ a1 = a2
ist beispielsweise für a1 = −1, a2 = 1 nicht erfüllt, und es gibt kein a ∈ R mit f (a) = −1.
(iv) Die Abbildung f : R → R, x 7→ x + 1 ist bijektiv. Zunächst zeigen wir die Injektivität. Sind a1 , a2 ∈ R beliebig
vorgegeben, dann gelten die Implikationen
f (a1 ) = f (a2 )
⇒
a1 + 1 = a2 + 1
⇒
a1 = a2
,
also ist ∀x 1 , x 2 ∈ R : f (x 1 ) = f (x 2 ) ⇒ x 1 = x 2 wahr. Ist b ∈ R beliebig vorgegeben, dann setzen wir a = b−1
und erhalten f (a) = f (b − 1) = (b − 1) + 1 = b. Für jedes b ∈ R gibt es also ein a ∈ R mit f (a) = b, d.h. die
Aussage ∀ y ∈ R : ∃x ∈ R : f (x) = y ist erfüllt.
—–
26
—–
(v) Für jede Menge X nennt man idX : X → X , x 7→ x die identische Abbildung oder Identität auf der Menge X .
Sie ist offenbar ebenfalls bijektiv.
(2.9) Satz
Die Komposition zweier injektiver (bzw. surjektiver, bijektiver) Abbildungen ist
injektiv (bzw. surjektiv, bijektiv).
Beweis:
Seien X , Y, Z Mengen und f : X → Y , g : Y → Z Abbildungen. Zunächst setzen wir voraus, dass f und g
injektiv sind und beweisen die Injektivität von g ◦ f . Seien dazu x 1 , x 2 ∈ X mit (g ◦ f )(x 1 ) = (g ◦ f )(x 2 ) vorgegeben.
Nach Definition der Komposition ◦ ist dies gleichbedeutend mit g( f (x 1 )) = g( f (x 2 )). Weil g injektiv ist, folgt daraus
f (x 1 ) = f (x 2 ). Weil auch f injektiv ist, erhalten wir x 1 = x 2 . Damit ist die Injektivität von g ◦ f bewiesen.
Nun setzen wir voraus, das f und g surjektiv sind, und beweisen die Surjektivität von g ◦ f . Sei z ∈ Z vorgegeben.
Zu zeigen ist, dass ein x ∈ X mit (g ◦ f )(x) = z existiert. Weil g surjektiv ist, gibt es ein y ∈ Y mit g( y) = z. Weil
auch f surjektiv ist, existiert ein x ∈ X mit f (x) = y. Insgesamt gilt also (g ◦ f )(x) = g( f (x)) = g( y) = z. Damit ist
die Surjektivität von g ◦ f bewiesen.
Setzen wir nun voraus, dass f und g bijektiv sind. Dann sind f und g insbesondere injektiv, und wie wir im ersten
Absatz gezeigt haben, folgt daraus die Injektivität von g ◦ f . Die Abbildung f und g sind auch beide surjektiv. Wie
im zweiten Absatz gezeigt, folgt daraus die Surjektivität von g ◦ f . Als injektive und surjektive Abbildung ist g ◦ f
also insgesamt bijektiv.
ƒ
Oft werden wir auch die folgende Charakterisierung injektiver, surjektiver und bijektiver Abbildungen verwenden.
(2.10) Satz Seien X , Y nichtleere Mengen und f : X → Y eine Abbildung.
(i) Es ist f genau dann injektiv, wenn eine Abbildung g : Y → X mit g ◦ f = idX existiert.
(ii) Sie ist genau dann surjektiv, wenn es ein g : Y → X mit f ◦ g = idY gibt.
(iii) Sie ist bijektiv genau dann, wenn ein g : Y → X mit den Eigenschaften g ◦ f = idX und
f ◦ g = idY existiert. Die Abbildung g mit diesen beiden Eigenschaften ist dann eindeutig
bestimmt. Man nennt sie die Umkehrabbildung von f und bezeichnet sie mit f −1 .
Beweis:
zu (i)
„⇒“
Sei f : X → Y eine injektive Abbildung und x 0 ∈ X ein beliebig gewähltes Element. Gibt
es für y ∈ Y ein Urbild von x ∈ X , so ist dieses eindeutig bestimmt, und wir definieren g( y) = x. Besitzt y dagegen
kein Urbild, dann setzen wir g( y) = x 0 . Ist nun x ∈ X und y = f (x), dann ist x das eindeutig bestimmte Urbild
von y, und nach Definition von g gilt (g ◦ f )(x) = g( f (x)) = g( y) = x = idX (x). Also besitzt g die gewünschte
Eigenschaft g ◦ f = idX .
—–
27
—–
Sei f : X → Y eine Abbildung und g : Y → X mit g ◦ f = idX . Wir müssen zeigen, dass f injektiv ist. Seien
„⇐“
dazu x 1 , x 2 ∈ X Elemente mit f (x 1 ) = f (x 2 ). Dann gilt
x 1 = idX (x 1 ) = (g ◦ f )(x 1 ) = g( f (x 1 )) = g( f (x 2 )) = (g ◦ f )(x 2 ) = idX (x 2 ) = x 2 .
Also ist f tatsächlich injektiv.
zu (ii)
„⇒“
−1
xy ∈ f
Sei f : X → Y eine surjektive Abbildung. Für jedes y ∈ Y wählen wir ein beliebiges Urbild
({ y}) und definieren g( y) = x y . Für jedes y ∈ Y gilt dann ( f ◦ g)( y) = f (g( y)) = f (x y ) = y = idY ( y),
also besitzt g die gewünschte Eigenschaft.
Sei f : X → Y eine Abbildung und g : Y → X mit f ◦ g = idY . Um die Surjektivität von f nachzuweisen,
„⇐“
müssen wir zeigen, dass es für jedes y ∈ Y ein x ∈ X mit f (x) = y existiert. Ein solches Element x ist durch
x = g( y) gegeben, denn es gilt f (g( y)) = ( f ◦ g)( y) = idY ( y) = y.
zu (iii)
„⇐“
Sei f : X → Y eine Abbildung und g : Y → X mit g ◦ f = idX und f ◦ g = idY . Dann ist f nach (i)
injektiv, nach (ii) surjektiv, insgesamt also bijektiv.
„⇒“
Sei f : X → Y eine bijektive Abbildung. Dann gibt es nach (i) eine Abbildung g1 : Y → X mit g1 ◦ f = idX und
nach (ii) eine Abbildung g2 : Y → X mit f ◦ g2 = idY . Wir zeigen, dass g1 = g2 gilt. Für gegebenes y ∈ Y erhalten
wir auf Grund unserer Voraussetzungen
g1 ( y) = g1 (idY ( y)) = g1 (( f ◦ g2 )( y)) = g1 ( f (g2 ( y))) = (g1 ◦ f )(g2 ( y)) = idX (g2 ( y)) = g2 ( y).
Also gilt tatsächlich g1 = g2 , d.h. g = g1 ist eine Abbildung mit den beiden gewünschten Eigenschaften. Sei nun
h : Y → X eine weitere Abbildung mit h ◦ f = idX und f ◦ h = idY . Aus g ◦ f = idX und f ◦ h = idY folgt dann, wie
soeben gezeigt, die Identität g = h. Also ist g eindeutig bestimmt.
ƒ
Eine wichtige Anwendung der Abbildungen ist die Definition der Mächtigkeit einer Menge. Für jedes n ∈ N sei
Mn = {1, 2, ..., n} jeweils die Menge der natürlichen Zahlen k mit 1 ≤ k ≤ n. Außerdem setzen wir M0 = ∅.
(2.11) Definition Sei n ∈ N0 . Man sagt, eine Menge A besteht aus n Elementen oder hat die
Mächtigkeit n, falls eine bijektive Abbildung ϕ : Mn → A existiert. Wir schreiben dann |A| = n.
(2.12) Definition Eine Menge A ist endlich, falls ein n ∈ N0 mit |A| = n existiert. Ansonsten
bezeichnen wir die Menge A als unendlich.
Wir müssen sicherstellen, dass unsere Definition der Mächtigkeit einer endlichen Menge eindeutig ist, dass also nicht
|A| = m und |A| = n für zwei verschiedene Zahlen m, n ∈ N0 gilt. Dies erfordert ein wenig Aufwand.
—–
28
—–
(2.13) Lemma
Sei A eine beliebige Menge, und seien a, b ∈ A zwei verschiedene Elemente.
Dann ist die Abbildung τab : A → A gegeben durch

b falls x = a



τab (x) =
a falls x = b



x sonst
eine Bijektion.
(Die Abbildung τab vertauscht die beiden Elemente a und b miteinander, alle übrigen Elemente
werden auf sich selbst abgebildet.)
Beweis:
Zunächst beweisen wir die Surjektivität. Sei y ∈ A vorgegeben. Ist y = a, dann gilt τab (b) = y. Im
Fall y = b ist τab (a) = y, und im verbleibenden Fall y ∈
/ {a, b} gilt τab ( y) = y. Also liegt y auf jeden Fall in der
Bildmenge der Abbildung τab . Zum Nachweis der Injektivität seien u, v ∈ A mit τab (u) = τab (v) vorgegeben. Ist
τab (u) = τab (v) = a, dann muss u = v = b gelten. Im Fall τab (u) = τab (v) = b gilt u = v = a. Ist schließlich τab (u)
nicht in {a, b} enthalten, dann folgt u = τab (u) = τab (v) = v.
ƒ
Für den Beweis der nächsten Aussage bemerken wir vorweg, dass die vollständige Induktion aus §1 statt über N
auch über N0 = N ∪ {0} geführt werden kann, wenn man den Induktionsanfang bei n = 0 ansetzt.
(2.14) Proposition Sei n ∈ N0 . Dann ist jede injektive Abbildung Mn → Mn auch surjektiv.
Beweis:
Wir beweisen die Aussage durch vollständige Induktion über n ∈ N0 . Die einzige Abbildung von M0 nach
M0 ist wegen M0 = ∅ die leere Menge, und diese ist nach Definition sowohl injektiv als auch surjektiv (also bijektiv).
Damit ist die Aussage für n = 0 bewiesen.
Sei nun n ∈ N0 vorgegeben und ψ : Mn+1 → Mn+1 eine injektive Abbildung. Zu zeigen ist, dass ψ auch surjektiv
ist. Zunächst betrachten wir den Fall, dass ψ(n + 1) = n + 1 ist. Dann gilt ψ(Mn ) ⊆ Mn . Denn wäre dies nicht
der Fall, dann gäbe es ein k ∈ Mn mit ψ(k) = n + 1, was aber wegen ψ(k) = n + 1 = ψ(n + 1) im Widerspruch
zur Injektivität von ψ stehen würde. Mit ψ ist auch die Einschränkung ψ| Mn injektiv. Es handelt sich also um eine
injektive Abbildung Mn → Mn ; laut Induktions- voraussetzung ist diese auch surjektiv. Daraus folgt ψ(Mn ) = Mn .
Wegen ψ(n+1) = n+1 ist damit insgesamt gezeigt, dass jedes Element in Mn+1 von ψ getroffen wird, die Abbildung
ψ also surjektiv ist. Damit ist die Betrachtung dieses Falls abgeschlossen.
Betrachten wir nun den Fall, dass ψ(n + 1) = k mit k ∈ Mn gilt. Weil τk,n+1 nach (2.13) bijektiv ist, ist nach (2.9)
mit ψ auch die Abbildung ψ̃ = τk,n+1 ◦ ψ injektiv; darüber hinaus gilt
ψ̃(n + 1)
=
(τk,n+1 ◦ ψ)(n + 1)
=
τk,n+1 (ψ(n + 1))
=
τk,n+1 (k)
=
n + 1.
Wie im vorherigen Absatz gezeigt, folgt daraus, dass ψ̃ surjektiv ist. Aber damit ist auch ψ = τ−1
◦ ψ̃ surjektiv.
k,n+1
Damit ist der Induktionsschritt abgeschlossen.
ƒ
—–
29
—–
Aus (2.14) folgt nun in der Tat die Eindeutigkeit von |A| für eine endliche Menge A. Denn nehmen wir an, es gäbe
m, n ∈ N0 mit m < n und der Eigenschaft, dass sowohl |A| = m als auch |A| = n erfüllt ist. Dann gäbe es Bijektionen
ϕ : Mm → A und ψ : Mn → A. Nach (2.9) wäre dann durch α = ϕ −1 ◦ ψ eine bijektive Abbildung Mn → Mm gegeben.
Wegen Mm ⊆ Mn können wir α als injektive Abbildung Mn → Mn auffassen. Wegen α(Mn ) = Mm ( Mn ist α als
Abbildung Mn → Mn jedoch nicht surjektiv. Wir haben also eine injektive, nicht surjektive Abbildung Mn → Mn
konstruiert. Aber die Existenz einer solchen Abbildung ist nach (2.14) ausgeschlossen. Also war unsere Annahme
falsch, es kann nicht gleichzeitig |A| = m und |A| = n gelten.
(2.15) Proposition Zwei endliche Mengen A, B haben genau dann dieselbe Mächtigkeit, wenn
eine Bijektion A → B existiert.
Beweis:
„⇒“
Sei n ∈ N0 mit |A| = n = |B|. Die Gleichung |A| = n bedeutet, dass eine bijektive Abbildung
ϕ : Mn → A existiert. Aus |B| = n folgt, dass es eine Bijektion ψ : Mn → B gibt. Nach (2.9) ist durch ψ ◦ ϕ −1 eine
Bijektion von A nach B gegeben.
„⇐“ Weil A endlich ist, gibt es ein n ∈ N0 und eine Bijektion ϕ : Mn → A. Außerdem existiert nach Voraussetzung
eine Bijektion ψ : A → B. Somit ist ψ ◦ ϕ eine Bijektion Mn → B, und daraus folgt |B| = n = |A|.
(2.16) Proposition
ƒ
Eine Menge A ist genau dann unendlich, wenn eine injektive Abbildung
N → A existiert.
Beweis:
„⇐“
Nehmen wir an, es gibt eine injektive Abbildung ψ : N → A, obwohl A endlich ist. Setzen wir
|A| = n, dann existiert also eine bijektive Abbildung ϕ : Mn → A. Durch Einschränkung von ψ auf Mn+1 erhalten wir
eine injektive Abbildung Mn+1 → A. Durch α = ϕ −1 ◦(ψ| Mn+1 ) ist dann eine injektive Abbildung Mn+1 → Mn gegeben.
Aufgefasst als Abbildung Mn+1 → Mn+1 ist diese injektiv, aber nicht surjektiv wegen α(Mn+1 ) = Mn ( Mn+1 . Da nach
(2.14) eine solche Abbildung nicht existiert, war unsere Annahme falsch. Wenn eine injektive Abbildung ψ : N → A
existiert, muss A also unendlich sein.
„⇒“
Nun setzen wir voraus, dass A unendlich ist. Wir konstruieren eine Abbildung ψ : N → A, indem wir die
Bilder ψ(n) der Reihe nach definieren. Zunächst wählen wir ein beliebiges Element a ∈ A und setzen ψ(1) = a.
Diese Abbildung ist offenbar injektiv. Sei nun n ∈ N, und nehmen wir an, dass ψ auf der Teilmenge Mn ⊆ N bereits
definiert und dort injektiv ist. Wäre ψ(Mn ) = A, dann hätten wir eine Bijektion zwischen Mn und A. Die Menge A
wäre dann endlich, im Widerspruch zur Annahme. So aber können wir ein neues Element a ∈ A\ ψ(Mn ) wählen und
ψ(n + 1) = a setzen. Dann ist ψ auf Mn+1 weiterhin injektiv, denn wegen der Injektivität von ψ| Mn ist ψ(k) = ψ(`)
für k < ` und k, ` ∈ Mn ausgeschlossen. Wegen ψ(n + 1) = a ∈
/ ψ(Mn ) ist k ∈ Mn und ` = n + 1 ebenfalls unmöglich.
Wir erhalten so eine Abbildung ψ, die auf ganz N definiert ist. Auch diese ist injektiv. Wäre nämlich ψ(k) = ψ(`)
für zwei k, ` ∈ N mit k < `, dann würde sich ein Widerspruch zur Injektivität von ψ| M` ergeben.
—–
30
—–
ƒ
Wir beweisen nun ein einige Rechenregeln für die Mächtigkeit endlicher Mengen.
(2.17) Satz
(i) Sind A und B endliche disjunkte Mengen, ist also A ∩ B = ∅, dann gilt |A ∪ B| = |A| + |B|.
(ii) Ist B endlich und A ⊆ B, dann gilt |A| ≤ |B| und |B \ A| = |B| − |A|.
(iii) Sind A und B beliebige endliche Mengen, dann gilt
|A ∪ B| = |A| + |B| − |A ∩ B| und |A × B| = |A| × |B|.
(iv) Für jede endliche Menge A gilt |P (A)| = 2|A| .
Ist A also eine endliche Menge, dann ist sowohl P (A) als auch jede Teilmenge von A endlich.
Beweis:
zu (i) Sei m = |A| und n = |B|. Dann gibt es Bijektionen ϕ : Mm → A und ψ : Mn → B. Wir definieren
nun eine Abbildung α : Mm+n → A ∪ B durch α(k) = ϕ(k) für 1 ≤ k ≤ m und α(k) = ψ(k − m) für m + 1 ≤ k ≤ n.
Wenn wir zeigen können, dass α bijektiv ist, dann folgt daraus |A ∪ B| = m + n = |A| + |B|.
Zum Nachweis der Injektivität seien k, ` ∈ Mm+n mit α(k) = α(`) vorgegeben. Ist k ∈ Mm , dann muss auch ` ∈ Mm
gelten, denn ansonsten wäre α(k) = α(`) ein Element von A ∩ B, was wegen A ∩ B = ∅ ausgeschlossen ist. Nach
Definition der Abbildung α folgt daraus ϕ(k) = α(k) = α(`) = ϕ(`), und weil ϕ injektiv ist, erhalten wir k = `. Ist
k > m, dann folgt wegen A ∩ B = ∅ ebenso ` > m. Wir erhalten α(k) = ψ(k − m) = ψ(` − m) = α(`) und wiederum
k = `, diesmal auf Grund der Injektivität von ψ.
Zum Nachweis der Surjektivität sei x ∈ A ∩ B vorgegeben. Dann gilt x ∈ A oder x ∈ B. Ist x ∈ A, dann gibt es ein
k ∈ Mm mit ϕ(k) = x. Daraus folgt α(k) = x. Gilt dagegen x ∈ B, so existiert ein k ∈ Mn mit ψ(k) = x, und wir
erhalten α(k + m) = x. Damit ist die Surjektivität bewiesen, insgesamt ist α also bijektiv.
zu (ii) Sei n = |B|. Zum Beweis von |A| ≤ n nehmen wir an, dass A unendlich ist oder zumindest |A| ≥ n + 1 gilt.
Im ersten Fall gibt es nach (2.16) eine injektive Abbildung N → A, im zweiten eine bijektive Abbildung M r → A für
ein r ≥ n + 1. In beiden Fällen können wir die Abbildung zu einer injektiven Abbildung Mn+1 → A einschränken,
die wir wegen A ⊆ B auch als injektive Abbildung ϕ : Mn+1 → B betrachten können. Wegen |B| = n gibt es nun
eine Bijektion ψ : Mn → B. Durch ψ−1 ◦ ϕ ist dann eine injektive Abbildung Mn+1 → Mn definiert. Fassen wir diese
als Abbildung α : Mn+1 → Mn+1 auf, so ist α zwar injektiv, wegen α(Mn+1 ) = Mn ( Mn+1 aber nicht surjektiv. Die
Existenz einer solchen Abbildung ist durch (2.14) ausgeschlossen. Also war unsere Annahme falsch, und |A| ≤ n ist
bewiesen. Weil die Menge B disjunkt in A und B \ A zerlegt werden kann, gilt nach Teil (i) |B| = |A| + |B \ A|, also
|B \ A| = |B| − |A|.
—–
31
—–
zu (iii)
Zum Beweis der ersten Gleichung zerlegen wir |A ∪ B| disjunkt in die Teilmengen A ∩ B, A \ (A ∩ B) und
B \ (A ∩ B). Durch Anwendung von (i) und (ii) erhalten wir
|A ∪ B|
=
|A ∩ B| + |A \ (A ∩ B)| + |B \ (A ∩ B)|
=
=
|A ∩ B| + (|A| − |A ∩ B|) + (|B| − |A ∩ B|)
|A| + |B| − |A ∩ B|.
Die Gleichung |A × B| = |A| · |B| beweisen wir durch vollständige Induktion über n = |B|. Ist n = 0, dann gilt B = ∅
und A× B = ∅, also |A× B| = 0 = |A|·0 = |A|·|B|. Ist n = 1, dann gilt B = {b} für ein b ∈ B. Wir bemerken, dass durch
A → A × B, a 7→ (a, b) eine Bijektion gegeben ist. Denn aus (a1 , b) = (a2 , b) folgt a1 = a2 , also ist die Abbildung
injektiv. Andererseits hat jedes Element in A×B die Form (a, b) für ein a ∈ A, stimmt also mit dem Bild von a überein.
Daraus folgt die Surjektivität. Insgesamt ist die Abbildung bijektiv. Mit (2.15) erhalten wir |A × B| = |A| = |A| · |B|.
Sei nun n ∈ N vorgegeben, und setzen wir die Aussage für dieses n voraus. Sei |B| = n + 1, b ∈ B ein beliebig
gewähltes Element und B 0 = B \ {b}. Nach (i) gilt |B 0 | = |B| − 1 = n, und die Induktionsvoraussetzung liefert
|A × B 0 | = |A| · n. Weil A × B sich disjunkt in die Teilmengen A × B 0 und A × {b} zerlegen lässt, gilt
|A × B|
=
|A × B 0 | + |A × {b}|
=
|A| · n + |A|
=
|A|(n + 1)
=
|A| · |B|.
zu (iv) Der Beweis erfolgt durch vollständige Induktion über n = |A|. Ist n = 0, dann gilt A = ∅. Die leere Menge
besitzt nur eine Teilmenge, nämlich ∅. Es gilt also P (A) = {∅} und somit |P (A)| = 1 = 20 .
zum Induktionsschritt im Beweis von (2.17)(iv)
Sei nun n ∈ N0 , und setzen wir die Aussage für n voraus. Sei nun A eine (n + 1)-elementige Menge. Zu zeigen ist
|P (A)| = 2n+1 . Dazu wählen wir ein beliebiges Element a ∈ A und setzen A0 = A \ {a}. Dann gilt |A0 | = n, und nach
Induktionsvoraussetzung gilt |P (A0 )| = 2n . Wir betrachten nun die disjunkte Zerlegung P (A) = S ∪ T mit
S
=
{B ∈ P (A) | a ∈
/ B}
—–
und
T
32
—–
=
{B ∈ P (A) | a ∈ B}.
Nach Definition gilt S = P (A0 ), denn die Teilmengen von A0 sind genau die Teilmengen B ⊆ A mit a ∈
/ B. Zwischen
den Mengen S und T ist durch φ : S → T , B 7→ B ∪ {a} eine Bijektion gegeben, denn ψ : T → S , B 7→ B \ {a} ist
offenbar die Umkehrabbildung von φ. Nach (2.15) folgt daraus |S | = |T |. Wir erhalten nun
|P (A)|
=
|S | + |T |
=
2|S |
=
2|P (A0 )|
=
2 · 2n
=
2n+1 .
Damit ist der Induktionsschritt abgeschlossen.
(2.18) Definition
ƒ
Für jede Menge B und jedes k ∈ N0 sei Pk (B) jeweils die Anzahl der k-
elementigen Teilmengen von B, also
¨
Pk (B)
Für alle k, n ∈ N0 definieren wir
n
k
=
«
A ∈ P (B) |A| = k .
= |Pk (Mn )| und bezeichnen diese Zahl als den Binomial-
koeffizienten von n über k.
Beispielsweise ist
5
3
= 10, denn M5 = {1, 2, 3, 4, 5} hat genau zehn dreielementige Teilmengen, nämlich
{1, 2, 3} , {1, 2, 4} , {1, 2, 5} , {1, 3, 4} , {1, 3, 5} , {1, 4, 5} , {2, 3, 4} , {2, 3, 5} , {2, 4, 5} , {3, 4, 5}.
Einige Binomialkoeffizienten lassen sich direkt angeben. Für alle k, n ∈ N0 gilt
n
n
n
n
n
=1 ,
= n und
=
falls k ≤ n, außerdem
= 0 falls k > n.
0
1
k
n−k
k
n
Die Gleichung 0 = 1 ergibt sich aus der Feststellung, dass Mn nur eine nullelementige Teilmenge besitzt, nämlich
die leere Menge. Für n ∈ N0 mit n ≥ 1 sind die einelementigen Teilmengen von Mn offenbar genau die Mengen
n
{1}, {2}, ..., {n}, daraus folgt n = 1. Sind k, n ∈ N0 mit k > n, dann gibt es nach (2.17) (i) keine k-elementigen
n
Teilmengen von |Mn |. Daraus folgt k = 0 für k > n.
Die Gleichung
n
k
=
n n−k
ist für k ≤ n ergibt sich durch folgende Überlegung: Ist A ⊆ Mn eine k-elementige
Teilmenge, dann ist Mn \ A nach nach (2.17) (ii) eine n − k elementige Teilmenge. Durch Φ : A 7→ Mn \ A ist also eine
Abbildung Pk (Mn ) → Pn−k (Mn ) gegeben. Diese besitzt Pn−k (Mn ) → Pk (Mn ), B 7→ Mn \ B als Umkehrabbildung.
Denn wegen n − (n − k) = k ist Mn \ B für jedes B ∈ Pn−k (Mn ) in Pk (Mn ) enthalten, und wegen Mn \ (Mn \ A) = A,
Mn \ (Mn \ B) = B für alle A ∈ Pk (Mn ) und B ∈ Pn−k (Mn ) sind die beiden Abbildungen tatsächlich zueinander invers.
Die folgenden beiden Aussagen ermöglichen die Berechnung beliebiger Binomialkoeffizienten.
(2.19) Proposition Seien k, n ∈ N0 , wobei k ≥ 1 ist. Dann gilt
n
n
n+1
=
+
.
k
k
k−1
—–
33
—–
Beweis:
Wir betrachten die disjunkte Zerlegung von Pk (Mn+1 ) = S ∪ T in die Teilmengen
¨
«
¨
«
S
=
A ∈ Pk (Mn+1 ) n + 1 ∈ A
und
T
=
A ∈ Pk (Mn+1 ) n + 1 ∈
/A
,
wobei T = Pk (Mn ) ist. Offenbar handelt es sich bei φ : Pk−1 (Mn ) → S , A 7→ A ∪ {n} um eine Bijektion, denn
ψ : S → Pk−1 (Mn ), B 7→ B \ {n} ist eine Umkehrabbildung von φ. Daraus folgt |Pk (Mn )| = |S |, und insgesamt
n+1
n
n erhalten wir k = |Pk (Mn+1 )| = |S | + |T | = |Pk (Mn )| + |Pk−1 (Mn )| = k + k−1 .
ƒ
n
Aus dieser Formel ergibt sich als Berechnungsschema das sogenannte Pascalsche Dreieck. Ist ` für jedes ` ∈ N0
n+
bereits bekannt, dann lässt sich der Wert k dadurch berechnen, dass man die im Dreieck unmittelbar darüber
n n
stehenden Werte k−1 und k einfach addiert.
0
0
1
1
0
1
1
3
3
1
2
1
3
2
3
1
3
0
1
2
2
2
1
2
0
1
1
3
3
1
Um eine explizite, nicht-rekursive Formel für die Binomialkoeffizienten anzugeben, benötigen wir die Fakultätsfunktion. Es handelt sich dabei um eine Abbildung N0 → N, n 7→ n!, die rekursiv definiert ist durch
0!
=
1
(n + 1)!
und
=
(n + 1) · n!
für alle
n ∈ N0 .
Es gilt also 1! = 1·0! = 1, 2! = 2·1! = 2, 3! = 3·2! = 6, 4! = 4·3! = 24, 5! = 5·4! = 120 usw. Insgesamt handelt es sich
um eine sehr schnell wachsende Funktion. Zum Beispiel ist 30! = 265.252.859.812.191.058.636.308.480.000.000,
das sind immerhin schon 33 Dezimalstellen.
(2.20) Satz Für alle k, n ∈ N0 mit k ≤ n gilt
n
n!
=
k
k!(n − k)!
.
Wir beweisen die Aussage durch vollständige Induktion über n ∈ N0 , jeweils für alle k ∈ N0 mit k ≤ n.
0
0!
Für n = k = 0 folgt die Gleichung aus 0 = 1 = 0!·0!
erfüllt. Sei nun n ∈ N0 beliebig vorgegeben, und setzen wir die
Beweis:
Gleichung für dieses n und alle k ∈ N0 mit k ≤ n voraus. Unter dieser Voraussetzung beweisen wir die Gleichung
n+1
(n+1)!
für n + 1 und 1 ≤ k ≤ n + 1. Ist k = 0, so gilt 0 = 1 = 0!(n+1)! . Für 1 ≤ k ≤ n folgt die Gleichung mit Hilfe von
(2.19) aus der Rechnung
n+1
k
=
n!(n − k + 1)
k!(n − k)!(n − k + 1)
n
k
+
+
n
k−1
=
n!k
k(k − 1)!(n − k + 1)!
—–
n!
k!(n − k)!
=
34
+
n!
(k − 1)!(n − k + 1)!
n!((n − k + 1) + k)
k!(n − k + 1)!
—–
=
=
(n + 1)!
k!(n + 1 − k)!
.
Der einzige verbleibende Fall ist k = n + 1. Weil Mn+1 die einzige (n + 1)-elementige Menge von Mn+1 ist, gilt
n+1
(n+1)!
= |Pn+1 (Mn+1 )| = 1, und ebenso ist (n+1)!0! gleich 1.
ƒ
n+1
Nachdem wir uns bis jetzt mit der Mächtigkeit endlicher Mengen beschäftigt haben, wenden wir uns nun den unendlichen Mengen zu.
(2.21) Definition Wir bezeichnen zwei Mengen A und B als gleichmächtig (oder als Mengen
mit gleicher Mächtigkeit) und schreiben |A| = |B|, wenn eine Bijektion φ : A → B existiert.
Mit Hilfe dieser Definition können nun auch verschiedene Arten von unendlichen Mengen gegeneinander abgegrenzt
werden.
(2.22) Definition
Eine Menge A wird abzählbar unendlich genannt, wenn sie die gleiche
Mächtigkeit wie N0 besitzt. Eine Menge, die endlich oder abzählbar unendlich ist, nennen wir
höchstens abzählbar. Eine Menge, die nicht höchstens abzählbar ist, bezeichnet man als überabzählbar.
Als erstes bemerken wir
(2.23) Proposition Abzählbar unendliche Mengen sind unendlich.
Nehmen wir an, dass eine Menge A zugleich endlich und abzählbar uendlich ist. Dann gibt es einerseits
Beweis:
ein n ∈ N0 mit |A| = n, also eine Bijektion ϕ : Mn → A, und andererseits eine Bijektion ψ : N0 → A. Sei ψn+1 die
Einschränkung von ψ auf Mn+1 ; dann wäre ϕ −1 ◦ ψn+1 : Mn+1 → Mn eine injektive Abbildung von Mn+1 in eine
echte Teilmenge von Mn+1 . Aber eine solche Abbildung kann es nach (2.14) nicht geben.
ƒ
Genau wie bei den endlichen Mengen sehen wir uns nun an, unter welchen Mengenoperationen die Abzählbarkeit
erhalten bleibt.
(2.24) Lemma Jede unendliche Teilmenge von N ist abzählbar unendlich.
Beweis:
zu (i)
Sei A ⊆ N eine unendliche Teilmenge. Wir definieren eine injektive Abbildung ϕ : N → A durch
folgende Rekursionsvorschrift: Wie in den Übungen mit dem Induktionsprinzip gezeigt wurde, besitzt jede nichtleere
Teilmenge von N ein kleinstes Element. Bezeichnet a1 das kleinste Element in A, dann setzen wir ϕ(1) = a1 . Sei
nun n ∈ N und nehmen wir nun an, dass ϕ(k) für 1 ≤ k ≤ n bereits definiert wurde, und dass ϕ auf Mn = {1, ..., n}
injektiv ist.
—–
35
—–
Wäre die Menge A \ ϕ(Mn ) leer, dann würde daraus ϕ(Mn ) = A folgen. Damit wäre ϕ eine Bijektion zwischen Mn
und A, was aber der Voraussetzung widerspricht, dass A unendlich ist. So aber können wir in A \ ϕ(Mn ) ein kleinstes
Element b wählen und ϕ(n + 1) = b definieren. Offenbar ist ϕ auch auf Mn+1 injektiv. Denn nehmen wir an, es gäbe
Elemente k, ` ∈ Mn+1 mit k < ` und ϕ(k) = ϕ(`). Wegen der Injektivität von ϕ| Mn ist dies nur möglich, wenn k ∈ Mn
und ` = n + 1 ist. Aber dann ist ϕ(`) = ϕ(n + 1) = b ∈
/ ϕ(Mn ) und ϕ(k) ∈ ϕ(Mn ). Also können ϕ(k) und ϕ(`) nicht
übereinstimmen.
Insgesamt erhalten wir so eine Abbildung ϕ : N → A. Auch diese ist injektiv. Sind nämlich k, ` ∈ N mit k < `, dann
folgt aus der Injektivität von ϕ| M` sofort ϕ(k) 6= ϕ(`). Es bleibt zu zeigen, dass ϕ auch surjektiv ist. Nehmen wir an,
dies ist nicht der Fall. Dann existiert in A ein kleinstes Element a mit a ∈
/ ϕ(N). Seien a1 , ..., a r die endlich vielen
Elemente in A, die kleiner als a sind. Für jedes i ∈ {1, ..., r} gibt es ein ni ∈ N mit ϕ(ni ) = ai . Nach eventueller
Vertauschung der Elemente a1 , ..., a r können wir annehmen, dass n r unter den Zahlen a1 , ..., a r maximal ist. Daraus
folgt {a1 , ..., a r } ⊆ ϕ(Mn ) für n = n r . Wir behaupten nun, dass ϕ(n + 1) = a gelten muss, im Widerspruch zur
Annahme. Wegen A \ {a1 , ..., a r } ⊇ A \ ϕ(Mn ) ist a auch das kleinste Element in A \ ϕ(Mn ). Also ergibt sich die
Gleichung ϕ(n + 1) = a direkt aus unserer Rekursionsvorschrift.
ƒ
(2.25) Proposition
(i) Teilmengen höchstens abzählbarer Mengen sind höchstens abzählbar.
(ii) Sind A, B Mengen, ist A höchstens abzählbar und φ : A → B eine surjektive Abbildung,
dann ist auch B höchstens abzählbar.
zu (i)
Beweis:
Sei B eine höchstens abzählbare Menge und A ⊆ B. Ist B endlich, dann ist A nach (2.17) (i)
ebenfalls endlich und damit höchstens abzählbar. Wir können deshalb annehmen, dass B abzählbar unendlich ist.
Demnach gibt es eine Bijektion ϕ : B → N. Ist A endlich, dann ist A nach Definition höchstens abzählbar. Wir können
also annehmen, dass A unendlich ist. Auf Grund der Bijektivität von ϕ ist ϕ(A) eine unendliche Teilmenge von N.
Diese ist nach (2.24) abzählbar unendlich. Also ist auch A abzählbar unendlich, insbesondere höchstens abzählbar.
Nach (2.10) (ii) existiert eine Abbildung ψ : B → A mit ϕ ◦ ψ = idB , und nach (2.10) (i) ist diese
zu (ii)
Abbildung injektiv. Wie unter (i) gezeigt, ist ψ(B) als Teilmenge der höchstens abzählbaren Menge A ebenfalls
höchstens abzählbar. Weil ψ als injektive Abbildung eine zwischen B und ψ(B) bijektiv ist, ist auch B höchstens
abzählbar.
ƒ
(2.26) Satz
(i) Sind A und B abzählbar unendliche Menge, dann ist auch A × B abzählbar unendlich.
(ii) Ist I höchstens abzählbar, und ist (Ai )i∈I eine Familie bestehend aus lauter höchstens
S
abzählbaren Mengen Ai , dann ist auch die Vereinigung i∈I Ai höchstens abzählbar.
Beweis:
zu (i)
Zunächst führen wir den Beweis auf den Fall A = B = N zurück. Weil A und B abzählbar
unendlich sind, gibt es Bijektionen ϕ : N → A und ψ : N → B. Man überprüft leicht, dass dann die Abbildung
—–
36
—–
N × N → A × B, (m, n) 7→ (ϕ(m), ψ(n)) ebenfalls bijektiv ist. Wenn also N × N abzählbar unendlich ist, dann gilt
dasselbe für A × B. Es genügt also nachzuweisen, dass N × N abzählbar unendlich ist. Dazu geben wir ein injektive
Abbildung zwischen N × N und N an. Die grundlegende Idee besteht darin, die Paare in N × N nach dem folgenden
Schema durchzunummerieren.
(1, 1)
(1, 2)
(1, 3)
%
(2, 1)
%
(2, 2)
%
(3, 3)
%
(4, 1)
%
(2, 4)
%
(3, 2)
(1, 5)
%
(2, 3)
%
(3, 1)
(1, 4)
%
(4, 2)
%
(5, 1)
Dies wird realisiert durch die Abbildung φ : N2 → N, (m, n) 7→ n + 12 (m + n − 2)(m + n − 1) + n, die folgendermaßen
zu Stande kommt: In jeder Diagonale des angegebenen Schemas befinden sich die Paare (m, n) ∈ N2 mit konstanter
Summe m + n, wobei (m, n) jeweils auf der n-ten Position der (m + n − 1)-ten Diagonale landet. Die r-te Diagonale
hat für jedes r ∈ N jeweils genau r Einträge. Die Formel 1 + ... + r = 12 r(r + 1), die in (1.6) bewiesen wurde, zeigt,
dass die (m + n − 2) vorausgehenden Diagonalen insgesamt die Länge 12 (m + n − 2)(m + n − 1) haben. Also landet
das Element (m, n) im Schema auf der Position 12 (m + n − 2)(m + n − 1) + n.
Wir beweisen nun die Injektivität der Abbildung ψ. Dazu seien (m1 , n1 ), (m2 , n2 ) ∈ N2 mit φ(m1 , n1 ) = φ(m2 , n2 )
vorgegeben. Zu zeigen ist (m1 , n1 ) = (m2 , n2 ). Als erstes überprüfen wir, dass die Zahlen
r1 = m1 + n1 − 2
r 2 = m2 + n 2 − 2
und
übereinstimmen. Nehmen wir an, dass dies nicht der Fall ist und zum Beispiel r1 < r2 gilt. Dann ist φ(m1 , n1 ) ≤
1
r (r
2 1 1
+ 1) + r1 und φ(m2 , n2 ) ≥ 12 r2 (r2 + 1). Wir erhalten
φ(m2 , n2 ) − φ(m1 , n1 )
≥
1
r (r
2 2 2
=
+ 1) −
1 2
r
2 1
€1
Š
≥
+ 32 r1
Š
r (r + 1) + r1
2 1 1
+ 32 r1 + 1 −
€1
r2
2 1
1
(r
2 1
=
+ 1)(r1 + 2) −
1
€1
r (r + 1) + r1
2 1 1
Š
,
was der Voraussetzung φ(m1 , n1 ) = φ(m2 , n2 ) widerspricht. Also muss r1 = r2 gelten. Aus r1 = r2 folgt aber direkt
1
r (r + 1)
2 1 1
= 12 r2 (r2 + 1). Zusammen mit φ(m1 , n1 ) = φ(m2 , n2 ) ⇔ 21 r1 (r1 + 1) + n1 = 21 r2 (r2 + 1) + n2 folgt daraus
n1 = n2 und damit auch m1 = m2 . Damit ist die Injektivität bewiesen.
Wir haben somit gezeigt, dass N2 gleichmächtig zur Teilmenge ψ(N2 ) von N ist. Nach (2.24) ist N2 höchstens
abzählbar ist. Andererseits ist N0 × N0 unendlich; wäre dies nicht so, dann würde aus der Injektivität der Abbildung
N → N2 , m 7→ (m, 1) auch die Endlichkeit von N folgen, was nach (2.16) ausgeschlossen ist.
—–
37
—–
zu (ii)
Da I höchstens abzählbar ist, gibt es eine injektive Abbildung ϕ : I → N. Auf Grund der Injektivität gibt es
nach (2.10) (i) eine Abbildung ψ : N → I mit ϕ ◦ ψ = idN . Diese ist nach (2.10) (ii) surjektiv. Dasselbe Argument
liefert uns für jedes i ∈ I auch eine surjektive Abbildung ϕi : N → Ai . Wir behaupten nun, dass durch
[
Ai , (m, n) 7→ ϕψ(m) (n)
φ : N2 −→
i∈I
ebenfalls eine surjektive Abbildung gegeben ist. Ist nämlich a ∈
S
i∈I
Ai vorgegeben, dann gibt es i ∈ I mit a ∈ Ai ,
ein m ∈ N0 mit ψ(m) = i und ein n ∈ N0 mit ϕi (n) = a. Es folgt φ(m, n) = ϕψ(m) (n) = ϕi (n) = a. Nach (2.25) (ii)
S
ƒ
ist deshalb mit N2 auch die Menge i∈I Ai höchstens abzählbar.
Abbildungen können genutzt werden, um Elemente einer Menge A durch Elemente einer anderen Menge I zu indizieren. In diesem Zusammenhang bezeichnet man eine Abbildung ϕ : I → A auch als Familie von Elementen der
Menge A und I als Indexmenge der Familie. Man verwendet dann für die Abbildung ϕ die Notation (ai )i∈I , und das
Element ϕ(i) ∈ A bezeichnet man mit ai . Ist I = N oder N0 , dann nennt man die Familie auch eine Folge.
Beispielsweise wird durch a1 = 3, a2 = 5, a3 = 97, a4 = 3 eine Familie (ai )i∈I natürlicher Zahlen mit der Indexmenge
{1, 2, 3, 4} definiert. Durch die Festlegung an = n2 für alle n ∈ N erhält man eine Folge (an )n∈N natürlicher Zahlen,
nämlich die Folge der Quadratzahlen.
Familien werden verwendet, um auf die Elemente einer Menge A leichter zugreifen zu können (ähnlich wie die
Seitennummern einen leichteren Zugriff auf die Seiten eines Buchs ermöglichen). Man kann auf diese Weise auch
bestimmte Elemente von A auszeichnen oder sie (im Fall von I = N) in eine bestimmte Reihenfolge bringen. Zu
beachten ist dabei, dass die Abbildung I → A, i 7→ ai im allgemeinen weder injektiv noch surjektiv zu sein braucht.
Beispielsweise kann daseelbe Element von A in einer Familie auch mehrfach vorkommen, also ai = a j für verschiedene i, j ∈ I gelten.
Ein weiteres wichtiges Hilfsmittel in der Mathematik ist das Summenzeichen. Zur Vorbereitung führen wir die
folgende Notation ein: Ist I eine Menge, dann bezeichnen wir mit Pfin (I) die Menge der endlichen Teilmengen von
I. Es handelt sich um die Vereinigung sämltlicher Mengen Pk (I) mit k ∈ N0 .
(2.27) Satz
Sei I eine Menge und (ai )i∈I eine Familie natürlicher Zahlen mit Indexmenge I.
Dann gibt es eine eindeutig bestimmte Zuordnung
Pfin (I) → N0
,
J 7→
X
ai .
i∈J
mit den Eigenschaften
X
ai = 0,
i∈∅
X
i∈J∪K
ai =
X
ai = ak für alle k ∈ I und
i∈{k}
X
i∈J
aj +
X
ak
für J, K ∈ Pfin (I) mit J ∩ K = ∅.
i∈K
—–
38
—–
Der Beweis dieses Satzes erfolgt durch eine rekursive Definition des Summenzeichens. Zunächst definiert man das
P
Summenzeichen für die (einzige) nullelementige Teilmenge von I durch i∈∅ ai = 0. Sei nun n ∈ N0 , und nehmen
wir an, dass das Summenzeichen für n-elementige Teilmengen von I bereits definiert wurde. Ist nun |J| = n + 1 und
P
P
j ∈ J, dann ist J 0 = J \ { j} eine n-elementige Menge von I, und wir können i∈J ai = i∈J 0 ai + a j definieren.
Es muss allerdings noch überprüft werden, dass diese Definition unabhängig von der Auswahl des Elements j aus
P
J ist; dieselbe Vorgehensweise mit einem anderen j 0 ∈ J muss für i∈J ai denselben Wert liefern. Aus Zeitgründen verzichten wir auf die detaillierte Ausführung, zumal wir in erster Linie an der praktischen Verwendung des
Summenzeichens interessiert sind.
Ist (ai )i∈I besipielsweise eine Familie natürlicher Zahlen über einer zweielementigen Menge I = {k, `}, dann gilt
P
P
i∈I ai = ak + a` + am , und
i∈I ai = ak + a` . Für eine dreielementige Menge I = {k, `, m} erhält man entsprechend
so weiter. Besonders häufig verwenden als Indexmengen Teilmengen von Z der Form Mn = {1, 2, ..., n} mit n ∈ N
oder M r,s = {r, r + 1, ..., s − 1, s} mit r, s ∈ Z und r ≤ s. Außerdem bietet es sich an, M0 = ∅ und M r,s = ∅ für r > s
zu setzen. Ist nun (am )m∈Z eine Familie natürlicher Zahlen mit Z als Indexmenge, dann setzt man
n
X
X
=
ai
i=1
P7
s
X
und
ai
=
ai
i=r
i∈Mn
ai .
i∈M r,s
P4
ai = 0. Die Formel für die Summe der ersten n natürlichen
Pn
Zahlen aus Kapitel 1 kann mit dem Summenzeichen in der Form i=1 i = 21 n(n + 1) geschrieben werden.
Beispielsweise ist
i=3
ai = a3 +a4 +a5 +a6 +a7 und
X
(2.28) Proposition (i)
i=6
Seien (ai )i∈I , (bi )i∈I zwei Familien natürlicher Zahlen mit endlicher
Indexmenge I, und sei c ∈ N0 . Dann sind (ai + bi )i∈I und (cai )i∈I ebenfalls Familien natürlicher
Zahlen über I, und es gilt
X
(ai + bi )
=
X
i∈I
(ii)
ai +
i∈I
X
X
und
bi
i∈I
cai
=
i∈I
c
X
ai .
i∈I
Sei J eine weitere endliche Menge und ϕ : J → I eine Bijektion. Dann ist (c j ) j∈J mit
c j = aϕ( j) eine Familie natürlicher Zahlen mit Indexmenge J, und es gilt
X
=
cj
X
j∈J
=
aϕ( j)
X
j∈J
ai .
i∈I
Auch hier verzichten wir auf die Angabe eines Beweises. Die letzte Gleichung bezeichnet man als Umparametrisierung einer Summe. Für Anwendungen ist vor allem der folgende Spezialfall interessant: Für m, n, r ∈ Z mit
m ≤ n ist durch ϕ : Mm+r,n+r → Mm,n , j 7→ j − r eine Bijektion definiert, deren Umkehrabbildung offenbar durch
Mm,n → Mm+r,n+r , i 7→ i + r gegeben ist. Wir erhalten dann für eine beliebige Familie (ai )i∈Z die Gleichung
n
X
i=m
ai
=
X
ai
=
i∈Mm,n
X
aϕ( j)
j∈Mm+r,n+r
—–
39
—–
=
n+r
X
j=m+r
a j−r .
Ist besipielsweise (am )m∈Z gegeben durch am = m2 für alle m ∈ Z, dann gilt
5
X
32 + 42 + 52
=
ai
(6 − 3)2 + (7 − 3)2 + (8 − 3)2
=
8
X
=
i=3
a j−3 .
j=6
Als wichtige Anwendung des Summenzeichens beweisen wir eine Verallgemeinerung der aus der Schule bekannten
binomischen Formel (a + b)2 = a2 + 2a b + b2 auf beliebige Exponenten.
(2.29) Satz
(Binomischer Lehrsatz)
Für alle a, b, n ∈ N0 gilt die Gleichung (a + b)n =
n X
n
k
k=0
a n−k b k .
Wir beweisen die Gleichung durch vollständige Induktion über N. Für n = 0 ist die Gleichung offenbar
P0
0
0
erfüllt, denn einerseits gilt (a + b)0 = 1, andererseits aber auch k=0 k a0−k b k = 0 a0 b0 = 1 · 1 · 1 = 1. Sei nun
Beweis:
n ∈ N0 und die Gültigkeit der Gleichung für n vorausgesetzt. Dann gilt
(a + b)n+1
=
(a + b)(a + b)n
=
n X
n
(a + b)
k=0
=
a
n X
k=0
n
k
a n−k b k + b
n X
n
k
k=0
n X
=
a n−k b k
n
k
k=0
k
!
a n−k b k
a n+1−k b k +
n X
n
k=0
k
a n−k b k+1 .
Die beiden Summanden am Ende der Rechnung werden nun einzeln umgeformt. Auf Grund der Identität
n+1
gilt für den ersten Summanden
0
n X
n
k=0
k
Wegen
=
a n+1−k b k
n
n
=1=
n+1
n+1
n X
n
k=0
k
a
n
0
a n+1 b0 +
n X
n
k=1
k
=
a n+1−k b k
n+1
0
a n+1 b0 +
n X
n
k=1
k
a n+1−k b k .
erhalten wir für den zweiten Summanden die Gleichung
n−k k+1
b
=
n+1 X
n
k−1
k=1
=
n X
k=1
n
k−1
a
=
n+1−k k
b
n X
n
k=1
a n+1−k b k +
n+1
n+1
Nach (2.19) erfüllen die Binomialkoeffizienten die Gleichung
n
n
n+1
=
+
k
k
k−1
—–
40
—–
k−1
a0 b n+1 .
für
a
b +
n+1−k k
(?2 )
k ∈ N, n ∈ N0 .
n
n
a0 b n+1
n
0
=1=
(?1 )
Addieren wir nun die Ausdrücke (?1 ) und (?2 ), so erhalten wir
!
n n + 1 n+1 0 X
n n+1−k k
n+1
(a + b)
=
a b +
a
b
+
0
k
k=1
=
n+1
0
n+1
0
a
a n+1 b0 +
n X
n
k
k=1
n+1 0
b +
n X
n+1
k
k=1
a
+
n
b +
n+1−k k
k−1
n+1
n X
n
k=1
a n+1−k b k +
0 n+1
a b
n+1
k−1
=
a
b +
n+1−k k
n+1
n+1
a0 b n+1
n+1 X
n+1
k=0
k
n+1
n+1
!
0 n+1
a b
=
a n+1−k b k .
Also ist die Gleichung auch für n + 1 gültig.
ƒ
Neben dem Summen- wird häufig auch das Produktzeichen verwendet. Hier ist das Ziel die Bildung von Produkten
über beliebige endliche Mengen natürlicher Zahlen. Wie in (2.27) kann gezeigt werden, dass für jede Familie (ai )i∈I
natürlicher Zahlen über einer Indexmenge I eine eindeutig bestimmte Zuordnung
Pfin (I) −→ N0
,
J 7→
Y
ai
i∈J
Š
ak existiert, falls J, K ⊆ I endlich und disjunkte
€Q
Š €Q
Š
Q
Q
Q
sind. Es gelten zu (2.28) analoge Rechenregeln i∈I (ai bi ) =
i∈I ai
i∈I bi und
j∈J aϕ( j) =
i∈I ai , falls
P
P
ϕ : J → I eine Bijektion bezeichnet. Lediglich die Gleichung i∈I cai = c i∈I ai muss modifiziert werden: Beim
Q
Q
Produktzeichen gilt i∈I (cai ) = c n i∈I ai , falls n = |I| ist.
mit
Q
i∈∅
ai = 1,
Q
i∈{k}
ai = ak und
Q
i∈J∪K
ai =
€Q
i∈J
aj
Š €Q
i∈K
Sowohl die Fakultätsfunktion als auch die Binomialkoeffizienten können mit Hilfe des Produktzeichens ausgedrückt
werden: Es gilt
n!
=
n
Y
k=1
k
und
n
k
=
1
k! (n − k)!
für alle k, n ∈ N0 gilt k ≤ n.
—–
41
n!
—–
=
1
n
Y
k! `=n−k+1
`
§ 3.
Die reellen Zahlen
Inhaltsübersicht
Bevor wir in den nachfolgenden Kapiteln mit den reellen Zahlen arbeiten und tieferliegende Sätze, zum Beispiel über
reellwertige Folgen oder Funktionen beweisen können, müssen wir uns zunächst einmal ein Fundament schaffen und
festlegen, welche Eigenschaften der Menge R der reellen Zahlen wir als „bekannt“ voraussetzen möchten. Ziel dieses
Kapitels ist also eine axiomatische Charakterisierung der reellen Zahlen.
Diese Axiome lassen sich in drei Gruppen einteilen. Zunächst einmal bilden die reellen Zahlen einen Körper. Das bedeutet,
dass auf R arithmetische Operationen +, −, · und : existieren, welche die vom praktischen Rechnen her gewohnten Regeln
erfüllen. Darüber hinaus existiert auf R eine Anordnung, also eine mit der Arithmetik verträgliche Totalordnung. Drittens
ist R als angeordneter Körper vollständig, was man durch die Formulierung umschreibt, dass R als kontinuierlicher
Zahlenstrahl keine „Lücken“ besitzt. Diese Eigenschaft unterscheidet R zum Beispiel vom Körper Q der rationalen Zahlen.
Neben der axiomatischen Charakterisierung von R werden wir in diesem Kapitel auch die aus der Schule bekannten Zahlbereiche N, N0 , Z und Q als Teilmengen von R definieren. Auch die komplexen Zahlen C werden als Erweiterung von
R eingeführt. Die Anordnungseigenschaft ermöglicht die Definition spezieller Teilmengen [a, b] von R, die sogenannten
Intervalle. Als Anwendung der Vollständigkeit definieren wir auf R die Exponentiation positiver reeller Zahlen a mit
p
beliebigen rationalen Exponenten, beispielsweise a1/2 = a.
(I)
Ringe und Körper
Eine Verknüpfung auf einer Menge X ist eine Abbildung · : X × X → X . An Stelle von ·(a, b) schreibt man in der
Regel a · b für a, b ∈ X . Man bezeichnet die Verknüpfung als kommutativ, wenn a · b = b · a für alle a, b ∈ X gilt,
und als assoziativ, wenn a · (b · c) = (a · b) · c für alle a, b, c ∈ X erfüllt ist.
(3.1) Definition Ein Ring ist ein Tripel (K, +, ·) bestehend aus einer Menge K und Verknüpfungen + und · auf K, so dass folgende Bedingungen erfüllt sind.
(i) Die Verknüpfungen + und · sind kommutativ und assoziativ.
(ii) Es gilt das Distributivgesetz a(b + c) = ab + ac.
(iii) Es gibt Elemente 0K und 1K mit der Eigenschaft, dass 0K + a = a und 1K · a = a für alle
a ∈ K erfüllt ist.
(iv) Für jedes a ∈ K gibt es ein b ∈ K mit a + b = 0K .
Gilt zusätzlich 0K 6= 1K , und gibt es für jedes a ∈ K mit a 6= 0K ein b ∈ K mit ab = 1K , dann
nennt man (K, +, ·) einen Körper.
—–
42
—–
In einem Ring (K, +, ·) gibt es jeweils nur ein Element 0K und 1K mit der unter (iii) genannten Eigenschaft. Erfüllt
nämlich ein Element 00K ∈ K ebenfalls 00K + a = a für alle a ∈ K, dann erhält man durch Einsetzen von a = 0K
nämlich insbesondere
0K
00K + 0K
=
0K + 00K
=
=
00K .
Ebenso gilt: Ist 10K ∈ R ein Element mit 10K · a = a für alle a ∈ K, so folgt 1K = 10K · 1K = 1K · 10K = 1K . Die Elemente
0K und 1K sind also durch ihre Eigenschaft eindeutig bestimmt. Man nennt sie das Null- bzw. Einselement des
Rings. Für jedes a ∈ K gibt es nur ein b ∈ K mit der Eigenschaft (iv). Sind nämlich b, c ∈ K beliebige Elemente mit
a + b = 0K und a + c = 0K , so erhält man b = c durch die Rechnung
b
=
0K + b
=
(a + c) + b
=
(c + a) + b
=
c + (a + b)
=
c + 0K
=
0K + c
=
c.
Man nennt das eindeutig bestimmte Element b ∈ K mit a + b = 0K das Negative von a und bezeichnet es mit −a.
Mit Hilfe es Negativen kann eine weitere Verknüpfung − auf K definiert werden, und zwar durch die Festlegung
a − b = a + (−b) für a, b ∈ K. Man bezeichnet die Verknüpfung + als Addition, die Verknüpfung − als Subtraktion
und · als Multiplikation auf dem Ring K.
Ebenso gibt es für jedes a ∈ K höchstens ein b ∈ K mit ab = 1K . Ist nämlich c ∈ K ein weiteres Element mit
ac = 1K , so erhält man b = 1K · b = (ac)b = (ca)b = c(ab) = c · 1K = 1K · c = c. Ein Element b mit der Eigenschaft
ab = 1K wird Kehrwert von a genannt und mit a−1 bezeichnet. Ist K ein Körper, so lässt sich mit Hilfe der Kehrwerte
in K auch Brüche definieren. Man setzt dazu
a
b
=
a b−1
für alle
a, b ∈ K mit
b 6= 0K .
Bekannte Beispiele für Körper sind die rationalen Zahlen Q und die reellen Zahlen R jeweils mit der gewöhnlichen
Addition und Multiplikation als Verknüpfungen. Die in (3.1) unter (iii) genannten Elemente 0K und 1K sind in
diesem Fall einfach die Zahlen 0 und 1. Dagegen sind N und Z mit den gewöhnlichen Verknüpfungen + und · keine
Körper. Nicht jedes Element ungleich Null besitzt einen Kehrwert, beispielsweise gibt es keine natürliche oder ganze
Zahl a mit 2 · a = 1. Für N kommt hinzu, dass auch Punkt (iv) nicht erfüllt ist. Wir werden aber sehen, dass Z
immerhin noch ein Ring ist.
Abgesehen von den soeben genannten Zahlbereichen kennt man eine große Zahl weiterer Körper, darunter auch solche mit endlicher Elementmenge. In diesem Fall kann die Addition und Multiplikation jeweils durch eine Wertetabelle angegeben werden. Die Körper mit der geringstmöglichen Elementezahl bestehen aus zwei bzw. drei Elementen.
Sie werden üblicherweise mit F2 bzw. F3 bezeichnet.
Verknüpfungstabellen des Körpers F2 :
+
0
1
·
0
1
0
0
1
0
0
0
1
1
0
1
0
1
—–
43
—–
Verknüpfungstabellen des Körpers F3 :
+
0
1
2
·
0
1
2
0
0
1
2
0
0
0
0
1
1
2
0
1
0
1
2
2
2
0
1
2
0
2
1
Dass die Verknüpfungen kommutativ sind, erkennt man auf einen Blick daran, dass die Tabellen symmetrisch bezüglich der von links oben nach rechts unten verlaufenden Diagonalen sind. Auch die Eigenschaften (i)(b),(c) und
(ii)(b),(c) überprüft man leicht. (Beispielsweise erfüllt das Element 0F2 = 0 die Bedingung 0F2 + x = x für alle
x ∈ F2 , wie man durch Einsetzen der Elemente 0, 1 in x leicht überprüft.) Ziemlich mühsam ist dagegen die Verifikation von Assoziativ- und Distributivgesetz, da man hier 23 = 8 Gleichungen für F2 und sogar 33 = 27 Gleichungen
für F3 kontrollieren muss. In der Algebra-Vorlesung werden wir Techniken zur Konstruktion endlicher Körper kennenlernen, die unter anderen einen einfacheren Nachweis des Assoziativ- und des Distributivgesetz mit sich bringen.
Wir beweisen nun einige elementare Rechenregeln, die in allen Ringen bzw. Körpern gültig sind.
(3.2) Proposition Sei (K, +, ·) ein Ring, und seien a, b ∈ K. Dann gilt
(i) −0K = 0K , −(−a) = a und −(a + b) = (−a) + (−b)
(ii) 0K · a = 0K , a(−b) = (−a)b = −(ab) und ab = (−a)(−b)
Ist K sogar ein Körper, dann gilt zusätzlich:
−1 −1
(iii) 1−1
= a und (ab)−1 = a−1 b−1 sofern a, b 6= 0K
K = 1K , (a )
(iv) Aus a b = 0K folgt a = 0K oder b = 0K .
Beweis:
zu (i)
Es gilt 0K = 0K + 0K . Wie bereits oben festgestellt, gibt es nur ein einziges Element c ∈ K mit
0K + c = 0K , nämlich das Negative −0K . Weil die Gleichung 0K + c = 0K sowohl mit c = 0K als auch c = −0K erfüllt
ist, folgt −0K = 0K . Zum Beweis der zweiten Gleichung stellen wir zunächst fest, dass (−a) + a = a + (−a) = 0K
gilt. Also ist a das Negative von −a, es gilt also −(−a) = a. Zum Beweis der dritten Gleichung verwenden wir die
Rechnung
(a + b) + ((−a) + (−b))
=
(a + b) + ((−b) + (−a))
a + ((b + (−b)) + (−a))
=
=
a + (0K + (−a))
=
a + (b + ((−b) + (−a)))
a + (−a)
=
=
0K .
Diese zeigt, dass (−a) + (−b) das Negative von a + b ist. Es gilt also −(a + b) = (−a) + (−b).
zu (ii)
Zum Beweis der ersten Gleichung 0K · a = 0K gehen wir in zwei Schritten vor. Zunächst gilt 0K a =
(0K + 0K )a = 0K a + 0K a, und daraus wiederum folgt
0K
=
(0K a) + (−(0K a))
=
(0K a + 0K a) + (−(0K a))
=
0K a + 0K
—–
44
=
—–
0K a.
=
0K a + (0K a + (−(0K a)))
Beweisen wir nun die zweite Gleichung. Es gilt ab + a(−b) = a(b + (−b)) = a0K = 0K a = 0K . Also ist a(−b)
das Negative von a b, es folgt −(a b) = a(−b). Der Beweis der dritten Gleichung läuft nach demselben Schema ab:
Wegen ab + (−a)b = (a + (−a))b = 0K b = 0K ist (−a)b ebenfalls das Negative von ab, es gilt also −(ab) = (−a)b.
Die letzte Gleichung erhalten wir schließlich durch Anwendung bereits bewiesener Gleichungen. Es gilt
(−a)(−b)
=
=
−(a(−b))
−(−(ab))
=
,
ab
wobei in den ersten beiden Schritten die soeben gezeigten Identitäten und im letzten Schritt die zweite Gleichung
von (i) verwendet wurde.
zu (iii)
Hier ergeben sich die Gleichungen aus der Eindeutigkeit des Kehrwerts. Die Gleichung 1K = 1K · 1K zeigt,
−1
dass 1K sein eigener Kehrwert ist, also 1−1
· a = 1K sieht man, dass a der Kehrwert
K = 1K ist. An der Gleichung a
von a−1 ist, es gilt also (a−1 )−1 = a. Aus der Rechnung gilt noch
(a b) · (a−1 b−1 )
=
(a b) · (b−1 a−1 )
=
a(1K a−1 )
=
=
a(b(b−1 a−1 ))
aa−1
=
1K
=
a((bb−1 )a−1 )
,
folgt schließlich, dass a−1 b−1 der Kehrwert von ab ist, also (ab)−1 = a−1 b−1 gilt.
zu (iv)
Seien a, b ∈ K mit a b = 0K , und nehmen wir an, dass a 6= 0K und b 6= 0K gilt. Dann besitzen beide
Elemente Kehrwerte, und es folgt 0K = 0K (a−1 b−1 ) = (ab)(a−1 b−1 ) = (ab)(ab)−1 = 1K . Aber die Gleichung
0K = 1K ist in einem Körper ausgeschlossen. Die Annahme a 6= 0K und b 6= 0K hat zu einem Widerspruch geführt,
und folglich muss a = 0K oder b = 0K gelten.
ƒ
Auf Grund der Assoziativität für + und · können Klammern gespart werden: An Stelle von a + (b + c) oder a(bc)
schreibt man einfach a + b + c oder a bc. Auf weitere Klammern kann verzichtet werden, wenn man die Konvention
Punktrechnung vor Strichrechnung zu Grunde legt. Dazu vereinbart man, dass der Ausdruck a+bc gleichbedeutend
mit a + (bc) ist, und dass a − bc dasselbe bedeutet wie a − (bc) oder a + (−(bc)).
Aus der Rechenregel (iii) folgt unmittelbar, dass in Brüchen gekürzt werden kann: Ist K ein Körper, und sind a, b, c ∈
K mit b, c 6= 0K , dann gilt
ac
bc
=
ac(bc)−1
=
ac b−1 c −1
=
ab−1 cc −1
=
ab−1 1K
=
ab−1
=
a
b
.
Übrigens wäre es nicht sinnvoll, bei der Körperdefinition auch die Existenz eines Kehrwerts 0−1
K von 0K zu fordern:
−1
Dann würde man nämlich für jedes a ∈ K die Gleichung a = a · 1K = a · (0K · 0−1
K ) = 0K · (a · 0K ) = 0K erhalten,
d.h. der Körper würde nur aus dem Nullelement 0K bestehen! Insbesondere würden die Elemente 0K und 1K zusammenfallen, was wir ja explizit ausgeschlossen haben. Wir halten fest: In einem Körper K besitzt das Nullelement
0K keinen Kehrwert.
—–
45
—–
In einem Ring K kann jeder Zahl n ∈ N0 auf natürliche Weise ein Element nK in K zugeordnet werden: Zunächst
ordnet man der 0 das Nullelement 0K und der 1 das Einselement 1K des Rings zu. Anschließend definiert man
rekursiv (n + 1)K = nK + 1K für alle n ∈ N. Es gilt also 2K = 1K + 1K , 3K = 2K + 1K = 1K + 1K + 1K , und so fort.
Viele Rechenregeln übertragen sich von N auf diese Elemente. Dies ist in erster Linie darauf zurückzuführen, dass
die Addition und Multiplikation auf N0 mit der Addition und Multiplikation der entsprechenden Körperelemente
zusammenhängt.
(3.3) Lemma Für alle m, n ∈ N0 gilt (m + n)K = mK + nK und (m · n)K = mK nK .
Beweis:
Die erste Gleichung beweisen wir durch vollständige Induktion über n ∈ N0 jeweils für alle m ∈ N0 . Für
n = 0 ist die Gleichung wegen (m + 0)K = mK und mK + 0K = mK offenbar für alle m ∈ N0 erfüllt. Sei nun n ∈ N0 ,
und setzen wir die Gleichung für n voraus. Für jedes m ∈ N gilt dann
(m + (n + 1))K
=
((m + n) + 1)K
mK + nK + 1K
=
=
(m + n)K + 1K
=
mK + (n + 1)K .
Dabei ist zu beachten, dass die Gleichungen (m + n + 1)K = (m + n)K + 1K und (n + 1)K = nK + 1K auf Grund
der rekursiven Definition von nK gelten. Außerdem haben wir im dritten Schritt die Induktionsvoraussetzung angewendet. Beim Beweis der zweiten Gleichung gehen wir genauso vor. Für n = 0 ist diese wegen (m · 0)K = 0K und
mK · 0K = 0K für alle m ∈ N0 erfüllt. Sei nun n ∈ N0 , und setzen wir die Gleichung für dieses n voraus. Wir erhalten
(m(n + 1))K
=
(mn + m)K
mK nK + mK 1K
=
=
(mn)K + mK
mK (nK + 1K )
=
=
mK nK + mK
=
mK (n + 1)K .
Dabei wurde im zweiten Schritt die bereits bewiesene erste Gleichung und im dritten Schritt die Induktionsvoraussetzung angwendet.
ƒ
Die Elemente nK kamen durch wiederholte Addition des Elements 1K zu Stande. Genau lassen sich mit Hilfe der
Multiplikation Potenzen von Ringelementen definieren. Für beliebiges a ∈ R setzt man a0 = 1K und definiert anschließend rekursiv a n+1 = a n · a für alle n ∈ N0 .
(3.4) Lemma Seien K ein Ring, a, b ∈ K und m, n ∈ N0 . Dann gilt
(i) a m+n = a m a n
(ii) (a m )n = a mn
(iii) (a b)m = a m b m
—–
46
—–
Beweis:
zu (i)
Das Beweisschema ist dasselbe wie bei Lemma (3.3): Wir beweisen die Aussage durch vollständige
Induktion über n ∈ N0 jeweils für alle m ∈ N0 . Für n = 0 ist die Gleichung erfüllt, denn es gilt a m+0 = a m und
a m a0 = a m · 1K = a m . Sei nun n ∈ N0 , und setzen wir die Gleichung für dieses n voraus. Dann folgt
a m+(n+1)
=
a(m+n)+1
=
a m+n a
=
am an a
=
a m a n+1 .
Dabei wurde im zweiten Schritt die rekursive Definition der höheren Potenzen und im dritten Schritt die Induktionsvoraussetzung verwendet.
Wegen (a m )0 = 1K und a m0 = a0 = 1K ist die Gleichung im Fall n = 0 für beliebige m ∈ N gültig. Sei nun
zu (ii)
n ∈ N0 , und setzen wir die Gleichung für dieses n voraus. Dann folgt
(a m )n+1
=
(a m )n a m
=
a mn a m
=
a mn+m
=
a m(n+1) .
Im ersten Schritt haben wir die rekursive Definition der höheren Potenzen, im zweiten Schritt die Induktionsvoraussetzung und im dritten Schritt die Gleichung (i) verwendet.
zu (iii)
Für m = 0 ist die Gleichung erfüllt, denn es gilt (ab)0 = 1K und a0 b0 = 1K · 1K = 1K . Sei nun m ∈ N0 und
die Gleichung für dieses m vorausgesetzt. Dann folgt
(a b)m+1
=
(a b)m (a b)
=
a m b m ab
=
a m ab m b
=
a m+1 b m+1 .
Also ist die Gleichung auch für m + 1 gültig.
ƒ
Die Summen- und Produktzeichen, die wir am Ende von Kapitel 2 für Familien natürlicher Zahlen eingeführt haben,
lassen sich genauso auch in beliebigen Körpern verwenden. Auch der binomische Lehrsatz (2.29) ist an Stelle von
a, b ∈ N0 für beliebige Elemente a, b eines Körpers K gültig.
(II)
Anordnung
Die Begriffe Halb- und Totalordnung haben wir bereits in Kapitel 2 kennengelernt. Auf einem Körper K sollte eine
Totalordnung ≤ natürlich nicht völlig willkürlich definiert werden, sondern auf eine Art und Weise, die mit den
arithmetischen Operationen + und · des Körpers zuammenhängt. Dies gelingt mit Hilfe des folgenden Begriffs.
(3.5) Definition Sei K ein Körper. Eine Teilmenge K+ ⊆ K wird Anordnung von K genannt,
wenn die folgenden Bedingungen erfüllt sind.
(i) Für jedes x ∈ K gilt genau eine der drei Aussagen x = 0K , x ∈ K+ , −x ∈ K+ .
(ii) Aus x, y ∈ K+ folgt x + y ∈ K+ und x y ∈ K+ .
Das Paar (K, K+ ) bezeichnet man als angeordneten Körper. Ein Element x ∈ K wird als positiv
bezeichnet, wenn x ∈ K+ , und negativ, wenn −x ∈ K+ gilt.
—–
47
—–
Für die spätere Verwendung definieren wir die Bezeichnungen
K+ = K+ ∪ {0K }
K× = K \ {0K }.
und
Wie wir gleich sehen werden, lässt sich mit Hilfe der Teilmenge K+ eine Totalordnung auf K im Sinne von Definition
(2.2) definieren. Zunächst aber zeigen wir
(3.6) Lemma Sei (K, K+ ) ein angeordneter Körper.
(i) Für alle a ∈ K× gilt a2 ∈ K+ .
(ii) Aus a ∈ K+ folgt jeweils a−1 ∈ K+ .
Beweis:
zu (i) Nach Bedingung (i) in Definition (3.5) gilt ür jedes a ∈ K× jeweils a ∈ K+ oder −a ∈ K+ . Aus
Bedingung (ii) folgt im ersten Fall a2 = a·a ∈ K+ . Im zweiten Fall wenden wir dieselbe Bedingung sowie Proposition
(3.2) (i) an und erhalten ebenfalls a2 = a · a = (−a)(−a) ∈ K+ .
zu (ii)
Das Element a−1 besitzt wegen (a−1 )−1 = a einen Kehrwert, ist also ungleich 0K . Nach (i) folgt damit
(a−1 )2 ∈ K+ . Mit (a−1 )2 und a liegt auch das Produkt (a−1 )2 a in K+ , und wegen a−1 = a−1 · 1K = a−1 (a−1 a) =
(a−1 a−1 )a = (a−1 )2 a gilt damit auch a−1 ∈ K+ .
ƒ
(3.7) Satz Sei (K, K+ ) ein angeordneter Körper.
(i) Durch x ≤ y ⇔ y − x ∈ K+ ist eine Totalordnung auf K definiert.
Für alle x, y ∈ K gilt x < y ⇔ y − x ∈ K+ .
Seien nun x, y, a ∈ K vorgegeben.
(ii) Es gilt x ≤ y ⇔ x + a ≤ y + a.
(iii) Ist a positiv, dann gilt x ≤ y ⇔ ax ≤ a y.
(iv) Ist a negativ, dann gilt x ≤ y ⇔ ax ≥ a y.
Die drei Aussagen (ii), (iii) und (iv) bleiben gültig, wenn man ≤ durch < und ≥ durch > ersetzt.
Beweis:
zu (i)
Als erstes beweisen wir die Zusatzaussage. Nach Definition ist für x, y ∈ K die Aussage x < y
äquivalent zu (x ≤ y) ∧ x 6= y. Dies ist äquivalent zu ( y − x ∈ K+ ) ∧ ( y − x 6= 0K ), und da sich K+ disjunkt in
K+ ∪ {0K } zerlegen lässt, ist dies wiederum gleichbedeutend mit y − x ∈ K+ .
Beweisen wir nun, dass ≤ eine Halbordnung ist, und beginnen wir mit der Reflexivität. Sei x ∈ K vorgegeben. Zu
zeigen ist x ≤ x, was nach Definition gleichbedeutend mit x − x ∈ K+ ist. Aber Letzteres ist offensichtlich wahr, denn
es gilt x − x = 0K und 0K ∈ K+ . Zum Beweis der Antisymmetrie seien x, y ∈ K mit x ≤ y und y ≤ x vorgegeben.
Zu zeigen ist x = y. Nehmen wir an, es gilt x 6= y. Dann wäre zugleich x < y und y < x erfüllt. Wie bereits gezeigt,
hätte dies zur Folge, dass y − x und x − y beide in K+ liegen, wegen x − y = −( y − x) also y − x ∈ K+ und
−( y − x) ∈ K+ . Aber dies widerspricht Axiom (i) in Definition (3.5). Also ist nur x = y möglich.
—–
48
—–
Wenden wir uns nun der Transitivität zu und setzen dafür x ≤ y und y ≤ z voraus. Zu zeigen ist x ≤ z. Im Fall
x = y erhalten wir direkt x = y ≤ z, und aus y = z folgt genauso x ≤ y = z. Wir können uns also auf den Fall
beschränken, dass x 6= y und y 6= z gilt. Dann folgt aus unserer Voraussetzung x < y und y < z, und es folgt
y − x, z − y ∈ K+ . Axiom (ii) in Definition (3.5) zeigt uns, dass wegen
(z − y) + ( y − x)
=
z + (− y) + y + (−x)
=
z + (−x)
=
z−x
dann auch das Element z − x in K+ liegt. Daraus folgt x < z, insbesondere x ≤ z.
Um nachzuweisen, dass ≤ nicht nur eine Halb-, sondern eine Totalordnung ist, seien x, y ∈ K vorgegeben. Zu
zeigen ist, dass x ≤ y oder y ≤ x gilt. Ist x = y, dann ist x ≤ y nach Definition erfüllt. Im Fall x 6= y gilt dagegen
y − x 6= 0K , und aus Axiom (i) in Definition (3.5) folgt dann, dass entweder y − x oder −(x − y) = x − y ein
Element von K+ ist. Im ersten Fall gilt x < y und somit x ≤ y, im zweiten y < x und insbesondere y ≤ x.
zu (ii)
Wir beweisen zunächst die Äquivalenz x < y ⇔ x + a < y + a. Wie eingangs bemerkt, ist x < y
gleichbedeutend mit y − x ∈ K+ . Wegen ( y + a) − (x + a) = y + a + (−x) + (−a) = y + (−x) = y − x ist dies
äquivalent zu dass ( y + a) − (x + a) ∈ K+ , also zu x + a < y + a. Dieselbe Aussage für ≤ erhält man nun durch die
Äquivalenzumformung
x≤y
zu (iii)
(x < y) ∨ (x = y)
⇔
⇔
(x + a < y + a) ∨ (x + a = y + a)
⇔
x + a ≤ y + a.
Auch hier betrachten wir zunächst die Äquivalenz x < y ⇔ ax < a y. „⇒“ Aus x < y folgt y − x ∈ K+ .
Wegen a ∈ K+ liegt damit auch auch a y − ax = a( y − x) in K+ , also gilt ax < a y.
(3.6) (ii) mit a auch a
ax < a y ⇒ a
−1
ax < a
−1
−1
„⇐“
Da nach Lemma
positiv ist, können wir die bereits bewiesene Schlussrichtung anwenden und erhalten
a y ⇒ x < y. Damit ist die Äquivalenz für die Relation < insgesamt bewiesen.
Um auch die Äquivalenz für die Relation ≤ zu zeigen, bemerken wir zunächst x = y ⇒ ax = a y und ax = a y ⇒
a−1 ax = a−1 a y ⇒ x = y, insgesamt also x = y ⇔ ax = a y. Aus den beiden Äquivalenzen x < y ⇔ ax < a y und
x = y ⇔ ax = a y erhält man rein logisch die Äquivalenz x ≤ y ⇔ ax ≤ a y.
zu (iv)
Hier zeigen wir zunächst die Äquivalenz x < y ⇔ −x > − y. Diese erhält man durch die Umformungen
x<y
⇔
y − x ∈ K+
⇔
(−x) − (− y) ∈ K+
⇔
−x > − y.
Wegen x = y ⇔ −x = − y folgt daraus auch unmittelbar x ≤ y ⇔ −x ≥ − y. Ist nun a ein beliebiges negatives
Element, dann ist −a positiv. Durch Anwendung von (iii) und der soeben bewiesenen Äquivalenz erhalten wir
x < y ⇔ (−a)x < (−a) y ⇔ −a x < −a y ⇔ ax > a y, und nach demselben Schema beweist man schließlich auch
die Äquivalenz x ≤ y ⇔ a x ≥ a y.
ƒ
Ist (K, K+ ) ein angeordneter Körper, dann verwenden wir von nun an das Relationssymbol ≤ (und entsprechend
auch die Symbole ≤, < und >) immer für die nach Satz (3.7) zu K+ gehörende Totalordnung auf K, ohne jeweils
ausdrücklich darauf hinzweisen.
—–
49
—–
(3.8) Proposition
(weitere Rechenregeln in angeordneten Körpern)
(i) Aus 0K < a < b folgt b−1 < a−1 .
(ii) Für alle n ∈ N gilt nK ∈ K+ .
(iii) Für alle a, b ∈ K mit a < b gilt a < 2−1
K (a + b) < b.
Beweis:
zu (i)
Aus a, b ∈ K+ folgt a b ∈ K+ . Nach Lemma (3.6) (ii) sind a−1 und b−1 und damit auch a−1 b−1 in K+
enthalten. Wegen a < b liegt auch b − a in K+ . Nun gilt
a−1 − b−1
=
1K a−1 − 1K b−1
=
=
(bb−1 )a−1 − (aa−1 )b−1
b(a−1 b−1 ) − a(a−1 b−1 )
=
=
b(b−1 a−1 ) − a(a−1 b−1 )
(b − a)(a−1 b−1 ).
Aus b − a ∈ K+ und a−1 b−1 ∈ K+ folgt also a−1 − b−1 ∈ K+ und damit a−1 > b−1 wie gewünscht.
zu (ii)
Wir beweisen die Aussage durch vollständige Induktion über n ∈ N0 . Wegen 0K 6= 1K und 12K = 1K
können wir Teil (i) von Lemma (3.6), nach dem alle Quadrate ungleich Null positiv sind. Dies liefert uns 1K ∈ K+ ,
also die Aussage für n = 1. Ist nun n ∈ N beliebig, und setzen wir die Aussage für dieses n voraus, dann folgt
(n + 1)K = nK + 1K ∈ K+ , denn die Summe zweier positiver Zahlen ist positiv.
zu (iii)
Nach Definition gilt 2K a = (1K + 1K )a = 1K a + 1K a = a + a, und ebenso erhält man 2K b = b + b. Aus
a < b folgt 2K a = a + a < a + b und a + b < b + b = 2K b. Nach Teil (ii) gilt 2K ∈ K+ , und nach Lemma (3.6) (ii)
ist damit auch 2−1
K positiv. Aus 2K a < a + b folgt nun
a
=
2−1
K (2K a)
≤
2−1
K (a + b).
−1
Aus a + b < 2K b folgt ebenso die Ungleichung 2−1
K (a + b) < 2K (2K b) = b.
ƒ
(3.9) Definition Eine Teilmenge I ⊆ K wird Intervall in K genannt, wenn gilt: Sind a, b ∈ I
mit a < b, dann sind auch alle x ∈ K mit a < x < b in I enthalten.
Für viele Anwendungen ist es hilfreich, unseren angeordneten Körper K durch Hinzunahme zweier weiterer Elementen −∞ und +∞ zu einer Menge K̄ = K ∪ {−∞, +∞} zu erweitern. Durch die Festlegung
a≤b
⇔
a = −∞ ∨ (a, b ∈ R ∧ a ≤ b) ∨ b = +∞
wird die Totalordnung ≤ von K auf K̄ ausgedehnt. Denn auf Grund der Definition gilt a ≤ a nicht nur für alle a ∈ K,
sondern auch für a ∈ {±∞}. Also ist ≤ reflexiv. Seien nun a, b ∈ K̄ mit a ≤ b und b ≤ a vorgegeben. Im Fall a, b ∈ K
folgt a = b direkt aus der Tatsache, dass ≤ eine Totalordnung auf K ist. Gilt a ∈
/ K und b ∈ K, dann folgt aus a ≤ b,
dass a = −∞ sein muss, und aus b ≤ a ergibt sich ebenso b = ∞, also a = b. Analog behandelt man die beiden
Kombinationen a ∈ K, b ∈
/ K und a, b ∈
/ K. Also ist die Relation ≤ antisymmetrisch.
—–
50
—–
Zum Nachweis der Transitivität seien a, b, c ∈ K̄ mit a ≤ b und b ≤ c vorgegeben. Ist a = −∞ oder c = +∞, dann
gilt auf jeden Fall a ≤ c. Im Fall a = +∞ muss b = +∞ und damit auch c = +∞ gelten, also ist a ≤ c auch hier
füllt. Genauso behandelt man den Fall c = −∞. Im Fall a, c ∈ K folgt aus a ≤ b zunächst b ∈ K oder b = +∞; aber
b = +∞ würde wegen b ≤ c auch c = +∞ bedeuten, im Widerspruch zur Voraussetzung. Also liegt auch b in K.
Die Ungleichungen a ≤ b und b ≤ c implizieren dann a ≤ c, weil ≤ auf K transitiv ist.
Damit ist insgesamt gezeigt, dass ≤ auf K̄ eine Halbordnung ist. Darüber hinaus ist es sogar eine Totalordnung. Sind
nämlich a, b ∈ K̄ vorgegeben, dann liegen entweder beide Elemente in K, oder mindestens eines der Elemente liegt
in {±∞}. Im ersten Fall erhalten wir a ≤ b oder b ≤ a, weil ≤ eine Halbordnung auf K ist. Im zweiten Fall sei
beispielsweise a = −∞. Dann gilt auf jeden Fall a ≤ b. Nach demselben Schema geht man die Fälle a = +∞, b = ∞
und b = +∞ durch.
(3.10) Proposition Neben der leeren Menge ∅ sind alle Teilmengen der Form
]a, b[
=
{x ∈ K | a < x < b}
a, b ∈ K̄
[a, b[
=
{x ∈ K | a ≤ x < b}
a ∈ K, b ∈ K̄
]a, b]
=
{x ∈ K | a < x ≤ b}
a ∈ K̄, b ∈ K
[a, b]
=
{x ∈ K | a ≤ x ≤ b}
a, b ∈ K
Intervalle in K. Insbesondere ist auch K = ]−∞, +∞[ selbst ein Intervall.
Beweis:
Wir beweisen die Intervalleigenschaft nur für Teilmengen der Form [a, b[ mit a ∈ K und b ∈ K̄, da für
alle übrigen der Beweis sehr ähnlich funktioniert. Seien x, y Elemente aus I = [a, b[ mit x < y, und sei z ∈ K mit
x < z < y. Zu zeigen ist, dass auch z in I liegt. Wegen x ∈ I gilt a ≤ x, und aus a ≤ x, x < z folgt a ≤ z sogar a < z.
Aus y ∈ I folgt y < b, und zusammen mit z < y erhalten wir z < b. Insgesamt gilt also a ≤ z < b und somit z ∈ I.
Man beachte, dass es die Argumentation keine Rolle spielt, ob b ∈ R oder b = +∞ gilt.
ƒ
Intervalle vom Typ ]a, b[ bezeichnet man als offen, die vom Typ [a, b] als abgeschlossen, und diejenigen vom Typ
[a, b[ oder ]a, b] sind halboffen. In jedem Fall nennt man a und b die Grenzen des Intervalls. Sind sie beide Grenzen
endlich, also Elemente aus K, so spricht man von einem endlichen, sonst von einem unendlichen Intervall.
(3.11) Definition (archimedisches Axiom)
Die Anordnung K+ auf K wird archimedisch genannt, wenn für beliebige x, y ∈ K+ jeweils
ein n ∈ N existiert, so dass nK x > y erfüllt ist. Man bezeichnet (K, K+ ) in diesem Fall als
archimedisch angeordneten Körper.
Die Elemente x, y ∈ K+ erfüllen die archimedische Bedingung: Es gilt 5K x > y.
—–
51
—–
Es gibt angeordnete Körper, in denen das archimedische Axiom nicht gültig ist, beispielsweise die sogenannen hyperreellen Zahlen, eine Erweiterung der gewöhnlichen reellen Zahlen, in der auch „unendlich kleine“ und „unendlich
große“ Elemente existieren. Wir beweisen nun noch einige Rechenregeln basierend die auf dem archimedischen
Axiom.
(3.12) Satz Sei (K, K+ ) ein archimedisch angeordneter Körper.
(i) Für jedes " ∈ K+ gibt es ein n ∈ N mit n−1
K < ".
(ii) Sei x ∈ K mit x ≥ −1K . Dann gilt (1K + x)n ≥ 1K + nK x für alle n ∈ N0 .
Dies ist die sogenannte Bernoullische Ungleichung.
(iii) Ist b > 1K , dann existiert für jedes κ ∈ K+ ein n ∈ N mit b n > κ.
Ist dagegen 0K < b < 1K , so gibt es für jedes " ∈ K+ ein n ∈ N mit b n < ".
Beweis:
zu (i)
Wenden wir das archimedische Axiom auf x = 1K und y = " −1 an, so erhalten wir ein n ∈ N mit
nK > " −1 . Es folgt n−1
K < ".
zu (ii)
Wir zeigen die Ungleichung durch vollständige Induktion über n ∈ N0 . Für n = 0 ist die Aussage offen-
sichtlich erfüllt, denn es ist (1K + x)0 = 1K und 1K + 0K x = 1K . Sei nun n ∈ N0 , und setzen wir die Aussage für n
voraus. Es gilt
(1K + x)n+1
=
(1K + x)n (1K + x)
1K + nK x + x + nK x 2
≥
≥
1K + nK x + x
(1K + nK x)(1K + x)
=
1K + (n + 1)K x
=
,
wobei wir im zweiten Schritt neben der Induktionsvoraussetzung (1K + x)n ≥ 1+nK x auch die Bedingung 1K + x ≥ 0
an x verwendet haben, die sich aus der Voraussetzung x ≥ −1K ergibt. Insgesamt erhalten wir die gewünschte
Ungleichung für n + 1.
zu (iii)
Zunächst bestrachten wir den Fall b > 1K . Sei x = b − 1K . Auf Grund der Bernoullischen Ungleichung
gilt b = (1K + x)n ≥ 1K + nK x. Wir zeigen nun, dass ein n ∈ N mit nK x > κ − 1K existiert. Im Fall κ − 1K ≤ 0K
n
ist dies bereits für n = 1 erfüllt; im Fall κ − 1K > 0K liefert uns das archimedische Axiom wegen x > 0K ein solches
Element. In beiden Fällen gilt dann b n ≥ 1K + nK x > 1K + (κ − 1K ) = κ. Setzen wir nun b < 1K voraus. Definieren
wir c = b−1 , dann gilt c > 1K . Auf Grund des bereits bewiesenen Falls, angewendet auf κ = " −1 , gibt es ein n ∈ N
n
mit c n > " −1 . Daraus folgt (c n )−1 < ". Nach Lemma (3.4) (iii) ist c n b n = (c b)n = (b−1 b)n = 1K
= 1K und somit
(c n )−1 = b n . Auf diese Weise erhalten wir b n < ".
ƒ
—–
52
—–
(III)
Vollständigkeit
Im weiteren Verlauf bezeichnet (K, K+ ) stets einen angeordneten Körper. Wie wir im vorherigen Abschnitt gesehen
haben, existiert auf K eine Totalordnung, wir können uns die Menge K also als linearen „Zahlenstrahl“ vorstellen.
Eine Eigenschaft, die nun die reellen Zahlen R gegebenüber anderen Körpern wie etwa Q auszeichnet, ist die
Tatsache, dass dieser Zahlenstrahl keine „Lücken“ besitzt. Diese Eigenschaft soll im folgenden präzise formuliert
werden.
(3.13) Definition Ein Dedekindscher Schnitt von K ist ein Paar (A, B) bestehend aus Teilmengen A, B ⊆ K mit den folgenden Eigenschaften:
(i) Es gilt A, B 6= ∅ und A ∪ B = K.
(ii) Für alle a ∈ A und b ∈ B gilt a < b, insbesondere ist A ∩ B = ∅.
Ein Element t ∈ K wird Schnittzahl von (A, B) genannt, wenn die Ungleichungen a ≤ t ≤ b für
alle a ∈ A und b ∈ B erfüllt sind.
ein Dedekindscher Schnitt (A, B) mit Schnittzahl t
(3.14) Lemma Jeder Dedekindsche Schnitt von K besitzt höchstens eine Schnittzahl.
Beweis:
Sei (A, B) ein Dedekindscher Schnitt, und nehmen wir an, dass t, t 0 ∈ K mit t < t 0 beides Schnittzahlen
0
0
von (A, B) sind. Nach Proposition (3.8) erfüllt das Element u = 2−1
K (t + t ) die Ungleichungen t < u < t . Wegen
/ B. Das
t < u und t ≥ a für alle a ∈ A gilt u ∈
/ A. Andererseits gilt wegen u < t 0 und b ≥ t 0 für alle b ∈ B auch u ∈
Element u liegt also weder in der Menge A noch in der Menge B. Aber wegen A ∪ B = K muss jedes Element von K
in A oder B liegen. Dieser Widerspruch zeigt, dass keine zwei verschiedenen Schnittzahlen existieren können.
(3.15) Definition
ƒ
Ein angeordneter Körper K wird vollständig genannt, wenn jeder Dede-
kindsche Schnitt (A, B) von K eine Schnittzahl besitzt.
Betrachten wir im Körper R die beiden Teilmengen
A = {x ∈ R | x ≤
p
2}
und
B = {x ∈ R | x >
p
2}.
Wir überprüfen, dass (A, B) ein Dedekindscher Schnitt ist. Die Mengen A und B sind nichtleer, denn beispielsweise
p
p
gilt 1 ∈ A und 2 ∈ B. Weil für jede Zahl x ∈ R entweder x ≤ 2 oder x > 2 gilt, ist A ∪ B = R erfüllt. Ist a ∈ A und
—–
53
—–
p
2 < b, also insbesondere a < b. Damit haben wir alle Bedingungen für einen Dedekindschen
p
p
Schnitt verifiziert. Anhand der Ungleichungen a ≤ 2 < b sieht man auch, dass 2 eine Schnittzahl von (A, B) ist.
b ∈ B, dann gilt a ≤
Genauso können wir im Körper Q der rationalen Zahlen die beiden Teilmengen
p
p
A = {x ∈ Q | x ≤ 2}
und
B = {x ∈ Q | x > 2}
definieren.
Wie im vorherigen Beispiel überzeugt man sich davon, dass (A, B) ein Dedekindscher Schnitt ist. Dieser besitzt aber
(im Körper Q) keine Schnittzahl. Gehen wir nämlich davon aus, dass u ∈ Q eine Schnittzahl ist, dann gilt entweder
p
p
p
u < 2 oder u > 2, denn die Zahl 2 ist irrational und somit nicht in Q enthalten. Betrachten wir zunächst den
p
Fall u < 2.
Es gibt keine Schnittzahl u <
p
2.
Nach Definition der Schnittzahl muss a ≤ u für alle a ∈ A gelten. Wir wir aber im nächsten Abschnitt zeigen werden,
liegen die rationalen Zahlen dicht in R, was bedeutet, dass in jedem noch so kleinen offenen Intervall von R eine
p
rationale Zahl enthalten ist. Dies bedeutet, dass ein a1 ∈ Q miteinander u < a1 < 2 existiert. Es gilt a1 ∈ A nach
p
Definition der Menge A, aber dies steht im Widerspruch zu a ≤ u für alle a ∈ A. Ebenso führt man den Fall u > 2
auf einen Widerspruch. Der Körper Q ist also nicht vollständig!
Wir nähern uns dem Begriff der Vollständigkeit noch von einer etwas anderen Richtung, die sich später in den
Anwendungen als wichtig herausstellen wird.
(3.16) Definition
Sei M ⊆ K eine beliebige Teilmenge. Eine Element s ∈ K heißt obere
Schranke von M , wenn s ≥ x für alle x ∈ M gilt. Ein Element, das obere Schranke von M ist
und zugleich in M liegt, wird Maximum oder größtes Element von M genannt.
Genauso definiert man
(3.17) Definition
Sei M ⊆ K eine beliebige Teilmenge. Eine Element s ∈ K heißt untere
Schranke von M , wenn s ≤ x für alle x ∈ M gilt. Ein Element, das untere Schranke von M ist
und zugleich in M liegt, wird Minimum oder kleinstes Element von M genannt.
Jede Menge M besitzt höchstens ein Maximum. Sind nämlich s, s0 beides Maxima von M , dann ist s zugleich obere
Schranke von M , und wegen s0 ∈ M folgt s ≥ s0 . Genauso beweist man die Ungleichung s0 ≥ s, und insgesamt folgt
—–
54
—–
s = s0 . Mit genau demselben Argument sieht man auch, dass jede Menge höchstens ein Minimum besitzt. Im Falle
der Existenz bezeichnet man das größte Element von M mit max M und das kleinste Element mit min M .
Für jede Teilmenge M ⊆ K bezeichnen wir mit S + (M ) die Menge der oberen und mit S − (M ) die Menge der
unteren Schranken von M .
(3.18) Definition
Sei M ⊆ K. Ein kleinstes Element von S + (M ), sofern es existiert, wird
kleinste obere Schranke oder Supremum von M genannt. Ein größtes Element von S − (M )
bezeichnet man (im Falle der Existenz) als größte untere Schranke oder Infimum von M .
Die Menge M (blau) besitzt zwar unendlich viele obere Schranken (grün), aber nur eine kleinste obere Schranke (rot).
Dass jede Teilmenge von K höchstens ein kleinstes bzw. größtes Element besitzt, gilt natürlich auch für die Mengen
S + (M ) und S − (M ). Daraus folgt, dass das Supremum und das Infimum einer Menge M ⊆ K jeweils eindeutig
bestimmt ist, sofern es existiert. Man verwendet üblicherweise für das Supremum die Bezeichnung sup M , für das
Infimum die Bezeichung inf M .
(3.19) Proposition Sei M ⊆ K. Existiert das Maximum von M , dann auch das Supremum von
M , und es gilt max M = sup M . Wenn die Menge M ein Minimum besitzt, so hat sie auch ein
Infimum, und es gilt min M = inf M .
Beweis:
Sei a = max M . Dann ist a nach Definition eine obere Schranke von M . Nehmen wir an, dass a kein
Supremum, also keine kleinste obere Schranke von M ist. Dann gibt es eine noch kleinere obere Schranke, also ein
b ∈ S + (M ) mit b < a. Aber dies ist unmöglich, denn wegen a ∈ M und b ∈ S + (M ) muss b ≥ a gelten. Dieser
Widerspruch zeigt, dass a = sup M gilt. Der Beweis der Aussage über das Minimum läuft völlig analog.
ƒ
(3.20) Definition Eine Teilmenge M ⊆ K ist nach oben beschränkt, wenn S + (M ) nicht leer
ist, und nach unten beschränkt, wenn dasselbe für S − (M ) gilt. Ist M nach oben und nach
unten beschränkt, so nennt man M eine beschränkte Menge.
Mit Hilfe des Supremum und des Infimums können wir die Vollständigkeit angeordneter Körper auf eine andere Art
und Weise charakterisieren.
—–
55
—–
(3.21) Satz Folgende Aussagen sind äquivalent.
(i) Der angeordnete Körper (K, K+ ) ist vollständig.
(ii) Für jede nichtleere, nach oben beschränkte Menge M ⊆ K existiert sup M .
(iii) Für jede nichtleere, nach unten beschränkte Menge M ⊆ K existiert inf M .
Beweis:
„(i) ⇒ (ii)“
Sei M ⊆ K nichtleer und nach oben beschränkt. Weiter sei B = S + (M ) und A = K \ B. Wir zeigen,
dass (A, B) ein Dedekindscher Schnitt von K ist. Weil M nach oben beschränkt ist, ist B nicht leer. Sei x ∈ M ein
beliebiges Element. Wegen x − 1K < x und x ∈ M ist x − 1K keine obere Schranke von M . Aus x − 1K ∈
/ B folgt
x − 1K ∈ A, also ist auch A nicht leer. Nach Definition ist auch A ∪ B = K erfüllt. Sei nun a ∈ A und b ∈ B, zu zeigen
ist a < b. Nehmen wir an, dass a ≥ b gilt. Weil das Element b eine obere Schranke von M ist, müsste dies erst recht
für a gelten. Aber dann wäre a auch ein Element von B, was auf Grund der Definition A = K \ B ausgeschlossen ist.
Da K nach Voraussetzung vollständig ist, existiert für (A, B) eine Schnittzahl t. Wir zeigen, dass t = sup M gilt.
−1
Nehmen wir zunächst an, t wäre keine obere Schranke. Dann gäbe es ein x ∈ M mit x > t. Setzen wir y = 2K
(t + x),
dann gilt t < y < x. Weil t die Schnittzahl von (A, B) ist, muss y in B liegen. Damit wäre y eine obere Schranke
von M , was im Widerspruch zu x ∈ M und x > y steht. Gehen wir jetzt davon aus, das Element t wäre zwar eine
obere Schranke, aber kein Supremum von M . Dann gäbe es ein t 0 ∈ S + (M ) mit t 0 < t. Weil aber t die Schnittzahl
von (A, B) ist, würde daraus t 0 ∈ A folgen. Somit wäre t 0 kein Element von B und damit keine obere Schranke von
M . Insgesamt ist t = sup M damit bewiesen.
“(ii) ⇒ (iii)“
Sei M ⊆ K nichtleer und nach unten beschränkt. Dann ist auch −M = {−x | x ∈ M } eine nichtleere
Teilmenge von K. Auf Grund der Äquivalenz t ≤ x ∀x ∈ M ⇔ −t ≥ −x ∀ x ∈ M ist ein Element t ∈ K genau
dann eine untere Schranke von M , wenn −t eine obere Schranke von −M ist. Da nach Voraussetzung die Menge M
untere Schranken besitzt, gibt es für −M obere Schranken. Aus unserer Voraussetzung folgt nun, dass s = sup(−M )
existiert. Wir zeigen, dass −s = inf M gilt.
Weil s eine obere Schranke von −M ist, handelt es sich auf Grund unserer Vorüberlegung bei −s um eine untere
Schranke von M . Wäre −s dennoch kein Infimum von M , dann müsste es ein s0 ∈ S − (M ) mit s0 > −s geben. Aber
dann würde auch −s0 < s gelten, und nach unserer Vorüberlegung wäre −s0 ∈ S + (−M ). Aber dies ist unmöglich,
weil s nach Voraussetzung die kleinste obere Schranke von −M ist.
“(iii) ⇒ (i)“
Sei (A, B) ein Dedekindscher Schnitt von K. Wegen A 6= ∅ gibt es ein a ∈ A, und dieses erfüllt a ≤ b
für alle b ∈ B. Insgesamt ist B damit nichtleer und nach unten beschränkt, und auf Grund unserer Voraussetzung
existiert t = inf B. Wir zeigen, dass t die Schnittzahl von (A, B) ist. Weil t nach Definition eine untere Schranke von
B ist, gilt t ≤ b für alle b ∈ B. Nehmen wir nun an, a ≤ t ist nicht für alle a ∈ A erfüllt. Dann gibt es ein a ∈ A mit
a > t. Wegen a ≤ b für alle b ∈ B ist a in S − (B) enthalten. Aber dies ist unmöglich, denn nach Definition ist t das
größte Element von S − (B). Also gilt a ≤ t ≤ b für alle a ∈ A und b ∈ B.
—–
56
—–
ƒ
Ist M ⊆ K nicht nach oben beschränkt, also S + (M ) = ∅, dann definiert man sup M = +∞. Ebenso ist es üblich,
inf M = −∞ zu setzen, wenn M nicht nach unten beschränkt ist. Im Gegensatz zu beliebigen angeordneten Körpern
lassen sich in vollständigen Körpern die Intervalle leicht beschreiben.
(3.22) Satz
Ist (K, K+ ) vollständig, dann sind die Intervalle in K genau die in Proposition
(3.10) angegebenen Teilmengen der Form ]a, b[, ]a, b], [a, b[ und [a, b] mit a, b ∈ K̄.
Beweis:
Sei I ⊆ K ein Intervall, und gehen wir davon aus, dass I nicht leer ist. Wir beweisen den Satz, indem wir
die folgenden vier Einzelfälle abarbeiten.
(i) Die Menge I ist weder nach oben noch nach unten beschränkt.
(ii) Sie ist nach oben, aber nicht nach unten beschränkt.
(iii) Sie ist nach unten, aber nicht nach oben beschränkt.
(iv) Sie ist beschränkt.
zu (i)
Wir zeigen, dass in diesem Fall I = K gilt. Ist x ∈ K beliebig, dann gibt es ein z ∈ I mit z > x, denn sonst
wäre x eine obere Schranke von I. Ebenso gibt es ein y ∈ I mit y < x, weil x ansonsten eine untere Schranke von I
wäre. Aus y, z ∈ I, den Ungleichungen y < x < z und der Intervall-Eigenschaft folgt x ∈ I.
zu (ii)
Hier zeigen wir, dass I die Form ]−∞, b[ oder ]−∞, b] hat. Weil I nichtleer und nach oben beschränkt
ist, existiert b = sup I. Setzen wir zunächt b ∈ I voraus und zeigen wir, dass in diesem Fall I = ]−∞, b] gilt. Ist
x ∈ I, dann folgt x ≤ b, weil b eine obere Schranke von I ist. Somit erhalten wir I ⊆ ]−∞, b]. Zum Beweis der
umgekehrten Inklusion sei x ∈ ]−∞, b] vorgegeben. Dann gilt x ≤ b, und im Fall x = b ist x ∈ I offenbar erfüllt.
Gehen wir von x < b aus, dann gibt es jedenfalls ein y ∈ I mit y < x, denn ansonsten wäre x eine untere Schranke
von I, die nach Voraussetzung nicht existiert. Wegen x < b ist b = sup I ist x keine obere Schranke von I, somit
gibt es ein z ∈ I mit x < z. Aus y, z ∈ I, den Ungleichungen y < x < z und der Intervall-Eigenschaft folgt x ∈ I.
Insgesamt haben wir damit gezeigt, dass I = ]−∞, b] gilt.
Betrachten wir nun den Fall b ∈
/ I und zeigen, dass in dieser Situation I = ]−∞, b[ gilt. Ist x ∈ I, dann gilt x < b
und somit x ∈ ]−∞, b[. Sei umgekehrt x ∈ ]−∞, b[ vorgegeben. Dann gilt x < b. Weil x keine untere Schranke von
I ist, gibt es ein y ∈ I mit y < x. Weil x keine obere Schranke von I ist, existiert ein z ∈ I mit x < z. Aus y, z ∈ I, den
Ungleichungen y < x < z und der Intervall-Eigenschaft folgt wiederum x ∈ I, damit ist die Gleichung I = ]−∞, b[
insgesamt bewiesen.
zu (iii)
Weil I nichtleer und nach unten beschränkt ist, existiert a = inf I. Wie im vorherigen Absatz beweist man
nun I = ]a, +∞[ im Fall a ∈
/ I und I = [a, +∞[ im Fall a ∈ I. Weil der Beweis völlig analog verläuft, verzichten wir
auf die Angabe der Details.
—–
57
—–
zu (iv)
Weil I nichtleer und beschränkt ist, existieren a = inf I und b = sup I. Wir betrachten zunächst den Fall,
dass a ∈
/ I und b ∈ I gilt und zeigen, dass dann die Gleichung I = ]a, b] gilt. Sei x ∈ I. Dann gilt a ≤ x ≤ b, weil a
eine untere und b eine obere Schranke von I ist. Wegen a ∈
/ I gilt sogar a < x ≤ b, und daraus folgt x ∈ ]a, b]. Setzen
wir nun umgekehrt x ∈ ]a, b] voraus. Ist x = b, dann folgt c ∈ I. Ansonsten gilt a < x < b. Weil x keine untere
Schranke für I ist (nach Definition ist a die größte untere Schranke), gibt es ein y ∈ I mit y < x. Andererseits ist x
auch keine obere Schranke von I, so dass ein z ∈ I mit x < z existiert. Aus y, z ∈ I, den Ungleichungen y < x < z
und der Intervall-Eigenschaft folgt x ∈ I. Damit ist I = ]a, b] nachgewiesen. Nach demselben Schema beweist man
- Ist a ∈ I und b ∈
/ I, dann gilt I = [a, b[.
- Aus a, b ∈
/ I folgt I = ]a, b[.
- Aus a, b ∈ I folgt I = [a, b].
Insgesamt ist der Beweis damit abgeschlossen.
ƒ
Wir werden die vollständig angeordneten Körper noch auf eine weitere Art charakterisieren.
(3.23) Definition
Man sagt, der angeordnete Körper (K, K+ ) besitzt die Intervallschachte-
lungs-Eigenschaft, wenn für jede Folge (I n )n∈N nichtleerer, abgeschlossener, endlicher IntervalT
le, die I n+1 ⊆ I n für alle n ∈ N erfüllt, die Schnittmenge n∈N I n nicht leer ist.
Der Körper Q der rationalen Zahlen besitzt diese Eigenschaft nicht. Beispielsweise ist für jedes n ∈ N die Menge
p
p
I n = [ 2 − 1n , 2 + 1n ] ∩ Q ein abgeschlossenes und endliches Intervall in Q, und es gilt I n+1 ⊆ I n für alle n ∈ N.
T
Aber der Durschnitt n∈N I n dieser Intervalle ist die leere Menge.
(3.24) Satz
Ein angeordneter Körper (K, K+ ) ist genau dann vollständig, wenn er die
Intervallschachtelungs-Eigenschaft besitzt und die Anordnung K+ archimedisch ist.
Beweis:
„⇒“
Wir setzen voraus, dass (K, K+ ) vollständig ist und beweisen zunächst die Intervallschachtelungs-
Eigenschaft. Sei I n = [an , bn ] eine Folge nichtleerer, abgeschlossener, endlicher Intervalle mit an , bn ∈ K, an < bn
und I n ⊆ I n+1 für alle n ∈ N. Wir definieren
A
=
{an | n ∈ N}.
Offenbar ist A nichtleer, und wegen A ⊆ I1 ist A beschränkt. Auf Grund der Vollständigkeit existiert somit a = sup A.
T
Zum Nachweis der Intervallschachtelungs-Eigenschaft zeigen wir, dass a im Durchschnitt n∈N I n der Intervalle
enthalten ist. Weil a eine obere Schranke von A ist, gilt a ≥ an für alle n ∈ N. Liegt a dennoch nicht im Durchschnitt,
dann gilt a ∈
/ I m für ein m ∈ N, also a > bm . Wir zeigen nun, dass bm eine obere Schranke von A ist.
—–
58
—–
Wegen I n+1 ⊆ I n für alle n ∈ N gilt jeweils an+1 ≥ an und bn+1 ≤ bn . Ist nun n ≥ m, dann gilt bm ≥ bn > an . Im Fall
n ≤ m gilt bm > am ≥ an . Also ist bm tatsächlich eine obere Schranke von A. Weil a aber die kleinste obere Schranke
von a ist, folgt daraus a ≤ bm , im Widerspruch zu unserer vorherigen Feststellung. Dies widerspruch zeigt, dass a
im Durchschnitt sämtlicher Intervalle enthalten ist.
Nun zeigen wir noch, dass K+ archimedisch ist. Seien x, y ∈ K+ vorgegeben, und nehmen wir an, es gibt kein n ∈ N
mit nK x > y. Dann gilt nK x ≤ y und somit nK ≤
N
x
y
für alle n ∈ N, das heißt die Menge
=
{nK | n ∈ N}
ist nach oben beschränkt. Wegen 1K ∈ N ist die Menge N außerdem nichtleer. Auf Grund der Vollständigkeit existiert
somit s = sup N . Weil s nach Definition die kleinste obere Schranke von N ist, kann s − 1K wegen s − 1K < s keine
obere Schranke von N sein. Daraus folgt, dass ein n ∈ N mit nK > s−1K existiert. Wir erhalten (n+1)K = nK +1K >
s. Aber wegen (n + 1)K ∈ N widerspricht dies s = S + (N ). Unsere Annahme, dass kein n ∈ N mit nK x > y existiert,
hat zu einem Widerspruch geführt. Also gibt es ein solches n, und K+ ist archimedisch.
„⇐“
Setzen wir nun voraus, dass (K, K+ ) die Intervallschachtelungs-Eigenschaft besitzt und ein archimedisch
angeordneter Körper ist. Wir müssen zeigen, dass daraus die Vollständigkeit von (K, K+ ) folgt. Sei dazu M ⊆ K eine
nichtleere, nach oben beschränkte Menge. Zu zeigen ist, dass s = sup M existiert. Um die IntervallschachtelungsEigenschaft anwenden zu können, definieren wir I n = [an , bn ] für jedes n ∈ N0 durch folgendes Verfahren. Sei
a ∈ M und b ∈ S + (M ) mit a < b. Zunächst setzen wir a0 = a, b0 = b. Sei nun n ∈ N0 , und nehmen wir an, dass
an , bn bereits konstruiert sind. Wir setzen dann cn = 2−1
K (an + bn ) und führen eine Fallunterscheidung durch. Gilt
cn ∈ S + (M ), dann definieren wir an+1 = an und bn+1 = cn . Ist cn dagegen keine obere Schranke von M , dann setzen
wir an+1 = cn und bn+1 = bn . Wir überprüfen durch vollständige Induktion für jedes n ∈ N0 die folgenden Aussagen.
n
(i) bn − an = (2−1
K ) (b − a)
(ii) Das Element bn ist eine obere Schranke von M .
(iii) Für das Intervall I n = [an , bn ] gilt I n ∩ M 6= ∅.
Für n = 0 sind die Aussagen (i), (ii) und (iii) nach Definition erfüllt. Sei nun n ∈ N0 , und setzen wir die drei
Aussagen für n voraus. Es gilt
cn − an
=
−1
2−1
K a n + 2K b n − a n
=
2−1
K (bn − an )
=
n+1
(2−1
(b − a)
K )
bn − cn
=
−1
bn − 2−1
K b n − 2K a n
=
2−1
K (bn − an )
=
n+1
(2−1
(b − a).
K )
und ebenso
Weil (an+1 , bn+1 ) entweder mit (an , cn ) oder mit (cn , bn ) übereinstimmt, ist (i) für n + 1 auf jeden Fall erfüllt. Außerdem wird bn+1 so gewählt, dass auch Aussage (ii) für n + 1 gültig ist. Überprüfen wir nun noch die Aussage (iii).
Nach Induktionsvoraussetzung gibt es ein x ∈ M mit an ≤ x ≤ bn . Ist (an+1 , bn+1 ) = (an , cn ), dann ist cn = bn+1 eine
obere Schranke von M . Es gilt dann an ≤ x ≤ cn , also x ∈ I n+1 ∩ M . Im Fall (an+1 , bn+1 ) = (cn , bn ) ist cn keine obere
—–
59
—–
Schranke von M , die Zahl bn nach Induktionsvoraussetzung aber schon. Somit gibt es ein x ∈ M mit cn < x ≤ bn ,
und es folgt x ∈ I n+1 ∩ M .
Damit ist der Induktionsbeweis ist abgeschlossen. Für jedes n ∈ N0 gilt wegen an < cn < bn in jedem Fall an+1 ≥ an
und bn+1 ≤ bn , insgesamt also I n+1 ⊆ I n . Deshalb kann die Intervallschachtelungs-Eigenschaft angewendet werden,
T
und diese zeigt, dass ein Element s ∈ K im Durchschnitt n∈N0 I n sämtlicher Intervalle existiert. Wir werden zu
zeigen, dass s = sup M gilt.
Nehmen wir zunächst an, dass s keine obere Schranke von M ist. Dann gibt es ein x ∈ M mit x > s. Auf Grund
der archimedischen Anordnung finden wir für " =
x−s
b−a
n
nach Satz (3.12) (iii) ein n ∈ N mit (2−1
K ) < ". Es folgt
n
bn − an = (2−1
K ) (b − a) < "(b − a) = x − s und
bn
<
an + x − s
≤
x.
Aber dies widerspricht der Feststellung, dass bn eine obere Schranke von M ist. Gehen wir nun davon aus, dass s
zwar eine obere Schranke, aber kein Supremum ist. Dann gibt es ein s0 ∈ S + (M ) mit s0 < s. Setzen wir " =
s−s0
,
b−a
n
dann finden wir durch erneute Anwendung der archimedischen Anordnungseigenschaft ein n ∈ N mit (2−1
K ) < ",
n
0
und daraus folgt bn − an = (2−1
K ) (b − a) < s − s . Auf Grund der Aussage (iii) gibt es ein x ∈ K mit an ≤ x ≤ bn .
Insgesamt erhalten wir
s0
<
s − bn + an
≤
an
≤
x.
Aber s0 < x widerspricht der Annahme, dass s0 eine obere Schranke von M ist. Damit ist s = sup M und die Vollständigkeit von K bewiesen.
ƒ
Mit Hilfe des Intervallschachtelungs-Kriteriums leiten wir eine weitere wichtige Eigenschaft vollständiger angeordneter Körper her.
(3.25) Satz Jeder vollständige, angeordnete Körper besitzt überabzählbar viele Elemente.
Beweis:
Sei (K, K+ ) vollständig, und nehmen wir an, dass K höchstens abzählbar ist. Dann gibt es eine injektive
Abbildung f : K → N und nach (2.10) eine Abbildung g : N → K mit f ◦ g = idN . Wiederum nach (2.10) ist
die Abbildung g surjektiv. Wir definieren x n = g(n) für alle n ∈ N und werden die Surjektivität von g nun zu
einem Widerspruch führen. Dazu definieren wir zwei Folgen (i` )`∈N und ( j` )`∈N natürlicher Zahlen nach folgendem
Schema. Zunächst setzen wir i1 = 1 und j1 = min{n ∈ N | x n > x i1 }. Ist nun ` ∈ N und sind i` , j` bereits konstruiert,
dann setzen wir
i`+1
=
min{n ∈ N | x i` < x n < x j` }
j`+1
=
min{n ∈ N | x i`+1 < x n < x j` }
Nach Konstruktion gilt für alle ` ∈ N jeweils x i` < x i`+1 < x j`+1 < x j` . Setzen wir I` = [x i` , x j` ], dann gilt also jeweils
T
I` ) I`+1 . Auf Grund des Intervallschachtelungs-Kriteriums gibt es ein x ∈ K im Durchschnitt `∈N I` all dieser
Intervalle.
—–
60
—–
Auf Grund der Surjektivität von oben gibt es ein m ∈ N mit x = x m . Es gilt dann x i` ≤ x m ≤ x j` für alle ` ∈ N0 ;
wegen x i` < x i`+1 und x j`+1 < x j` muss sogar x i` < x m < x j` für alle ` gelten. Weil die Indizes i` alle verschieden sind,
muss ein k ∈ N0 , k ≥ 2 mit ik > m existieren. Nun gilt nach Definition
ik
=
min{n ∈ N0 | x ik−1 < x n < x jk−1 }.
Aber andererseits gilt x ik−1 < x m < x jk−1 , also widerspricht ik > m der Minimalität von ik . Die Annahme „K höchstens
abzählbar“ war also falsch, und somit ist K überabzählbar.
(IV)
ƒ
Definition der Zahlbereiche N, Z, Q und R
Nach den Vorbereitungen der letzten drei Abschnitte können wir nun die reellen Zahlen definieren.
(3.26) Satz (ohne Beweis)
Es gibt einen vollständigen, angeordneten Körper. Wir bezeichnen ihn mit R und nennen ihn
den Körper der reellen Zahlen.
Für Null- und Einselement 0R , 1R in R schreiben wir 0 und 1, lassen die Angabe des Körpers R im Index also
künftig weg. An Stelle des Ausdrucks a b−1 schreiben wir auch ab , d.h. wir verwenden die aus der Schule bekannte
Bruchschreibweise. Wir verwenden die Bezeichnung R+ für die Teilmenge der positiven reelle Zahlen und setzen
R+ = R+ ∪ {0}.
Sämtliche Eigenschaften, die wir im letzten Abschnitt für vollständige Körper hergeleitet haben, sind also auch für
die reellen Zahlen gültig, nämlich
(i) Jede nichtleere, nach oben beschränkte Teilmenge von R besitzt ein Supremum, und jede nichtleere, nach
unten beschränkte Teilmenge besitzt ein Infimum, nach (3.21).
(ii) Der Körper R besitzt die Intervallschachtelungs-Eigenschaft, nach (3.22).
(iii) Die Anordnung R+ ist archimedisch nach (3.22). Damit sind auch die Aussagen von (3.12) gültig.
(iv) Der Körper R ist überabzählbar, siehe (3.25).
Bei der Definition der archimedischen Eigenschaft wurden allerdings die natürlichen Zahlen als bekannt vorausgesetzt. Wir werden nun die natürlichen Zahlen als Teilmenge von R definieren.
(3.27) Definition
Eine Teilmenge M ⊆ R wird induktiv genannt, wenn 1 ∈ M gilt und für
jedes x ∈ M auch x + 1 ∈ M erfüllt ist.
—–
61
—–
Beispiele für induktive Teilmengen in R sind R selbst, R+ oder R+ .
(3.28) Definition Die Teilmenge N ⊆ R der natürlichen Zahlen ist definiert durch
\
=
N
M
=
{ n ∈ R | n ∈ M für jede induktive Teilmenge M ⊆ R }.
M ⊆R induktiv
Außerdem definieren wir N0 = N ∪ {0}.
Die Menge N ist selbst induktiv. Da nämlich 1 nach Definition in jeder induktiven Menge liegt, ist 1 auch im Durchschnitt aller induktiven Mengen, also in N, enthalten. Ist x ∈ N, dann liegt x in in jeder induktivem Menge. Nach
Definition ist dann auch x + 1 in jeder induktiven Menge enthalten. Des folgt x + 1 ∈ N.
Aus der Definition von N folgt unmittelbar, dass N ⊆ M für jede induktive Teilmenge M ⊆ R gilt. Ist M umgekehrt
eine induktive Teilmenge von R mit M ⊆ N, dann muss also M = N gelten.
(3.29) Proposition
(i) Sind m, n ∈ N, dann gilt auch m + n ∈ N und mn ∈ N.
(ii) Ist m ∈ N, dann liegt m − 1 in N0 .
(iii) Alle natürlichen Zahlen sind positiv, d.h. es gilt N ⊆ R+ .
Beweis:
zu (i)
Sei m ∈ N. Dann ist die Teilmenge T = {n ∈ N | m + n ∈ N} induktiv, denn es gilt m + 1 ∈ N auf
Grund der Induktivität von N, und aus m + n ∈ N folgt aus demselben Grund m + (n + 1) ∈ N. Es folgt T = N, also
m + n ∈ N für alle n ∈ N. Ebenso ist U = {n ∈ N | mn ∈ N} eine induktive Menge, denn wegen m1 = m ∈ N gilt
1 ∈ U, und aus n ∈ U folgt
mn ∈ N
⇒
mn + m = m(n + 1) ∈ N
⇒
n + 1 ∈ U.
Also ist wiederum U = N, es gilt also mn ∈ N für alle n ∈ N.
zu (ii)
Die Menge M = {x ∈ R | x − 1 ∈ N0 } ist induktiv. Denn wegen 1 − 1 = 0 gilt 1 ∈ M , und ist n ∈ M , dann
gilt n − 1 ∈ N0 . Sowohl für n − 1 = 0 als auch für n − 1 ∈ N ist (n + 1) − 1 = n in N0 enthalten, und daraus folgt
n + 1 ∈ M . Die Induktivität von M impliziert N ⊆ M . Also gilt n − 1 ∈ N0 für alle n ∈ N.
zu (iii)
Dies folgt aus der Induktivität der Menge T = {x ∈ N | x > 0R }.
(3.30) Satz Die Menge N der natürlichen Zahlen erfüllt die Peano-Axiome (P1) bis (P5) aus
Kapitel 1.
—–
62
—–
ƒ
Beweis:
Die Axiome (P1) (Existenz eines ausgezeichneten Elements 1 ∈ N) und (P2) (Existenz eines Nachfolgers
n + 1 für jedes n ∈ N) ergeben sich direkt aus der Induktivität von N. Nehmen wir an, es gibt ein n ∈ N, das 1
als Nachfolger besitzt. Dann gilt n + 1 = 1, und daraus folgt n = 0. Aber die Null ist in N nicht enthalten, denn
R+ ist eine induktive Menge mit 0 ∈
/ R+ , und N ist in jeder induktiven Teilmenge von R enthalten. Damit ist (P3)
bewiesen. Sind m, n ∈ N mit m + 1 = n + 1 vorgegeben, dann können wir auf beiden Seiten der Gleichung den Wert
−1 addieren und erhalten m = n. Dies zeigt (P4).
Nun beweisen wir noch das Induktionsprinzip (P5). Sei dazu ϕ ein Aussagenschema mit Parameter x, dass für jedes
n ∈ N eine sinnvolle Aussage ϕ(n) liefert. Außerdem setzen wir voraus, dass die Aussagen ϕ(1) und ∀x ∈ N :
ϕ(x) ⇒ ϕ(x + 1) erfüllt sind. Dann ist A = {n ∈ N | ϕ(n)} eine induktive Menge, denn wegen ϕ(1) gilt 1 ∈ A, und
auf Grund der zweiten Voraussetzung ist für jedes n ∈ A auch n + 1 in A enthalten. Wie zu Anfang des Abschnitts
bemerkt, folgt aus A ⊆ N und der Induktivität von A die Gleichheit A = N. Somit ist die Aussage ∀x ∈ N : ϕ(x)
gültig und damit das Induktionsprinzip (P5) bewiesen.
ƒ
In den Übungen wurde gezeigt, dass aus den Peano-Axiomen folgt, dass jede nichtleere Teilmenge von N ein kleinstes
Element besitzt. Wir bemerken noch, dass die Teilmenge N ⊆ R nach oben unbeschränkt ist. Denn nehmen wir an,
s ∈ R wäre eine obere Schranke von N. Wegen 1 ≤ s muss s ∈ R+ gelten. Auf Grund der archimedischen Eigenschaft
gibt es aber ein n ∈ N mit n = n · 1 > s, was zu unserer Annahme im Widerspruch steht.
(3.31) Definition
Die Menge Z der ganzen Zahlen und die Menge Q der rationalen Zahlen
sind als Teilmengen von R definiert durch
Z
=
Q =
N0 ∪ {n ∈ R | −n ∈ N}
{x ∈ R | ∃a ∈ Z, b ∈ N : x = ab }.
(3.32) Satz
(i) Durch Einschränkung der Abbildungen + : R × R → R und · : R × R → R auf Z × Z
erhält man zwei Verknüpfungen + und · auf Z. Entsprechendes gilt für die Menge Q der
rationalen Zahlen.
(ii) Das Tripel (Z, +, ·) ist ein Ring.
(iii) Das Tripel (Q, +, ·) ist ein Körper, und durch Q+ = R+ ∩ Q ist eine archimedische Anordnung auf Q definiert.
Beweis:
zu (i)
Durch Einschränkung der Verknüpfungen + und · auf Z × Z erhält man zunächst Abbildungen
+ : Z × Z → R und · : Z × Z → R. Um zu zeigen, dass diese Abbildungen Verknüpfungen auf Z sind, müssen wir
nachweisen, dass Summen und Produkte ganzer Zahlen wiederum ganze Zahlen sind.
—–
63
—–
Wir beginnen mit der Multiplikation. Für vorgegebene x, y ∈ Z beweist man x y ∈ Z durch separate Betrachtung
der Fälle x ∈ N, x = 0 und −x ∈ N sowie y ∈ N, y = 0 und − y ∈ N. Ist beispielsweise x ∈ N und − y ∈ N, dann
folgt aus (3.29) −x y ∈ N und damit x y ∈ Z. Die anderen acht Kombinationen können nach dem gleichen Prinzip
abgearbeitet werden.
Bevor wir zeigen, dass auch x + y in Z liegt, bemerken wir zunächst, dass Z ∩ R+ = N gilt. Die Inklusion „⊇“ folgt
aus (3.29) (iii). Sei umgekehrt a ∈ Z ∩ R+ . Wegen 0 ∈
/ R+ ist a = 0 ausgeschlossen. Wäre a = −n für ein n ∈ N,
dann würden sowohl −n als auch n in R+ liegen, was den Anordungseigenschaften von R+ widersprechen würde.
Also bleibt a = n als einzige Möglichkeit.
Nun beweisen wir durch vollständige Induktion über n ∈ N: Ist x ∈ Z und n ∈ N0 , dann liegt x − n in Z. Für
n = 0 ist nichts zu zeigen. Sei nun die Aussage für n bewiesen und x ∈ Z. Wir müssen zeigen, dass für x ∈ Z
auch x − (n + 1) = (x − n) − 1 in Z liegt. Nach Induktionsvoraussetzung gilt x − n ∈ Z. Im Fall x − n > 0 gilt
x − n ∈ N auf Grund der Bemerkung von oben. Aus (3.29) (ii) folgt x − (n + 1) = (x − n) − 1 ∈ N0 , also insbesondere
x − (n + 1) ∈ Z. Ist x − n = 0, dann gilt x − (n + 1) = −1, und −1 ist ebenfalls in Z enthalten. Betrachten wir
nun noch den Fall x − n < 0. Dann ist n − x wieder in Z ∩ R+ = N enthalten. Es folgt n − x + 1 ∈ N und somit
x − (n + 1) = −(n − x + 1) ∈ Z.
Nach diesen Vorbereitungen können wir nun zeigen, dass mit x, y ∈ Z auch x + y in Z enthalten ist. Sind x, y > 0,
dann folgt x, y ∈ N und somit x + y ∈ N ⊆ Z. Im Fall x, y < 0 liegen −x und − y beide in N, somit gilt auch
(−x) + (− y) ∈ N und x + y = −((−x) + (− y)) ∈ Z. Sei nun x > 0 und y < 0, also n = − y ∈ N. Wie zuvor gezeigt,
gilt dann x + y = x + (−n) = x − n ∈ Z. Ebenso behandelt man den Fall x < 0, y > 0.
Wir zeigen nun, dass die Einschränkungen von + und · auf Q × Q Verknüpfungen auf Q sind, d.h. dass für r, s ∈ Q
auch r + s und rs in Q liegen. Sei dazu r =
r +s =
a
b
a
b
und s =
+
c
d
=
c
d
mit a, c ∈ Z und b, d ∈ N. Auf Grund der Gleichungen
ad + bc
und
bd
rs =
ac
bd
und wegen bd ∈ N sowie ad + bc, ac ∈ Z sind r + s und rs Elemente von Q.
zu (ii)
Wir überprüfen die Bedingungen aus der Ringdefinition (3.1). Da die Assoziativ- und Kommutativgesetze
sowie das Distributivgesetz für alle Elemente in R gelten, sind sie erst recht für alle Elemente von Z bzw. Q erfüllt.
Die Elemente 0Q = 0 und 1Q = 1 besitzen offenbar die definierende Eigenschaft von Null- und Einselement. Ist
n ∈ Z, dann überprüft man durch Betrachtung der Einzelfälle n ∈ N, n = 0 und −n ∈ N leicht, dass auch −n in Z
enthalten ist. Außerdem gilt n + (−n) = 0. Sei nun x ∈ Q, x =
a
b
mit a ∈ Z und b ∈ N. Dann ist auch −x =
−a
b
in Q
enthalten, und es gilt x + (−x) = 0. Damit haben wir gezeigt, dass Z und Q Ringe sind.
Sei x ∈ Q× , x =
a
b
mit a ∈ Z und b ∈ N. Dann gilt a ∈ N oder −a ∈ N. Im ersten Fall zeigt die Gleichung x −1 = ab ,
im zweiten Fall die Gleichung x −1 =
(−b)
,
(−a)
dass auch x −1 in Q enthalten ist. Wegen x · x −1 = 1 besitzt x also einen
Kehrwert in Q; dies zeigt, dass Q ein Körper ist.
—–
64
—–
Zum Schluss zeigen wir noch, dass Q+ = Q ∩ R+ die Bedingungen für eine Anordnung aus (3.5) erfüllt. Da R+ eine
Anordnung auf R ist, gilt für jedes x ∈ Q genau eine der Bedingungen x ∈ R+ , x = 0 oder −x ∈ R+ . Zusammen
mit x ∈ Q folgt daraus, dass genau eine der Bedingungen x ∈ Q+ , x = 0 oder −x ∈ Q+ erfüllt ist. Sind x, y ∈ Q+ ,
dann gilt insbesondere x, y ∈ R+ . Weil R+ eine Anordnung auf R ist, folgt x + y ∈ R+ und x y ∈ R+ . Wegen
x + y, x y ∈ Q folgt daraus wiederum x + y ∈ Q+ und x y ∈ Q+ . Die Anordnung Q+ ist archimedisch, denn die
archimedische Bedingung in (3.11) gilt für alle x, y ∈ R+ und somit erst recht für alle x, y ∈ Q+ .
ƒ
Wir bezeichnen eine Zahl x ∈ R als rational, wenn sie in Q liegt, ansonsten also irrational.
(3.33) Satz Die rationalen und die irrationalen Zahlen liegen jeweils dicht in R. Dies bedeutet, dass jedes nicht-leere, offene Intervall I ⊆ R sowohl rationale als auch irrationale Zahlen
enthält.
Beweis:
Nach Definition gilt I = ]a, b[ mit a, b ∈ R̄. Wir dürfen davon ausgehen, dass a < b mit a, b ∈ R gilt.
Denn enthält jedes solche Intervall rationale und irrationale Zahlen, dann gilt dies erst recht für Intervalle der Form
]−∞, b[ und ]a, +∞[.
Zunächst konzentrieren wir uns auf den Beweis der Aussage, dass I eine rationale Zahl enthält und führen dies auf
den Fall zurück, dass a > 0 ist. Nehmen wir an, wir hätten den Satz in dieser Situation bereits bewiesen, und setzen
wir nun a ≤ 0 voraus. Dann können wir a und b in den positiven Bereich verschieben und dort die bereits bewiesene
Aussage anwenden. Da N nach oben unbeschränkt ist, gibt es ein k ∈ N mit k > −a, und wegen a + k, b + k > 0
finden wir auf Grund unserer Annahme finden ein s ∈ Q mit a + k < s < b + k. Es folgt dann a < r < b für die
rationale Zahl r = s − k.
Setzen wir nun 0 < a < b voraus. Die Idee besteht darin, den Abstand zwischen x und y durch Multiplikation
mit einer natürlichen Zahl so zu vergrößern, dass zwischen x und y auf jeden Fall eine natürliche Zahl liegt. Dazu
definieren wir " = b − a und wählen ein auf Grund von (3.12) existierendes m ∈ N mit
1
m
< ". Sei nun k ∈ N
minimal mit k > ma. Dann gilt k − 1 ≤ ma < k und somit
k−1
m
Wir rechnen nach, dass auch die Ungleichung
b
Insgesamt gilt also a <
=
k
m
a + (b − a)
=
k
m
≤
a
k
<
m
.
< b erfüllt ist. Tatsächlich gilt
a+"
>
a+
1
m
≥
k−1
m
+
1
m
=
k
m
.
< b. Nun zeigen wir noch, dass jedes endliche, offene Intervall I = ]a, b[ auch eine
irrationale Zahl enthält. Nach eventueller Verkleinerung von I dürfen wir 0 ∈
/ I annehmen. Wie bereits gezeigt,
i
h
p
p
a pb
0
0
p
enthält I =
, 2 eine Zahl r ∈ Q, und wegen 0 ∈
/ I ist r 6= 0. Die Zahl 2r liegt dann offenbar in I. Wäre 2r
2
p
p
p
rational, dann würde auch 2 = ( 2r)r −1 ∈ Q gelten. Es ist aber bekannt, dass 2 nicht rational ist, und somit ist
p
auch 2r irrational.
ƒ
—–
65
—–
Aus (2.25) und (2.26) kann leicht hergeleitet werden, dass Z und Q abzählbar unendlich sind. Zunächst sind Z
und Q offenbar unendlich, da sie N als Teilmengen enthalten. Durch n 7→ −n ist eine Bijektion zwischen N und
N− = {−n | n ∈ N} definiert. Also ist auch N− abzählbar unendlich. Als Vereinigung der höchstens abzählbaren
Mengen N, {0} und N− ist Z höchstens abzählbar, insgesamt also abzählbar unendlich. Die surjektive Abbildung
Z × N → Q, (a, b) 7→
a
b
zeigt, dass auch Q höchstens abzählbar und damit insgesamt abzählbar unendlich ist.
Für beliebige Körper K haben wir im Abschnitt I Potenzen der Form a n mit a ∈ K und n ∈ N0 eingeführt. Dies
werden wir nun verallgemeinern. Ist K ein Körper und a ∈ K× , so definieren wir
a−n
(a n )−1
=
für
n ∈ N.
Insgesamt ist a m damit für alle m ∈ Z definiert.
(3.34) Lemma
Die Potenzgesetze (i) bis (iii) aus Lemma (3.4) sind im Fall a, b 6= 0K für
beliebige m, n ∈ Z gültig.
Beweis:
Weil die Rechenregeln für m, n ∈ N0 bereits bewiesen wurden, können wir von Anfang an voraussetzen,
dass mindestens einer der beiden Exponenten m, n negativ ist.
zu (i)
Hier betrachten wir zunächst den Fall m ≥ 0, n < 0. Darüber hinaus nehmen wir an, dass m + n ≥ 0
gilt. Dann liegen m + n, −n und m in N0 . Es gilt (m + n) + (−n) = m, und auf Grund des bereits bewiesenen Falls
gilt deshalb a m+n a−n = a m . Es folgt a m+n = a m (a−n )−1 = a m a−(−n) = a m a n . Ist m + n < 0, dann sind die Zahlen
−(m + n), m und −n in N0 erhalten. Wegen −(m + n) + m = −n erhalten wir a−(m+n) a m = a−n . Daraus folgt weiter
a m (a−n )−1 = (a−(m+n) )−1
a m a−(−n) = a−(−(m+n))
⇔
⇔
a m a n = a m+n .
Den Fall m < 0, n ≥ 0, können wir auf den vorherigen zurückführen, denn es gilt a m+n = a n+m = a n a m = a m a n .
Setzen wir nun m, n < 0 voraus. Dann liegen −m, −n und −(m + n) in N0 , und aus −(m + n) = (−m) + (−n) folgt
a−(m+n) = a−m a−n . Durch die Umformungen
(a−(m+n) )−1 = (a−m a−n )−1
⇔
⇔
(a−(m+n) )−1 = (a−m )−1 (a−n )−1
a−(−(m+n)) = a−(−m) a−(−n)
⇔
a m+n = a m a n
sieht man, dass die Gleichung auch in dieser Situation erfüllt ist.
zu (ii)
Auch hier betrachten wir zunächst den Fall m ≥ 0, n < 0. Hier liegen −n und −(m + n) in N0 . Auf Grund
des bereits bewiesenen Falls erhalten wir (a m )n = ((a m )−n )−1 = (a m(−n) )−1 = (a−mn )−1 = a−(−mn) = a mn . Bevor wir
weitere Fälle bearbeiten können, müssen wir zunächst durch vollständige Induktion die Gleichung (a−1 )n a n = 1K
für alle n ∈ N0 beweisen. Wegen (a−1 )0 a0 = 1K · 1K = 1K ist diese für n = 0 erfüllt.
—–
66
—–
Ist n ∈ N0 und die Gleichung für n vorausgesetzt, dann folgt
(a−1 )n+1 a n+1
=
(a−1 )n a−1 a n a
(a−1 )n a n a−1 a
=
=
1K · 1K
=
1K
,
wobei im vorletzten Schritt die Induktionsvoraussetzung verwendet wurde. Damit ist der Induktionsbeweis abgeschlossen.
Wir beweisen nun die Gleichung (a m )n = a mn im Fall m < 0 und n ∈ Z und definieren dafür c = a−1 . Wie soeben
gezeigt, gilt a−m c −m = 1K , also a m = (a−m )−1 = c −m , und ebenso a mn = c −mn . Auf Grund des bereits bewiesenen
Falls und wegen −m ∈ N0 wir
(a m )n
zu (iii)
(c −m )n
=
=
c (−m)n
=
c −mn
=
a mn .
Hier brauchen wir nur den Fall m < 0 betrachten. Wegen −m ∈ N und auf Grund des bereits bewiesenen
Falls erhalten wir (a b)m = ((a b)−m )−1 = (a−m )−1 (b−m )−1 = a m b m .
ƒ
(3.35) Lemma Sei (K, K+ ) ein angeordneter Körper, und sei n ∈ N. Dann gilt für a, b ∈ K+
die Äquivalenz a < b ⇔ a n < b n . Ist n ungerade, dann gilt sie sogar für alle a, b ∈ K.
Beweis: Seien a, b ∈ K+ . Im Fall a = 0K oder b = 0K ist die Äquivalenz offensichtlich, so dass wir uns auf a, b ∈ K+
beschränken können. Es gilt
(b − a)
n−1
X
!
a
=
n−1−k k
b
k=0
n−1
X
a n−1−k b k+1 −
n−1
X
k=0
bn +
n−1
X
k=1
Mit a und b ist auch die Summe c =
k=0
n
X
=
k=0
a n−k b k − a n −
Pn−1
a n−k b k
n−1
X
a n−k b k −
k=1
a n−k b k
=
n−1
X
a n−k b k
=
k=0
bn − an.
k=1
a n−1−k b k in der Klammer positiv. An der Gleichung b n − a n = c(b − a)
kann somit die Äquivalenz b − a ∈ K+ ⇔ b n − a n ∈ K+ abgelesen werden, und damit gilt auch a < b ⇔ a n < b n .
Sei nun n ungerade, n = 2k + 1 mit k ∈ N0 . Im Fall a, b ≥ 0K wurde die Äquivalenz bereits bewiesen. Ist a < 0K
und b ≥ 0K , dann ist wegen a2k = (a k )2 auch a n = a2k a negativ. Es gilt also a < 0K ≤ b und a n < 0K ≤ b n . Dies
zeigt, dass die Äquivalenz a < b ⇔ a n < b n in dieser Situation immer erfüllt ist. Nun betrachten wir noch den
k
Fall a, b < 0K . Weil n ungerade ist, gilt (−1K )n = (−1K )2k (−1K ) = ((−1K )2 )k (−1K ) = 1K
(−1K ) = −1K . Wegen
−a, −b > 0K können wir die Äquivalenz auf den bereits bewiesenen Fall zurückführen, denn es gilt
a<b
⇔
−b < −a
⇔
⇔
(−b)n < (−a)n
(−1K )b n < (−1K )a n
⇔
⇔
(−1K )n b n < (−1K )n a n
an < bn.
ƒ
Wir bemerken noch, dass Lemma (3.35) richtig bleibt, wenn man das Zeichen < durch eines der Symbole >, ≤, ≥
oder = ersetzt. Bei > genügt es, einfach die Rollen von a und b zu vertauschen. Für die Gleichheit argumentiert man
—–
67
—–
indirekt: Die Implikation a = b ⇒ a n = b n gilt offensichtlich. Andererseits folgt aus a n = b n auch a = b, denn a < b
hätte a n < b n zur Folge, und aus a > b würde sich a n > b n ergeben, jeweils im Widerspruch zur Voraussetzung.
Damit ist auch klar, wie man die Aussagen für ≤ und ≥ herleitet.
(3.36) Satz Sei b ∈ R+ und n ∈ N. Dann gibt es eine eindeutig bestimmte Zahl α ∈ R+ mit
p
n
αn = b. Sie wird mit b bezeichnet und die n-te Wurzel von b genannt.
Beweis:
Im Fall n = 1 oder b = 0 ist die Aussage offensichtlich, weil man im ersten Fall α = b und im zweiten
α = 0 setzen kann. Deshalb können wir n > 1 und b > 0 voraussetzen. Wir betrachten nun die Menge
M
=
{x ∈ R | x n ≤ b}
und zeigen zunächst, dass diese ein positives Supremum besitzt. Wegen 0n ≤ b gilt 0 ∈ M , also ist die Menge M
nicht leer. Sei nun c = max{1, b}. Wegen Lemma (3.35) und c ≥ 1 gilt c n = c n−1 c ≥ 1n−1 c = c. Für jedes x ∈ R mit
x > c gilt folglich x n > c n ≥ c ≥ b und somit x ∈
/ M . Dies zeigt, dass c eine obere Schranke von M ist. Weil es sich
bei M um eine nichtleere, nach oben beschränkte Menge handelt, existiert α = sup M . Wegen b > 0 enthält M auf
jeden Fall positive Zahlen; wählt man beispielsweise m ∈ N so groß, dass
1
m
und somit
1
m
n
1
=
≤
mn
1
m
<
1
m
< b ist, dann folgt
b
∈ M . Weil α eine obere Schranke von M ist, muss also α > 0 gelten.
Nun beweisen wir die Gleichung αn = b, indem wir die beiden Ungleichungen αn > b und αn < b einzeln widerlegen. Nehmen wir zunächst an, dass αn > b gilt. In diesem Fall können wir ein h ∈ R+ so klein wählen, dass auch
(α − h)n > b gilt. Denn für jedes h ∈ R+ mit h < α ist − αh > −1. Wir können deshalb die Bernoullische Ungleichung
(3.12) anwenden und erhalten
(α − h)n
=
h n
αn 1 −
α
nh
αn 1 −
α
≥
=
αn − hnαn−1 .
Setzen wir nun " = αn − b und wählen h so klein, dass außer h < α auch hnαn−1 < " ⇔ h <
"
nαn−1
erfüllt ist, dann
erhalten wir
(α − h)n
≥
αn − hnαn−1
>
αn − "
=
αn − (αn − b)
=
b
wie gewünscht. Andererseits ist α−h keine obere Schranke von M , weil α nach Definition die kleinste obere Schranke
ist. Es gibt also ein y ∈ M mit y > α − h. Aus y ∈ M folgt y n ≤ b und nach Lemma (3.35) somit (α − h)n < y n ≤ b,
im Widerspruch zu (α − h)n > b. Dies zeigt, dass der Fall αn > b ausgeschlossen ist.
—–
68
—–
Nehmen wir nun an, dass αn < b gilt. In diesem Fall liefert können wir h ∈ R+ so klein wählen, dass auch (α+h)n < b
noch gültig ist. Denn der binomische Lehrsatz (2.29) liefert für jedes h ∈ R+ mit h < α die Abschätzung
(α + h)
n
n X
n
=
k
k=0
≤
αn + h
α
h
mit der Konstanten γ =
k=1
n
k
α +
n
n X
n
k
k=1
n X
n
k
k=1
Pn
=
n−k k
αn−k αk−1
=
α
=
n−k k
h
α +h
n
n X
n
k=1
αn + h
n X
n
k=1
k
αn−1
=
k
αn−k hk−1
αn + hγ
αn−1 ∈ R+ . Wir setzen nun " = b − αn und wählen h ∈ R+ so, dass neben h < α
auch die Abschätzung hγ < " ⇔ h < "γ−1 erfüllt ist. Dann folgt
(α + h)n
αn + hγ
≤
<
αn + "
=
αn + (b − αn )
=
b.
Andererseits ist α eine obere Schranke von M und somit α + h ∈
/ M . Aus α + h ∈
/ M folgt (α + h)n > b. Aber dies
widerspricht unserer zuvor gefundenen Abschätzung (α + h)n < b. Somit scheidet auch αn < b aus, und als einzige
Möglichkeit bleibt αn = b. Es gibt kein weiteres Element β ∈ R+ mit β n = b, denn wie wir im Anschluss an (3.35)
festgestellt haben, folgt aus αn = b = β n unmittelbar α = β.
ƒ
(3.37) Lemma Für a, b ∈ R+ und m, n ∈ N, p ∈ N0 gilt
p
n
p
n
=
ab
a·
p
n
b
,
p
p
n
( n a) p = a p
und
pp
m
n
a=
p
mn
a.
Die zweite Gleichung gilt im Fall a 6= 0 für alle p ∈ Z. Die beiden Zuordnungen R+ → R+
p
gegeben durch a 7→ a n und a 7→ n a sind invers zueinander.
p
p
p
p p
p
p p
n
n
n
n
Aus ( n a)n = a und ( b)n = b folgt ( n a · b)n = ( n a)n ( b)n = ab. Also ist γ = n a b die eindeutig
Beweis:
bestimmte Zahl in R+ mit γn = a b. Damit ist die erste Gleichung bewiesen. Ebenso zeigt die Rechnung
p
m
dass γ =
p
n
a
‹mn
=
 p
m
p
n
a
‹m ‹n
=
€p
Šn
n
a
=
,
a
pp
a die eindeutig bestimmte Zahl mit γmn = a ist. Daraus folgt die dritte Gleichung. Die zweite Gleichung
p
kann durch vollständige Induktion über p bewiesen werden. Für p = 0 ist sie offenbar erfüllt, denn es gilt ( n a)0 = 1,
p
p
p
p
n
n
n
und wegen 1n = 1 gilt a0 = 1 = 1, insgesamt also ( n a)0 = a0 . Ist p ∈ N0 und setzen wir die Formel dieses p
m
n
voraus, dann folgt
p
( n a) p+1
=
p p
( n a) p n a
=
p
n
p
ap n a
=
p
n
ap · a
=
p
n
a p+1 .
Beweisen wir die Gleichung nun noch im Fall a 6= 0 und p < 0. Zunächst zeigen wir für c ∈ R× und n ∈ N die
Gleichung
p
n
c −1
—–
=
69
€p
Š−1
n
c
.
—–
p
p
p
p p
n
n
n
n
Wegen 1n = 1 gilt 1 = 1, und daraus folgt n c c −1 = cc −1 = 1 = 1. Multipliziert man nun beide Seiten mit
p
( n c)−1 , so erhält man das gewünschte Ergebnis. Anwendung dieser Gleichung auf c = a−p liefert nun
p
n
p
=
ap
n
(a−p )−1
p
n
=
a−p
‹−1
€ p Š−p −1
n
a
=
€p
Šp
n
a .
=
Schließlich zeigt die triviale Gleichung a n = a n , dass γ = a das eindeutig bestimmte Element mit γn = a n sein
p
p
n
muss. Daraus folgt a n = a. Nach Definition der n-ten Wurzel gilt andererseits ( n a)n = a. Dies zeigt, dass die
angegebenen Zuorndungen zueinander invers sind.
ƒ
Mit Hilfe der n-ten Wurzeln können wir Potenzen a r für a ∈ R+ beliebige rationale Exponenten r definieren. Besitzt
p
n
a m . Die Definition ist unabhängig von
r die Darstellung r = mn mit m ∈ Z und n ∈ N, dann setzen wir α r =
p
der Darstellung der rationalen Zahl r als Bruch. Sind nämlich p ∈ Z und q ∈ N weitere Zahlen mit r = q , dann folgt
m
n
=
p
q
⇔ mq = np und
p
n
=
am
qp
n
p
(a m ) p
p
=
np
p
=
a mp
mq
=
a mp
qp
q
m
(a p )m
=
p
q
ap.
(3.38) Lemma Die Potenzgesetze (i) bis (iii) aus (3.4) gelten auch für a, b ∈ R+ und beliebige
Exponenten r, s ∈ Q.
Beweis:
a r+s = a r as . Aus r + s =
mq+np
nq
r s
a a
p
m
n
Wegen r, s ∈ Q gibt es m, p ∈ Z und n, q ∈ N mit r =
und s = q . Zunächst beweisen wir die Gleichung
folgt
p
n
=
am
p
q
qp
n
=
ap
q
p
nq
=
(a m )q
qp
q
·
n
=
a mq+np
(a p )n
p
=
nq
a mq
p
nq
a np
a r+s .
Die Gleichung (a r )s = a rs erhält man durch die Rechnung
(a r )s
=
m
p
(a n ) q
€p
n
=
p
=
nq
Šp
=
=
a nq
=
am
a mp
q
mp
q€
p
n
am
Šp
=
a rs
,
p
am bm
q
p
q p
=
n
a mp
und die Gleichung (a b) r = a r b r erhält man durch
(a b) r
=
m
(a b) n
=
m
=
p
m
=
ar br .
—–
70
an bn
n
(ab)m
n
=
ƒ
—–
p
n
am
p
n
bm
(V)
Bewertete Körper und komplexe Zahlen
(3.39) Definition
Eine Bewertung auf einem Körper K ist eine Abbildung | · | : K → R+ , so
dass für alle x, y ∈ K die folgenden Bedingungen erfüllt sind.
(i) x = 0 ⇔ |x| = 0
(ii) |x y| = |x|| y|
(iii) |x + y| ≤ |x| + | y|
(Dreiecksungleichung)
Das Paar (K, | · |) bezeichnet man dann als bewerteten Körper.
Wir definieren eine Abbildung | · | : R → R+ durch

x 7→
 x

−x
falls
x ≥0
falls
x < 0.
Man bezeichnet sie als Absolutbetrag auf den reellen Zahlen.
(3.40) Lemma Für jedes x ∈ R gilt x ≤ |x| und |x| = | − x|.
Beweis:
Im Fall x = 0 sind die Gleichungen |x| = 0 = | − x| und die Ungleichung x ≤ |x| offenbar gültig. Ist x
positiv, dann gilt nach Definition |x| = x und | − x| = x, und die Ungleichung ist wegen x ≤ x erfüllt. Ist dagegen
x negativ, dann gilt |x| = −x und | − x| = −x. Da x eine negative und −x eine positive Zahl ist, gilt auch hier
x ≤ −x = |x|.
(3.41) Satz Durch den Absolutbetrag ist eine Bewertung auf R definiert.
Beweis:
zu (i)
Zu überprüfen sind die Eigenschaften (i), (ii) und (iii) einer Bewertung.
„⇒“ Nach Definition gilt |0| = 0.
„⇐“ Ist |x| = 0R , dann gilt x = 0 oder −x = 0, also x = 0 in beiden Fällen.
zu (ii)
Man zeigt die Gleichung durch Betrachtung der vier Einzelfälle
(a) x, y ≥ 0
(b) x ≥ 0, y < 0
(c) x < 0, y ≥ 0
(d) x, y < 0.
Wir beschränken uns auf Fall (b). Nach Definition gilt |x| = x und | y| = − y. Im Fall x = 0 gilt |x|| y| = |0|| y| =
0 · | y| = 0 und |x y| = |0| = 0. Sei nun x > 0 vorausgesetzt. Dann gilt −x y = x(− y) > 0, also x y < 0 und deshalb
|x y| = −x y. Es folgt |x y| = −x y = x(− y) = |x|| y|, die Gleichung ist im Fall (b) also erfüllt.
—–
71
—–
zu (iii)
Wie für alle Körperelemente gilt x ≤ |x| und y ≤ | y|. Aus den Anordnungsaxiomen folgt x + y ≤ x + | y| ≤
|x| + | y|. Ebenso gilt −x ≤ | − x| = |x| und − y ≤ | − y| = | y| und somit −(x + y) ≤ |x| + | y|. Da |x + y| gleich x + y
oder gleich −(x + y) ist, ist die Ungleichung |x + y| ≤ |x| + | y| somit auf jeden Fall erfüllt.
ƒ
Wir werden nun noch ein weiteres Beispiel für einen bewerteten Körper kennenlernen. Der Beweis des folgenden
Satzes ist Gegenstand der Algebra-Vorlesung.
(3.42) Satz Es gibt einen Körper (C, +C , ·C ) mit folgenden Eigenschaften.
(i) Es gilt C ⊇ R, und für alle a, b ∈ R gilt a +C b = a + b und a ·C b = ab.
(ii) Es gibt ein Element i ∈ C mit i 2 = −1.
(iii) Jedes Element z ∈ C kann auf eindeutige Weise in der Form z = a + i b mit a, b ∈ R
dargestellt werden kann.
Man nennt C den Körper der komplexen Zahlen, und das Element i die imaginäre Einheit. Ist z ∈ C, z = a + i b
mit a, b ∈ R, so nennt man a den Realteil Re(z) und b den Imaginärteil Im(z) von z. Wieder verwenden wir zur
Vereinfachung der Notation die Symbole + und · statt +C und ·C zur Bezeichnung der Addition und Multiplikation
auf C.
Aus der Definition von C und der Tatsache, dass es sich um einen Körper handelt, kann direkt abgeleitet werden,
nach welchen Regeln die Addition, Multiplikation, Negative- und Kehrwertbildung zu erfolgen hat. Seien z, w ∈ C,
z = a + i b und w = c + id mit a, b, c, d ∈ R. Dann gilt
z+w
=
(a + i b) + (c + id)
=
(a + c) + i(b + d) ,
und das Produkt erhält man durch
zw
=
(a + i b)(c + id)
ac + i bc + iad + i 2 bd
=
=
=
ac + (−1)bd + i bc + iad
(ac − bd) + i(bc + ad).
An den Gleichungen 0 + z = 0 + (a + i b) = (a + 0) + i b = a + i b = z und 1 · z = 1(a + i b) = (1a) + i(1b) = a + i b = z
sieht man, dass Null- und Einselement von C durch 0C = 0 und 1C = 1 gegeben sind. Den Kehrwert erhält man im
Fall z 6= 0 durch die Rechnung
z −1
=
1
a + ib
=
a − ib
(a + i b)(a − i b)
a − ib
a2
+ ia b − ia b
− (−1)b2
=
—–
=
a − ib
a2
72
+
b2
—–
a − ib
a2
=
=
+ iab − iab − i 2 b2
a
a2
+
b2
+i
(−b)
a2 + b2
.
(3.43) Definition
Für jedes z ∈ C, z = a + i b mit a, b ∈ R nennt man z̄ = a − i b das zu z
konjugiert komplexe Element. Die Abbildung C → C, z 7→ z̄ bezeichnet man dann als komplexe
Konjugation.
Wir beweisen für die komplexe Konjuation einige einfache Rechenregeln.
(3.44) Proposition Für z, w ∈ C gilt
(i) z̄¯ = z
Beweis:
zu (i)
(iii) zw = z̄ w̄.
Wir schreiben z und w in der Form z = a + i b und w = c + id, mit a, b, c, d ∈ R.
Diese Gleichung ergibt sich durch die Rechnung
z̄¯
zu (ii)
(ii) z + w = z̄ + w̄
=
a + ib
=
=
a − ib
a + i(−b)
=
a + i(−(−b))
=
a + ib
=
z.
Es gilt z + w = (a + c) + i(b + d) und somit
z+w
=
(a + c) + i(b + d)
=
(a + c) − i(b + d)
=
(a − i b) + (c − id)
=
z̄ + w̄.
zu (iii) Wegen zw = (a + i b)(c + id) = (ac − bd) + i(ad + bc) gilt einerseits
zw
=
(ac − bd) − i(ad + bc).
Andererseits ist z̄ w̄ = (a − i b)(c − id) = (ac − bd) + i(−bc − ad). Also ist die Gleichung zw = z̄ w̄ erfüllt.
(3.45) Definition Sei z = a + i b ∈ C mit a, b ∈ R. Dann nennt man
|z|
=
p
a2 + b2
=
p
(a + i b)(a − i b)
=
p
zz̄
den Absolutbetrag von z.
Der komplexe Absolutbetrag |z| ist der Abstand des Punktes z vom Nullpunkt.
—–
73
—–
ƒ
(3.46) Satz Durch den Absolutbetrag ist eine Bewertung auf C definiert.
Beweis:
Wieder sind die Eigenschaften (i), (ii) und (iii) einer Bewertung zu überprüfen.
zu (i)
„⇒“
Die Darstellung der Null durch Real- und Imaginärteil ist gegen durch 0 + i0, und folglich gilt
p
p
|0| = 02 + 02 = 0. „⇐“ Sei z = a + i b mit a, b ∈ R. Ist |z| = 0, dann folgt a2 + b2 = 0 und somit a2 + b2 = 0.
Da Quadrate von Elementen in R entweder positiv oder gleich Null sind, folgt a = b = 0 und damit z = 0.
zu (ii)
Wegen (3.44) gilt |zw|2 = (zw)zw = zz̄w w̄ = |z|2 |w|2 . Durch Wurzelziehen auf beiden Seiten erhalten wir
|zw| = |z||w|.
zu (iii)
Seien z, w ∈ C vorgegeben. Es gilt die Äquivalenz
|z + w| ≤ |z| + |w|
⇔
|z + w|2 ≤ (|z| + |w|)2
(z + w)(z̄ + w̄) ≤ zz̄ + w w̄ + 2|z||w|
⇔
⇔
|z + w|2 ≤ |z|2 + 2|z||w| + |w|2
zz̄ + wz̄ + z w̄ + w w̄ ≤ zz̄ + w w̄ + 2|z||w|
⇔
⇔
wz̄ + z w̄ ≤ 2|z||w|.
Stellen wir wz̄ durch Real- und Imaginärteil dar, wz̄ = a + i b mit a, b ∈ R, dann ist die linke Seite der Ungleichung
wz̄ + z w̄
=
wz̄ + wz̄
=
(a + i b) + (a − i b)
=
2a
p
p
und auf der rechten Seite steht 2|z||w| = 2|z̄||w| = 2|wz̄| = 2 a2 + b2 . Zu zeigen ist also 2a ≤ 2 a2 + b2 , was zu
p
p
p
a ≤ a2 + b2 äquivalent ist. Aber diese Gleichung ist offenbar erfüllt, denn es gilt a ≤ |a| = a2 ≤ a2 + b2 .
ƒ
Der Körper C der komplexen Zahlen unterscheidet sich von R in einigen wichtigen Punkten.
(3.47) Satz Auf dem Körper C gibt es keine Anordnung. Es gibt also keine Teilmenge C+ ⊆ C,
so dass die Bedingungen (i) und (ii) aus (3.5) erfüllt sind.
Angenommen, C+ ist eine Teilmenge von C mit den Eigenschaften (i) und (ii). Nach Lemma (3.6) (i) sind Quadrate
von Elementen ungleich Null stets positiv, es gilt also −1 = i 2 ∈ C+ . Andererseits ist nach (3.8) (ii) das Einselement
1 positiv und −1 damit negativ. Auf Grund von Eigenschaft (i) einer Anordnung kann ein Element nicht zugleich
positiv und negativ sein. Dieser Widerspruch zeigt, dass eine Menge C+ mit den Eigenschaften (i) und (ii) nicht
existiert.
ƒ
—–
74
—–
Ein weiterer Unterschied zwischen R und C besteht darin, dass man in C aus beliebigen Elementen eine Quap
dratwurzeln ziehen kann; für jedes z ∈ C gibt es also ein w ∈ C mit w 2 = z. Beispielsweise sind i und 2i die
p
p 2
Quadratwurzeln von −1 und −2, denn es gilt i 2 = −1 und ( 2i)2 = 2 i 2 = 2(−1) = −2. Auch das Element i
besitzt wieder eine Quadratwurzel, denn es gilt
i
1
p +p
2
2
2
=
1
p
2
2
1
i
+2· p · p +
2
2
i
p
2
2
=
1
2
+ i + (− 12 )
=
i.
Allgemeiner kann man beweisen
(3.48) Satz In den komplexen Zahlen besitzt jede Gleichung der Form
an z n + an−1 z n−1 + ... + a2 z 2 + a1 z + a0
=
0
mit n ∈ N und a0 , a1 , ..., an ∈ C mindestens eine Lösung.
Diese Eigenschaft des Körpers C bezeichnet man als algebraische Abgeschlossenheit. Der Satz ist Thema der
Algebra- und der Funktionentheorie-Vorlesung. In den reellen Zahlen ist die entsprechende Aussage falsch, denn
beispielsweise besitzt die Gleichung x 2 + 1 = 0 keine reelle Lösung.
—–
75
—–
§ 4.
Folgen und Reihen
Inhaltsübersicht
Intuitiv bedeutet die Konvergenz einer Folge (an )n∈N reeller oder komplexer Zahlen gegen einen Grenzwert a, dass sich
die Folgenglieder an mit wachsendem n dem Wert a immer weiter annähern. Präziser lässt sich dies folgendermaßen
formulieren: Für jedes noch so kleine " ∈ R+ gibt es einen Index N , ab dem alle Folgenglieder von a einen Abstand
kleiner als " haben. Beispielsweise gibt es einen Index N , ab dem die Folgenglieder an (mit n ≥ N ) und der Grenzwert a
nur um einen Wert kleiner als " = 10−6 auseinanderliegen.
Nach der Formulierung des Konvergenzbegriffs werden wir im ersten Abschnitt vor allem untersuchen, unter welchen
Operationen, die auf Folgen angwendet werden können, die Konvergenzeigenschaft erhalten bleibt. Beispielsweise werden wir zeigen, dass für zwei konvergente Folgen (an )n∈N und (bn )n∈N mit Grenzwerten a und b auch die Folge
(an + bn )n∈N konvergiert, und zwar gegen den Wert a + b. Außerdem werden wir die sog. uneigentliche Konvergenz
gegen die unendlichen Werte ±∞ definieren.
In einigen Situationen ist es notwendig, die Konvergenz einer Folge zu nachzuweisen, ohne das man einen konkreten
Grenzwert angeben kann. Dies wird durch den Begriff der Cauchyfolge ermöglicht, den wir im zweiten Abschnitt einführen. Häufig kommt es auch vor, dass eine Folge zwar im Ganzen nicht konvergiert, wohl aber bestimmte Teilfolgen. Dies
ist zum Beispiel immer dann der Fall, wenn die Folge beschränkt ist, und führt auf den Begriff des Häufungspunkts.
Jeder Folge (an )n∈N kann eine neue Folge (sn )n∈N zugeordnet werden, deren n-tes Glied
P∞ durch sn = a1 +a2 +...+an gegeben
ist. Man nennt eine solche Folge eine Reihe und bezeichnet sie mit dem Ausdruck n=1 an . Beispielsweise wird die Folge
mit den Gliedern 1, 1 + 21 , 1 + 12 + 13 ,... die harmonische Reihe genannt. Wir werden im dritten Abschnitt eine Reihe von
Kriterien zusammenstellen, mit denen sich die Konvergenz von Reihen untersuchen lässt. Mit Hilfe der Reihen können
wir dann unter anderem die aus der Schule bekannte Dezimalbruchentwicklung reeller Zahlen präzise definieren.
(I)
Folgen und Konvergenz
Im gesamten Abschnitt bezeichnet (K, | · |) einen bewerteten Körper. Wie wir bereits in Abschnitt §3 definiert haben,
ist eine Folge (an )n∈N in K eine Familie reeller Zahlen mit N als Indexmenge, also eine Abbildung N → K. Gelegentlich bietet es sich an, eine Folge nicht bei n = 1, sondern bei einer anderen Zahl n0 ∈ Z beginnen zu lassen. Auch
Familien mit der Indexmenge {n ∈ Z | n ≥ n0 } nennen wir Folgen und verwenden in diesem Fall die Bezeichnung
(an )n≥n0 . Wir betrachten einige konkrete Beispiele für Folgen reeller und komplexer Zahlen.
(i)
(a)n∈N
=
(a, a, a, a, ...),
(ii)
( 1n )n∈N
=
(1, 12 , 13 , 14 , ...)
(iii)
n
( n+1
)n∈N
=
( 12 , 23 , 34 , 45 , ...)
(iv)
( 2nn )n∈N
=
4
5
6
7
( 12 , 24 , 38 , 16
, 32
, 64
, 128
, ...)
(v)
(b n )n∈N0
=
(1, b, b2 , b3 , b4 , b5 , ...),
a∈K
(konstante Folge)
b∈C
—–
76
—–
Setzt man im letzten Beispiel b = −1, dann erhält man die Folge (1, −1, 1, −1, 1, −1, 1, ...), für b = 3 kommt
entsprechend (1, 3, 9, 27, 81, 243, 728, ...) und für b = i die Folge
(1, i, −1, −i, 1, i, −1, −i, 1, i, −1, −i, 1, ...)
heraus. Im letzten Beispiel wiederholen sich die Folgenglieder periodisch in Viererschritten, weil i 4 = 1 ist.
Folgen können auch rekursiv definiert werden. Beispielsweise erhält man durch die Rekursionsvorschrift a0 = 1
und an+1 = (n + 1)an die Folge an = n!, gegeben durch die Fakultätsfunktion. Durch die Vorschrift f0 = f1 = 1 und
f n+2 = f n + f n+1 für n ≥ 0 erhält man die bekannte Fibonacci-Folge, deren erste Folgenglieder durch
(1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, ...)
gegeben sind. Beispielsweise ist f2 = f0 + f1 = 1 + 1 = 2, f3 = f1 + f2 = 1 + 2 = 3, f4 = f2 + f3 = 2 + 3 = 5, und nach
dem gleichen Schema berechnet man alle weiteren Folgenglieder.
Bevor wir zur zentralen Definition dieses Abschnitts kommen, schicken wir Folgendes voraus: Sei (an )n∈N eine Folge
in K, außerdem a ∈ K und " ∈ R+ .
• Die Ungleichung |an − a| < " bedeutet, dass der Abstand zwischen dem Wert a und dem Folgenglied an kleiner
als " ist. Da wir uns unter " im Allgemeinen einer „sehr kleine“ Zahl vorstellen, bedeutet die Ungleich also,
dass an „sehr nahe“ bei a liegt.
• Im Fall K = C ist dieser Abstand einfach der Abstand der beiden komplexen Zahlen an und a in der Ebene,
wenn wir wie in §3 komplexe Zahlen als Punkte in der Ebene betrachten, wobei der Realteil als x- und der
Imaginärteil als y-Koordinate aufgefasst wird.
• Im Fall K = R ist die Ungleichung |an − a| < " gleichbedeutend mit an − a < " und −(an − a) = a − an < ",
also mit a − " < an < a + ". Anschaulich bedeutet die Ungleichung, dass an und a auf dem Zahlenstrahl einen
Abstand kleiner als " haben.
• Sei nun N ∈ N. Die Aussage „|an − a| < " für alle n ≥ N “ bedeutet, dass die Ungleichung |an − a| < " für
alle Folgenglieder an ab dem Index N erfüllt ist. Die Ungleichung gilt also für aN , aN +1 , aN +2 usw., aber nicht
unbedingt für aN −1 .
(4.1) Definition
Sei (an )n∈N eine Folge in K und a ∈ K. Wir sagen, die Folge konvergiert
gegen a und schreiben
lim an
n→∞
=
a
,
wenn für jedes " > 0 ein N ∈ N existiert, so dass |an − a| < " für alle n ≥ N erfüllt ist. Man sagt
in diesem Fall, a ist ein Grenzwert der Folge (an )n∈N und bezeichnet die Folge als konvergent.
Folgen, die keinen Grenzwert besitzen, werden divergente Folgen genannt.
—–
77
—–
In der formalen Quantorenschreibweise lautet die Bedingung für die Konvergenz
∀" ∈ R+ : ∃N ∈ N : ∀n ∈ N, n ≥ N : |an − a| < ".
An Stelle von lim an verwenden wir auch die einfachere Schreibweise limn an .
n→∞
Veranschaulichung der Konvergenz einer Folge
Egal, wie klein der "-Streifen a − " < a < a + " (grün) um den Grenzwert a herum gewählt wird, es liegen immer nur endlich
viele Folgenglieder außerhalb des Streifens (schwarz) und die übrigen, unendlich vielen, innerhalb davon (rot).
—–
78
—–
Wir betrachten nun einige Beispiele für konvergente und divergente Folgen.
1
n
(i) Für die Folge (an )n∈N mit an =
(3.12) gibt es ein N ∈ N mit
1
N
für alle n ∈ N gilt limn an = 0. Sei nämlich " > 0 beliebig vorgegeben. Nach
< ". Für jedes n ≥ N folgt |an − 0| =
1
n
≤
1
N
< ".
(ii) Sei a ∈ K. Für die konstante Folge (an )n∈N gegeben durch an = a gilt limn an = a. Sei nämlich ein " > 0
vorgegeben und N = 1. Für alle n ≥ N gilt |an − a| = |a − a| = 0 < ".
(iii) Sei an =
mit
1
N
n
n+1
für alle n ∈ N. Dann gilt limn an = 1. Für ein vorgegebenes " sei nämlich N eine natürliche Zahl
< ". Für beliebige n ≥ N folgt dann
|an − 1|
(iv) Für an =
n
2n
=
n
n + 1 − 1
n − (n + 1) n+1 =
1
=
n+1
1
<
N
<
".
gilt limn an = 0. Um das zu sehen, zeigt man zunächst durch vollständige Induktion, dass 2n ≥ n2
für alle n ≥ 4 erfüllt ist. Für n = 4 ist 24 = 16 = 42 , also ist die Ungleichung offensichtlich erfüllt. Sei nun
n ∈ N und 2n ≥ n2 bereits bewiesen. Auf Grund der Voraussetzung n ≥ 4 gilt
(n − 1)2 ≥ 2
n2 − 2n + 1 ≥ 2
⇔
2n2 ≥ n2 + 2n + 1
⇔
⇔
⇔
n2 ≥ 2n + 1
2n2 ≥ (n + 1)2
,
und die Induktionsvoraussetzung liefert 2n+1 = 2 · 2n ≥ 2 · n2 ≥ (n + 1)2 . Sei nun " > 0 vorgegeben. Dann
wählen wir N0 ∈ N mit
1
N0
< " und setzen N = max{4, N0 }. Für alle n ≥ N gilt dann
|an − 0|
=
n
2n
=
n2 1
·
2n n
≤
1
n
≤
1
N0
<
".
(v) Die Folge (an )n∈N gegeben durch an = (−1)n für alle n ∈ N ist divergent. Denn angenommen, a ∈ R wäre
ein Grenzwert der Folge. Dann gibt es für " = 1 ein N ∈ N, so dass |an − a| < " für alle n ≥ N erfüllt ist.
Für gerades n ≥ N erhalten wir |a − 1| = |a − an | < 1, insbesondere −(a − 1) < 1 ⇔ 1 − a < 1 ⇔ a > 0.
Setzen wir dagegen ein ungerades n ≥ N ein, so erhalten wir |a − (−1)| = |a − an | < 1, also insbesondere
a + 1 < 1 ⇔ a < 0. Beide Ungleichungen können aber unmöglich erfüllt sein. Also hat uns die Annahme,
dass ein Grenzwert a existiert, zu einem Widerspruch geführt.
(4.2) Definition
Wir nennen eine Folge (an )n∈N beschränkt, wenn die Teilmenge von R+
gegeben durch {|an | | n ∈ N} beschränkt ist.
(4.3) Satz Jede konvergente Folge (an )n∈N ist beschränkt.
—–
79
—–
Beweis:
Sei a der Grenzwert der Folge. Die Konvergenzbedingung, angewendet auf " = 1, liefert ein N ∈ N mit
|an − a| < 1 für alle n ≥ N . Für den Betrag von an folgt daraus
|an |
=
|(an − a) + a|
≤
|an − a| + |a|
<
1 + |a|
für alle
n ≥ N.
Sei nun M = max{|a1 |, |a2 |, ..., |aN −1 |, 1 + |a|}. Dann ist |an | ≤ M für alle n ∈ N erfüllt.
ƒ
Wichtig ist auch der Umkehrschluss dieses Satzes: Jede unbeschränkte Folge ist divergent.
(4.4) Proposition Sei b ∈ R und (an )n∈N gegeben durch an = b n für alle n ∈ N.
(i) Ist |b| < 1, dann gilt limn an = 0.
(ii) Für b = 1 gilt limn an = 1.
(iii) In den Fällen b = −1 und |b| > 1 ist die Folge divergent.
Beweis:
zu (i)
Durch vollständige Induktion zeigt man zunächst, dass |b n | = |b|n und |b|n < 1 für alle n ∈ N gilt.
Sei nun " > 0 vorgegeben. Nach (3.12) gibt es ein N ∈ N mit |b|N < ". Für alle n ≥ N folgt dann
|an − 0| = |b n | = |b|n = |b|n−N |b|N ≤ |b|N < ".
zu (ii)
Die Folge (1n )n∈N = (1)n∈N ist konstant und konvergiert daher, wie oben gesehen, gegen ihren konstanten
Wert.
zu (iii)
Im Fall b = −1 stimmt (an )n∈N mit der Folge ((−1)n )n∈N überein und ist somit, wie bereits gesehen,
divergent. Für alle b ∈ C und |b| > 1 zeigen wir, dass die Folge unbeschränkt ist. Angenommen, es gibt ein c ∈ R+ ,
c > 0 mit |an | < c für alle n ∈ N. Nach Satz (3.12) gibt es ein andererseits ein N ∈ N mit |b N | = |b|N > c. Wir
erhalten somit einen Widerspruch zu unserer Annahme.
ƒ
(4.5) Proposition Ändert man bei einer Folge nur endlich viele Glieder ab, so ändert dies nichts
am Konvergenzverhalten. Genauer: Seien (an )n∈N und (bn )n∈N Folgen und M ∈ N, so dass
an = bn für alle n ≥ M erfüllt ist. Konvergiert nun (an )n∈N gegen ein a ∈ R, dann konvergiert
(bn )n∈N gegen denselben Wert.
Beweis:
Sei " > 0 vorgegeben. Auf Grund der Konvergenz von (an )n∈N finden wir ein N0 ∈ N mit der Eigenschaft,
dass |an − a| < " für alle n ≥ N0 gilt. Sei nun N = max{M , N0 }. Für alle n ≥ N gilt dann |bn − a| = |an − a| < ". Also
konvergiert auch (bn )n∈N gegen a.
ƒ
Ebenso einfach beweist man, dass sich das Konvergenzverhalten einer Folge nicht ändert, wenn man endlich viele
Glieder am Anfang der Folge hinzunimmt oder entfernt.
(4.6) Satz Der Grenzwert einer Folge (an )n∈N , sofern er existiert, ist eindeutig bestimmt.
—–
80
—–
Beweis: Angenommen, a und a0 sind zwei verschiedene Grenzwerte der Folge. Sei " = |a0 −a|. Sei " = a0 −a. Wegen
limn an = a gibt es ein N1 ∈ N, so dass |an − a| < 12 " für alle n ≥ N1 gilt. Andererseits gibt es wegen limn→∞ an = a0
auch ein N2 ∈ N mit der Eigenschaft, dass |an − a0 | < 21 " für alle n ≥ N2 erfüllt ist. Für alle n ≥ max{N1 , N2 } gilt nun
"
|a0 − a|
=
=
|(a0 − an ) + (an − a)|
≤
|an − a0 | + |an − a|
1
"
2
<
+ 21 "
=
".
Dieser Widerspruch zeigt, dass die Annahme falsch war und somit keine zwei verschiedenen Grenzwerte existieren.
ƒ
Wir beweisen nun eine Reihe von Aussagen, die es uns erlauben, die Berechnung der Grenzwerte von kompliziert
aufgebauten Folgen auf bereits bekannte Grenzwerte von Folgen zurückzuführen. Man bezeichnet diese Aussagen
zusammenfassend als Grenzwertsätze.
(4.7) Satz Seien (an )n∈N , (bn )n∈N und (cn )n∈N Folgen in K, wobei cn = an + bn für alle n ∈ N
ist. Gilt nun
lim an = a
lim bn = b
und
n→∞
mit
n→∞
a, b ∈ K
,
dann konvergiert auch (cn )n∈N , und zwar gegen den Wert a + b.
Sei " > 0 vorgegeben. Auf Grund der Konvergenz von (an )n∈N gibt es ein N1 ∈ N mit |an − a| < 21 " für alle
Beweis:
n ≥ N1 . Die Konvergenz von (bn )n∈N liefert uns ein N2 ∈ N mit |bn − b| < 21 " für alle n ≥ N2 . Sei N = max{N1 , N2 }.
Für n ∈ N mit n ≥ N gilt dann
|cn − (a + b)|
=
|(an + bn ) − (a + b)|
=
|(an − a) + (bn − b)|
≤
|an − a| + |bn − b|
<
1
"
2
+ 12 "
Also konvergiert (cn )n∈N tatsächlich gegen den Wert a + b.
(4.8) Satz
=
".
ƒ
Seien (an )n∈N , (bn )n∈N und (cn )n∈N Folgen in K mit cn = an bn für alle n ∈ N.
Konvergieren die Folgen (an )n∈N und (bn )n∈N gegen a bzw. b ∈ K, dann konvergiert auch die
Folge (cn )n∈N , und zwar gegen den Wert ab.
Beweis:
Weil (an )n∈N konvergent ist, ist sie nach Folgerung (4.3) auch beschränkt, es gibt also ein K1 ∈ R, K1 > 0
mit |an | < K1 für alle n ∈ N. Sei K = max{K1 , |b|} und " > 0 eine vorgegebene reelle Zahl. Auf Grund der Konvergenz
von (an )n∈N und (bn )n∈N finden wir natürliche Zahlen N1 , N2 ∈ N, so dass
|an − a| <
"
2K
für alle
n ≥ N1
und
|bn − b| <
"
2K
für alle
n ≥ N2
erfüllt ist. Sei nun N = max{N1 , N2 }. Für alle n ≥ N gilt dann
|cn − a b|
=
|an bn − an b + an b − ab|
"
"
+
K
|an ||bn − b| + |an − a||b| < K
2K 2K
|an bn − a b|
=
Also konvergiert (cn )n∈N gegen den Wert a b.
=
|an (bn − b) + (an − a)b|
=
1
"
2
+ 12 "
=
≤
".
ƒ
—–
81
—–
(4.9) Folgerung Seien (an )n∈N und (bn )n∈N konvergente Folgen mit den Grenzwerten a bzw.
b ∈ K und λ ∈ C.
(i) Die Folge (cn )n∈N gegeben durch cn = λan konvergiert gegen den Wert λa.
(ii) Die Folge (dn )n∈N mit dn = an − bn konvergiert gegen den Wert a − b.
Beweis:
Aussage (i) folgt aus Satz (4.8), wenn wir für (bn )n∈N die konstante Folge (λ)n∈N einsetzen. Zum Beweis
von (ii) wenden wir Aussage (i) zunächst auf λ = −1 an. Dies liefert die Gleichung limn −bn = −b. Nun erhält man
die gewünschte Aussage durch Anwendung von Satz (4.7) auf die Folgen (an )n∈N und (−bn )n∈N .
ƒ
(4.10) Satz Seien (an )n∈N und (bn )n∈N konvergente Folgen mit Grenzwerten a, b ∈ K, wobei
b 6= 0K ist. Dann gibt es ein N0 ∈ N mit bn 6= 0K für alle n ≥ N0 , und die Folge (cn )n≥N0 mit
cn =
Beweis:
an
bn
konvergiert gegen den Wert ab .
Wir zeigen zunächst, dass ein N0 ∈ N mit der angegebenen Eigenschaft existiert. Sei " = 12 |b|. Auf Grund
der Konvergenz von (bn )n∈N existiert ein N0 ∈ N mit |bn − b| < " für alle n ∈ N. Für alle n ≥ N0 gilt dann
|b|
und somit |bn | >
1
|b|,
2
=
|b − bn + bn |
≤
|b − bn | + |bn |
1
|b| + |bn |
2
<
insbesondere ist bn 6= 0K . Durch Übergang zum Kehrwert erhalten wir die Abschätzung
|bn |−1 < 2|b|−1 .
Wir beweisen nun die Konvergenz von (cn )n≥N0 zunächst für den Spezialfall, dass es sich bei (an )n∈N um die konstante
Folge mit Wert 1 handelt. Für vorgegebenes " > 0 wählen wir uns ein N1 ∈ N mit der Eigenschaft, dass
<
|bn − b|
"|b|2
für alle
2
n ≥ N1
Für alle n ≥ N mit N = max{N0 , N1 } erhalten wir dann
1
b − bn 1
1 b − b
− = =
n
b
b
bn b
|bn ||b|
n
<
gilt.
2 "|b|2
|b|2
2
=
".
Die entsprechende Aussage für eine beliebige konvergente Folge (an )n∈N erhält man nun wegen
(4.8).
an
bn
= an · b1 aus Satz
n
ƒ
Als Anwendungsbeispiel für die bisherigen Sätze bestimmen wir den Grenzwert der Folge
an
=
n2 + 7n + 3
3n2 − 5
—–
82
für alle
—–
n∈N
Es gilt
lim an
n→∞
=
lim
n2 + 7n + 3
=
3n2 − 5
n→∞
lim
n→∞
limn 1 + limn
7
n
+
3−
5
n2
1+
3
n2
€7Š
+ limn
n
€ Š
limn 3 − lim n52
=
€
Š
limn 1 + 7n + n32
Š
€
limn 3 − n52
=
€3Š
n2
sofern alle in der Rechnung aufgeführten Grenzwerte existieren. (Wenn auch nur einer der Grenzwerte nicht existieren würde, dann wäre die gesamte Rechnung wertlos, weil die Voraussetzungen der Grenzwertsätze nicht erfüllt
und ihre Anwendung daher unzulässig wäre!) Nun gilt limn
limn
7
n
= 0, limn
3
n2
= 0 und limn
5
n2
1
n
= 0 und limn
1
n2
= (limn 1n )(limn 1n ) = 0 · 0 = 0. Es folgt
= 0. Insgesamt erhalten wir
=
lim an
n→∞
1+0+0
3−0
=
1
.
3
(4.11) Satz Seien (an )n∈N , (bn )n∈N reelle konvergente Folgen mit Grenzwerten a, b ∈ R. Gilt
an ≤ bn für alle n ∈ N, dann folgt a ≤ b.
Beweis:
Nehmen wir an, dass a > b ist, und sei " =
es ein N1 ∈ N mit |an − a| < ", also an > a − " =
bn < b+" =
1
(a+ b)
2
1
(a
2
1
(a
2
− b) > 0. Wegen der Konvergenz von (an )n∈N gibt
+ b). Ebenso finden wir ein N2 ∈ N mit |bn − b| < ", also
für alle n ≥ N2 . Sei nun N = max{N1 , N2 }. Für alle n ≥ N erhalten wir dann an > 12 (a+ b) > bn ,
im Widerspruch zur Voraussetzung, dass an ≤ bn für alle n ∈ N gilt.
ƒ
(4.12) Satz („Sandwich-Lemma“)
Seien (an )n∈N , (bn )n∈N und (cn )n∈N drei Folgen reeller Zahlen, und es gelte
an
≤
bn
≤
für alle
cn
n ∈ N.
Konvergieren die Folgen (an )n∈N und (cn )n∈N gegen denselben Grenzwert a ∈ R, dann konvergiert die Folge (bn )n∈N , und zwar gegen den Wert a.
Beweis:
Sei " ∈ R+ vorgegeben. Wegen limn an = limn cn = a gibt es N1 , N2 ∈ N, so dass |an − a| < " für alle n ≥ N1
und und |cn − a| < " für alle n ≥ N2 erfüllt ist. Es folgt an > a − " für alle n ≥ N1 und cn < a + " für alle n ≥ N2 . Sei
N = max{N1 , N2 } und n ∈ N mit n ≥ N . Dann gilt einerseits
bn − a
≥
an − a
>
a−"−a
=
−"
cn − a
<
a+"−a
=
".
und andererseits
bn − a
≤
Aus −" < bn − a < " folgt |bn − a| < ". Damit ist limn bn = a bewiesen.
—–
83
—–
ƒ
(4.13) Definition Man sagt, eine reelle Folge (an )n∈N konvergiert uneigentlich gegen +∞ und
verwendet die Notation
lim an = +∞,
n→∞
wenn für jedes κ ∈ R+ ein N ∈ N existiert, so dass an > κ für alle n ≥ N erfüllt ist. Ebenso
schreiben wir limn an = −∞, wenn es für jedes κ ∈ R+ ein N ∈ N mit an < −κ für alle n ≥ N
gibt.
Wir betrachten einige Beispiele zur uneigentlichen Konvergenz.
(i) Die Folge (an )n∈N mit an = 2n konvergiert uneigentlich gegen +∞. Ist nämlich κ > 0 vorgegeben, dann
finden wir nach (3.12) ein N ∈ N mit 2N > κ. Für alle n ≥ N gilt dann 2n = 2n−N · 2N > κ.
(ii) Die Folge (an )n∈N mit an = −n konvergiert uneigentlich gegen −∞. Ist nämlich κ ∈ R+ vorgegeben, dann
gibt es nach dem archimedischen Axiom ein N ∈ N mit N > κ. Für alle n ≥ N gilt dann an = −n ≤ −N < −κ.
(iii) Die Folge (an )n∈N mit an = (−1)n ist weder eigentlich noch uneigentlich konvergent. Dass es keinen reellen
Grenzwert gibt, haben wir bereits gezeigt. Ebensowenig gilt limn an = +∞, denn es es gibt zum Beispiel für
κ = 1 kein N ∈ N mit an > κ für alle n ≥ N . (Tatsächlich ist kein einziges Folgenglied größer als 1.) Genauso
sieht man, dass auch limn an = −∞ nicht erfüllt ist.
Auch für uneigentliche Grenzwerte lassen sich in begrenztem Umfang „Rechenregeln“ aufstellen.
(4.14) Proposition Seien (an )n∈N und (bn )n∈N Folgen reeller Zahlen mit
lim an
n→∞
=
lim bn
n→∞
=
+∞.
Dann gilt auch limn (an + bn ) = +∞.
Beweis:
Sei κ ∈ R+ vorgegeben. Wegen limn an = +∞ gibt es ein N1 ∈ N mit an > 21 κ für alle n ≥ N1 . Ebenso gibt
es wegen limn bn = +∞ ein N2 ∈ N mit bn > 12 κ. Sei nun N = max{N1 , N2 }. Für alle n ∈ N mit n ≥ N gilt dann
an + bn
>
1
κ + 12 κ
2
Damit ist limn (an + bn ) = +∞ bewiesen.
=
κ.
ƒ
Sind andererseits (an )n∈N und (bn )n∈N Folgen mit limn an = +∞ und limn bn = −∞, dann ist über die Folge der
Form (an + bn )n∈N keine Aussage möglich. Ist beispielsweise an = 2n und bn = −n, dann gilt an + bn = n und
somit limn (an + bn ) = +∞. Im Fall an = n und bn = −2n konvergiert an + bn = −n uneigentlich gegen −∞. Es
kann aber auch vorkommen, dass (an + bn )n∈N gegen eine reelle Zahl konvergiert (zum Beispiel gegen 42 im Fall
—–
84
—–
an = n + 42, bn = −n) oder einfach divergiert (zum Beispiel bei an = n + (−1)n und bn = −n). Folgende Tabellen
geben zusammenfassend an, wie sich (uneigentliche) Grenzwerte bezüglich der Rechenoperationen +, −, · und bei
Kehrwertbildung verhalten.
+
−∞
b∈R
+∞
−
−∞
b∈R
+∞
−∞
−∞
−∞
?
−∞
?
−∞
−∞
a∈R
−∞
a+b
+∞
a∈R
+∞
a−b
−∞
+∞
?
+∞
+∞
+∞
+∞
+∞
?
·
−∞
b<0
b=0
b>0
+∞
−∞
+∞
+∞
?
−∞
−∞
a<0
+∞
ab
0
ab
−∞
a=0
?
0
0
0
?
a>0
−∞
ab
0
ab
+∞
+∞
−∞
−∞
?
+∞
+∞
lim an
lim an−1
−∞
0
a<0
a
−1
a=0
?
a>0
a
−1
+∞
0
Beispielsweise bedeutet der Eintrag links oben in der „+“-Tabelle: Sind (an )n∈N0 und (bn )n∈N0 Folgen mit limn an =
limn bn = −∞, dann folgt limn (an + bn ) = −∞. Die Zeilen und Spalten mit den Einträgen b ∈ R, b < 0 usw. beziehen
sich immer auf endliche (reelle) Werte. Der Eintrag „?“ bedeutet jeweils, dass bei der entsprechenden Kombination
keine allgemeine Aussage möglich ist, so wie wir es oben bereits in einem konkreten Fall gesehen haben.
Im Hinblick auf spätere Anwendungen wird es sich als günstig herausstellen, dass wir für die Konvergenz einer reellen Folge eine einheitliche Definition zur Verfügung haben. Dazu erinnern wir an die in §3 eingeführte Bezeichnung
R̄ für die Menge R ∪ {±∞}.
(4.15) Definition
Seien a ∈ R̄ und U ⊆ R̄ vorgegeben. Wir bezeichnen die Menge U als
Umgebung des Punktes a
(i) im Fall a ∈ R, wenn ein " ∈ R+ existiert, so dass ]a − ", a + "[ ⊆ U erfüllt ist
(ii) im Fall a = +∞, wenn ein κ ∈ R+ existiert, so dass ]κ, +∞] ⊆ U gilt,
(iii) im Fall a = −∞, wenn ein κ ∈ R+ existiert, so dass [−∞, −κ[ ⊆ U gilt.
Im Fall (i) bezeichnen wir die Menge ]a − ", a + "[ selbst als "-Umgebung von a.
Auf der Grundlage dieser Definition gilt nun: Eine reelle Folge (an )n∈N konvergiert genau dann (eigentlich oder
uneigentlich) gegen einen Punkt a ∈ R̄, wenn eine Umgebung U ⊆ R̄ von a und ein N ∈ N existieren, so dass
an ∈ U für alle n ≥ N erfüllt ist. Dies ergibt sich unmittelbar durch Vergleich mit den Definitionen (4.1) und (4.13).
—–
85
—–
(II)
Häufungspunkte und Cauchyfolgen
(4.16) Definition Sei K ein bewerteter Körper und (an )n∈N eine Folge in K. Ein Punkt a ∈ K
wird Häufungspunkt von (an )n∈N genannt, wenn es für jedes " ∈ R+ jeweils unendlich viele
n ∈ N mit |an − a| < " gibt.
Beispielsweise besitzt die Folge (an )n∈N gegeben durch an = (−1)n für zwei verschiedene Häufungspunkte, nämlich
−1 und 1. Allgemein gilt
(4.17) Proposition
Konvergiert die Folge (an )n∈N gegen ein a ∈ K, dann ist a der einzige
Häufungspunkt von (an )n∈N .
Beweis:
Zunächst zeigen wir, dass a ein Häufungspunkt der Folge ist. Sei " ∈ R+ vorgegeben. Dann gibt es ein
N ∈ N mit |an − a| < " für alle n ≥ N . Also ist |an − a| < " für unendlich viele n ∈ N erfüllt. Nehmen wir nun
an, es gibt einen weiteren Häufungspunkt b. Auf Grund der Konvergenz gibt es für "1 = |b − a| ein N1 ∈ N mit
|an − a| < 12 "1 für alle n ≥ N1 . Sei nun n ∈ N mit n ≥ N1 . Wäre |an − b| < 21 "1 , dann würde daraus
"1
=
|b − a|
≤
|(b − an ) + (an − a)|
≤
|an − b| + |an − a|
<
1
"
2 1
+ 21 "1
=
"1
folgen. Der Widerspruch "1 < "1 zeigt, dass |an − b| < 12 "1 nur für n < N1 möglich ist. Damit kann b kein Häufungspunkt von (an )n∈N sein.
ƒ
Wir werden nun die Häufungspunkte reeller Folgen genauer untersuchen.
(4.18) Definition Eine Folge (an )n∈N reeller Zahlen ist
(i) monoton wachsend, wenn an ≤ an+1
(ii) streng monoton wachsend, wenn an < an+1
(iii) monoton fallend, wenn an ≥ an+1
(iv) streng monoton fallend, wenn an > an+1
für alle n ∈ N erfüllt ist.
(4.19) Satz Jede beschränkte, monoton wachsende oder fallende Folge reeller Zahlen konvergiert.
Beweis:
Sei (an )n∈N monoton wachsend und beschränkt. Auf Grund der Vollständigkeit von R existiert s = sup A
für die Menge A = {an | n ∈ N}. Wir beweisen nun, dass s = limn an gilt und geben dafür ein " ∈ R+ vor. Da s − "
—–
86
—–
keine obere Schranke für die Menge A ist, gibt es ein N ∈ N mit s − " < aN ≤ s. Für beliebiges n ≥ N gilt nun
s − " < aN ≤ an ≤ s, also an > s − " und somit |s − an | = s − an < ". Die entsprechende Argumentation für monoton
fallende Folgen verläuft analog, man braucht nur das Supremum durch das Infimum zu ersetzen.
ƒ
(4.20) Definition Sei (an )n∈N eine Folge reeller Zahlen. Man nennt
lim supn an
=
lim infn an
=
lim sup {am | m ∈ N, m ≥ n}
n→∞
bzw.
lim inf {am | m ∈ N, m ≥ n}
n→∞
den Limes superior bzw. Limes inferior von (an )n∈N , sofern diese Grenzwerte existieren.
(4.21) Proposition
Sei (an )n∈N eine beschränkte Folge reeller Zahlen. Dann existieren
lim supn an und lim infn an .
Beweis:
Wir beweisen nur die Existenz von lim supn an . Dazu definieren wir für jedes n ∈ N die Menge An = {am |
m ∈ N, m ≥ n}, außerdem sei a eine untere und b eine obere Schranke von A1 = {am | m ∈ N}. Für jedes n ∈ N
gilt An ⊆ A1 . Also ist a auch eine untere und b eine obere Schranke von An . Weil An nichtleer und beschränkt ist,
existiert sup An , und es gilt a ≤ sup An ≤ b.
Wir müssen nun zeigen, dass limn sup An existiert. Wegen An ⊇ An+1 ist jede obere Schranke von An auch eine obere
Schranke von An+1 . Es gilt also S + (An ) ⊆ S + (An+1 ), und daraus folgt
sup An
=
min S + (An )
≥
min S + (An+1 )
=
sup An+1 .
Insgesamt haben wir damit nachgewiesen, dass die Folge gegeben durch die Elemente sup An , n ∈ N monoton fallend
und nach unten beschränkt ist. Aus Satz (4.19) folgt die Konvergenz.
ƒ
(4.22) Satz Sei (an )n∈N eine beschränkte Folge reeller Zahlen. Dann ist lim supn an der größte
Häufungspunkt von (an )n∈N (also maximal in der Menge der Häufungspunkte), und lim infn an
ist der kleinste Häufungspunkt der Folge.
Beweis:
Zunächst zeigen wir, dass a = lim supn an ein Häufungspunkt der Folge ist. Sei " ∈ R+ vorgegeben. Es
genügt zu zeigen, dass für jedes N ∈ N jeweils ein n ∈ N mit n ≥ N und |an − a| < " existiert, denn dann gibt es
unendlich viele n mit |an − a| < ".
Sei also N ∈ N vorgegeben. Wie im letzten Beweis definieren wir An = {am | m ≥ n} für alle n ∈ N. Weil die Folge
(sup An )n∈N gegen a konvergiert, gibt es ein m ∈ N mit m ≥ N und | sup Am − a| < 12 ". Weil außerdem sup Am eine
—–
87
—–
obere Schranke, sup Am − 12 " aber keine obere Schranke von Am ist, gibt es ein n ∈ N mit n ≥ m ≥ N und
sup Am − 12 "
<
≤
an
sup Am .
Insbesondere gilt |an − sup Am | < 21 ". Insgesamt erhalten wir |an − a| = |an − sup Am + sup Am − a| ≤ |an − sup Am | +
| sup Am − a| < 12 " + 12 " = ".
Nun zeigen wir, dass a der größte Häufungspunkt der Folge ist. Nehmen wir an, dass b ∈ R mit b > a ein weiterer
Häufungspunkt ist. Sei " = b − a. Dann gibt es für jedes m ∈ N ein n ≥ m mit |an − b| < 12 ". Insbesondere gilt
an > b − 21 " = a + 12 ". Weil sup Am eine obere Schranke von {an | n ≥ m} ist, folgt daraus
≥
sup Am
a + 12 ".
Weil diese Abschätzung für jedes m ∈ N gültig ist, folgt
a
=
lim sup Am
m→∞
≥
a + 21 "
,
im Widerspruch zu a < a + 12 ". Also muss a der größte Häufungspunkt von (an )n∈N sein. Der Beweis der entsprechenden Aussagen für den Limes inferior läuft analog.
(4.23) Folgerung
ƒ
(Satz von Bolzano-Weierstrass)
Jede beschränkte Folge reeller Zahlen besitzt einen Häufungspunkt.
Beweis:
Dies ist eine unmittelbare Konsequenz aus Satz (4.22).
ƒ
(4.24) Folgerung Eine Folge konvergiert genau dann, wenn sie beschränkt ist und genau einen
Häufungspunkt besitzt.
Beweis:
Die Richtung „⇒“ ergibt sich aus Proposition (4.17) und Satz (4.3).
„⇐“
Sei (an )n∈N eine be-
schränkte Folge mit genau einem Häufungspunkt. Für jedes m ∈ N sei Am = {an | n ≥ m}. Nach Satz (4.22)
ist limn sup An = lim supn an der größte und limn inf An = lim infn an der kleinste Häufungspunkt von (an )n∈N . Auf
Grund der Voraussetzung, dass nur ein Häufungspunkt existiert, fallen beide Grenzwerte zusammen. Wegen am ∈ Am
gilt inf Am ≤ am ≤ sup Am für alle m ∈ N. Aus dem Sandwich-Lemmas (Satz (4.12)) folgt damit die Konvergenz der
Folge (an )n∈N .
(4.25) Definition
ƒ
Eine Folge (an )n∈N in K wird Cauchyfolge genannt, wenn für jedes " > 0
ein N ∈ N existiert, so dass
|an − am | < "
für alle
—–
88
n, m ≥ N
—–
gilt.
Wir geben ein anschauliches Kriterium für Cauchyfolgen an, dass auf der Schachtelung von Intervallen basiert.
Hierzu benötigen wir zunächst eine Beobachtung zum Durchschnitt abgeschlossener Intervalle. Ist I ein Intervall
mit den Grenzen a, b ∈ R̄, a < b, so bezeichnen wir ein x ∈ R mit a < x < b als inneren Punkt von I. Sind a, b ∈ R,
so wird `(I) = b − a die Länge von I genannt
(4.26) Lemma
Seien I und J endliche abgeschlossene Intervalle mit einem gemeinsamen
inneren Punkt. Dann ist auch I ∩ J ein endliches, abgeschlossenes Intervall, mit 0 < `(I ∩ J) ≤
min{`(I), `(J)}.
Beweis:
Sei I = [a, b] und J = [c, d], mit a, b, c, d ∈ R, a < b und c < d. Auf Grund der Voraussetzung gibt es ein
x ∈ R mit a < x < b und c < x < d. Es folgt max{a, c} < x < min{b, d}, also insbesondere min{b, d} − max{a, c} >
0. Außerdem gilt min{b, d} − max{a, c} ≤ b − a und ebenso min{b, d} − max{a, c} ≤ d − c. Das Intervall [u, v]
mit den Grenzen u = max{a, c} und v = min{b, d} stimmt mit I ∩ J überein, denn für jeden Punkt y ∈ R ist
a ≤ y ≤ b und c ≤ y ≤ d offenbar äquivalent zu u ≤ y ≤ v. Wie bereits festgestellt, gilt 0 < `([u, v]) < `(I) und
0 < `([u, v]) < `(J).
(4.27) Proposition Eine Folge (an )n∈N in R ist genau dann eine Cauchyfolge, wenn eine Folge
(I k )k∈N abgeschlossener Intervalle I k ⊆ R existiert mit den Eigenschaften
(i) I k ⊇ I k+1 für alle k ∈ N
(ii) Für jedes k ∈ N liegen alle bis auf endlich viele Folgenglieder in I k .
(iii) Es gilt lim `(I k ) = 0.
k→∞
Beweis:
„⇒“
Unter der Voraussetzung, dass (an )n∈N eine Cauchyfolge ist, konstruieren wir rekursiv eine
Intervallfolge (I k )k∈N mit den gewünschten Eigenschaften. Dabei soll I k jeweils ein abgeschlossenes Intervall der
Länge ≤ 2 · 2−k sein. An Stelle von (ii) wählen wir die Intervalle I k sogar so, dass jeweils alle bis auf endlich viele
Folgenglieder innere Punkte von I k sind. Weil (an )n∈N eine Cauchyfolge ist, gibt es ein n0 ∈ N mit |an − am | < 1 für
alle m, n ≥ n0 . Definieren wir das Intervall I0 durch I0 = [an0 − 1, an0 + 1], dann ist an für alle n ≥ n0 ein innerer
Punkt von I0 , und I0 hat die Länge 2 = 2 · 2−0 .
Sei nun k ∈ N0 vorgegeben, und setzen wir voraus, dass nk und das Intervall I k mit der Länge 2 · 2−k bereits
konstruiert wurden. Wiederum auf Grund der Cauchyfolgen-Eigenschaft existiert ein nk+1 ≥ nk , so dass |am − an | <
2−(k+1) für alle m, n ≥ nk+1 erfüllt ist. Setzen wir
J
=
[ank+1 − 2−(k+1) , ank+1 + 2−(k+1) ]
,
dann ist an für jedes n ≥ nk+1 ein innerer Punkt von I k und J. Nach Lemma (4.26) ist I k+1 = I k ∩J ein abgeschlossenes
Intervall mit Länge ≤ 2 · 2−(k+1) , und für jedes n ≥ nk+1 ist ist an innerer Punkt von I k+1 . Wegen limk 2 · 2−k = 0 gilt
erst recht limk `(I k ) = 0. Damit sind alle Aussagen erfüllt.
—–
89
—–
„⇐“
Sei (I k )k∈N eine Folge von Intervallen mit der angegebenen Eigenschaft. Zum Nachweis der Cauchyfolgen-
Eigenschaft sei " ∈ R+ vorgegeben. Wir wählen k ∈ N so groß, dass `(I k ) < " ist. Nach Voraussetzung liegen
alle bis auf endlich viele Folgenglieder in I k , es gibt also ein N ∈ N mit an ∈ I k für alle n ≥ N . Daraus folgt
|an − am | ≤ `(I k ) < " für alle m, n ≥ N . Also ist (an )n∈N eine Cauchyfolge.
ƒ
(4.28) Satz Die Cauchyfolgen in R sind genau die konvergenten Folgen.
Beweis:
„⇐“
Sei (an )n∈N eine konvergente Folge und a ∈ R ihr Grenzwert. Zum Nachweis der Cauchyfolgen-
Eigenschaft sei " ∈ R+ vorgegeben. Dann gibt es N ∈ N mit |an − a| < 12 " für alle n ≥ N . Sind m, n ≥ N vorgegeben,
so folgt
|an − am |
„⇒“
=
|(an − a) + (a − am )|
≤
|an − a| + |am − a|
<
1
"
2
+ 21 "
=
".
Sei (an )n∈N eine reelle Cauchyfolge und (I k )k∈N eine Folge von Intervallen mit den in (4.27) beschriebenen
Eigenschaften. Auf Grund der Vollständigkeit von R und der Intervallschachtelungs-Eigenschaft (siehe Satz (3.24))
gibt es ein a ∈ R mit a ∈ I k für alle k ∈ N. Wir zeigen, dass limn an = a gilt. Sei " ∈ R+ vorgegeben. Wir können
k ∈ N nach (4.27) (iii) so groß wählen, dass `(I k ) < " gilt. Auf Grund der Eigenschaft (ii) in (4.27) existiert ein
N ∈ N, so dass an ∈ I k für alle n ≥ N gilt. Aus a ∈ I k folgt |an − a| ≤ `(I k ) < " für alle n ≥ N .
ƒ
Cauchyfolgen ermöglichen es also, die Konvergenz einer Folge auch dann nachzuweisen, wenn der Grenzwert unbekannt ist. Dies wird sich im nächsten Abschnitt bei den unendlichen Summen (Reihen) als sehr hilfreich erweisen.
Wir beenden den Abschnitt mit einem Anwendungsbeispiel, indem wir die Konvergenz der Folge
1 n
an =
1+
n
untersuchen. Von praktischer Bedeutung ist diese Formel für die Zinsrechnung. Stellen wir uns vor, ein gewisser
Geldbetrag k (in Euro) wird mit einem jährlichen Zinssatz von 100 Prozent verzinst. (Diesen unrealistisch hohen
Zinssatz wählen wir nur, um das Beispiel so einfach wie möglich zu halten.) Dann hängt der Kontostand am Ende
des Jahres davon ab, wie häufig der Betrag verzinst wurde. Fallen die Zinsen nur einmal im Jahr an, hätte man am
Jahresende den Betrag 2a. Bei monatlicher Verzinsung werden natürlich nicht jedesmal 100 Prozent aufgeschlagen,
1 12
sondern der Zinssatz wird durch 12 geteilt. Am Jahresende hätte sich dann der Betrag k(1 + 12
) angesammelt. Bei
n gleichmäßig über das Jahr verteilten Verzinsungen hat man am Jahresende den Betrag
1 n
kan = k 1 +
n
angespart. Lassen wir n gegen unendlich laufen, dann erhält man den Betrag, der bei einer kontinuierlichen Verzinsung zu Stande kommt. Die entscheidende Frage ist nun, ob dies noch ein endlicher Wert ist, und wenn ja, in
welcher Größenordnung sich dieser bewegt.
(4.29) Proposition Die Folge (an )n∈N gegeben durch an = (1 + 1n )n für alle n ∈ N ist konvergent. Wir bezeichnen den Grenzwert als die Eulersche Zahl e.
—–
90
—–
Durch Anwendung der Bernoullischen Ungleichung erhalten wir für n ≥ 2 die Abschätzung
Beweis:
€
Šn €
Šn
1 + 1n
1 − 1n
€
1−
=
1
n2
Šn
≥
1−
1
n
€
Šn €
Šn−1
1 + 1n
1 − 1n
≥1
⇔
und weiter
€
Šn
1 + 1n
=
an
1
€
Šn−1
1 − 1n
>
=
1
€ n−1 Šn−1
=
n ‹n−1

n−1
n
=
1+
n−1
1
=
n−1
an−1 .
Dies zeigt, dass die Folge (an )n∈N monoton wachsend ist. Wir betrachten nun die Folge (bn )n∈N gegeben durch
bn = (1 + 1n )n+1 für alle n ∈ N. Durch die Rechnung
1
1+
1
n
·
1
1−
=
1
n
n2
n2 − 1 + 1
=
(n + 1)(n − 1)
n2
erhalten wir wiederum mit Hilfe der Bernoullische Ungleichung
n
1
1
1
1+ 2
€
Šn · €
Šn =
n −1
1+ 1
1− 1
n
>
=
−1
1+
n
1
1+
n
1
n2
−1
>
1+
1
n2
1
n
.
Multiplikation der beiden Seiten mit (1 + 1n )n liefert
=
bn
1+
1
n+1
n
<
1
€
Šn
1 − 1n
1
€ n−1 Šn
=

=
n ‹n
n−1
n
=
1+
n
n−1
=
bn−1 .
Also ist (bn )n∈N monoton fallend. Darüber hinaus gilt
1
<
1+
1
n
≤
€
Šn
1 + 1n
=
an
≤
bn
=
€
Šn+1
1 + 1n
≤
(1 + 1)2
=
4.
Dies bedeutet, dass (an )n∈N nach oben und (bn )n∈N nach unten beschränkt ist. Nach Satz (4.19) sind damit beide
Folgen konvergent.
ƒ
Aus dem Beweis ergibt sich, dass die Folge (an )n∈N von unten, die Folge (bn )n∈N von oben gegen den Grenzwert
e konvergiert. Es gilt also an ≤ e ≤ bn für alle n ∈ N. Man erhält auf diese Weise für n = 2 die Abschätzung
2, 25 =
9
4
<e<
27
8
= 3, 375. Für n = 105 erhält man die genauere Abschätzung 2, 71827 < e < 2, 71830, gerundet
auf die ersten 60 Dezimalstellen ist
e
≈
2, 71828182845904523536028747135266249775724709369995957496697.
—–
91
—–
(III)
Konvergenzkriterien für Reihen
(4.30) Definition
Sei (an )n∈N eine (reelle oder komplexe) Folge. Dann bezeichnet man die
Folge (sn )n∈N gegeben durch
sn =
n
X
n∈N
für
ak
k=1
als Reihe über (an )n∈N . Das Folgenglied sn nennt man die n-te Partialsumme der Reihe.
Beginnt die Folge nicht bei 1, sondern an einem beliebigen Startwert n0 ∈ Z, dann beginnt auch die Folge der
Partialsummen bei n0 . Die Reihe über (an )n≥n0 ist dann gegeben durch
n
X
=
sn
n ∈ Z mit n ≥ n0 .
für alle
ak
k=n0
Die Reihe über (an )n∈N bzw. (an )n≥n0 wird mit
∞
X
∞
X
an bzw.
an bezeichnet.
n=n0
n=1
Wir betrachten einige konkrete Beispiele für Reihen.
(i) Die Reihe
∞
X
1
n
besteht aus den Folgengliedern
n=1
s1 = 1,
(ii) Die Reihe
s2 = 1 +
1
2
= 32 ,
s3 = 1 +
1
2
+
1
3
=
11
,
6
s4 = 1 +
1
2
+
1
3
+
1
4
=
25
,
12
...
∞
X
(−1)n besteht aus den Folgengliedern
n=1
s1 = −1,
s2 = (−1) + 1 = 0,
(4.31) Definition
Sei
P∞
n=1
s3 = (−1) + 1 + (−1) = −1,
s4 = (−1) + 1 + (−1) + 1 = 0,
...
an eine Reihe über R oder C und (sn )n∈N die Folge ihrer Partial-
summen. Man sagt, die Reihe konvergiert gegen einen Grenzwert a ∈ R (oder C), wenn die
Folge (sn )n∈N gegen a konvergiert. Existiert kein solcher Grenzwert, dann spricht man von einer
divergenten Reihe.
Ebenso ordnet man der Reihe den Grenzwert +∞ oder −∞ zu, wenn die Folge (sn )n∈N uneigentlich gegen +∞ oder
P∞
P∞
−∞ konvergiert. Konvergiert die Reihe n=1 an , dann verwendet man die Notation n=1 an auch für den Grenzwert,
man setzt also
∞
X
an
n=1
—–
=
lim
n→∞
92
n
X
k=1
—–
ak .
Die Bezeichnung
P∞
n=1
an wird also für zwei verschiedene Objekte verwendet: einerseits für die Folge (sn )n∈N der
Partialsummen, andererseits auch für den (evtl. uneigentlichen) Grenzwert dieser Folge, sofern er existiert. Welche
Bedeutung gemeint ist, muss dem jeweiligen Kontext entnommen werden.
In einigen Fällen lässt sich der Grenzwert einer Reihe direkt angeben.
(4.32) Proposition Es gilt
∞
X
1
n=1
n(n + 1)
= 1.
Pn
1
n
Wir beweisen zunächst durch vollständige Induktion über n ∈ N die Summenformel k=1 k(k+1)
= n+1
.
P1
1
1
1
Die Gleichung ist für n = 1 richtig, denn es gilt k=1 k+1 = 2 = 1+1 . Den Induktionsschluss von n auf n + 1 erhält
Beweis:
man durch
n+1
X
1
k=1
k(k + 1)
=
n
X
1
k=1
k(k + 1)
n(n + 2) + 1
n
Ind.-V.
=
(n + 1)(n + 2)
n2 + 2n + 1
=
(n + 1)(n + 2)
1
+
(n + 1)(n + 2)
=
n+1
+
1
(n + 1)(n + 2)
(n + 1)2
=
(n + 1)(n + 2)
n+1
=
,
n+2
wobei wir beim zweiten „=“ die Induktionsvoraussetzung verwendet haben. Die Folge (sn )n∈N ist also gegeben durch
P∞
n
1
n
sn = n+1
, und es folgt n=1 n(n+1)
= limn n+1
= 1.
ƒ
(4.33) Proposition
(geometrische Reihe)
Für alle x ∈ C mit |x| < 1 gilt
∞
X
xn =
n=0
Beweis:
1
1− x
.
Wir beweisen durch vollständige Induktion über n ∈ N0 die Summenformel
n
X
=
xn
1 − x n+1
1− x
k=0
Für n = 0 gilt
n+1
X
k=0
P0
xk
k=0
=
x0 = 1 =
n
X
1−x
.
1−x
.
Der Schluss von n auf n + 1 folgt aus der Rechnung
Ind.-V.
x k + x n+1 =
k=0
1 − x n+1
1− x
+ x n+1
1 − x n+1
=
1− x
Die Folge (sn )n∈N der Partialsummen ist also gegeben durch sn =
+
1−x n+1
.
1−x
x n+1 − x n+2
1− x
n=0
xn
=
lim
n→∞
1 − x n+1
1− x
—–
93
=
—–
1
1− x
.
1 − x n+2
1− x
.
Wegen |x| < 1 gilt lim x n = 0. Unter
n→∞
Verwendung der Grenzwertsätze erhalten wir also
∞
X
=
ƒ
P∞
P∞
an und n=1 bn konvergente Reihen über R oder C und λ ∈ R bzw.
P∞
P∞
P∞
C. Dann sind auch die Reihen n=1 (an + bn ), n=1 (an − bn ) und n=1 λan konvergent, und es
(4.34) Satz Seien
n=1
gilt
∞
∞
∞
X
X
X
(an + bn ) =
an +
bn
n=1
n=1
,
n=1
∞
∞
∞
X
X
X
(an − bn ) =
an −
bn
n=1
n=1
und
n=1
∞
X
λan = λ
n=1
∞
X
an .
n=1
Diese Aussagen ergeben sich ziemlich unmittelbar aus den Grenzwertsätzen für Folgen. Wir beschränken
P∞
P∞
uns deshalb auf die Reihe n=1 (an + bn ). Seien (sn )n∈N und (t n )n∈N die Folgen der Partialsummen von n=1 an
P∞
bzw. n=1 bn . Durch einen leichten Induktionsbeweis zeigt man zunächst, dass sn + t n die n-te Partialsumme von
P∞
n=1 (an + bn ) ist. Auf Grund des Grenzwertsatzes für Summen gilt nun
Beweis:
∞
X
(an + bn )
=
n=1
Der Beweis für
P∞
n=1 (an
− bn ) und
lim (sn + t n )
n→∞
P∞
n=1 λan
=
lim sn + lim t n
n→∞
n→∞
=
∞
X
an +
n=1
∞
X
bn .
n=1
verläuft völlig analog.
ƒ
P∞
P∞
(4.35) Proposition Seien n=1 an und n=1 bn konvergente Reihen über R. Gilt an ≤ bn für
P∞
P∞
alle n ∈ N, dann folgt n=1 an ≤ n=1 bn .
P∞
Beweis:
Sei (sn )n∈N die Folge der Partialsummen von n=1 an und (t n )n∈N die Folge der Partialsummen von
P∞
n=1 bn . Durch Anwendung der Voraussetzung an ≤ bn und vollständige Induktion beweist man, dass sn ≤ t n für
alle n ∈ N gilt. Die entsprechende Aussage (4.11) für Folgen liefert nun die Behauptung.
ƒ
Wir werden nun einige Kriterien für die Konvergenz von Reihen herleiten. Wir beschränken uns dabei auf Reihen
über reellwertigen Folgen.
(4.36) Satz
(Cauchy-Kriterium)
P∞
Eine Reihe n=1 an = (sn )n∈N in R konvergiert genau dann, wenn für jedes " > 0 ein N ∈ N
existiert, so dass
n
X
a
=
k=m+1 k Beweis:
|sn − sm |
<
"
für alle
m, n ∈ N
mit
n≥m≥N
gilt.
Das angegebene Kriterium ist genau dann erfüllt, wenn die Folge (sn )n∈N der Partialsummen eine Cauchy-
folge bildet. Nach Satz (4.28) ist die Cauchyfolgen-Eigenschaft äquivalent zur Konvergenz der Folge.
—–
94
—–
ƒ
∞
X
(4.37) Folgerung Sei
an eine konvergente Reihe in R. Dann gilt lim an = 0.
n→∞
n=1
Sei " ∈ R+ vorgegeben. Nach dem Cauchy-Kriterium gibt es ein N ∈ N mit |
Beweis:
Pn
k=m+1
ak | < " für alle
m, n ≥ N . Wählen wir n = m + 1, dann erhalten wir insbesondere |am+1 | < " für alle m ≥ N , also |am | < " für alle
m ≥ N + 1.
ƒ
(4.38) Satz
(Monotoniekriterium)
Sei (an )n∈N eine Folge nichtnegativer reeller Zahlen. Genau dann konvergiert die Reihe
P∞
n=1
an ,
wenn die Folge (sn )n∈N der Partialsummen beschränkt ist.
Setzen wir voraus, dass die Folge (sn )n∈N beschränkt ist. Wegen an ≥ 0 für alle n ∈ N ist sie außerdem
Beweis:
monoton wachsend. Also folgt die Konvergenz aus Satz (4.19). Umgekehrt folgt aus der Konvergenz von (sn )n∈N die
Beschränktheit dieser Folge.
ƒ
(4.39) Satz Die Reihe
∞
X
1
n=1
n
divergiert.
Wir zeigen, dass die Folge (sn )n∈N der Partialsummen unbeschränkt ist. Für p ∈ N gilt




p+1
p
p
2
2k+1
2k+1
X
X
X
X
X
1



1
1
s2p+1 =
= 1+

 ≥ 1+

k+1 
n
n
2
k
k
n=1
k=0
k=0
Beweis:
n=2 +1
=
1+
p
X
2k ·
k=0
1
2k+1
=
1+
p
X
1
2
n=2 +1
=
1 + 12 (p + 1)
1
(p
2
=
+ 3).
k=0
Dabei haben wir im zweiten Schritt die Summe lediglich in einzelne „Pakete“ aufgeteilt, d.h. wir haben Teilsummen
von 1 +
1
2
+
1
3
+ ... in der Form
1
1
2
+
+
( 31 + 14 )
+
( 15 +
1
6
+
1
7
+ 18 )
+
...
zusammengefasst. Beim dritten Schritt in der Ungleichungskette oben beachte man, dass für alle n ∈ N im Bereich
2k + 1 ≤ n ≤ 2k+1 die Abschätzung
1
n
≥
1
2k+1
gilt, und das insgesamt 2k Summanden in diesen Bereich fallen. Wegen
lim p 21 (p + 3) = +∞ zeigt die Ungleichungskette, dass die Partialsummen s2p+1 über jede vorgegebene reelle Zahl
hinauswachsen.
ƒ
—–
95
—–
(4.40) Satz
(Leibniz-Kriterium)
Sei (an )n∈N eine monoton fallende Folge nichtnegativer reeller Zahlen mit der Eigenschaft
P∞
limn an = 0. Dann konvergiert die Reihe n=0 (−1)n an .
Beweis:
Die Teilfolge (s2n )n≥0 der Folge (sn )n∈N der Partialsummen ist monoton fallend, denn es gilt
=
s2n+2 − s2n
a2n+2 − a2n+1
≤
0
für alle
n ∈ N0 .
Die Rechnung s2n+3 −s2n+1 = −a2n+3 +a2n+2 ≥ 0 zeigt, dass die Teilfolge (s2n+1 )n≥0 monoton wächst. Außerdem sind
beide Folgen beschränkt, denn es gilt s2n = s2n−1 + a2n ≥ s2n−1 ≥ s1 für alle n ∈ N und s2n+1 = s2n − a2n+1 ≤ s2n ≤ s0
für alle n ∈ N0 . Also existieren nach Satz (4.19) die beiden Grenzwerte
s = lim s2n
und
n→∞
s0 = lim s2n+1 .
n→∞
Wegen s − s0 = lim (s2n − s2n+1 ) = lim a2n+1 = 0 stimmen s und s0 überein.
n→∞
n→∞
Sei nun " ∈ R+ vorgegeben. Wegen der Konvergenz der beiden Teilfolgen gibt es nun N1 , N2 ∈ N mit |s2n − s| < "
für alle n ≥ N1 und |s2n+1 − s| < " für alle n ≥ N2 . Sei N = max{2N1 , 2N2 + 1} und n ∈ N mit n ≥ N . Ist n gerade,
n = 2k, dann gilt 2k ≥ N ≥ 2N1 und somit k ≥ N1 , also |sn − s| = |s2k − s| < ". Ist n dagegen ungerade, n = 2k + 1,
dann folgt k ≥ N2 und |sn − s| = |s2k+1 − s| < ".
ƒ
Nach dem Leibniz-Kriterium sind beispielsweise die Reihen
∞
X
1
(−1)n+1
n
n=1
∞
X
(−1)n
und
n=0
1
2n + 1
konvergent.
Die erste dieser beiden Reihen wird alternierende harmonische Reihe genannt.
P∞
(4.41) Definition Eine Reihe n=1 an wird absolut konvergent genannt, wenn die Reihe
P∞
n=1 |an | der Absolutbeträge konvergiert.
(4.42) Proposition Jede absolut konvergente Reihe ist im herkömmlichen Sinn konvergent.
Beweis:
Durch vollständige Induktion über n verallgemeinert man die Dreiecksungleichung
|x + y| ≤ |x| + | y| zunächst von zwei auf n Summanden, d.h. man beweist
n
n
X
X
a
≤
|ak |
k=1 k k=1
—–
96
—–
P∞
für beliebiges n ∈ N und a1 , ..., an ∈ R. Sei nun n=1 an eine absolut konvergente Reihe und " ∈ R+ vorgegeben. Da
P∞
n=1 |an | konvergiert, existiert nach dem Cauchy-Kriterium (Satz (4.36)) ein N ∈ N, so dass für alle m, n ≥ N die
Pn
Abschätzung k=m+1 |ak | < " erfüllt ist. Es folgt
n
n
X
X
|ak | < ".
ak ≤
k=m+1 k=m+1
Die erneute Anwendung des Cauchy-Kriteriums liefert die gewöhnliche Konvergenz der Reihe.
ƒ
(4.43) Satz
(Majorantenkriterium)
P∞
P∞
Sei n=1 cn eine konvergente Reihe in R+ und n=1 an eine Reihe mit |an | ≤ cn für fast alle
P∞
(d.h. alle bis auf endlich viele) n ∈ N. Dann konvergiert n=1 an absolut.
Zunächst bemerken wir, dass (wie bei den Folgen) die Modifikation von endlich vielen Gliedern einer
Beweis:
Reihe nichts an deren Konvergenzverhalten ändert. Deshalb können wir die Ungleichung |an | ≤ cn für alle n ∈ N
voraussetzen. Wir zeigen nun, dass eine Reihe unter der angegebenen Bedingung das Cauchy-Kriterium erfüllt.
P∞
Sei " ∈ R+ vorgegeben. Auf Grund der Konvergenz von n=1 cn gibt es ein N ∈ N mit
n
n
X
X
ck = ck < "
für n, m ≥ N .
k=m+1 k=m+1
Pn
Pn
Wegen |ak | ≤ ck für alle k ∈ N folgt k=m+1 |ak | ≤ k=m+1 ck < ". Damit sind die Voraussetzungen des CauchyKriteriums nachgewiesen.
ƒ
(4.44) Folgerung
(Minorantenkriterium)
P∞
P∞
Sei n=1 cn eine divergente Reihe in R+ und n=1 an eine Reihe mit an ≥ cn für fast alle n ∈ N.
P∞
Dann ist auch n=1 an divergent.
Beweis:
Wie im vorherigen Beweis können wir die Ungleichung an ≥ cn für alle n ∈ N voraussetzen. Wäre
P∞
n=1
an
konvergent, dann könnten wir das Majorantenkriterium anwenden und erhielten damit auch die Konvergenz der
P∞
Reihe n=1 cn , im Widerspruch zur Voraussetzung.
ƒ
Wir illustrieren die Anwendung von Majoranten- und Minorantenkriterium an einer Reihe von Beispielen.
Beispiel 1:
Für alle k ≥ 2 ist die Reihe
∞
X
1
n=1
nk
konvergent.
Beweis: Durch direktes Nachrechnen haben wir bereits gezeigt, dass
∞
X
1
n=1
n(n + 1)
—–
97
—–
eine konvergente Reihe ist. Da eine konvergente Reihe auch nach Multiplikation mit einem skalaren Vielfachen noch
2
konvergent ist (vgl. Satz (4.34)) ist auch die Reihe über ( n(n+1)
)n∈N konvergent. Nun gelten für alle n ∈ N die
Ungleichungen
n≥1
also
1
nk
≤
1
n2
Beispiel 2:
≤
2
n(n+1)
⇔
n2 ≥ n
2n2 ≥ n2 + n
⇔
n2 ≥ 21 n(n + 1).
⇔
für alle n ∈ N. Das Majorantenkriterium beweist somit die Konvergenz der Reihe.
Die Reihe
∞
X
1
2n + 7
n=1
ƒ
ist divergent.
Beweis: Für alle n ∈ N mit n ≥ 7 gilt
2n + 7 ≤ 3n
Wäre
P∞
P∞
1
n=1 3n
1
n=1 3n
⇔
1
3n
P∞
≤
1
2n + 7.
1
n=1 n ,
was wir bereits widerlegt haben. Also haben wir mit
eine divergente Minorante für unsere Reihe gefunden.
ƒ
Beispiel 3:
konvergent, dann nach Satz (4.34) auch
Die Reihe
∞
X
1
n=1
n2 − 5
ist konvergent.
Beweis: Für alle n ∈ N mit n ≥ 4 gilt
n2 ≥ 10
also
1
n2 − 5
≤
2
∞
X
2
n
n2
. Somit ist
2
(4.45) Satz
n=1
1 2
n
2
⇔
≥5
⇔
n2 − 5 ≥ 12 n2
eine konvergente Majorante für
∞
X
1
n=1
n2 − 5
,
.
(Quotientenkriterium)
Sei (an )n∈N eine Folge mit an 6= 0 für fast alle n ∈ N. Ferner existiere ein θ ∈ R, 0 < θ < 1, so
dass die Ungleichung
an+1 a n
erfüllt ist. Dann ist
∞
X
≤
θ
für fast alle
an absolut konvergent.
n=1
—–
98
—–
n∈N
ƒ
Beweis:
an+1
| ≤ θ für alle n ∈ N
an
|an+1 | ≤ θ n |a1 | für alle n ∈ N0 .
Wir setzen voraus, dass die Bedingungen an 6= 0 und |
|a2 | ≤ θ |a1 |, und durch vollständige Induktion beweist man
erfüllt sind. Dann gilt
P∞
Die Reihe n=0 θ n |a1 |
stimmt bis auf den konstanten Faktor |a1 | mit der geometrischen Reihe überein, konvergiert also gegen den Wert
P∞
P∞
|a1 |/(1 − θ ). Somit ist n=0 θ n |a1 | eine konvergente Majorante der Reihe n=1 an .
ƒ
Mit Hilfe des Quotientenkriteriums kann beispielsweise gezeigt werden, dass die Reihe
∞
X
n
n=1
konvergiert. Setzen wir nämlich an =
an+1 a n
an+1
=
an
n
,
2n
2n
dann gilt
n+1
2n+1
n
2n
=
n + 1 2n
·
2n+1 n
=
n+1
=
1
2
=
2n
1+
1
n
und für n ≥ 2 gilt
1
n
≤
1
2
⇔
1+
1
n
≤
3
2
|an+1 |/|an | = 21 (1 + 1n ) ≤ 34 .
⇔
3
4
Die Voraussetzungen des Quotientenkriteriums sind also mit der Konstante θ =
erfüllt.
Wir wenden das Quotientenkriterium nochmals auf eine etwas kompliziertere Situation an, indem wir die Konvergenz der Reihe
∞
X
n3 + 5
4n
n=1
beweisen. Setzen wir an =
an+1 a n
≤
n3 +5
4n
=
1
4
·
für n ∈ N, dann gilt für n ≥ 2 die Ungleichung n + 1 ≤ 32 n, und somit
(n + 1)3 + 5
4n+1
27 3
n + 5 · 27
8
8
n3 + 5
wobei im vierten Schritt die Abschätzung
teriums sind also mit der Konstanten θ =
·
=
4n
n3 + 5
1
4
·
=
1
4
·
(n + 1)3 + 5
27
(n3 + 5)
8
n3 + 5
27
≤ 5 · 27
8
8
27
erfüllt.
32
n3 + 5
=
1
4
·
27
8
≤
=
1
4
27
32
·
( 32 n)3 + 5
n3 + 5
<
1
,
verwendetet wurde. Die Voraussetzungen des Quotientenkri-
Man beachte, dass es für die Anwendung des Quotientenkriteriums nicht genügt, lediglich die Ungleichung |
P∞
für fast alle n ∈ N zu beweisen. Betrachten wir zum Beispiel die Reihe n=1 an mit an = 1n . Es gilt
an+1 n
für alle n ∈ N ,
a = n+1 < 1
n
an+1
|
an
<1
aber die Reihe ist, wie wir gezeigt haben, divergent.
mit an 6= 0 und
a
| an+1 |
n
an+1
|
an
kann auch die Divergenz von Folgen nachgewiesen werden. Sei (an )n∈N eine Folge
P∞
≥ 1 für fast alle n ∈ N. Dann divergiert die Reihe n=1 an . Ist nämlich n0 ∈ N so gewählt, dass
Mit Hilfe der Quotienten |
die Bedingungen für alle n ≥ n0 erfüllt sind, dann erhält man die Ungleichungen
|an0 |
≤
|an0 +1 |
≤
|an0 +2 |
—–
99
—–
≤
...
,
so dass die Folge an also keine Nullfolge sein kann. Deshalb ist die Reihe
P∞
n=1
an divergent.
(4.46) Folgerung Sei (an )n∈N eine Folge und n0 ∈ N, so dass an 6= 0 für n ≥ n0 gilt und die
Folge (|
an+1
|)n≥n0
an
konvergiert, mit α = lim |
n→∞
an+1
|.
an
(i) Gilt α < 1, dann konvergiert die Reihe
∞
X
an absolut.
n=1
(ii) Gilt α > 1, dann divergiert sie.
Im Fall α = 1 ist keine Aussage möglich, d.h. es gibt Reihen mit dieser Eigenschaft, die konvergieren, und andere, die divergieren.
Den Beweis stellen wir als Übungsaufgabe. Das folgende Kriterium ist dem Quotientenkriterium ähnlich, basiert aber
auf der Wurzelfunktion.
(4.47) Satz
(Wurzelkriterium)
Sei (an )n∈N eine Folge mit der Eigenschaft, dass ein θ ∈ R, 0 < θ < 1 existiert, so dass
P∞
θ für fast alle n ∈ N erfüllt ist. Dann konvergiert die Reihe n=1 an absolut.
p
n
|an | ≤
p
Sei die Bedingung n |an | ≤ θ für alle n ∈ N erfüllt. Dann gilt |an | ≤ θ n für alle n ∈ N, also ist wiederum
P∞
ƒ
die geometrische Reihe n=0 θ n eine konvergente Majorante.
Beweis:
Wie beim Quotientenkriterium gilt, dass im Falle von
p
n
|an | ≥ 1 für unendlich viele n ∈ N, die Reihe
P∞
n=1
an
divergiert. Denn dann gilt unendlich oft |an | ≥ 1, die Folge (an )n∈N kann also keine Nullfolge sein. Genau wie in
Folgerung (4.46) beweist man auch
p
(4.48) Folgerung Sei (an )n∈N eine Folge mit der Eigenschaft, dass die Folge ( n |an |)n∈N konp
vergiert, mit α = lim n |an |.
n→∞
(i) Gilt α < 1, dann konvergiert die Reihe
∞
X
an absolut.
n=1
(ii) Gilt α > 1, dann divergiert sie.
Wiederum ist im Fall α = 1 ist keine Aussage möglich.
Weder Quotienten- noch Wurzelkriterium sind stark genug, um die Divergenz der harmonischen Reihe oder die
P∞
Konvergenz der Reihe n=1 n12 nachzuweisen, denn es gilt
1
n+1
lim
n→∞ 1
n
= lim
n→∞
n
n+1
=1
und ebenso
—–
100
lim
n→∞
—–
1 2
( n+1
)
( 1n )2
= lim
n→∞

n ‹2
n+1
= 1.
Wir formulieren nun ein Kriterium, dass für diese Reihen geeignet ist. Der Beweis ähnelt dem Verfahren, mit dem
P∞
wir die Divergenz der harmonischen Reihe n=1 1n nachgewiesen haben.
(4.49) Satz (Verdichtungskriterium)
Sei (an )n∈N eine monoton fallende Folge nichtnegativer reeller Zahlen, und sei die Folge
(bk )k∈N0 definiert durch bk = 2k a2k für alle k ∈ N0 . Dann gilt die Äquivalenz
∞
X
∞
X
⇔
an ist konvergent
n=1
Beweis:
„⇐“
bk ist konvergent.
k=0
Nach Voraussetzung ist die Reihe
P∞
bk konvergent. Zu zeigen ist, dass die Reihe
k=0
P∞
n=1
an
konvergiert. Für alle k ∈ N0 und m ∈ N0 mit 0 ≤ m < 2 gilt auf Grund der Monotonie der Folge (an )n∈N die
k
Abschätzung a2k ≥ a2k +m . Setzen wir also c2k +m = a2k für k ∈ N0 und 0 ≤ m < 2k , dann gilt cn ≥ an für alle n ∈ N.
P∞
P∞
Wenn wir zeigen können, dass die Reihe n=1 cn konvergiert, dann folgt die (absolute) Konvergenz von n=1 an
aus dem Majorantenkriterium (Satz (4.43)). Dafür wiederum genügt es zu zeigen, dass die Folge der Partialsummen
Pp
r−1
≤ p < 2 r erfüllt ist. Dann gilt die
n=1 cn beschränkt ist. Sei p ∈ N vorgegeben und r ∈ N so gewählt, dass 2
Abschätzung
p
X
cn
≤
r
2X
−1
k
r−1 2X
−1
X
=
cn
r−1
X
=
bk
∞
X
≤
k=0
Sämtliche Partialsummen
Pp
n=1 cn
a2 k
=
k=0 m=0
k=0 m=0
n=1
n=1
=
c2k +m
k
r−1 2X
−1
X
bk
<
r−1
X
2k a2k
k=0
+∞.
k=0
sind also durch den endlichen Wert
P∞
k=0
bk nach oben beschränkt.
P∞
„⇒“ Diese Richtung beweisen wir durch Kontraposition: Wir setzen voraus, dass die Reihe k=0 bk divergiert und
P∞
leiten daraus die Divergenz von n=1 an ab. Für alle k ∈ N0 und m ∈ N0 mit 0 ≤ m < 2k definieren wir c2k +m = a2k+1 .
P∞
Auf Grund der Monotonie der Folge (an )n∈N gilt dann cn ≤ an für alle n ∈ N. Wenn wir zeigen können, dass n=1 cn
P∞
divergiert, dann folgt die Divergenz von n=1 an aus dem Minorantenkriterium (Satz (4.44)). Sei p ∈ N mit p ≥ 2
Pp
vorgegeben und r ∈ N so gewählt, dass 2 r ≤ p < 2 r+1 erfüllt ist. Dann erhalten wir für die Partialsumme n=1 cn
die untere Abschätzung
p
X
cn
≥
n=1
r
2X
−1
=
cn
=
r−1
X
c2k +m
=
k=0 m=0
n=1
1
2
k
r−1 2X
−1
X
2
k+1
a2k+1
=
k=0
k
r−1 2X
−1
X
a2k+1
k=0 m=0
1
2
r−1
X
bk+1
k=0
=
1
2
=
r−1
X
2k a2k+1
k=0
r
X
!
bk − a1
.
k=0
Pr
bk auf Grund der Voraussetzung für r → ∞ gegen +∞ läuft, gilt auf Grund der Abschätzung
Pp
P∞
P∞
dasselbe für die Partialsumme n=1 cn für p → ∞. Also ist n=1 cn und damit auch n=1 an divergent.
ƒ
Weil die Summe
k=0
—–
101
—–
Als Anwendung des Verdichtungskriteriums beweisen wir, dass die Reihe
P∞
n=1
n−α für jedes α ∈ Q mit α > 1
konvergiert. Setzen wir an = n−α für alle n ∈ N und θ = 21−α , so gilt 0 ≤ θ < 1 und
∞
X
=
2k a2k
k=0
P∞
∞
X
2k
k=0
1
∞ €
X
Šk
21−α
=
2kα
=
k=0
∞
X
θ k.
k=0
a2k mit der geometrischen Reihe zum Wert θ übereinstimmt und folglich konverP∞
giert. Nach dem Verdichtungskriterium ist damit auch n=1 an konvergent. (Aussage und Beweis sind auch für
Die Rechung zeigt, dass
k=0 2
k
irrationale α ∈ R mit α > 1 gültig, Allerdings haben wir n−α für irrationales α noch nicht definiert, weil dafür der
Stetigkeitsbegriff benötigt wird.)
Gelegentlich wird bei Rechnungen mit einer Reihe
P∞
an die Reihenfolge der Glieder an abgeändert, und es soll
n=1
sichergestellt werden, dass diese Operation keine Auswirkung auf das Konvergenzverhalten und den Grenzwert der
Reihe hat. Wenn bei der ursprünglichen Reihe absolute Konvergenz vorliegt, so ist dies tatsächlich der Fall.
(4.50) Satz
(Umordnungssatz)
P∞
Sei n=1 an eine absolut konvergente Reihe. Ist τ : N → N eine bijektive Abbildung, dann ist
P∞
auch die Reihe n=1 aτ(n) absolut konvergent, und es gilt
∞
X
=
an
∞
X
aτ(n) .
n=1
n=1
Für jedes n ∈ N sei An = {1, ..., n}, Bn = τ(An ) und bn = max Bn . Zunächst beweisen wir die absolute
P∞
Konvergenz von n=1 aτ(n) . Es gilt
Beweis:
n X
a
τ(k)
=
k=1
Dies zeigt, dass die Folge
X
|ak |
≤
k∈Bn
Pn
k=1 |aτ(k) |
bn
X
|ak |
≤
|an |
<
+∞.
n=1
k=1
der Partialsummen von
∞
X
P∞
n=1
aτ(n) beschränkt ist und die Reihe somit tatsäch-
lich absolut konvergiert.
Nun muss noch gezeigt werden, dass beide Reihen gegen denselben Wert konvergieren. Für jedes n ∈ N sei
Pn
Pn
sn = k=1 ak und sn0 = k=1 aτ(k) . Nach den Grenzwertsätzen genügt es dazu, die Gleichung limn (sn − sn0 ) = 0
P∞
nachzuweisen. Sei also " ∈ R+ vorgegeben. Weil die Reihe n=1 an absolut konvergiert, gibt es ein N ∈ N mit
∞
X
|ak |
k=N +1
—–
102
<
1
".
2
—–
Weil die Abbildung τ surjektiv ist, existiert ein N 0 ≥ N mit BN 0 = τ(AN 0 ) ⊇ AN . Für alle n ≥ N 0 gilt dann ebenfalls
Bn ⊇ AN , was zu AN = Bn ∩ AN äquivalent ist. Für solche n erhalten wir
sn − sn0
X
=
ak −
k∈An
X
X
k∈Bn
X
ak +
X
ak −
X
ak
=
k∈Bn \AN
X
ak −
ak .
k∈Bn \AN
k∈An \AN
k∈Bn \AN
k∈AN
X
ak −
k∈Bn ∩AN
=
ak
X
ak −
k∈An \AN
X
ak −
X
ak +
k∈AN
k∈An \AN
k∈AN
X
=
ak
Es folgt
|sn − sn0 |
X
≤
X
|ak | +
|ak |
∞
X
≤
k=N +1
k∈Bn \AN
k∈An \AN
∞
X
|ak | +
1
"
2
<
|ak |
k=N +1
+ 21 "
=
".
Weil " ∈ R+ beliebig vorgegeben war, folgt daraus limn (sn − sn0 ) = 0 wie gewünscht.
ƒ
Wir illustrieren an einem Beispiel, dass sich der Wert einer Reihe bei Umordnung ändern kann, wenn keine absolute,
sondern nur „gewöhnliche“ Konvergenz vorliegt, die man auch als bedingte Konvergenz bezeichnet. Wie wir mit
Hilfe des Leibniz-Kriteriums gezeigt haben, konvergiert die alternierende harmonische Reihe
∞
X
1
(−1)n+1
n
n=1
∞ X
=
1
2k − 1
k=1
Sie konvergiert aber nicht absolut, denn die harmonische Reihe
1
−
2k
P∞
n=1 |(−1)
.
n+1 1
|
n
=
P∞
1
20
+
1
n=1 n
ist divergent. Summieren
wir nun die alternierende harmonische Reihe in der umgeordneten Form
1−
1
2
−
1
4
+
1
3
−
1
6
−
1
8
+
1
5
−
1
10
−
1
12
+
1
7
−
1
14
−
1
16
+
1
9
−
1
18
−
1
11
−
1
22
−
1
24
+ ...
Anstatt auf einen ungerade (positiven) Term nur einen geraden (negativen) Term folgen zu lassen, ordnen wir ihm
jeweils zwei gerade Terme zu. Insgesamt wird die Summe also in „Dreierblöcken“ organisiert, die in der Form
1
1
1
2−1
1
1
1
1
−
−
=
−
= 2
−
2k − 1 2(2k − 1) 4k
2(2k − 1) 2 · 2k
2k − 1 2k
geschrieben werden können. Als Summe über diese Terme erhalten wir
∞ X
k=1
1
2k − 1
−
1
2(2k − 1)
−
1
4k
=
∞
X
1
2
k=1
1
2k − 1
−
1
2k
=
1
2
∞
X
1
(−1)n+1 .
n
n=1
Gegenüber der herkömmlichen Reihenfolge hat sich der Grenzwert also halbiert.
Eine wichtige, konkrete Anwendung der Theorie der konvergenten Reihen liegt in der Darstellung reeller Zahlen
durch endliche oder unendliche Dezimalbrüche. Weil es keinen zusätzlichen Aufwand bedeutet, beschränken wir
uns nicht auf die gewohnten Darstellungen zur Basis 10, sondern betrachten als Basis beliebige natürliche Zahlen
b > 1.
—–
103
—–
(4.51) Definition Sei b ∈ N mit b > 1. Ein b-adischer Bruch ist eine Reihe der Form
∞
X
an b−n
n=−r
wobei r ∈ Z sowie 0 ≤ an < b und an ∈ Z für alle n ∈ Z mit n ≥ −r gilt. Dabei bezeichnet man
an als die n-te Stelle des b-adischen Bruchs.
Symbolisch stellt man b-adische Brüche in der Form a−r ...a−1 a0 , a1 a2 ... dar. Für b = 10 erhält man so die bekannte
Dezimaldarstellung reeller Zahlen. Zum Beispiel gilt
0, 33333...
∞
X
=
3 · 10
−n
∞
X
=
n=1
−(n+1)
3
10
=
3 · 10
·
∞
X
10−n
3
10
=
·
n=0
n=0
1
1
10
1−
Dabei haben wir im zweiten Schritt die Formel für den Wert der geometrische Reihe
3
10
=
P∞
n=0 q
n
=
·
10
9
1
1−q
=
1
.
3
verwendet.
Gibt es ein N mit an = 0 für n ≥ N , dann können diese Stellen bei der symbolischen Darstellung auch weggelassen
werden, d.h. 0, 497 und 0, 49700000... bezeichnen denselben b-adischen Bruch. Sich periodisch wiederholende
Stellen kennzeichnet man durch einen Überstrich: 0, 3 = 0, 33333... Wir betrachten einige weitere Beispiele.
(i) Die 10-adischen Brüche 1, 0 und 0, 9 stellen beide die reelle Zahl 1 dar. Im zweiten Fall folgt dies aus der
Rechnung
0, 9
=
∞
X
−n
=
9 · 10
9
10
∞ €
X
·
n=1
1
10
Šn
=
9
10
·
n=0
1
1−
9
10
=
1
10
·
1
9
10
=
9
10
·
10
9
=
1.
Dies zeigt, dass die Darstellung einer reellen Zahl als b-adischer Bruch jedenfalls nicht völlig eindeutig ist.
(ii) Die b-adischen Darstellungen der reellen Zahl
1
7
lautet 0, 001 zur Basis b = 2. Zur Basis 10 erhalten wir
0, 142857 für b = 10, und 0, 1 zur Basis b = 7.
Beweis:
Wir rechnen lediglich nach, dass 0, 001 die 2-adische Darstellung von
1
7
ist, und überlassen den Rest dem
Leser als Übungsaufgabe. Sei (an )n∈N die Folge der Stellen des 2-adischen Bruchs. Dann gilt a3k−2 = a3k−1 = 0 und
P∞
a3k = 1 für alle k ∈ N. Für jedes n ∈ N sei sn die n-te Partialsumme der Reihe n=1 an 2−n . Wir erhalten
!
∞
n
2
X
X
X
−n
`−3k
0, 001 =
an 2
= lim sn = lim s3n = lim
a3k−` 2
n→∞
n=1
=
∞
X
2
X
k=1
`=0
n→∞
!
a3k−` 2`−3k
n→∞
k=1
`=0
∞
X
(a3k−2 22−3k + a3k−1 21−3k + a3k 2−3k )
=
=
k=1
∞
X
(4a3k−2 + 2a3k−1 + a3k )2−3k
∞
X
(4 · 0 + 2 · 0 + 1)2−3k
=
k=1
=
k=1
1
8
∞
X
k=0
8−k
=
1
8
k=1
1
1−
—–
∞
X
1
8
104
=
—–
1
8
·
8
7
=
1
.
7
8−k
=
Dabei wurde im dritten Schritt Folgerung (4.24) angewendet: Ist die Folge (sn )n∈N konvergent, dann ist mit (sn )n∈N
auch (s3n ) beschränkt, und kann wie (sn )n∈N nur einen Häufungspunkt besitzen, nämlich denselben wie (sn )n∈N .
Daraus folgt, dass die Grenzwerte beider Folgen, sofern sie existieren, übereinstimmen müssen. Dass sie existieren,
ergibt sich unabhängig von der Rechnung auch aus dem nachfolgenden Satz.
ƒ
(4.52) Satz Jeder b-adische Bruch konvergiert gegen eine reelle Zahl.
Beweis:
Sei (an )n≥−r die Folge der Stellen und (sn )n≥−r die Folge der Partialsummen der Reihe
P∞
n=−r
an b−n . Wir
zeigen, dass (sn )n≥−r eine Cauchyfolge ist; die Konvergenz gegen ein a ∈ R ergibt sich dann aus Satz (4.28) Ist
" ∈ R+ vorgegeben, dann bestimmen wir zunächst ein N ∈ N mit b−N < ". Seien nun n, m ∈ N mit m, n ≥ N
gegeben, wobei wir n ≥ m voraussetzen. Dann gilt
n
X
=
|sn − sm |
ak b−k
n
X
≤
k=m+1
≤
(b − 1)b−k
n−m−1
X
b−k
≤
k=0
(b − 1)b−m−1
k=0
1
1−
(b − 1)b−k−m−1
k=m+1
(b − 1)b−m−1
(b − 1)b−m−1
n−m−1
X
≤
≤
k=0
(b − 1)b−m−1
=
1
b
∞
X
( 1b )k
b
b−1
=
b−m
<
".
ƒ
(4.53) Satz Jedes a ∈ R lässt sich in der Form ±s darstellen, wobei s den Wert eines b-adischen
P∞
Bruchs n=−r an b−n bezeichnet.
Beweis: Wir können uns auf den Fall beschränken, dass a ≥ 0 ist. Nach Satz (3.12) existiert ein r ∈ N mit b r+1 > a.
Wir beweisen nun durch vollständige Induktion über n ≥ −r, dass es jeweils Zahlen
a−r , a−r+1 ,
gibt, so dass für sn =
Pn
k=−r
...,
∈
an−1 , an
{0, ..., b − 1}
ak b−k jeweils die Abschätzungen
sn
≤
a
<
sn + b−n
erfüllt sind.
Nach Voraussetzung ist 0 ≤ a < b r+1 . Um zunächst eine geeignete Zahl a−r zu bestimmen, betrachten wir die
Unterteilung
0 < b r < 2b r < ... < (b − 1)b r < b · b r = b r+1
”
”
des Intervalls 0, b r+1 . Da a in diesem Intervall enthalten ist, gibt es ein eindeutig bestimmtes a−r ∈ {0, ..., b − 1}
mit a−r b r ≤ a < (a−r + 1)b r . Für s−r = a−r b r ist die Bedingung s−r ≤ a < s−r + b r dann offenbar erfüllt. Gehen
—–
105
—–
wir nun davon aus, dass a−r , ..., an bereits konstruiert sind. Nach Induktionsvoraussetzung gilt sn ≤ a < sn + b−n für
Pn
sn = k=−r ak b−k . Wir betrachten nun die Unterteilung
<
sn
sn + 1 · b−(n+1)
<
sn + (b − 1)b−(n+1)
<
...
sn + b−n
<
des Intervalls sn , sn + b−n . Wieder finden wir ein eindeutig bestimmtes an+1 mit
sn + an+1 b−(n+1)
≤
sn + (an+1 + 1)b−(n+1) .
<
a
Für sn+1 = sn + an+1 b−(n+1) gilt dann sn+1 ≤ a < sn+1 + b−(n+1) . Damit ist der Induktionsbeweis abgeschlossen.
Für die konstruierte Folge (sn )n≥−r gilt nun limn sn = a. Wählen wir nämlich für ein vorgegebenes " ∈ R+ ein N ∈ N
mit b−N < ", dann gilt für alle n ≥ N wegen sn ≤ a < sn + b−n die Abschätzung
=
|a − sn |
<
a − sn
(sn + b−n ) − sn
b−n
=
<
".
ƒ
(4.54) Lemma Sei (an )n∈N eine Folge mit an ∈ Z, an ≤ b − 1 für alle n ∈ N. Dann gilt im Falle
P∞
der Konvergenz die Abschätzung n=1 an b−n ≤ 1, und Gleichheit genau dann, wenn an = b − 1
für alle n ∈ N ist.
Beweis:
Durch Proposition (4.35) erhalten wir zunächst die Abschätzung
∞
X
an b−n
≤
n=1
∞
X
(b − 1)b−n
=
(b − 1)
n=1
∞
X
b−n
∞
b−1 X
=
b
n=1
b−1
1
b
1−
1
b
=
b−1
b
·
b
b−1
=
Die Rechnung zeigt, dass im Fall an = b − 1 für alle n ∈ N die Gleichung
b−n
=
n=0
1.
P∞
n=1
an b−n = 1 erfüllt ist. Setzen wir nun
umgekehrt die Gleichung voraus und nehmen an, dass an0 < b − 1 für ein n0 ∈ N gilt. Dann folgt
∞
X
an b−n
=
n=1
lim
n→∞
n
X

ak b−k
≤
k=1

lim 
n→∞
nX
0 −1
n
X
k=1
k=n0 +1
(b − 1)b−k + an0 b−n0 +


(b − 1)b−k 

=
=

n0 −1
n
X
X

lim 
(b − 1)b−k + (b − 1)b−n0 +
(b − 1)b−k + (an0 − b + 1)b−n0 
n→∞
lim
n→∞
k=n0 +1
k=1
n
X
(b − 1)b−k
!
+ (an0 − b + 1)b−n0
=
1 + (an0 − b + 1)b−n0
<
1
k=1
im Widerspruch zur angenommenen Gleichung.
ƒ
—–
106
—–
Der folgende Satz zeigt, inwieweit die Darstellung von reellen Zahlen als b-adische Brüche eindeutig ist.
(4.55) Satz
Seien c, d ∈ R, c, d ≥ 0 und c =
P∞
n=−r cn b
−n
,d =
P∞
n=−r
dn b−n Darstellungen
dieser Zahlen als b-adische Brüche. Genau dann gilt c = d, wenn einer der folgenden drei
Bedingungen für die b-adischen Brüche zutrifft:
(i) Es gilt cn = dn für alle n ∈ Z, n ≥ −r
(ii) Es gibt ein N ∈ Z, N ≥ −r, so dass cn = dn für alle n < N , dN = cN + 1 und cn = b − 1,
dn = 0 für alle n > N .
(iii) Es gibt ein N ∈ Z, N ≥ −r, so dass cn = dn für alle n < N , cN = dN + 1 und cn = 0,
dn = b − 1 für alle n > N .
Beweis:
„⇐“
Im Fall (i) ist die Identität c = d klar, denn gleiche Reihen konvergieren gegen denselben Wert. Im
zweiten Fall erhalten wir die Identität durch die Rechnung
=
d−c
∞
X
(dn − cn )b−n
=
b
+b
−(N +1)
(1 − b)
(1 − b)b−n
=
n=N +1
n=N
−N
∞
X
b−N +
∞
X
b−n
=
b−N +
n=0
1− b
b N +1
·
b
=
b−1
b−N − b−N = 0.
Die Rechnung im Fall (iii) läuft vollkommen analog.
„⇒“
Sei c = d vorausgesetzt. Angenommen, die b-adischen Brüche
P∞
n=−r cn b
−n
und
P∞
n=−r
dn b−n sind nicht
identisch, und N ∈ Z mit N ≥ −r ist minimal mit der Eigenschaft cN 6= dN . Betrachten wir zunächst den Fall, dass
cN < dN ist. Durch Umformungen erhalten wir
c=d≡
∞
X
(dn − cn )b−n = 0 ≡ (dN − cN )b−N +
∞
X
(dn − cn )b−n = 0
n=N +1
n=−r
≡
∞
X
(cN +n − dN +n )b−n = dN − cN
n=1
Wegen 0 ≤ cN +n , dN +n < b gilt für die Differenzen cN +n − dN +n ≤ b − 1. Nach Lemma (4.54) folgt dN − cN ≤ 1, also
dN − cN = 1 auf Grund der Annahme cN < dN . Nochmalige Anwendung von Lemma (4.54) liefert cN +n = b − 1 und
dN +n = 0 für alle n ∈ N, d.h. die Bedingung (ii) ist erfüllt. Genauso führt die Annahme cN > dN auf Bedingung (iii).
ƒ
—–
107
—–
Für jede Basis b findet man Zahlen x ∈ R mit zwei verschiedenen Darstellungen als b-adische Brüche. Andererseits
gibt es immer auch Zahlen mit nur einer b-adischen Darstellung. Ist zum Beispiel b = 10, dann sind durch
1, 5
zwei Darstellungen von x =
3
2
=
1, 50
und
1, 49
als 10-adischer Bruch gegeben. gegeben. Dagegen ist die Darstellung von x =
2
3
zur
Basis 10 eindeutig bestimmt, nämlich gleich 0, 6.
Für b = 2 erhalten wir durch 1, 0 und 0, 1 zwei verschiedene Darstellungen von x = 1. Die Darstellung von x =
1
5
gegeben durch 0, 0011 ist wiederum eindeutig bestimmt. Man kann sich mit Hilfe von Satz (4.55) leicht überlegen,
dass das Problem der Mehrdeutigkeit grundsätzlich nur bei rationalen Zahlen auftreten kann: Eine reelle Zahl mit
einer abbrechenden Dezimalbruchentwicklung, für die also ein N ∈≥ −r mit cn = 0 für alle n ≥ N existiert, ist stets
eine rationale Zahl.
—–
108
—–
§ 5.
Stetigkeit
Inhaltsübersicht
Nachdem wir uns im letzten Kapitel ausführlich mit Grenzwerten von Folgen beschäftigt haben, wird dieses Konzept
nun hier verwendet, um Grenzwerte von Funktionen zu definieren. Intuitiv bedeutet die Gleichung lim x→a f (x) = c für
eine Funktion f , dass sich f (x) dem Wert c nähert, wenn x dem Wert a angenähert wird. Präzise definiert man dies
mit Hilfe der Folgenkonvergenz. Die Funktion f wird stetig im Punkt a genannt, wenn a zum Definitionsbereich von f
gehört und die Gleichung lim x→a f (x) = f (a) erfüllt ist. In der Schulmathematik wird dies meist durch die Formulierung
umschrieben, dass die Funktion f an der Stelle a nicht „springt“.
Zunächst betrachten wir eine Reihe von Beispielen für Grenzwerte und Stetigkeit und beschäftigen wir uns mit der Frage,
wie Grenzwerte von Funktionen berechnet bzw. wie sich die Stetigkeit einer Funktion nachweisen lässt. Anschließend
leiten wir mit zwei zentrale Sätze über stetige Funktionen her: den Zwischenwertsatz und das Maximumsprinzip. Zum
Abschluss werden diese Sätze für die Definition der Exponential- und Logarithmusfunktionen verwendet.
Sei D ⊆ R. Wir erinnern daran, dass eine (reellwertige) Funktion auf D nichts weiter als eine Abbildung f : D → R
ist. Dabei bezeichnet man D als den Definitionsbereich von f . Folgende Beispiele für Funktionen werden wir im
Laufe der Vorlesung immer wieder aufgreifen.
(i) Sei c ∈ R. Dann ist die Abbildung f : R → R, x 7→ c die konstante Funktion mit dem Wert c.
3
2
1
x
−3
−2
−1
1
2
3
(ii) Die identische Abbildung id : R → R, x 7→ x ist eine Funktion.
3
2
1
x
−3
−2
−1
1
−1
−2
−3
—–
109
—–
2
3
(iii) Die Betragsfunktion abs : R → R ist gegeben durch x 7→ |x|.
3
2
1
x
−3
−2
−1
1
2
3
(iv) Für jedes x ∈ R definieren wir die untere Gaußklammer durch
bxc
=
max {r ∈ Z | r ≤ x}.
Dann ist durch die Zuordnung x 7→ bxc ebenfalls eine Funktion auf ganz R definiert.
3
2
1
x
−3
−2
−1
1
2
3
−1
−2
−3
−4
(v) Die Zuordnungen R → R gegeben durch
x 7→ 2x 2 + 1
und
x 7→ x 3 − 3x 2 + 5x + 1
sind reellwertige Funktionen. Allgemeiner bezeichnet man eine Abbildung der Form
x 7→
m
X
ak x k
mit
m ∈ N0 ,
a0 , ..., am ∈ R
k=0
als (reellwertige) Polynomfunktion.
(vi) Seien f , g : R → R Polynomfunktionen und D = {x ∈ R | g(x) 6= 0}. Eine Abbildung der Form
h : D −→ R ,
x 7→
f (x)
g(x)
wird (reelle) rationale Funktion genannt. Konkrete Beispiele für rationale Funktionen sind
R −→ R,
x 7→
1
und
x2 + 1
—–
110
R \ {−1, 1} −→ R,
—–
x 7→
3x + 5
x2 − 1
.
Sei D ⊆ R eine beliebige Teilmenge. Eine Folge (x n )n∈N reeller Zahlen bezeichnen wir als Folge in D, wenn x n ∈ D
für alle n ∈ N gilt.
(5.1) Definition Sei D ⊆ R und a ∈ R̄. Man nennt a einen Häufungspunkt von D, wenn eine
Folge in D \ {a} existiert, die (eventuell uneigentlich) gegen a konvergiert. Einen Punkt a ∈ D,
der kein Häufungspunkt von D ist, nennt man einen isolierten Punkt von D.
Ist beispielsweise D = ]0, 1]∪{2, 3}, dann ist [0, 1] die Menge der Häufungspunkte von D, während 2 und 3 isolierte
Punkte sind. Das Beispiel zeigt, dass die Häufungspunkte einer Menge D nicht unbedingt in D enthalten sein müssen.
Ein Häufungspunkt a von D mit a ∈
/ D wird auch Berührpunkt der Menge D genannt.
(5.2) Proposition Sei D ⊆ R, a ∈ R̄ und Da = D \ {a}.
(i) Im Fall a ∈ R ist a genau dann ein Häufungspunkt von D, wenn für jedes " ∈ R+ ein
x ∈ Da mit |x − a| < " existiert.
(ii) Der Punkt a = +∞ ist genau dann Berührpunkt von D, wenn für jedes κ ∈ R+ ein x ∈ D
mit x > κ existiert.
(iii) Der Punkt a = −∞ ist genau dann Berührpunkt von D, wenn für jedes κ ∈ R+ ein x ∈ D
mit x < −κ existiert.
Beweis:
zu (i)
Ist a ein Häufungspunkt von D, so gibt es eine Folge (x n )n∈N in Da mit limn x n = a. Für
„⇒“
+
vorgegebenes " ∈ R existiert insbesondere ein n ∈ N mit |x n − a| < ", und x n liegt in Da . „⇐“ Erfüllt der Punkt
a die angegebene Voraussetzung, so gibt es insbesondere für jedes n ∈ N ein x n ∈ Da mit |x n − a| < 1n . Somit ist
(x n )n∈N eine Folge in Da . Wir zeigen, dass limn x n = a gilt. Ist " ∈ R+ vorgegeben, dann gibt es ein N ∈ N mit
Es folgt |x n − a| <
1
n
≤
1
N
1
N
< ".
< " für alle n ≥ N und damit die Behauptung.
zu (ii) „⇒“ Ist +∞ ein Berührpunkt von D, dann gibt es eine Folge (x n )n∈N in D mit der Eigenschaft limn x n = +∞.
Ist κ ∈ R+ vorgegeben, dann gibt es insbesondere ein n ∈ N mit x n > κ, und x n liegt in D.
„⇐“
Erfüllt D die
angegebene Voraussetzung, so exstiert insbesondere für jedes n ∈ N ein x n ∈ D mit x n > n. Durch (x n )n∈N ist dann
also eine Folge in D gegegeben. Ist κ ∈ R+ , dann gibt es ein N ∈ N mit N > κ, und es folgt x n > n ≥ N > κ für alle
n ≥ N . Damit ist limn x n = +∞ bewiesen. Der Beweis von (iii) verläuft weitgehend analog.
(5.3) Definition Seien D ⊆ R, f : D → R eine Funktion und a, c ∈ R̄. Ist a ein Berührpunkt
von D, und gilt für jede Folge (x n )n∈N in D die Implikation
lim x n = a
⇒
lim f (x n ) = c
so bezeichnet man c als Grenzwert von f im Punkt a.
—–
111
—–
,
ƒ
Falls a oder c in {−∞, +∞} liegen, spricht man genauer von einem uneigentlichen, sonst von einem eigentlichen
Grenzwert der Funktion f . Grundsätzlich kann f : D → R nur einen (eigentlichen oder uneigentlichen) Grenzwert
im Punkt a besitzen. Sind nämlich c, d ∈ R̄ beides Grenzwerte von f im Punkt a, und ist (x n )n eine Folge in D mit
lim x n = a, so muss
=
c
lim f (x n )
n→∞
=
gelten.
d
Deshalb ist es gerechtfertigt, im Fall der Existenz für den Grenzwert von f im Punkt a die Bezeichnung
lim f (x)
x→a
einzuführen. Es ist aber durchaus möglich, dass f : D → R in einem Punkt a ∈ R̄ keinen eigentlichen oder uneigentlichen Grenzwert besitzt, selbst wenn es sich bei a um einen Berührpunkt von D handelt.
Als Beispiel betrachten wir die Signumsfunktion sgn : R → R gegeben durch
2
sgn(x)
=

−1



0



1
für x < 0
1
für x = 0
x
−3
für x > 0.
−2
−1
1
2
3
−1
−2
Sei f = sgn| D die Einschränkung von sgn auf die Menge D = R \ {0}. Nehmen wir an, dass c ∈ R̄ der Grenzwert von
f im Punkt a = 0 ist. Die beiden Folgen (x n )n und ( yn )n gegeben durch x n =
1
n
und yn = − 1n für alle n ∈ N liegen
beide in D und konvergieren gegen Null. Nach Definition des Grenzwerts müsste also sowohl
c
=
lim f (x n )
n→∞
=
lim f ( 1n )
n→∞
=
=
lim 1
n→∞
1
als auch
c
=
lim f ( yn )
n→∞
=
lim f (− 1n )
n→∞
=
lim (−1)
n→∞
=
−1
gelten. Der resultierende Widerspruch 1 = c = −1 lässt nur den Schluss zu, dass der Grenzwert lim f (x) nicht
x→0
existiert.
Wir studieren den Grenzwertbegriff für Funktionen anhand von einigen weiteren Beispielen.
Beispiel 1:
Sei die Funktion f : R+ → R gegeben durch x 7→ 1x . Dann gilt
3
2
lim f (x) = +∞
x→0
und
lim f (x) = 0.
x→+∞
1
x
1
—–
112
—–
2
3
Beweis:
Für den Nachweis der ersten Gleichung bemerken wir zunächst, dass 0 ein Berührpunkt von D = R+ ist.
Ist nämlich (an )n∈N gegeben durch an =
1
n
für alle n ∈ N, dann liegen alle Folgenglieder in D, und es gilt limn an = 0;
außerdem ist 0 ∈
/ D.
Sei nun (x n )n∈N eine beliebige Folge in D mit limn x n = 0. Zu zeigen ist limn f (x n ) = +∞. Sei dazu κ ∈ R+
vorgegeben. Wegen limn x n = 0 gibt es ein N ∈ N mit |x n | < κ−1 für alle n ≥ N . Weil die Folge (x n )n∈N in D liegt,
gilt x n > 0 und somit |x n | = x n für alle n ∈ N. Somit erhalten wir für alle n ≥ N die Abschätzung
f (x n )
=
x n−1
=
|x n |−1
>
(κ−1 )−1
=
κ.
Weil κ ∈ R+ beliebig vorgegeben war, ist damit limn f (x n ) = +∞ bewiesen.
Überprüfen wir nun den zweiten Grenzwert. Zunächst stellen wir fest, dass +∞ ein Berührpunkt von D ist, denn
die Folge (an )n∈N gegeben durch an = n für alle n ∈ N liegt in D und konvergiert gegen +∞. Sei nun (x n )n∈N
eine beliebige Folge in D mit limn x n = +∞. Zu zeigen ist limn f (x n ) = 0. Sei dazu " ∈ R+ vorgegeben. Wegen
limn x n = +∞ gibt es ein N ∈ N mit x n > " −1 für alle n ≥ N . Wegen x n > 0 gilt auch f (x n ) = x n−1 > 0 und somit
| f (x n )| = f (x n ) für alle n ∈ N. Insgesamt erhalten wir | f (x n )| = f (x n ) = x n−1 < " für alle n ≥ N .
Beispiel 2:
ƒ
Wir betrachten die Funktion f auf dem Definitionsbereich D = [0, 1[ ∪ ]1, 2[ ∪ {3} gegeben durch
5
4

f (x)
=
x +1



3− x



5
für
0≤ x <1
3
für
1< x <2
2
für
x = 3.
1
x
1
2
3
Dann gilt lim f (x) = 2, und der Grenzwert lim f (x) existiert nicht.
x→1
Beweis:
x→3
Für den ersten Grenzwert müssen wir zunächst überprüfen, dass 1 ein Berührpunkt von D ist. Sei (an )n∈N
durch an = 1 −
1
n
für alle n ∈ N gegeben. Dann gilt 0 ≤ an < 1 und somit an ∈ [0, 1[ ⊆ D für alle n ∈ N. Außerdem
gilt 1 ∈
/ D und limn an = 1.
Sei nun (x n )n∈N eine beliebige Folge in D mit limn x n = 1. Zu zeigen ist limn f (x n ) = 2. Sei dazu " ∈ R+ vorgegeben.
Wegen limn x n = 1 gibt es ein N ∈ N mit |x n − 1| < min{1, "} für alle n ≥ N . Sei nun n ∈ N mit n ≥ N vorgegeben.
Wegen |x n − 1| < 1 gilt 0 < x n < 2. Wir unterscheiden zwei Fälle. Ist x n > 1, dann gilt 1 < x n < 2 und somit
f (x n ) = 3 − x n . Daraus folgt
| f (x n ) − 2|
=
|(3 − x n ) − 2|
—–
=
| − (x n − 1)|
113
—–
=
|x n − 1|
<
".
Ist x n < 1, dann gilt 0 < x n < 1 und f (x n ) = x n + 1. Wir erhalten
| f (x n ) − 2|
=
|x n + 1 − 2|
=
<
|x n − 1|
".
Also ist | f (x n ) − 2| < " für alle n ≥ N erfüllt und damit limn f (x n ) = 2 bewiesen. Der Grenzwert lim f (x) existiert
x→3
nicht, weil 3 in D enthalten und damit kein Berührpunkt von D ist.
ƒ
Sei D ⊆ R und a ein Berührpunkt von D. Für jedes c ∈ R sei f c : D → R die konstante Funktion
Beispiel 3:
gegeben durch f c (x) = c für alle x ∈ D. Dann gilt
lim f c (x) = c
lim id D (x) = a.
und
x→a
x→a
Sei (x n )n∈N eine beliebige Folge in D mit limn x n = a. Dann gilt
Beweis:
lim f c (x n ) = lim c = c
n→∞
lim id D (x n ) = lim x n = a.
und
n→∞
n→∞
n→∞
ƒ
(5.4) Proposition Sei f eine Polynomfunktion gegeben durch
f : R −→ R ,
x 7→ x m + am−1 x m−1 + ... + a1 x + a0
mit m ∈ N0 und a0 , ..., am−1 ∈ R.
(i) Ist m gerade, dann gilt lim f (x) = lim f (x) = +∞.
x→−∞
x→+∞
(ii) Für ungerades m gilt lim f (x) = +∞ und lim f (x) = −∞.
x→−∞
x→+∞
Beweis:
Wir beschränken uns auf Teil (i) und die Bestimmung des ersten Grenzwertes. Zunächst schätzen wir
die Funktionswerte f (x) für x > 1 nach unten ab. Für solche x können wir die Funktion f in der Form f (x) =
x m (1 + g(x)) schreiben, mit
g(x)
am−1
=
x
+ ... +
a0
xm
=
m−1
X
ak
k=0
x m−k
.
Sei nun c = max{ 2m|ak | | 0 ≤ k < m}. Ist x ∈ R mit x > c und x > 1, so erhalten wir |x| > 2m|ak | für 0 ≤ k < m.
Für alle k mit ak 6= 0 gilt
|ak |
|x|
und offensichtlich ist
|g(x)|
=
|ak |
|x|
≤
1
2m
<
|ak |
2m|ak |
=
1
2m
,
auch im Fall ak = 0 erfüllt. Wir erhalten somit
m−1
X ak k=0 x m−k ≤
m−1
X
k=0
a k x m−k ≤
m−1
X
|ak |
k=0
|x|
≤
m−1
X
k=0
1
2m
=
m·
1
2m
insbesondere g(x) > − 21 . Dies wiederum bedeutet f (x) = x m (1 + g(x)) > x m (1 + (− 12 )) =
max{1, c}.
—–
114
—–
=
1 m
x
2
1
2
,
für alle x >
Für den Nachweis des Grenzwerts bemerken wir zunächst, dass +∞ ein Berührpunkt von D = R ist, denn (an )n∈N
gegeben durch an = n für alle n ∈ N ist eine Folge in D mit limn an = +∞. Sei nun (x n )n∈N eine beliebige Folge in
D, die gegen +∞ konvergiert. Zu zeigen ist limn f (x n ) = +∞. Sei dazu κ ∈ R+ vorgegeben. Dann gibt es ein N ∈ N
mit x n > max{1, c, 2κ} für alle n ≥ N . Auf Grund unserer Überlegungen aus dem ersten Teil des Beweises folgt
f (x n )
1 m
x
2 n
>
1
x
2 n
≥
≥
1
(2κ)
2
=
κ
für alle n ∈ N mit n ≥ N .
ƒ
(5.5) Definition Seien D ⊆ R und f , g : D → R Funktionen auf D. Dann bezeichnet man die
Funktionen f + g und f g auf D gegeben durch
( f + g)(x) = f (x) + g(x) und
( f g)(x) = f (x)g(x)
für x ∈ D
als Summe bzw. Produkt von f und g. Gilt zusätzlich g(x) 6= 0 für alle x ∈ D, dann definiert
man
f
g
Die Funktion
f
g
(x) =
f (x)
x ∈ D.
für alle
g(x)
wird der Quotient von f und g genannt.
(5.6) Proposition Seien D ⊆ R, f , g : D → R, und sei a ∈ R̄ ein Berührpunkt von D. Wenn die
Grenzwerte
lim f (x)
und
x→a
lim g(x)
x→a
beide existieren und in R liegen, also endlich sind, dann gilt
lim ( f + g)(x) = lim f (x) + lim g(x)
x→a
x→a
lim ( f g)(x) =
und
x→a
x→a
insbesondere existieren diese Grenzwerte. Ist der Quotient
0, so gilt auch
lim
x→a
Beweis:
f
g
(x)
f
g

‹
‹
lim f (x)
lim g(x) .
x→a
x→a
auf D definiert, und ist lim g(x) 6=
x→a
lim f (x)
x→a
=
lim g(x)
.
x→a
Alle Aussagen lassen sich aus den Grenzwertsätzen ableiten. Wir demonstrieren dies am Beispiel der
Funktion f + g. Sei (x n )n∈N eine Folge in D mit limn x n = a. Durch Anwendung von Satz (4.7) erhalten wir
lim ( f + g)(x n )
n→∞
=
lim f (x n ) + g(x n )
=
n→∞
lim f (x n ) + lim g(x n )
n→∞
n→∞
Damit ist die Gleichung lim ( f + g)(x) = lim f (x) + lim g(x) bewiesen.
x→a
x→a
x→a
—–
115
—–
=
lim f (x) + lim g(x).
x→a
x→a
ƒ
(5.7) Definition Seien D ⊆ R, f : D → R und a ∈ D. Man sagt, die Funktion f ist stetig im
Punkt a, wenn für jede Folge (x n )n in D die Implikation
lim x n = a
n→∞
⇒
lim f (x n ) = f (a)
gilt.
n→∞
Die Funktion f wird stetig genannt, wenn sie in jedem Punkt von D stetig ist.
(5.8) Proposition Seien D ⊆ R, a ∈ D, Da = D \ {a} und f˜ = f | Da . Dann sind die folgenden
beiden Aussagen äquivalent.
(i) Die Funktion f ist stetig in a.
(ii) Es gilt lim f˜(x) = f (a), oder a ist in D ein isolierter Punkt.
x→a
Beweis:
„(i) ⇒ (ii)“ Ist a ein isolierter Punkt von D, dann brauchen wir nichts zu zeigen. Nehmen wir nun an,
dass a ein Häufungspunkt von D ist. Dann ist a ein Berührpunkt der Menge Da . Sei (x n )n∈N eine Folge in Da mit
limn x n = a. Dann ist (x n )n∈N erst recht eine Folge in D, und nach Definition der Stetigkeit gilt
lim f˜(x n )
n→∞
=
lim f (x n )
=
n→∞
f (a).
Damit ist lim f˜(x) = f (a) bewiesen.
x→a
„(ii) ⇒ (i)“ Betrachten wir zunächst den Fall, dass a ein isolierter Punkt von D ist. Sei (x n )n∈N eine Folge in D mit
limn x n = a. Nach Proposition (5.2) gibt es ein " ∈ R+ , so dass |x − a| < " für kein x ∈ Da erfüllt ist. Sei nun N ∈ N
so gewählt, dass |x n − a| < " für alle n ≥ N gilt. Für jedes n ∈ N mit n ≥ N gilt dann x n ∈ D \ Da , also x n = a. Es
folgt f (x n ) = f (a) für alle n ≥ N und damit insbesondere limn f (x n ) = f (a).
Sei nun a ein Häufungspunkt von D und wiederum (x n )n∈N eine Folge in D mit limn x n = a. Auf Grund der
Häufungspunkt-Eigenschaft gibt es nach Proposition (5.2) für jedes n ∈ N ein yn ∈ Da mit | yn − a| <
definieren eine neue Folge
(x n0 )
1
.
n
Wir
in Da durch

x n0
=
xn
falls
x n ∈ Da

falls
xn = a
yn
und überprüfen, dass auch diese Folge gegen a konvergiert. Sei " ∈ R+ vorgegeben. Wegen limn x n = a gibt es ein
1
< " ist, und N
N2
0
|x n − a| = | yn − a|
N1 ∈ N mit |x n − a| < " für alle n ≥ N1 . Sei N2 ∈ N so gewählt, dass
mit n ≥ N , dann gilt
Damit ist
limn x n0
|x n0
− a| = |x n − a| < " im Fall x n ∈ Da und
= a bewiesen, und auf Grund der Voraussetzung gilt
lim f (x n0 )
n→∞
=
lim f˜(x n0 )
n→∞
=
= max{N1 , N2 }. Ist nun n ∈ N
<
1
n
≤
1
N2
< " im Fall x n = a.
f (a).
Nun zeigen wir, dass daraus limn f (x n ) = f (a) folgt. Sei " ∈ R+ vorgegeben. Wegen limn f (x n0 ) = f (a) gibt es ein
N ∈ N mit | f (x n0 ) − f (a)| < " für alle n ≥ N . Für jedes n ≥ N gilt entweder x n = x n0 oder x n = a. Im ersten Fall ist
| f (x n ) − f (a)| = | f (x n0 ) − f (a)| < "; im zweiten Fall ist diese Abschätzung wegen | f (x n ) − f (a)| = | f (a) − f (a)| = 0
ebenfalls erfüllt. Damit haben wir limn f (x n ) = f (a) nachgewiesen.
—–
116
—–
ƒ
Wir betrachten einige Beispiele für stetige Funktionen.
(i) Jede konstante Funktion auf einer beliebigen Teilmenge D ⊆ R ist stetig.
Beweis:
Sei a ∈ D beliebig vorgegeben und (x n )n∈N eine Folge in D mit limn x n = a. Dann folgt limn f (x n ) =
limn c = c = f (a). Weil die Folge beliebig vorgegeben war, folgt daraus die Stetigkeit von f im Punkt a.
ƒ
(ii) Für jede Teilmenge D ⊆ R ist die identische Abbildung id D stetig.
Beweis:
Sei a ∈ D und (x n )n∈N eine Folge in D mit limn x n = a. Dann gilt limn id D (x n ) = limn x n = a = id D (a). Also
ist id D im Punkt a stetig.
ƒ
(iii) Die Funktion abs : R → R, x 7→ |x| ist stetig.
Beweis:
Sei a ∈ R und (x n )n∈N eine Folge in R mit limn x n = a. In den Übungen haben wir gezeigt, dass für
beliebige x, y ∈ R jeweils ||x| − | y|| ≤ |x − y| gilt. Damit zeigen wir, dass limn abs(x n ) = abs(a) erfüllt ist. Sei " ∈ R+
vorgegeben. Wegen limn x n = a gibt es ein N ∈ N mit |x n − a| < " für alle n ≥ N . Es folgt
|abs(x n ) − abs(a)|
=
||x n | − |a||
≤
|x n − a|
<
"
für alle n ≥ N . Weil " ∈ R+ beliebig vorgegeben war, ist damit limn abs(x n ) = abs(a) bewiesen.
ƒ
(iv) Die Signumsfunktion sgn : R → R ist im Punkt 0 unstetig, in allen übrigen Punkten stetig.
Beweis:
xn =
1
n
Zunächst beweisen wir die Unstetigkeit im Punkt 0 und betrachten dazu die Folge (x n )n∈N gegeben durch
für alle n ∈ N. Es gilt limn x n = limn
lim sgn(x n )
n→∞
1
n
= 0. Wegen x n > 0 gilt sgn(x n ) = 1 für alle n ∈ N. Daraus folgt
=
lim 1
n→∞
=
1
6=
0
=
sgn(0).
Also ist die Stetigkeitsbedingung im Punkt 0 nicht erfüllt. Sei nun a ∈ R+ . Wir müssen zeigen, dass die Abbildung
sgn in a stetig ist und betrachten dazu eine beliebige reelle Folge (x n )n∈N mit limn x n = a. Für " = a ∈ R+ existiert
auf Grund der Konvergenz ein N ∈ N mit |x n − a| < " für alle n ≥ N . Insbesondere gilt x n > a − " = a − a = 0 für
alle n ≥ N . Aus x n > 0 folgt sgn(x n ) = 1 für alle n ≥ N1 und somit limn sgn(x n ) = 1 = sgn(a).
Sei nun a ∈ R negativ und (x n )n∈N eine reelle Folge, die gegen a konvergiert. Für " = −a ∈ R+ gibt es ein N ∈ N
mit |x n − a| < " für alle n ≥ N . Dies bedeutet x n < a + " = a + (−a) = 0 und somit sgn(x n ) = −1 für alle n ≥ N . Es
folgt limn sgn(x n ) = −1 = sgn(a).
ƒ
—–
117
—–
Ist D ⊆ R und a ∈ D ein isolierter Punkt, so ist jede Funktion f : D → R in a stetig. Denn in diesem Fall gibt es keine
Folge (x n )n∈N in Da , die gegen a konvergiert. Die Implikation limn x n = a ⇒ limn f (x n ) = f (a) ist damit für jede
Folge in D erfüllt.
(5.9) Proposition Seien D ⊆ R, f , g : D → R, und sei a ∈ D. Wenn die Funktionen f und g
im Punkt a stetig sind, dann gilt dasselbe für f + g und f g. Ist der Quotient
so ist auch
f
g
f
g
auf D definiert,
in a stetig.
Wir beschränken uns auf den Nachweis für die Funktion f + g. Ist a ∈ D ein isolierter Punkt von D, dann
ist f + g in a auf jeden Fall stetig. Andernfalls ist a ein Berührpunkt der Menge Da = D \ {a}. Setzen wir f˜ = f | Da
Beweis:
und g̃ = g| Da , dann folgt aus Proposition (5.8) und der Stetigkeit von f und g im Punkt a, dass
lim f˜(x)
=
x→a
f (a)
und
lim g̃(x)
x→a
=
g(a)
gilt. Durch Anwendung von Proposition (5.6) erhalten wir
lim ( f˜ + g̃)(x)
x→a
=
lim f˜(x) + lim g̃(x)
x→a
x→a
=
f (a) + g(a)
=
( f + g)(a).
Wiederum auf Grund von Proposition (5.8) bedeutet dies, dass f + g im Punkt a stetig ist.
ƒ
(5.10) Folgerung Alle Polynomfunktionen und rationalen Funktionen sind jeweils auf ihrem
gesamten Definitionsbereich stetig.
Beweis:
Dies folgt aus Proposition (5.9) und der Tatsache, dass alle rationalen Funktionen sich durch Addition,
Multiplikation und Division aus der Identität id und den konstanten Funktionen zusammensetzen lassen.
ƒ
Reellwertige Funktionen lassen sich auch durch Komposition gegebener Funktionen definieren (siehe Abschnitt §3).
Sind D, E ⊆ R und f : D → R, g : E → R Funktionen mit f (D) ⊆ E, dann ist auch g ◦ f eine reellwertige Funktion
auf D. Ist zum Beispiel f = abs und g : R → R gegeben durch g(x) = x 3 + 3x + 5 für alle x ∈ R, dann sind die
Kompositionen g ◦ abs und abs ◦ g gegeben durch
(g ◦ abs)(x) = g(|x|) = |x|3 + 3|x| + 5
(abs ◦ g)(x) = |g(x)| = |x 3 + 3x + 5|
und
für alle x ∈ R.
(5.11) Proposition Seien f : D → R und g : E → R stetige Funktionen mit f (D) ⊆ E. Dann
ist auch die Funktion (g ◦ f ) : D → R stetig.
Beweis:
Sei a ∈ D und (x n )n∈N eine Folge in D mit lim x n = a. Wegen der Stetigkeit von f gilt dann lim f (x n ) =
n→∞
n→∞
f (a). Nun ist durch yn = f (x n ) eine Folge in E mit lim yn = f (a) gegeben. Die Stetigkeit von g im Punkt f (a)
n→∞
liefert dann
lim (g ◦ f )(x n )
n→∞
=
lim g( yn )
n→∞
=
g( f (a))
=
(g ◦ f )(a).
Also sind x 7→ |x|3 + 3|x| + 5 und x 7→ |x 3 + 3x + 5| beides stetige Funktionen.
—–
118
—–
ƒ
Häufig verwendet man auch das folgende äquivalente Kriterium, um die Stetigkeit einer Funktion zu untersuchen.
(5.12) Satz
("-δ-Kriterium)
Sei f : D → R eine Funktion und a ∈ D. Genau dann ist f stetig in a, wenn für jedes " ∈ R+ ein
δ ∈ R+ existiert, so dass die Implikation
|x − a| < δ
Beweis:
„⇐“
⇒
| f (x) − f (a)| < "
für alle
x∈D
erfüllt ist.
Nehmen wir an, dass "-δ-Kriterium ist erfüllt. Sei (x n )n∈N eine Folge in D mit lim x n = a. Wir
n→∞
müssen zeigen, dass lim f (x n ) = f (a) erfüllt ist. Sei dazu " > 0 vorgegeben. Dann gibt es auf Grund unseres
n→∞
Kriteriums ein δ > 0, so dass aus |x − a| < δ stets | f (x) − f (a)| < " folgt, für alle x ∈ D. Wegen lim x n = a gibt es
n→∞
ein N ∈ N, so dass |x n − a| < δ für alle n ≥ N erfüllt ist. Dann gilt aber auch | f (x n ) − f (a)| < " für alle n ∈ N mit
n ≥ N . Damit haben wir lim f (x n ) = f (a) bewiesen.
n→∞
„⇒“
Angenommen, die Funktion f ist in a stetig, aber das "-δ-Kriterium ist nicht erfüllt. Dann gibt es ein " > 0
mit der Eigenschaft, dass für jedes δ > 0 ein x ∈ D mit |x − a| < δ und | f (x) − f (a)| ≥ " existiert. Speziell finden
wir für jedes n ∈ N ein x n ∈ D mit
|x n − a| <
1
n
und
| f (x n ) − f (a)| ≥ ".
Für die Folge (x n )n∈N gilt dann offenbar lim x n = a, wegen | f (x n ) − f (a)| ≥ " für alle n ∈ N konvergiert die Folge
n→∞
f (x n ) aber nicht gegen f (a). Dies widerspricht unserer Annahme, dass f im Punkt a stetig ist.
ƒ
Ein ähnliches Kriterium lässt sich auch für Funktionsgrenzwerte formulieren.
(5.13) Satz Seien D ⊆ R, f : D → R eine Funktion und a, c ∈ R̄, wobei a ein Berührpunkt von
D sei. Unter diesen Voraussetzungen gilt lim f (x) = c genau dann, wenn für jede Umgebung V
x→a
von c eine Umgebung U von a mit f (U) ⊆ V existiert.
Beweis:
„⇐“
Sei (x n )n∈N eine Folge in D mit limn x n = a und V eine Umgebung von c. Wir müssen zeigen,
dass ein N ∈ N mit f (x n ) ∈ V für alle n ≥ N existiert, denn dann ist limn f (x n ) = c erfüllt. Nun gibt es nach
Voraussetzung eine Umgebung U von a mit f (U) ⊆ V . Wegen limn x n = a existiert ein N ∈ N mit x n ∈ U für alle
n ≥ N . Daraus folgt f (x n ) ∈ f (U) ⊆ V für alle n ≥ N .
„⇒“
Nehmen wir an, das lim x→a f (x) = c erfüllt ist, aber andererseits eine Umgebung V von c existiert mit der
Eigenschaft, dass f (U) 6⊆ V für alle Umgebungen U von a gilt. Im Fall a ∈ R gibt es dann für jedes n ∈ N ein x n in der
—
”
Umgebung Un = a − 1n , a + 1n von a mit f (x n ) ∈
/ V . Ist a = +∞, dann existiert für jedes n ∈ N ein x n ∈ ]n, +∞[
—–
119
—–
mit f (x n ) ∈
/ V . Im Fall a = −∞ finden für jedes n ∈ N ein x n ∈ ]−∞, −n[ mit f (x n ) ∈
/ V . In jedem der drei Fälle gilt
dann limn x n = a, aber es existiert kein N ∈ N mit f (x n ) ∈ V für alle n ≥ N . Folglich konvergiert ( f (x n ))n∈N weder
eigentlich noch uneigentlich gegen c. Dies steht zur Voraussetzung lim x→a f (x) = c im Widerspruch.
ƒ
Im zweiten Teil dieses Kapitels beweisen wir nun einige wichtge Sätze über stetige Funktionen.
(5.14) Satz
(Zwischenwertsatz)
Seien a, b ∈ R mit a < b und I = [a, b]. Weiter sei f : I → R eine stetige Funktion mit f (a) < 0
und f (b) > 0. Dann existiert ein c ∈ I mit f (c) = 0. Dasselbe gilt, wenn f (a) > 0 und f (b) < 0
ist.
Beweis:
Wir beschränken und auf den Fall f (a) < 0, f (b) > 0, da sich der Beweis im anderen Fall analog führen
lässt. Um die Existenz einer Nullstelle c zu beweisen, konstruieren wir rekursiv eine Folge von Paaren (an , bn ), so
dass folgende drei Bedingungen für alle n ∈ N erfüllt sind:
(i) Es gilt [an+1 , bn+1 ] ⊆ [an , bn ].
(ii) Für die Länge des Intervalls [an , bn ] gilt jeweils bn − an = 2−n (b − a).
(iii) Es gilt jeweils f (an ) ≤ 0 und f (bn ) ≥ 0.
Für n = 1 setzen wir a1 = a und b1 = b. Nehmen wir nun an, das Paar (an , bn ) ist bereits konstruiert, und m =
1
(an
2
+ bn ) ist der Mittelpunkt des Intervalls [an , bn ]. Ist f (m) ≥ 0, dann setzen wir an+1 = an und bn+1 = m. Gilt
dagegen f (m) < 0, dann sei an+1 = m und bn+1 = bn . Man rechnet unmittelbar nach, dass das Paar (an+1 , bn+1 ) in
beiden Fällen wieder die Bedingungen (i) bis (iii) erfüllt.
Die Folge (an )n∈N ist nach Konstruktion monoton wachsend und nach oben beschränkt (mit b als oberer Schranke),
also nach Satz (4.19) konvergent. Die Folge (bn )n∈N ist monoton fallend und nach unten beschränkt, deshalb existiert
—–
120
—–
auch hier ein Grenzwert. Wegen
lim bn − lim an
n→∞
n→∞
=
lim (bn − an )
n→∞
lim 2−n (b − a)
=
n→∞
=
0
stimmen die beiden Grenzwerte überein, wir können also c = lim an = lim bn setzen. Da f stetig ist und f (an ) ≤ 0
n→∞
n→∞
für alle n ∈ N gilt, erhalten wir die Abschätzung
f (c)
=
lim f (an )
n→∞
≤
0
nach Satz (4.11). Entsprechend liefert die Stetigkeit von f und die Ungleichung f (bn ) ≥ 0 für alle n ∈ N die
Abschätzung f (c) ≥ 0. Insgesamt erhalten wir so f (c) = 0, wir haben also eine Nullstelle c im Intervall I gefunden.
ƒ
(5.15) Folgerung Sei I wie oben und f : I → R stetig und d ∈ R mit f (a) < d < f (b). Dann
gibt es ein c ∈ I mit f (c) = d. Dasselbe gilt auch im Fall f (a) > d > f (b).
Beweis:
Wir wenden den Zwischenwertsatz auf die Funktion g : I → R mit g(x) = f (x) − d an und erhalten ein
c ∈ I mit g(c) = 0. Dieses c erfüllt dann die Gleichung f (c) = d.
(5.16) Folgerung
ƒ
Ist I ⊆ R ein beliebiges Intervall, und ist f : I → R eine stetige Funktion,
dann ist auch f (I) ein Intervall in R.
Beweis:
Seien c, d ∈ f (I) mit c < d und q ∈ R mit c < q < d vorgegeben. Zu zeigen ist, dass q in f (I) liegt; dies
ist gleichbedeutend damit, dass ein p ∈ I mit f (p) = q existiert. Wegen c, d ∈ f (I) gibt es a, b ∈ I mit f (a) = c und
f (b) = d. Nach eventueller Vertauschung von a und b können wir davon ausgehen, dass a < b gilt. Nach Folgerung
(5.15) finden wir ein p ∈ [a, b] mit f (p) = q. Weil es sich bei I um ein Intervall handelt, ist p in I enthalten.
(5.17) Satz
(Maximumsprinzip)
Seien a, b ∈ R mit a < b und I = [a, b]. Sei f : I → R stetig. Dann ist die Funktion f auf I
beschränkt, was bedeutet, dass die Wertemenge
M
=
{ f (x) | x ∈ I}
⊆
R
von f beschränkt ist. Außerdem nimmt die Funktion auf I ihr Maximum und ihr Minimum an,
d.h. es gibt p, q ∈ I mit f (p) = max M und f (q) = min M .
—–
121
—–
ƒ
Maximumsprinzip: Der Wertebereich von f ist beschränkt.
Das Maximum wird im Punkt p, das Minimum in q angenommen.
Beweis:
Wir beweisen nur, dass M nach oben beschränkt ist und das Maximum von f angenommen wird. Die
entsprechenden Aussagen über das Minimum folgen dann durch Anwendung der bereits bewiesenen Aussagen auf
die Funktion g(x) = − f (x). Wir unterscheiden zwei Fälle.
1. Fall: Die Menge M ist nach oben beschränkt.
Dann existiert das Supremum s = sup M , und es gibt eine Folge (x n )n∈N mit limn f (x n ) = s. Um dies zu zeigen,
wählen wir für jedes n ∈ N ein x n ∈ I mit s −
1
n
< f (x n ) ≤ s; gäbe es ein solches x n nicht, dann wäre bereits s −
1
n
obere Schranke von M , im Widerspruch zur Definition des Supremums als kleinste obere Schranke. Es folgt dann
| f (x n ) − s| <
1
n
für alle n ∈ N und somit limn f (x n ) = s.
2. Fall: Die Menge M ist nach oben unbeschränkt.
Dann finden wir eine Folge (x n )n∈N in I mit limn f (x n ) = +∞. Anderseits gilt a ≤ x n ≤ b für alle n ∈ N, die Folge
(x n )n∈N ist also beschränkt. Nach dem Satz (4.23) besitzt die Folge (x n )n∈N einen Häufungspunkt c ∈ R. Demnach
gibt es für jedes k ∈ N ein nk ≥ k mit |x nk − c| < 1k . Die Folge (x nk )k∈N konvergiert dann gegen den Punkt c; wegen
a ≤ x nk ≤ b für jedes k ∈ N ist auch c im Intervall I enthalten.
Die Stetigkeit von f im Punkt c liefert nun limk f (x nk ) = f (c), insbesondere ist die Folge bestehend aus den Werten
| f (x nk )| nach Satz (4.3) durch ein r ∈ R+ beschränkt. Aber dies steht im Widerspruch zu limn f (x n ) = +∞, denn auf
Grund dieser Voraussetzung müsste ein N ∈ N mit f (x n ) > r für alle n ≥ N existieren. Damit könnte | f (x nk )| ≤ r
auch nur für endlich viele k ∈ N gelten.
Dieser Widerspruch zeigt, dass der zweite Fall nicht auftreten kann. Also ist M in der Tat nach oben beschränkt. Wie
im zweiten Fall wählen wir einen Häufungspunkt p ∈ M und eine Folge (nk )k∈N natürlicher Zahlen mit lim x nk = p.
Wegen f (x n ) > s −
1
n
für alle n ∈ N gilt f (p) = limk→∞ f (x nk ) ≥ s − limn→∞
1
nk
= s, also wird der maximale Wert s
von f im Punkt p angenommen. Dies zeigt auch, dass s = sup M zugleich das Maximum von M ist.
—–
122
—–
ƒ
Für offene oder halboffene Intervalle ist die Aussage falsch, wie das Beispiel f : ]0, 2] → R, x 7→
1
x
zeigt. Offenbar ist
diese Funktion nach oben unbeschränkt.
2
1
x
1
2
(5.18) Definition Eine Funktion f : D → R wird monoton wachsend genannt, wenn aus a ≤ b
stets f (a) ≤ f (b) folgt. Von einer streng monoton wachsenden Funktion spricht man, wenn im
Fall a < b immer f (a) < f (b) erfüllt ist. Entsprechend sind die Begriffe monoton fallend bzw.
streng monoton fallend definiert.
Sei f : D → R eine Funktion mit der Eigenschaft, dass die Menge D bijektiv auf E = f (D) abgebildet wird. Dann
nennen wir die Umkehrabbildung g = f −1 : E → D auch die Umkehrfunktion von f . Beispielsweise ist für ungerades
p
k ∈ N die in Abschnitt §9 definierte k-te Wurzelfunktion rk : R → R, x 7→ k x die Umkehrfunktion von pk : R → R,
x 7→ x k . Dies überprüft man anhand der Gleichungen
p
p
p
k
(rk ◦ pk )(x) = rk (x k ) = x k = x und (pk ◦ rk )(x) = pk ( k x) = ( k x)k = x
für alle
x ∈ R.
Eine entsprechende Aussage gilt auch für gerades k ∈ N, nur dass hier die Definitionsbereiche D = E = R+ gewählt
werden müssen. (Man beachte dazu die Voraussetzungen in Lemma (3.35).)
(5.19) Satz
(Stetigkeit der Umkehrfunktion)
Sei I ⊆ R ein Intervall, und sei f : I → R stetig und streng monoton wachsend. Dann ist f
eine Bijektion auf ihr Bild f (I), und die Umkehrfunktion f −1 : f (I) → I ist ebenfalls stetig und
streng monoton wachsend.
Beweis:
Die Abbildung f ist injektiv, denn sind a, b ∈ I mit a 6= b, dann gilt f (a) < f (b) im Fall a < b und
f (a) > f (b) im Fall a > b, auf jeden Fall also f (a) 6= f (b). Als Abbildung I → f (I) ist f außerdem surjektiv,
insgesamt also eine Bijektion zwischen I und f (I). Sei f −1 : f (I) → I die Umkehrabbildung. Mit f ist auch f −1
streng monoton wachsend. Andernfalls gäbe es c, d ∈ f (I) mit c < d und f −1 (c) ≥ f −1 (d). Im Fall f −1 (c) = f −1 (d)
würde c = f ( f −1 (c)) = f ( f −1 (d)) = c folgen, im Fall f −1 (c) > f −1 (d) würden wir c > d erhalten, in beiden Fällen
also also c ≥ d im Widerspruch zur vorherigen Feststellung. Nach Folgerung (5.16) ist mit I auch f (I) ein Intervall.
—–
123
—–
Beweisen wir nun die Stetigkeit von f −1 . Sei q ∈ J und ( yn )n∈N eine Folge in J mit limn yn = q. Weiter sei p = f −1 (q)
und x n = f −1 ( yn ) für jedes n ∈ N. Wir müssen zeigen, dass limn x n = p gilt. Angenommen, dies ist nicht der Fall.
Dann gibt es ein " ∈ R+ , so dass |x n − p| ≥ " für unendlich viele n ∈ N gilt. Betrachten wir die Mengen
M+ = {n ∈ N | x n ≥ p + "}
M− = {n ∈ N | x n ≤ p − "}
und
,
dann ist M+ oder M− unendlich. Gehen wir davon aus, dass M+ unendlich ist; im anderen Fall läuft der Beweis
analog. Auf Grund der strengen Monotonie von f gilt für alle n ∈ M+ jeweils
yn
=
f (x n )
f (p + ")
≥
>
f (p)
=
q.
Setzen wir "1 = | f (p + ") − q|, dann gilt also | yn − q| > "1 für unendlich viele n ∈ N. Aber dies widerspricht der
Voraussetzung limn yn = q.
ƒ
Als Anwendung des soeben bewiesenen Satzes werden wir nun die aus der Schulmathematik bekannten Exponentialund Logarithmusfunktionen definieren. Zur Vorbereitung benötigen wir allerdings ein paar Hilfsaussagen.
(5.20) Lemma Für jedes a ∈ R gibt es eine Folge (an )n∈N in Q mit limn an = a.
Beweis:
Sei a ∈ R. Weil die rationalen Zahlen in R dicht liegen (Satz (3.33)), gibt es für jedes n ∈ N eine Zahl
an ∈ Q mit |an − a| < 1n . Wir zeigen, dass limn an = a gilt. Sei dazu " ∈ R+ vorgegeben. Dann gibt es ein N ∈ N mit
1
N
1
n
< ". Für alle n ≥ N folgt damit |an − a| <
≤
1
N
< ".
ƒ
(5.21) Lemma Sei b ∈ R mit b > 1.
(i) Die Funktion Q → R, x 7→ b x ist streng monoton wachsend.
p
n
(ii) Es gilt limn b = 1.
(iii) Die Abbildung Q → R, x 7→ b x ist stetig.
Beweis:
zu (i) Seien x, y ∈ Q mit x < y vorgegeben. Indem wir x und y auf einen Nenner bringen, erhalten wir
ein n ∈ N und u, v ∈ Z mit x = un , y =
v
n
und u < v. Dann ist v − u positiv. Es folgt b v−u ≥ b > 1. Multiplikation mit
bu liefert bu < b v . Nach Lemma (3.35) gilt die Äquivalenz
bx < b y
⇔
u
v
bn < bn
⇔
u
v
(b n )n < (b n )n
⇔
bu < b v .
zu (ii) Sei " ∈ R+ vorgegeben und c = 1 + ". Wegen c > 1 gibt es nach Satz (3.12) (iii) ein N ∈ N mit c N > b, also
p
p
n
n
gilt ebenso c n ≥ c N > b für alle n ≥ N . Nun ist 1 < b < c jeweils äquivalent zu 1 < b < c n , also gilt 1 < b < c für
alle n ≥ N . Es folgt
p
n
b − 1
=
p
n
b−1
—–
<
c−1
124
—–
=
"
für
n ≥ N.
zu (iii) Zunächst beweisen wir die Stetigkeit im Punkt 0. Sei also (x n )n∈N eine Folge rationaler Zahlen, die gegen
p
k
Null konvergiert; zu zeigen ist dann limn b x n = 1 = b0 . Sei dazu " ∈ R+ vorgegeben. Nach (ii) gilt limk b2 = 1,
also finden wir ein k ∈ N mit
2
bk −1
=
Wegen limn x n = 0 gibt es ein N ∈ N mit |x n | ≤
Ungleichungen b
− 1k
<b
xn
1
k
1
k
1
(b2 ) k − 1
<
".
für alle n ≥ N . Aus − 1k < x n <
1
k
folgen nach Teil (i) die
< b und somit
|b x n − 1|
≤
1
1
b k − b− k
1
2
b− k (b k − 1)
=
2
≤
bk −1
<
"
für
n ≥ N.
Damit ist die Stetigkeit im Punkt 0 bewiesen. Sei nun x ∈ Q beliebig vorgegeben und (x n )n∈N eine Folge in Q mit
limn x n = x. Dann gilt limn (x n − x) = 0, und die Stetigkeit im Punkt 0 zeigt
‹

=
lim b x n = lim b x b x n −x = b x lim b x n −x
n→∞
n→∞
n→∞
b x b0
=
bx .
Also ist die Abbildung auch im Punkt x stetig.
ƒ
Zu jedem b ∈ R mit b > 1 gibt es eine eindeutig bestimmte, stetige Funktion
(5.22) Satz
exp b : R → R mit exp b (x) = b x für alle x ∈ Q. Diese ist streng monoton wachsend und erfüllt
die Gleichung
exp b (x + y)
=
exp b (x) exp b ( y)
für alle x, y ∈ R. Man bezeichnet sie als die Exponentialfunktion zur Basis b.
Beweis: Wir beginnen mit der Definition einer geeigneten Funktion. Nach Lemma (5.20) gibt es für jedes irrationale
x ∈ R eine Folge (an(x) )n∈N in Q, die gegen x konvergiert. Für x ∈ Q definieren wir (an(x) )n∈N durch an(x) = x für alle
n ∈ N. Es liegt nahe, die Funktion exp b an jeder Stelle x ∈ R durch
exp b (x)
=
(x)
lim b an
n→∞
zu definieren, allerdings müssen wir dafür nachweisen, dass der Grenzwert auf der rechten Seiten auch existiert.
(x)
Wir überprüfen, dass (b an )n∈N eine Cauchyfolge ist; weil jede Cauchyfolge konvergiert (Satz (4.28)), folgt daraus
die Existenz des Grenzwertes.
Seien also x ∈ R, " ∈ R+ vorgegeben und κ ∈ R+ eine obere Schranke der Menge {an(x) | n ∈ N}. Nach Lemma
(5.21) ist die Abbildung x 7→ b x auf ganz Q und insbesondere im Nullpunkt stetig. Nach dem "-δ-Kriterium (Satz
(5.12)) gibt es somit ein δ ∈ R+ mit der Eigenschaft, dass aus |a| < δ für jedes a ∈ Q jeweils |b a − 1| < b−κ " folgt.
(x)
Weil (an(x) )n∈N eine Cauchyfolge ist, gibt es ein N ∈ N, so dass |an(x) − am
| < δ für alle m, n ≥ N erfüllt ist. Wir
erhalten dann
(x) an(x)
b − b am =
(x) (x)
(x)
b am b an −am − 1
—–
125
—–
<
bκ b−κ "
=
"
(x)
womit die Cauchyfolgen-Eigenschaft von (b an )n∈N bewiesen ist. Nach Definition gilt darüber hinaus für alle x ∈ Q
(x)
jeweils exp b (x) = limn b an = limn b x = b x .
Im nächsten Schritt beweisen wir die Gleichung exp b (x + y) = exp b (x) exp b ( y) für alle x, y ∈ R. Nach Definition
gilt
exp b (x + y) exp b (x)−1 exp b ( y)−1
(x+ y)
lim b an
n→∞
=

(x+ y)
lim b an
b−an b−an
(x)
lim b an
‹−1 
( y)
lim b an
‹−1
n→∞
n→∞
n→∞
( y)
(x)
‹
=
(x+ y)
(x)
( y)
lim b(an −an −an )
=
n→∞
Wegen limn an(x+ y) = x + y, limn an(x) = x und limn an( y) = y gilt
€
Š
lim an(x+ y) − an(x) − an( y)
=
n→∞
(x + y) − x − y
=
0.
Auf Grund der Stetigkeit der Funktion x 7→ b x im Nullpunkt erhalten wir somit
exp b (x + y) exp b (x)−1 exp b ( y)−1
(x+ y)
(x)
( y)
lim b(an −an −an )
=
n→∞
=
b0
=
1.
Nun zeigen wir, dass die Funktion exp b auf ihrem gesamten Definitionsbereich stetig ist. Zunächst beweisen wir die
Stetigkeit im Nullpunkt. Sei " ∈ R+ vorgegeben. Weil b 7→ b x in 0 stetig ist, gibt es ein δ ∈ R+ mit der Eigenschaft,
dass aus |a| < δ jeweils |b a − 1| < 12 " folgt, für alle a ∈ Q. Sei nun x ∈ R mit |x| < 12 δ. Wegen limn an(x) = x und
(x)
(x)
limn b an = exp b (x) gibt es ein n ∈ N mit |an(x) | < δ und |b an − exp b (x)| < 21 ". Es folgt
| exp b (x) − 1|
≤
(x)
(x)
| exp b (x) − b an | + |b an − 1|
1
"
2
<
+ 12 "
=
"
,
womit die Stetigkeit im Nullpunkt bewiesen ist. Anschließend zeigen wir die Stetigkeit in einem beliebigen Punkt
x ∈ R. Sei (x n )n∈N eine Folge in R mit limn x n = x. Dann konvergiert x n − x gegen Null, und wir erhalten

‹
lim exp b (x n ) = lim exp b (x) exp b (x n − x) = exp b (x) lim exp b (x n − x)
n→∞
n→∞
=
n→∞
exp b (x) exp b (0)
=
exp b (x + 0)
=
exp b (x).
Um zu zeigen, dass exp b streng monoton wachsend ist, genügt es exp b (a) > 1 für alle a ∈ R+ nachzuweisen. Sind
dann nämlich x, y ∈ R mit x < y vorgegeben, dann ist y − x positiv, und es folgt exp b ( y) = exp b ( y − x) exp b (x) >
exp b (x). Sei also a ∈ R+ vorgegeben, und sei c ∈ Q eine Zahl mit 0 < c < a. Wegen limn an(a) = a gibt es ein N ∈ N
(a)
mit an(a) ≥ c für alle n ≥ N . Auf Grund der strengen Monotonie der Abbildung x 7→ b x folgt b an ≥ b c > b0 = 1 für
alle n ≥ N und damit auch
exp b (x)
=
(a)
lim b an
≥
n
bc
>
1.
Zum Beweis der Eindeutigkeit der Funktion exp b nehmen wir an, dass f : R → R eine weitere stetige Funktion mit
f (x) = b x für x ∈ Q ist. Dann gilt für beliebiges x ∈ R auf Grund der Stetigkeit von f jeweils
f (x)
=
lim f (an(x) )
n→∞
=
(x)
lim b an
n→∞
Die Funktionen f und exp b stimmen also auf ganz R überein.
—–
126
=
exp b (x).
ƒ
—–
Als Ergänzung zu Satz (5.22) bemerken wir
(5.23) Proposition Der Wertebereich von exp b ist gegeben durch exp b (R) = R+ .
Beweis:
Zunächst einmal bemerken wir, dass exp b nur positive Werte annimmt. Denn auf Grund der strengen
Monotonie von exp b gilt exp b (x) > exp b (0) = b0 = 1 > 0 für alle x ∈ R+ . Für dasselbe x gilt auch
exp b (−x) exp b (x)
=
exp b ((−x) + x)
=
exp b (0)
=
1
,
also exp b (−x) = exp b (x)−1 > 0. Dies zeigt, dass exp b auch im Bereich x < 0 nur positive Werte annimmt. Nun
zeigen wir, dass für jedes d > 1 ein x ∈ R+ mit exp b (x) = d existiert. Wegen b > 1 gibt es ein n ∈ N mit b n > d.
Wir betrachten nun die Funktion exp b auf dem abgeschlossenen Intervall I = [0, n]. Es ist exp b (0) = 1 < d und
exp b (n) = b n > d. Nach Folgerung (5.15) zum Zwischenwertsatz existiert somit ein x ∈ [0, n] mit exp b (x) = d. Ist
0 < d < 1, dann gilt d −1 > 1. Auf Grund des bereits Gezeigten gibt es ein x ∈ R mit exp b (x) = d −1 , und es folgt
exp b (−x) = exp b (x)−1 = (d −1 )−1 = d. Berücksichtigen wir noch exp b (0) = b0 = 1, so ist damit bewiesen, dass jeder
positive Wert von exp b tatsächlich angenommen wird.
(5.24) Satz
ƒ
Die Umkehrfunktion log b : R+ → R von exp b ist stetig und streng monoton
wachsend. Man nennt sie den Logarithmus zur Basis b. Für alle u, v ∈ R+ gilt
log b (uv)
Beweis:
=
log b (u) + log b (v).
Alle Aussagen mit Ausnahme der Gleichung folgen aus Satz (5.19). Zum Nachweis der Gleichung seien
u, v ∈ R+ vorgegeben, außerdem x = log b (u) und y = log b (v). Dann gilt u = exp b (log b (u)) = exp b (x) und ebenso
v = exp b ( y), darüber hinaus exp b (x + y) = exp b (x) exp b ( y). Weil die Abbildungen log b und exp b zueinander invers
sind, erhält man durch Anwendung von log b auf beide Seiten log b (uv) = log b (exp b (x) exp b ( y)) = log b (exp b (x +
y)) = x + y = log b (u) + log b (v).
ƒ
y
10
8
6
4
2
−4
−2
2
4
6
8
10
x
−2
−4
Verlauf der Exponentialfunktion (blau) und der
Logarithmusfunktion (orange), jeweils zur Basis 2
—–
127
—–
(5.25) Proposition
Die Funktionen exp b : R → R+ und log b : R+ → R besitzen das Grenz-
wertverhalten
lim exp b (x) = 0
,
lim log b (x) = −∞
,
x→−∞
x→0
Beweis:
lim exp b (x) = +∞
x→+∞
lim log b (x) = +∞
x→+∞
Sämtliche Aussagen ergeben sich aus der Monotonie der Funktionen und den Gleichungen exp b (R) = R+
und log b (R+ ) = R. Zum Nachweis von lim exp b (x) = 0 sei eine Folge (x n )n∈N mit limn x n = −∞ vorgegeben.
x→−∞
Zu zeigen ist limn exp b (x n ) = 0. Dazu geben wir uns ein " ∈ R+ vor. Wegen exp b (R) = R+ existiert ein a ∈ R mit
0 < exp b (a) ≤ ". Sei nun N ∈ N so gewählt, dass x n < a für alle n ≥ N erfüllt ist. Auf Grund der strengen Monotonie
von exp b folgt 0 < exp b (x n ) < exp b (a) für n ≥ N , insbesondere
| exp b (x n )|
=
exp b (x n )
<
exp b (a)
≤
"
für alle n ≥ N . Damit ist limn exp b (x n ) = 0 bewiesen. Für den Beweis von lim exp b (x) = +∞ sei (x n )n∈N eine
x→+∞
Folge mit limn x n = +∞. Wir müssen zeigen, dass limn exp b (x n ) = +∞ gilt. Sei dazu κ ∈ R+ vorgegeben. Wegen
exp b (R) = R+ gibt es ein a ∈ R mit exp b (a) ≥ κ. Wegen limn x n = +∞ gibt es ein N ∈ N mit x n > a für alle n ≥ N .
Wiederum auf Grund der strengen Monotonie erhalten wir
exp b (x n )
>
exp b (a)
≥
κ
für alle n ≥ N , womit limn exp b (x n ) = +∞ bewiesen ist. Der Beweis der beiden Grenzwerte von log b läuft völlig
analog, so dass wir ihn dem Leser als Übungsaufgabe überlassen können.
ƒ
In §12 haben wir die Eulersche Zahl e definiert. Wie wir noch sehen werden, fällt der Exponential- und der Logarithmusfunktion zur Basis e eine Sonderrolle zu. Den Logarithmus zu dieser Basis bezeichnet man auch als natürlichen
Logarithmus.
—–
128
—–
§ 6.
Differenzierbarkeit
Inhaltsübersicht
Aus der Schulmathematik ist bekannt, dass die Ableitung einer Funktion f in einem Punkt a die Steigung der Tangente
an den Funktionsgraphen von f durch den Punkt (a, f (a)) angibt. Dabei ist die Tangentensteigung nach Definition der
Grenzwert der Sekantensteigungen durch die Punkte (a, f (a)) und (x, f (x)), den man erhält, wenn man x gegen a laufen
lässt. Dieser geometrische Ansatz bildet die Grundlage für unsere Definition von f 0 (a) durch einen Funktionsgrenzwert.
Nachdem wir die Definition der Ableitung anhand einiger Beispiele diskutiert haben, beweisen wir zunächst die aus
der Schule bekannten Ableitungsregeln, im Einzelnen die Summen-, Produkt-, Quotienten-, Ketten- und Umkehrregel.
Anschließend leiten wir den Zusammenhang zwischen dem Vorzeichen der Ableitung und dem Monotonieverhalten der
Funktion her und zeigen, wie mit Hilfe von erster und zweiter Ableitung lokale Minima und Maxima bestimmt werden
können. Auch dies ist bereits aus dem Schulunterricht bekannt (Stichwort „Kurvendiskussion“). Im letzten Abschnitt sehen
wir uns an, inwiefern Funktionen durch höhere Ableitungen approximiert werden können und behandeln die für konkrete
Berechnungen wichtigen Taylorreihen.
(I) Der Differenzierbarkeitsbegriff
Sei D ⊆ R eine beliebige Teilmenge. Man nennt a ∈ D einen inneren Punkt von D, wenn ein " ∈ R+ existiert, so
dass ]a − ", a + "[ ⊆ D erfüllt ist. Offenbar ist ein innerer Punkt immer auch ein Häufungspunkt von D: Wählt man
nämlich N hinreichend groß, so dass
1
N
< " erfüllt ist, dann erhält man zum Beispiel durch (an )n≥N mit an = a +
1
n
eine Folge in D, die gegen a konvergiert.
(6.1) Definition
Sei D ⊆ R und a ∈ D ein innerer Punkt. Eine Funktion f : D → R wird
differenzierbar an der Stelle a genannt, wenn
f 0 (a)
=
lim
x→a
f (x) − f (a)
x −a
als eigentlicher Grenzwert existiert. Man nennt f 0 (a) in diesem Fall die Ableitung von f an der
Stelle a. Wir nennen die Funktion f differenzierbar, wenn sie an jeder Stelle ihres Definitionsbereichs differenzierbar ist.
Als innerer Punkt von D ist a zugleich ein Berührpunkt der Menge Da = D \ {a}. Die Funktion
g(x)
=
f (x) − f (a)
x −a
ist auf Da definiert, somit ist gewährleistet, dass der Grenzwert lim g(x) tatsächlich gebildet werden kann. Geomex→a
trisch lässt sich g(x) als Steigung der Sekante des Funktionsgraphen von f durch die Punkte (a, f (a)) und (x, f (x))
interpretieren. Durch den Grenzübergang x → a erhält man die Steigung der Tangente an den Funktionsgraphen
durch den Punkt (a, f (a)).
—–
129
—–
y
5
4
3
2
1
x
1
2
4
3
5
Veranschaulichung der Differenzierbarkeit:
Die Sekantensteigungen (orange) nähern sich für x → a der Tangentensteigung (rot) an.
(6.2) Proposition
Sei f : D → R eine Funktion und a ∈ D ein innerer Punkt. Dann sind
folgende Bedingungen äquivalent.
(i) Die Funktion f ist in a differenzierbar.
(ii) Es existiert der Grenzwert lim
f (a + h) − f (a)
h
h→0
.
(iii) Es gibt eine reelle Zahl c ∈ R und eine Funktion ψ : Da → R mit
f (a + h)
=
f (a) + ch + ψ(a + h)
und
lim
ψ(a + h)
h→0
h
=
0.
Sind diese äquivalenten Bedingungen erfüllt, dann stimmt der Grenzwert in (ii) und die reelle
Zahl c in (iii) mit dem Wert f 0 (a) der Ableitung überein.
Beweis:
„(i) ⇒ (ii)“
Die Funktion g(h) = 1h ( f (a + h) − f (a)) besitzt die Menge
D0
=
{h ∈ R | a + h ∈ D} \ {0}
als Definitionsbereich. Damit der Grenzwert definiert ist, müssen wir zeigen, dass 0 ein Berührpunkt von D0 ist. Nach
Voraussetzung gibt es eine Folge (x n )n∈N in Da mit limn x n = a. Setzen wir hn = x n − a für alle n ∈ N, so erhalten
wir wegen a + hn = x n ∈ Da eine Folge in D0 mit limn hn = 0. Also ist 0 tatsächlich ein Berührpunkt. Ist nun (hn )n∈N
eine beliebige Folge in D0 mit limn hn = 0, dann ist durch x n = a + hn eine Folge in Da mit Grenzwert a gegeben, und
aus der Differenzierbarkeit von f in a folgt
lim
n→∞
f (a + hn ) − f (a)
hn
=
lim
n→∞
f (x n ) − f (a)
xn − a
—–
130
=
—–
lim
x→a
f (x) − f (a)
x −a
=
f 0 (a).
Wir definieren auf der Menge D0 von oben die Funktion φ durch φ(h) = f (a + h) − f (a) − ch, wobei
„(ii) ⇒ (iii)“
c den Grenzwert unter (ii) bezeichnet, und setzen ψ(x) = φ(x − a) für alle x ∈ Da . Dann gilt offenbar
f (a + h)
=
f (a) + ch + φ(h)
=
für alle h ∈ D0
f (a) + ch + ψ(a + h)
und außerdem
lim
ψ(a + h)
=
h
h→0
lim
φ(h)
h→0
=
h
lim
f (a + h) − f (a)
h
h→0
− lim
h→0
ch
h
=
c−c
=
0.
„(iii) ⇒ (i)“ Sei c ∈ R und ψ : Da → R eine Funktion mit der angegebenen Eigenschaft. Weiter sei (x n )n∈N eine
Folge in Da mit limn x n = a. Dann konvergiert die Folge gegeben durch hn = x n − a gegen 0, und wir erhalten
lim
f (x n ) − f (a)
n→∞
xn − a
=
lim
f (x)− f (a)
x−a
x→a
gilt f (a) = c.
=
hn
n→∞
Dies zeigt, dass der Grenzwert lim
0
f (a + hn ) − f (a)
chn
lim
n→∞
hn
+ lim
ψ(a + hn )
=
hn
n→∞
c+0
=
c.
existiert und mit c übereinstimmt. Also ist f in a differenzierbar, und es
ƒ
Wir betrachten einige Beispiele für differenzierbare und nicht differenzierbare Funktionen.
(i) Sei c ∈ R und die Funktion f gegeben durch f : R → R, x 7→ c. Dann gilt f 0 (a) = 0 für alle a ∈ R, denn es
gilt jeweils
lim
f (a + h) − f (a)
h
h→0
=
lim
c−c
h→0
h
=
=
lim 0
h→0
0.
Die Ableitung von id : R → R ist gegeben durch id0 (x) = 1 für alle x ∈ R.
(ii) Die Funktion id : R → R, x 7→ x ist überall differenzierbar, mit Ableitung 1. Dies folgt für alle a ∈ R aus der
Rechung
lim
id(a + h) − id(a)
=
h
h→0
lim
(a + h) − a
=
h
h→0
lim
h→0
h
=
h
lim 1
h→0
=
1.
(iii) Die Funktion f : R → R, x 7→ x 2 ist überall differenzierbar mit der Ableitung f 0 (x) = 2x für alle x ∈ R. Denn
für jedes reelle a gilt
lim
f (a + h) − f (a)
=
h
h→0
lim
(a + h)2 − a2
h
h→0
=
(iv) Die Funktion f : D → R, x 7→
mit der Ableitung f (x) =
0
− x12
1
x
=
2a + 0
=
lim
h→0
2ah + h2
h
=
2a + lim h
h→0
2a.
ist auf ihrem gesamten Definitionsbereich D = R \ {0} differenzierbar,
für jedes x ∈ D. Zum Beweis bemerken wir zunächst, dass jedes a ∈ D
ein innerer Punkt des Definitionsbereichs ist. Setzen wir nämlich " = |a|, dann gilt " ∈ R+ . Ist a < 0 und
x ∈ ]a − ", a + "[, dann gilt x < a + " = a + (−a) = 0 und somit x ∈ D. Im Fall a > 0 und x ∈ ]a − ", a + "[
gilt x > a − " = a − a = 0, also wiederum x ∈ D. In beiden Fälle ist also ]a − ", a + "[ ⊆ D erfüllt.
—–
131
—–
Bestimmen wir nun den Wert der Ableitung an einer beliebigen Stelle a ∈ D. Es gilt
lim
f (a + h) − f (a)
=
h
h→0
lim
(−h)
a(a+h)
lim
−
1
a
=
h
h→0
=
h
h→0
1
a+h
lim −
h→0
1
a(a + h)
a−(a+h)
a(a+h)
lim
=
=
h
h→0
−
1
a2
(v) Die Funktion abs : R → R ist an jedem Punkt a ∈ R× differenzierbar, aber im Punkt 0 nicht differenzierbar.
Sei zunächst a < 0 und (hn )n∈N eine beliebige Folge mit limn hn = 0. Setzen wir " = |a|, so gibt es ein N ∈ N
mit |hn | < " für alle n ≥ N . Für diese n gilt dann a + hn < a + " = a + (−a) = 0 und somit |a + hn | = −(a + hn ).
Weil sich endlich viele Folgenglieder auf den Grenzwert nicht auswirken, erhalten wir
abs(a + hn ) − abs(a)
lim
=
hn
n→∞
lim
−(a + hn ) + a
=
hn
n→∞
lim
|a + hn | − |a|
lim
n→∞
=
hn
n→∞
−hn
=
hn
−1
Damit ist abs0 (a) = −1 bewiesen. Betrachten wir nun den Fall a > 0. Sei wiederum (hn )n∈N eine Folge mit
limn hn = 0. Wie im vorherigen Fall zeigt man, dass a + hn > 0 und somit |a + hn | = a + hn für alle bis auf
endlich viele n ∈ N gilt. Man erhält dann
lim
abs(a + hn ) − abs(a)
=
hn
n→∞
a + hn − a
lim
=
hn
n→∞
lim
n→∞
hn
hn
=
1
und somit abs0 (a) = 1. Nehmen wir nun an, die Funktion abs ist auch im Nullpunkt differenzierbar. Dies
würde bedeuten, dass der Grenzwert
lim
abs(h) − abs(0)
=
h
h→0
lim
abs(h)
h
h→0
existiert. Um ihn zu auszurechnen, betrachten wir die Folge ( 1n )n∈N mit limn
lim
abs(h)
=
h
h→0
lim
abs( 1n )
=
1
n
n→∞
1
n
n→∞ 1
n
lim
=
1
n
= 0. Wir erhalten
lim 1
n→∞
=
1.
Wenn der Grenzwert also existiert, dann muss er mit 1 übereinstimmen. Betrachten wir aber andererseits die
Folge (− 1n )n∈N , die ebenfalls gegen Null konvergiert, so erhalten wir
lim
h→0
abs(h)
h
Der Widerspruch 1 = lim
h→0
=
abs(h)
h
lim
n→∞
abs(− 1n )
(− 1n )
1
n
n→∞ (− 1 )
n
=
lim
=
lim −1
n→∞
=
−1.
= −1 zeigt, dass der Grenzwert nicht existiert.
(vi) Die Funktion f : R → R, x 7→
p
3
x ist im Punkt a = 0 nicht differenzierbar. Zum Nachweis genügt es, eine
Folge (hn )n∈N mit limn hn = 0 anzugeben, für die der Grenzwert
1
(
n→∞ hn
lim
—–
p
132
3
hn −
—–
p
3
0)
nicht existiert. Sei hn =
1
n3
p
für alle n ∈ N. Dann gilt lim hn = 0 und 3 hn = 1n für alle n ∈ N. Wir erhalten
n→∞
p
p
1
3
3
hn − 0
1 3
n
=
=
·n
= n2 .
1
hn
n
3
n
Die Folge ist unbeschränkt und somit nicht konvergent.
y
2
1
x
−5
−4
−3
−2
−1
1
2
3
4
5
−1
−2
p
Die Kubikwurzel-Funktion x 7→ 3 x ist im Nullpunkt nicht differenzierbar.
Der Funktionsgraph hat dort eine senkrechte Tangente (rot), die Steigung wird unendlich groß.
In jedem einzelnen Beispiel hätte man nach (6.2) an Stelle des Grenzwerts lim auch den entsprechenden Grenzwert
h→0
lim betrachten können, dies hätte an der Rechnung jeweils wenig geändert. Zum Abschluss bemerken wir noch
x→a
(6.3) Satz Sei f : D → R eine Funktion und a ∈ D. Ist f im Punkt a differenzierbar, dann ist
sie dort auch stetig.
An einer Unstetigkeitstelle a kann eine Funktion nicht differenzierbar sein.
Die Steigungen der Sekanten (gelb) laufen für x → a gegen einen unendlichen Wert.
Beweis:
Wir zeigen, dass unter der angegebenen Voraussetzung lim f (x) = f (a) erfüllt ist. Als innerer Punkt von
x→a
D ist a auch ein Häufungspunkt von D und ein Berührpunkt von Da = D \ {a}. Sei nun (x n )n∈N eine Folge in Da mit
—–
133
—–
limn x n = a. Die Differenzierbarkeit von f an der Stelle a liefert nun
‹
f (x) − f (a)
f (x) − f (a) 
lim f (x) = lim f (a) +
lim (x − a)
(x − a)
= f (a) + lim
x→a
x→a
x→a
x→a
x −a
x −a
=
f (a) + f 0 (a) · 0
=
f (a).
ƒ
Ist eine Funktion f : D → R an einer Stelle a nicht stetig, so ist sie also dort auch nicht differenzierbar.
—–
134
—–
(II) Ableitungsregeln
(6.4) Satz
(Summenregel)
Sei D ⊆ R eine beliebige Teilmenge, f , g : D → R Funktionen und a ∈ D ein Punkt, in dem f
und g beide differenzierbar sind. Dann ist auch f + g in a differenzierbar, und es gilt
( f + g)0 (a)
Beweis:
f 0 (a) + g 0 (a).
=
Nach Voraussetzung ist a ein innerer Punkt von D. Weil f und g in a differenzierbar sind, existieren die
Grenzwerte
lim
f (x) − f (a)
= f 0 (a)
und
lim
g(x) − g(a)
x→a
x −a
Auf Grund der Prop. (5.6) über Funktionsgrenzwerte erhalten wir
x→a
lim
( f + g)(x) − ( f + g)(a)
lim
lim
f (x) − f (a)
x −a
x→a
lim
+ lim
+
x→a
x −a
g(x) − g(a)
g(x) − g(a)
x −a
= g 0 (a).
f (x) + g(x) − f (a) − g(a)
x→a
f (x) − f (a)
x −a
x→a
(6.5) Satz
=
x −a
x→a
x −a
x −a
=
f 0 (a) + g 0 (a).
=
=
ƒ
(Produktregel)
Sei D ⊆ R eine beliebige Teilmenge, f , g : D → R Funktionen und a ∈ D ein Punkt, in dem f
und g beide differenzierbar sind. Dann ist auch f g in a differenzierbar, und es gilt
( f g)0 (a)
Beweis:
f 0 (a)g(a) + f (a)g 0 (a).
=
Auch hier ist nach Voraussetzung ist a ein innerer Punkt von D, und weil f und g in a differenzierbar
sind, existieren die Grenzwerte
lim
f (x) − f (a)
x −a
x→a
= f 0 (a)
und
lim
x→a
g(x) − g(a)
x −a
= g 0 (a).
Ferner ist nach (6.3) eine differenzierbare Funktion immer auch stetig. Wenden wir dies auf die Funktion g an, so
erhalten wir lim g(x) = g(a). Wiederum durch Anwendung der Rechenregeln für Funktionsgrenzwerte erhalten wir
x→a
lim
( f g)(x) − ( f g)(a)
x→a
lim
x −a
=
lim
f (x)g(x) − f (a)g(a)
x −a
x→a
f (x)g(x) − f (a)g(x) + f (a)g(x) − f (a)g(a)
x −a
x→a
—–
135
—–
=
=
lim
( f (x) − f (a))g(x)
x −a
+ lim
f (a)(g(x) − g(a))
x −a

‹
g(x) − g(a)
f (x) − f (a)
lim g(x) + f (a) lim
=
lim
x→a
x→a
x→a
x −a
x −a
x→a
(6.6) Folgerung
x→a
=
f 0 (a)g(a) + f (a)g 0 (a).
ƒ
Für jedes n ∈ N sei f n : R → R gegeben durch f n (x) = x n für alle x ∈ R.
Dann gilt f n0 (a) = na n−1 für alle a ∈ R und n ∈ N, insbesondere ist die Funktion f n auf ihrem
gesamten Definitionsbereich differenzierbar.
Beweis:
Sei a ∈ R. Wir beweisen die Gleichung f n0 (a) = na n−1 durch vollständige Induktion über n. Für n = 1 gilt
f10 (a) = id0 (a) = 1 = 1 · a0 . Sei nun n ∈ N, und setzen wir die Gleichung für n voraus. Dann folgt
0
f n+1
(a)
=
( f n f1 )0 (a)
=
=
f n0 (a) f1 (a) + f n (a) f10 (a)
na n + a n
=
Ind.−V.
=
(n + 1)a n .
na n−1 · a + a n · 1
ƒ
Zusammen mit der Summenregel ergibt sich aus Folgerung (6.6) unmittelbar, dass alle Polynomfunktionen auf ganz
R differenzierbar sind.
(6.7) Satz
(Quotientenregel)
Sei D ⊆ R eine beliebige Teilmenge, seien f , g : D → R Funktionen mit g(x) 6= 0 für alle x ∈ D.
Sei a ∈ D ein Punkt mit der Eigenschaft, dass f und g in a differenzierbar sind. Dann ist die
Funktion
f
g
in a differenzierbar, und es gilt
0
f
g
Beweis:
(a)
f 0 (a)g(a) − f (a)g 0 (a)
=
g(a)2
.
Auf Grund der Voraussetzungen existiert der Grenzwert
lim
g(x) − g(a)
x −a
x→a
g 0 (a).
=
Nach (6.3) ist g an der Stelle a auch stetig, es gilt also lim g(x) = g(a). Wir zeigen nun zunächst, dass die Funktion
1
g
x→a
an der Stelle a differenzierbar ist und die Gleichung
0
1
g
(a)
—–
=
136
−
g 0 (a)
g(a)2
—–
erfüllt ist. Auf Grund der Rechenregeln für Funktionsgrenzwerte und wegen g(a) 6= 0 gilt
lim
x→a
1
g(x)
−
1
g(a)
=
x −a
lim
g(a) − g(x)
1
x −a
g(x)g(a)
x→a
lim
=
g(a)g(a)
−
g 0 (a)
g(a)2
1
lim
x −a
x→a
1
(−g 0 (a)) ·
=
g(a) − g(x)
=
x→a
g(x)g(a)
.
Mit Hilfe der Produktregel erhalten wir nun
0
f
g
f 0 (a)
g(a)
‚
+ f (a) −
(a)
g 0 (a)
=
f ·
0
g
(a)
f 0 (a)g(a)
Œ
g(a)2
1
=
g(a)2
f 0 (a)
=
‚
+
1
g
f (a)(−g 0 (a))
(a) + f (a)
Œ
=
g(a)2
0
1
g
(a)
=
f 0 (a)g(a) − f (a)g 0 (a)
g(a)2
.
ƒ
Wir haben oben gezeigt, dass für jedes n ∈ N die Ableitung von f n (x) = x n durch f n0 (x) = nx n−1 gegeben ist. Mit
der Quotientenregel kann man überprüfen, dass diese Formel auch im Fall n ∈ Z mit n < 0 die richtige Ableitung
liefert. Es gilt dann nämlich m = −n ∈ N, außerdem f m =
1
,
fn
und auf Grund der bereits bewiesenen Formel erhalten
×
wir für alle x ∈ R jeweils
f n0 (x)
=
1
0
fm
(x)
=
=
−
f m0 (x)
=
f m (x)2
nx −n−1 · x 2n
=
−
mx m−1
x 2m
=
−
(−n)x −n−1
x −2n
nx n−1 .
Der einzige Unterschied zum Fall n ∈ N besteht darin, dass der Definitionsbereich von f n und f n0 nicht durch R,
sondern durch R = R \ {0} gegeben ist. Wir bemerken noch, dass die Ableitungsregel f n0 (x) = nx n−1 für n = 0 als
einzige ganze Zahl nicht gültig ist.
(6.8) Satz
(Kettenregel)
Seien D und E Teilmengen von R und f : D → R, g : E → R Funktionen mit f (D) ⊆ E. Sei a ∈ D
ein Punkt mit der Eigenschaft, dass f in a differenzierbar ist und dass g in f (a) differenzierbar
ist. Dann ist auch g ◦ f : D → R im Punkt a differenzierbar, und es gilt
(g ◦ f )0 (a)
Beweis:
=
g 0 ( f (a)) f 0 (a).
Sei b = f (a) und die Funktion g̃ : E → R definiert durch

g( y) − g(b)
für y 6= b

y−b
g̃( y) =
 0
g (b)
für y = b.
—–
137
—–
Weil die Funktion g in b differenzierbar ist, gilt
lim g̃( y)
y→b
=
lim
g( y) − g(b)
g 0 (b)
=
y−b
y→b
=
g̃(b) ,
mit anderen Worten, die Funktion g̃ ist im Punkt b stetig. Weil f im Punkt a und g̃ im Punkt b = f (a) stetig ist,
handelt es sich bei g̃ ◦ f um eine im Punkt a stetige Funktion. Wir betrachten nun den Differentialquotienten der
Funktion g ◦ f . Ist x ∈ D ein Punkt mit f (x) 6= f (a), dann gilt
(g ◦ f )(x) − (g ◦ f )(a)
x −a
=
(g ◦ f )(x) − (g ◦ f )(a)
f (x) − f (a)
·
f (x) − f (a)
x −a
=
(g̃ ◦ f )(x) ·
f (x) − f (a)
x −a
.
Ist x 6= a und f (x) = f (a), dann ist die Gleichung
(g ◦ f )(x) − (g ◦ f )(a)
=
f (x) − f (a)
(g̃ ◦ f )(x) ·
x −a
x −a
offenbar auch erfüllt, denn dann steht auf beiden Seiten eine Null. Insgesamt erhalten wir somit

‹
(g ◦ f )(x) − (g ◦ f )(a)
f (x) − f (a)
=
lim
=
lim (g̃ ◦ f )(x)
lim
x→a
x→a
x→a
x −a
x −a
(g̃ ◦ f )(a) f 0 (a)
g 0 (b) f 0 (a)
=
g 0 ( f (a)) f 0 (a)
=
ƒ
Wir bestimmen die Ableitung der Funktion h : R → R, x 7→ (x 2 + 5)7 mit Hilfe der Kettenregel. Seien f , g : R → R
gegeben durch f (x) = x 2 + 5 und g(x) = x 7 für alle x ∈ R. Dann ist h = g ◦ f , und die Ableitungen von f und g
sind gegeben durch f 0 (x) = 2x und g 0 (x) = 7x 6 für x ∈ R. Die Kettenregel liefert also
h0 (x)
(6.9) Satz
=
(g ◦ f )0 (x)
=
f 0 (x)g 0 ( f (x))
=
2x · 7(x 2 + 5)6
=
14x(x 2 + 5)6 .
(Umkehrregel)
Sei I ⊆ R ein (endliches oder unendliches) offenes Intervall, f : I → R stetig und streng
monoton wachsend. Sei J = f (I) und g = f −1 die Umkehrfunktion von f . Ist f an einer Stelle
a ∈ I differenzierbar und gilt f 0 (a) 6= 0, dann ist auch g an der Stelle b = f (a) differenzierbar,
und es gilt
g 0 (b)
Beweis:
1
=
f
1
=
0 (a)
f
0 (g(b))
.
Sei ( yn )n∈N eine Folge in J \ {b}, die gegen b konvergiert. Definieren wir x n = g( yn ) für alle n ∈ N,
so ist (x n )n∈N eine Folge in I \ {a}. Nach Satz (5.19) ist mit der Funktion f auch die Funktion g stetig, also gilt
limn x n = limn g( yn ) = g(b) = f −1 ( f (a)) = a. Auf Grund der Differenzierbarkeit von f im Punkt a und wegen
f 0 (a) 6= 0 gilt
lim
n→∞
g( yn ) − g(b)
yn − b
=
lim
n→∞
xn − a
=
f (x n ) − f (a)
lim
n→∞
=
1
f
0 (a)
—–
=
138
1
f
0 (g(b))
—–
.
1
f (x n ) − f (a)
xn − a
Damit ist g 0 (b) = lim
g( y) − g(b)
y−b
y→b
1
=
f 0 (g(b))
bewiesen.
ƒ
(6.10) Folgerung Sei k ∈ N und g k : R+ → R+ , x 7→
p
und es gilt g k0 (x) = 1k ( k x)1−k für alle x ∈ R+ .
Beweis:
p
k
x. Dann ist g k auf R+ differenzierbar,
Wie wir bereits in §5 festgestellt haben, ist g k die Umkehrfunktion der Funktion f k : R+ → R+ gegeben
durch x 7→ x k . Für alle x ∈ R+ gilt f k0 (x) = k x k−1 , die Umkehrregel liefert also
g k0 (x)
=
1
1
=
f k0 (g k (x))
=
p
f k0 ( k x)
k(
p
k
1
1 p
( k x)1−k .
k
=
x)k−1
ƒ
Weiter unten werden wir mit Hilfe der Umkehrregel auch die Ableitungen der Logarithmusfunktionen bestimmen.
(6.11) Folgerung Sei r ∈ Q, r 6= 0 und f r : R+ → R, x 7→ x r . Dann gilt
f r0 (x)
=
r x r−1
x ∈ R+ .
für alle
Beweis: Sei r = ab mit a ∈ Z, a 6= 0 und b ∈ N. Bezeichnen wir mit f a , g b : R+ → R+ die Potenzfunktion f a (x) = x a
p
bzw. g b (x) = b x, dann gilt f r = g b ◦ f a , denn für alle x ∈ R+ ist
(g b ◦ f a )(x)
=
g b ( f a (x))
=
g b (x a )
=
p
b
xa
=
x a/b
=
f r (x).
p
Mit Hilfe der Kettenregel und der bereits bewiesenen Formel g 0b (x) = 1b ( b x)1−b erhalten wir
f r0 (x)
=
1 p
b
( x a )1−b a x a−1
b
=
(g b ◦ f a )0 (x)
a
b
a
(x b )1−b x a−1
g 0b ( f a (x)) f a0 (x)
=
=
a
r x b (1−b)+(a−1)
=
=
g 0b (x a ) f a0 (x)
a
r x b −1
=
=
r x r−1
ƒ
Man kann zeigen, dass diese Ableitungsregel auch für irrationales r ∈ R \ {0} gültig bleibt, indem man die Regel für
rationales r verwendet und einen Grenzübergang durchführt. Hierzu benötigt man allerdings einen Satz über die
Vertauschbarkeit der Ableitung mit Grenzübergängen, den wir hier aus Zeitgründen nicht behandeln können.
—–
139
—–
(III) Der Mittelwertsatz
(6.12) Definition Sei D ⊆ R, f : D → R eine Funktion und a ∈ D ein beliebiger Punkt. Man
nannt a ein
(i) lokales Maximum von f , wenn ein " ∈ R+ existiert, so dass f (a) ≥ f (x) für alle x ∈ D
mit |x − a| < " gilt, und ein
(ii) globales Maximum von f , wenn f (a) ≥ f (x) für alle x ∈ D erfüllt ist.
Entsprechend sind die Begriffe lokales bzw. globales Minimum definiert.
Das Wort Extremum ist der gemeinsame Oberbegriff für Minimum und Maximum. Man kann somit auch von lokalen oder globalen Extremstellen sprechen. Offenbar ist jedes globale Extremum auch ein lokales, während die
Umkehrung im Allgemeinen falsch ist.
(6.13) Proposition
(notwendiges Kriterium für Extrema)
Sei D ⊆ R, f : D → R eine Funktion und a ∈ D ein lokales Extremum von f . Ist die Funktion f
in a differenzierbar, dann gilt f 0 (a) = 0.
Beweis:
Nach Voraussetzung ist a ein innerer Punkt von D, es gibt also ein " ∈ R+ mit der Eigenschaft, dass
]a − ", a + "[ in D enthalten ist. Wir gehen davon aus, dass es sich bei a um ein lokales Maximum von f handelt;
im Fall eines Minimums läuft der Beweis völlig analog. Nach eventueller Verkleinerung von " ist dann f (a) ≥ f (x)
für alle x ∈ D mit |x − a| < " erfüllt. Sei nun N ∈ N so groß gewählt, dass
1
N
< " gilt. Wir definieren Folgen (x n )n≥N
und ( yn )n≥N durch
xn = a −
1
n
yn = a +
und
1
n
für alle
n ∈ N.
Wegen f (x n ) − f (a) ≤ 0 und x n − a = − 1n < 0 für alle n ≥ N gilt
f 0 (a)
=
lim
n→∞
Andererseits gilt f ( yn ) − f (a) ≤ 0 sowie yn − a =
f 0 (a)
=
1
n
f (x n ) − f (a)
xn − a
≥
0.
> 0 für alle n ≥ N und somit
lim
n→∞
f ( yn ) − f (a)
yn − a
Insgesamt ist also nur f 0 (a) = 0 möglich.
≤
0.
ƒ
—–
140
—–
(6.14) Satz
(Satz von Rolle)
Seien a, b ∈ R mit a < b. Ferner sei f : [a, b] → R eine stetige Funktion mit f (a) = f (b), die
darüber hinaus auf ]a, b[ differenzierbar ist. Dann gibt es ein c ∈ ]a, b[ mit f 0 (c) = 0.
Beweis:
Wenn f auf [a, b] konstant ist, dann ist die Aussage trivial, denn in diesem Fall gilt f 0 (x) = 0 für alle
x ∈ ]a, b[. Nehmen wir nun an, dass ein x ∈ ]a, b[ mit f (x) > f (a) existiert. Nach dem Maximumsprinzip (5.17)
nimmt f sein Maximum in einem Punkt c ∈ [a, b] an, wobei c ∈ {a, b} allerdings ausgeschlossen ist, denn dort ist
der Funktionswert jedenfalls nicht maximal. Dieses c ist dann nach Definition auch ein lokales Maximum, und das
notwendige Kriterium für Extrema (6.13) liefert f 0 (c) = 0.
Wenn f auf [a, b] nicht konstant ist und auch kein x ∈ ]a, b[ mit f (x) > f (a) existiert, dann gibt es ein x ∈ ]a, b[
mit f (x) < f (a). Der Beweis verläuft dann analog zum vorherigen Fall, an Stelle des globalen Maximums betrachtet
man das globale Minimum.
(6.15) Satz
ƒ
(Mittelwertsatz der Differentialrechnung)
Seien a, b ∈ R mit a < b. Ferner sei f : [a, b] → R stetig und auf ]a, b[ differenzierbar. Dann
gibt es ein c ∈ ]a, b[ mit
f 0 (c)
=
—–
f (b) − f (a)
b−a
141
—–
.
Beweis:
Wir wenden den Satz von Rolle auf die Funktion g(x) = f (x) −
f (b)− f (a)
(x
b−a
− a) an. Es gilt g(a) = f (a) =
g(b), außerdem ist die Funktion g stetig auf [a, b] und differenzierbar auf ]a, b[. Auf Grund des Satzes von Rolle
finden wir ein c ∈ ]a, b[ mit g 0 (c) = 0, und es folgt
f 0 (c)
=
f (b) − f (a)
g 0 (c) +
f (b) − f (a)
=
b−a
b−a
.
ƒ
Seien a, b ∈ R mit a < b. Ferner sei f : [a, b] → R stetig und es gelte
(6.16) Folgerung
f (x) = 0 für alle x ∈ ]a, b[. Dann ist f auf [a, b] konstant.
0
Beweis:
Angenommen, es gibt ein c ∈ ]a, b] mit f (c) 6= f (a). Nach dem Mittelwertsatz finden wir dann ein
x ∈ ]a, c[ mit
f 0 (c)
f (c) − f (a)
=
c−a
6=
0
im Widerspruch zur Voraussetzung.
ƒ
Häufig wird der Mittelwertsatz auch in der folgenden verallgemeinerten Form verwendet.
(6.17) Satz Seien a, b ∈ R mit a < b und f , g : [a, b] → R stetige, auf ]a, b[ differenzierbare
Funktionen, wobei wir g 0 (x) 6= 0 für alle x ∈ ]a, b[ voraussetzen. Dann gibt es ein c ∈ ]a, b[
mit
f 0 (c)
Beweis:
f (b) − f (a)
=
g 0 (c)
g(b) − g(a)
Auf Grund unserer Voraussetzungen muss g(a) 6= g(b) gelten, weil ansonsten nach dem Satz von Rolle
ein x ∈ ]a, b[ mit g 0 (x) = 0 existieren würde. Wir betrachten nun auf [a, b] die Funktion
=
h(x)
f (x) − g(x)
f (b) − f (a)
g(b) − g(a)
.
Diese erfüllt die Voraussetzungen des Satzes von Rolle, denn es gilt
h(a)
=
=
f (a) − g(a)
f (b) − f (a)
g(b) − g(a)
f (a)g(b) − f (b)g(a)
g(b) − g(a)
=
f (a)g(b) − f (a)g(a) − f (b)g(a) + f (a)g(a)
=
=
g(b) − g(a)
f (b)g(b) − f (b)g(a) − f (b)g(b) + f (a)g(b)
f (b) − g(b)
g(b) − g(a)
f (b) − f (a)
g(b) − g(a)
=
h(b).
Es gibt also ein x ∈ ]a, b[ mit
h0 (x) = 0
⇔
f 0 (x) − g 0 (x)
f (b) − f (a)
g(b) − g(a)
—–
=0
142
⇔
—–
f 0 (x)
g 0 (x)
=
f (b) − f (a)
g(b) − g(a)
ƒ
Als erste Anwendung des Mittelwertsatzes bestimmen wir die Ableitung der Exponential- und Logarithmusfunktionen. An Stelle von exp b (x) (für x, b ∈ R und b > 1) schreiben wir im weiteren Verlauf häufig auch b x . Für 0 < b < 1
definieren wir b x = exp1/b (x). Neben b x+ y = b x b y gelten auch die Rechenregeln (b x ) y = b x y und (ab) x = a x b y
für a, b ∈ R+ und nicht nur für rationale, sondern beliebige reelle x, y. Wie schon zuvor beweist man dies dadurch,
dass man x und y durch Folgen (x n )n∈N , ( yn )n∈N rationaler Zahlen approximiert, die Gültigkeit von (b x n ) yn = b x n yn
und (ab) x n = a x n b yn verwendet und den Limes n → ∞ bildet.
(6.18) Lemma
Sei b ∈ R, b > 1. Dann existiert der Grenzwert lim f (x) für die Funktion
x→0
×
f : R −→ R gegeben durch
f (x)
=
bx − 1
x
.
Zunächst zeigen wir, dass f auf R+ streng monoton wachsend ist. Für x, y ∈ R mit 0 < y < x gilt
Beweis:
f (x)
bx − 1
=
=
x
(b y ) x/ y − 1
=
x
b y − 1 (b y ) x/ y − 1
·
.
x
by − 1
Durch Anwendung des Mittelwertsatzes auf die Funktion g : [1, b y ] → R, t 7→ t y/x mit der Ableitung g 0 (t) =
y
x
t y/x−1 erhalten wir ein z ∈ ]1, b y [ mit
(b y ) x/ y − 1
by
g(b y ) − g(1)
=
−1
by
=
−1
g 0 (z)
y
=
x
z y/x−1 .
Daraus folgt
f (x)
=
b y − 1 (b y ) x/ y − 1
·
x
by − 1
=
b y − 1 x x/ y−1
· z
x
y
wobei wir im letzten Schritt verwendet haben, dass z > 1 und
+
=
x
y
by − 1
y
z x/ y−1
>
by − 1
y
=
f ( y) ,
> 1 gilt. Damit ist nachgewiesen, dass die Funktion
f auf R streng monoton wächst.
Damit ist nun leicht zu sehen, dass s = inf { f (x) | x ∈ R+ } der gesuchte Grenzwert von f ist. Für den Nachweise
sei (hn )n∈N eine Folge in R× mit limn hn = 0. Zunächst zeigen wir, dass limn f (|hn |) = s gilt. Nach Definition von s
gibt es ein δ ∈ R+ mit f (δ) < s + ". Wählen wir N ∈ N so groß, dass |hn | < δ für alle n ≥ N erfüllt ist, dann folgt
s ≤ f (|hn |) < f (δ) < s + " auf Grund des streng montonen Wachstums von f und somit | f (|hn |) − s| < " für alle
n ≥ N . Damit ist limn f (|hh |) = s bewiesen. Als nächstes bemerken wir, dass für alle h ∈ R+ die Gleichung
f (−h)
=
b−h − 1
−h
=
b−h ·
1 − b−h
h
=
b−h ·
bh − 1
h
=
gilt. Weil die Funktion x 7→ b x im Nullpunkt stetig ist, gilt limn b−|hn | = b0 = 1 und somit

‹
‹
lim b−|hn | f (hn ) =
lim b−|hn |
lim f (hn )
= 1·s =
n→∞
n→∞
n→∞
b−h f (h)
s.
Sei nun " ∈ R+ vorgegeben. Auf Grund unserer bisherigen Überlegungen gibt es ein N1 ∈ N mit | f (|hn |) − s| < " für
alle n ≥ N1 und ein N2 ∈ N mit |e−|hn | f (|hn |) − s| < " für alle n ≥ N2 . Weil f (hn ) für jedes n ∈ N mit f (|hn |) oder mit
e−|hn | f (|hn |) übereinstimmt, gilt | f (hn ) − s| < " für alle n ∈ N mit n ≥ max{N1 , N2 }.
—–
143
—–
ƒ
Die Exponential- und Logarithmusfunktion exp : R → R und ln : R+ → R zur
(6.19) Satz
Basis e (der Eulerschen Zahl) sind auf ihrem gesamten Definitionsbereich differenzierbar. Es gilt
exp0 (x) = exp(x) für alle
Beweis:
1
ln0 (x) =
x ∈ R und
x ∈ R+ .
für alle
x
Zunächst beweisen wir, dass die Exponentialfunktion auf ihrem gesamten Definitionsbereich differenzier-
bar ist. Sei x ∈ R beliebig vorgegeben. Dann gilt
exp0 (x)
=
lim
e x+h − e x
=
h
h→0
lim e x ·
eh − 1
=
h
h→0
se x
,
wobei s den Grenzwert aus (6.18) bezeichnet. Wäre s = 0, dann müsste die Exponentialfunktion nach (6.16) konstant sein, was offensichtlich nicht der Fall ist. So aber können wir die Umkehrregel (6.9) anwenden. Nach ihr ist
mit exp auch die Umkehrfunktion ln differenzierbar, und für alle x ∈ R+ gilt
ln0 (x)
1
=
1
=
seln(x)
sx
.
Wir bestimmen nun die konstante s, indem wir die Ableitung von ln an der Stelle x = 1 explizit berechnen. Mit Hilfe
der Rechenregel ln(x y) = ln(x) + ln( y) erhält man durch vollständige Induktion ln(x n ) = n ln(x) für alle x ∈ R+
und n ∈ N. Es folgt
1
s
0
=
ln (1)
Š
€
lim n · ln 1 + 1n
n→∞
=
lim
ln(1 + h) − ln(1)
€
Š
lim ln (1 + 1n )n
=
=
h
h→0
=
n→∞
ln

lim
ln(1 + 1n )
lim (1 +
n→∞
=
1
n
n→∞
1 n
)
n
‹
=
ln e
=
1
,
wobei wir im vorletzten Schritt die Definition der Eulerschen Zahl aus (4.29) verwendet haben. Es folgt s = 1, und
Einsetzen liefert die angegebenen Formeln für die Ableitungen von exp und log.
ƒ
Wir können nun auch die Ableitungen für exp b und log b zu einer beliebigen Basis b ∈ R mit b > 1 angeben. Es gilt
eln(b) = b, und für jedes x ∈ R folgt daraus
exp b (x)
=
bx
=
(eln(b) ) x
=
e x ln(b)
=
exp(x ln(b)).
Mit Hilfe der Kettenregel erhalten wir
exp0b (x)
=
ln(b) exp0 (x ln(b))
=
ln(b) exp(x ln(b))
Wendet man log b auf beide Seiten der Gleichung
ln(x)
ln(x)
exp b
= exp
· ln(b)
ln(b)
ln(b)
=
=
ln(x)
ln(b)
und damit
—–
144
log0b (x) =
—–
ln(b) exp b (x).
exp(ln(x))
an, so erhält man
log b (x)
=
ln0 (x)
ln(b)
=
=
x
1
x ln(b)
.
Zum Abschluss dieses Abschnitts beweisen wir mit Hilfe des verallgemeinerten Mittelwertsatzes noch zwei wichtige
Regeln zur Bestimmung von Funktionsgrenzwerten.
(6.20) Satz
(l’Hospital’sche Regeln)
Seien a, b ∈ R, a < b, und seien f , g : ]a, b[ → R differenzierbare Funktionen.
Es sei g 0 (x) 6= 0 für alle x ∈ ]a, b[.
(i) Aus lim f (x) = lim g(x) = 0 oder lim f (x) = lim g(x) = +∞ folgt
x→a
x→a
x→a
x→a
f (x)
lim
=
g(x)
x→a
f 0 (x)
lim
g 0 (x)
x→a
(ii) Aus lim f (x) = lim g(x) = 0 oder lim f (x) = lim g(x) = +∞ folgt
x→b
x→b
x→b
x→b
f (x)
lim
=
g(x)
x→b
f 0 (x)
lim
g 0 (x)
x→b
d.h. wenn die rechte Seite der Gleichung als eigentlicher Grenzwert existiert, so existiert auch
der linke Grenzwert, und beide Werte stimmen überein.
Beweis:
Wir beschränken uns auf den Beweis der Aussage (i), da der Beweis von (ii) weitgehend analog verläuft.
Zunächst beweisen wir (i) unter der Voraussetzung
lim f (x)
=
x→a
=
lim g(x)
x→a
0.
Durch die Festlegung f (a) = g(a) = 0 können wir f und g als stetige Funktionen auf dem Intervall [a, b[ betrachten.
Sei c = lim f 0 (x)/g 0 (x) und (x n )n∈N eine Folge in ]a, b[ mit limn x n = a. Zu zeigen ist
x→a
f (x n )
lim
n→∞
g(x n )
=
c.
Dabei ist zu beachten, dass g(x n ) 6= 0 für jedes n ∈ N gilt, da ansonsten nach dem Satz von Rolle ein Punkt
yn ∈ a, x n mit g 0 ( yn ) = 0 existieren würde, im Widerspruch zur Voraussetzung. Auf Grund des verallgemeinerten
Mittelwertsatzes gibt es für jedes n ∈ N jeweils ein yn ∈ a, x n mit
f 0 ( yn )
g 0 ( yn )
=
f (x n ) − f (a)
g(x n ) − g(a)
=
f (x n )
g(x n )
.
Mit (x n )n∈N konvergiert auch die Folge ( yn )n∈N gegen a, und auf Grund der Voraussetzung läuft der Quotient
f 0 ( yn )/g 0 ( yn ) = f (x n )/g(x n ) damit gegen den Wert c. Nun beweisen wir (i) unter der Voraussetzung
lim f (x)
x→a
=
lim g(x)
x→b
=
+∞.
Sei c wieder der Grenzwert auf der rechten Seite der Gleichung und (x n )n∈N eine Folge in ]a, b[ mit limn x n = a. Zu
zeigen ist auch hier
lim
n→∞
f (x n )
g(x n )
—–
145
=
—–
c.
Die Funktion h = f 0 /g 0 kann durch die Festlegung h(a) = c zu einer stetigen Funktion auf [a, b[ gemacht werden.
f 0 (x)
Sei " ∈ R+ vorgegeben. Nach dem "-δ-Kriterium gibt es ein δ ∈ R+ , so dass aus |x − a| < δ jeweils | g 0 (x) − c| < 12 "
folgt. Sei nun y = a + δ. Wegen limn x n = a und limn f (x n ) = limn g(x n ) = +∞ gibt es ein N ∈ N, so dass x n < y,
f (x n ) > 0 und g(x n ) > max{0, g( y)} für alle n ≥ N erfüllt ist. Für diese n gilt
f (x n ) − f ( y) 1 −
·
g(x n ) − g( y) 1 −
g( y)
g(x n )
=
f ( y)
f (x n )
f (x n ) − f ( y)
g(x n ) − g( y)
·
f (x n ) g(x n ) − g( y)
·
f (x n ) − f ( y)
g( yn )
=
f (x n )
g(x n )
.
Auf Grund des verallgemeinerten Mittelwertsatzes finden wir für jedes n ≥ N ein yn ∈ x n , y mit
f 0 ( yn ) 1 −
·
g 0 ( yn ) 1 −
Wegen | yn − a| < δ gilt c − 21 " <
f 0 ( yn )
g 0 ( yn )
g( y)
g(x n )
=
f ( y)
f (x n )
f (x n )
.
g(x n )
< c + 21 ". Der Faktor rechts konvergiert für n → ∞ gegen den Wert 1,
so dass die Differenz zwischen f 0 ( yn )/g 0 ( yn ) und f (x n )/g(x n ) beliebig klein wird. Also gibt es ein N1 ≥ N mit
c−" <
f (x n )
g(x n )
< c + " für alle n ≥ N1 . Dies zeigt, dass der größte Häufungspunkt von f (x n )/g(x n ) nach oben
durch c + " und der kleinste Häufungspunkt nach unten durch c − " abgeschätzt werden kann. Weil " beliebig klein
gewählt werden kann, ist c tatsächlich der einzige Häufungspunkt der Folge, und nach Folgerung (4.24) bedeutet
dies limn f (x n )/g(x n ) = c.
ƒ
Als Anwendungsbeispiel für die l’Hospitalsche Regel berechnen wir den Grenzwert
lim
x
x→0
1 − ex
auf dem Definitionsbereich D = ]0, 1[. Definieren wir die Funktionen f und g auf D durch f (x) = x und g(x) =
1 − e x , dann sind beide Funktionen differenzierbar, und es gilt g 0 (x) = −e x 6= 0 für alle x ∈ D. Auf Grund der
Stetigkeit von x 7→ x und x 7→ 1 − e x im Nullpunkt gilt
lim f (x)
x→0
=
lim g(x)
x→0
=
0.
Die Voraussetzungen der Ersten l’Hospitalschen Regel sind also erfüllt, und wir erhalten
lim
x→0
x
1−
ex
=
lim
1
x→0 (−e x )
=
1
(−e0 )
=
−1.
Um den Anwendungsbereich der l’Hospitalschen Regeln zu erweitern, zeigen wir
—–
146
—–
(6.21) Lemma
—
”
(i) Sei a > 0 und f : ]a, +∞[ → R eine beliebige Funktion und g : 0, 1a → R gegeben
durch g(x) = f ( 1x ). Dann gilt lim x→+∞ f (x) = lim x→0 g(x).
”
—
(ii) Sei b < 0 und f : ]−∞, b[ → R beliebig und g : 1b , 0 gegeben durch g(x) = 1x . Dann
gilt lim x→−∞ f (x) = lim x→0 g(x).
Dies bedeutet jeweils: Der Grenzwert auf der linken Seite der Gleichung existiert genau dann,
wenn der Grenzwert rechts existiert, und in diesem Fall stimmen die beiden Werte überein. Die
Aussage ist sowohl für uneigentliche als auch für eigentliche Grenzwerte gültig.
Wir beschränken uns auf den Beweis von (i) und setzen voraus, dass der Grenzwert c = lim x→+∞ f (x)
”
—
existiert. Ist (x n )n∈N eine Folge in 0, 1a mit limn x n = 0, dann ist ( x1 )n∈N eine Folge in ]a, +∞[ mit limn x1 = +∞.
Beweis:
n
n
Es folgt limn g(x n ) = limn f ( x1 ) = c. Gehen wir nun umgekehrt davon aus, dass c = lim x→0 g(x) existiert. Ist
n
—
”
(x n )n∈N eine Folge in ]a, +∞[ mit limn x n = +∞, dann ist ( x1 )n∈N eine Folge in 0, 1a mit limn x1 = 0. Daraus folgt
n
limn f (x n ) = limn g( x1 ) = c.
n
ƒ
n
Als weiteres Anwendungsbeispiel für die l’Hospitalschen Regeln bestimmen wir den Grenzwert
x
lim
.
x→+∞ e x
Dazu betrachten wir die Funktionen f (x) = x und g(x) = e x auf ]1, +∞[. Es gilt
lim f ( 1x )
=
x→0
lim f (x) = +∞
lim g( 1x )
und
x→+∞
x→0
=
lim g(x) = +∞.
x→+∞
Außerdem ist die Funktion x 7→ g( 1x ) = e−1/x differenzierbar, und die Ableitung x 7→ − x12 e−1/x nimmt auf ]0, 1[
nicht den Wert 0 an. Damit sind alle Voraussetzungen für die Anwendung der l’Hospitalschen Regel erfüllt, und wir
erhalten
lim
x→+∞
x
ex
=
1
x
x→0 e 1/x
lim
=
lim
x→0
(− x12 )
=
(− x12 )e1/x
lim e−1/x
x→0
=
lim e−x
x→+∞
=
0.
Mit Hilfe dieses Ergebnisses können wir auch den Grenzwert
lim
x2
ex
berechnen, und zwar durch eine weitere Anwendung der l’Hospitalschen Regeln. Es gilt
x→+∞
lim
x→+∞
x2
ex
=
1
x2
x→0 e 1/x
lim
=
(−2)
x3
x→0 (− 1 )e 1/x
x2
lim
=
1
x
x→0 e 1/x
2 · lim
=
2·0
Durch einen Induktionsbeweis kann man zeigen, dass
xn
= 0
ex
für alle n ∈ N gilt. Die Exponentialfunktion wächst also schneller als jede Polynomfunktion.
lim
x→+∞
—–
147
—–
=
0.
(IV) Montonieverhalten und Kriterien für Extrema
Wir haben oben bereits ein notwendiges Kriterium für das Auftreten lokaler Extrema formuliert, nämlich das Verschwinden der ersten Ableitung. Wie bereits aus dem Schulunterricht bekannt, ist dieses Kriterium aber nicht hinreichend. Für die Funktion f (x) = x 3 gilt beispielsweise f 0 (0) = 0, ohne dass die Funktion an dieser Stelle ein lokales
Extremum besitzt.
(6.22) Satz
(Ableitung und Monotonieverhalten)
Seien a, b ∈ R mit a < b. Sei f : [a, b] → R eine stetige, auf ]a, b[ differenzierbare Funktion.
(i) Gilt f 0 (x) ≥ 0 für alle x ∈ ]a, b[, dann ist f auf [a, b] monoton wachsend.
(ii) Gilt f 0 (x) > 0 für alle x ∈ ]a, b[, dann ist f auf [a, b] streng monoton wachsend.
(iii) Gilt f 0 (x) ≤ 0 für alle x ∈ ]a, b[, dann ist f auf [a, b] monoton fallend.
(iv) Gilt f 0 (x) < 0 für alle x ∈ ]a, b[, dann ist f auf [a, b] streng monoton fallend.
Beweis:
zu (i) Angenommen, es gilt f 0 (x) ≥ 0 für alle x ∈ ]a, b[, aber f ist auf I nicht monoton wachsend. Dann
gibt es x, y ∈ [a, b] mit x < y und f (x) > f ( y). Nach dem Mittelwertsatz (6.15)) gibt es ein c ∈ ]x, y[ ⊆ Ĩ mit
f 0 (c)
f ( y) − f (x)
=
y−x
<
0
im Widerspruch zur Voraussetzung.
zu (ii) Nehmen wir an, es gilt f 0 (x) > 0 für alle x ∈ ]a, b[, aber f ist auf [a, b] nicht streng monoton wachsend.
Dann finden wir x, y ∈ [a, b] mit x < y und f (x) ≥ f ( y). Auf Grund des Mittelwertsatzes existiert ein c ∈ x, y
mit
f 0 (c)
=
f ( y) − f (x)
y−x
≤
0
,
was erneut der Voraussetzung widerspricht. Der Beweis der Aussagen (iii) und (iv) verläuft vollkommen analog. ƒ
Sei D ⊆ R und f : D → R eine Funktion. Definieren wir die Menge D1 ⊆ R durch
D1
=
{x ∈ D | f ist in x differenzierbar }
,
so erhalten wir durch die Ableitung f 0 eine Funktion f 0 : D1 → R. Wir bezeichnen f als zweimal differenzierbar
an der Stelle x ∈ D, wenn x in D1 liegt und die Funktion f 0 in x differenzierbar ist. Man bezeichnet dann f 00 (x) =
( f 0 )0 (x) als die zweite Ableitung von f an der Stelle x.
Mit demselben Ansatz lassen sich auch höhere Ableitungen definieren. Sei D0 = D und f (0) = f . Für jedes n ∈ N0
definieren wir rekursiv
Dn+1
=
{x ∈ Dn | f (n) ist in x differenzierbar }
—–
148
—–
und f (n+1) (x) = ( f (n) )0 (x) für alle x ∈ Dn+1 . Man sagt, die Funktion f ist an der Stelle x n-mal differenzierbar,
wenn x in Dn liegt. Gilt Dn = D, dann bezeichnet man f insgesamt als n-mal differenzierbare Funktion. Nach
Definition gilt D = D0 ⊇ D1 ⊇ ... ⊇ Dn für alle n ∈ N.
Liegt x in Dn und ist f (n) in x stetig, so bezeichnet man f an der Stelle x als n-mal stetig differenzierbar. Ist Dn = D
und f (n) auf ganz D stetig, so ist f insgesamt eine n-mal stetig differenzierbare Funktion auf D. Die Menge dieser
Funktionen D wird mit C n (D) bezeichnet. Insbesondere steht C 0 (D) für die Menge der stetigen Funktionen auf D.
Gilt Dn = D für alle n ∈ N, so ist f beliebig oft differenzierbar und damit auch n-mal stetig differenzierbar für jedes
n ∈ N, denn jede differenzierbare Funktion ist nach (6.3) stetig. Die Menge der Funktionen mit dieser Eigenschaft
wird durch C ∞ (D) bezeichnet.
Wir haben in (6.2) die folgende äquivalente Charakterisierung differenzierbarer Funktionen angegeben: Eine Funktion f : D → R ist genau dann differenzierbar an einer Stelle a ∈ D, wenn ein c ∈ R und eine Funktion ψ : D → R
mit
f (x) = f (a) + c(x − a) + ψ(x) für alle x ∈ D
ψ(x)
=0
x −a
existiert. In diesem Fall gilt c = f 0 (a). Die Funktion f wird an der Stelle a also durch eine Polynomfunktion ersten
und
lim
x→a
Grades approximiert, und zwar durch
τ1 ( f , a)(x)
=
f (a) + f 0 (a)(x − a).
Man bezeichnet τ1 ( f , a) als das Taylorpolynom erster Ordnung von f an der Stelle a. Es ist dadurch gekennzeichnet, dass
τ1 ( f , a)(a) = f (a)
und
τ1 ( f , a)0 (a) = f 0 (a)
erfüllt ist.
Unser Ziel besteht nun darin, die zweimal differenzierbaren Funktionen auf ähnliche Weise zu charakterisieren.
Dazu suchen wir eine Polynomfunktion zweiten Grades p : R → R mit p(k) (a) = f (k) (a) für k = 0, 1, 2. Setzen wir p
in der Form p(x) = u(x − a)2 + v(x − a) + w mit u, v, w ∈ R an, so gilt p0 (x) = 2u(x − a) + v und p00 (x) = 2u, also
p00 (a) = 2u, p0 (a) = v und p(a) = w. Der Ansatz, dass die Ableitungen von p und f bis zum Grad 2 übereinstimmen,
liefert u = 21 f 00 (a), v = f 0 (a) und w = f (a). Das gesuchte Polynom ist also
p(x)
=
f (a) + f 0 (a)(x − a) + 12 f 00 (a)(x − a)2 .
Man bezeichnet dieses Polynom mit τ2 ( f , a) und nennt es das Taylorpolynom zweiter Ordnung von f an der
Stelle a. Wir werden uns nun anschauen, wie dieses Polynom mit der zweifachen Differenzierbarkeit einer Funktion
zusammenhängt. Zur Vorbereitung beweisen wir
(6.23) Lemma Seien a, b, c ∈ R mit a < c < b und f : ]a, b[\{c} → R eine beliebige Funktion.
Wenn die beiden Grenzwerte lim x→c ( f |]a,c[ )(x) und lim x→c ( f |]c,b[ )(x) existieren und übereinstimmen, dann existiert auch der Grenzwert lim f (x), und es gilt lim f (x) = lim ( f |]a,c[ )(x) =
x→c
lim ( f |]c,b[ )(x).
x→c
x→c
—–
149
—–
x→c
Beweis:
Sei u der gemeinsame Grenzwert der Funktionen g = f |]a,c[ und h = f |]c,b[ für x → c. Erweitern wir den
Definitionsbereich von g durch g(c) = u auf ]a, c] und den von h auf [c, b[ durch h(c) = u, dann sind die Funktionen
g und h beide im Punkt c stetig. Sei nun (x n )n∈N eine Folge in ]a, b[ \ {c}, die gegen c konvergiert. Zu zeigen ist
limn f (x n ) = u; sei dazu " ∈ R+ vorgegeben. Nach dem "-δ-Kriterium und auf Grund der Stetigkeit von g in c gibt
es ein δ1 ∈ R+ mit der Eigenschaft, dass die Implikation |x − c| < δ1 ⇒ |g(x) − u| < " für alle x ∈ ]a, c[ erfüllt ist.
Ebenso finden wir ein δ2 ∈ R+ mit |x − c| < δ2 ⇒ |h(x) − u| < " für alle x ∈ ]c, b[. Sei nun δ = min{δ1 , δ2 } und
N ∈ N so groß gewählt, dass |x n − c| < δ für alle n ≥ N erfüllt ist. Für diese n gilt im Fall x n < c die Abschätzung
| f (x n ) − u|
=
|g(x n ) − u|
<
"
im Fall x n > c ebenso | f (x n ) − u| = |h(x n ) − u| < ". Damit ist limn f (x n ) = u nachgewiesen.
ƒ
Man bezeichnet lim ( f |]a,c[ )(x) als den linksseitigen und lim ( f |]c,b[ )(x) als den rechtsseitigen Grenzwert der Funkx→c
x→c
tion f , während lim f (x) der beidseitige Grenzwert genannt wird. Aus dem Lemma folgt, dass die l’Hospitalsche
x→c
Regel (6.20) (i) auch für beidseitige Grenzwerte gültig ist.
(6.24) Satz Sei f : D → R eine Funktion und a ∈ D ein Punkt, in dem f zweimal differenzierbar ist. Dann gibt es eine Funktion ψ : D → R mit
f (x)
Beweis:
=
τ2 ( f , a)(x) + ψ(x) für alle x ∈ D
und
lim
x→a
ψ(x)
(x − a)2
= 0.
Für alle x ∈ D definieren wir ψ(x) = f (x) − τ2 ( f , a)(x). Mit f und τ2 ( f , a) ist auch ψ zweimal dif-
ferenzierbar. Mit Hilfe der beidseitigen l’Hospitalschen Regel (s.o.) und der beiden Gleichungen ψ0 (a) = f 0 (a) −
τ2 ( f , a)0 (a) = 0 und ψ00 (a) = f 00 (a) − τ2 ( f , a)00 (a) = 0 erhalten wir
lim
x→a
ψ(x)
(x − a)2
(6.25) Satz
=
lim
x→a
ψ0 (x)
2(x − a)
1
lim
2 x→a
=
ψ0 (x) − ψ0 (a)
x −a
=
1 00
ψ (a)
2
=
0
ƒ
(hinreichendes Kriterium für lokale Maxima)
Seien a, b, c ∈ R mit a < c < b. Sei f : ]a, b[ → R eine differenzierbare Funktion, die in c sogar
zweimal differenzierbar ist, und es gelte
f 0 (c) = 0
und
f 00 (c) < 0.
Dann besitzt f in c ein lokales Maximum.
—–
150
—–
Sei D = ]a, b[ und Dc = D \ {c}. Nach Satz (6.24) gibt es eine Funktion ψ : Dc → R mit f (x) =
Beweis:
1
2
f (c) + f (c)(x − c)2 + ψ(x) für alle x ∈ Dc und
00
lim
x→c
ψ(c)
=
(x − c)2
0.
Definieren wir ϕ : D → R durch ϕ(x) = ψ(x)/(x − c)2 für x 6= c und ϕ(c) = 0, dann ist ϕ im Punkt c stetig. Nach
dem "-δ-Kriterium gibt es also für " = − 21 f 00 (c) ∈ R+ ein δ ∈ R+ mit |ϕ(x)| < " für alle x ∈ D mit |x − c| < δ.
Insbesondere gilt für alle x ∈ Dc damit ϕ(x) < − 12 f 00 (c), also
1
2
f 00 (c)(x − c)2 + ψ(x)
1
2
=
1
2
f 00 (c)(x − c)2 + ϕ(x)(x − c)2
f 00 (c)(x − c)2 − 12 f 00 (c)(x − c)2
=
<
0
und somit f (x) < f (c). Also ist c tatsächlich ein lokales Maximum von f .
ƒ
Nach demselben Schema beweist man
(6.26) Satz
(hinreichendes Kriterium für lokale Minima)
Seien a, b, c ∈ R mit a < c < b. Sei f : ]a, b[ → R eine differenzierbare Funktion, die in c sogar
zweimal differenzierbar ist, und es gelte
f 0 (c) = 0
f 00 (c) > 0.
und
Dann besitzt f in c ein lokales Minimum.
Die gerade angegebenen Kriterien sind jeweils hinreichend, aber nicht notwendig für die Existenz einer Extremstelle.
So besitzt zum Beispiel die Funktion f (x) = x 4 in c = 0 ein lokales Minimum, aber statt f 00 (c) > 0 gilt f 00 (c) = 0.
(V) Taylorpolynome und Taylorreihen
Auch für n > 2 läst sich eine Funktion f : D → R, die in einem Punkt a mindestens n-fach differenzierbar ist,
durch eine Polynomfunktion p approximieren, wobei der Grad ≤ n gewählt werden kann. Man bestimmt p so, dass
p(`) (a) = f (`) (a) für 0 ≤ ` ≤ n erfüllt ist. Setzen wir die Polynomfunktion in der Form
p(x)
=
a0 + a1 (x − a) + a2 (x − a)2 + ... + an (x − a)n
mit
a0 , a1 , ..., an ∈ R
an, so sind die höheren Ableitungen von p gegeben durch
p(`) (x)
=
n
X
k(k − 1) · ... · (k − ` + 1)(x − a)k−` ak
=
k=`
n
X
k!
k=`
(k − `)!
(x − a)k−` ak
für
0≤`≤n
,
insbesondere gilt p(`) (a) = `!a` für 0 ≤ ` ≤ n. Die Koeffizienten des gesuchten Polynoms sind also gegeben durch
a` = f (`) (a)/(`!), und das Polynom selbst ist gegeben durch
τn ( f , a)(x)
=
p(x)
=
n
X
1
k=0
—–
151
—–
k!
f (k) (a)(x − a)k .
Man nennt es das Taylorpolynom n-ter Ordnung von f an der Stelle a. In Analogie zu Satz (6.24) gilt
(6.27) Satz Sei n ∈ N, f : D → R eine Funktion und a ∈ D ein Punkt, in dem f mindestens
n-mal differenzierbar ist. Dann gibt es eine Funktion ψ : D → R mit
f (x)
=
τn ( f , a)(x) + ψ(x) für alle x ∈ D
und
lim
x→a
ψ(x)
= 0.
(x − a)n
Wir definieren die Funktion ψ auf D durch ψ(x) = f (x) − τn ( f , a)(x). Mit f und τn ( f , a)(x) ist die
Beweis:
Funktion ψ n-mal differenzierbar in a, und es gilt ψ(k) (a) = f (k) (a) − τn ( f , a)(k) (a) = 0 für 0 ≤ k ≤ n. Durch
(n − 1)-fache Anwendung der beidseitigen l’Hospitalschen Regel erhalten wir
lim
x→a
ψ(x)
=
(x − a)n
lim
x→a
ψ(n−1) (x)
n!(x − a)
1
lim
n! x→a
=
ψ(n−1) (x) − ψ(n−1) (a)
(x − a)
=
1
ψ(n) (a)
n!
=
0.
ƒ
(6.28) Lemma Sei n ∈ N, D ⊆ R, a ∈ D, und seien f , g : D → R zwei Funktionen, die beide
im Punkt a mindestens n-mal differenzierbar sind. Dann gilt
τn ( f + g, a) = τn ( f , a) + τn ( f , b) und τn (c f , a) = cτn ( f , a) für alle
Durch vollständige Induktion und mit Hilfe der Summen- und Produktregel zeigt man zunächst, dass
Beweis:
(n)
( f + g)
a ∈ D.
(a) = f (n) (a) + g (n) (a) und (c f )(n) (a) = c f n (a) für alle n ∈ N gilt. Nun erhält man die Gleichungen direkt
durch Einsetzen in die Definition des Taylorpolynoms. Es gilt
τn ( f + g, a)
=
n
X
1
k=0
k!
( f + g)(k) (a)(x − a)k
=
n
X
1
k=0
=
k!
f (k) (a)(x − a)k +
n
X
1
k=0
k!
g (k) (a)(x − a)k
τn ( f , a) + τn (g, a)
und
τn (c f , a)
=
n
X
1
k=0
(6.29) Folgerung
k!
(c f )(k) (a)(x − a)k
=
c
n
X
1
k=0
k!
f (k) (a)(x − a)k
=
cτn ( f , a).
Sei p : R → R eine Polynomfunktion vom Grad m ∈ N. Dann gilt für alle
a, x ∈ R und n ≥ m jeweils die Gleichung
p(x)
=
τn (p, a)(x).
Also ist die Funktion p ihr eigenes n-tes Taylorpolynom für n ≥ m.
—–
152
—–
ƒ
Beweis:
Als Polynomfunktion vom Grad m kann p in der Form
n
X
=
p(x)
ak (x − a)k
a0 , ..., an ∈ R
mit geeigneten
k=0
dargestellt werden. Wegen Lemma (6.28) genügt es also, die Gleichung für den Fall p(x) = (x − a)m zu beweisen.
Für 0 ≤ k ≤ m gilt
p(k) (x)
=
m(m − 1)...(m − 1 + k)(x − a)m−k
,
und p(k) (x) = 0 für k > m. Es folgt p(k) (a) = 0 für 0 ≤ k < m, p(m) (a) = m! und p(k) (a) = 0 für alle k > m. Sei nun
n ∈ N mit n ≥ m. Dann gilt also
τn (p, a)(x)
=
n
X
1
k!
k=0
1
m!
p(k) (a)(x − a)k
m!(x − a)m
=
1
=
(x − a)m
m!
=
p(m) (a)(x − a)m
p(x).
=
ƒ
Als Beispiel betrachten wir die Polynomfunktion p(x) = x 3 − x 2 + 7x + 5 und berechnen ihr viertes Taylorpolynom
an der Stelle 0. Die Ableitungen von p sind gegeben durch
p(0) (x)
=
x 3 − x 2 + 7x + 5
p(1) (x)
=
3x 2 − 2x + 7
p(2) (x)
=
6x − 2
p
(3)
(x)
=
6
p
(4)
(x)
=
0
Es gilt also p(0) (0) = 5, p(1) (0) = 7, p(2) (0) = −2, p(3) (0) = 6, p(4) (0) = 0. Das gesuchte Taylorpolynom ist somit
τ4 (p, 0)(x)
=
5+
1
1!
7x +
1
2!
1
(−2)x 2 +
3!
6x 3 +
1
4!
0x 4
=
5 + 7x − x 2 + x 3
=
p(x).
Überraschend ist, dass dieselbe Rechnung auch an jedem anderen Entwicklungspunkt funktioniert. Beispielsweise
ist p(0) (1) = 12, p(1) (1) = 8, p(2) (1) = 4, p(3) (1) = 6, p(4) (1) = 0. Somit ist das vierte Taylorpolynom an der Stelle 1
gegeben durch
τ4 (p, 1)(x)
=
12 +
1
1!
8(x − 1) +
12 + 8(x − 1) + 2(x − 1)2 + (x − 1)3
=
(6.30) Definition
=
1
2!
4(x − 1)2 +
1
3!
6(x − 1)3 +
1
4!
0x 4
=
12 + (8x − 8) + (2x 2 − 4x + 2) + (x 3 − 3x 2 + 3x − 1)
5 + 7x − x 2 + x 3
=
p(x).
Sei f : D → R eine Funktion und a ∈ D ein Punkt, an dem f beliebig oft
differenzierbar ist. Dann bezeichnet man die von x ∈ R abhängige Reihe
τ( f , a)(x)
=
∞
X
1
n=0
n!
f (n) (a)(x − a)n
als Taylorreihe von f im Punkt a.
—–
153
—–
Die Definition enthält keine Aussage darüber, für welche x ∈ R die Reihe konvergiert. Wir werden zu einem späteren
Zeitpunkt allgemeine Aussagen darüber herleiten, wie die Menge dieser x ∈ R aussehen kann. In der Tat ist es
möglich, dass Konvergenz nur für x = a vorliegt, und dass die Reihe für alle x 6= a divergiert. Für x = a konvergiert
die Reihe immer, denn wegen (a − a)n = 0 für n > 0 sind fast alle Reihenglieder gleich Null. Nur der erste Term ist
wegen
1
0!
f (0) (a0(a − a)0 = f (a) möglicherweise ungleich Null.
Sei f : D → R eine Funktion und a ∈ D ein innerer Punkt von a. Man
(6.31) Definition
bezeichnet f als analytisch in a, wenn eine Folge (an )n∈N und eine Umgebung ]a − ", a + "[ ⊆
D von a existieren, so dass die Reihe
∞
X
=
p(x)
an (x − a)n
n=0
für alle x ∈ ]a − ", a + "[ konvergiert und die Gleichung p(x) = f (x) erfüllt ist. Man bezeichnet
eine von x abhängende Reihe der Form p(x) als Potenzreihe mit Entwicklungspunkt a.
Wir werden später sehen, dass eine in a analytische Funktion f auch in a differenzierbar ist. Die Ableitung f 0 ist
dann ebenfalls analytisch, und es gilt
f 0 (x)
=
∞
X
nan (x − a)n−1
für alle
x ∈ ]a − ", a + "[ .
n=1
Durch vollständige Induktion folgt daraus, dass eine analytische Funktion beliebig oft differenzierbar ist, und dass
für alle k ∈ N0 und x ∈ ]a − ", a + "[ jeweils
f (k) (x)
=
∞
X
n(n − 1)...(n − k + 1)an (x − a)n−k
=
∞
X
n!
n=k
(n − k)!
n=k
an (x − a)n−k
gilt.
Wir erhalten f (k) (a) = k!ak für alle k ∈ N0 und somit
τ( f , a)(x)
=
∞
X
f (n) (a)
n=0
n!
(x − a)n
=
∞
X
n!
n=0
n!
an (x − a)n
=
∞
X
an (x − a)n
=
f (x).
n=0
Daraus folgt unmittelbar: Ist eine Funktion f in einem Punkt a analytisch, dann kann sie in einer Umgebung von
a immer durch ihre Taylorreihe dargestellt werden. In der Funktionentheorie-Vorlesung werden wir ein Kriterium
formulieren, mit dem sich die Analytizität vieler Funktionen nachweisen lässt: Eine Funktion f : D → R mit Definitionsbereich D ⊆ R ist in a ∈ D genau dann analytisch, wenn sie sich in einer Umgebung von a in der Menge C der
komlexen Zahlen zu einer komplex differenzierbaren Funktion fortsetzen lässt.
Aus diesem Kriterium wird sich zum Beispiel leicht ergeben, dass alle rationalen Funktionen auf ihrem gesamten
Definitionsbereich analytisch sind. In einfachen Fällen lässt sich das auch durch direktes Nachrechnen überprüfen.
Zeigen wir zum Beispiel, dass die Funktion
f : R \ {1} → R ,
—–
154
x 7→
—–
1
x −1
im Punkt x = 0 analytisch ist. Es gilt
f 0 (x) = −
1
(x
2
f 00 (x) =
,
− 1)2
(x
f 000 (x) = −
,
− 1)3
6
,
(x − 1)4
und durch einen einfachen Induktionsbeweis bestätigt man die Formel
f (n) (x) = (−1)n
n!
n ∈ N0 .
für alle
(x − 1)n+1
Insbesondere gilt f (n) (0) = (−1)n n!/(−1)n+1 = −n!, somit ist die Taylorreihe von f an der Stelle 0 gegeben durch
τ( f , 0)(x)
∞
X
f (n) (0)
=
n!
n=0
=
xn
∞
X
−n!
n=0
n!
=
xn
−
∞
X
x n.
n=0
Es handelt sich also um die geometrische Reihe in x. Für alle x ∈ R mit |x| < 1 gilt
∞
X
1
1
−
xn = −
=
= f (x) ,
1
−
x
x
−
1
n=0
also ist f auf dem Intervall ]−1, 1[ tatsächlich durch eine Potenzreihe darstellbar. Für Polynomfunktionen ist wegen
Folgerung (6.29) ohnehin klar, dass sie in jedem Punkt ihres Definitionsbereichs durch eine Potenzreihe (mit endlich
vielen Termen ungleich Null) darstellbar sind.
Es kann gezeigt werden, dass auch die Exponentialfunktion exp : R → R+ analytisch ist. Sie kann auf ganz R durch
ihre Taylorreihe dargestellt werden. Wegen exp0 = exp gilt exp(n) (0) = exp(0) = 1 für alle n ∈ N0 . Es gilt also
exp(x)
=
τ(exp, 0)(x)
∞
X
exp(n) (0)
=
n!
n=0
(x − 0)n
∞
X
xn
=
n=0
für alle x ∈ R.
n!
Im Rahmen der Integralrechnung werden wir zwei weitere Funktionen sin, cos : R → [−1, 1] einführen, die Sinusund Kosinusfunktion. Wie wir sehen werden, gilt sin0 (x) = cos(x) und cos0 (x) = − sin(x), außerdem sin(0) = 0
und cos(0) = 1. Durch vollständige Induktion beweist man leicht für alle n ∈ N0 die Gleichungen
sin(4n) (0) = 0
sin(4n+1) (0) = 1
,
cos(4n) (0) = 1
cos(4n+1) (0) = 0
,
sin(4n+2) (0) = 0
,
sin(4n+3) (0) = −1
,
cos(4n+2) (0) = −1
,
,
cos(4n+3) (0) = 0.
,
Sowohl die Sinus- als auch die Kosinusfunktion ist auf ganz R analytisch. Ihre Entwicklungen als Taylorreihen sind
gegeben durch
sin(x)
=
τ(sin, 0)(x)
∞
X
sin(n) (0)
=
n!
n=0
lim
n→∞
n
X
k=0
‚
sin(4k) (0)
(4k)!
x
4k
+
lim
n→∞
lim
n→∞
n
X
k=0
(x − 0)n
sin(4k+1) (0)
(4k + 1)!
n X
k=0
(4k + 1)!
(2(2k) + 1)!
lim
n→∞
4k+1
1
(−1)2k
‚
x
x
=
(−1)k
k=0
(2k + 1)!
n→∞
+
x 2k+1
—–
n
X
sin(k) (0)
k!
k=0
sin(4k+2) (0)
(4k + 2)!
(−1)
x 4k+1 +
2(2k)+1
2n+1
X
+
lim
(4k + 3)!
x
4k+2
x 4k+3
(−1)2k+1
(2(2k + 1) + 1)!
=
155
+
=
lim
n→∞
sin(4k+3) (0)
(4k + 3)!
x
Œ
x
(2n + 1)!
n=0
x 2n+1
4n+3
X
k=0
sin(k) (0)
k!
Œ
=
2(2k+1)+1
∞
X
(−1)n
—–
xn
=
4k+3
=
xn
=
und
=
cos(x)
τ(cos, 0)(x)
∞
X
cos(n) (0)
=
n!
n=0
=
lim
n→∞
n
X
k=0
‚
cos(4k) (0)
(4k)!
x
4k
+
lim
lim
n→∞
k=0
cos(4k+1) (0)
(4k + 1)!
n X
1
n→∞
n
X
(x − 0)n
‚
k=0
(4k)!
(−1)2k
(2(2k))!
lim
n→∞
x
x
x
4k
2(2k)
2n+1
X
(−1)k
k=0
(2k)!
4k+1
+
+
x 2k
=
+
lim
n→∞
n
X
cos(k) (0)
k=0
cos(4k+2) (0)
(4k + 2)!
(−1)
(4k + 2)!
x
4k+2
(−1)2k+1
x
+
lim
n→∞
cos(4k+3) (0)
(4k + 3)!
4n+3
X
k=0
cos(k) (0)
k!
xn
Œ
x
4k+3
=
=
x
2(2k+1)
∞
X
(−1)n
n=0
4k+2
=
Œ
(2(2k + 1))!
=
k!
xn
(2n)!
=
x 2n
und diese Reihendarstellungen sind wie bei der Exponentialfunktion für alle x ∈ R gültig.
Zum Schluss sei noch angemerkt, dass eine Funktion in einem Punkt beliebig oft differenzierbar sein kann, ohne
dass sie dort analytisch ist. In den Übungen werden wir zeigen, dass die Funktion

€ Š
exp − 1
für x > 0
x
f : R −→ R , x 7→

0
für x ≤ 0
im Punkt x = 0 genau diese Eigenschaften besitzt.
—–
156
—–
§ 7.
Integralrechnung
Inhaltsübersicht
In der Schule definiert man das Integral einer nicht-negativen Funktion durch die Fläche unter dem Funktionsgraphen.
Diese Definition können wir hier nicht unmittelbar verwenden, weil wir den Begriff des Flächeninhalts für krummlinig
begrenzte Flächen (noch) nicht zur Verfügung haben. Statt dessen werden wir das Integral zunächst approximieren, in
dem wir die Fläche unter dem Funktionsgraphen durch Flächeninhalte von Rechtecken ausschöpfen bzw. überdecken.
Man spricht in diesem Zusammenhang von Unter- bzw. Obersummen. Wenn sich diese Unter- und Obersummen beliebig
nahe kommen, nennt man die Funktion Riemann-integrierbar. Das Supremum der Untersummen, das in diesem Fall mit
dem Infimum der Obersummen zusammenfällt, wird das Riemann-Integral der Funktion genannt.
Rb
Aus der Schulmathematik ist auch bereits bekannt, dass ein Integral a f (x) d x durch Stammfunktionen berechnet
werden kann: Es stimmt mit der Differenz F (b) − F (a) überein, wobei F eine differenzierbare Funktion mit F 0 = f bezeichnet. Dieser Zusammenhang ist als Hauptsatz der Differential- und Integralrechnung bekannt und wird im zweiten
Abschnitt dieses Kapitels bewiesen. Direkt aus dem Hauptsatz ergeben sich auch zwei wichtige, aus der Schule bekannte
Integrationsregeln, nämlich die Substitutionsregel und die partielle Integration. Die Anwendung dieser Regeln werden
wir anhand einiger Beispiele nachvollziehen.
Im letzten Abschnitt verwenden wir das Riemann-Integral, um die Bogenlänge eines Funktionsgraphens zu definieren.
Dies wiederum bildet die Grundlage zur Definition der trigonometrischen Funktionen (Sinus, Konsinus, Tangens) und
ihrer Umkehrfunktionen. Wie wir sehen werden, ermöglichen letztere die Integration beliebiger rationaler Funktionen.
(I) Definition des Riemann-Integrals
Im gesamten Abschnitt bezeichnet [a, b] ⊆ R ein endliches, abgeschlossenes Intervall positiver Länge, mit a, b ∈ R
und a < b. Eine endliche (eventuell auch leere) Teilmenge Z = {x 1 , ..., x n−1 } ⊆ ]a, b[ bezeichnen wir als Zerlegung
(oder Unterteilung) von [a, b]. Dabei gehen wir davon stets davon aus, dass die Zahlen x k so angeordnet sind,
dass x k < x k+1 für 1 ≤ k < n − 1 erfüllt ist. Außerdem setzen wir stets x 0 = a und x n = b. Für die Menge aller
Zerlegungen von [a, b] verwenden wir die Bezeichung Z(a, b).
(7.1) Definition
Sei f : [a, b] → R eine beschränkte Funktion, und sei Z = {x 1 , ..., x n−1 }
eine Zerlegung von [a, b]. Sei x 0 = a und x n = b. Für jedes k mit 0 ≤ k < n definieren wir
ck = inf f ([x k , x k+1 ]) und dk = sup f ([x k , x k+1 ]). Dann bezeichnet man
S f− (Z )
=
n−1
X
ck (x k+1 − x k )
als Untersumme
dk (x k+1 − x k )
als Obersumme
k=0
und
S f+ (Z )
=
n−1
X
k=0
von f bezüglich der Zerlegung Z .
—–
157
—–
Wir illustrieren den Begriff der Unter- und Obersumme am Beispiel der Funktion f : [0, 1] → R gegeben durch
x 7→ x 2 . Für jedes n ∈ N betrachten wir die Zerlegung
{ 1n , 2n , ..., n−1
}.
n
=
Zn
Zunächst berechnen wir die Untersumme. Weil f streng monoton wachsend ist, gilt inf f ([ nk , k+1
]) = f ( nk ) =
n
€ k Š2
n
.
Verwenden wir die Summenformel für die ersten n Quadratzahlen
n
X
k2
1
n(n + 1)(2n + 1)
6
=
,
k=1
so erhalten wir für die Untersumme den Wert
S f− (Zn )
n−1
X
=
f ( nk )
n−1 € Š
X
k 2
=
n
k=0
1
n
1
n3
=
k=0
n−1
X
k2
=
1
n3
· 16 (n − 1)n(2n − 1)
=
1
(1 − 1n )(2 − 1n ).
6
k=0
Nun bestimmen wir noch die Obersumme. Auf Grund des streng monotonen Wachstums der Funktion f gilt hier
€
Š2
]) = f ( k+1
) = k+1
und somit
sup f ([ nk , k+1
n
n
n
S f+ (Zn )
=
n−1
X
f ( k+1
)
n
n € Š
X
k 2
=
n
1
n
=
1
n3
k=1
k=0
n
X
k2
1
n3
=
· 61 n(n + 1)(2n + 1)
=
1
(1 + 1n )(2 + 1n ).
6
k=1
Wir bemerken, dass sich für n → ∞ der Wert der Untersumme von unten, der Wert der Obersumme von oben gegen
den exakten Wert
1
6
·1·2=
1
3
des Integrals konvergiert.
(7.2) Definition Sei f : [a, b] → R eine beschränkte Funktion. Dann bezeichnet man
b
Z
f (x) d x
o
n
= sup S f− (Z ) Z ∈ Z(a, b)
bzw.
aÆ
bÆ
Z
f (x) d x
n
o
inf S f+ (Z ) Z ∈ Z(a, b)
=
a
als Unter- bzw. Oberintegral der Funktion f . Stimmen Unter- und Oberintegral von f überein,
dann bezeichnet man f als Riemann-integrierbar und nennt
b
Z
f (x) d x
=
Z
a
b
f (x) d x
aÆ
=
bÆ
Z
f (x) d x
a
das Riemann-Integral der Funktion f .
Man beachte, dass Unter- und Oberintegral bei einer beschränkten Funktion f stets endliche reelle Zahlen sind.
Sind nämlich c, d ∈ R Werte mit c ≤ f (x) ≤ d für alle x ∈ [a, b], und ist Z = {x 1 , ..., x n−1 } eine Zerlegung von
Pn
[a, b], dann können wir die Unter- und Obersummen gegeben durch S f− (Z ) = k=1 ck (x k − x k−1 ) und S f+ (Z ) =
Pn
k=1 dk (x k − x k−1 ) wegen c ≤ ck ≤ dk ≤ d durch c(b − a) nach unten und durch d(b − a) nach oben abschätzen.
—–
158
—–
Ist [a, b] ein endliches, abgeschlossenes Intervall, Z = {x 1 , ..., x n−1 } eine Zerlegung, und setzen wir x 0 = a, x n = b,
dann bezeichnet man die Zahl
δ(Z )
=
max { x k+1 − x k | 0 ≤ k < n}
als Feinheit der Zerlegung.
Eine Zerlegung Z 0 heißt Verfeinerung von Z , wenn Z 0 ⊇ Z gilt.
Sei f : [a, b] → R eine Funktion und Z eine Zerlegung wie oben. Ein
Tupel v = (v0 , ..., vn−1 ) von Punkten mit vk ∈ x k , x k+1 für 0 ≤ k < n nennen wir einen
(7.3) Definition
Auswahlvektor zur Zerlegung Z . Die Zahl
R f (Z , v)
n−1
X
=
f (vk )(x k+1 − x k )
k=0
wird die Riemannsche Summe von f zu Z und v genannt.
Wir haben weiter vorne im Text die Unter- und Obersummen von f : [0, 1] → R, x 7→ x 2 zu den Zerlegungen Zn =
} berechnet. Sowohl S f− (Zn ) als auch S f+ (Zn ) sind auch Riemannsche Summen bezüglich Zn , nämlich
{ 1n , 2n , ..., n−1
n
R1
die zu den Auswahlvektoren (0, 1n , ..., n−1
) und ( 1n , ..., n−1
, 1). Alternativ könnte man aber das Integral 0 x 2 d x auch
n
n
durch einen Riemannsche Summe berechnen, deren Auswahlvektor aus den Mittelpunkten der Teilintervalle besteht,
also
1
=
vn
,
3
2n 2n
, ...,
2n − 1
.
2n
Mit Hilfe der Summenformeln
n
X
k = 21 n(n + 1)
n
X
und
k=1
k2 = 16 n(n + 1)(2n + 1)
k=1
erhalten wir hier die Werte
R f (Zn , vn )
=
n−1 €
X
Š € k+1 k Š
f 2k+1
−n
2n
n
=
k=0
=
1
n3
n−1
X
k=1
k2 +
n−1 €
X
2k+1
2n
Š2
1
n
1
4n3
=
k=0
1
n3
n−1
X
k+
n−1
4n3
=
1
6
=
1
n3
· 16 (n − 1)n(2n + 1) +
n−1 €
X
Š
4k2 + 4k + 1
k=0
1
n3
k=1
· 12 (n − 1)n +
n−1
4n3
€
Š€
Š n−1 n−1
1 − 1n 2 − 1n +
+
.
2n2
4n3
Auch hier nähert sich Wert für n → ∞ dem exakten Wert
1
3
des Integrals. Wir werden nun den Zusammenhang
zwischen diesen drei verschiedenen Summentypen genauer untersuchen.
—–
159
—–
(7.4) Lemma Sei f : [a, b] → R eine beschränkte Funktion, und seien Z , Z 0 Zerlegungen von
[a, b], wobei Z 0 eine Verfeinerung von Z ist. Dann gilt
S f− (Z 0 )
Beweis:
S f− (Z )
≥
S f+ (Z 0 )
und
S f+ (Z ).
≤
Sei Z = {x 1 , ..., x m−1 } und Z 0 = { y1 , ..., yn−1 }. Wegen Z ⊆ Z 0 gibt es für jedes k mit 1 ≤ k < m ein
`k ∈ {1, ..., n − 1} mit x k = y`k . Außerdem definieren wir x 0 = y0 = a, x m = yn = b sowie `0 = 0 und `m = n.
Für 0 ≤ k < m sei ck = sup f ([x k , x k+1 ]), und für 0 ≤ ` < n setzen wir d` = sup f ([ y` , y`+1 ]). Für jedes ` mit
`k ≤ ` < `k+1 gilt dann [ y` , y`+1 ] ⊆ [x k , x k+1 ] und folglich d` ≤ ck . Wir erhalten
+
0
S f (Z )
n−1
X
=
d` ( y`+1 − y` )
−1
m−1
X
X `k+1
=
−1
m−1
X `k+1
X
d` ( y`+1 − y` )
≤
k=0 `=`k
`=0
ck ( y`+1 − y` )
=
k=0 `=`k
m−1
X
ck (x k+1 − x k )
S f+ (Z ).
=
k=0
Der Beweis der anderen Ungleichung läuft völlig analog.
ƒ
(7.5) Folgerung Für jede beschränkte Funktion f : [a, b] → R gilt
Z
b
f (x) d x
f (x) d x.
≤
aÆ
Beweis:
bÆ
Z
a
Sei " ∈ R+ vorgegeben. Nach Definition von Unter- und Oberintegral gibt es Zerlegungen Z und Z 0 mit
−
S f (Z ) >
Z
b
f (x) d x − "
und
+
0
S f (Z ) <
bÆ
Z
aÆ
f (x) d x + ".
a
Setzen wir Z 00 = Z ∪ Z 0 , dann erhalten wir mit (7.4) die Ungleichungen S f− (Z 00 ) ≥ S f− (Z ) und S f+ (Z 00 ) ≤
S f+ (Z 0 ). Da außerdem S f− (Z 00 ) ≤ S f+ (Z 00 ) gilt, erhalten wir insgesamt die Abschätzung
bÆ
Z
f (x) d x −
a
Z
b
f (x) d x
>
(S f+ (Z 0 ) − ") − (S f− (Z ) + ")
≥
aÆ
(S f+ (Z 00 ) − ") − (S f− (Z 00 ) + ")
≥
−2".
Da " ∈ R+ beliebig klein gewählt werden kann, folgt daraus die Behauptung.
—–
160
—–
ƒ
(7.6) Lemma Sei f : [a, b] → R beschränkt und Z eine Zerlegung von [a, b].
(i) Für jeden Auswahlvektor v bezüglich Z gilt
S f− (Z )
R f (Z , v)
≤
≤
S f+ (Z ).
(ii) Für jedes " ∈ R+ gibt es Auswahlvektoren v und w mit
R f (Z , v) < S f− (Z ) + "
R f (Z , w) > S f+ (Z ) − ".
und
Ober- und Untersummen lassen sich also beliebig genau durch Riemannsche Summen
approximieren.
Beweis:
zu (i)
Sei Z = {x 1 , ..., x n−1 } und v = (v0 , ..., vn−1 ), außerdem x 0 = a und x n = b. Für 0 ≤ k < n sei
ck = inf f ([x k , x k+1 ]) und dk = sup f ([x k , x k+1 ]). Es gilt dann ck ≤ f (vk ) ≤ dk für 0 ≤ k < n, und daraus folgt
sowohl
S f− (Z )
n−1
X
=
ck (x k+1 − x k )
≤
k=0
n−1
X
f (vk )(x k+1 − x k )
=
R f (Z , v)
k=0
als auch
R f (Z , v)
=
n−1
X
f (vk )(x k+1 − x k )
n−1
X
≤
k=0
zu (ii)
dk (x k+1 − x k )
=
S f+ (Z ).
k=0
Sei δ ∈ R+ beliebig vorgegeben. Nach Definition von Infimum und Supremum gibt es für jedes k mit
0 ≤ k ≤ n − 1 jeweils vk , w k ∈ [x k , x k+1 ] mit f (vk ) < ck + δ und f (w k ) > dk − δ. Setzen wir v = (v0 , ..., vn−1 ) und
w = (w0 , ..., w n−1 ), dann folgt
R f (Z , v)
=
n−1
X
f (vk )(x k+1 − x k )
<
k=0
n−1
X
n−1
X
(ck + δ)(x k+1 − x k )
=
k=0
ck (x k+1 − x k ) +
k=0
n−1
X
δ(x k+1 − x k )
=
S f− (Z ) + δ(b − a)
k=0
und ebenso
R f (Z , w)
=
n−1
X
f (w k )(x k+1 − x k )
n−1
X
(dk − δ)(x k+1 − x k )
>
k=0
n−1
X
k=0
dk (x k+1 − x k ) −
=
k=0
n−1
X
δ(x k+1 − x k )
=
S f+ (Z ) − δ(b − a).
k=0
Wählen wir δ ∈ R+ so klein, dass δ(b − a) < " gilt, dann sind die gewünschten Abschätzungen also erfüllt.
—–
161
—–
ƒ
(7.7) Lemma Sei f : [a, b] → R eine beschränkte Funktion und Z eine Zerlegung von [a, b].
Dann gibt es für jedes " ∈ R+ ein δ ∈ R+ , so dass für jede Zerlegung Z 0 mit δ(Z 0 ) < δ jeweils
die beiden Ungleichungen
0 ≤ S f+ (Z 0 ) − S f+ (Z ∪ Z 0 ) < "
Beweis:
0 ≤ S f− (Z ∪ Z 0 ) − S f− (Z 0 ) < "
und
erfüllt sind.
Sei Z 0 = {x 1 , ..., x m−1 } und Z ∪ Z 0 = { y1 , ..., yn−1 }, wobei die Punkte x k , y` wie üblich der Größe nach
geordnet sind. Wieder setzen wir x 0 = y0 = a und x m = yn = b. Wegen Z 0 ⊆ Z ∪ Z 0 gibt es für jedes k ∈ {0, ..., m}
ein `k ∈ {0, ..., n} mit x k = y`k , insbesondere ist `0 = 0 und `m = n. Sei nun ck = sup f ([x k , x k+1 ]) für 0 ≤ k < m
und d` = sup f ([ y` , y`+1 ]) für 0 ≤ ` < n. Dann gilt nach Definition der Obersumme
S f+ (Z 0 ) =
m−1
X
und S f+ (Z ∪ Z 0 ) =
ck (x k+1 − x k )
n−1
X
d` ( y`+1 − y` ).
`=0
k=0
Die erste Summe kann aufgeteilt werden in
S f+ (Z 0 )
m−1
X
=
ck (x k+1 − x k )
−1
m−1
X `k+1
X
=
ck ( y`+1 − y` ).
k=0 `=`k
k=0
Außerdem gilt für `k < ` < `k+1 jeweils [ y` , y`+1 ] ⊆ [x k , x k+1 ] und somit d` ≤ ck für diese `. Es folgt
S f+ (Z 0 ) − S f+ (Z ∪ Z 0 )
=
−1
m−1
X `k+1
X
ck ( y`+1 − y` ) −
−1
m−1
X `k+1
X
d` ( y`+1 − y` )
k=0 `=`k
k=0 `=`k
=
−1
m−1
X `k+1
X
(ck − d` )( y`+1 − y` )
≥
0.
k=0 `=`k
Setzen wir t = |Z |, dann entsteht Z ∪ Z 0 aus Z 0 durch Hinzunahme von höchtens t Punkten, und diese Hinzunahme führt zur Entstehung von höchstens 2t neuen Intervallen. Für höchstens 2t Werte von ` gilt also [ y` , y`+1 ] (
[x k , x k+1 ], wobei k die eindeutig bestimmte Zahl k mit `k ≤ ` < `k+1 bezeichnet, und dmait ist ck = d` für höchstens
2t Werte von ` nicht erfüllt. Setzen wir nun s = sup{| f (x)| | x ∈ [a, b]}, und bezeichnen mit δ − 1 die Feinheit der
Zerlegung Z 0 , dann folgt
| y`+1 − y` |
≤
|x k+1 − x k |
≤
δ1
für alle ` und die zugehörigen k, und wir erhalten insgesamt die Abschätzung
S f+ (Z 0 ) − S f+ (Z ∪ Z 0 )
≤
2stδ1 .
Genau nach demselben Schema beweist man die Ungleichungen
0
≤
S f− (Z ∪ Z 0 ) − S f− (Z 0 )
≤
2stδ1 .
Sei nun " ∈ R+ vorgegeben. Wählen wir δ ∈ R+ so klein, dass 2stδ < " gilt, dann sind also für jede Zerlegung Z 0
mit δ(Z 0 ) < δ die gewünschten Abschätzungen erfüllt.
—–
ƒ
162
—–
(7.8) Satz Sei f : [a, b] → R beschränkt. Dann sind folgenden Aussagen äquivalent.
(i) Die Funktion f ist Riemann-integrierbar.
(ii) Für jedes " ∈ R+ gibt es eine Zerlegung Z mit S f+ (Z ) − S f− (Z ) < ".
(iii) Für jedes " ∈ R gibt es ein δ ∈ R+ , so dass für jede Unterteilung Z mit Feinheit δ(Z ) < δ
jeweils S f+ (Z ) − S f− (Z ) < " erfüllt ist.
(iv) Es gibt eine Zahl u ∈ R mit der folgenden Eigenschaft: Für jedes " ∈ R+ gibt es ein
δ ∈ R+ , so dass |R f (Z , v) − u| < " für jede Zerlegung Z mit δ(Z ) < δ und jeden
Auswahlvektor v zu Z erfüllt ist.
Sind diese äquivalenten Bedingungen erfüllt, dann stimmt die Zahl u in Aussage (iv) mit dem
Rb
Integral a f (x) d x überein.
Beweis:
„(i) ⇒ (ii)“ Sei " ∈ R+ vorgegeben. Nach Definition des Unterintegrals gibt es eine Zerlegung Z mit
Z b
S f− (Z )
>
aÆ
f (x) d x − 21 ".
Ebenso gibt es nach Definition des Oberintegrals eine Zerlegung Z 0 mit
Z bÆ
S f+ (Z 0 )
<
a
f (x) d x + 21 ".
Weil f Riemann-integrierbar ist, stimmen Unter- und Oberintegral mit dem Riemann-Integral überein. Ersetzen
wir Z und Z 0 durch die feinere Zerlegung Z 00 = Z ∪ Z 0 , dann erhalten wir mit (7.4) insgesamt S f− (Z 00 ) >
Rb
Rb
1
+
00
"
und
S
(Z
)
<
f (x) d x + 21 ". Es folgt
f
(x)
d
x
−
f
2
a
a
!
!
Z b
Z b
S f+ (Z 00 ) − S f− (Z 00 )
f (x) d x + 12 "
<
a
−
a
f (x) d x − 12 "
=
".
„(ii) ⇒ (i)“ Sei " ∈ R+ vorgegeben, und sei Z eine Zerlegung mit der unter (ii) angegebenen Eigenschaft. Nach
Definition von Ober- und Unterintegral gilt
Z b
−
S f (Z )
f (x) d x
≤
bÆ
Z
f (x) d x
≤
aÆ
≤
S f+ (Z )
≤
S f− (Z ) + ".
a
Weil " ∈ R+ beliebig klein gewählt werden kann, müssen Unter- und Oberintegral übereinstimmen. Also ist f
Riemann-integrierbar.
„(i) ⇒ (iii)“ Sei " ∈ R+ vorgegeben und u =
Rb
a
f (x) d x. Auf Grund der Voraussetzung und nach Definition des
Unterintegrals gilt
u
Z
=
f (x) d x
sup S f− (Z ) ,
=
Z
aÆ
somit finden wir eine Zerlegung Z1 mit S f (Z1 ) > u −
−
1
".
4
Genauso findet man eine Zerlegung Z2 mit S f+ (Z2 ) <
u + 14 ". Setzen wir Z = Z1 ∪ Z2 , dann ist Z eine gemeinsame Verfeinerung von Z1 und Z2 . Mit (7.4) erhält man
die Abschätzungen
S f− (Z )
≥
—–
S f− (Z1 )
163
>
—–
u − 41 "
und
S f+ (Z )
S f+ (Z2 )
≤
u + 14 ".
<
Mit (7.7) wählen wir nun zu 14 " und der Zerlegung Z ein passendes δ. Dann erfüllt jede Zerlegung Z 0 mit δ(Z 0 ) < δ
die Abschätzung
S f+ (Z 0 ) − S f− (Z 0 )
S f+ (Z ∪ Z 0 ) + 41 " − S f− (Z ∪ Z 0 ) − 41 "
≤
S f+ (Z ) + 41 " − S f− (Z ) − 14 "
„(iii) ⇒ (iv)“ Sei u =
R bÆ
a
(u + 41 " + 14 ") − (u − 14 " − 41 ")
<
≤
=
".
f (x) d x und " ∈ R+ beliebig vorgegeben. Nach (iii) gibt es ein zu " gehörendes δ ∈ R+
mit der dort beschriebenen Eigenschaft. Ist nun Z eine beliebige Zerlegung von [a, b] mit δ(Z ) < δ, dann gilt
S f+ (Z ) − S f− (Z )
<
".
Für jeden Auswahlvektor v bezüglich Z gelten nach Lemma (7.6) die Ungleichungen S f− (Z ) ≤ R f (Z , v) ≤ S f+ (Z ),
und wegen (7.5) gilt
Z
−
S f (Z )
b
f (x) d x
≤
≤
S f+ (Z ).
≤
u
aÆ
Insgesamt folgt daraus
R (Z , v) − u
f
≤
S f+ (Z ) − S f− (Z )
<
".
„(iv) ⇒ (i)“ Sei " ∈ R+ beliebig vorgegeben, und seien u ∈ R und δ ∈ R+ die zu 41 " gehörenden Werte, wie unter
(iv) angegeben. Sei Z eine Zerlegung von [a, b] mit δ(Z ) < δ. Nach Lemma (7.6) gibt es Auswahlvektoren v, w
bezüglich Z mit
R f (Z , v)
<
S f− (Z ) + 14 "
und
R f (Z , w)
>
S f+ (Z ) − 41 ".
Nach (iv) gilt außerdem R f (Z , v) > u − 41 " und R f (Z , w) < u + 14 ". Wegen
S f− (Z )
Z
b
f (x) d x
≤
bÆ
Z
f (x) d x
und
aÆ
≤
S f+ (Z )
a
erhalten wir insgesamt
bÆ
Z
b
Z
f (x) d x
≤
S f+ (Z ) − S f− (Z )
R f (Z , w) + 41 " − R f (Z , v) − 41 "
=
R f (Z , w) − R f (Z , v) + 12 "
f (x) d x −
a
<
aÆ
(u + 41 ") − (u − 14 ") + 21 "
=
<
".
Weil " ∈ R+ beliebig klein gewählt werden kann, folgt daraus die Übereinstimmung von Unter- und Oberintegral.
Die Funktion f ist also Riemann-integrierbar.
Schließlich bemerken wir noch, dass als Nebenresultat des Beweises von „(iii) ⇒ (iv)“ gezeigt wurde, dass das
Oberintegral von f mit dem Wert u in Aussage (iv) identisch ist. Im Falle der Riemann-Integrierbarkeit von f gilt
Rb
also u = a f (x) d x.
ƒ
—–
164
—–
Wir leiten nun einige Rechenregeln für das Riemann-Integral her.
(7.9) Satz
Seien f , g : [a, b] → R Riemann-integrierbare Funktionen und λ ∈ R. Dann sind
auch f + g und λ f Riemann-integrierbar. Außerdem gilt
b
Z
( f + g)(x) d x =
(i)
a
f (x) d x +
(λ f )(x) d x = λ
(ii)
f (x) d x
a
b
Z
f (x) d x ≤
(iii) Aus f ≤ g folgt
S f−+g (Z )
b
Z
g(x) d x.
a
Beweis:
g(x) d x
a
b
Z
a
b
Z
a
b
Z
b
Z
a
Zur Vorbereitung bemerken wir, dass für jede Zerlegung Z = {x 1 , ..., x n−1 } von [a, b] jeweils
zu (i)
≥ S f (Z ) + S g− (Z ) und S f++g (Z ) ≤ S f+ (Z ) + S g+ (Z ) gilt. Für jedes k mit 0 ≤ k < n ist nämlich
−
inf f ([x k , x k+1 ]) + inf g([x k , x k+1 ]) eine untere Schranke von ( f + g)([x k , x k+1 ]), denn für jedes x ∈ [x k , x k+1 ]
gilt ( f + g)(x) = f (x) + g(x) ≥ inf f ([x k , x k+1 ]) + inf g([x k , x k+1 ]). Daraus folgt inf ( f + g)([x k , x k+1 ]) ≥
inf f ([x k , x k+1 ]) + inf g([x k , x k+1 ]), und Summation über alle k ergibt S f−+g (Z ) ≥ S f− (Z ) + S g− (Z ). Der Beweis der zweiten Ungleichung läuft analog.
Sei nun " ∈ R+ vorgegeben. Weil f und g nach Voraussetzung Riemann-integrierbar Funktionen sind, gibt es nach
(7.8) (ii) Zerlegungen Z und Z 0 von [a, b] mit S f+ (Z ) − S f− (Z ) < 21 " und S g+ (Z 0 ) − S g− (Z 0 ) < 21 ". Ersetzen wir
Z und Z 0 durch die feinere Zerlegung Z 00 = Z ∪ Z 0 , dann bleiben diese Ungleichungen wegen (7.4) erhalten. Es
folgt
S f++g (Z 00 ) − S f−+g (Z 00 )
≤
S f+ (Z 00 ) + S g+ (Z 00 ) − S f− (Z 00 ) + S g− (Z 00 )
S f+ (Z 00 ) − S f− (Z 00 ) + S g+ (Z 00 ) − S g− (Z 00 )
<
1
"
2
+ 12 "
=
Wegen (7.8) (ii) ist f + g also Riemann-integrierbar. Außerdem gilt sowohl
Z b
S f− (Z 00 ) + S g− (Z 00 )
≤
S f−+g (Z 00 )
( f + g)(x) d x
≤
≤
S f++g (Z 00 )
≤
=
".
S f+ (Z 00 ) + S g+ (Z 00 )
a
als auch
−
S f (Z
00
b
Z
) + S g− (Z 00 )
f (x) d x +
≤
b
Z
a
g(x) d x
≤
S f+ (Z 00 ) + S g+ (Z 00 ).
a
also
Z
b
( f + g)(x) d x −
a
b
Z
f (x) d x +
a
b
Z
a
!
g(x) d x ≤
S f++g (Z 00 ) − S f−+g (Z 00 )
Da " ∈ R+ beliebig klein gewählt werden kann, stimmen die beiden Integrale überein.
—–
165
—–
<
".
zu (ii) Hier beschränken wir uns auf den Fall, dass λ < 0 ist. Dies ist im Vergleich zu λ > 0 der problematischere
Teil, weil durch die Multiplikation mit λ die Ungleichungen umgedreht werden. Der Fall λ = 0 ist trivial, weil
das Riemann-Integral der konstanten Nullfunktion offenbar durch Unter- und Obersumme Null abgeschätzt werden
kann.
Sei also λ < 0, außerdem µ = −λ ∈ R+ und " ∈ R+ beliebig vorgegeben. Auf Grund der Riemann-Integrierbarkeit
"
.
µ
gibt es eine Zerlegung Z mit S f+ (Z ) − S f− (Z ) <
Sei Z = {x 1 , ..., x n−1 }, und seien ck = inf f ([x k , x k+1 ]),
dk = sup f ([x k , x k+1 ]), jeweils für 0 ≤ k < n. Dann sind Unter- und Obersummen gegeben durch
S f− (Z ) =
n
X
ck (x k+1 − x k )
S f+ (Z ) =
und
n
X
dk (x k+1 − x k ).
k=0
k=0
Wegen λ < 0 gilt λck = sup (λ f )([x k , x k+1 ]) und λdk = inf (λ f )([x k , x k+1 ]). Daraus folgt unmittelbar Sλ−f (Z ) =
λS f+ (Z ) und Sλ+f (Z ) = λS f− (Z ). Wir erhalten
Sλ+f (Z ) − Sλ−f (Z )
=
+
−
λ(S f (Z ) − S f (Z ))
<
λ· −
"
µ
=
".
Also ist λ f Riemann-integrierbar. Aus den beiden Ungleichungen
Sλ−f (Z )
b
Z
(λ f )(x) d x
≤
≤
Sλ+f (Z )
≤
λS −
f (Z )
a
und
Sλ−f (Z )
=
λS +
(Z )
f
≤
λ
b
Z
f (x) d x
Sλ+f (Z )
=
a
folgt
Z
Z b
b
f (x) d x (λ f )(x) d x − λ
a
a
Sλ+f (Z ) − Sλ−f (Z )
≤
<
".
Da " ∈ R+ beliebig klein gewählt werden kann, stimmen die beiden Integrale überein.
zu (iii) Sei " ∈ R+ beliebig vorgegeben. Weil f und g Riemann-integrierbar sind, gibt es Zerlegungen Z und Z 0 von
[a, b] mit S f+ (Z ) − S f− (Z ) < " und S g+ (Z 0 ) − S g− (Z 0 ) < ". Ersetzen wir Z und Z 0 durch die feinere Zerlegung
Z 00 = Z ∪ Z 0 , dann bleiben diese Ungleichungen wegen (7.4) erhalten. Wegen f ≤ g gilt S f− (Z 00 ) ≤ S f+ (Z 00 ) ≤
S g+ (Z 00 ) und somit
b
Z
b
Z
f (x) d x
g(x) d x −
a
≥
S g− (Z 00 ) − S f+ (Z 00 )
≥
S g+ (Z 00 ) − S f− (Z 00 ) − 2"
≥
−2".
a
Weil " ∈ R+ beliebig klein gewählt werden kann, folgt daraus die gewünschte Ungleichung.
—–
166
—–
ƒ
(7.10) Satz Sei f : [a, b] → R beschränkt und c ∈ ]a, b[ ein beliebig gewählter Punkt. Genau
dann ist f Riemann-integrierbar, wenn die Funktionen f |[a,c] und f |[c,b] Riemann-integrierbar
sind, und in diesem Fall gilt
b
Z
f (x) d x
=
a
Beweis:
c
Z
f (x) d x +
b
Z
a
f (x) d x.
c
Zunächst beweisen wir die „genau dann“-Aussage zur Integrierbarkeit. Auch hierzu verwenden wir das
(7.8). Sei g = f |[a,c] und h = f |[c,b] . Zur Vorbereitung bemerken wir: Ist Z 0 eine Zerlegung von [a, c] und Z 00 eine
Zerlegung von [c, b], dann ist durch Z = Z 0 ∪ {c} ∪ Z 00 eine Zerlegung von [a, b] gegeben. Außerdem gilt
S f− (Z ) = S g− (Z 0 ) + Sh− (Z 00 )
S f+ (Z ) = S g+ (Z 0 ) + Sh+ (Z 00 ).
und
(7.1)
Wir beschränken und auf den Beweis der ersten Gleichung. Wir können die Elemente von Z 0 und Z 00 so durchnummerieren, dass Z 0 = {x 1 , ..., x m−1 } und Z 00 = {x m+1 , ..., x n−1 } gilt, mit m, n ∈ N0 und m + 1 < n. Setzen wir
außerdem x m = c und definieren ck = inf f ([ck , ck+1 ]) für 0 ≤ k < n, dann erhalten wir
S f− (Z )
n−1
X
=
k=0
ck (x k+1 − x k )
=
m−1
X
ck (x k+1 − x k ) +
k=0
n−1
X
ck (x k+1 − x k )
=
S g− (Z 0 ) + Sh− (Z 00 ).
k=m+1
„⇒“ Sei " ∈ R+ vorgegeben. Weil f nach Voraussetzung integrierbar ist, existiert eine Zerlegung Z von [a, b] mit
S f+ (Z ) − S f− (Z ) < ". Dabei können wir annehmen, dass c in Z liegt, denn ersetzen wir Z durch Z1 = Z ∪ {c},
dann gilt S f− (Z1 ) ≥ S f− (Z ) und S f+ (Z1 ) ≤ S f+ (Z1 ) nach (7.6) und somit auch S f+ (Z1 ) − S f− (Z1 ) < ".
Setzen wir also c ∈ Z voraus, und definieren wir Z 0 = ]a, c[ ∩ Z sowie Z 00 = ]c, b[ ∩ Z . Dann ist Z 0 eine Zerlegung
von [a, c], die Menge Z 00 ist eine Zerlegung von [c, b], und es gilt Z = Z 0 ∪ {c} ∪ Z 00 . Wie oben gezeigt wurde, folgt
daraus (7.1). Wegen S g+ (Z 0 ) − S g− (Z 0 ) ≥ 0, Sh+ (Z 00 ) − Sh− (Z 00 ) ≥ 0 und
S g+ (Z 0 ) − Sh− (Z 0 ) + S g+ (Z 00 ) − Sh− (Z 00 )
=
=
S g+ (Z 0 ) + Sh+ (Z 00 ) − S g− (Z 0 ) + Sh− (Z 00 )
S f+ (Z ) − S f− (Z )
<
"
gilt S g+ (Z 0 ) − S g− (Z 0 ) < " und Sh+ (Z 00 ) − Sh− (Z 00 ) < ". Dies zeigt, dass g und h Riemann-integrierbar sind.
„⇐“
Wieder sei " ∈ R+ vorgegeben. Weil g und h nach Voraussetzung integrierbar sind, gibt es Zerlegungen
Z 0 von [a, c] und Z 00 von [c, b] mit S g+ (Z 0 ) − S g− (Z 0 ) <
1
"
2
und Sh+ (Z 00 ) − Sh− (Z 00 ) <
Z = Z ∪ {c} ∪ Z , dann gelten wiederum die Gleichungen (7.1). Wir erhalten
S f+ (Z ) − S f− (Z ) =
S g+ (Z 0 ) + Sh+ (Z 00 ) − S g− (Z 0 ) + Sh− (Z 00 )
0
00
€
Š
S g+ (Z 0 ) − S g− (Z 0 ) + Sh+ (Z 00 ) − Sh− (Z 00 )
—–
167
—–
<
1
"
2
+ 12 "
=
=
".
1
".
2
Definieren wir
Dies zeigt, dass f Riemann-integrierbar ist. Zum Schluss beweisen wir noch die angegebene Gleichung. Es gilt
sowohl
b
Z
−
S f (Z )
f (x) d x
≤
S f+ (Z )
≤
a
als auch
S f− (Z )
=
S g− (Z 0 ) + Sh− (Z 00 )
c
Z
g(x) d x +
≤
h(x) d x
a
≤
S g+ (Z 0 ) + Sh+ (Z 00 )
≤
S f+ (Z ).
c
Daraus folgt
Z
Z b
Z b
c
f (x) d x +
f (x) d x −
f (x) d x a
c
a
≤
b
Z
=
Z
Z b
Z b
c
g(x) d x +
h(x) d x −
f (x) d x a
c
a
S f+ (Z ) − S f− (Z )
<
".
Da " ∈ R+ beliebig klein gewählt werden kann, erhalten wir die angegebene Gleichung.
ƒ
Unser nächstes Ziel ist der Nachweis, dass jede stetige Funktion f auf einem abgeschlossenen Intervall Riemannintegrierbar ist. Hierzu benötigen wir ein wenig Vorbereitung.
(7.11) Definition
Eine Funktion f : D → R wird auf einer Teilmenge D ⊆ R gleichmäßig
stetig genannt, wenn für jedes " ∈ R+ ein δ ∈ R+ existiert, so dass die Implikation
|x − y| < δ
| f (x) − f ( y)| < "
⇒
für alle x, y ∈ D erfüllt ist.
Eine gleichmäßig stetige Funktion f : D → R ist nach dem "-δ-Kriterium offenbar in jedem Punkt a ∈ D stetig.
Umgekehrt braucht eine stetige Funktion aber nicht gleichmäßig stetig zu sein. Als Beispiel betrachten wir die
Funktion
f : ]0, 1[ −→ R ,
x 7→
1
,
x
die als rationale Funktion in jedem Punkt ihres Definitionsbereichs stetig ist. Sie ist aber nicht gleichmäßig stetig.
Wäre sie es, dann gäbe es für " = 1 ein δ > 0, so dass
|x − y| < δ
⇒
| f (x) − f ( y)| < 1
erfüllt ist. Wir wählen nun n ∈ N so groß, so dass
|x − y| =
| 1n
−
1
|
2n
=
1
2n
1
2n
für alle
x, y ∈ ]0, 1[
< δ erfüllt ist. Für x =
1
n
und y =
1
2n
gilt dann zwar
< δ, aber | f (x) − f ( y)| = |n − 2n| = n ≥ 1, im Widerspruch zur Annahme.
(7.12) Satz Jede auf einem endlichen, abgeschlossenen Intervall [a, b] ⊆ R stetige Funktion
ist dort auch gleichmäßig stetig.
—–
168
—–
Beweis:
Sei f : [a, b] → R stetig und nehmen wir an, f wäre nicht gleichmäßig stetig. Dann gäbe es ein " ∈ R+
mit der Eigenschaft, dass für jedes δ ∈ R+ ein Paar x, y ∈ [a, b] mit |x − y| < δ, aber | f (x) − ( y)| ≥ " existiert.
Insbesondere gäbe es dann für jedes n ∈ N Punkte x n , yn ∈ [a, b] mit |x n − yn | < 1n , aber | f (x n ) − f ( yn )| ≥ ".
Nach dem Satz (4.23) von Bolzano-Weierstraß besitzt (x n )n∈N einen Häufungspunkt p. Wir finden also eine streng
monoton wachsende Folge (nk )k∈N natürlicher Zahlen mit |x nk −p| <
1
k
für alle k ∈ N. Die Folge (x nk )k∈N konvergiert
offenbar gegen p. Wir behaupten, dass auch limk ynk = p gilt. Um dies zu beweisen, wählen wir für vorgegebenes
" 0 ∈ R+ ein so großes K ∈ N, dass
| ynk − p|
< 12 " 0 und |x nk − p| < 12 " 0 für alle k ≥ K erfüllt ist. Es gilt dann
1
nK
| ynk − x nk | + |x nk − p|
≤
<
1
nk
+ 21 " 0
"0
<
für alle
k ≥ K.
Damit ist die Behauptung bewiesen. Auf Grund der Stetigkeit von f gilt nun limk ( f (x nk )− f ( ynk )) = f (p)− f (p) = 0.
Dies widerspricht der Annahme | f (x n ) − f ( yn )| ≥ " für alle n ∈ N.
ƒ
Nach diesen Vorbereitungen können wir nun zeigen
(7.13) Satz Jede stetige Funktion auf einem endlichen, abgeschlossenen Intervall ist Riemannintegrierbar.
Beweis:
Sei f : [a, b] → R eine stetige Funktion und " ∈ R+ vorgegeben. Nach (7.12) ist f als stetige Funktion
auf einem abgeschlossenen Intervall auch gleichmäßig stetig. Seien " 0 =
|x − y| < δ
⇒
| f (x) − f ( y)| < " 0
erfüllt ist. Sei außerdem n ∈ N so groß, dass
"
b−a
für alle
und die Zahl δ ∈ R+ so gewählt, dass
x, y ∈ [a, b]
< δ gilt. Wir definieren nun x k = a + nk (b − a) für 0 ≤ k ≤ n
b−a
n
und setzen Z = {x 1 , ..., x n−1 }. Nach dem Maximumsprinzip (5.17) gibt es jeweils Punkte yk , zk ∈ [x k , x k+1 ], so dass
ck = f ( yk ) das Minimum und dk = f (zk ) das Maximum von f auf [x k , x k+1 ] ist. Daraus folgt, dass Unter- und
Obersumme der Zerlegung Z durch
S f− (Z ) =
n−1
X
ck (x k+1 − x k )
S f+ (Z ) =
und
k=0
gegeben sind. Wegen | yk − zk | ≤
b−a
n
n−1
X
dk (x k+1 − x k )
k=0
< δ gilt jeweils dk − ck = f (zk ) − f ( yk ) < " 0 . Damit erhalten wir
S f+ (Z ) − S f− (Z )
=
n−1
X
(dk − ck )(x k+1 − x k )
≤
k=0
n−1
X
" 0 (x k+1 − x k )
=
" 0 (x n − x 0 )
=
" 0 (b − a)
=
".
k=0
Da " ∈ R+ beliebig klein gewählt werden kann, zeigt dies nach (7.8) (ii), dass f Riemann-integrierbar ist.
—–
169
—–
ƒ
Der Satz lässt sich auf eine noch größere Klasse von Funktionen verallgemeinern. Eine Funktion f : [a, b] → R
wird stückweise stetig genannt, wenn eine Zerlegung Z = {x 1 , ..., x n−1 } von [a, b] existiert, so dass die Funktionen
g k = f |]x k ,x k+1 [ stetig sind und
lim g k
und
x→x k
lim g k
x→x k+1
als eigentliche Grenzwerte existieren, für 0 ≤ k < n. Dabei wird wie immer x 0 = a und x n = b gesetzt. Aus den
Grenzwertbedingungen folgt nämlich, dass wir g k als stetige Funktion auf [x k , x k+1 ] betrachten können, die außer
in den Randpunkten x k , x k+1 mit f übereinstimmen. Nach (7.13) ist g k und damit f |[x k ,x k+1 ] integrierbar, und mit
(7.10) folgt daraus die Integrierbarkeit von f auf [a, b].
Der folgende Satz wird im folgenden Abschnitt ein zentrales Hilfsmittel beim Beweis des Hauptsatzes der Differentialund Integralrechnung sein.
(7.14) Satz
(Mittelwertsatz der Integralrechnung)
Seien f , g : [a, b] → R stetige Funktionen, wobei wir g ≥ 0 voraussetzen. Dann gibt es ein
c ∈ [a, b] mit
b
Z
f (x)g(x) d x
=
f (c)
a
g(x) d x.
a
Der Spezialfall g = 1 liefert die Gleichung
Beweis:
b
Z
Rb
a
f (x) d x = f (c)(b − a) für ein c ∈ [a, b].
Wir definieren u = min f ([a, b]) und v = max f ([a, b]). Nach dem Maximumsprinzip sind diese Werte
als reelle Zahlen definiert, und es existieren Punkte p, q ∈ [a, b] mit f (p) = u und f (q) = v. Wir können p < q
voraussetzen, denn im Fall q > p läuft der Beweis völlig analog, und im Fall p = q ist die Funktion f konstant und
die Aussage daher trivial. Nach Voraussetzung gilt ug ≤ f g ≤ v g auf dem gesamten Intervall [a, b]. Auf Grund von
(7.9) (iii) gelten deshalb die Ungleichungen
b
Z
u
b
Z
f (x)g(x) d x
≤
g(x) d x
a
≤
v
g(x) d x.
a
Insbesondere gibt es ein µ ∈ [u, v] mit
Rb
a
b
Z
a
f (x)g(x) d x = µ
Rb
a
g(x) d x. Da f stetig ist, liefert uns der Zwischen-
wertsatz (5.14) einen Punkt c ∈ [p, q] mit f (c) = µ. Damit ist die Aussage bewiesen.
ƒ
Für reelle Zahlen a, b ∈ R mit a < b und integrierbare Funktionen f auf [a, b] definieren wir
a
Z
f (x) d x = 0
a
Z
f (x) d x = −
und
a
b
b
Z
f (x) d x.
a
Man beachte, dass der Mittelwertsatz der Integralrechnung für a ≥ b gültig bleibt. Ebenso leicht überzeugt man
sich davon, dass die letzte Gleichung in (7.10) für beliebige reelle Zahlen a, b, c gültig bleibt, unabhängig von deren
Anordnung.
—–
170
—–
(II) Der Hauptsatz der Differential- und Integralrechnung
In diesem Abschnitt untersuchen wir den Zusammenhang zwischen dem Riemann-Integral und der Ableitung von
Funktionen. Als Ergebnis werden wir das aus der Schulmathematik bekannte Resultat herleiten, dass sich das Integral
einer Funktion f mit Hilfe von Stammfunktionen berechnen lässt.
(7.15) Definition Sei D ⊆ R und f : D → R eine beliebige Funktion. Eine Funktion F : D → R
wird Stammfunktion von f genannt, wenn F auf ganz D differenzierbar ist und F 0 = f gilt.
Als erstes zeigen wir mit Hilfe des Mittelwertsatzes der Integralrechnung, dass das Riemann-Integral zur Definition
von Stammfunktionen verwendet werden kann.
(7.16) Proposition Sei f : ]a, b[ → R stetig und c ∈ ]a, b[. Die Funktion F : ]a, b[ → R sei
definiert durch
F (x)
x
Z
=
f (t) d t.
c
Dann ist F eine Stammfunktion von f .
Beweis:
Sei x ∈ ]a, b[ und (x n )n∈N eine Folge in ]a, b[ \ {x} mit limn x n = x. Für den Differentialquotienten von
F gilt
F (x n ) − F (x)
xn − x
=
xn
‚Z
1
xn − x
f (t) d t −
c
x
Z
Œ
f (t) d t
=
c
1
xn − x
xn
Z
f (t) d t.
x
Nach dem Mittelwertsatz der Integralrechnung gibt es für jedes n ∈ N im Fall x < x n ein yn ∈ [x, x n ] und im Fall
x > x n ein yn ∈ [x n , x] mit
xn
Z
f (t) d t
=
(x n − x) f ( yn ).
x
Nach Definition gilt | yn − x| ≤ |x n − x| für alle n ∈ N. Mit (x n )n∈N konvergiert also auch die Folge ( yn )n∈N gegen x,
und aus der Stetigkeit von f folgt
lim
F (x n ) − F (x)
n→∞
xn − x
=
lim f ( yn )
n→∞
=
f (x).
Also gilt tatsächlich F 0 (x) = f (x) für alle x ∈ ]a, b[.
ƒ
(7.17) Proposition Sei f : ]a, b[ → R eine Funktion und F :→ R eine Stammfunktion. Eine
weitere Funktion G auf ]a, b[ ist genau dann eine Stammfunktion von f , wenn die Differenz
G − F auf ]a, b[ konstant ist.
Beweis:
„⇒“
„⇐“
Ist G − F konstant, dann gilt (G − F )0 (x) = 0 und somit G 0 (x) = F 0 (x) = f (x) für alle x ∈ ]a, b[.
Seien F, G Stammfunktionen von f . Nach Voraussetzung gilt (G − F )0 = G 0 − F 0 = f − f = 0, und nach
Folgerung (6.16) ist G − F damit auf ]a, b[ konstant.
—–
ƒ
171
—–
(7.18) Satz
(Hauptsatz der Differential- und Integralrechnung)
Sei f : ]a, b[ → R stetig und F eine Stammfunktion von f . Für alle c, d ∈ ]a, b[ gilt dann
d
Z
f (x) d x
=
F (d) − F (c).
c
Rx
Nach Proposition (7.16) ist durch F̃ (x) = c f (t) d t jedenfalls eine Stammfunktion von f gegeben. Für
Rd
diese gilt F̃ (c) = 0 und F̃ (d) = c f (t) d t. Da F eine weitere Stammfunktion ist, existiert nach Proposition (7.17)
Beweis:
ein u ∈ R mit F (x) = F̃ (x) + u für alle x ∈ ]a, b[. Es gilt also
F (d) − F (c)
=
F̃ (d) − F̃ (c)
d
Z
=
f (x) d x.
ƒ
c
Um Schreibarbeit zu sparen, verwendet man im Zusammenhang mit einer Stammfunktion F häufig die Notation
d
F (x)
F (d) − F (c).
für die Differenz
c
Die Gleichung aus dem Hauptsatz kann dann in der Form
Rd
d
f (x) d x = F (x) c geschrieben werden. Man kann
c
die Schreibweise noch weiter vereinfachen, indem man einfach
Z
f (x) d x
=
notiert. Ausgeschrieben soll dies bedeuten, dass die Gleichung
F (x)
Rd
c
d
f (x) d x = F (x) c für beliebige c, d im Defini-
tionsbereich von f erfüllt ist. Den Ausdruck auf der linken Seite bezeichnet man als unbestimmtes Integral. Man
beachte, dass die Funktion F auf der rechten Seite nur bis auf eine Konstante eindeutig bestimmt ist. Dort kann eine
beliebige Stammfunktion von f erscheinen. So wäre zum Beispiel auch die Gleichung
Z
x3 d x
=
1 4
x
4
+1
korrekt. Im allgemeinen bemüht man sich bei der Angabe von unbestimmten Integralen aber, eine möglichst „einfache“ Stammfunktion auszuwählen.
Für n ∈ R mit n 6= −1 gilt
Z
xn d x
=
x n+1
,
n+1
unter der Bedingung x 6= 0 falls n < 0.
Die Bedingung x 6= 0 bedeutet, dass die Null nicht im Integrationsintervall [a, b] liegen darf, d.h. die ausführlich
geschriebene Gleichung
b
Z
xn d x
=
a
—–
172
x n+1
b
n+1
a
—–
ist nur gültig, wenn a, b ∈ R beide positiv oder beide negativ sind. Denn ansonsten wäre die Funktion x n nicht an
Rb
jeder Stelle des Intervalls [a, b] definiert und daher auch a x n d x undefiniert. Selbst wenn wir die Funktion an der
Stelle 0 willkürlich fortsetzen würden, etwa in der Form

7→
x
x n
für
x 6= 0

0
für
x =0
hätte das Integralzeichen keine Bedeutung, da wir schon allein für die Definition des Ober- oder Unterintegrals eine
beschränkte Funktion benötigen.
Als weiteres Beispiel beweisen wir die Gleichung
Z
dx
x
=
ln |x|
x 6= 0.
für
Sei nämlich [a, b] ein Integrationsintervall. Nach Voraussetzung gilt 0 ∈
/ [a, b], d.h. die Grenzen a, b ∈ R sind
entweder beide positiv oder beide negativ. Für x > 0 ist ln(x) eine Stammfunktion von x 7→ 1x , also gilt
b
Z
dx
=
x
a
b
ln(x)
a, b > 0
für
a
nach dem Hauptsatz der Differential- und Integralrechnung. Im Fall x < 0 ist F (x) = ln(−x) eine Stammfunktion
1
= 1x . Wir erhalten
für x 7→ 1x , denn nach der Kettenregel gilt F 0 (x) = (−1) −x
b
Z
dx
=
x
a
b
ln(−x)
a, b < 0.
für
a
Sowohl für a, b > 0 als auch für a, b < 0 gilt also die Gleichung
b
Z
dx
a
x
=
b
ln |x|
.
a
Aus dem Hauptsatz der Differential- und Integralrechnung ergibt sich wegen exp0 (x) = exp(x) auch unmittelbar die
Integralformel
Z
exp(x) d x
(7.19) Satz
=
exp(x).
(Substitutionsregel)
Sei f : I → R stetig und u : I → R stetig differenzierbar mit u(I) ⊆ I. Dann gilt
b
Z
0
f (u(t))u (t) d t
=
a
Z
u(b)
u(a)
—–
173
—–
f (x) d x.
Beweis:
Sei F : I → R eine Stammfunktion von f und G = F ◦ u. Die Anwendung der Kettenregel liefert
(F ◦ u)0 (t) d t
F 0 (u(t))u0 (t)
=
f (u(t))u0 (t).
=
Diese Funktion ist auf Grund unserer Voraussetzungen stetig. Folglich erhalten wir nach dem Hauptsatz der Differential- und Integralrechnung
Z b
Z
0
f (u(t))u (t) d t
b
0
=
a
(F ◦ u) (t) d t
=
b
(F ◦ u)(t)
=
u(b)
F (x)
a
a
Z
=
u(a)
u(b)
f (x) d x.
ƒ
u(a)
Als erstes Anwendungsbeispiel für die Substitutionsregel beweisen wir die Formel
Z
dx
= ln |x + c|
für x 6= −c.
x +c
Seien a, b ∈ R. Liegt −c nicht im Intervall [a, b], dann ist 0 nicht in [a + c, b + c] enthalten. Anwendung der
Substitutionsregel auf u(t) = t + c mit Ableitung u0 (t) = 1 liefert
Z b
Z b 0
Z b+c
b+c
dt
u (t) d x
dx
=
=
=
ln |x|
t+c
u(t)
x
a+c
a
a
a+c
Z
x exp(x 2 ) d x
1
2
=
=
ln |x + c|
b
a
exp(x 2 ).
Hier verwenden wir u(t) = t 2 mit der Ableitung u0 (t) = 2t.
b
Z
te
t2
dt
=
a
1
2
b
Z
(2t)e
t2
dt
1
2
=
a
Beim nächsten Beispiel ist zu beachten, dass allgemein
R
dx
f (x)
Z
b2
ex d x
=
a2
1 x2
e
2
b
a
nur eine vereinfachte Schreibweise für
Wir zeigen
Z
dx
(x +
c)n
=
1
1−n
(x + c)1−n
n ∈ N, n ≥ 2.
für
Wiederum verwenden wir die Substitution u(t) = x + c mit u0 (t) = 1 an und erhalten
Z b
Z b+c
b+c
b
dt
1
1
−n
1−n
1−n
=
x dx =
x
=
(x + c)
(t + c)n
1−n
1−n
a+c
a
a
a+c
(7.20) Satz
(partielle Integration)
Seien f , g : I → R zwei stetig differenzierbare Funktionen. Dann gilt
b
Z
0
f (x)g (x) d x
=
a
a
—–
b
b Z
f (x)g(x) −
174
—–
f 0 (x)g(x) d x.
a
.
R
1
f (x)
d x ist.
Beweis:
Wir wenden die Produktregel auf die Funktion F = f g an und erhalten F 0 (x) = f 0 (x)g(x) + f (x)g 0 (x).
Der Hauptsatz der Differential- und Integralrechnung liefert
b
Z
0
f (x)g(x) d x +
a
b
Z
0
f (x)g (x) d x
b
Z
=
a
F 0 (x) d x
=
b
F (x)
=
b
f (x)g(x) .
a
a
a
Durch Umstellen erhalten wir die gewünschte Gleichung.
ƒ
Als Anwendung der partiellen Integration beweisen wir
Z
=
x exp(x)
(x − 1) exp(x).
Dazu definieren wir die Funktionen f (x) = x und g(x) = exp(x) mit den Ableitungen f 0 (x) = 1 und g 0 (x) = exp(x).
Für beliebige a, b ∈ R gilt dann
b
Z
x exp(x) d x
=
a
b
Z
0
f (x)g (x) d x
=
a
a
b Z b
x exp(x) −
1 · exp(x) d x
a
=
a
f 0 (x)g(x) d x
=
a
b b
x exp(x) − exp(x)
a
b
b Z
f (x)g(x) −
=
b
(x − 1) exp(x) .
a
a
Durch mehrfache Anwendung der partiellen Integration lassen sich kompliziertere Ausdrücke integrieren, beispielsweise
Z
(x 2 + 5) exp(x) d x
=
(x 2 − 2x + 7) exp(x).
Für beliebige a, b ∈ R gilt nämlich
b
Z
2
(x + 5) exp(x) d x
=
b Z b
(x + 5) exp(x) −
2x exp(x) d x
2
a
a
b b Z b
(x 2 + 5) exp(x) − 2x exp(x) +
2 exp(x) d x
a
a
=
=
a
b b b
(x 2 + 5) exp(x) − 2x exp(x) + 2 exp(x)
a
a
=
a
b
2
(x − 2x + 7) exp(x) .
a
Als weiteres Anwendungsbeispiel beweisen wir
Z
ln(x) d x
=
x ln(x) − x
für
x > 0.
Hier besteht der Trick darin, die partielle Integration auf das „triviale“ Produkt ln(x) = 1 · ln(x) anzuwenden.
b
Z
ln(x) d x
=
a
b
Z
1 · ln(x) d x
=
a
a
=
b Z b
x ln(x) −
1 dx
a
=
x·
a
b
x ln(x) − x
.
a
a
—–
b
b Z
x ln(x) −
175
—–
1
x
dx
a
Allgemeiner kann mit partieller Integration und vollständiger Induktion gezeigt werden, dass
Z
x n+1
x n ln(x) d x =
((n + 1) ln(x) − 1)
für alle n ∈ N0 gilt.
(n + 1)2
Wir werden noch weitere Beispiele für die Berechnung von Integralen angeben, sobald wir die trigonometrischen
Funktionen (Sinus und Kosinus) definiert haben.
(III) Trigonometrische Funktionen
Unser Ziel in diesem Kapitel besteht darin, die aus dem Schulunterricht bekannten trigonometrischen Funktionen
(Sinus, Kosinus und Tangens) zu definieren. Bekanntlich hängen diese drei Funktionen mit der Geometrie der rechtwinkligen Dreiecke zusammen. Bezeichnet α einen der nicht-rechten Winkel eines solchen Dreiecks und sind a, b, c
die Seitenlängen von Ankathete, Gegenkathete und Hypothenuse, dann gelten die Beziehungen
cos(α) =
a
c
sin(α) =
,
b
c
,
tan(α) =
b
a
.
Dabei wird in die Kosinus-, Sinus- und Tangensfunktion der Winkel jeweils im Bogenmaß eingesetzt. Dies ist die
Länge des Teils vom Kreisbogen, der über dem Winkel liegt, bei einem 90◦ -Winkel also beispielsweise die Bogenlänge
eines Viertelkreises vom Radius 1.
Um die Länge von Kreisbögen oder allgemeineren Kurven präzise definieren zu können, benötigen wir ein wenig
Vorbereitung. Für jeden Punkt p = (p1 , p2 ) ∈ R2 setzen wir
=
kpk
Æ
p12 + p22
und bezeichnen diese Zahl als Abstand des Punkts p vom Koordinatenursprung (0, 0). Für beliebige Punkte p, q ∈ R2
gilt die Dreiecksungleichung kp + qk ≤ kpk + kqk. Anschaulich ist das klar, den Beweis werden wir in der Analysis
meherer Variablen nachholen. Durch einen einfachen Induktionsbeweis leitet man daraus für endlich viele Punkte
p1 , ..., pn die Ungleichung
n
X
pk k=1 ≤
n
X
kpk k
k=1
ab. Den Wert kq − pk bezeichnen wir als den Abstand der Punkte p und q. Im folgenden seien a, b ∈ R mit a < b
und f : [a, b] → R eine stetige Funktion.
(7.21) Definition
Sei Z = {x 1 , ..., x m−1 } eine Zerlegung von [a, b], außerdem x 0 = a und
x m = b. Für jedes k ∈ {0, ..., m} setzen wir pk = (x k , f (x k )). Dann bezeichnen wir
`( f , Z )
=
m−1
X
kpk+1 − pk k
k=0
als die Länge des von f und Z definierten Polygonzugs.
—–
176
—–
(7.22) Lemma Ist Z 0 eine Verfeinerung von Z , dann gilt `( f , Z ) ≤ `( f , Z 0 ).
Beweis:
Sei Z 0 = { y1 , ..., yn−1 }, außerdem y0 = a und yn = b. Wegen Z ⊆ Z 0 gibt es für jedes k ∈ {0, ..., m} ein
`k ∈ {0, ..., n} mit x k = y`k , insbesondere ist `0 = 0 und `m = n. Setzen wir q` = ( y` , f ( y` )) für 0 ≤ ` ≤ n, dann gilt
pk = q`k für 0 ≤ k ≤ m. Wegen
=
pk+1 − pk
q`k+1 − q`k
`k+1
−1
X
(q`+1 − q` )
=
`=`k
erhalten wir mit der Dreiecksungleichung von oben die Abschätzung
0
`( f , Z )
=
n−1
X
−1
m−1
X
X `k+1
=
kq`+1 − q` k
`=0
≥
m−1
X
k=0
=
kpk+1 − pk k
kq`+1 − q` k
`=`k
`( f , Z ).
ƒ
k=0
(7.23) Definition Sei Z(a, b) die Menge der Zerlegungen von [a, b]. Ist die Menge
M
=
`( f , Z ) | Z ∈ Z(a, b)
nach oben beschränkt, dann nennen wir `( f ) = sup M die Bogenlänge des Funktionsgraphen
von f .
(7.24) Proposition Sei c ∈ ]a, b[ ein Punkt mit der Eigenschaft, dass die Bogenlängen `( f |[a,c] )
und `( f |[c,b] ) existieren. Dann existiert auch die Bogenlänge `( f ), und es gilt
`( f )
Beweis:
=
`( f |[a,c] ) + `( f |[c,b] ).
Sei s ∈ R die Summe auf der rechten Seite der Gleichung und M = {`( f , Z ) | Z ∈ Z(a, b)}. Zu zeigen
ist, dass es sich bei s um das Supremum der Menge M handelt. Zunächst überprüfen wir, dass s eine obere Schranke
von M ist. Sei dazu Z ∈ Z(a, b) beliebig vorgegeben. Wir definieren Z0 = Z ∪ {c}, außerdem
Z 0 = Z0 ∩ ]a, c[
Z 00 = Z0 ∩ ]c, b[ .
und
Sei Z 0 = {x 1 , ..., x m−1 }, Z 00 = { y1 , ..., yn−1 }, außerdem x 0 = a, x m = y0 = c und yn = b. Weiter sei pk = (x k , f (x k ))
für 0 ≤ k ≤ m und qk = ( yk , f ( yk )) für 0 ≤ k ≤ n. Wir erhalten dann
`( f , Z )
≤
`( f , Z0 )
=
m−1
X
kpk+1 − pk k +
k=0
kqk+1 − qk k
k=0
`( f |[a,c] , Z 0 ) + `( f |[c,b] , Z 00 )
—–
n−1
X
177
≤
`( f |[a,c] ) + `( f |[c,b] ).
—–
=
Nun zeigen wir noch, dass es sich bei s um die kleinste obere Schranke von M handelt. Sei dazu " ∈ R+ vorgegeben.
Nach Definition von `( f |[a,c] ) und `( f |[c,b] ) gibt es Zerlegungen Z 0 und Z 00 der Intervalle [a, c] und [c, b] mit
`( f |[a,c] , Z 0 ) > `( f |[a,c] ) − 21 "
und
`( f |[c,b] , Z 00 ) > `( f |[c,b] ) − 21 ".
Setzen wir Z = Z 0 ∪ {c} ∪ Z 00 , dann gilt offenbar
`( f , Z )
`( f |[a,c] , Z 0 ) + `( f |[c,b] , Z 00 ) ,
=
und daraus folgt ( f , Z ) > s − ". Damit ist bewiesen, dass s − " für beliebiges " ∈ R+ keine obere Schranke von M
ist.
ƒ
Für unsere trigonometrischen Anwendungen sind wir an einer speziellen Funktion besonders interessiert. Wir bezeichnen den Funktionsgraphen von
κ : [−1, 1] −→ R ,
x 7→
p
1 − x2
als den (oberen) Halbkreis.
(7.25) Proposition Seien a, b ∈ R mit a < b und −1 ≤ a, b ≤ 0 oder 0 ≤ a, b ≤ 1. Dann ist
die Bogenlänge `(κ|[a,b] ) definiert und genügt der Abschätzung
`(κ|[a,b] )
Beweis:
≤
(b − a) + |κ(b) − κ(a)|.
Wir setzen −1 ≤ a, b ≤ 0 voraus; im andere Fall verläuft der Beweis vollkommen analog. Sei Z eine
beliebige Zerlegung von [a, b]; offenbar genügt es zu zeigen, dass `(κ|[a,b] , Z ) nach oben durch (b−a)+|κ(b)−κ(a)|
abgeschätzt werden kann. Sei dazu Z = {x 1 , ..., x m−1 }, außerdem x 0 = a und x m = b. Für 0 ≤ k ≤ m definieren wir
die Punkte
pk = (x k , κ(x k )) ,
qk = (x k , 0) und
rk = (0, κ(x k )).
Wegen pk = qk + rk gilt jeweils kpk+1 − pk k ≤ kqk+1 −qk k+krk+1 − rk k für 0 ≤ k < m. Wegen x k < x k+1 gilt außerdem
kqk+1 − qk k = k(x k+1 − x k , 0)k = x k+1 − x k , und weil die Funktion κ auf [−1, 0] streng monoton wachsend ist, gilt
jeweils krk+1 − rk k = κ(x k+1 ) − κ(x k ). Insgesamt erhalten wir damit die Abschätzung
`(κ|[a,b] , Z )
=
m−1
X
kpk+1 − pk k
≤
k=0
≤
m−1
X
k=0
m−1
X
k=0
X
m−1
x k+1 − x k +
κ(x k+1 ) − κ(x k )
=
kqk+1 − qk k +
m−1
X
krk+1 − rk k
k=0
(b − a) + (κ(b) − κ(a)).
ƒ
k=0
Auf Grund von (7.24) und (7.25) existiert damit auch die Bogenlänge `(κ); man bezeichnet diese als die Kreiszahl π.
Wir beschäftigen und nun mit der Frage, wie die Kreiszahl mit Hilfe der Differential- und Integralrechnung bestimmt
werden kann.
—–
178
—–
(7.26) Satz
Seien a, b ∈ R, a < b und f : ]a, b[ → R eine stetig differenzierbare Funktion.
Für beliebige c, d ∈ R mit a < c < d < b gilt dann
`( f |[c,d] )
=
d
Z
p
1 + f 0 (x)2 d x.
c
Sei Z = {x 1 , ..., x m−1 } eine beliebige Zerlegung von [c, d], und x 0 = c, x m = d. Nach dem Mittelwertsatz
der Differentialrechnung (6.15) existiert für 0 ≤ k < m jeweils ein yk ∈ x k , x k+1 , so dass die Gleichung
Beweis:
f 0 ( yk )
f (x k+1 ) − f (x k )
=
x k+1 − x k
erfüllt ist. Setzen wir wieder pk = (x k , f (x k )) für 0 ≤ k ≤ m, dann erhalten wir damit
`( f , Z )
=
m−1
X
kpk+1 − pk k
=
k=0
m−1
X
m−1
XÆ
x k+1 − x k
2
2
+ f (x k+1 ) − f (x k )
=
k=0
È
(x k+1 − x k )
1+
f (x k+1 ) − f (x k )
x k+1 − x k
k=0
Die Funktion g : [c, d] → R, x 7→
p
2
=
m−1
X
p
(x k+1 − x k ) 1 + f 0 ( yk )2 .
k=0
1 + f 0 (x)2 ist stetig, nach Satz (7.13) also Riemann-integrierbar. Die soeben
durchgeführte Rechnung zeigt, dass `( f , Z ) die Riemannsche Summe der Funktion g zur Zerlegung Z ist.
Sei nun Z(c, d) die Menge aller Zerlegungen von [c, d] und M = {`( f , Z ) | Z ∈ Z(c, d)}. Wir beweisen die Aussage
Rd
des Satzes, indem wir zeigen, dass s = c g(x) d x das Supremum von M ist. Seien Z ∈ Z(c, d) und " ∈ R+
vorgegeben. Nach Satz (7.8) (iv) gibt es ein δ ∈ R+ mit der Eigenschaft, so dass jede Riemannsche Summe zu einer
Zerlegung mit Feinheit kleiner als δ höchstens um den Wert " vom Integralwert s abweicht. Ist Z 0 eine Zerlegung
von [c, d] mit δ(Z 0 ) < δ, dann kann die Feinheit von Z ∪ Z 0 erst recht durch δ abgeschätzt werden, und es folgt
`( f , Z )
≤
`( f , Z ∪ Z 0 )
≤
s + ".
Weil " ∈ R+ beliebig klein gewählt werden kann, ist s damit eine obere Schranke von M . Um zu zeigen, dass es sich
um die kleinste obere Schranke handelt, sei " ∈ R+ und wiederum δ ∈ R+ der zugehörige Wert nach Satz (7.8). Für
jede Zerlegung Z mit δ(Z ) < δ gilt dann `( f , Z ) > s − ". Dies zeigt, dass s − " keine obere Schranke von M ist. ƒ
Leider kann (7.26) für die Berechnung von π nicht direkt verwendet werden, weil die Funktion κ in den Punkten −1
und 1 nicht differenzierbar ist. Auf dem offenen Intervall ]−1, 1[ ist die Ableitungsfunktion von κ(x) = (1 − x 2 )1/2
gegeben durch
κ0 (x)
=
1
(−2x)(1 −
2
—–
x 2 )−1/2
179
—–
=
−p
x
1 − x2
.
Dies bedeutet, dass immerhin auf den abgeschlossenen Teilintervallen [a, b] ⊆ ]−1, 1[ die Bogenlänge von κ|[a,b]
durch
`(κ|[a,b] )
bp
Z
=
1+ f
0 (x)2
Z br
=
dx
a
x2
1+
Z br
1 − x2 + x2
1−
a
=
dx
x2
b
Z
=
dx
1 − x2
a
dx
p
a
1 − x2
bestimmt werden kann. Darüber hinaus ist die folgende Integralgleichung bei der Berechnung von π hilfreich.
(7.27) Proposition Für alle a, b ∈ R mit −1 < a < b < 1 gilt
2
Z bp
1−
x2
=
dx
a
a
Beweis:
b
Z
p
b
2
x 1− x
+
dx
p
a
.
1 − x2
Dieses Ergebnis erhält man durch Anwendung der partiellen Integration. Es gilt
Z b p
Z bp
p
b Z b
1 − x2 d x
=
1·
a
=
=
1 − x2 d x
1 − x2
x
−
a
a
b
p
b Z
2
x 1− x
+
a
x2
p
a
=
=
dx
1 − x2
a
b
p
b Z
2
x 1− x
+
a
b
p
b Z
2
x 1− x
+
dx
p
a
1−
x2
−
Z bp
a
a
(−x)
dx
x·p
1 − x2
dx
p
1 − x2
b
Z
−
a
1 − x2
dx
p
1 − x2
1 − x 2 d x.
a
Durch Umstellen der Gleichung erhält man das gewünschte Ergebnis.
ƒ
Daraus erhalten wir nun unmittelbar
(7.28) Folgerung Die Kreiszahl π erfüllt die Gleichung
π
Z
=
1
2
p
1 − x 2 d x.
−1
Weil das Integral rechts den Flächeninhalt des Halbkreises angibt, entspricht π also nicht nur
der Länge des Halbkreisbogens, sondern auch dem Flächeninhalt des Vollkreises.
Beweis:
Sei ("n )n∈N eine beliebige Folge in ]0, 1[ mit limn "n = 0. Für jedes n ∈ N gilt
π
=
`(κ)
=
`(κ|[−1,−1+"n ] ) + `(κ|[−1+"n ,1−"n ] ) + `(κ|[1−"n ,1] )
`(κ|[−1,−1+"n ] ) +
Z
1−"n
−1+"n
—–
dx
p
180
1 − x2
—–
+ `(κ|[1−"n ,1] ).
=
Der erste und letzte Term kann nach Proposition (7.25) abgeschätzt werden durch
"n + κ(−1 + "n ) − κ(−1)
"n + κ(1) − κ(1 − "n ) .
bzw.
Auf Grund der Stetigkeit von κ konvergieren also beide Terme für n → ∞ gegen Null. Für den mittleren Term gilt
1−"
Z n
dx
p
−1+"n
Auch der Ausdruck
p
1−"n
2
x 1− x
1 − x2
=
1−"
Z n
2
p
p
1−"n
1 − x2 d x − x 1 − x2
.
−1+"n
−1+"n
p
1 − (1 − "n )2
(1 − "n ) − (−1 + "n )
=
=
p
2(1 − "n ) 1 − (1 − "n )2
−1+"n
R 1−"n p
konvergiert gegen Null. Insgesamt haben wir damit also π = limn −1+" 2 1 − x 2 d x nachgewiesen. Wegen 0 ≤
p
Rbp n
1 − x 2 ≤ 1 gilt für beliebige a, b ∈ [−1, 1] die Abschätzung 0 ≤ a 1 − x 2 d x ≤ (b − a). Daraus folgt
1−"
−1+"
Z1
Z n p
Z1 p
Z n p
p
2 1 − x2 d x +
2 1 − x2 d x = 2 1 − x2 d x ≤
2 1 − x2 d x −
−1
−1
−1+"
1−"
n
n
2((−1 + "n ) − (−1)) + 2(1 − (1 − "n ))
=
4"n .
Damit erhalten wir wie gewünscht
π
=
1−"
Z n
lim 2
n→∞
p
1−
x2
=
dx
2
−1+"n
Z1 p
1 − x 2 d x.
ƒ
−1
Für die Definition von Sinus- und Kosinusfunktion betrachten wir nun die Abbildung
α : [−1, 1] −→ R ,
x 7→ `(κ|[x,1] ).
(7.29) Lemma Die Funktion α ist auf ihrem gesamten Definitionsbereich stetig und streng monoton fallend. Außerdem ist sie auf ]−1, 1[ differenzierbar, und sie bildet das Intervall [−1, 1]
bijektiv auf [0, π] ab.
Beweis:
Seien x, y ∈ ]−1, 1[ vorgegeben. Nach Definition gilt
α( y) − α(x)
=
`(κ|[ y,1] ) − `(κ[x,1] )
=
`(κ|[ y,x] )
=
y
Z
−
x
dt
p
,
1 − t2
und nach dem Hauptsatz der Differential- und Integralrechnung folgt daraus die Differenzierbarkeit von α auf
]−1, 1[ sowie die Gleichung α0 (x) = −(1 − x 2 )−1/2 . Wenn wir nachweisen können, dass α auch in den Punkten −1
—–
181
—–
und 1 stetig ist, dann folgt insgesamt aus Satz (6.22), dass α eine streng monoton fallende Funktion und damit auch
eine injektive Abbildung ist. Die Stetigkeit im Punkt 1 folgt aus der Abschätzung
α(x)
=
`(κ|[x,1] )
(1 − x) + κ(1) − κ(x) für
≤
x ∈ [0, 1]
nach Proposition (7.25). Die Stetigkeit im Punkt −1 erhalten wir durch
π − α(x)
=
`(κ|[−1,1] ) − `(κ|[x,1] )
=
`(κ|[−1,x] )
≤
(x + 1) + κ(x) − κ(−1).
Aus den beiden Abschätzungen folgt nämlich
lim α(x) = 0 = α(1)
lim (π − α(x)) = 0 = π − α(−1).
und
x→1
x→−1
Die Surjektivität von α folgt schließlich aus den Gleichungen α(−1) = π, α(1) = 0, der Stetigkeit von α und dem
Zwischenwertsatz.
ƒ
Aus (7.29) folgt, dass α eine stetige, streng monoton fallende Umkehrfunktion β : [0, π] → [−1, 1] besitzt, mit
β(0) = 1 und β(π) = −1.
(7.30) Definition Es gibt eindeutig bestimmte Funktionen cos : R → R und
sin : R → R mit den Eigenschaften
(i) cos(α(x)) = x und sin(α(x)) =
p
1 − x 2 für alle x ∈ [−1, 1]
(ii) cos(x + π) = − cos(x) und sin(x + π) = − sin(x) für alle x ∈ R.
Wir bezeichnen sie als Kosinus- und Sinusfunktion.
Beweis:
Wir beginnen mit der Definition der Kosinusfunktion. Ist x ∈ R vorgegeben, dann setzen wir
k = b πx c
cos(x) = (−1)k β(x − kπ).
und
Zu zeigen ist, dass cos die unter (i) und (ii) genannten Eigenschaften tatsächlich besitzt. Zum Nachweis von (i) sei
x ∈ [−1, 1] vorgegeben. Ist x > −1, dann ist b
α(x) = π, somit
α(x)
b π c
α(x)
c
π
= 0 und somit cos(α(x)) = β(α(x)) = x. Im Fall x = −1 ist
= 1 und
cos(α(x))
=
−β(α(x) − π)
=
−β(0)
=
−1
=
x.
Zum Nachweis von (ii) sei x ∈ R beliebig vorgegeben. Setzen wir k = b πx c, dann ist b x+π
c = k + 1, und wir erhalten
π
cos(x + π)
=
(−1)k+1 β((x + π) − (k + 1)π)
=
−(−1)k β(x − kπ)
Nun definieren wir die Sinusfunktion für beliebiges x ∈ R durch
k = b πx c
und
sin(x) = (−1)k
—–
182
—–
p
1 − cos(x − kπ)2 .
=
− cos(x).
Für x ∈ [−1, 1] gilt dann sin(α(x)) =
p
1 − cos(α(x))2 =
p
1 − x 2 . Ist x ∈ R vorgegeben und k = b πx c, dann gilt
b x+π
c = k + 1 und folglich
π
sin(x + π)
=
(−1)k+1
p
1 − cos((x + π) − (k + 1)π)2
=
−(−1)k
p
1 − cos(x − kπ)2
=
− sin(x).
Damit ist die Existenzbeweis für die Funktionen cos und sin abgeschlossen. Zum Nachweis der Eindeutigkeit sei
f : R → R eine beliebige Funktion mit
f (α(x)) = x für x ∈ [−1, 1]
f (x + π) = − f (x) für x ∈ R.
und
Sei x ∈ R vorgegeben und k = b πx c. Dann gilt 0 ≤ x −kπ < π und f (x) = (−1)k f (x −kπ). Setzen wir y = β(x −kπ),
dann gilt y ∈ ]−1, 1], und wir erhalten insgesamt
f (x)
=
(−1)k f (x − kπ)
(−1)k cos(α( y))
=
=
(−1)k f (α( y))
=
(−1)k y
(−1)k cos(x − kπ)
=
cos(x).
=
Damit ist die Eindeutigkeit der Kosinusfunktion nachgewiesen. Für die Eindeutigkeit der Sinusfunktion läuft der
Beweis nach demselben Schema ab.
ƒ
Als nächstes werden wir die Stetigkeit und die Differenzierbarkeit von Sinus- und Kosinusfunktion beweisen. Auf
Grund der Gleichungen cos(x + kπ) = (−1)k cos(x) und sin(x + kπ) = (−1)k sin(x) für alle x ∈ R und k ∈ Z folgt
die Stetigkeit bzw. Differenzierbarkeit an einer Stelle x auch Stetigkeit bzw. Differenzierbarkeit bei x + kπ für alle
k ∈ Z; im Falle der Differenzierbarkeit gilt jeweils
sin0 (x + kπ) = (−1)k sin0 (x)
cos0 (x + kπ) = (−1)k cos0 (x).
und
Darüber hinaus zeigt (7.30), dass die Gleichung
sin(x)2 + cos(x)2
=
für alle x ∈ R
1
erfüllt ist. Denn nach Punkt (i) gilt sie zunächst für 0 ≤ x < π, und auf Grund der Gleichungen für sin(x + πk)
und cos(x + πk) überträgt sie sich auf ganz R. Zum Schluss bemerken wir noch, dass die Ungleichung sin(x) > 0
p
/ {±1}. Für k ∈ Z und
für alle x ∈ ]0, π[ erfüllt ist, denn für diese x ist sin(x) = 1 − cos(x)2 und cos(x) ∈
x ∈ ]kπ, (k + 1)π[ folgt damit
sin(x) > 0 falls k gerade
sin(x) < 0 falls k ungerade.
und
Das folgende Lemma war Inhalt einer Übungsaufgabe.
(7.31) Lemma Seien a, b ∈ R, a < b und f : ]a, b[ → R eine stetige Funktion. Ferner setzen
wir voraus, dass f auf ]a, b[ \ {c} differenzierbar ist und der Grenzwert u = lim f 0 (x) existiert.
Dann ist f in c differenzierbar, und es gilt f 0 (c) = u.
—–
183
—–
x→c
(7.32) Satz Sinus- und Kosinusfunktion sind differenzierbar, genauer gilt
cos0 (x) = − sin(x)
Beweis:
sin0 (x) = cos(x)
und
für alle
x ∈ R.
Zunächst bestimmen wir die Ableitung von α auf dem Intervall ]−1, 1[. Bereits im Beweis von (7.29)
haben wir bemerkt, dass die Gleichung
α( y) − α(x)
=
y
Z
−
x
dt
p
für alle
1 − t2
x, y ∈ R gilt.
Nach (7.16) folgt daraus, dass α0 (x) = −(1 − x 2 )−1/2 für alle x ∈ ]−1, 1[ erfüllt ist. Wenden wir die Umkehrregel
an, so erhalten wir
cos0 (x)
=
β 0 (x)
=
1
α0 (β(x))
=
−
p
1 − β(x)2
=
−
p
1 − cos(x)2
=
− sin(x)
für alle x ∈ ]0, π[. Auf Grund der Vorbemerkung ist die Gleichung damit auch für alle x ∈ R \ {kπ | k ∈ Z} gültig.
Als nächses zeigen wir, dass die Kosinusfunktion auf ganz R zumindest stetig ist. Auf Grund der Vorbemerkung
genügt es, die Stetigkeit in 0 zu beweisen. Sei " ∈ R+ vorgegeben und (x n )n∈N eine Folge in R mit limn x n = 0. Auf
Grund der Stetigkeit der Funktion β in den Punkten 0 und π gibt es ein δ ∈ R+ mit δ < π, so dass aus 0 ≤ x < δ
jeweils β(x) > β(0) − " = 1 − " und aus π − δ < x ≤ π jeweils β(x) < β(π) + " = −1 + " folgt. Sei nun N ∈ N so
groß, dass |x n | < δ für alle n ≥ N gilt. Für jedes solche n gilt im Fall x n > 0 dann 1 ≥ cos(x) = β(x) > 1 − ", im Fall
x n < 0 gilt β(π − x) < −1 + " und somit cos(x) = −β(π − x) > 1 − ". In jedem Fall gilt also | cos(x) − cos(0)| =
| cos(x) − 1| < ".
Für jedes k ∈ Z und x ∈ ]kπ, (k + 1)π[ gilt jeweils sin(x) = (−1)k
p
1 − cos(x)2 . Dies zeigt, dass die Sinusfunktion
auf R \ {kπ | k ∈ Z} stetig ist. Wir beweisen nun die Stetigkeit der Sinusfunktion im Nullpunkt. Ist (x n )n∈N eine
Folge mit limn x n = 0, dann folgt limn cos(x n ) = cos(0) = 1 auf Grund der Stetigkeit der Kosinusfunktion. Es folgt
lim sin(x n )2
n→∞
=
1 − lim cos(x n )2
n→∞
=
0
und somit auch limn sin(x n ) = 0 = sin(0). Auf Grund der Vorbemerkung haben wir damit die Stetigkeit der Sinusfunktion auf ganz R bewiesen.
Nun beweisen wir die Differenzierbarkeit der Kosinusfunktion im Nullpunkt. Wir wissen bereits, dass cos0 (x) =
− sin(x) für alle x ∈ ]−π, π[ \ {0} gilt. Nach (7.31) folgt daraus
cos0 (0)
=
lim cos0 (x)
x→0
=
lim − sin(x)
x→0
=
− sin(0).
Mit Hilfe der Vorbemerkung erhalten wir die Differenzierbarkeit der Kosinusfunktion und die Gültigkeit der Gleichung cos0 (x) = − sin(x) auf ganz R.
—–
184
—–
Zum Schluss beweisen wir die Differenzierbarkeit der Sinusfunktion. Auf dem Intervall ]0, π[ gilt für den Sinus die
p
Gleichung sin(x) = 1 − cos(x)2 , somit liefert die Kettenregel
sin0 (x)
=
1
−2(− sin(x)) cos(x) · p
2 1 − cos(x)2
sin(x) cos(x)
=
sin(x)
=
cos(x).
Wiederum überträgt sich die Gleichung sin0 (x) = cos(x) auf alle x ∈ R \ {kπ | k ∈ Z}. Um die Differenzierbarkeit
im Nullpunkt zu beweisen, wenden wir erneut (7.31) an. Weil die Sinusfunktion auf ganz R stetig ist und sin0 (x) =
cos(x) für alle x ∈ ]−π, π[ \ {0} gilt, erhalten wir
sin0 (0)
=
lim sin0 (x)
x→0
=
lim cos(x)
x→0
=
cos(0).
Auf Grund der Vorbemerkung ist damit sin0 (x) = cos(x) für alle x ∈ R bewiesen.
ƒ
Aus (7.32) folgt, dass Sinus- und Kosinusfunktion beliegt oft differenzierbar sind. Außerdem liefern die Ableitungen
die Entwicklung als Taylorreihe, die wir am Ende des letzten Kapitels angegeben haben. Durch Einsetzen in die
Reihendarstellung sieht man auch, dass cos(−x) = cos(x) und sin(−x) = − sin(x) erfüllen. Die erste Gleichung
erfüllt auch die Funktion x 7→ x k für gerades, die zweite x 7→ x k für ungerades k ∈ Z. Man bezeichnet deshalb den
Kosinus als gerade und den Sinus als ungerade Funktion.
Wir wissen bereits, dass die Kosinusfunktion eingeschränkt auf das Intervall [0, π] eine stetige, bijektive, streng
monoton fallende Funktion [0, π] → [−1, 1] definiert. Die Umkehrfunktion
arccos : [−1, 1] −→ [0, π]
bezeichnet man als Arcus cosinus. Wir haben bereits im Beweis von (7.32) gesehen, dass der Arcus cosinus auf
]−1, 1[ differenzierbar ist, mit der Ableitungsfunktion
arccos0 (x)
=
−p
1
.
1 − x2
Auf Grund der Stetigkeit der Kosinusfunktion, und wegen cos(0) = 1 > 0 und cos(π) = −1 < 0 besitzt cos im offenen
Intervall ]0, π[ eine Nullstelle γ. Weil cos auf [0, π] streng monoton fallend ist, muss dies die einzige Nullstelle sein.
Aus der Gleichung cos(π − γ) = cos(γ − π) = (−1) cos(γ) = 0 folgt γ = 12 π. Wegen cos(x + kπ) = (−1)k cos(x) für
alle x ∈ R und k ∈ Z ist die genaue Nullstellenmenge der Kosinusfunktion durch
¨
«
1
π + kπ k ∈ Z
2
”
—
”
”
gegeben. Insbesondere gilt cos(x) > 0 für alle x ∈ 0, 12 π , wegen cos(x) = cos(−x) sogar für alle x ∈ − 12 π, 12 π .
”
—
Wegen sin0 (x) = cos(x) folgt daraus, dass die Sinusfunktion auf dem abgeschlossenen Intervall − 12 π, 12 π streng
monoton wachsend ist. Mit dem Zwischenwertsatz und den Werten
sin(− 12 π) = −1
sin( 12 π) = 1
und
”
—
zeigt man, dass es sich um eine bijektive Abbildung zwischen − 21 π, 12 π und [−1, 1] handelt. Die Umkehrfunktion
”
—
arcsin : [−1, 1] −→ − 12 π, 21 π
—–
185
—–
nennt man den Arcus sinus. Die Ableitung dieser Funktion kann mit der Umkehrregel bestimmt werden: Für alle
x ∈ ]−1, 1[ und y = arcsin(x) gilt gilt
arcsin0 (x)
1
=
=
sin ( y)
0
1
1
=
cos( y)
p
1 − sin( y)2
=
1
p
.
1 − x2
Schließlich definiert man noch auf dem Definitionsbereich R \ { 21 π + kπ | k ∈ Z} die Tangensfunktion durch
tan(x)
sin(x)
=
cos(x)
.
Mit Hilfe der Quotientenregel bestimmt man die Ableitung; für alle x im Definitionsbereich gilt
tan0 (x)
sin0 (x) cos(x) − sin(x) cos0 (x)
=
cos(x)2 + sin(x)2
=
cos(x)2
=
cos(x)2
1
cos(x)2
.
—
”
Wegen tan0 (x) > 0 für alle x ∈ − 12 π, 21 π ist die Tangensfunktion auf diesem Intervall streng monoton wachsend.
Die Einschränkung der Funktion auf dieses Intervall besitzt die Grenzwerte
lim tan(x) = −∞
lim tan(x) = +∞.
und
x→− 21 π
x→ 12 π
Sei nämlich (x n )n∈N eine Folge mit limn x n = 21 π. Auf Grund der Stetigkeit von Sinus- und Cosinusfunktion gilt dann
limn sin(x n ) = 1, und (cos(x n ))n∈N ist eine Folge positiver Zahlen, die gegen Null konvergiert. Insgesamt erhalten
wir damit limn tan(x n ) = +∞. Den anderen Grenzwert überprüft man auf analoge Weise.
—
”
Die Grenzwerte zeigen, dass die Tangensfunktion eine surjektive Abbildung von − 12 π, 21 π auf R definiert. Ist näm”
—
lich y ∈ R beliebig vorgegeben, dann gibt es auf Grund der uneigentlichen Grenzwerte Punkte a, b ∈ − 21 π, 12 π
mit tan(a) < y und tan(b) > y. Der Zwischenwertsatz liefert dann ein c ∈ ]a, b[ mit tan(c) = y.
—
”
Insgesamt erhält man durch die Einschränkung der Tangensfunktion also eine Bijektion zwischen − 21 π, 12 π und
R. Die Umkehrabbildung
—
”
arctan : R −→ − 12 π, 12 π
bezeichnet man als Arcus tangens. Wiederum kann die Ableitungsfunktion mit Hilfe der Umkehrregel berechnet
werden. Für alle x ∈ R und y = arctan(x) gilt
arctan0 (x)
=
1
tan0 ( y)
cos( y)2
=
cos( y)2
=
cos( y)2
+ sin( y)2
=
1
1 + tan( y)2
=
1
1 + x2
.
Die drei Gleichungen für die Ableitungsfunktionen können natürlich auch in der Form von unbestimmten Integralen
geschrieben werden. Es gilt
Z
p
dx
1−
x2
=
Z
sowie
1
π − arccos(x)
2
=
arcsin(x)
dx
1 + x2
=
für
−1< x <1
arctan(x).
Die Unterschied von 21 π in der oberen Zeile kommt auf Grund der beiden Werte arcsin(0) = 0 und arccos(0) = 12 π
zu Stande.
—–
186
—–
Literaturverzeichnis
[App] J. Appell, Analysis in Beispielen und Gegenbeispielen. Springer-Verlag Heidelberg 2009.
[For] O. Forster, Analysis 1. Vieweg studium Grundkurs Mathematik, Braunschweig 1983.
[Heu] H. Heuser, Lehrbuch der Analysis, Teil 1. Teubner-Verlag Stuttgart 1991.
[Hil] S. Hildebrandt, Analysis 1. Springer-Verlag Heidelberg 2002.
[Koe] K. Königsberger, Analysis 1. Springer-Verlag Berlin 2001.
Herunterladen