Analysis Grundkurs - Institut für Mathematik Potsdam

Analysis Grundkurs
Heinz Junek
Vorlesung im WS/SS 2007-8
Institut für Mathematik
Universität Potsdam
e-mail: [email protected]
10. Juli 2008
2
INHALTSVERZEICHNIS
Inhaltsverzeichnis
1 Grundlagen der Analysis
1
1.1
Logik und Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Der Körper der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.3
Summenzeichen und binomische Formeln . . . . . . . . . . . . . . . . . . .
6
1.4
Suprema und Infima, Vollständigkeitsaxiom . . . . . . . . . . . . . . . . .
7
1.5
Die Approximation reeller Zahlen durch rationale Zahlen . . . . . . . . . .
9
1.6
Existenz- und Eindeutigkeit n-ter Wurzeln . . . . . . . . . . . . . . . . . . 10
2 Elementare Funktionen
13
2.1
Funktionen und deren Eigenschaften . . . . . . . . . . . . . . . . . . . . . 13
2.2
Monotone Funktionen
2.3
Potenzfunktionen mit rationalem Exponenten . . . . . . . . . . . . . . . . 15
2.4
Die Exponentialfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3 Beträge und komplexe Zahlen
21
3.1
Die Betragsfunktion in R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2
Der Körper C der komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . 21
4 Zahlenfolgen und Reihen
25
4.1
Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2
Reelle Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3
Monotone Zahlenfolgen und Intervallschachtelungen . . . . . . . . . . . . . 32
4.4
Häufungspunkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.5
Das Cauchysche Konvergenzkriterium . . . . . . . . . . . . . . . . . . . . . 41
4.6
Topologische Grundbegriffe
4.7
Der Banachsche Fixpunktsatz . . . . . . . . . . . . . . . . . . . . . . . . . 45
5 Zahlenreihen
. . . . . . . . . . . . . . . . . . . . . . . . . . 43
48
5.1
Begriffsbildung und Konvergenzkriterien . . . . . . . . . . . . . . . . . . . 48
5.2
Alternierende Reihen in R . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.3
Absolut konvergente Reihen in R und C . . . . . . . . . . . . . . . . . . . 53
5.4
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.5
Exponential- und trigonometrische Funktionen . . . . . . . . . . . . . . . . 61
INHALTSVERZEICHNIS
6 Stetigkeit
3
66
6.1
Einführung und Begriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.2
Stetigkeit klassischer Funktionen
6.3
Stetige Funktionen auf kompakten Intervallen . . . . . . . . . . . . . . . . 70
6.4
Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.5
Ganzrationale und gebrochen rationale Funktionen . . . . . . . . . . . . . 76
6.6
Sinus, Kosinus und Logarithmus in R und C . . . . . . . . . . . . . . . . . 80
7 Differentialrechnung
. . . . . . . . . . . . . . . . . . . . . . . 68
87
7.1
Differenzierbarkeit und Differentiationsregeln . . . . . . . . . . . . . . . . . 87
7.2
Differentiation elementarer Funktionen . . . . . . . . . . . . . . . . . . . . 91
7.3
Mittelwertsätze der Differentialrechnung . . . . . . . . . . . . . . . . . . . 95
7.4
Der Satz von Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7.5
Taylorreihen und analytische Funktionen . . . . . . . . . . . . . . . . . . . 102
7.6
Kurvendiskussionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
7.7
Partielle Ableitungen und Gradient . . . . . . . . . . . . . . . . . . . . . . 111
7.8
Extremwerte für Funktionen mit mehreren Variablen . . . . . . . . . . . . 120
8 Integralrechnung
123
8.1
Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.2
Eigenschaften Riemannscher Integrale . . . . . . . . . . . . . . . . . . . . . 129
8.3
Mittelwertsätze der Integralrechnung . . . . . . . . . . . . . . . . . . . . . 133
8.4
Hauptsatz der Differential– Integralrechnung . . . . . . . . . . . . . . . . . 134
8.5
Integrationsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
8.6
Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . . . . . 141
8.7
Vertauschung von Limes und Integral . . . . . . . . . . . . . . . . . . . . . 144
8.8
Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
8.9
Integration und Inhaltslehre . . . . . . . . . . . . . . . . . . . . . . . . . . 149
8.10 Gebietsintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
8.11 Die Transformationsformel . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
8.12 Das Volumen der n-dimensionalen Kugel . . . . . . . . . . . . . . . . . . . 162
8.13 Kurven und Bogenlängen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
8.14 Oberflächeninhalte und Flächenintegrale . . . . . . . . . . . . . . . . . . . 167
8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ? . . . . . . . . . . . . . . . . 170
4
INHALTSVERZEICHNIS
9 Ergänzungen
174
9.1
Der Approximationssatz von Weierstrass . . . . . . . . . . . . . . . . . . . 174
9.2
Metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
9.3
Kompakte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
9.4
Wege zur Einführung der Exponentialfunktion f (x) = ex . . . . . . . . . . 181
9.5
Die logische Abhängigkeit der zentralen Sätze . . . . . . . . . . . . . . . . 183
9.6
Kontrollfragen zur Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 184
1
1
1.1
Grundlagen der Analysis
Logik und Mengenlehre
(1) Die mathematische Logik behandelt logische Aussagen, Wahrheitswertfunktionen
und deren Zusammensetzungen. Eine Aussage ist ein sprachliches Gebilde, dem genau
einer der Wahrheitswerte W oder F zukommt. Z.B. (3 teilt 6) = W oder (5 teilt 6) = F .
Eine Aussageform ist ein Ausdruck mit einer freien Variablen x, aus dem bei Belegung
der Variablen x mit Objekten eines Grundbereiches X eine Aussage entsteht. Eine
Aussageform ist z.B. x teilt 60“ Ḋies ist weder wahr noch falsch. Belegt man x aber mit
”
natürlichen Zahlen, so ergeben sich Aussagen:
(Für x = 3 gilt x teilt 60) = W und (Für x = 7 gilt x teilt 60) = F .
Über die Gültigkeit einer Aussage (Elementaraussage) entscheidet die jeweilige Wissenschaft. Die Logik untersucht dagegen den Wahrheitsgehalt von Zusammensetzungen von
Aussagen.
Die Wahrheitswertvariablen p, q, ... stehen für Aussagen. Wichtig ist in der Logik nur,
dass sie die Wahrheitswerte W oder F annehmen können.
(2) Für die Bildung zusammengesetzter logischer Ausdrücke sind die folgenden
klassischen Wahrheitswertfunktionen besonders wichtig:
Name
Konjunktion
Alternative
(nicht ausschließendes ”oder”)
Negation
Implikation
(Prämisse ⇒ Conclusio)
Äquivalenz
Sprachliche Bedeutung Bezeichnung
p und q
p∧q
p oder q
p∨q
nicht p
¬p
wenn p dann q
p⇒q
p gdw q
p⇔q
Diese Wahrheitswertfunktionen sind durch ihre Wertetabellen, die man in diesem Fall
Wahrheitswerttabellen nennt, definiert (Tabellen verstehen und lernen!):
p
W
W
F
F
q
W
F
W
F
p∧q
W
F
F
F
p∨q
W
W
W
F
p⇒q
W
F
W
W
p⇔q
W
F
F
W
¬p
F
W
-
Besonders hingewiesen werden sollte auf die Definition der Wertetafel für die Implikation.
Der Ansatz (F ⇒ W ) = W ist von vornherein nicht unbedingt klar. Sicher sollte
man aber (F ⇒ W ) 6= F setzen, die Zweiwertigkeit der Logik erfordert dann aber
(F ⇒ W ) = W .
2
1 GRUNDLAGEN DER ANALYSIS
(3) Zwei Aussageverbindungen heißen logisch äquivalent, wenn ihre Wahrheitswerttabellen wertverlaufsgleich sind. Äquivalente Aussagen können logisch als völlig
gleich-wertig betrachtet werden. Der Ersatz einer Aussage durch eine logisch äquivalente
Aussage ist eine wesentliche Grundtechnik beim Führen von Beweisen. Besonders wichtig
sind die folgenden Äquivalenzen:
¬¬p
äquivalent zu p
¬(p ∨ q) äquivalent zu ¬p ∧ ¬q
¬(p ∧ q) äquivalent zu ¬p ∨ ¬q

(Doppelte Negation) 
(Negation der Alternative) (Begründung?)

(Negation der Konjunktion)
Für den Nachweis der Gültigkeit von Implikationen werden folgende Äquivalenzen sehr
oft benutzt:
p ⇒ q äquivalent zu ¬p ∨ q
¬(p ⇒ q) äquivalent zu p ∧ ¬q
und äquivalent zu ¬q ⇒ ¬p
(Kontraposition)
(Indirekter Beweis)
(Beweis ebenfalls durch Vergleich der Wahrheitswerttabellen).
(4) Die Mengenlehre wurde als sprachliches Instrument der Mathematik um
1880 von Georg Cantor bei der Untersuchung komplizierter analytischer Sachverhalte
(Konvergenzpunkte von Fourier–Reihen) in naiver Form geschaffen. Nach Georg
Cantor entsteht eine Menge durch Anwendung des sogenannten
Mengenbildungsaxioms: Ist H(x) eine beliebige Aussageform über einem Grundbereich X, so kann die Menge M aller Elemente x aus X, für die H(x) wahr wird, gebildet
werden. In Zeichen schreibt man:
M = {x : H(x) = W} oder einfach M = {x : H(x)}.
Gehört ein Element x aus X zu M , so schreibt man x ∈ M . Bertrand Russell zeigte
mit seiner berühmten Antinomie, dass die naive Mengenlehre bei zu großzügiger Interpretation der Mengenbildung zu Widersprüchen führt. Nach Cantor müsste es nämlich
möglich sein, die Menge
M = {A : A ist eine Menge und A 6∈ A}
zu bilden. Da aber sowohl die Annahme M 6∈ M als auch die Annahme M ∈ M zum
Widerspruch führt, kann M nicht existieren. Im Grunde ist diese Antinomie bereits aus
der Antike bekannt: Ein Kreter behauptet, dass alle Kreter lügen.
Dieser Antinomie kann dadurch ausgewichen werden, dass man der Enthaltenseins–
Relation ∈ die Restriktion auferlegt, dass eine Menge sich nicht selbst als Element
enthalten kann. Damit wird die Existenz einer Menge aller Mengen ausgeschlossen,
und die Russellsche Menge kann nicht mehr gebildet werden. Die exakte Ausführung
dieses Ansatzes wurde in der Form eines Stufenaufbaus von Russell und in der Form
eines Klassenkalküls von v.Neumann/Bernays/Gödel in den vierziger Jahren des
20. Jh. durchgeführt. Heutzutage benutzt man alternativ das Axiomensystem von
1.1 Logik und Mengenlehre
3
Zermelo/Fraenkel (ZF). Auf Details der axiomatischen Mengenlehre soll hier aber nicht
eingegangen werden.
(5) Mengenoperationen: Die Wahrheitswertfunktionen erlauben ein Operieren mit
Mengen. Die wichtigsten Mengenoperationen sind die folgenden: Es seien A und B
irgendwelche Teilmengen eines Grundbereiches X. Man bildet:
A∪B = {x : x ∈ A∨x ∈ B}
A∩B = {x : x ∈ A∧x ∈ B}
A \ B = {x : x ∈ A ∧ x 6∈ B}
A = {x ∈ X : x 6∈ A}
Vereinigung von A und B
Durchschnitt von A und B
Differenz von A und B
Komplementärmenge von A.
Vereinigung und Durchschnitt können auch für Systeme (Aj )j∈J von Mengen statt nur
für zwei Mengen definiert werden.
(6) Unter den vielen Rechenregeln für Mengen sind die folgenden besonders wichtig:
A∩B =A∪B
A∪B =A∩B
o
de Morgansche Formeln
A=A
(Beweis der Formeln?)
(7) Weitere Mengen werden auf folgende Weise konstruiert. Es seien X, Y beliebige Mengen.
Potenzmenge:
Kreuzmenge:
P(X) = {M : M ⊆ X} = Menge aller Teilmengen von X
X × Y = {(x, y) : x ∈ X ∧ y ∈ Y }
Die Kreuzmenge wird z.B. zur Definition des n–dimensionalen reellen Raumes benötigt:
Rn := R × . . . × R = {(x1 , . . . , xn ) : xi ∈ R}.
Schließlich führen wir die Menge aller Funktionen von X nach Y ein:
Y X = {f : f ist Funktion von X in Y }.
(8) Endliche Mengen sind solche Mengen, deren Elemente sich mit einem Abschnitt
[1, . . . , n] von natürlichen Zahlen durchnummerieren lassen. Endliche Mengen lassen sich
daher durch Aufzählung ihrer Elemente, z.B. in der Form M = {x1 , . . . , xn } angeben. Die
eindeutig bestimmte Zahl n heißt dabei die Anzahl der Elemente von M oder auch die
Kardinalzahl von M , bezeichnet durch card(M ). Sind X und Y endliche Mengen, so
gelten (Beweis?):
card(P(X)) = 2card(X) , card(Y X ) = card(Y )card(X) .
Die letzte Gleichung zeigt insbesondere, dass die Bezeichnung Y X für die Menge aller
Funktionen von X in Y sehr geschickt gewählt ist. Man mache sich klar, dass auch die
Bezeichnung Rn oder genauer R{1,...,n} als Spezialfall dieser Symbolik aufgefasst werden
kann.
4
1 GRUNDLAGEN DER ANALYSIS
1.2
Der Körper der reellen Zahlen
(1) Zur Bezeichnung der uns bekannten Zahlbereiche benutzen wir folgende Symbolik:
Natürliche Zahlen: N = {0, 1, 2, . . .};
N∗ = N \ {0}
Ganze Zahlen:
Z = {0, ±1, ±2, . . .}
Rationale Zahlen: Q
Reelle Zahlen:
R
Komplexe Zahlen: C
Die Axiome des geordneten Körpers der reellen Zahlen:1
Axiom 1: Addition und Multiplikation in R sind wohldefiniert und es gelten:
(a + b) + c = a + (b + c) und (a · b) · c = a · (b · c).
(Assoziativgesetze)
Axiom 2: Stets gelten a + b = b + a und a · b = b · a.
(Kommutativgesetze)
Axiom 3: Die Addition ist umkehrbar, die Multiplikation ist bedingt umkehrbar, d.h.:
Jede Gleichung der Form a + x = b besitzt genau eine Lösung x, die mit x = b − a
bezeichnet wird, und jede Gleichung a · y = b besitzt im Fall a 6= 0 genau eine Lösung
y = b : a = b/a.
(Umkehrbarkeit der Operationen)
Axiom 4: Stets gilt (a + b) · c = a · c + b · c.
(Distributivgesetz)
Axiom 5: Für alle x ∈ R gilt x ≤ x.
(Reflexivität)
Axiom 6: Aus x ≤ y und y ≤ x folgt stets x = y.
(Antisymmetrie)
Axiom 7: Aus x ≤ y und y ≤ z folgt stets x ≤ z.
(Transitivität)
Axiom 8: Für alle Paare x, y ∈ R gilt einer der Fälle x ≤ y oder x ≥ y.
(Linearität)
Axiom 9: Aus a < b folgt a + c < b + c für alle c ∈ R. (Monotoniegesetz der Addition)
Axiom 10: Aus a < b und c > 0 folgt a · c < b · c. (Monotoniegesetz der Multiplikation)
Axiom 11 Jede nach oben beschränkte, nichtleere Menge A ⊆ R hat in R ein Supremum.
.
(Vollständigkeitsaxiom, Details s. später.)
1
Zahlen haben sich als ein sehr geeignetes Instrument zur quantitativen Analysis von Sachverhalten
in Theorie und Praxis erwiesen. Die Mindestanforderung an eine quantitative Methode besteht nämlich
darin, dass man die Daten vergleichen und mittels der vier Grundrechenoperationen verarbeiten kann.
Die kleinste mathematische Struktur mit diesen Eigenschaften ist der Körper Q der rationalen Zahlen.
Für höhere Rechenoperationen, etwa das Wurzelziehen, ist dieser Zahlenbereich jedoch noch zu klein,
z.B. hat die Gleichung x2 = 2 keine rationalen Lösungen.Die Basis für die Analysis ist daher der größere
Körper R der reellen Zahlen. Die Existenz und die Eigenschaften dieser Struktur postulieren wir in den
folgenden Axiomen. Den diffizilen Nachweis, dass es eine solche Struktur überhaupt gibt, holen wir später
nach.
1.2 Der Körper der reellen Zahlen
5
Aus diesen wenigen Axiomen lassen sich nun weitere wichtige Formeln ableiten. Von
besonderer Bedeutung für den Aufbau der Analysis sind dabei die nachfolgenden
Sachverhalte. Wir beginnen mit einer Ergänzung zu Axiom 10:
Satz 1.1 Aus a < b und c < 0 folgt a · c > b · c.
Beweis: Aus c < 0 folgt durch Addition von −c aus Axiom 9 die Ungleichung 0 < −c. Die
Multiplikation der Ungleichung a < b mit der positiven (!) Zahl −c ergibt nach Axiom
10 die Aussage −a · c < −b · c, und durch Umstellen mit Axiom 9 folgt die Behauptung
b · c < a · c.
Heimlich haben wir bei diesem Beweis noch von der Gleichung a · (−c) = −(a · c) Gebrauch gemacht. Die Gültigkeit dieser Formel folgt mit Axiom 4 aber aus der Gleichung
a · c + a · (−c) = a · (c − c) = a · 0 = 0, denn dann muss das Produkt a · (−c) nach Axiom
3 das eindeutig bestimmte Entgegengesetzte zu a · c sein.
Satz 1.2 Für alle x ∈ R gilt x2 ≥ 0.
Beweis: Ungleichungen beweist man häufig durch Fallunterscheidungen, die auf Axiom 8
beruhen: Aus x = 0 folgt x2 = 0. Ist x > 0, so folgt x · x > x · 0 nach Multiplikation mit
x wegen Axiom 10. Ist x < 0, so folgt auch x · x > x · 0 = 0, diesmal wegen Satz 1.1
Satz 1.3 (Bernoullische2 Ungleichung) Für alle h ≥ −1 und alle natürlichen Zahlen
n ≥ 0 gilt 1 + nh ≤ (1 + h)n .
Beweis: Aussagen mit natürlichzahligen Parametern werden häufig mittels vollständiger
Induktion bewiesen. Für den Induktionsanfang n = 0 ist die Ungleichung trivial gültig.
Sie gelte nun für festes n ∈ N. Durch Multiplikation von (1 + h)n ≥ 1 + nh mit der
nichtnegativen (!) Zahl 1 + h ergibt sich die Abschätzung
(1+h)n+1 = (1+h)(1+h)n ≥ (1+h)(1+nh) = 1+h+nh+nh2 ≥ 1+h+nh = 1+(n+1)h.
Damit ist die Bernoullische Ungleichung für alle n ∈ N bewiesen.
An dieser Stelle eine Bemerkung zur Bedeutung von Ungleichungen. Durch die Vorsilbe
”un” ist dieses Wort im Deutschen negativ belegt und betont die Ungleichheit. Daraus
resultiert beim Anfänger häufig eine Unterschätzung des Wertes von Ungleichungen. Man
muss sich aber klar machen, dass eine Ungleichung bereits eine ”halbe” Gleichung ist und
dass in den Fällen, in denen ein äquivalentes Umformen von Ausdrücken zu schwierig
oder gar nicht mehr möglich ist, mit einer Abschätzung wenigstens noch eine Teilaussage
erhalten werden kann. Die Bernoullische Ungleichung lässt auch eine geometrische Interpretation zu: Der Graph der linearen Funktion g(h) = 1 + nh liegt unterhalb des Graphen
von f (h) = (1 + h)n und wegen g(0) = f (0) = 1 ist g(h) = 1 + nh die Gleichung der
Tangente im Punkt (0, 1).
2
Jakob Bernoulli (1654-1705). Zum Bernoullischen Stammbaum gehören ferner die Mathematiker:
Johann B. (1667-1748, jüngster Bruder Jakobs); Niklaus B. (1687-1759), Neffe und Schüler von Jakob
und Johann); Daniel B. (1700-1782, Sohn von Johann).
6
1 GRUNDLAGEN DER ANALYSIS
1.3
Summenzeichen und binomische Formeln
Definition 1.4 (Das Summenzeichen)
Zahlen definieren wir:

n
 am + . . . + an
X
am
ai =

i=m
0
Für jedes System a0 , a1 , . . . , an von reellen
für
für
für
m < n,
m = n,
m > n.
(leere Summe)
Satz 1.5 (Rechenregeln) (Beweis?)
(a)
n
P
ai +
i=0
(b)
n
P
n
P
i=0
ai =
i=0
(c)
bi =
n
P
i=m
m
P
(ai + bi ),
(Additivität)
i=0
n
P
ai +
i=0
ai =
n
P
ai
für
0 ≤ m ≤ n,
(Zerlegungsformel)
i=m+1
n+k
P
ai−k
für alle
k ∈ N.
(Indexverschiebung)
i=m+k
Aufgabe: Beweisen Sie die arithmetische Summenformel:
n
P
i=1
i=
n(n+1)
!
2
Wir wollen nun die bekannten binomischen Formeln
(x ± y)2 = x2 ± 2xy + y 2 und x2 − y 2 = (x − y)(y + x)
auf höhere Potenzen als 2 verallgemeinern. Wir beginnen mit der letzten dieser Formeln:
Satz 1.6 (Drei Varianten der geometrischen Summenformel) Für alle x, y ∈ R
und alle n ∈ N gelten:
x
n+1
−y
n+1
= (x − y) ·
1 − y n+1 = (1 − y)
n
X
xn−k y k
k=0
n
X
y k = (1 − y)(1 + y + . . . + y n )
(1)
(2)
k=0
n
X
k=0
yk =
1 − y n+1
1−y
(3)
Der Beweis kann durch Polynomdivision oder durch vollständige Induktion geführt
werden. (Ausführen!) Die zweite Formel ist ein Spezialfall der ersten (x = 1).
Die Verallgemeinerung der ”ersten” binomischen Formel erfordert eine Vorbereitung:
1.4 Suprema und Infima, Vollständigkeitsaxiom
7
Definition 1.7 (Der Binomialkoeffizient) Für n, p ∈ N setzen wir
n
n(n − 1) · . . . · (n − p + 1)
(gelesen: n über p)
=
p
1 · 2 · ... · p
Für p > n ist np = 0, für n ≥ p gibt np die Anzahl der Auswahlmöglichkeiten von p
Objekten aus einem Vorrat von n Objekten an. Durch Nachrechnen (ausführen!) beweist
man für n ≥ p die Formel:
n
n
n+1
+
=
(Additionstheorem für Binomialkoeffizienten)
p
p+1
p+1
Auf dieser Formel beruht das Pascalsche Dreieck zur Berechnung der Zahlen np .
Satz 1.8 (Binomischer Lehrsatz)
n X
n n−j j
n
(x + y) =
x y für alle x, y ∈ R und n ∈ N.
j
j=0
Beweis: Induktiv unter Verwendung des Additionstheorems oder alternativ durch kombinatorische Überlegungen, wie oft der Term xn−j y j beim Ausmultiplizieren entsteht.
1.4
Suprema und Infima, Vollständigkeitsaxiom
Die Axiome 1 - 10 sind auch im Zahlbereich Q erfüllt, aber die besondere Qualität von R
gegenüber Q besteht in dem nun zu erörternden Axiom 11, dem Vollständigkeitsaxiom.
Wir schaffen uns zunächst das notwendige Instrumentarium:
Definition 1.9 Es sei A eine beliebige Teilmenge von R.
1. A heißt nach oben beschränkt, wenn es eine Zahl x ∈ R mit a ≤ x für alle a ∈ A gibt.
Jedes x mit dieser Eigenschaft heißt eine obere Schranke von A.
2. Falls A eine kleinste obere Schranke hat, so heißt diese das Supremum von A. Es gilt
also
x = sup A ⇔ a) x ist eine obere Schranke von A und
b) ist x0 eine weitere obere Schranke von A, so gilt x ≤ x0 .
Die Bedingung b) ist äquivalent zu:
∗
b ) keine Zahl z < x ist eine obere Schranke von A, d.h.:
Zu jedem z < x existiert ein a ∈ A mit z < a ≤ x.
Untere Schranken und Infima (größte untere Schranken) werden analog definiert.
Axiom 11 (Vollständigkeitsaxiom in R): Jede nach oben beschränkte, nichtleere Menge
A ⊆ R hat in R ein Supremum.
Diese Axiom bildet die Grundlage für die gesamte Analysis, wir werden es sehr bald in
Aktion erleben! Vorerst leiten wir einige Konsequenzen ab.
8
1 GRUNDLAGEN DER ANALYSIS
Satz 1.10 Sind ∅ =
6 A, B ⊆ R nach oben beschränkte Mengen, so gilt
sup A + sup B = sup(A + B).
Ist zusätzlich ∅ =
6 A, B ⊆ R+ , so ist
sup A · sup B = sup(A · B)
Hierbei bedeuten A + B = {a + b : a ∈ A, b ∈ B} und A · B = {a · b : a ∈ A, b ∈ B}.
Beweis: Wir begnügen uns mit dem Beweis der additiven Formel: Es seien x = sup A und
y = sup B. Dann gilt a+b ≤ x+y für alle a ∈ A und alle b ∈ B nach dem Monotoniegesetz.
Insbesondere existiert s = sup(A + B), und es gilt s ≤ x + y. Wäre aber s < x + y, so
wäre g = x + y − s > 0. Wegen x = sup A und y = sup B existieren nach Definition des
Supremums Zahlen a ∈ A und b ∈ B mit x − g2 < a und y − g2 < b, und hieraus würde
s = x + y − g < a + b ≤ s folgen. Widerspruch.
Satz 1.11 (Archimedisches3 Axiom oder Axiom des Messens): Sind a, b beliebige
reelle Zahlen mit a > 0, so existiert eine natürliche Zahl n ∈ N mit b < na.
Beweis: Wäre na ≤ b für alle n ∈ N, so wäre die Menge A = {na : n ∈ N} nach oben
durch b beschränkt. Wegen Axiom 11 existiert s = sup A, und nach (2) führt das auf den
Widerspruch s < s + a = sup{0, a, 2a, . . .} + sup{a} = sup{a, 2a, 3a, · · · } ≤ s.
Aufgaben zu Suprema, Infima, Maxima und Minima
Die Begriffe Supremum und Infimum bereiten Anfängern immer Schwierigkeiten. Das
liegt in der Natur der Sache, denn hiermit wird man erstmals in voller Schärfe mit
dem Unendlichen konfrontiert! Bei der Übertragung der Erfahrungen im Umgang mit
endlichen Mengen auf unendliche Mengen muss höchste Vorsicht geboten sein. So gibt es
in jeder endlichen Menge A von Zahlen natürlich eine kleinste Zahl, die das Minimum von
A genannt wird. Unendliche Mengen müssen aber kein Minimum haben, beispielsweise
gibt es keine kleinste positive reelle Zahl! Supremum und Infimum dienen in gewisser
Weise als Ersatz für Maxima und Minima.
(1) Aufgabe: Man berechne: a) sup
n
n+1
∗
: n ∈ N , b) sup n+1
:
n
∈
N
!
n
(2) Aufgabe: Es sei A eine nichtleere Teilmenge von R. Man sagt, dass A ein (absolutes
oder globales) Maximum hat, wenn es ein Element x ∈ A mit a ≤ x für alle a ∈ A gibt.
Analog wird das Minimum definiert. Beantworten Sie:
a) Ist das Maximum einer Menge auch ihr Supremum?
b) Hat die Menge A = {x : x ∈ R und x < 0} ein Maximum/Supremum?
c) Hat die Menge A = {arctan x : x ∈ R} ein Maximum/Supremum?
3
Archimedes (287?-212 v.Chr.), Syrakus, ”Integralrechnung”, Hebelgesetz, Archimedisches Prinzip.
1.5 Die Approximation reeller Zahlen durch rationale Zahlen
9
d) Welchen Wert hat inf{x2 − 4x + 6 : x ∈ R}?
(3) Aufgabe: a) Geben Sie die ausführliche Definition des Infimums an!
b) Es sei ∅ =
6 A ⊆ R, und es sei B = {−a : a ∈ A} die Menge der entgegengesetzen
Elemente. Zeigen Sie inf A = − sup B, falls wenigstens eine der beiden Größen existiert!
c) Beweisen Sie die zu Axiom 11 ergänzende Aussage: Jede nach unten beschränkte,
nichtleere Teilmenge A ⊆ R hat in R ein Infimum.
(4) Aufgabe: Beweisen Sie das Komplement zu Satz 1.10: Sind ∅ 6= A, B ⊆ R nach
unten beschränkt, so gilt inf A + inf B = inf(A + B).
(5) Aufgabe: Beweisen Sie die multiplikative Formel in Satz 1.10: Sind die Mengen
∅=
6 A, B ⊆ R+ nach oben beschränkt, so gilt sup A · sup B = sup(A · B).
(6) Aufgabe: Das Archimedische Axiom ermöglicht das Messen großer Entfernungen.
Zeigen Sie, dass damit auch das Teilen im Mikrobereich möglich wird: Zu jeder (kleinen)
positiven Zahl a gibt es eine natürliche Zahl n mit 0 < n1 < a! Beweisen Sie dies!
(7) Bemerkung: a) Wegen Aufgabe (6) gibt gibt es Grenzen in der Anwendbarkeit der
rellen Zahlen zur Beschreibung des Mikrokosmos, denn die Heisenbergsche Unschärferelation verbietet in gewissem Sinn ein Messen beliebig kleiner Abstände. Verzichtet man
jedoch auf das Archimedische Axiom, so ist wegen des Beweises zu Satz 1.11 auch das
Vollständigkeitsaxiom nicht mehr zu haben! Das Ergebnis wäre eine sehr viel schwierigere
nichtarchimedische Analysis, die neuerdings als p-adische Analysis auch entwickelt wurde.
b) In Anbetracht der soeben genannten Bedenken und den noch zu erörternden, weitreichenden Konsequenzen aus dem Vollständigkeitsaxiom erhebt sich die grundlegende Frage
nach der Existenz des Zahlbereiches R überhaupt! Hier ist keine Zeit für dieses knifflige
Problem, lesen Sie in der Literatur nach (z.B. Junek, Analysis, Abschnitte 1.3, 3.4 und
3.7).
1.5
Die Approximation reeller Zahlen durch rationale Zahlen
Wir zeigen in diesem Abschnitt, dass reelle Zahlen näherungsweise durch rationale Zahlen
beschrieben werden können.
Satz 1.12 Zu jeder rellen Zahl b existiert genau eine ganze Zahl m mit m ≤ b < m + 1.
Diese heißt der ganze Teil von b, in Zeichen m = Int(b). (integer = ganze Zahl)
Beweis: Es genügt, den Beweis für b > 0 zu führen. Mit a = 1 folgt aus dem Archimedischen Axiom, dass eine natürliche Zahl m mit b < (m + 1) · 1 = m + 1 existiert. Es sei m
die kleinste natürliche Zahl mit dieser Eigenschaft. Dann ist also m ≤ b < m + 1.
Satz 1.13 (Dichtheitsaxiom): Zu jedem Paar x, y reeller Zahlen mit x < y existiert
eine rationale Zahl r mit x < r < y.
10
1 GRUNDLAGEN DER ANALYSIS
Beweis: Wegen y − x > 0 existiert nach dem Archimedischen Axiom ein n ∈ N mit
1 < n · (y − x). Weiter gibt es zu nx nach (1) ein m ∈ Z mit m ≤ nx < m + 1. Also ist
< y.
nx < m + 1 ≤ nx + 1 < nx + n(y − x) = ny und folglich x < m+1
n
Satz 1.14 (Approximation reeller Zahlen durch rationale Zahlen): Für jede reelle
Zahl x gilt x = sup{r ∈ Q : r < x}.
Beweis: Es sei A = {r ∈ Q : r < x}. Wegen (1) ist A 6= ∅. Daher existiert s = sup A und
sicher ist s ≤ x. Wäre aber s < x, so gäbe es nach dem Dichtheitsaxiom eine rationale
Zahl r mit s < r < x im Widerspruch zur Definition von s.
1.15 (Die Dezimalbruchdarstellung reeller Zahlen) Es sei x ∈ R mit x ≥ 0 beliebig gegeben. Die Zahlen xk = 10−k · Int (10k · x) für k ∈ N sind rational, haben eine kstellige Dezimalbruchdarstellung
xk = a0 , a1 a2 . . . ak und erfüllen die Ungleichung xk ≤ x.
√
(Für x = 2 ist z.B. x0 = 1; x1 = 1, 4; x2 = 1, 41; . . .) Sie heißen daher untere dezimale
Näherungen von x. Wir zeigen x = sup{xk : k ∈ N}. Falls x0 = sup{xk : k ∈ N} < x
wäre, so existierte nach Archimedes eine Zahl n ∈ N mit 1 < n(x − x0 ) < 10n (x − x0 ) =
10n x − 10n x0 . Dann wäre aber 10n xn = Int (10n x) ≥ Int (10n x0 + 1) > 10n x0 im Widerspruch zu xn ≤ x0 . In diesem Sinn kann jedem x ≥ 0 eine
Dezimalbruchentwicklung: x = a0 , a1 a2 a3 . . .
zugeordnet werden. Das Rechnen mit den dezimalen Näherungen beruht auf Satz 1.10:
Sind {xk : k ∈ N} und {yk : k ∈ N} die unteren dezimalen Näherungen zu x, y ≥ 0, so
gelten:
x + y = sup{xk : k ∈ N} + sup{yk : k ∈ N} = sup{xk + yk : k ∈ N},
x · y = sup{xk : k ∈ N} · sup{yk : k ∈ N} = sup{xk · yk : k ∈ N}.
1.6
Existenz- und Eindeutigkeit n-ter Wurzeln
Die Nichtlösbarkeit der Gleichung x2 = 2 im Zahlbereich Q war ein Hauptmotiv für die
Erweiterung von Q zu R . Wir zeigen nun, dass in R diese und ähnliche Aufgaben lösbar
sind.
Satz 1.16 Zu jeder natürlichen Zahl n ≥ 1 und jeder reellen Zahl a ≥ 0 existiert genau
√
eine Zahl w ≥ 0 mit wn = a. Diese Zahl heißt die n-te Wurzel aus a, in Zeichen w = n a.
Beweis: Eindeutigkeit: Aus 0 ≤ w1 < w2 folgt w1n < w2n , aus w1 6= w2 also w1n 6= w2n .
Existenz: Es sei a > 0. Zunächst gilt xn = a genau dann, wenn x eine Nullstelle der
Funktion f (x) = xn − a ist. Zur Ermittlung der Nullstellen von f wenden wir das Newtonsche4 Tangentenverfahren an (s. Fig. 38). Die Idee besteht in folgendem: Wir wählen
einen beliebigen Startwert x0 > 0 mit xn0 ≥ a. (Eine solche Zahl existiert wegen des
4
Isaac Newton (1643-1727), Professor in Cambridge, England
1.6 Existenz- und Eindeutigkeit n-ter Wurzeln
11
Abbildung 1: Newtonsches Tangentenverfahren
Archimedischen Axioms). Dann legen wir die ”Tangente” g im Punkt (x0 , f (x0 )) an die
Kurve y = f (x). Die Nullstelle der linearen Funktion g ist dann eine Verbesserung von
x0 , und wir erwarten, dass bei fortgesetzter Wiederholung des Verfahrens näherungsweise
eine Nullstelle von f berechnet werden kann. Zur analytischen Durchführung dieser Idee
auf der Basis der bisherigen Axiome benötigen wir die Gleichung der ”Tangente”. Aus
der Bernoullischen Ungleichung 1 + nh ≤ (1 + h)n folgt mit h = xx0 − 1 für alle x ≥ 0 die
Ungleichung
xn
x
≤ n.
1+n
x0
x0
Nach Multiplikation mit xn0 und Subtraktion von a ergibt sich daraus
g(x) := (xn0 − a) + nxn−1
(x − x0 ) ≤ xn − a = f (x) für alle x ≥ 0.
0
(∗)
Also stellt die soeben eingeführte lineare Funktion g wirklich eine Tangente an f im Punkt
(x0 , f (x0 )) mit Nullstelle bei
xn − a
x1 = x0 − 0 n−1
nx0
dar. Wegen (*) ist g(0) ≤ 0 − a < 0 ≤ xn0 − a = g(x0 ). Somit gelten 0 < x1 ≤ x0 und
0 = g(x1 ) ≤ xn1 − a (nochmals (*)). Wir können daher das Verfahren mit x1 statt x0
wiederholen. Auf diese Weise erhalten wir rekursiv Zahlen
xj+1 = xj −
xnj − a
mit 0 < xj+1 ≤ xj und 0 ≤ xnj+1 −a für alle j ∈ N.
nxn−1
j
(∗∗)
Wegen Axiom 11 existiert das Infimum w = inf{xj : j ∈ N}. Wir zeigen wn = a: Durch
Umstellen von (**) folgt xj+1 · n · xjn−1 + xnj − a = nxnj , und der Übergang zum Infimum
liefert wegen Satz 1.10 wie gewünscht wn = a.
Die im Beweis zu Satz 1.16 verwendete Iterationsformel (**) liefert auch eine effektive und
sehr schnell konvergierende Methode zur näherungsweisen Berechnung von Wurzeln. Geometrisch ergeben sich die xn wie in Abbildung 7.1 dargestellt. Das angegebene Verfahren
hat weit über die Berechnung reeller Wurzeln Bedeutung, die gleiche Technik kann beispielsweise auch angewandt werden, um sogenannte positiv definite Matrizen als Quadrate
von Matrizen zu schreiben.
Aufgaben
1. Berechnen Sie w =
√
2 auf 18 Dezimalstellen (Taschenrechner erlaubt).
12
1 GRUNDLAGEN DER ANALYSIS
p√
√
√ √
√
2. Beweisen Sie durch Probe n ab = n a · n b und n m a = n·m a für a, b ≥ 0.
√
3. Zeigen Sie 2 ∈
/ Q. Geben Sie eine irrationale Zahl x ∈ [0, 1] an.
4. Zeigen Sie: Zu je zwei rationalen Zahlen p < q existiert eine irrationale Zahl x mit
p < x < q.
√
5. Zeigen Sie inf{ n x : n ∈ N∗ } = 1 für alle x > 1. Hinweis: Beweisen Sie unter
Verwendung der Bernoullischen Ungleichung zunächst die Ungleichung:
√
n
x≤1+
x−1
.
n
13
2
2.1
Elementare Funktionen
Funktionen und deren Eigenschaften
Funktionen werden in der modernen Mathematik losgelöst von der Frage ihrer Berechnungsmöglichkeit zunächst als reine Objekte der Mengenlehre definiert.
Definition 2.1 Es seien X und Y nichtleere Mengen. Unter einer Funktion verstehen
wir ein Tripel (X, g, Y ), wobei g eine Teilmenge von X × Y mit der folgenden Eigenschaft
ist :
Sind (x, y1 ), (x, y2 ) ∈ g, so ist y1 = y2 . (Nacheindeutigkeit)
Die Menge X heißt Vorbereich der Funktion, die Menge Y heißt Nachbereich von g.
Statt (X, g, Y ) werden meistens die ausdrucksvollere Symbolik g : X → Y benutzen oder
auch einfach g schreiben. Die Mengen
D(g) = {x ∈ X : Es existiert ein y ∈ Y mit (x, y) ∈ g},
W (g) = {y ∈ Y : Es existiert ein x ∈ Xmit (x, y) ∈ g}
heißen Definitions- bzw. Wertebereich von g.
Nach obigem gehört zu jedem x ∈ D(g) genau ein Wert y ∈ Y mit (x, y) ∈ g. Dieser Wert
heißt der Funktionswert von x und wird durch y = g(x) bezeichnet. Zwei Funktionen
f : X → Y und g : X → Y sind gleich, wenn sie wertverlaufsgleich sind, d.h., wenn
D(f ) = D(g) und wenn g(x) = f (x) für alle x ∈ D(f ) gilt.
Definition 2.2 Eine Funktion g = (X, g, Y ) heißt eine Funktion von X in Y , wenn
D(g) = X gilt. Die Funktion g heißt Funktion von X auf Y oder eine Surjektion, wenn
D(g) = X und W (g) = Y gelten. Die Funktion g heißt eine voreindeutige Funktion
oder eine Injektion, wenn für alle x1 , x2 ∈ D(f ) aus g(x1 ) = g(x2 ) stets x1 = x2 folgt.
Während in der diskreten Mathematik Funktionen oft durch Wertetafeln gegeben sind (es
sei an die Wahrheitswertfunktionen erinnert), werden Funktionen in der Analysis häufig
durch eine Funktionsgleichung oder eine Berechnungsvorschrift gegeben. So heißen z.B.
die durch die Gleichung
fn (x) = xn , x ∈ R
auf R definierten Funktionen Potenzfunktionen.
Definition 2.3 Sind f : X → Y und g : Y → Z zwei Funktionen, so läßt sich durch
Aneinanderfügen eine neue Funktion g ◦ f : X → Z durch
g ◦ f = {(x, z) ∈ X × Z : Es existiert ein y ∈ Y mit y = f (x) und z = g(y)}
definieren. Diese Funktion heißt die Superposition oder Nacheinanderausführung von f
und g. Dabei gilt offenbar
(g ◦ f )(x) = g(f (x)) für alle x ∈ D(g ◦ f ) und D(g ◦ f ) = {x ∈ D(f ) : f (x) ∈ D(g)}.
14
2 ELEMENTARE FUNKTIONEN
Natürlich ist streng auf die Reihenfolge der Anwendung der Funktionen zu achten.
Unwesentlich ist bei der Superposition von mehr als zwei Funktionen jedoch die Art
der Beklammerung, denn es gilt für f : X → Y , g : Y → Z und h : Z → W stets
h ◦ (g ◦ f ) = (h ◦ g) ◦ f , also eine Art Assoziativgesetz.
Auf jeder Menge X 6= ∅ existiert die identische Funktion bezeichnet durch idX : X → X,
die durch idX (x) = x definiert wird.
Definition 2.4 Eine Funktion g : Y → X heißt Umkehrfunktion zur Funktion f : X →
Y , wenn g ◦ f = idX und f ◦ g = idY gelten.
Die Umkehrfunktion zu f ist im Fall der Existenz durch f eindeutig bestimmt, denn wären
g1 und g2 zwei solche Funktionen, so ergäbe sich D(g1 ) = Y = D(g2 ) wegen f ◦ g = idY .
Da aber ferner g1 (y) = ((g2 ◦ f ) ◦ g1 )(y) = (g2 ◦ (f ◦ g1 ))(y) = g2 (y) für alle y ∈ Y gilt,
folgt g1 = g2 . Die Umkehrfunktion zu f wird im Fall der Existenz durch f −1 bezeichnet.
Satz 2.5 Eine Funktion f : X → Y besitzt genau dann eine Umkehrfunktion, wenn
D(f ) = X und W (f ) = Y sind und wenn f eineindeutig ist.
Beweis. Hat f eine Umkehrfunktion g, so gilt D(f ) = X wegen g ◦ f = idX und
W (f ) = Y wegen f ◦ g = idY . Wendet man die Funktion g auf eine Gleichung der Form
f (x1 ) = f (x2 ) an, so folgt x1 = x2 . Das zeigt die Eineindeutigkeit von f . Sind umgekehrt
die Bedingungen im Satz erfüllt, so definiere man g := {(y, x) : (x, y) ∈ f }. Dann ist g
offenbar eine Umkehrfunktion zu f .
Aufgaben
Prüfen Sie, ob die Mengen
A = {(x, y) ∈ R2 : y 2 − x2 = 0} und B = {(x, y) ∈ R2 : y − x2 = 0}
Graphen von Funktionen von R in R sind.
2.2
Monotone Funktionen
Wir betrachten in diesem Abschnitt ausschließlich reelle Funktionen einer reellen
Veränderlichen, d.h. Funktionen aus R in R.
Definition 2.6 Eine Funktion f aus R in R heißt (streng) monoton wachsend auf einer
Teilmenge M ihres Definitionsbereiches für alle x1 , x2 ∈ M aus
x1 < x 2
stets
f (x1 ) ≤ f (x2 )
bzw.
f (x1 ) < f (x2 ))
folgt. Entsprechend werden monoton fallende Funktionen definiert.
2.3 Potenzfunktionen mit rationalem Exponenten
15
Als Beispiele betrachten wir die Potenzfunktionen fn (x) = xn für n ∈ N∗ . Auf der positiven Halbachse R+ = {x : x ≥ 0} sind diese Funktionen streng monoton wachsend,
denn aus 0 ≤ x1 < x2 folgt x21 < x1 x2 < x22 , und durch einen induktiven Beweis in analoger Weise xn1 < xn2 . Entsprechend zeigt man, daß fn (x) = xn auf dem Intervall (−∞, 0]
für geradzahliges n streng monoton fallend und für ungeradzahliges n streng monoton
wachsend sind.
Satz 2.7 (1. Hauptsatz über monotone Funktionen) Ist f : I → f (I) auf dem Intervall I streng monoton wachsend, so hat f eine Umkehrfunktion f −1 : f (I) → I, die
selbst streng monoton wachsend ist.
Beweis. Eine streng monoton wachsende Funktion f ist offenbar voreindeutig. Daher existiert die Umkehrfunktion f −1 . Seien nun z1 , z2 ∈ W (f ) mit z1 < z2 gegeben und seien
x1 = f −1 (z1 ), x2 = f −1 (z2 ). Dann gilt x1 < x2 , da die Ungleichung x1 ≥ x2 wegen der
Monotonie von f nicht z1 < z2 verträglich ist. Also ist f −1 streng monoton wachsend.
Folgerung 2.8 Die Funktionen fn (x) = xn (n 6= 0) haben auf [0, ∞) streng monoton
√
wachsende Umkehrfunktionen, dies sind die Wurzelfunktionen gn (y) = n y.
2.3
Potenzfunktionen mit rationalem Exponenten
Zur Vorbereitung der Definition von Potenzfunktionen mit rationalem Exponenten beweisen wir:
Satz 2.9 Es seien n, p ∈ N∗ und m, p ∈ Z mit
√
n
xm =
m
n
= pq . Dann gilt
p
√
q
x für alle x ≥ 0.
√
√
Beweis. Es seien a = n xm , b = ( q x)p und t = mq = np. Dann folgt unter Verwendung
der Potenzgesetze für natürlichzahlige Exponenten
√
at = anp = xmp = ( q x)qmp = bqm = bt .
Also ist a = b.
Definition 2.10 Für jede rationale Zahl r ∈ Q wird durch die Gleichung
fr (x) := xr =
√
n
√
m
xm = ( n x)m , r = , n > 0
n
im Fall r > 0 eine streng monoton wachsende Funktion und im Fall r < 0 eine streng
monoton fallende Funktion auf dem Intervall (0, ∞), die Potenzfunktion mit rationalem
Exponenten, definiert.
16
2 ELEMENTARE FUNKTIONEN
2.4
Die Exponentialfunktionen
In diesem Absschnitt wird die Exponentialfunktion f (x) = ax auf ordnungstheoretischer
Grundlage eingeführt. Im 1. Charakterisierungssatz wird gezeigt, dass die Exponentialfunktion auch abstrakt durch ihre Eigenschaften, insbesondere durch ihr Additionstheorem eindeutig bestimmt ist. Das erklärt auch, warum jede Beschreibung eines Wachstumsund Sterbeprozesses auf Exponentialfunktionen als Modelle führen muss. Im Verlauf des
Kurses werden wir weitere Beschreibungsmöglichkeiten der Exponentialfunktionen kennen
lernen. Das unterstreicht einmal mehr die fundamentale Bedeutung dieser Funktion und
gibt Anlass, Exponentialfunktionen auch in anderen Strukturen als Zahlbereichen (z.B. in
Matrizenräumen) einzuführen. Das hat besondere Bedeutung in der Theorie dynamischer
Systeme und in der Quantenmechanik.
Satz 2.11 Es sei a > 1. Die durch f (r) = ar =
hat die folgenden Eigenschaften:
a)
b)
c)
d)
√
n
am für r =
m
n
auf Q definierte Funktion
D(f ) = Q ,
f ist streng monoton wachsend auf Q,
f (r + s) = ar+s = ar as = f (r)f (s) für alle r, s ∈ Q,
f (r) > 0 für alle r ∈ Q .
Beweis. a) folgt aus Definition 2.10. Für den Nachweis von b) seien r und s rationale Zahlen
mit r < s. Da beide Brüche gleichnamig gemacht werden können, kann r = nk < nj = s
√
√
n
n
angenommen werden. Dann ist k < j, und hieraus folgen ak < aj und ak < aj .
Zu c): Aus r =
k
n
und s =
j
n
ar+s = a
k+j
n
folgt
=
√
n
ak+j =
√
n
ak ·
√
n
k
j
aj = a n · a n = ar as .
r
Schließlich ergibt sich d) aus ar = (a 2 )2 ≥ 0 . Wegen b) ist ar = 0 dabei unmöglich.
Der bisher noch mit Lücken behaftete Graph der Funktion f (x) = ax kann nun mit
dem folgenden Satz ausgefüllt werden. Auf diese Weise entsteht die auf ganz R definierte
Exponentialfunktion.
Satz 2.12 (Die monotone Fortsetzung der Exponentialfunktion) Es sei a > 1.
Dann heißt die durch die folgende Formel definierte Funktion
F (x) = ax := sup{ar : r ≤ x, r ∈ Q}
die
a)
b)
c)
d)
Exponentialfunktion zur Basis a. Sie hat die folgenden Eigenschaften:
D(F ) = R,
F ist streng monoton wachsend auf R,
F (x + y) = ax+y = ax ay = F (x) · F (y) für alle x, y ∈ R,
W (F ) = (0, ∞).
2.4 Die Exponentialfunktionen
17
Beweis. Wegen Satz 2.11b) gilt F (r) = ar = f (r) für alle r ∈ Q. Daher ist F eine
Fortsetzung von f . Wir zeigen jetzt D(F ) = R. Für x ∈ R sei
Ax := {ar : r ≤ x, r ∈ Q}.
Dann ist Ax 6= ∅ und nach oben beschränkt wegen Satz 2.11. Folglich existiert sup Ax
wegen Axiom 11. Das zeigt D(F ) = R.
Für x ∈ R setzen wir nun
A0x := {ar : r < x, r ∈ Q}
und zeigen zunächst, daß auch sup Ax = sup A0x gilt. Im Fall x ∈ R \ Q bleibt nichts
zu beweisen. Sei also jetzt x ∈ Q. Natürlich ist sup A0x ≤ sup Ax = ax . Wäre aber
c = sup A0x < ax , so gäbe es wegen inf{a1/n : n ∈ N∗ } = 1 (s. Aufgabe 3 aus Abschnitt
1.6) eine Zahl n ∈ N∗ , so dass auch noch c · a1/n < ax und somit c < ax−1/n gelten. Da
aber x − 1/n ∈ A0x gilt, steht das im Widerspruch zu c = sup A0x .
Zum Beweis von b) wählen wir zu x < y zwei rationale Zahlen r, s mit x < r < s < y.
Dann ist Ax ≤ ar < as ≤ ay , also ax < ay .
Das Additionstheorem c) ergibt sich durch folgende Rechnung:
ax · ay = sup A0x · sup A0y = sup A0x · A0y
= sup{ar+s : r < x, s < y; r, s ∈ Q}
= sup{at : t < x + y, t ∈ Q} = ax+y .
Zum Beweis von d) ist schließlich zu zeigen, dass jede Gleichung der Form ay = c mit
c > 0 eine Lösung hat. Wir bilden dazu die Menge Mc = {r ∈ Q : ar ≤ c} und werden
zeigen, dass y = sup Mc obige Gleichung löst. Zunächst ist Mc 6= ∅, denn wegen dem
archimedischen Axiom und der Bernoullischen Ungleichung existiert ein n ∈ N∗ mit
c−1 ≤ 1 + n(a − 1) ≤ an .
Also ist a−n ≤ c und damit −n ∈ Mc . Die Menge Mc ist aber auch nach oben beschränkt,
da sie andererseits wegen b) die Menge aller natürlichen Zahlen enthalten müßte. Die
Ungleichung an ≤ c kann aber nach nicht für alle natürlichen Zahlen gelten, denn für
hinreichend große n ∈ N ist
c < 1 + n(a − 1) ≤ an ,
wiederum nach der Bernoullischen Ungleichung. Also ist Mc nicht leer und nach oben
beschränkt, und daher existiert y = sup Mc . Es bleibt ay = c zu zeigen. Zu r < y existiert
0
ein r0 ∈ Mc mit r < r0 . Also gilt ar < ar ≤ c. Das zeigt A0y ≤ c, also ay ≤ c. Wäre
aber ay < c , so gäbe es wiederum wegen inf{a1/n : n ∈ N∗ } = 1 eine Zahl n ∈ N∗ mit
ay · a1/n < c. Zu diesem n wählen wir eine Zahl r ∈ Mc mit y − n1 < r ≤ y, also y < r + n1
. Dann folgt aber
1
1
1
ar+ n = ar · a n ≤ ay · a n < c,
also r +
1
n
∈ Mc im Widerspruch zu y < r +
1
n
. Das beweist ay = c.
Bisher haben wir Exponentialfunktionen nur mit einer Basis a > 1 eingeführt. Der Fall
0 < a < 1 wird durch die Definition ax := (a−1 )−x hierauf zurückgeführt. Ergänzend
definieren wir 1x = 1 für alle x ∈ R.
18
2 ELEMENTARE FUNKTIONEN
Bemerkung 2.13 Die für die Exponentialfunktion typische Gleichung F (x + y) =
F (x) · F (y) läßt folgende Interpretation zu. Deutet man x als Zeit und setzt man y = 1
Zeiteinheit, so bedeutet
F (x + 1) = F (1) · F (x),
dass diese Funktion F Wachstumsprozesse mit einem Wachstumsfaktor F (1) modelliert.
Insbesondere sind Exponentialfunktionen also zur Modellierung von bakteriellen Wachstumsprozessen, von Verzinsungsprozessen und von radioaktiven Zerfallsprozessen geeignet.
Der folgende Satz zeigt, daß umgekehrt nur Exponentialfunktionen zur Beschreibung
ungebremsten Wachstums geeignet sind:
Satz 2.14 (Erster Charakterisierungssatz für Exponentialfunktionen) Es sei f
eine nicht identisch verschwindende Funktion mit folgenden Eigenschaften:
a) D(f ) = R ,
b) f ist monoton wachsend,
c) Es gilt f (x + y) = f (x) · f (y) für alle x, y ∈ R.
Dann ist f eine Exponentialfunktion, und es gilt f (x) = ax mit a = f (1) für alle x ∈ R.
Insbesondere ist W (f ) = (0, ∞), sofern f (1) 6= 1.
Beweis. Nach Voraussetzung existiert ein x0 ∈ R mit f (x0 ) 6= 0. Wegen f (x0 ) = f (x0 +
0) = f (x0 ) · f (0) folgt hieraus f (0) = 1. Das ergibt weiterhin a := f (1) ≥ f (0) = 1. Für
alle x ∈ R und alle n ∈ N∗ gilt f (nx) = f (x + . . . + x) = f (x)n wegen c). Für m, n ∈ N∗
ergibt sich speziell
m m n
= f
,
am = f (1)m = f (m) = f n ·
n
n
also f ( m
) = am/n . Das zeigt f (r) = ar für alle rationalen Zahlen r > 0. Wegen
n
f (−x)f (x) = f (x + (−x)) = f (0) = 1
folgt weiter f (−x) = f (x)−1 für alle x ∈ R . Hieraus ergibt sich insbesondere f (r) = ar
alle r ∈ Q. Also gilt auch
ax = sup{ar : r ≤ x, r ∈ Q} = sup{f (r) : r ≤ x, r ∈ Q} ≤ f (x)
für alle x ∈ R. Ebenso ist a−x ≤ f (−x) und folglich f (x) ≤ ax . Beide Ungleichungen
zusammen zeigen nun f (x) = ax für alle x ∈ R.
Definition 2.15 (Logarithmusfunktionen) Die Umkehrfunktion g = loga zur Exponentialfunktion F (x) = ax mit a > 0 und a 6= 1 heißt Logarithmusfunktion zur Basis a.
Es gilt also
x = loga y genau dann, wenn ax = y.
2.4 Die Exponentialfunktionen
19
Satz 2.16 Die Funktion g(y) = loga y hat folgende Eigenschaften:
a) D(g) = (0, ∞) und W (g) = R,
b) loga a = 1 und loga 1 = 0,
c) loga ist für a > 1 streng monoton wachsend,
d) loga (x1 x2 ) = log2 x1 + loga x2 ,
e) loga xb = b loga x für alle b ∈ R.
Beweis. Die Aussagen a), b) und c) ergeben sich aus Satz 2.12 und Satz 2.7. Zum Beweis
von d) seien ci = loga xi für i = 1, 2. Dann ist aci = xi , und folglich ac1 +c2 = x1 · x2 .
Hieraus folgt c1 + c2 = loga (x1 x2 ). Wir übergehen den Beweis zu e).
Die Logarithmen zur Basis 2, 10 und e bezeichnet man kurz durch ld, lg bzw. ln (für
logarithmus dualis, Briggscher Logarithmus und logarithmus naturalis).
Satz 2.17 Für alle reellen Zahlen a, b > 0 mit a, b 6= 1 gilt
ax = bx·logb a für alle x ∈ R.
Insbesondere lässt sich jede Exponentialfunktion durch Stauchung der x-Achse in jede
andere Exponentialfunktion überführen.
Beweis. Der Ansatz ax = bx·z führt durch Logarithmieren zur Basis b auf x · logb a = x · z,
also z = logb a.
Die folgenden Funktionen stehen in engem Zusammenhang mit der Exponentialfunktion.
Ihr Nutzen wird später klar werden (z.B. im Abschnitt zur Berechnung von Integralen
oder in der hyperbolischen Geometrie).
Definition 2.18 Die Funktionen
sinh x =
ex − e−x
2
und
cosh x =
ex + e−x
2
heißen der hyperbolische Sinus bzw. der hyperbolische Kosinus,, ihre Umkehrfunktionen
(soweit definiert) heißen Areasinus Hyperbolicus bzw. Areacosinus Hyperbolicus, sie werden durch arsinh bzw. arcosh bezeichnet.
Aufgaben zu Abschnitt 2.4
1. Beweisen Sie mit der Methode aus dem Beweis zu Satz 2.12 die Gleichung
(ax )y = axy für alle x, y ∈ R.
2. Beweisen Sie mittels der Formel aus Aufgabe 1 die Formel e) aus Satz 2.16.
3. Beweisen Sie die Transformationsformel logb x = loga x · logb a.
4. Beweisen sie für alle Zahlen a, b, c > 0 und a, b, c 6= 1 die Gleichung
loga b · logb c · logc a = 1.
20
2 ELEMENTARE FUNKTIONEN
5. Lösen Sie die Gleichung log16 x + log4 x + log2 x = 7.
6. Skizzieren Sie den Verlauf der Funktionen sinh und cosh.
7. Beweisen Sie die Additionstheoreme für die hyperbolischen Funktionen:
sinh(x + y) = sinh(x) cosh(y) + cosh(x) sinh(y),
cosh(x + y) = cosh(x) cosh(y) + sinh(x) sinh(y).
21
3
Beträge und komplexe Zahlen
Ziel aller Bemühungen in der Analysis ist die Untersuchung von Funktionen. Im Abschnitt
II haben wir als Hauptwerkzeug die Ordnungsrelation im Bereich der reellen Zahlen mit
ihren Eigenschaften benutzt. Am Beispiel der Konstruktion der Wurzel- und der Exponentialfunktion konnte die Leistungsfähigkeit dieses Apparates demonstriert werden.
Ordnungstheoretische Techniken wie diese finden auch in der modernen Analysis in der
Theorie der Vektorverbände ihre Weiterentwicklung. Dennoch erweist sich dieser Apparat
als etwas schwerfällig, und die Einbeziehung komplexwertiger Funktionen ist grundsätzlich
ausgeschlossen, da der Bereich der komplexen Zahlen keine mit Addition und Multiplikation verträgliche (totale) Ordnung zulässt. Wir benutzen daher von nun ab hauptsächlich
den Abstandsbegriff, der durch die Betragsfunktion sowohl in R als auch im Körper C
der komplexen Zahlen eingeführt werden kann. Es sei bemerkt, dass dies Konzept später
sogar auf endlich- und unendlich dimensionale Vektorräume verallgemeinert werden kann.
Damit haben wir für alle diese Fälle eine einheitliche Methode.
3.1
Die Betragsfunktion in R
Definition 3.1 Im Körper R der reellen
gende Formel eingeführt:

 x für
0 für
|x| =

−x für
Zahlen wird die Betragsfunktion durch die fol
x>0 
x=0
= max{x, −x}

x<0
Satz 3.2 Die Betragsfunktion | · | : R → R hat die folgenden drei Eigenschaften:
(B1) Stets ist |x| ≥ 0, und es gilt |x| = 0 genau dann, wenn x = 0 ist.
(B2) Für alle x, y ∈ R gilt |xy| = |x| · |y| .
(B3) Für alle x, y ∈ R gilt |x + y| ≤ |x| + |y|.
(Dreiecksungleichuung)
Beweis. Die Behauptungen ergeben sich durch Fallunterscheidungen.
3.2
Der Körper C der komplexen Zahlen
Der Körper der komplexen Zahlen wird als Erweiterung von R mit dem Ziel konstruiert,
in diesem Bereich eine Lösung der Gleichung x2 = −1 zu finden. In R ist diese Gleichung wegen 1.2 nämlich nicht lösbar. Um diese Konstruktion vorzubereiten, nehmen wir
zunächst an, daß ein Erweiterungsbereich C von R derartig existiert, daß in C eine den
Axiomen Ax1 - Ax4 aus Abschnitt 1.2 genügende Addition und Multiplikation erklärt ist
und daß in C eine Lösung der Gleichung x2 = −1 existiert. Wir bezeichnen eine solche
Lösung (wie L. Euler) mit i. Dann enthält C wegen der Axiome Ax1 - Ax4 zumindestens
alle Elemente der Form a + bi mit a, b ∈ R. Wegen Ax1 - Ax4, i 6∈ R und i2 = −1 gelten
für diese Zahlen die folgenden Aussagen:
22
3 BETRÄGE UND KOMPLEXE ZAHLEN
a) a + bi = a0 + b0 i genau dann, wenn a = a0 und b = b0 .
b) (a + bi) + (c + di) = (a + c) + (b + d)i .
c) (a + bi) · (c + di) = (ac − bd) + (ad + bc)i .
d) Es ist i = 0 + 1 · i und 1 = 1 + 0 · i .
Damit ist umgekehrt die Konstruktion von C als kleinste derartige Erweiterung von R
vorbereitet.
Definition 3.3 (Der Körper C) Wir setzen C = {(a, b) : a ∈ R, b ∈ R} = R × R und
definieren eine Addition und Multiplikation in C durch
(a, b) + (c, d) = (a + c, b + d),
(a, b) · (c, d) = (ac − bc, ac + bd).
Es ist reine Schreibarbeit, die Gültigkeit der Rechenregeln Ax1, Ax2 und Ax4 nachzuweisen. Für die Division (Ax3) benötigt man einen kleinen Trick, den wir in (4) besprechen.
Führt man in Anlehnung an d) die Abkürzungen 1 = (1, 0) und i = (0, 1) ein, so folgt für
die Elemente (a, b) ∈ C die Darstellung
(a, b) = a(1, 0) + b(0, 1) = a · 1 + bi.
Der Teilbereich {a · 1 : a ∈ R} ⊆ C lässt sich vermöge a · 1 7→ a eineindeutig auf R
abbilden, und da a · 1 + a0 · 1 = (a + a0 ) · 1 sowie (a · 1) · (b · 1) = (a · b) · 1 gelten, können
wir die Elemente der Form a · 1 mit den reellen Zahlen und das Element 1 speziell mit
der Zahl 1 identifizieren. Damit lässt sich C auch wie folgt schreiben:
C = {a + b i : a, b ∈ R}.
Die so konstruierte Erweiterung C von R heißt der Körper der komplexen Zahlen.
Definition 3.4 Unter der Gaußschen Zahlenebene versteht man die durch die Zuordnung
z = a + b i 7→ (a, b) ∈ R2 hergestellte eineindeutige Abbildung von C auf R2 (s. Abbildung
2).
Abbildung 2: Gaußsche Zahlenebene
Wegen Definition 3.3 vollzieht sich die Addition in C dabei genau so, wie die Addition
der zugehörigen Vektoren in R2 .
3.2 Der Körper C der komplexen Zahlen
23
Definition 3.5 Die Funktionen
Re : C → R vermöge Re(a + bi) = a
Im : C → R vermöge Im(a + bi) = b
heißen Real- bzw. Imaginärteil, und die durch
z = a + bi 7→ z := a − bi
definierte Spiegelung an der reellen Achse heißt Konjugieren. Die Zahl z heißt die zu z
konjugierte reelle Zahl. (S. Abbildung 2)
Satz 3.6 Es seien z, z1 , z2 ∈ C und z = a + bi. Dann gelten:
1)
2)
3)
4)
5)
z = z,
z1 + z2 = z1 + z2 ,
z1 · z2 = z1 · z2 ,
z · z = (a + bi)(a + bi) = a2 + b2 ≥ 0,
Rez = z+z
, Imz = z−z
.
2
2i
Beweis. Nachrechnen!
Die Division komplexer Zahlen kann nun durch Erweitern mit dem konjugiert komplexen
Nenner leicht ausgeführt werden. So ist beispielsweise
(3 + 5i)(2 − i)
6 + 5 + (10 − 3)i
11 7
3 + 5i
=
=
=
+ i.
2+i
(2 + i)(2 − i)
4+1
5
5
Bemerkung 3.7 Im Zahlbereich R folgt aus z n = z m für z 6= 0, 1 sofort n = m. Beachten
Sie, dass dieser Schluss in C nicht richtig ist! Finden Sie ein Gegenbeispiel!
Definition 3.8 (Betrag) Für jede Zahl z = a + bi ∈ C heißt die Zahl
√
√
|z| := a2 + b2 = zz
der Betrag von z. In der Gaußschen Zahlenebene ist der Betrag der Zahl z = a + bi als
Abstand des Punktes P (a, b) zum Nullpunkt realisiert.
Satz 3.9 Die Betragsfunktion | · | : C → R hat folgende Eigenschaften:
(B1) Stets ist |z| ≥ 0 , und es gilt |z| = 0 genau dann, wenn z = 0 ist.
(B2) Für alle z1 , z2 ∈ C gilt |z1 · z2 | = |z1 | · |z2 |.
(B3) Für alle z1 , z2 ∈ C ist |z1 + z2 | ≤ |z1 | + |z2 |.
(Dreiecksungleichung)
Beweis. Die Aussagen (B1) und (B2) ergeben sich aus Satz 3.6. Die Dreiecksungleichung
(B3) ergibt sich wie folgt: Wegen Rez ≤ |z| und Satz 3.6 gilt
|z1 + z2 |2 = (z1 + z2 )(z1 + z2 ) = |z1 |2 + (z1 z2 + z1 z2 ) + |z2 |2
= |z1 |2 + 2Re(z1 z2 ) + |z2 |2 ≤ |z1 |2 + 2|z1 ||z2 | + |z2 |2 = (|z1 | + |z2 |)2 ,
und hieraus folgt die Dreiecksungleichung.
24
3 BETRÄGE UND KOMPLEXE ZAHLEN
Aufgaben zu Kapitel 3
1+i
,
1−i
1
b) z2 = 3−2i
, c) z3 =
2. Berechnen Sie: a) Re (2 + i)5 , b) |(2 + i)5 |.
1. Berechnen Sie: a) z1 =
3−i
.
5
3. Bestimmen Sie alle Lösungen der Gleichungen a) z 2 = i , b) z 3 = 8 in C.
4. Beweisen Sie die Ungleichung |z| − |w| ≤ |z − w| für alle z, w ∈ C.
5. Skizzieren Sie die Menge M = {z : |z − i| ≤ 2} in der Gaußschen Zahlenebene.
25
4
Zahlenfolgen und Reihen
Zahlenfolgen und deren Eigenschaften sind eines der wichtigsten Instrumente für die Untersuchung von Funktionen. Dieses Kapitel hat daher eine grundsätzliche und zentrale
Bedeutung für das Verständnis der Analysis und der Leser muss sich unbedingt sichere
Kenntnisse zu diesem Gegenstand aneignen.
4.1
Zahlenfolgen
Definition 4.1 Unter einer reellen bzw. komplexen Zahlenfolge (an )n∈N versteht man eine
Abbildung (an ) : N → R bzw. (an ) : N → C. Die Zahlen an für n ∈ N heißen die Glieder
der Folge.
Die Menge aller reeller bzw. komplexer Zahlenfolgen wird (in übereinstimmung mit Abschnitt 1.1(7)) durch RN bzw. CN bezeichnet.
Für Zahlenfolgen können gemäß nachfolgender Definition Rechenoperationen eingeführt
werden:
(an )n∈N ± (bn )n∈N = (an ± bn )n∈N ,
(an )n∈N · (bn )n∈N = (an · bn )n∈N ,
c · (an )n∈N = (c · an )n∈N für c ∈ C.
Insbesondere sind RN und CN mit diesen Rechenoperationen (unendlich dimensionale)
Vektorräume.
Definition 4.2 Ist (an )n∈N eine Zahlenfolge und ist (nk )k∈N eine streng monoton wachsende Folge natürlicher Zahlen n1 < n2 < . . ., so heißt die Folge (ank )k∈N eine Teilfolge
von (an ).
So sind z.B. (an )n≥10 , (a2n ) oder (a2n+1) drei Teilfolgen von (an ).
Definition 4.3 Eine Folge (an ) heißt
a) stationär, falls an = an+1 für alle n ∈ N gilt.
b) quasistationär, falls eine Zahl n0 ∈ N so existiert, dass an = an+1 für alle n ≥ n0 gilt.
Wir führen nun den grundlegenden Begriff der Konvergenz von Folgen ein, wie er von
A. L. Cauchy5 1832 in seinen ,,Vorlesungen zur Infinitesimalrechnungßur strengen Begründung der Analysis entwickelt wurde.
5
Der Name Analysis leitet sich aus dem Titel des Buches ,,Cours d’analyse de l’École Polytechnique”
von Augustin Louis Cauchy (1789-1857) aus dem Jahr 1821 ab. Die Mathematiker vor Cauchy wie
Leibniz, Newton, die Bernoullis, Euler oder Lagrange hatten oft ohne saubere mathematische Definitionen gearbeitet und viel intuitives Verständnis von Funktionen benutzt. Bei der Vorbereitung zu seinen
Vorlesungen fielen Cauchy diese Lücken auf, und so stellte er als erster die Analysis auf eine strenge
methodische Basis. Deswegen betrachtet man ihn als einen der ersten modernen Mathematiker.
26
4 ZAHLENFOLGEN UND REIHEN
Definition 4.4 (Konvergenz) Eine Zahlenfolge (an ) heißt konvergent gegen a und a
heißt Grenzwert von (an ), wenn zu jedem ε > 0 eine Zahl n0 (ε) so existiert, dass für alle
n ∈ N mit n ≥ n0 (ε) die Abschätzung |an − a| < ε gilt. In diesem Fall schreibt man
lim an = a oder einfach an → a für n → ∞. In Kurzform könnten wir schreiben:
n→∞
lim an = a ⇐⇒ ∀ε > 0 ∃n0 ∈ N ∀n ∈ N : n ≥ n0 ⇒ |an − a| < ε.
n→∞
Die Kontraposition der in der Definition enthaltenen Implikation ergibt das Kriterium
lim an = a ⇐⇒ Für alle ε > 0 gilt |an − a| ≥ ε höchstens für endlich viele n ∈ N.
n→∞
Wir werden sagen, dass eine Aussage H(n) über natürliche Zahlen fast immer gilt, wenn
H(n) für höchstens endlich viele natürliche Zahlen nicht erfüllt ist. In dieser Formulierung
kann man sagen:
lim an = a ⇐⇒ Für jedes ε > 0 gilt fast immer |an − a| < ε.
n→∞
Definition 4.5 (ε-Umgebungen) Unter der ε-Umgebung einer Zahl a in R bzw. C versteht man die folgenden Mengen:
Im Fall R: Uε (a) = {x ∈ R : |x − a| < ε} = (a − ε, a + ε), Intervall mit Mittelpunkt a.
Im Fall C: Uε (a) = {x ∈ C : |x − a| < ε}, offene Kreisscheibe mit Zentrum a.
Kehren wir nun zu Folgen zurück. Da die Ungleichung |an − a| < ε mit an ∈ Uε (a)
äquivalent ist, können wir feststellen:
lim an = a ⇐⇒ Für jedes ε > 0 gilt fast immer an ∈ Uε (a).
n→∞
Alle der soeben eingeführten Charakterisierungen der Konvergenz werden wir gleichberechtigt benutzen. Schließlich definieren wir noch:
Definition 4.6 Eine Folge (an ) heißt konvergent, wenn sie einen Grenzwert hat.
Abbildung 3: Konvergente Folgen an → a in C und R
4.1 Zahlenfolgen
27
2n2
= 2, denn es ist
n→∞ n2 + 1
Beispiel 4.7 Wir betrachten ein Beispiel: Es gilt lim
2n2
2n2 − 2n2 − 2 2
2
− 2 = ≤ 2 ≤ε
2
= 2
2
n +1
n +1
n +1
n
p
p
für alle n > 2/ε. Also könnte z.B. n0 (ε) = Int( 2/ε) + 1 gewählt werden.
Satz 4.8 Jede Folge hat höchstens einen Grenzwert.
Beweis. Seien a 6= a0 zwei verschiedene Grenzwerte der Folge (an ). Wir wählen ε =
1
|a − a0 | > 0. Dann ist Uε (a0 ) ∩ Uε (a) = ∅. Daher kann im Widerspruch zur Voraussetzung
2
höchstens eine der beiden Mengen fast alle Folgenglieder an enthalten.
Es ist nicht immer leicht zu entscheiden, ob eine Folge konvergiert oder nicht. Wir wollen
daher im Folgenden einige Konvergenzkriterien aufstellen. Als erstes Hilfsmittel dient dazu
der Begriff der Beschränktheit.
Definition 4.9 (Beschränktheit) Eine Zahlenfolge (an ) heißt beschränkt, wenn es eine
Konstante K > 0 mit |an | ≤ K für (fast) alle n ∈ N gibt.
Satz 4.10 (Ein notwendiges Konvergenzkriterium) Jede konvergente Folge ist beschränkt.
Beweis. Es sei (an ) konvergent gegen a. Dann gibt es zu ε = 1 eine Zahl n0 mit |an −a| < 1
für alle n ≥ n0 . Also ist
|an | = |an − a + a| ≤ |an − a| + |a| ≤ 1 + |a| für alle n ≥ n0 .
Setzen wir nun K = max{1 + |a|, |a0 |, . . . , |an0 |}, so gilt |an | ≤ K für alle n ∈ N. Also ist
(an ) beschränkt.
Definition 4.11 Folgen mit Grenzwert 0 heißen Nullfolgen.
Unmittelbar aus der Definition folgt:
Satz 4.12 Es gilt an → a genau dann, wenn (an − a) eine Nullfolge ist.
Beispiel 4.13 Wir betrachten einige Beispiele reeller Nullfolgen:
a) Die Folge (an ) = ( n1 ) ist eine Nullfolge, denn wegen des archimedischen Axioms gilt
für jedes ε > 0 fast immer die Ungleichung 1ε < n und damit n1 < ε. Nach analogem
Argument gilt auch lim n1α = 0 für alle α > 0.
n→∞
b) Die geometrische Folge (an ) = (q n ) ist im Fall 0 < |q| < 1 eine Nullfolge, für |q| > 1
ist die Folge unbeschränkt.
√
√
c) Es gilt lim ( n + 1 − n) = 0, denn es ist
n→∞
√
√ √
√
√
√
( n + 1 − n)( n + 1 + n)
1
1
√
| n + 1 − n| =
≤ √ ≤√ ,
√
2 n
n
n+1+ n
und für gegebenes ε > 0 gilt fast immer
√1
n
< ε, wie in a) gezeigt wurde.
28
4 ZAHLENFOLGEN UND REIHEN
Die in Beispiel 4.13c) verwendete Methode zum Nachweis der Nullfolgeneigenschaft lässt
sich zu folgendem Kriterium verallgemeinern:
Satz 4.14 (Dominanzkriterium) Sind (an ) und (bn ) zwei Zahlenfolgen, ist (bn ) eine
Nullfolge und gibt es eine Konstante K > 0 so, dass |an | ≤ K|bn | für (fast) alle n ∈ N
gilt, so ist auch (an ) eine Nullfolge.
Beweis. Zu gegebenem ε > 0 betrachten wir die Ungleichung |an | ≤ K · |bn | < ε, die wegen
bn → 0 fast immer erfüllt ist. Daher ist auch (an ) eine Nullfolge.
Als einfaches Beispiel betrachten wir die Folge (an ) = n25+2 . Aus der Abschätzung
5
5
1
≤
= bn → 0
≤
5
·
n2 + 2
n2
n
folgt sofort, dass die Folge (an ) eine Nullfolge ist.
0<
Satz 4.15 a) Summe und Differenz von Nullfolgen sind Nullfolgen.
b) Ist (an ) eine Nullfolge und ist (bn ) beschränkt, so ist (an · bn ) eine Nullfolge.
Insbesondere bilden die Mengen aller reellen bzw. komplexen Nullfolgen zwei (unendlich
dimensionale) Vektorräume, die einfach mit c0 bezeichnet werden.
Beweis. Es seien (an ) und (bn ) zwei Nullfolgen. Zu vorgegebenem ε > 0 existiert dann
eine Zahl n1 ∈ N mit |an | < 2ε für alle n ≥ n1 . Entsprechend existiert eine Zahl n2 ∈ N
mit |bn | < 2ε für alle n ≥ n2 . Setzen wir n0 = max{n1 , n2 }, so folgt
ε ε
|an + bn | ≤ |an | + |bn | ≤ + = ε für alle n ≥ n0 .
2 2
Also ist (an + bn ) eine Nullfolge. Die Aussage b) folgt aus 4.14.
Der folgende Satz erleichtert manchmal die Untersuchung komplexer Zahlenfolgen:
Satz 4.16 Für komplexe Zahlenfolgen (zn ) mit zn = an + bn i gilt:
zn → 0 ⇐⇒ an → 0 und bn → 0.
Beweis. (⇒): Die Behauptung folgt wegen |an |, |bn | ≤ |zn | aus Satz 4.14.
(⇐) : Die Behauptung folgt wegen |zn | ≤ |an | + |bn | aus Satz 4.14 und Satz 4.15a).
Mit Satz 4.12 lassen sich die für Nullfolgen gefundenen Aussagen auf konvergente Folgen
übertragen:
Satz 4.17 (Grenzwertsätze) Es seien (an ) und (bn ) konvergente Zahlenfolgen. Dann
konvergieren auch die Summen- und Produktfolgen, und es gelten
lim an ± bn = lim an ± lim bn und lim an · bn = lim an · lim bn .
n→∞
n→∞
n→∞
n→∞
n→∞
n→∞
Ferner ist lim |an | = | lim an |. Gelten überdies an 6= 0 für alle n ∈ N und lim an 6= 0,
n→∞
n→∞
n→∞
so gilt auch
1
1
lim
=
.
n→∞ an
lim an
n→∞
4.1 Zahlenfolgen
29
Beweis. Es seien an → a und bn → b. Dann folgt
|(an + bn ) − (a + b)| = |(an − a) − (bn − b)| ≤ |an − a| + |bn − b| → 0.
Das Dominanzkriterium zusammen mit Satz 4.15 zeigt dann an + bn → a + b. Wir betrachten nun Produkte. Da (an ) als konvergente Folge auch beschränkt ist, gibt es eine
Konstante K > 0 mit |an | ≤ K für alle n ∈ N. Nun ist
|an bn − ab| = |an bn − an b + an b − ab| ≤ |an bn − an b| + |an b − ab|
≤ |an ||bn − b| + |an − a||b| ≤ K|bn − b| + |an − a||b| → 0.
Die mögliche Vertauschung von lim mit dem Betrag ergibt sich aus der Abschätzung
n→∞
||an | − |a| ≤ |an − a| → 0.
Zum Beweis der Divisionsformel beachten wir zunächst, dass wegen a 6= 0 eine Zahl n0 ∈ N
so gefunden werden kann, dass |a − an | ≤ |a|
für alle n ≥ n0 gilt. Hieraus folgt
2
|an | = |a − (a − an )| ≥ |a| − |a − an | ≥ |a| −
|a|
1
2
|a|
=
, also
≤
2
2
|an |
|a|
für alle n ≥ n0 . Dies zeigt nun
1
1 a − an 1
2
= |a − an |
≤ |a − an | · 2 → 0.
− =
an a
an a
|an ||a|
|a|
Damit ist der Satz vollständig bewiesen.
Beispiel 4.18 Als Anwendung der Grenzwertsätze betrachten wir das folgende Beispiel:
n2 (2 + n1 − n12 )
2 + n1 −
2n2 + n − 1
lim
=
lim
=
lim
n→∞
n→∞
n→∞
5n2 − n
n2 (5 − n1 )
5 − n1
1
n2
lim (2 +
=
n→∞
1
n
−
lim (5 −
n→∞
1
)
n2
1
)
n
2
= .
5
Man sieht leicht, dass nach diesem Verfahren alle Probleme der Form
P (n)
mit beliebigen Polynomen P (n) und Q(n)
n→∞ Q(n)
lim
bearbeitet werden können.Wir überlassen dem Leser die Formulierung eines entsprechenden Satzes.
Aufgaben zu Abschnitt 4.1
1. Man zeige: Aus an → a und bn → a folgt an − bn → 0.
2. Für jede Folge an → 0 existiert max{|an | : n ∈ N}.
3. Berechnen Sie
2n+n2
2,
n→∞ 1−3n
a) lim
2k+k2
4
k→∞ 1−3k
b) lim
j2
.
j→∞ j!
und c) lim
30
4 ZAHLENFOLGEN UND REIHEN
4. Zeigen Sie lim
√
n
n→∞
a = 1 für alle a > 0.
1
2
n→∞ 1−3n
5. Berechnen Sie lim
+
n
2n+1
i.
a1 + . . . + an
. Die Folge (cn ) heißt
n
auch Folge der Cesaro-Mittel von (an ). Zeigen Sie:
6. Es sei (an ) eine beliebige Folge und es sei cn =
an → a =⇒ cn → a.
Diskutieren Sie am Beispiel an = (−1)n die Frage, ob auch die Umkehrung der
Implikation gilt.
4.2
Reelle Zahlenfolgen
Das in Satz 4.14 formulierte Dominanzkriterium für Nullfolgen kann zu folgendem Vergleichskriterium für beliebige reelle Zahlenfolgen verallgemeinert werden. Wir werden dieses Kriterium im weiteren oft anwenden. Manchmal wird es in der Literatur aus offensichtlichen Gründen auch Sandwich-Kriterium genannt.
Satz 4.19 (Vergleichskriterium) Sind (an ), (bn ) und (cn ) drei reelle Zahlenfolgen mit
an ≤ cn ≤ bn für fast alle n ∈ N und ist lim an = lim bn = a, so konvergiert auch die
n→∞
n→∞
Folge (cn ) gegen a.
Beweis. Es sei a = lim an . Dann ist
n→∞
|cn − a| = |cn − an + an − a| ≤ |cn − an | + |an − a|
≤ |bn − an | + |an − a| ≤ |bn − a| + |an − a| + |an − a| → 0.
Damit ist alles bewiesen.
Wir dehnen nun die Grenzwertsätze aus Satz 4.17 auf ”höhere” Rechenoperationen aus.
Durch mehrfache Anwendung der Grenzwertsätze folgt aus an → a, dass auch akn → ak für
alle k ∈ N konvergiert. Die Ausdehnung dieser Aussage auf beliebige reelle Exponenten
ist ein Spezialfall des folgenden viel allgemeineren Satzes:
Satz 4.20 Es sei f eine monoton wachsende Funktion von [a, b] auf das Intervall
[f (a), f (b)]. Dann gilt:
lim f (xn ) = f lim xn für alle konvergenten Folgen (xn ) ⊆ [a, b].
n→∞
n→∞
Für monoton fallende Funktionen gilt eine entsprechende Aussage.
4.2 Reelle Zahlenfolgen
31
Beweis. Wir betrachten zunächst den Fall, dass f auf [a, b] streng monoton wächst. Es sei
(xn ) eine Folge in [a, b] mit xn → x und es sei a < x < b. Wir fixieren ein ε > 0. Durch
eventuelle Verkleinerung von ε können wir dabei
f (a) < f (x) − ε < f (x) < f (x) + ε < f (b)
annehmen. Wir setzen nun c1 = f (x) − ε, c2 = f (x) + ε und u1 = f −1 (c1 ), u2 = f −1 (c2 ).
Dann gilt u1 < x < u2 , und wegen xn → x existiert eine Zahl n0 ∈ N mit xn ∈ (u1 , u2 ) für
alle n ≥ n0 . Hieraus folgt f (xn ) ∈ (f (u1 ), f (u2 )) = (c1 , c2 ) = Uε (f (x)). Also gilt f (xn ) →
f (x). Im Fall x = a oder x = b setzen wir die Funktion f linear und streng monoton
auf das Intervall [a − 1, b + 1] fort, damit ist dieser Fall auf den ersten zurückgeführt. Im
Fall, dass f nur monoton wachsend ist, ”stören” wir die Funktion f durch Addition der
linearen Funktion h(t) = t − a, wir setzen also
g(t) = f (t) + h(t) für t ∈ [a, b].
Dann ist g eine streng monoton wachsende Funktion von [a, b] auf [f (a), f (b) + (b − a)].
Aus xn → x folgt also nach dem bereits Bewiesenen
f (xn ) = g(xn ) − h(xn ) → g(x) − h(x) = f (x).
Damit ist alles bewiesen.
Folgerung 4.21 Aus xn → x folgen xαn → xα für alle α ∈ R, axn → ax für alle a > 0 und
ln xn → ln x, sofern die Elemente xn und x im Definitionsbereich der jeweiligen Funktion
liegen.
Satz 4.22 Es gelten
√
n
a → 1 für alle a > 0 und
√
n
n → 1.
Beweis. Die erste Formel ist wegen a1/n → a0 = 1 ein Spezialfall von Folgerung 4.21, sie
trat außerdem in anderer Formulierung bereits in Aufgabe 5 aus Abschnitt 1.6 auf. Für
den Beweis der zweiten Formel erhalten wir aus der Bernoullischen Ungleichung zunächst
√
q
q
q
√
√
n
1
n √
n
n
n=
n≤ 1+ n≤1+
1≤
=1+ √ →1 .
n
n
Also gilt
p√
n
n → 1 und daher
√
n
n → 1.
Aufgaben
1. Man zeige
√
n
2n → 1.
√
n
n2 + 2n − 5 → 1.
p
1
1
3. Man berechne lim 102+ n und lim e− n2 .
2. Man zeige
n→∞
n→∞
32
4.3
4 ZAHLENFOLGEN UND REIHEN
Monotone Zahlenfolgen und Intervallschachtelungen
Die Grenzwertsätze waren ein nützliches Instrument, um in günstig gelagerten Fällen die
Existenz und die Berechnung von Grenzwerten auf bekannte Grenzwerte zurückzuführen.
In zahlreichen anderen Situationen wird diese Methode jedoch nicht greifen. So ist z.B.
die später zu beweisende und bereits G.W. Leibniz (1646-1716) bekannte Formel
(−1)n
π
1 1 1
=
lim 1 − + − + − . . . +
n→∞
3 5 7
2n + 1
4
mit den bisherigen Methoden nicht zu verifizieren. Das betrifft sowohl die Existenz des
Grenzwertes als auch die noch schwierigere Frage der Ermittlung seines Wertes. Wir werden diese beide Fragen gesondert behandeln. Für das Existenzproblem werden in diesem
Abschnitt erste grundsätzliche und leistungsfähige Konvergenzkriterien entwickelt, die
letztendlich auf dem Vollständigkeitsaxiom (Ax 11) beruhen.
Definition 4.23 Eine reelle Zahlenfolge (an ) heißt monoton wachsend, wenn an ≤ an+1
für alle n ∈ N gilt. Wir bezeichnen diesen Sachverhalt häufig durch an %. Gilt an ≥ an+1
für alle n ∈ N, so heißt die Folge (an ) monoton fallend, und wir schreiben an &.
Es ist sofort zu sehen, dass eine Zahlenfolge (an ) monoton ist, wenn sie im Sinn der
Definition 2.6 eine monotone Funktion als Abbildung von N nach R ist.
Satz 4.24 (Bolzano-Kriterium für monotone Folgen) Eine monotone Zahlenfolge
ist genau dann konvergent, wenn sie beschränkt ist. Dabei gilt
sup{an : n ∈ N}, falls (an ) monoton wächst.
lim an =
inf {an : n ∈ N}, falls (an ) monoton fällt.
n→∞
Für monotone Folgen schreiben wir statt an → a auch an % a bzw. an & a.
Beweis. Es genügt zu zeigen, dass beschränkte, monoton wachsende Folgen (an ) auch
konvergent sind. Wegen des Vollständigkeitsaxioms existiert a = sup{an : n ∈ N}. Sei
nun ε > 0 gegeben. Da a − ε keine obere Schranke für {an : n ∈ N} sein kann, existiert
ein n0 ∈ N mit a − ε < an0 ≤ a. Für alle n ∈ N mit n ≥ n0 folgt wegen an % dann
a − ε ≤ an0 ≤ an ≤ a, also gilt |an − a| < ε für alle n ≥ n0 . Das zeigt a = lim an .
Wir verwenden dieses Kriterium nun zur weiteren Untersuchung von Exponentialfunktionen und konstruieren zunächst die Zahl Eulersche Zahl e.
Satz 4.25 Die Folge (1 + n1 )n
n≥1
ist monoton wachsend und konvergent, ihr Grenzwert
e = lim
n→∞
heißt Eulersche Zahl, und es gilt 2 < e < 3.
1
1+
n
n
4.3 Monotone Zahlenfolgen und Intervallschachtelungen
Beweis. Wir setzen an = (1 + n1 )n =
an
=
an−1
n+1
n
n+1 n
.
n
33
Dann ist
n n−1 2
n
n
n−1
n −1
n
1
n
·
=
·
=
1
−
·
,
n
n2
n−1
n2
n−1
und die Bernoullische Ungleichung mit h = −1/n2 ergibt
an
1
n
1
n
≥ 1−n· 2 ·
= 1−
=1.
an−1
n
n−1
n n−1
Also ist (an ) monoton wachsend.
Wir zeigen nun die Beschränktheit der Folge. Wegen der binomischen Formel und der
leicht einzusehenden Ungleichung
n
1
1
1
· k ≤
≤ k−1
k
n
k!
2
gilt
n
n
n
n X
X
X
1
1
1 n X n 1
2−k < 1 + 2 = 3.
≤
≤
1
+
≤
1
+
2
1+
=
k
n
k
n
k!
k!
k=0
k=1
k=1
k=0
Dabei haben wir noch von der geometrischen Summenformel (Satz 1.6(3)) Gebrauch gemacht. Aus Satz 4.24 ergibt sich somit die Konvergenz der Folge, und es ist 2 = a1 <
lim an < 3.
Bemerkung 4.26 Obige Grenzwertdarstellung lässt die folgende Interpretation zu. Eine
Größe y = y(t) unterliege auf dem Zeitintervall [0, 1] einem Wachstum mit Wachstumsgeschwindigkeit 1. Wir wollen y(1) = e · y(0) zeigen. Dazu zerlegen wir das Zeitintervall in
die Abschnitte 0 < n1 < n2 < . . . < nn und setzen yk = y( nk ). Rechnen wir innerhalb eines
Zeitintervalls mit einem anteiligen Wachstumsfaktor von 1 + n1 , so ergibt sich
1
yk = yk−1 · 1 +
n
1
= y(0) · 1 +
n
k
.
Also ist yn = y0 (1 + n1 )n eine Näherung für y(1). Der Grenzübergang n → ∞ ergibt dann
y(1) = e · y(0). Eleganter und präziser kann dieser Prozess mit Hilfe der Differentialrechnung beschrieben werden.
Satz 4.27 (Approximation von ex durch Polynome) Für jedes x ∈ R konvergiert
die Folge der Zahlen (1 + nx )n , n > −x, monoton gegen ex . Es gilt also
x n
lim 1 +
= ex .
n→∞
n
Beweis. Es sei x ∈ R fixiert. Wir zeigen zuerst, dass
n+1
x n
x
1+
≤ 1+
für alle n > −x
n
n+1
34
4 ZAHLENFOLGEN UND REIHEN
gilt. Wegen n > −x ist 1 + nx > 0. Wir wählen eine Zahl h > −1 als Lösung der Gleichung
(1 + h)n+1 =
n
1
=
n+x
1+
x
n
.
Die Bernoullische Ungleichung ergibt
n
= (1 + h)n+1 ≥ 1 + (n + 1)h .
n+x
Addition von n und Multiplikation mit
n+x
n(n+1)
ergibt der Reihe nach
n
≥ (n + 1)(1 + h) ,
n+x
n+x
x
x
≥
(1 + h) = 1 +
(1 + h).
1+
n+1
n
n
n+
Potenzbildung mit n + 1 liefert schließlich die Behauptung.
Zum Nachweis der Beschränktheit der Folge wählen wir eine Zahl 0 6= k ∈ N mit | xk | ≤ 1.
Dann folgt aus der bereits bewiesenen Monotonie und aus Satz 4.25 die Ungleichung
n k
x n x nk
1
1+
≤ 3k .
≤ 1+
≤
1+
n
kn
n
Wegen Satz 4.24 konvergiert daher die in Rede stehende Folge, und wir können durch
x n
f (x) = lim 1 +
,
x∈R,
n→∞
n
eine Funktion f auf R definieren. Für x = −1 gilt
n+1
n
1
n
n
1
1
n · 1 = .
=
= lim
· lim
f (−1) = lim 1 −
n+1
n→∞
n→∞ n + 1
n→∞
n+1
n+1
e
lim n
n→∞
Nun sei x eine positive rationale Zahl der Form x =
n = kp gilt nx = m1 und n = mp
. Daraus folgt
q
f (±x) = lim
n→∞
p
q
mit p, q > 0. Mit m = kq und
mp/q
1
x n
1±
= lim 1 ±
= e±p/q = e±x ,
m→∞
n
m
womit f (x) = ex für alle x ∈ Q bewiesen ist. Wir zeigen als nächstes, dass die Funktion f
monoton wachsend ist. Es seien x, y ∈ R mit x < y gegeben. Wir wählen n ∈ N so groß,
dass 1 + nx , 1 + ny > 0 sind. Aus
x
y
x n y n
1 + < 1 + folgt nun 1 +
< 1+
.
n
n
n
n
Mithin gilt f (x) ≤ f (y), da Limites als Suprema gebildet werden können. Es sei schließlich
x eine beliebige reelle Zahl. Wir wählen eine Folge rationaler Zahlen rn mit rn % x. Dann
gilt
ex = sup{ern : n ∈ N} = sup{f (rn ) : n ∈ N} ≤ f (x).
Also ist ex ≤ f (x). Wäre aber ex < f (x), so wäre x < ln f (x). Wählt man eine rationale
Zahl r mit x < r < ln f (x), so folgte f (r) = er < f (x). Das steht im Widerspruch zur
Monotonie von f .
4.3 Monotone Zahlenfolgen und Intervallschachtelungen
35
Folgerung 4.28 Für alle n ∈ N und alle x ∈ (−n, ∞) gilt (1 + nx )n ≤ ex . Insbesondere
ist 1 + x ≤ ex für alle x ∈ R.
Der in der Folgerung beschriebene Sachverhalt ist in Abbildung 4 dargestellt.
Abbildung 4: Approximation der e-Funktion durch Polynome
Folgerung 4.29 Für alle k ∈ N gilt lim nk e−n = 0. Die Exponentialfunktion wächst also
n→∞
schneller als alle Potenzfunktionen.
Beweis. Wegen Folgerung 4.28 ist
k+1
1
x
≤ ex und folglich xk e−x ≤ (k + 1)k+1 ·
k+1
x
für alle x > 0. Mit x = n folgt hieraus die Behauptung.
Durch Übergang zu den Umkehrfunktionen können wir nun auch die entsprechende Darstellung für die Logarithmusfunktion ln x gewinnen. Setzen wir
x n
y = fn (x) = 1 +
,
x > −n ,
n
so ergibt die Auflösung nach x die Funktionenschar
√
x = gn (y) = n( n y − 1) ,
y≥0.
Für alle n ∈ N gilt nun gn (y) ≥ gn+1 (y) = v, denn die entgegengesetzte Annahme
u = gn (y) < gn+1 (y) führt wegen
y = fn (u) ≤ fn+1 (u) < fn+1 (v) = y
zum Widerspruch. Also ist die Folge (gn (y))n∈N monoton fallend. Dies ist die Grundlage
für den folgenden Satz:
Satz 4.30 (Approximation der Logarithmusfunktion) Für alle y > 0 konvergiert
√
die monoton fallende Folge der Zahlen n( n y − 1) und es gilt
√
ln y = loge y = lim n( n y − 1) .
n→∞
36
4 ZAHLENFOLGEN UND REIHEN
Beweis. Wir zeigen die Existenz des Grenzwertes
√
L(y) = lim n( n y − 1) für alle y > 0.
n→∞
Für y ≥ 1 ist die fragliche Folge nach unten durch 0 beschränkt. Zusammen mit der
bereits gezeigten Monotonie zeigt das die Existenz des Grenzwertes wegen des BolzanoKriteriums für monotone Folgen. Nun sei 0 < y < 1. Dann ist
p
p
√
√
√
n( n y − 1) = n(1 − n y −1 ) · n y = −n( n y −1 − 1) · n y.
Die rechte Seite der Gleichung konvergiert wegen y −1 ≥ 1 nach dem bereits gezeigten
gegen −L(y −1 ). Also konvergiert auch die linke Seite, und es gilt L(y) = −L(y −1 ).
Wir zeigen nun x = L(ex ) für alle x. Aus (1 + nx )n ≤ ex folgt durch Umstellen x ≤
√
n( n ex − 1), und der Übergang zum Limes ergibt x ≤ L(ex ) für alle x ∈ R. Insbesondere
ist auch −x ≤ L(e−x ) = −L(ex ), woraus x ≥ L(ex ) und damit die Gleichheit x = L(ex )
folgen. Also ist L die Umkehrfunktion von f (x) = ex , und daher gilt L(y) = ln y für alle
y ∈ R.
Wir wenden uns wieder der allgemeinen Theorie zu und leiten das folgende wichtige
Konvergenzprinzip her.
Definition 4.31 (Intervallschachtelung) Eine Intervallschachtelung (an |bn ) ist ein
Paar reeller Folgen (an ), (bn ) mit folgenden Eigenschaften:
a) an %,
b) bn &,
c) an ≤ bn für alle n ∈ N,
d) bn − an → 0 für n → ∞.
Satz 4.32 Ist (an |bn ) eine Intervallschachtelung, so existiert genau eine Zahl a ∈ R mit
an ≤ a ≤ bn für alle n ∈ N. Insbesondere gilt
\
[an , bn ] = {a} .
n∈N
Die Folgen (an ) und (bn ) konvergieren gegen a und man hat die ,,a priori Fehlerabschätzung”
|a − an | ≤ |bn − an | .
Beweis. Wegen am ≤ am+n ≤ bm+n ≤ bn gilt am ≤ bn für alle m, n ∈ N. Insbesondere ist
an ≤ a := sup{am : m ∈ N} ≤ bn
für alle n ∈ N .
Ist a0 eine weitere Zahl mit an ≤ a0 ≤ bn für alle n ∈ N, so folgt
0 ≤ |a − a0 | ≤ |bn − an | → 0 ,
also ist a = a0 . Speziell ist
lim bn = inf{bn : n ∈ N} = a .
n→∞
Die Fehlerabschätzung folgt aus bn ≥ a.
4.3 Monotone Zahlenfolgen und Intervallschachtelungen
37
Satz 4.33 (Intervallschachtelung für e) Durch (1 + n1 )n (1 + n1 )n+1 ist eine Intervallschachtelung in R gegeben, die sich auf die Zahl e zusammenzieht. Insbesondere gilt
|e − (1 + n1 )n | ≤ n3 .
Beweis. Es seien an = 1 +
b−1
n
=
n
n+1
1 n
n
und bn = 1 +
n+1
=
n+1−1
n+1
1 n+1
.
n
n+1
Dann ist an % bereits bekannt. Aus
=
1
1−
n+1
n+1
= cn+1
und cn+1 % e−1 nach (5) folgt bn & e . Also ist an < e < bn und
lim(bn −an ) = lim n1 ·an = 0. Hieraus folgt wegen an ≤ e ≤ 3 auch die Fehlerabschätzung.
Beispiel 4.34 (Leibnizreihe) Abschließend betrachten wir die zu Beginn des Paragraphen gestellte Frage nach der Konvergenz der Folge (sn ) mit
sn = 1 −
1 1
1
+ − . . . + (−1)n
.
3 5
2n + 1
Wir setzen
1
1 1
+ − +... −
und
3 5
4n − 1
1 1
1
1
= 1 − + − +... −
+
3 5
4n − 1 4n + 1
an = 1 −
bn
für n ≥ 1. Dann ist (an |bn ) offenbar eine Intervallschachtelung. Also konvergieren (an )
und (bn ) gegen den gleichen Wert. Dann konvergiert aber auch die gemischte Folge (sn ) =
(a1 , b1 , a2 , b2 , . . .). Der Nachweis, daß dieser Grenzwert gerade π/4 ist, kann aber noch
nicht erbracht werden.
Das Prinzip der Intervallschachtelung lässt auf C verallgemeinern:
Satz 4.35 (Kreisscheibensatz) Ist K1 ⊇ K2 ⊇ . . . eine Folge von abgeschlossenen
Kreisscheiben in C mit
T gegen Null strebenden Durchmessern. Dann gibt es genau eine
Zahl z ∈ C mit z ∈
Kn .
n∈N
Beweis. Wir betrachten das Problem in der Gaußschen Zahleneben. Die Projektionen der
Kreisscheiben auf die reelle bzw. imaginäre Achse erzeugen dort Intervallschachtelungen.
Bezeichnen α bzw. β die dadurch eingefangenen Zahlen, so ist z = α + β · i die einzige, in
allen Kreisscheiben Kn enthaltene Zahl.
Aufgaben
1. Zeigen Sie, dass die rekursiv definierte Folge
√
p
a0 = 2 , an = 2 + an−1
monoton wächst und beschränkt ist. Berechnen Sie den Grenzwert.
38
4 ZAHLENFOLGEN UND REIHEN
ln n
& 0.
n
n − 7 n + 3
3. Zeigen Sie, dass
eine Intervallschachtelung ist. Bestimmen Sie
n + 2 n + 2 n∈N
den eingefangenen Punkt.
2. Zeigen Sie
4. Es sei c > 1 und die Folgen (an ) und (bn ) seien rekursiv wie folgt definiert:
a0 = 1, b0 = c, an+1 =
c
bn+1
, an =
an + b n
.
2
Zeigen Sie, dass (an |bn√
) eine Intervallschachtelung ist
√ und zeigen Sie, dass der eingefangene Punkt gerade c ist. Berechnen Sie damit 2 auf vier Dezimalen (Benutzen
Sie die a priori Fehlerabschätzung.)
Hinweis: Zeigen Sie zuerst durch vollständige Induktion die Ungleichung b2n ≥ c.
√ √
√
5. Zeigen Sie, dass die Folge (an ) mit an = n( n + 1 − n) monoton wachsend und
beschränkt ist. Bestimmen Sie den Grenzwert.
Hinweis: Zeigen Sie an+1 /an ≥ 1.
6. Zeigen Sie
lim
n→∞
1
1+ α
n
n

 1
e
=

∞
für
für
für
α > 1,
α=1
0 < α < 1.
Hinweis: Benutzen Sie die Bernoullische Ungleichung und die aus Folgerung 4.28
bekannte Ungleichung (1 + nx )n ≤ ex für x ≥ 0.
4.4
Häufungspunkte
Bevor wir weiteren Konvergenzkriterien nachgehen, schwächen wir den Begriff des Grenzwertes etwas ab:
Definition 4.36 Es sei (an ) eine Zahlenfolge. Eine Zahl a heißt ein Häufungspunkt von
(an ), wenn für jedes ε > 0 unendlich viele Folgenglieder an in Uε (a) = {x : |x − a| < ε}
liegen, wenn also zu jedem n ∈ N ein Index k ≥ n so existiert, dass |a − ak | ≤ ε ist.
n−1
die beiden Zahlen
So hat beispielsweise die Zahlenfolge mit den Gliedern an = (−1)n
n
a = ±1 als Häufungspunkte. Die Beziehung zum Grenzwertbegriff ist durch die folgenden
beiden Sätze gegeben:
Satz 4.37 Konvergiert die Folge (an ) gegen a, so ist a der einzige Häufungswert von (an ).
Beweis. Offenbar ist a als Grenzwert auch ein Häufungspunkt. Ist aber b 6= a ein weiterer
Punkt, so gilt Uε (a) ∩ Uε (b) = ∅ für ε = |a − b|/2. Daher kann Uε (b) höchstens endlich
viele Folgenglieder an enthalten.
4.4 Häufungspunkte
39
Satz 4.38 Eine Zahl a ist genau dann ein Häufungspunkt der Folge (an ), wenn (an ) eine
gegen a konvergente Teilfolge (ank ) besitzt.
Beweis. Offensichtlich ist jeder Grenzwert einer Teilfolge von (an ) auch ein Häufungspunkt
von (an ). Sei umgekehrt a ein Häufungspunkt von (an ). Wir konstruieren eine gewünschte
Teilfolge dann so: Zu ε = 1 existiert mindestens ein Index n1 mit an1 ∈ U1 (a). Seien nun
bereits k Indizes n1 < n2 < . . . < nk mit ank ∈ U 1 (a) konstruiert. Dann gibt es aber auch
k
1
mindestens einen Index nk+1 > nk mit ank+1 ∈ U 1 (a). Die auf diese Weise
zu ε = k+1
k+1
konstruierte Folge (ank ) konvergiert nun gegen a, denn es gilt |ank − a| < k1 → 0.
Dem folgenden Satz kommt in der Analysis eine zentrale Bedeutung zu:
Satz 4.39 (Satz von Bolzano-Weierstraß) Jede beschränkte Zahlenfolge besitzt einen
Häufungspunkt.
Beweis. Wir betrachten zuerst den Fall reeller Zahlenfolgen und bedienen uns des sogenannten Halbierungsverfahrens:
Zu der beschränkten Folge (an ) wählen wir Zahlen A0 und B0 mit A0 ≤ an ≤ B0 für alle
0
. Falls das linke Teilintervall [A0 , C0 ] unendlich
n ∈ N. Wir setzen n0 = 0 und C0 = A0 +B
2
viele Folgenglieder an enthält, so wählen wir ein n1 > n0 mit an1 ∈ [A0 , C0 ] und setzen
A1 = A0 und B1 = C0 . In anderen Fall enthält aber [C0 , B0 ] unendlich viele Folgenglieder,
und wir wählen ein n1 > n0 mit an1 ∈ [C0 , B0 ] und setzen A1 = C0 und B1 = B0 .
In jedem Fall enthält [A1 , B1 ] dann unendlich viele Folgenglieder, und das Verfahren kann
wiederholt werden. Auf diese Weise entsteht eine Intervallschachtelung
B0 − A0
und Ak ≤ ank ≤ Bk für alle k ∈ N.
(Ak |Bk ) mit |Bk − Ak | =
2k
Nach Satz 4.32 existiert daher ein Grenzwert a der Folgen (Ak ) und (Bk ), der wegen
Satz 4.19 auch ein Grenzwert von (ank ) und damit ein Häufungspunkt von (an ) ist. Nach
Konstruktion ist dies sogar der kleinste Häufungspunkt von (an ).
Ist (zn ) nun eine komplexe, beschränkte Zahlenfolge, so setzen wir an = Re(zn ) und
bn = Im(zn ). Nach Obigem hat (an ) eine konvergente Teilfolge (ank ). Die Folge (bnk ) hat
wiederum eine konvergente Teilfolge (bnkj ). Somit ist (znkj ) konvergent.
Wir bemerken, dass das obige Verfahren im eigentlichen Sinn nicht konstruktiv, genauer
nicht algorithmisierbar ist, da die Entscheidung, ob ein Intervall unendlich viele Folgenglieder enthält, nicht algorithmisch entscheidbar ist. Trotz dieses grundsätzlichen Makels
ist das obige Kriterium jedoch von herausragender Bedeutung, da es keinen besseren Satz
gibt.
Eine genauere Analyse des Halbierungsverfahrens führt zu folgender Verschärfung des
Satzes von Bolzano-Weierstraß, die wir im Beweis zu diesem Satz bereits erwähnt hatten:
Satz 4.40 Jede beschränkte reelle Zahlenfolge (an ) besitzt einen größten und einen kleinsten Häufungswert. Diese heißen der Limes inferior bzw. der Limes superior von (an )
und sie werden durch
lim inf an bzw. durch lim sup an
n→∞
bezeichnet.
n→∞
40
4 ZAHLENFOLGEN UND REIHEN
Folgerung 4.41 Eine reelle Zahlenfolge ist genau dann konvergent, wenn sie beschränkt
ist und höchstens einen Häufungspunkt hat.
Beweis. Konvergente Folgen haben die genannten Eigenschaften. Sei umgekehrt (an ) beschränkt mit höchstens einem Häufungspunkt und sei a = lim inf an . Wäre a kein Grenzwert, so gäbe es ein ε > 0 derart, daß die Menge {n : |an − a| > ε} unendlich ist. Die
Teilfolge dieser an hat aber nach Bolzano-Weierstraß wiederum ein Häufungspunkt, der
natürlich von a verschieden ist. Dieser Widerspruch beweist den Satz.
Definition 4.42 Es sei E die Menge R oder C, es sei M eine Teilmenge von E. Eine
Zahl a heißt ein Häufungspunkt von M in E, wenn jede punktierte ε-Umgebung
Uε0 (a) = {x ∈ E : |x − a| < ε, x 6= a}
von a mindestens einen Punkt von M enthält.
Die Beziehung zwischen Häufungspunkten von Mengen und konvergenten Folgen ist durch
folgenden Satz gegeben:
Satz 4.43 Wie oben seien E = R, C und M ⊆ E. Ein Punkt a ∈ E ist genau dann ein
Häufungspunkt von M in E, wenn eine Folge von Elementen xn ∈ M mit xn 6= a und
xn → a existiert.
Beweis. Ist a ein Häufungspunkt, so können wir zu jedem ε = n1 ein Element xn ∈
0
(a) wählen. Wegen |xn − a| < n1 gilt xn → a. Ist umgekehrt eine Folge (xn ) mit
M ∩ U1/n
den im Satz genannten Eigenschaften gegeben, so gilt ist offenbar Uε (a)0 ∩ M 6= 0 für alle
ε > 0.
Satz 4.44 (Satz von Bolzano-Weierstraß für Mengen) Jede beschränkte unendliche Menge M in R oder C hat einen Häufungspunkt.
Beweis. Da M als unendlich vorausgesetzt wurde, kann eine Folge paarweise verschiedener
Punkte xn in M ausgewählt werden. Der Häufungspunkt dieser Folge ist nach aber ein
Häufungspunkt von M .
Für unbeschränkte reelle Zahlenfolgen führen wir schließlich die Werte +∞ und −∞ als
uneigentliche Grenzwerte bzw. Häufungspunkte ein:
Definition 4.45 Eine reelle Zahlenfolge (an ) heißt uneigentlich konvergent oder bestimmt
divergent gegen +∞, wenn zu jeder (großen) Zahl K > 0 ein Index N ∈ N so existiert,
dass |an | > K für alle n ≥ N gilt. In diesem Fall schreiben wir auch
an → +∞ oder lim an = +∞.
n→∞
Der Wert +∞ heißt ein Häufungspunkt von (an ), wenn eine Teilfolge (ank ) existiert, die
uneigentlich konvergent gegen ∞ ist.
Analog sind die Definitionen mit −∞ zu bilden.
4.5 Das Cauchysche Konvergenzkriterium
41
Aufgaben zu Abschnitt 4.4
1. Führen Sie den Beweis des Satzes von Bolzano-Weierstraß (4.39) für komplexe Zahlenfolgen aus.
2. Bestimmen Sie die Häufungspunkte der Folge ((−1)n e1/n ).
3. Man zeige, dass die nach folgender Vorschrift konstruierte Folge jede positive reelle Zahl als Häufungspunkt hat: Man trage die Brüche m/n in einer unendlichen
zweidimensionalen Tabelle ein und bilde hieraus wie in Figur 8 eine Folge.
4. Man zeige: Für jede beschränkte Zahlenfolge (an ) gelten
lim inf an =
n→∞
lim sup an =
n→∞
lim (inf ak )
n→∞ k≥n
und
lim (sup ak ) .
n→∞ k≥n
5. Man zeige, dass jeder Punkt des Intervalls [−1, 1] ein Häufungspunkt der Folge
an = sin(n) ist.
4.5
Das Cauchysche Konvergenzkriterium
Kern dieses Abschnitts ist die Bereitstellung des fundamentalen Cauchyschen Konvergenzkriteriums. Der hierfür entscheidende Begriff wurde 1832 von A. Cauchy gefunden:
Definition 4.46 Eine Zahlenfolge (an ) heißt eine Cauchy- oder Fundamentalfolge, wenn
es zu jedem ε > 0 eine natürliche Zahl n0 = n0 (ε) derart gibt, dass für alle m, n ≥ n0 die
Ungleichung |an − am | < ε besteht.
Satz 4.47 Jede Cauchy-Folge ist beschränkt.
Beweis. Zu ε = 1 sei n0 so gewählt, dass |an − am | ≤ 1 für alle m, n ≥ n0 gilt. Dann gilt
für alle n ≥ n0 die Abschätzung
|an | ≤ |an − an0 + an0 | ≤ |an − an0 | + |an0 | ≤ 1 + |an0 |.
Setzt man
K = max{|a1 |, . . . , |an0 |, 1 + |an0 |},
so folgt |an | ≤ K für alle n ∈ N.
Satz 4.48 Jede konvergente Zahlenfolge ist eine Cauchy-Folge.
Beweis. Es sei (an ) konvergent gegen a. Zu gegebenem ε > 0 existiert dann eine Zahl n0
so, dass |an − a| < ε/2 für alle n ≥ n0 gilt. Für beliebiges n, m ≥ n0 folgt dann
|an − am | ≤ |an − a| + |a − am | <
ε ε
+ =ε.
2 2
42
4 ZAHLENFOLGEN UND REIHEN
Satz 4.49 (Cauchysches Konvergenzkriterium) Eine Zahlenfolge ist genau dann
konvergent, wenn sie eine Cauchy-Folge ist.
Beweis. Es bleibt zu zeigen, dass jede Cauchy-Folge konvergent ist. Es sei (xn ) eine
Cauchy-Folge. Da Cauchy-Folgen beschränkt sind, hat (xn ) wegen des Satzes von BolzanoWeierstraß einen Häufungspunkt x∗ . Wir zeigen, dass x∗ sogar der Grenzwert von (xn ) ist.
Dazu sei ε > 0 beliebig gegeben. Wir wählen ein n0 = n0 (ε) derart, dass |xn − xm | ≤ ε/2
für alle n, m ≥ n0 gilt. Da x∗ ein Häufungspunkt von (xn ) ist, existiert ein Folgenglied
xn1 mit n1 ≥ n0 und |x∗ − xn1 | < ε/2. Hieraus folgt
|xn − x∗ | ≤ |xn − xn1 | + |xn1 − x∗ | <
ε ε
+ =ε
2 2
für alle n ≥ n0 (ε).
Wir demonstrieren die Leistungsfähigkeit des Kriteriums an folgender Aussage.
Satz 4.50 Es sei (ak ) eine beschränkte Zahlenfolge und es sei 0 < x < 1. Dann konvergiert die Folge (sn ) mit den Gliedern
sn =
n
X
ak x k .
k=0
Beweis. Es sei K eine Schranke für (ak ) und es seien m > n ≥ 0 beliebig gegeben. Dann
ist
|sm − sn | ≤
m
X
k
|ak | |x| ≤ K ·
k=n+1
m
X
k
n+1
|x| = K · |x|
m−n−1
X
k=n+1
|x|k ≤ K · |x|n+1 ·
k=0
1
→0
1 − |x|
für n → ∞. Also ist (sn ) eine Cauchy-Folge und daher konvergent in R.
1
Setzt man x = 10
und ist (ak ) eine Folge natürlicher Zahlen aus der Menge {0, 1, . . . , 9},
so bedeutet obiger Satz, dass eine formale Dezimalbruchentwicklung
u = 0.a1 a2 a3 . . .
auch als unendliche Reihe“
”
u = lim
n→∞
n
X
k=1
−k
ak 10
=
∞
X
ak 10−k
k=1
aufgefasst werden kann.
Beispiel 4.51 Wir können erneut die Konvergenz der zu Beginn von Abschnitt 4.3
erwähnten Folge nachweisen. In der Tat gilt für m > n
0 < s m − sn =
1
1
1
2
−
+ −... ±
≤
→ 0 für n → ∞ .
n+1 n+2
m
n+1
Also ist (sn ) eine Cauchy-Folge und daher konvergent.
4.6 Topologische Grundbegriffe
43
Aufgaben zu Abschnitt 4.5
1. Weisen Sie die Konvergenz der schon in Abschnitt 4.3 und Beispiel 4.34 erwähnten
Folge (sn ) mit
n
X
(−1)k
sn =
2k + 1
k=0
(Leibnizreihe)
erneut nach, indem Sie zeigen, dass (sn ) eine Cauchyfolge ist.
2. Wandeln Sie den periodischen Dezimalbruch a = 0, 123456789 in einen Bruch der
Form a = m
um.
n
4.6
Topologische Grundbegriffe
Die bisherigen Begriffsbildungen erlauben es, Punkte und Teilmengen von R bzw. C in
ihren ,,Lagebeziehungenßueinander zu beschreiben. Das Hilfsmittel ist dabei der bereits
mehrfach verwendete Umgebungsbegriff Uε (a). In diesem Abschnitt bezeiche E = R oder
E = C.
Definition 4.52 Es sei M ⊆ E eine beliebige Teilmenge von E. Eine Zahl a ∈ E heißt
dann:
a) ein innerer Punkt von M , wenn es eine Umgebung Uε (a) mit Uε (a) ⊆ M gibt.
b) ein äußerer Punkt von M , wenn es eine Umgebung Uε (a) mit Uε (a) ∩ M = ∅ gibt.
c) ein Randpunkt von M , wenn jede Umgebung Uε (a) sowohl Punkte aus M als auch
Punkte aus dem Komplement M enthält.
d) ein Häufungspunkt von M , wenn jede punktierte ε-Umgebung Uε0 (a) = Uε (a) \ {a}
einen Punkt aus M enthält.
Ein Punkt x ist genau dann ein innerer Punkt einer Menge M , wenn x ein äußerer Punkt
des Komplements M = E \ M ist (Beweis?). Jeder innere Punkt einer Menge ist auch ein
Häufungspunkt dieser Menge.
Abbildung 5: Randpunkte, innere und äußere Punkte
Definition 4.53 Eine Teilmenge M ⊆ E heißt
a) offen, wenn jeder ihrer Punkte ein innerer Punkt ist.
b) abgeschlossen, wenn das Komplement M = E \ M offen ist.
44
4 ZAHLENFOLGEN UND REIHEN
Satz 4.54 Jede ε-Kugel Uε (x0 ) = {x ∈ E : |x − a| < ε} ist offen.
Beweis. Übungsaufgabe.
Abgeschlossene Mengen lassen sich wie folgt charakterisieren:
Satz 4.55 Eine Menge M ⊂ E ist genau dann abgeschlossen, wenn sie alle ihre
Häufungspunkte in E enthält.
Beweis. Ein Häufungspunkt x von M kann kein innerer Punkt von M = E \ M sein.
Wird daher M als abgeschlossen vorausgesetzt, so folgt x 6∈ M , also ist x ∈ M . Enthält
umgekehrt die Menge M alle ihre Häufungspunkte, so gibt es zu jedem Punkt y 6∈ M
eine ε-Umgebung mit Uε (y) ∩ M = ∅. Also ist y ein innerer Punkt von M = E \ M .
Diese Menge M besteht daher nur aus inneren Punkten, sie ist also offen. Folglich ist M
abgeschlossen.
Definition 4.56 Für eine beliebige Menge M ⊆ E heißt die Vereinigung von M mit der
Menge aller ihrer Häufungspunkte der Abschluss M a von M .
Satz 4.57 Der Abschluss einer Menge M ist die kleinste abgeschlossene Menge, die M
enthält. Insbesondere gilt M a = M aa .
Beweis. Wir haben vor allem zu zeigen, dass M a abgeschlossen ist. Dazu sei x 6∈ M ein
Häufungspunkt von M a . Dann existiert zu jedem ε > 0 ein Punkt y ∈ Uε0 (x) ∩ M a . Ist
dabei bereits y ∈ M , so ergibt das y ∈ Uε0 (x)∩M . Im anderen Fall ist y aber zumindestens
ein Häufungspunkt von M . Zu δ = ε − |x − y| > 0 existiert daher ein m ∈ M ∩ Uδ0 (y).
Also ist |x − m| ≤ |x − y| + |y − m| < |x − y| + δ = ε. Das heißt m ∈ Uε0 (x). Also
ist x ein Häufungspunkt von M , woraus x ∈ M a folgt. Ist schließlich A eine beliebige
abgeschlossene Menge, die M enthält, so folgt aus Satz 4.55 die Inklusion M a ⊆ A.
Häufig werden Vereinigungen oder Durchschnitte offener oder abgeschlossener Mengen zu
bilden sein. Hierfür gilt der folgende Satz.
Satz 4.58 a) Die Vereinigung beliebig vieler offener Mengen ist offen.
b) Der Durchschnitt endlich vieler offener Mengen ist offen.
c) Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen.
d) Der Durchschnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen.
Beweis. Es ist sehr leicht zu sehen, dass die Vereinigung offener Mengen nur aus inneren
Punkten besteht. Ebenso leicht erkennt man, dass der Durchschnitt von zwei (und damit
von endlich vielen) offenen Mengen wieder offen ist. Die Behauptungen c) und d) folgen
dann aus a) und b) durch Betrachtung der Komplementärmengen und Verwendung der
de Morganschen Formeln.
Abzählbare Durchschnitte offener Mengen müssen nicht mehr offen sein. So ist beispielsweise die Menge
\
1
0, 1 +
= (0, 1]
n
n∈N
weder offen noch abgeschlossen.
4.7 Der Banachsche Fixpunktsatz
45
Definition 4.59 Eine Teilmenge M ⊆ E heißt (topologisch) dicht in E, wenn ihr Abschluss gleich E ist.
Nach Satz 1.13 ist zum Beispiel die Menge Q der rationalen Zahlen (auch topologisch)
dicht in R.
Aufgaben zu Abschnitt 4.6
1. Beweisen Sie den Satz 4.54.
2. Für Teilmengen M1 , M2 von R oder C beweise man folgende Aussagen:
a) M1aa = M1a ,
b) Aus M1 ⊆ M2 f olgt M1a ⊆ M2a ,
c) (M1 ∪ M2 )a = M1a ∪ M2a .
3. Es sei α > 0 eine reelle Zahl und es sei H = {m + nα : m, n ∈ Z} .
Man zeige der Reihe nach:
a) Ist α irrational, so hat H kein minimales positives Element (und umgekehrt).(Hinweis: Verwenden Sie, dass aus h1 , h2 ∈ H stets h1 ± h2 ∈ H folgt.)
b) Ist α irrational, so ist H dicht in R. (Benutzen Sie a)).
4. Beweisen Sie: Sind ∅ =
6 A, B abgeschlossene, beschränkte und nichtleere Teilmengen
von R oder C, so gibt es Punkte a0 ∈ A und b0 ∈ B mit der Eigenschaft
|a0 − b0 | = dist(A, B) = inf{|a − b| : a ∈ A, b ∈ B}.
4.7
Der Banachsche Fixpunktsatz
In R oder und C existiert ein sehr leistungsfähiges Verfahren zur näherungsweisen Lösung
von Gleichungen. Konkrete Aufgabenstellungen sind beispielsweise die reellen Gleichungen
ex = x3 oder auch cos(x) = x. Beide Gleichungen sind mit elementaren Umformungen
nicht aufzulösen. Es sei also E = R oder E = C. Es seien f und g zwei Abbildungen von
E in sich. Die Gleichung f (x) = 0 heißt dann eine Gleichung 1. Art, die Gleichung g(x) =
x heißt Gleichung 2. Art oder auch Fixpunktgleichung. Beide Aufgabenstellungen sind
äquivalent, da zum Beispiel durch Addition bzw. Subtraktion von x die eine Gleichung in
die andere Gleichung überführt werden kann. Die Gleichung g(x) = x erweist sich dabei für
die näherungsweise Lösung als zugänglicher. Rückt man nämlich den Abbildungscharakter
von g ins Blickfeld, so kann eine Lösung der Gleichung g(x) = x als Fixpunkt der Funktion
g gedeutet werden. Lösen der Gleichung bedeutet daher das Auffinden von Fixpunkten.
In den im folgenden zu präzisierenden günstigen Fällen erweist sich dieser Fixpunkt als
anziehend, d.h., er kann als Limes der iterativ gebildeten Folge xn+1 = g(xn ) gewonnen
werden. Wir präzisieren diesen Umstand durch die folgende Definition.
Definition 4.60 Es sei X eine Teilmenge von E. Eine Abbildung g : X → X heißt eine
Kontraktion in X, wenn es eine Zahl 0 < q < 1 mit
|g(x) − g(x0 )| ≤ q|x − x0 |
gibt.
für alle x, x0 ∈ X ,
46
4 ZAHLENFOLGEN UND REIHEN
Satz 4.61 (Banachscher Fixpunktsatz) Es sei X eine abgeschlossene Teilmenge von
E und es sei g eine Kontraktion in X mit einer Zahl 0 < q < 1. Dann existiert in X
genau eine Lösung x∗ der Gleichung g(x∗ ) = x∗ . Man erhält sie als Grenzwert der durch
die Vorschrift
xn+1 = g(xn )
gebildeten Folge mit beliebigem Startwert x0 ∈ X. Überdies gilt die Fehlerabschätzung
|x∗ − xn | ≤
qn
· |x1 − x0 |.
1−q
Beweis. Zum Beweis der Einzigkeit nehmen wir an, dass zwei Lösungen g(x∗ ) = x∗ und
g(x∗∗ ) = x∗∗ existieren. Die Kontraktionsbedingung ergibt
|x∗ − x∗∗ | = |g(x∗ ) − g(x∗∗ )| ≤ q|x∗ − x∗∗ | ,
woraus wegen q < 1 die Gleichung |x∗ − x∗∗ | = 0 , also x∗ = x∗∗ folgt.
Für den Existenzbeweis bilden wir eine Folge (xn ) nach der im Satz angegebenen Vorschrift. Dann ist
|xn+1 − xn | = |g(xn ) − g(xn−1 )| ≤ q|xn − xn−1 | ≤ q 2 |xn−1 − xn−2 | ≤ . . . ≤ q n |x1 − x0 |.
Hieraus folgt
|xn+m+1 − xn | ≤
m
X
|xn+j+1 − xn+j | ≤
j=0
m
X
q n+j |x1 − x0 | ≤ q n
j=0
1
|x1 − x0 | → 0 (∗).
1−q
Also ist (xn ) eine Cauchy-Folge. Es sei x∗ = lim xn . Da X abgeschlossen ist, gilt x∗ ∈ X.
n→∞
Wir zeigen g(x∗ ) = x∗ . Dazu sei ε > 0 beliebig vorgegeben. Dann existiert ein Index n0
mit |x∗ − xn | < 2ε für alle n ≥ n0 . Hieraus folgt
|g(x∗ ) − x∗ | = |g(x∗ ) − g(xn0 ) + g(xn0 ) − x∗ | ≤ |g(x∗ ) − g(xn0 )| + |g(xn0 ) − x∗ |
ε ε
≤ q|x∗ − xn0 | + |xn0 +1 − x∗ | < + = ε .
2 2
Da ε beliebig war, folgt g(x∗ ) = x∗ . Die Fehlerabschätzung ergibt sich aus der Ungleichung
(∗) durch Grenzübergang m → ∞.
Beispiel 4.62 Betrachten wir als erstes Beispiel die Gleichung cos(x) = x. Die Funktion
g(x) = cos(x) bildet das Intervall X = [0, 1] in sich ab. Die Kontraktionseigenschaft von
g auf X ergibt sich aus der folgenden Abschätzung, in der die Ungleichung | sin(t)| ≤ |t|
und ein Additionstheorem für den Kosinus verwendet werden:
| cos(x) − cos(x0 )| = |2 sin
x + x0
x − x0
1
· sin
| ≤ 2 · · sin 1 · |x − x0 | = sin 1 · |x − x0 |.
2
2
2
Wegen 0 < sin 1 < 1 liegt eine Kontraktion vor. Die Konstruktion der Iterationsfolge ist in
Abbildung 6 veranschaulicht, numerisch ergibt sich x∗ = 0.74... als Lösung der Gleichung
cos(x) = x.
4.7 Der Banachsche Fixpunktsatz
47
Abbildung 6: Iterationsfolge zur Lösung der Gleichung cos x = x.
Beispiel 4.63 Als zweites Beispiel betrachten wir eine zur Berechnung von
k-ten Wurzeln geeignete Kontraktion
x=x+
a − xk
,
k
0<a≤1.
Man kann zeigen, dass die Funktion
k
g(x) = x + a−x
eine Abbildung des Ink
a
tervalls X = [ k , 1] in sich ist. Weiter
ist
1
k
k
|g(x) − g(y)| = x − y − (x − y ) = |x − y|
k
a k−1 .
< |x − y| · 1 −
k
1
k−1
k−1
1 − (x
+ . . . + y )
k
Also ist g eine Kontraktion mit q = 1 − (a/k)k−1 , und der Banachsche Fixpunktsatz
liefert eine Lösung von a − xk = 0. Das hier benutzte Verfahren wird auch als vereinfachtes Newton-Verfahren bezeichnet.
Für a = 1/2 und k = 2 und x0 = 0.6 ergibt sich
p
∗
eine Näherungsfolge für x = 1/2 = 0, 707... gemäß der Werte in obiger Tabelle. Die
Näherungsfolge hat die in Satz 4.61 vorausgesagte lineare Konvergenzgeschwindigkeit.
Wir erinnern, dass die Iterationsfolge aus Kapitel 1 quadratisch konvergierte.
Aufgaben zu Abschnitt 4.7
1. Man berechne den nach Folgerung 4.29 zu vermutenden dritten Schnittpunkt von
y = x20 mit y = ex .
(Hinweis. Transformieren Sie die Schnittpunktgleichung durch Logarithmieren in
eine Fixpunktgleichung und zeigen Sie, dass die Funktion g(x) = 20 ln x eine Kontraktion auf dem Intervall [20 · ln 20, 202 ] ist. Iterieren Sie dann.)
48
5
5.1
5 ZAHLENREIHEN
Zahlenreihen
Begriffsbildung und Konvergenzkriterien
Definition 5.1 Es sei (ak )k∈N eine Zahlenfolge.
a) Unter der n-ten Partialsumme dieser Folge versteht man die Zahl
s n = a0 + . . . + an =
n
X
ak .
k=0
b) Unter der unendlichen Reihe der Folge (an ) versteht man die Folge (sn )n∈N der
Partialsummen, in Zeichen
!
∞
n
X
X
ak =
ak
.
k=0
k=0
n∈N
Mit dieser Begriffsbildung wird die Reihenlehre auf die Theorie der Folgen zurückgeführt.
Definition 5.2 Eine Reihe
∞
P
ak heißt konvergent (mit Grenzwert s), wenn die zu-
k=0
gehörige Folge der Partialsummen (sn )n∈N (gegen s) konvergiert. In diesem Fall benutzt
man das Reihensymbol auch zur Bezeichnung des Grenzwertes, man schreibt also
s=
∞
X
ak = lim
k=0
n→∞
n
X
ak .
k=0
Diese Doppelbedeutung der Symbolik wird zu Verwechselungen keinen Anlass geben.
Nach dem bisherigen ist die Reihenlehre ein Teilgebiet der Theorie der Folgen. Der nächste
Satz zeigt aber, dass auch umgekehrt jede Folge als eine Reihe (die sogenannte Teleskopsumme) aufgefasst werden kann. Diese Dualität ist ein wichtiges beweistechnisches
Hilfsmittel. Wir haben dies z.B. schon im Beweis zu Satz 4.61 ausgenutzt.
Satz 5.3 Es sei (an )n∈N eine beliebige Folge und es sei bn =
n
P
(ak+1 − ak ). Dann gilt:
k=0
lim an = a genau dann, wenn
n→∞
∞
X
(ak+1 − ak ) = a − a0 .
k=0
Beweis. Für jedes a ∈ E gilt
a − an+1 = a − (an+1 − an + an − + . . . − a0 + a0 ) = (a − a0 ) − bn ,
also
|a − an+1 | = |(a − a0 ) − bn |.
Hieraus folgt für n → ∞ die Behauptung.
5.1 Begriffsbildung und Konvergenzkriterien
Beispiel 5.4 Es gilt
∞
X
k=1
denn es ist
n
X
k=1
n
X
1
=
k(k + 1) k=1
49
1
= 1,
k(k + 1)
1
1
−
k+1 k
=1−
1
→ 1.
n+1
Definition 5.5 Unter einer geometrischen Reihe versteht man eine Reihe der Form
∞
X
xk mit x ∈ C.
k=0
Die Partialsummen der geometrischen Reihe wurden bereits in Satz 1.6 berechnet, es galt
sn =
n
X
k=0
xk =
1 − xn+1
.
1−x
Dieser Ausdruck konvergiert genau dann, wenn |x| < 1 ist, und der Grenzwert ist dann
1
. Das ergibt die wichtige Formel
1−x
∞
P
k=0
xk =
1
für |x| < 1.
1−x
Beispiel 5.6 Beispiel einer divergenten Reihe ist die harmonische Reihe:
∞ 1
P
= ∞.
k=1 k
Die Divergenz erkennt man aus der Abschätzung
1
1 1
1
1
1
1
s 2n = 1 + +
+
+
+ ... +
+ ... +
+ ... + n
2
3 4
5
8
2n−1 − 1
2
n−1
1 2 4
2
n
≥ 1 + + + + ... + n ≥ .
2 4 8
2
2
Daher ist die Teilfolge (s2n ) unbeschränkt, also nicht konvergent.
Aus den Konvergenzkriterien für Folgen gewinnt man entsprechende Konvergenzkriterien
für Reihen:
Satz 5.7 (Ein notwendiges Konvergenzkriterium) Wenn
∞
P
ak konvergent ist,
k=1
dann ist (ak ) eine Nullfolge.
(Das Beispiel der harmonischen Reihe zeigt, dass die Umkehrung obiger Aussage nicht
richtig ist.)
50
5 ZAHLENREIHEN
Beweis. Falls (sn ) konvergent ist, so ist (sn ) auch eine Cauchy-Folge. Hieraus folgt
|an | = |sn − sn−1 | → 0 für n → ∞.
Also ist (an ) eine Nullfolge.
Satz 5.8 (Cauchysches Konvergenzkriterium)
∞
X
k=1
n+p
X
ak ist konvergent ⇐⇒ ∀ε > 0 ∃n0 = n0 (ε) ∀p ≥ 1 ∀n ≥ n0 : ak < ε.
k=n+1
Beweis. Es ist
n+p
n+p
n
X
X
X
ak .
ak −
ak = |sn+p − sn | = k=1
k=n+1
k=1
Die im Satz angegebene Bedingung bedeutet daher, dass (sn ) eine Cauchy-Folge ist. Dies
ist in R oder C aber mit der Konvergenz der Folge äquivalent.
Das Cauchy-Kriterium für Reihen findet z.B. seine Anwendung beim Majorantenkriterium, das wir in Abschnitt 5.3 herleiten werden. Daher betrachten wir an dieser Stelle keine
weiteren Beispiele.
P
P
Satz 5.9 (Grenzwertsätze) Sind dieP
Reihen
ak und
P bk konvergent und ist λ eine
Zahl, so konvergieren auch die Reihen (ak ± bk ) und
λak und es gelten
∞
X
(ak ± bk ) =
k=0
∞
X
ak ±
k=0
∞
X
bk und
k=0
∞
X
λak = λ
k=0
∞
X
ak .
k=0
Beweis. Für die zugehörigen Partialsummen gilt
n
X
(ak ± bk ) =
k=0
n
X
k=0
ak ±
n
X
bk .
k=0
Daher folgt die Behauptung aus den entsprechenden Grenzwertsätzen für Folgen.
Produkte von Reihen verhalten sich wesentlich komplizierter, wir kommen in Satz 5.25
hierauf zurück.
Abschließend betrachten wir Reihen mit reellen Gliedern.
Satz 5.10 (Bolzano-Kriterium für Reihen mit nichtnegativen Gliedern) Es
∞
P
gelte an ≥ 0 für alle n ∈ N. Dann
an genau dann wenn die zugehörige Folge (sn ) der
n=1
Partialsummen beschränkt ist.
Beweis. Wegen sn+1 = sn + an+1 ≥ sn ist die Partialsummenfolge (sn ) monoton wachsend.
Die Beschränktheit von (sn ) ist somit nach Bolzanos Kriterium 4.24 mit der Konvergenz
von (sn ) äquivalent.
5.1 Begriffsbildung und Konvergenzkriterien
51
Beispiel 5.11 Als Anwendung untersuchen wir die sogenannten Dirichlet-Reihen
und beweisen
∞
X
1
konvergent für 1 < α < ∞
ζ(α) =
ist
.
α
divergent für 0 < α ≤ 1
k
k=1
Die Funktion ζ = ζ(α) heißt auch Riemannsche Zeta-Funktion.
Wir beginnen nun mit dem Nachweis der Divergenzbehauptung. Für α = 1 erhalten wir
die harmonische Reihe, deren Divergenz wir bereits
nkennen.
Für 0 < α < 1 gilt aber
P
1
1
≤ k1α gilt, also muß auch die Partialsummenfolge
unbeschränkt und daher
k
kα
k=1
divergent sein.
n∈N
Für α = 2 folgt
n
n
n
X
X
X
1
1
1
=1+
≤1+
≤1+1=2
2
2
k
k
k(k + 1)
k=1
k=2
k=1
nach Beispiel 5.4. Daher ist die zugehörige Partialsummenfolge beschränkt, und die
Dirichlet-Reihe ist für α = 2 konvergent. Für α ≥ 2 ist die Dirichlet-Reihe wegen k1α ≤ k12
dann ebenfalls konvergent.
Es bleibt die Lücke 1 < α < 2 zu untersuchen. Das gelingt mit einem Vorgriff auf die
Integralrechnung (siehe Satz 8.41). Es ist nämlich (Figur 7):
n
Zn
n
X
1
1
x1−α 1
1
=
≤
dx =
(n1−α − 1) ≤
α
α
k
x
1−α 1
1−α
α−1
k=2
1
für alle α > 1. Also ist
n
X
1
α
1
≤
1
+
=
.
α
k
α
−
1
α
−
1
k=1
Die Partialsummenfolge ist daher beschränkt, also konvergent.
Abbildung 7: Cauchys Integraltest
Die soeben angewandte Methode eines Konvergenznachweises wird auch Cauchyscher
Integraltest genannt.
Satz 5.12 (Verdichtungskriterium) Es sei an & 0. Dann gilt:
∞
P
n=0
an konvergiert genau dann, wenn
∞
P
k=0
a2k 2k konvergiert.
52
5 ZAHLENREIHEN
Beweis. Wegen an & 0 gilt
1
a2k · 2k = a2k · 2k−1 ≤ a2k−1 + . . . + a2k −1 ≤ a2k−1 · 2k−1
2
für alle k ∈ N. Hieraus folgt
N
N
2X
−1
N
X
1X
k
a2 k · 2 ≤
an ≤
a2k−1 · 2k−1 .
2 k=1
k=1
k=1
Somit sind die Partialsummenfolgen der beiden Reihen entweder beide beschränkt oder
beide unbeschränkt. Die Behauptung des Satzs folgt nun aus dem Bolzano-Kriterium für
Reihen mit nichtnegativen Gliedern.
Beispiel 5.13 Mit Hilfe dieses Kriteriums lässt sich erneut die Konvergenz der DirichletReihen untersuchen. Wegen
1
· 2k = 2k(1−α)
(2k )α
ist
X 1
X
k
2k(1−α) ,
·
2
=
k )α
(2
k
k
und diese geometrische Reihe konvergiert genau dann, wenn 1 − α < 0 also α > 1 ist.
Dies besätigt das bereits erhaltene Ergebnis.
Aufgaben zu Abschnitt 5.1
1. Man zeige
∞
P
n=1
1
qn
=
q
q−1
für |q| < 1.
2. Rechtfertigung der Dezimalbruchentwicklung (s.a. Satz 4.50) Es sei (an ) eine
Folge von Zahlen aus der Menge {0, 1, 2, . . . , 9} (die Ziffern in der Dezimalentwick∞
P
lung). Man beweise die Konvergenz der Reihe
ak · 10−k mittels:
k=1
a) dem Cauchykriterium (s.o.)
b) Satz 5.10.
3. Man zeige unter Verwendung des Cauchy-Kriteriums: Ist (an ) eine beschränkte Zah∞
P
an z n .
lenfolge und ist z ∈ C mit |z| < 1 eine beliebige Zahl, so konvergiert
n=0
4. Für welche s ∈ R konvergiert die Reihe
∞
X
k=2
1
?
n · (ln k)s
Hinweis: Verwenden Sie das Verdichtungskriterium.
5. Finden Sie eine geschlossene Formel für die Partialsummen der folgenden Reihe und
berechnen Sie deren Grenzwert:
∞
X
1
.
k · (k + 1) · (k + 2)
k=1
Hinweis: Verwenden Sie eine Partialbruchzerlegung.
5.2 Alternierende Reihen in R
5.2
53
Alternierende Reihen in R
∞
P
Definition 5.14 Eine Reihe
an heißt alternierend, wenn an · an+1 < 0 für alle n ∈ N
n=0
gilt.
Die bereits wiederholt untersuchte Leibnizreihe
∞
P
(−1)n
n=0
1
ist ein Beispiel für eine
2n + 1
alternierende Reihe. Für solche Reihen gilt das:
Satz 5.15 (Leibnizsches Konvergenzkriterium) Jede alternierende Reihe
∞
P
an mit
n=0
|an | & 0 ist konvergent, und es gilt |s − sn | ≤ |an+1 | für alle n ∈ N. Dabei bezeichnet (sn )
die Folge der Partialsummen.
Beweis. Ohne Beschränkung der Allgemeinheit sei a0 > 0. Für alle n ∈ N gilt dann
a2n > 0 > a2n+1 . Aus den nachfolgenden Überlegungen folgt, dass (s2n+1 |sn ) eine Intervallschachtelung ist:
s2n+1
s2n+1
s2n+2
s2n − s2n+1
=
≤
=
=
s2n + a2n+1 < s2n ,
s2n+1 + a2n+2 + a2n+3 = s2n+3 ,
s2n + a2n+1 + a2n+2 ≤ s2n und
−a2n+1 → 0 .
Nach dem Prinzip der Intervallschachtelung konvergieren daher die Folgen (s2n+1 ) und
(s2n ) gegen den gleichen Wert s. Also konvergiert auch (sn ) gegen s. Schließlich ist
0 ≤ s2k − s
0 ≤ s − s2k+1
≤ s2k − s2k+1
≤ s2k+2 − s2k+1
= |a2k+1 |,
= a2k+2 .
Hieraus folgt 0 ≤ |s − sn | ≤ |an+1 | für alle n ∈ N.
Das Leibniz-Kriterium ergibt sofort die Konvergenz der nachfolgenden Beispiele, die angegebenen Grenzwerte sind mit diesen Mitteln aber noch nicht zu berechnen. Zu bemerken
ist auch, dass die angegebenen Reihen sehr langsam konvergieren:
∞
X
(−1)n
n=0
∞
X
n=0
5.3
1
n+1
(−1)n
1
2n + 1
(= ln 2) ,
(=
π
).
4
Absolut konvergente Reihen in R und C
In diesem Abschnitt werden wir einige sehr einfach zu handhabende hinreichende Konvergenzkriterien kennen lernen.
54
5 ZAHLENREIHEN
Definition 5.16 Eine Reihe
vergiert.
P
ak heißt absolut konvergent, wenn die Reihe
P
|ak | kon-
Satz 5.17 Jede absolut konvergente Reihe ist auch konvergent.
Beweis. Jede absolut konvergente Reihe erfüllt das Cauchy-Kriterium
n+m
n+m
X
X
ak ≤
|ak | → 0 für n → ∞
k=n
k=n
und ist daher konvergent.
Es sei bemerkt, dass es konvergente Reihen gibt, die nicht absolut konvergent sind. Die
∞
P
1
Reihe
(−1)k+1 ist ein Beispiel dafür.
k
k=1
P
Satz 5.18 (Majorantenkriterium) P
Eine Reihe
ak ist genau dann absolut konvergent, wenn es eine konvergente Reihe
ck nichtnegativer
reeller Zahlen ck so gibt, dass
P
|a
ck heißt eine konvergente Majorante für
Pk | ≤ ck für (fast) alle k ∈ N gilt. (Die Reihe
ak .)
P
P
Beweis. Ist
ak absolut konvergent, so ist die Reihe
|ak | selbst als konvergente
MaP
jorante
geeignet.
Gilt umgekehrt
ck , so ist
P
P
P |ak | ≤ ck mit einer konvergenten Reihe
|ak | ≤ ck < ∞, also ist
|ak | konvergent nach dem Bolzanokriterium Satz 5.10.
Zur Anwendung dieses Majorantenkriteriums benötigt man einen Vorrat an reellen konvergenten Reihen mit positiven Gliedern. Häufig sind dafür geometrische Reihen geeignet.
Das führt auf die folgenden beiden Spezialisierungen des Majorantenkriteriums:
Satz 5.19 (Das Wurzelkriterium) Falls es eine Konstante q mit
p
0 ≤ q < 1 und k |ak | ≤ q für fast alle k ∈ N
P
gibt, sopist
ak absolut konvergent. Die Bedingung ist sicher dann erfüllt, wenn
k
lim sup |ak | < 1 ist.
k→∞
Beweis. Unter den Voraussetzungen des Satzes ist die Reihe
P
ak geeignet.
P
q k als Majorantenreihe für
Satz 5.20 (Das Quotientenkriterium) Falls es eine Konstante q mit
0 ≤ q < 1 und
gibt, so ist
P
ak absolut konvergent.
|ak+1 |
≤ q für fast alle k ∈ N
|ak |
5.3 Absolut konvergente Reihen in R und C
55
Beweis. Ohne Beschränkung der Allgemeinheit gelte obige Ungleichung für alle k ∈ N.
Durch wiederholte Anwendung folgt
|ak | |ak−1 |
|a1 |
|ak |
=
·
· ... ·
≤ qk .
|a0 |
|ak−1 | |ak−2 |
|a0 |
P
P
Daher ist |ak | ≤ |a0 | · q k , und
|a0 |q k ist eine konvergente Majorante für
an .
Beispiel 5.21 Die Reihe
∞ 1
P
ist konvergent, denn es gilt
k=0 k!
|ak+1 |
k!
1
=
=
→0.
|ak |
(k + 1)!
k+1
Wir wenden uns jetzt der Frage zu, ob der Wert einer Reihe von Umordnungen der
Reihenglieder unbeeinflußt bleibt. Für endliche Summen ist das wegen des Kommutativund Assoziativgesetzes selbstverständlich, und wir werden sehen, dass auch absolut konvergente Reihen diese Eigenschaft haben. Es gibt aber auch andere Situationen:
Beispiel 5.22 Das Beispiel der konvergenten Reihe
s=
∞
X
(−1)k
k=0
k+1
=1−
1 1 1
+ − + −...
2 3 4
zeigt, dass Umordnungen die Konvergenz zerstören und Grenzwerte verändern können.
Dazu ordnen wir die Reihenglieder {1, − 21 , 13 , − 14 , . . .} neu an. Wir setzen also
1 1 1
+ − + − . . . und
2 3 4
1 1 1 1 1 1
= 1 − − + − − + − − + − − +...
2 4 3 6 8 5
1
1
1 1
1
=
1−
− +
−
− + ...
2
4
3 6
8
1 1 1 1
1
1 1 1
1
=
− + − + −... =
1 − + − + − . . . = s 6= s.
2 4 6 8
2
2 3 4
2
s = 1−
s0
Man kann überdies zeigen, dass zu jeder(!) reellen Zahl x eine Umordnung obiger Reihe
mit Grenzwert x existiert (Riemannscher Umordnungssatz).
Derartig gewarnt suchen wir nun nach positiven Aussagen.
Definition 5.23 Unter einer UmordnungPoder Permutation der Menge N verstehen
wir eine Bijektion p : N → N. Eine Reihe P ak heißt unbedingt konvergent, wenn
Pfür
jede Permutation p von N auch die Reihe
ap(k) gegen den gleichen Grenzwert wie
ak
konvergiert.
56
5 ZAHLENREIHEN
Satz 5.24 (Satz von Riemann) Für Zahlenreihen
äquivalent:
1. Die Reihe
P
P
ak sind folgende Bedingungen
ak ist absolut konvergent.
2. Für jede Folge (σk ) von Zahlen σk ∈ {0, 1} ist die Reihe
reihenkonvergenz)
P
3. Die Reihe
ak ist unbedingt konvergent.
P
σk ak konvergent. (Teil-
Beweis. Wir betrachten zunächst nur reelle Reihen.
P
(1 ⇒ 3) Es sei ak eine absolut konvergent. Zum Beweis von 3) genügt es, die Bedingung
n
n
X
X
ak −
ap(k) = 0
(∗)
lim n→∞ k=0
k=0
für jede Permutation p von N zu zeigen. Es sei ε > 0 gegeben. Nach der vorausgesetzten
absoluten Konvergenz existiert eine Zahl N = N (ε) derart, dass
m
X
|ak | < ε für alle m ≥ N
k=N
gilt. Da p eine Permutation ist, existiert eine Zahl N1 ≥ N derart, dass {0, 1, . . . , N } ⊆
{p(0), . . . , p(N1 )} gilt. Für festes n ≥ N1 sei nun n∗ = max{n, p(0), . . . , p(n)}. Dann folgt
n
n
X
X
ak −
ap(k) ≤ |aN +1 | + . . . + |an∗ | < ε .
k=0
k=0
Damit ist (∗) bewiesen.
(3 ⇒ 2) Wir führen diesen Beweis indirekt und nehmen
P das Gegenteil an. Dann existiert
eine Folge (σk ) von Zahlen σk ∈ {0, 1} derart, dass
σk xk nicht konvergiert. Nach dem
Cauchy-Kriterium für Reihen bedeutet das
R
X
∃ε > 0 ∀n ∃r > n ∃R > r : σk ak ≥ ε.
k=r
Daher kann man induktiv zwei Folgen (rn ) und (Rn ) mit
X
Rj
r1 < R1 < r2 < R2 < r3 < R3 < . . . und σk ak ≥ ε für alle j ∈ N
k=rj
bilden.
Nun konstruieren wir eine Permutation p von N auf folgende Weise. Wir zerlegen die
Intervalle Ij = [rj , Rj ] in die Mengen in die Mengen Ij0 = {k ∈ Ij : σk = 1} und
Ij00 = {k ∈ Ij : σk = 0}. Wir wählen eine Bijektion pj : Ij → Ij derart, dass die Elemente
5.3 Absolut konvergente Reihen in R und C
57
von Ij0 vor die Elemente von Ij00 gesetzt werden. Hieraus konstruieren wir p : N → N auf
folgende Weise:

∞
S
 n
für n ∈
/
Ij ,
p(n) =
j=1

pj (n) für n ∈ Ij .
Es seien mj die Anzahl der Elemente von Ij0 . Nach Konstruktion von p gilt dann
rj +m
rj +mj −1
Rj
j −1
X
X
X
=
=
>ε
a
σ
a
σ
a
k
k
k
k
p(k)
k=rj
k=rj
k=rj
P
für alle k ∈ N. Daher erfüllt die Reihe
ap(k) kein Cauchy-Kriterium und kann folglich
nicht konvergieren.
P
(2 ⇒ 1) Die Reihe
ak sei teilreihenkonvergent. Wir setzen
0 für ak < 0,
1 für ak < 0,
σk =
bzw. τk =
1 sonst
0 sonst.
Nach Voraussetzung konvergieren die Reihen
X
|ak | =
X
P
σk ak und
σk ak −
X
P
τk ak , und wegen
τ k ak
P
konvergiert auch
|ak |.
P
Nun sei
zk eine komplexe Reihe
P und es seien ak = Re(zk ) und bk = Im(zk ). Wegen
P
|ak |, |b
|
≤
|z
|
≤
|a
|
+
|b
|
ist
z
genau
dann
absolut
konvergent,
wenn
dies
auf
ak
k
k
k
k
k
P
und
bk zutrifft. Damit ist der komplexe Fall auf den reellen zurückgeführt.
Abschließend untersuchen wir Produkte von Reihen. Für endliche Summen gilt nach
den einschlägigen Gesetzen (Distributiv- und Assoziativgesetz) bekanntlich die Formel
! m !
n
n
m
X
X
X
X
ai
bj =
ai b j ,
i=0
j=0
i=0
j=0
das Produkt
zweier
P
P Summen ist also die Summe aller möglichen Produkte ai bj der Glieder.
Sind
an und
bn unendliche Reihen, so hat man daher zunächst alle Produkte der
Form ai bj zu bilden. Sie lassen sich zweckmäßig in einer unendlichen Tabelle (Matrix)
notieren:
a0
a1
a2
a3
..
.
b0
a0 b 0
a1 b 0
a2 b 0
a3 b 0
b1
a0 b 1
a1 b 1
a2 b 1
a3 b 1
b2
a0 b 2
a1 b 2
a2 b 2
a3 b 2
b3
a0 b 3
a1 b 3
a2 b 3
a3 b 3
...
...
...
...
...
...
...
...
...
...
58
5 ZAHLENREIHEN
Abbildung 8: Anordnung nach Dreiecken bzw. Quadraten
Diese Produkte ai bj kann man auf verschiedenste Weisen zu einer Folge anordnen. Jedesmal wird man eine andere Partialsummenfolge erhalten, und die Konvergenz dieser
Reihen ist zunächst offen (s. Aufgabe 2 als Gegenbeispiel). Häufig finden die folgenden
beiden Summationsvorschriften Anwendung (z.B. in Satz 5.25):
Summation nach Dreiecken: (Cauchysche Produktreihe) Hierunter versteht man die
Partialsummenfolge
l
n X
X
ak bl−k ).
(
Sn =
(s. Figur 8)
l=0 k=0
Summation nach Quadraten: Darunter versteht man die Partialsummenfolge
sn =
n X
n
X
ai · b j =
i=0 j=0
n
X
ai ·
i=0
n
X
bj .
(s. Figur 8)
j=0
Für absolut konvergente Reihen gilt nun der wichtige:
P
P
Satz 5.25 (Multiplikationssatz) Sind
an und
bn absolut konvergente Zahlenreihen, so ist die Reihe aller Produkte ai bj in beliebiger
Reihenfolge
absolut konvergent und
P
P
ihr Reihenwert ist das Produkt der Werte von
an und
bn . Insbesondere gilt
∞
X
ai ·
i=0
∞
X
bj =
∞
n
X
X
n=0
j=0
ak bn−k .
k=0
Beweis. Die Aussage des Satzes bedeutet präzisiert, dass für jede Bijektion h : N → N × N
vermöge k 7→ h(k) = (i(k), j(k)) von N auf die Menge N × N aller Indexpaare die Reihe
∞
X
ai(k) bj(k)
k=0
absolut konvergiert und dass ihr Wert gleich dem Produkt der gegebenen Reihen ist. Nach
Voraussetzung konvergieren
α=
∞
X
i=0
|ai | und β =
∞
X
|bj | .
j=0
Zu jeder Zahl n ∈ N lässt sich nun eine Zahl N ∈ N so finden, dass
{h(0), . . . , h(n)} ⊆ {0, . . . , N } × {0, . . . , N }
5.4 Potenzreihen
59
gilt. Dann ist aber
n
X
|ai(k) bj(k) | ≤
N X
N
X
|ar · bs | =
r=0 s=0
k=0
N
X
|ar | ·
N
X
r=0
|bs | ≤ αβ < ∞.
s=0
Das zeigt die absolute Konvergenz der Reihe. Daher ist die Reihe auch unbedingt konvergent, und wir können den Grenzwert durch Summation nach Rechtecken ausrechnen.
Hierfür gilt aber
!
n
n
n
n
X
X
X
X
lim sn = lim
ai ·
bj = lim
ai · lim
bj .
n→∞
n→∞
i=0
j=0
n→∞
n→∞
i=0
j=0
Aufgaben zu Abschnitt 5.3
1. Zeigen Sie die Konvergenz der folgenden Reihen:
∞
∞ √
∞
∞
X
X
X
X
k
s!
j
10j
a)
,
b)
,
c)
,
d)
,
j
s
2
k!
s
(2j
+
1)!
s=0
j=0
j=0
k=0
e)
∞
X
k2
.
(2k)!
k=0
∞
X
(−1)k
√
2. Man zeige, dass die Reihe
konvergiert, dass aber das Cauchy-Produkt
k+1
k=0
dieser Reihe mit sich selbst divergent ist.
∞
∞
∞
X
X
1 X 1
2r
3. Beweisen Sie die Formel
·
=
.
j! k=0 k!
r!
r=0
j=0
4. Beweisen Sie in Ergänzung zum Wurzelkriterium (Satz 5.19) das folgende
p
P
ak .
Divergenzkriterium: Aus lim inf n |an | > 1 folgt die Divergenz der Reihe
n→∞
5. Geben Sie eine konvergente und eine divergente Reihe
5.4
P
ak mit lim
k→∞
p
k
|ak | = 1 an.
Potenzreihen
Definition 5.26 Eine reelle bzw. komplexe Potenzreihe ist eine Reihe der Form
f (x) =
∞
X
cn (x − x0 )n
mit cn , x0 ∈ R
bzw.
cn , x0 ∈ C.
n=0
Dabei heißen x0 der Mittelpunkt und die cn die Koeffizienten der Potenzreihe.
In vielen Anwendungen wird x0 = 0 sein. Die reelle bzw. komplexe Variable x kann
als freier Parameter betrachtet werden. Potenzreihen sind also Verallgemeinerungen von
Polynomen in x. Unter dem Konvergenzbereich der Reihe versteht man die Menge
n
o
X
B = x ∈ R bzw. C :
cn (x − x0 )n konvergiert .
Diese Menge ist durch ein Wechselspiel der cn mit den Werten |x − x0 | bestimmt. Der
folgende Satz charakterisiert diesen Konvergenzbereich genauer:
60
5 ZAHLENREIHEN
P
Satz 5.27 (Satz von Cauchy-Hadamard) Es sei
cn (x − x0 )n eine Potenzreihe in
C und es seien
 −1
für 0 < L < ∞
 L
p
∞
für L = 0
L = lim sup n |cn | und R =

n→∞
0
für L = ∞.
Dann ist die Potenzreihe im Innern der Kreisscheibe mit Mittelpunkt R absolut konvergent
und außerhalb dieses Kreises divergent. Es gilt also
{x ∈ C : |x − x0 | < R} ⊆ B ⊆ {x ∈ C : |x − x0 | ≤ R}.
Reihen mit R = ∞ heißen beständig konvergent, Reihen mit R = 0 heißen nirgends
konvergent. Die Zahl R heißt der Konvergenzkreisradius.
Im reellen Fall gilt entsprechend {x ∈ R : |x − x0 | < R} ⊆ B ⊆ {x ∈ R : |x − x0 | ≤ R},
der Konvergenzbereich ist also ein Intervall.
Beweis. Wir wenden das Wurzelkriterium an und setzen
p
p
q = lim sup n |cn (x − x0 )n | = |x − x0 | · lim sup n |cn | = |x − x0 | · L.
n→∞
n→∞
Sei zunächst 0 < L < ∞. Für |x − x0 | < R = L−1 ist q < 1, die Reihe ist also absolut
konvergent. Im Fall |x − x0 | > R = L−1 folgt q > 1 und somit die Divergenz der Reihe.
Die Randfälle L = 0 und L = ∞ sind ebenso leicht einzusehen.
Für die Punkte auf dem Kreisrand können mittels dieses Kriteriums keine Konvergenzaussagen gemacht werden. Beispielsweise ist für die drei Reihen
X 1
X
X1
xn ,
xn ,
xn ,
n
n2
der Konvergenzradius R = 1, das Verhalten auf dem Rande ist aber bei den drei Reihen
sehr unterschiedlich. (Wie nämlich ?)
∞ xn
√
P
n
Beispiel 5.28 Für die Reihe
ist
L
=
lim
2−n = 12 , also R = 2. Die Reihe
n
n=0 2
konvergiert daher zumindestens im Innern des Kreises {x : |x| < 2}. Für |x| ≥ 2 ist die
xn
Reihe divergent, denn n ist dann keine Nullfolge.
2
Gelegentlich ist die Berechnung des Konvergenzradius mittels des Quotientenkriteriums
einfacher.
Satz 5.29 Ist
P
cn (x − x0 )n eine Potenzreihe und existiert
|cn+1 |
,
n→∞ |cn |
l = lim
so gilt R = l−1 .
5.5 Exponential- und trigonometrische Funktionen
61
Beweis. Für |x − x0 | < l−1 gilt
|cn+1 (x − x0 )n+1 |
= |x − x0 | · l < 1,
lim
n→∞
|cn (x − x0 )n |
also ist die Reihe für dieses x absolut konvergent. Das zeigt l−1 ≤ R. Entsprechend folgt
aus |x − x0 | > l−1 die Divergenz der Reihe, daher ist l−1 ≥ R . Das zeigt l−1 = R.
Aufgaben zu Abschnitt 5.4
1. Man bestimme die Konvergenzbereiche für die folgenden Potenzreihen:
∞
X
∞
X
n
(x − 2) ,
n=0
5.5
n!x ,
n=0
∞
X
(−1)n+1 xn
,
n
n=n
1
n
∞
X
xn
n=0
∞
X
(x + 3)n
,
n2
n=n
1
nn
,
∞
X
in xn .
n=0
Exponential- und trigonometrische Funktionen
Wir nutzen nun Potenzreihen zur Definition bzw. Fortsetzung klassischer reeller Funktionen in das Komplexe und beginnen dabei mit der Exponentialfunktion.
Satz 5.30 Durch die Gleichung
exp(x) =
∞
X
xk
k=0
k!
wird auf C eine Funktion definiert, die die folgende Funktionalgleichung erfüllt:
exp(x + y) = exp(x) · exp(y)
Beweis. Es ist
für alle x, y ∈ C
cn+1 n!
1
= lim
=
lim
=0.
L = lim n→∞
cn n→∞ (n + 1)! n→∞ n + 1
Daher ist die obige Potenzreihe auf ganz C absolut konvergent. Wir rechnen nun unter
Verwendung der Cauchyschen Produktreihe und der binomischen Formel die Gültigkeit
der Funktionalgleichung nach:
!
!
!
∞
∞
∞
n
X
X
X
X
xj
yk
xn−k y k
exp(x) · exp(y) =
·
=
j!
k!
(n − k)! k!
n=0
j=0
k=0
k=0
∞
n ∞
X
1 X n n−k k X 1
=
x y =
(x + y)n = exp(x + y).
n!
k
n!
n=0
n=0
k=0
62
5 ZAHLENREIHEN
5.31 (Hilfssatz:) Für x ∈ R gelten exp(x) ≥ 0 und exp
x
n
=
p
n
exp(x).
Beweis. Nach Satz 5.30 gilt für alle x ∈ R die Gleichung
x n
x
x
x
x
exp
= exp
· . . . · exp
= exp
+ ... +
= exp(x).
n
n
n
n
n
x 2
Speziell ist ferner exp(x) = exp
≥0
2
Satz 5.32 (Die Reihendarstellung der Exponentialfunktion) Für alle x ∈ R gilt
ex = exp(x) =
X xn
n!
.
Beweis. Wegen Satz 4.30 und Hilfssatz 5.31 ist
x
p
ln(exp(x)) = lim n( n exp(x) − 1) = lim n exp
−1
n→∞
n→∞
n
∞
∞
X
1 X 1 xk
1 xk
= x + lim
= x + 0 = x.
= lim n
n→∞
n→∞ n
k! nk
k! nk−2
k=1
k=2
Dabei haben wir noch folgende Abschätzung benutzt:
∞
∞
X
k 1
x
X 1
|x|k ≤ exp(|x|) < ∞.
≤
k! nk−2 k!
k=2
k=2
Definition 5.33 (Die komplexe Exponentialfunktion) Durch die Formel
ez = exp(z) =
∞
X
zk
k=0
k!
,
z ∈ C,
wird die reelle Exponentialfunktion in das Komplexe fortgesetzt.
5.34 (Die Berechnung der Zahl e) Für x = 1 ergibt sich aus Satz 5.32 die Formel
∞
X
1
e=
,
k!
k=0
die zur Berechnung von e wegen der schnellen Konvergenz sehr gut geeignet ist. Für die
n−te Partialsumme sn ergibt sich nämlich der kleine Fehler
∞
X
1
1
1
1
|e − sn | =
=
1+
+
+ ...
k!
(n
+
1)!
(n
+
2)
(n
+
2)(n
+
3)
k=n+1
1
1
1
e
3
≤
1 + + + ... ≤
≤
.
(n + 1)!
2! 3!
(n + 1)!
(n + 1)!
5.5 Exponential- und trigonometrische Funktionen
Also ist z.B.
|e − s9 | ≤
63
3
≤ 10−6 .
10!
Das zeigt
e = s9 ± 10−6 = 2, 718281 ± 10−6 .
Folgerung 5.35 Die Zahl e ist irrational.
Beweis. Angenommen, es gäbe zwei natürliche Zahlen p, q > 1 mit e = p/q. Dann ist
q
∞
X
p X 1
1
1
1
1
q −1
1
1
1
0< −
=
≤ ·
+ 2 + ... = ·
.
= ·
−1
q k=0 k! k=q+1 k!
q!
q q
q! 1 − q
q! q − 1
Die Multiplikation mit q! ergibt
q
X
q!
1
0 < p (q − 1)! −
≤
,
k!
q−1
k=0
aber diese Ungleichung steht im Widerspruch dazu, dass die linksstehende Differenz ganzzahlig und positiv ist.
Folgerung 5.36 (Schwache Stirling-Formel) Für alle natürlichen Zahlen n gilt:
n n
e
≤ n! ≤ nn .
Beweis. Die rechte Ungleichung folgt aus n! = 1 · 2 · . . . · n ≤ nn , die linke aus
en =
∞
X
nk
nn
n n n n
≥
, also n! ≥ n =
.
k!
n!
e
e
k=0
Unter Verwendung der Formel nn = en ln n lässt sich obige Ungleichung auch in der Form
en(ln n−1) ≤ n! ≤ en·ln n
schreiben. Die Fakultät wächst also hyperexponentiell. Die Ungleichung ist zur
Abschätzung des Wachstums der Fakultätsfunktion nützlich. Für n = 1000 ergibt sich
z.B. aus
1000
1000
2000
1000
10
= 100
≤
≤ 1000! ≤ 10001000 = 103000
e
die Abschätzung 102000 ≤ 1000! ≤ 103000 . Die Formel lässt sich noch verfeinern und führt
dann zur sogenannten Stirlingschen Formel.
64
5 ZAHLENREIHEN
Definition 5.37 Unabhängig von geometrischen Zusammenhängen definieren wir die beiden trigonometrischen Funktionen
∞
X
(−1)k 2k+1
sin z =
z
(2k + 1)!
k=0
und
cos z =
∞
X
(−1)k
k=0
(2k)!
z 2k
für z ∈ C.
Man sieht wie im Beweis zu Satz 5.30, dass beide Reihen beständig konvergent sind.
eiz = cos z + i sin z.
Satz 5.38 (Die Eulersche Formel) Für alle z ∈ C gilt:
Beweis. Es ist
e
iz
=
∞
X
(iz)k
k=0
k!
=
∞
X
(iz)2k
k=0
∞
∞
∞
X
X
X
(iz)2k+1
(−1)k 2k
(−1)k 2k+1
+
=
z +i
z
(2k)!
(2k + 1)! k=0 (2k)!
(2k + 1)!
k=0
k=0
= cos z + i sin z.
Die Eulersche Formel zeigt den engen Zusammenhang zwischen der Exponentialfunktion
und den trigonometrischen Funktionen, der sich allerdings erst durch die Betrachtung
im Komplexen offenbart. Als erste Anwendung der Eulerschen Formel beweisen wir die
folgenden Eigenschaften der Sinus- und Kosinusfunktion:
Satz 5.39 Für alle x, y ∈ C gelten:
a) sin 0 = 0, cos 0 = 1.
b) sin(−x) = − sin x und cos(−x) = cos x,
c) sin(x ± y) = sin x cos y ± cos x sin y,
d) cos(x ± y) = cos x cos y ∓ sin x sin y.
e) cos2 x + sin2 x = 1,
f ) Für reelles x ∈ R gelten | sin x|, | cos x| ≤ 1.
(Anfangswerte)
(ungerade/gerade Funktion)
(Additionstheorem)
(Additionstheorem)
(Satz des Pythagoras)
(Beschränktheit im Reellen)
Beweis. Die Formeln a) und b) ergeben sich direkt aus der Reihendarstellung der beiden
Funktionen. Zum Beweis von c) und d) betrachten wir
e±i(x+y) = e±ix e±iy = (cos x ± i sin x)(cos y ± i sin y)
= (cos x cos y − sin x sin y) ± i(sin x cos y + cos x sin y) .
Andererseits ist aber wiederum nach 5.38
e±i(x+y) = cos(x + y) ± i sin(x + y) .
Also ist
cos(x + y) ± i sin(x + y) = (cos x cos y − sin x sin y) ± i(sin x cos y + cos x sin y).
Die Addition bzw. Subtraktion dieser beiden Formeln voneinander ergibt c) bzw. d). Aus
d) folgt mit y = −x die Formel e).
Da für reelles x auf Grund der Reihendarstellung auch die Werte cos x und sin x reell
sind, gelten in diesem Fall sin2 x, cos2 x ≥ 0. Daher folgt f) aus e).
5.5 Exponential- und trigonometrische Funktionen
65
5.40 Wir stellen nun Beziehungen zur Trigonometrie her. Aus
eix = cos x + i sin x
erhalten wir für reelle Zahlen x die Gleichung
|eix |2 = (cos x + i sin x)(cos x − i sin x) = cos2 x + sin2 x = 1 .
Die Zahlen der Form eix liegen also auf der Peripherie des Einheitskreises, und cos x bzw.
sin x sind Real- bzw. Imaginärteil von eix (s. Figur 9)
Abbildung 9: Komplexe Zahlen vom Betrag 1
Es bleibt die später zu beantwortende Frage, ob jede Zahl auf dem Einheitskreis eine
Darstellung der Form eix zulässt, um x endgültig als Bogenmaß auf dem Einheitskreis zu
deuten.
Aus der Eulerschen Formel folgt weiter die Formel
ex+iy = ex eiy = ex (cos y + i sin y) ,
x, y ∈ R,
die man die trigonometrische Darstellung der komplexen Zahlen nennt. Es bleibt
wiederum die Frage, ob sich jede komplexe Zahl z 6= 0 in dieser Form schreiben lässt. Das
ist mit der Frage äquivalent, ob der Wertebereich der komplexen Exponentialfunktion
gleich C \ {0} ist. Der Leser schlage schon einmal bei Satz 6.42 nach!
Aufgaben zu Abschnitt 5.5
1. Man beweise:
a) |ez | ≤ eRe z ≤ e|z| und ez = ez für alle z ∈ C,
b) eix = e−ix für x ∈ R.
2. Man beweise
cos x − cos y = −2 sin
3. Man beweise
sin z =
x+y
x−y
sin
für alle x, y ∈ C.
2
2
eiz − e−iz
,
2i
cos z =
eiz + e−iz
.
2
4. Zeigen Sie, dass die Exponentialfunktion f (z) = ez in C keine Nullstellen hat.
66
6
6.1
6 STETIGKEIT
Stetigkeit
Einführung und Begriff
Die Analyse von Funktionen ist die zentrale Aufgabenstellung der Analysis. Konvergenzuntersuchungen sind hierfür ein wichtiges Hilfsmittel. Von A. Cauchy wurde die grundlegende Bedeutung des Stetigkeitsbegriffes bei der Untersuchung von Funktionen erkannt.
Die weitreichenden Folgerungen aus dieser Eigenschaft sollen in diesem Kapitel dargelegt
werden. In Satz 4.20 haben wir bewiesen, dass jede streng monoton wachsende reelle Funktion f in R mit lückenlosem Wertebereich die folgende Eigenschaft besitzt: Aus xn → x
in D(f ) folgt f (xn ) → f (x) in W (f ). Wir nehmen diese Eigenschaft zum Anlass für die
folgende Definition. Wie bisher sei dabei E = R oder = C.
Definition 6.1 (Die Folgendefinition der Stetigkeit) Eine Funktion f aus E in E
heißt stetig in a ∈ D(f ), wenn für alle Folgen von Elementen xn ∈ D(f ) aus
xn → a stets f (xn ) → f (a)
folgt. Als Kurzformel gilt also
lim f (xn ) = f ( lim xn ).
n→∞
n→∞
Die Funktion f heißt stetig auf D(f ), wenn f in allen Punkten a ∈ D(f ) stetig ist.
Beispiel 6.2 Beispiele stetiger reeller Funktionen ergaben sich bereits in Folgerung 4.21.
Insbesondere sind die Funktionen
f (x) = xα ,
f (x) = ax ,
f (x) = ln x,
α∈R
a>0
auf ihren Definitionsbereichen stetig. Aber auch die Funktionen
f (z) = Re z ,
f (z) = Im z
und f (z) = |z|
sind stetig auf C. Das ergibt sich aus den Ungleichungen
|Re zn − Re a| = |Re (zn − a)| ≤ |zn − a| und |zn | − |a| ≤ |zn − a|.
In vielen theoretischen Untersuchungen ist die folgende Fassung des Stetigkeitsbegriffs
zweckmäßiger.
Satz 6.3 (ε-δ-Definition der Stetigkeit) Eine Funktion f aus E in E ist genau dann
bei a ∈ D(f ) stetig, wenn gilt:
∀ε > 0 ∃δ = δ(ε) > 0 ∀x ∈ D(f ) : |x − a| < δ ⇒ |f (x) − f (a)| < ε.
(s. Abb. 10).
6.1 Einführung und Begriff
67
Abbildung 10: ε-δ-Definition der Stetigkeit
In dieser Fassung bedeutet die Stetigkeit einer Abbildung oder eines Prozesses, dass kleine Ursachen kleine Wirkungen haben. Daher können alle evolutionären Prozesse durch
stetige Abbildungen modelliert werden. Das zeigt die überaus große Anwendungsbreite
des Stetigkeitsbegriffes.
Beweis zu Satz 3. Es sei f bei a ∈ D(f ) stetig. Wäre die im Satz angegebene Bedingung
nicht erfüllt, so gäbe es ein ε0 > 0 derart, dass zu jedem δ > 0 ein x ∈ D(f ) mit
|x − a| < δ und |f (x) − f (a)| ≥ ε0 existieren würde. Wählt man für δ der Reihe nach
die Zahlen δ = 1/n, so erhält man eine Folge zugehöriger xn ∈ D(f ) mit |xn − a| < n1
und |f (xn ) − f (a)| ≥ ε0 . Die erste Bedingung sichert xn → a, die zweite Bedingung
widerspricht dann aber der vorausgesetzten Stetigkeit.
Umgekehrt sei die angegebene ε − δ−Bedingung erfüllt, und es sei (xn ) eine Folge mit
xn ∈ D(f ) und xn → a . Wir haben f (xn ) → f (a) zu zeigen. Zu ε > 0 wählen wir ein
δ = δ(ε) > 0 gemäß obiger Bedingung. Wegen xn → a existiert ein n0 derart, dass für
alle n ≥ n0 die Ungleichung |xn − a| < δ besteht. Nach Voraussetzung folgt für diese n
dann aber auch |f (xn ) − f (a)| < ε, was zu beweisen war.
Viele Zusammensetzungen von Funktionen erhalten die Stetigkeit:
Satz 6.4 Es seien f, g Funktionen aus E in E, es sei a ∈ E.
a) Sind f und g bei a stetig, so auch f ± g und f · g.
b) Sind f bei a und g bei f (a) stetig, so ist (g ◦ f )(x) = g(f (x)) bei a stetig.
Beweis. Die Behauptungen ergeben sich sofort aus der Folgendefinition der Stetigkeit unter
Verwendung der Grenzwertsätze.
Aufgaben zu 6.1
1. Man zeige die Stetigkeit der Funktion f (x) = x2 unter Verwendung des ε-δKriteriums.
2. Ist f stetig auf E, so ist die Menge {x ∈ E : f (x) = 0} abgeschlossen.
68
6 STETIGKEIT
3. Die Dirichlet-Funktion D(x) ist wie folgt definiert: D(x) = 1, falls x rational, und
D(x) = 0, falls x irrational ist. Zeigen Sie, dass die Funktion D in keinem Punkt
x ∈ R stetig ist.
4. Es sei f eine Abbildung von E in E. Man beweise: f ist stetig auf E genau dann,
wenn das volle Urbild f −1 (U ) jeder offenen Teilmenge U ⊆ E offen in E ist.
5. Eine Funktion f : R → R heißt periodisch, wenn es eine Zahl p > 0 mit f (x) =
f (x + p) für alle x ∈ R gibt. Man zeige:
a) Ist f : R → R periodisch, stetig und nicht konstant, so existiert eine kleinste
positive Zahl p mit f (x) = f (x + p) für alle x ∈ R. Diese Zahl p heißt primitive
Periode.
b) Man finde ein Beispiel einer periodischen (nicht stetigen) Funktion, die keine
kleinste positive Periode besitzt.
6.2
Stetigkeit klassischer Funktionen
Satz 6.5 Jede ganzrationale Funktion
P (x) =
n
X
ak x k ,
x∈R,
x∈C
k=0
ist auf R bzw. auf C stetig.
Beweis. Die konstanten Funktionen P0 (x) = a und die lineare Funktion P1 (x) = x sind
offensichtlich überall stetig. Eine beliebige ganzrationale Funktion lässt sich aber durch
endlich viele Produkt– und Summenbildungen aus diesen Funktionen gewinnen und ist
daher nach Satz 6.4 selbst stetig.
Satz 6.6 Die Funktion f (x) =
Punkt a 6= 0 stetig.
1
x
von R \ {0} in sich bzw. von C \ {0} in sich ist in jedem
Beweis. Die Aussage ergibt sich aus dem Grenzwertsatz für Quotienten.
Folgerung 6.7 Jede gebrochen rationale Funktion
n
P
R(x) = k=0
m
P
ak x k
bj x j
j=0
ist auf ihrem Definitionsbereich in R bzw. C stetig.
6.2 Stetigkeit klassischer Funktionen
69
Beweis. Zähler– und Nennerfunktionen sind für sich nach Satz 6.5 auf C stetig, und der
Quotient ist nach Satz 6.6 außerhalb der Nullstellen des Nenners stetig.
Die Stetigkeit vieler klassischer Funktionen kann aus dem Satz 4.20 in Abschnitt 4.2
hergeleitet werden. Wir wiederholen diesen Satz hier in leicht veränderter Formulierung:
Satz 6.8 (Zweiter Hauptsatz über streng monoton wachsende Funktion) Ist f
eine reellwertige, streng monoton wachsende Funktion von dem Intervall [a, b] auf das
Intervall [f (a), f (b)], so ist f auf [a, b] stetig.
Folgerung 6.9 Die reellen Funktionen
chen stetig.
√
n
x, ex und ln x sind auf ihren Definitionsberei-
Satz 6.10 Jede Potenzreihe der Form
f (z) =
∞
X
ak z k
k=0
ist im Innern ihres Konvergenzbereiches stetig.
Beweis. Die Reihen
∞
X
ak z k
und
∞
X
kak z k
k=0
k=0
haben den gleichen Konvergenzradius R, denn es gilt
p
p
p
√
k
lim sup k |kak | = lim k · lim sup k |ak | = lim sup k |ak |.
Sei nun a ∈ C mit |a| < R gegeben. Wir wählen eine Zahl ρ > 0 mit |a| < ρ < R . Dann
ist nach obigem
∞
X
k|ak |ρk = M < ∞ .
k=0
Für alle z ∈ C mit |z| < ρ gilt nun
∞
∞
X
X
|f (z) − f (a)| = ak (z k − ak ) = ak (z − a)(z k−1 + az k−2 + . . . + ak−1 )
k=0
≤ |z − a|
k=1
∞
X
k=1
|ak |kρk−1 = |z − a|
M
.
ρ
Hieraus folgt die Behauptung, denn aus zn → a folgt nun f (zn ) → f (a).
Da eine beliebige Potenzreihe mit Mittelpunkt z0 immer als Zusammensetzung aus einer
Verschiebung h(z) = z − z0 und einer Potenzreihe mit Mittelpunkt 0 aufgefasst werden
kann, folgt aus Satz 6.10, dass jede Potenzreihe im Innern ihres Konvergenzbereiches stetig
ist.
Folgerung 6.11 Die Funktionen ez , sin z und cos z sind auf R und auf C stetig.
70
6.3
6 STETIGKEIT
Stetige Funktionen auf kompakten Intervallen
In diesem Abschnitt sollen weitreichende Folgerungen aus der Stetigkeit abgeleitet werden.
Dabei wird es sich zeigen, dass die Stetigkeit eine hinreichende Bedingung für viele naiv
zu erwartenden Eigenschaften von Funktionen ist. Wir beginnen mit der Betrachtung reellwertiger Funktionen auf abgeschlossenen und beschränkten (= kompakten) Intervallen.
Einige der Sätze (z. B. Satz vom Maximum und Minimuum, Satz über die gleichmäßige
Stetigkeit) gelten aber sogar für reellwertige Funktionen auf beliebigen kompakten Mengen.
Satz 6.12 (Der Nullstellensatz von Bolzano) Ist f eine stetige reellwertige Funktion auf [a, b] mit f (a) · f (b) < 0 , so hat f in [a, b] mindestens eine Nullstelle.
Abbildung 11: Nullstellensatz von Bolzano
Beweis. Der Beweis wird mit dem Halbierungsverfahren geführt: Ohne Beschränkung der
Allgemeinheit können wir f (a) < 0 < f (b) annehmen, andernfalls würden wir die Funktion −f betrachten. Wir setzen a0 = a und b0 = b und konstruieren induktiv eine Intervallschachtelung
(an | bn ) mit f (an ) < 0 ≤ f (bn ) und |an − bn | ≤
b−a
.
2n
Sei also bereits eine Folge von Intervallen [ak , bk ] mit obiger Eigenschaft für 1 ≤ k ≤ n
konstruiert. Wir bilden den Mittelpunkt
cn =
an + b n
2
des n−ten Intervalls. Ist f (cn ) < 0, so setzen wir an+1 = cn und bn+1 = bn , ist aber f (cn ) ≥
0, so setzen wir an+1 = an und bn+1 = cn . Für die so konstruierte Intervallschachtelung
(an | bn ) sei nun
x0 = lim an = lim bn .
Dann folgt aus der Stetigkeit
f (x0 ) = lim f (an ) ≤ 0 ≤ lim f (bn ) = f (x0 ).
Also ist f (x0 ) = 0. Zusätzlich gilt die a–priori–Fehlerabschätzung
|x0 − an | ≤ |bn − an | = |b − a| · 2−n .
6.3 Stetige Funktionen auf kompakten Intervallen
71
Satz 6.13 (Zwischenwertsatz) Ist f eine stetige, reellwertige Funktion auf [a, b], so
existiert zu jeder Zahl c mit f (a) < c < f (b) eine Zahl x0 ∈ (a, b) mit f (x0 ) = c. Jeder
Wert zwischen f (a) und f (b) wird also als Funktionswert angenommen.
Beweis. Die Funktion g(x) = f (x) − c ist ebenfalls stetig auf [a, b], und es ist
g(a) = f (a) − c < 0 < f (b) − c = g(b) .
Daher hat g eine Nullstelle x0 ∈ (a, b) und es folgt
f (x0 ) = g(x0 ) + c = c.
Satz 6.14 (Der Satz vom Maximum und Minimum) Es sei I = [a, b] ein kompaktes Intervall und es sei f : I → R stetig. Dann existieren Zahlen x∗ , x∗∗ ∈ I mit
f (x∗∗ ) ≤ f (x) ≤ f (x∗ ) für alle x ∈ [a, b].
Es gelten also f (x∗∗ ) = min f (x) und f (x∗ ) = max f (x).
x∈I
x∈I
Beweis. Es sei M = sup f (x), wobei der Wert M = ∞ zunächst nicht ausgeschlossen sei.
x∈I
Wir wählen eine Folge (xn ) von Elementen aus [a, b] mit f (xn ) → M . Nach dem Satz von
Bolzano–Weierstrass existiert eine konvergente Teilfolge (xkn ) von (xn ), deren Grenzwert
x∗ = lim xkn zu [a, b] gehört. Da f stetig ist, folgt
f (x∗ ) = lim f (xkn ) = M .
n→∞
Also nimmt die Funktion bei x∗ den Wert M an. Insbesondere ist M endlich. Zur Konstruktion von x∗∗ betrachte man die Funktion g(x) = −f (x). Nach dem bereits Bewiesenen
hat g ein Maximum, etwa bei x∗∗ . Für diese Zahl gilt dann
f (x∗∗ ) = −g(x∗∗ ) ≤ −g(x) = f (x) für alle x ∈ I.
Die Zusammenfassung des Satzes vom Maximum und des Zwischenwertsatzes ergibt:
Satz 6.15 Ist f eine stetige reelle Funktion in R, so ist das Bild jedes kompakten Intervalls I ⊆ D(f ) ein kompaktes Intervall.
Beweis. Es sei I = [a, b] ⊆ D(f ). Wegen des Satzes vom Maximum und Minimum existieren die Zahlen y1 = min f (x) und y2 = max f (x). Also ist f (I) ⊆ [y1 , y2 ]. Wegen des
x∈I
x∈I
Zwischenwertsatzes existiert aber zu jedem c ∈ [y1 , y2 ] ein x ∈ [a, b] mit f (x) = c. Also
gilt f (I) = [y1 , y2 ] .
Definition 6.16 (Gleichmäßige Stetigkeit) Eine Funktion f heißt gleichmäßig stetig
auf einer Menge M ⊆ D(f ), wenn gilt:
∀ε > 0 ∃δ > 0 ∀x, x0 ∈ M : |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε.
72
6 STETIGKEIT
Gleichmäßige Stetigkeit zieht Stetigkeit nach sich, die Umkehrung ist aber im allgemeinen
nicht richtig: Beispielsweise ist die Funktion f (x) = x1 auf dem Intervall (0, 1] zwar stetig,
aber nicht gleichmäßig stetig (s. Aufgabe 1).
Satz 6.17 (Satz über die gleichmäßige Stetigkeit) Ist f auf dem kompakten Intervall I stetig, so ist f auf I sogar gleichmäßig stetig.
Beweis. Wir führen den Beweis indirekt und nehmen an, dass ein ε > 0 derart existiert,
dass zu jedem δn = n1 Elemente xn , x0n ∈ I mit
|xn − x0n | <
1
und |f (xn ) − f (x0n )| ≥ ε
n
existieren. Da I kompakt ist, existiert eine konvergente Teilfolge (xkn ) von (xn ). Es sei
x∗ = lim xkn . Wegen
|x0kn − x∗ | ≤ |x0kn − xkn | + |xkn − x∗ | → 0
gilt auch x∗ = lim x0kn . Das ergibt den Widerspruch
ε ≤ lim |f (xkn )−f (x0kn )| = | lim f (xkn )−lim f (x0kn )| = |f (x∗ )−f (x∗ )| = 0.
Definition 6.18 (Konvergenzarten) Mit C[a, b] bezeichnet man die Menge aller stetigen, reellwertigen Funktionen f : [a, b] → R. Es sei (fn ) eine Folge in C[a, b]. Wir
definieren:
pktw
1. (fn ) heißt punktweise konvergent gegen f auf [a, b] (in Zeichen fn −→ f ), wenn
lim fn (x) = f (x) für alle x ∈ [a, b] gilt.
n→∞
Diese Bedingung ist äquivalent zu:
∀ε > 0 ∀x ∈ [a, b] ∃n0 ∀n : n ≥ n0 ⇒ |fn (x) − f (x)| < ε.
glm
2. (fn ) heißt gleichmäßig konvergent gegen f auf [a, b] (in Zeichen fn −→ f ), wenn
lim max |fn (x) − f (x)| = 0.
n→∞ x∈[a,b]
Diese Bedingung ist äquivalent zu:
∀ε > 0 ∃n0 ∀x ∈ [a, b] ∀n : n ≥ n0 ⇒ |fn (x) − f (x)| < ε.
Satz 6.19 Ist (fn ) eine Folge stetiger Funktionen fn ∈ C[a, b], die auf [a, b] gleichmäßig
gegen f konvergiert, so ist f auch stetig auf [a, b].
6.3 Stetige Funktionen auf kompakten Intervallen
73
Beweis. Es sei z ∈ [a, b] ein fester Punkt. Die Stetigkeit von f bei z ergibt sich nun wie
folgt. Zu ε > 0 wählt man ein n0 so, dass |fn0 (x) − f (x)| < ε für alle x ∈ [a, b] gilt. Da fn
(gleichmäßig) stetig ist, existiert ein δ > 0 mit
|fn0 (x) − fn0 (z)| < ε sofern |x − z| < δ.
Hieraus folgt nun
|f (x) − f (z)| ≤ |f (x) − fn0 (x)| + |fn0 (x) − fn0 (z)| + |fn0 (z) − f (z)| < ε + ε + ε
für alle x mit |x − z| < δ. Somit ist f stetig.
Beachten Sie, dass punktweise Grenzwerte stetiger Funktionen nicht zu stetigen Funktionen führen müssen (s. Aufgabe 2).
Satz 6.20 Es sei ∅ =
6 K beliebige kompakte6 Teilmenge von R oder C. Dann gelten:
a) Jede stetige Funktion f : K → R hat auf K ein Maximum und ein Minimum.
b) Ist f : K → R stetig, so ist f auf K sogar gleichmäßig stetig.
Beweis: Eine Analyse der entsprechenden Beweise für den Fall K = I, I ein kompaktes
Intervall, zeigt, dass dort nur der Bolzano-Weierstrass, also die Kompaktheit als Argument verwendet worden ist. Daher gelten die Beweise auch im Fall beliebiger kompakter
Mengen.
Bemerkung 6.21 Man könnte vermuten, dass ein Zwischenwertsatz auch für stetige
Funktionen f : [a, b] → C gültig wäre. Dem ist aber nicht so: Die Funktion f (t) = eit
ist eine stetige Funktion f : [0, π] → C mit f (0) = 1 und f (π) = cos π = −1, aber die
Gleichung f (t) = 0 hat keine Lösung.
Aufgaben Abschnitt 6.3
1. Man zeige, dass die Funktion f (x) =
1
x
auf (0, 1] nicht gleichmäßig stetig ist.
2. Wir betrachten die Potenzfunktionen fn (x) = xn auf [0, 1]. Zeigen Sie:
0 für 0 ≤ x < 1,
lim fn (x) =
1 für x = 1.
n→∞
Man begründe, warum die Folge (fn ) nicht gleichmäßig konvergiert.
3. Ist f (x) =
∞
P
ck xk eine Potenzreihe mit Konvergenzradius R < ∞, so konvergiert
k=0
die Folge der Polynome
Pn (x) =
n
X
ck xk
k=0
auf jedem kompakten Intervall I ⊂ (−R, R) gleichmäßig gegen f .
4. Bestimmen Sie mit Hilfe des Nullstellensatzes von Bolzano eine Nullstelle des Polynoms f (x) = x5 − x + 1 im Intervall [−2, 2] auf eine Dezimalstelle genau.
6
hat.
Eine Teilmenge M ⊂ R, C heißt kompakt, wenn jede Folge (xn ) ⊆ M einen Häufungspunkt in M
74
6.4
6 STETIGKEIT
Grenzwerte von Funktionen
Wie bisher sei E = R oder E = C. Wir betrachten die reelle Funktion
x3 + 2x2 − x − 2
f (x) =
,
3x − 3
die in allen Punkten x 6= 1 definiert und stetig ist und deren Graph in Abbildung 12
dargestellt ist.
Abbildung 12: Graph mit Lücke
An der Stelle a = 1 ist die Funktion zwar nicht stetig, sie hat aber wenigstens einen
Grenzwert im Sinn der folgenden Definition:
Definition 6.22 (Grenzwert) Es sei f eine Funktion aus E in E, und es sei a ∈ E
ein Häufungspunkt von D(f ). Dann heißt ein Punkt b ∈ E der Grenzwert von f an der
Stelle a, wenn für jede Folge (xn ) ⊆ D(f ) mit xn 6= a für alle n ∈ N aus xn → a auch
f (xn ) → b folgt. Wir schreiben für diesen Sachverhalt auch
lim f (x) = b.
x→a
Durch Vergleich der Definition der Stetigkeit an der Stelle a mit obiger Definition ergibt
sich sofort:
Satz 6.23 Ist a ∈ D(f ) ein Häufungspunkt von D(f ), so ist f genau dann bei a stetig,
wenn f bei a den Grenzwert f (a) hat.
Beispiel 6.24 Für stetige Funktionen bringt die Untersuchung von Grenzwerten in Punkten ihres Definitionsbereiches also keine neue Information über die Funktion. Anders ist es
jedoch mit Punkten, die nicht zum Definitionsbereich gehören. Wir kehren zum einführenden Beispiel zurück. Durch Polynomdivision ergibt sich
x3 + 2x2 − x − 2
lim
= lim
x→1
x→1
3x − 3
1 2
3
x +x+
3
2
=
1
3
17
+1+ = ,
3
2
6
die Funktion f hat also bei a = 1 den Grenzwert 17
. Erweitert man den Definitionsbereich
6
der Funktion f (x) durch die zusätzliche Definition
f (1) = lim f (x) =
x→1
17
,
6
so erhält man eine auf ganz R stetige Funktion. Man sagt dazu, dass die Funktion f stetig
fortgesetzt wurde.
6.4 Grenzwerte von Funktionen
75
Für Funktionen einer reellen Veränderlichen kann man überdies links– und rechtsseitige
Grenzwerte einführen:
Definition 6.25 (Einseitige Grenzwerte) .
a) Wir setzen (linksseitiger Grenzwert)
lim f (x) = lim f (x) = b,
x→a−0
x%a
wenn lim f (xn ) = b für alle Folgen xn % a mit xn ∈ D(f ) und xn 6= a gilt.
n→∞
b) Wir setzen (rechtsseitiger Grenzwert)
lim f (x) = lim = b,
x→a+0
x&a
wenn lim f (xn ) = b für alle Folgen xn & a mit xn ∈ D(f ) und xn 6= a gilt.
n→∞
1
x&0 x
Beispielsweise sind lim
1
x→0+0 x
= lim
1
x%0 x
= + ∞ und lim
1
x→0−0 x
= lim
= − ∞.
Mit Hilfe von Grenzwerten lassen sich die Unstetigkeitspunkte einer Funktion klassifizieren:
Definition 6.26 (Unstetigkeitspunkte) Es sei f eine Funktion aus R in R, es sei
a 6∈ D(f ) und es gäbe ein ε > 0 so, dass die punktierte ε-Umgebung Uε0 (a) zu D(f )
gehört. Dann hat f bei a
(i) eine Lücke, wenn lim f (x) existiert und endlich ist.
x→a
(ii) einen Sprung, wenn lim f (x) und lim f (x) existieren, endlich und verschieden sind.
x%a
x&a
(iii) einen Pol, wenn lim f (x) und lim f (x) existieren und ±∞ sind.
x%a
x&a
(iv) eine wesentliche Singularität in den verbleibenden Fällen.
Lücken waren uns bereits im einführenden Beispiel begegnet. Hat f eine Lücke bei a, so
lässt sich f durch den Ansatz f (a) = lim f (x) in den Punkt a hinein stetig fortsetzen.
x→a
x
Dagegen hat die Funktion f (x) = |x|
bei a = 0 einen Sprung von −1 zu +1, sie ist nicht
stetig fortsetzbar in den Punkt a = 0.
Die Funktion f (x) =
1
x
hat bei a = 0 einen Pol.
Schließlich ist f (x) = sin x1 ein Beispiel für eine Funktion, die bei a = 0 eine wesentliche
Singularität hat. Ihr Graph ist in Abb. 13 dargestellt.
Aufgaben zu Abschnitt 6.4
76
6 STETIGKEIT
Abbildung 13: f (x) = sin x1
1. Man berechne lim e−x und lim e−x .
x→∞
x→−∞
2. Man berechne
x2 −4
,
x→2 x−2
a) lim xn e−x ,
x2 −1
,
x%2 x−2
b) lim
x→∞
c) lim
1
2.
x→∞ 1+x
d) lim
3. Unter Verwendung der Potenzreihendarstellung der auftretenden Funktionen berechne man:
sin x − 1
cos x − 1
ex − 1
,
b) lim
,
c) lim
.
a) lim
x→0
x→0
x→0
x
x
x2
6.5
Ganzrationale und gebrochen rationale Funktionen
Die bisher entwickelten Techniken sind geeignet, einen umfassenden Einblick in die ganzrationalen und rationalen Funktionen zu gewinnen. Wir beginnen mit der Untersuchung
des Verhaltens im Unendlichen.
Satz 6.27 Es sei f (x) =
n
P
aj xj eine ganzrationale Funktion mit an 6= 0 und n ≥ 1.
j=0
Dann gilt
lim |f (x)| = ∞.
x→∞
Beweis. Es ist
f (x) = an x
n
an−1
a0 1+
+ ... + n .
x
x
Der zweite Faktor strebt für |x| → ∞ gegen 1, der erste Faktor strebt im Betrag gegen
Unendlich.
Satz 6.28 (Prinzip des Koeffizientenvergleichs) Sind zwei ganzrationale Funktionen wertverlaufsgleich, so stimmen sie in allen Koeffizienten überein.
6.5 Ganzrationale und gebrochen rationale Funktionen
77
Beweis. Es genügt zu zeigen, dass für jede ganzrationale Funktion
g(x) =
n
X
aj x j
j=0
aus g(x) = 0 für alle x ∈ R die Bedingung a0 = . . . = an = 0 folgt. Wegen 0 = g(0) = a0
ist a0 = 0. Wäre nun an > 0 für n ≥ 1, so hätte man lim g(x) = ∞ nach Satz 6.27 im
x→∞
Widerspruch zu g(x) = 0 für alle x ∈ R.
Definition 6.29 Für eine ganzrationale Funktion f (x) =
n
P
aj xj 6≡ 0 heißt die Zahl
j=0
Grad(f ) = max{j : aj 6= 0} der Grad von f . Ferner setzen wir Grad(0) = −∞.
Von grundsätzlicher Bedeutung ist die Frage nach der Existenz und Anzahl von Nullstellen
ganzrationaler Funktionen. Wir wollen beweisen, dass jede ganzrationale Funktion vom
Grad n ≥ 1 auch n (evtl. komplexe) Nullstellen hat. Dazu ist es zuerst nötig, den Begriff
der Vielfachheit einer Nullstelle einzuführen.
Satz 6.30 Eine Zahl x0 ∈ C ist genau dann eine Nullstelle der ganzrationalen Funktion
f (x), wenn eine Zerlegung
f (x) = (x − x0 ) · g(x)
mit einer geeigneten ganzrationalen Funktion g(x) möglich ist.
Beweis. Hat man eine derartige Zerlegung, so ist f (x0 ) = 0 · g(x0 ) = 0. Sei umgekehrt
f (x0 ) = 0. Die Polynomdivision f (x) : (x − x0 ) ergibt eine Zerlegung f (x) = (x − x0 ) ·
g(x) + q mit einer Zahl q. Aus f (x0 ) = 0 folgt dann aber q = 0.
Hat man eine Zerlegung f (x) = (x − x0 )g(x) gegeben, so könnte es sein, dass x0 auch
noch eine Nullstelle von g(x) ist. Dann lässt sich der Faktor (x − x0 ) nochmals abspalten,
es gilt dann also f (x) = (x − x0 )2 · g1 (x) mit einer neuen ganzrationalen Funktion g1 . Das
legt folgende Definition nahe:
Definition 6.31 Unter der Vielfachheit einer Nullstelle x0 einer ganzrationalen Funktion
f (x) versteht man die größte natürliche Zahl m, für die eine Zerlegung
f (x) = (x − x0 )m · g(x)
möglich ist. Insbesondere ist g(x0 ) 6= 0.
Folgerung 6.32 Für jede ganzrationale Funktion f ist die Summe der Vielfachheiten
ihrer Nullstellen nicht grösser als der Grad von f . Insbesondere hat f höchstens so viele
Nullstellen, wie der Grad von f angibt.
78
6 STETIGKEIT
Beweis. Es seien x0 , . . . , xk die Nullstellen von f mit den Vielfachheiten m0 , . . . , mk . Dann
existiert eine Zerlegung
f (x) = (x − x0 )m0 · . . . · (x − xk )mk g(x)
mit einer geeigneten ganzrationalen Funktion g(x). Ein Gradvergleich ergibt
Gradf = m0 + . . . + mk + Grad g ≥ m0 + . . . + mk ,
womit die Behauptung bewiesen ist.
Ein seit Vieta (1540–1603) bis zur berühmten Dissertation von C.F. Gauss im Jahr
1799 offenes Problem war die Frage, ob jede ganzrationale Funktion f vom Grad f = n ≥ 1
auch mindestens eine Nullstelle (und damit n–Nullstellen) hat. Wir werden diesen Satz
jetzt beweisen. Dazu beginnen wir mit dem Spezialfall:
Satz. Jede (sog. reine) Gleichung xn = a mit n ≥ 1 hat mindestens eine Lösung in C.
Beweis. Wir beweisen diesen Satz unter der Voraussetzung, dass die Zahl a eine Darstellung der Form
a = r eiϕ , r > 0 , ϕ ∈ R ,
besitzt. (In Satz 6.42 werden wir zeigen, dass eine solche Darstellung immer möglich ist.)
Für solche Zahlen a ist die Zahl
√
x = n r eiϕ/n
wegen xn = r(eiϕ/n )n = r eiϕ = a eine gesuchte Lösung von xn = a.
Satz 6.33 (Fundamentalsatz der klassischen Algebra) (Gauss 1799)
a) Jede ganzrationale Funktion f vom Grad(f ) ≥ 1 hat mindestens eine Nullstelle in C.
b) Jede ganzrationale Funktion f vom Grad(f ) ≥ 1 lässt sich in C in Linearfaktoren
f (x) = an (x − x1 )m1 · . . . · (x − xk )mk
zerlegen. Dabei ist m1 + . . . + mk = n.
Beweis. Es genügt, die Aussage a) zu beweisen. Die Zerlegung von f in das angegebene
Produkt ergibt sich dann durch wiederholte Anwendung von Satz 6.30. Die Idee zum
Beweis von a) besteht darin nachzuweisen, dass die Funktion |f (x)| ein Minimum hat und
dass dieses Minimum = 0 ist.
Wir zeigen als Erstes die Existenz des Minimums. Nach Satz 6.27 existiert eine Zahl K > 0
derart, dass
|f (x)| ≥ |f (0)| für alle |x| ≥ K
gilt. Auf der kompakten Menge {x : |x| ≤ K} hat die stetige Funktion |f | nach Satz 6.14
aber ein Minimum, etwa bei x0 . Wegen |f (x0 )| ≤ |f (0)| gilt dann aber sogar
|f (x0 )| = min |f (x)|.
x∈C
Wir wollen f (x0 ) = 0 zeigen und nehmen dazu das Gegenteil f (x0 ) 6= 0 an.
6.5 Ganzrationale und gebrochen rationale Funktionen
79
Die ganzrationale Funktion
r(x) =
f (x0 + x)
f (x0 + x) − f (x0 )
=
−1
f (x0 )
f (x0 )
hat offenbar bei x = 0 eine Nullstelle. Daher existiert eine Zerlegung
f (x0 + x)
− 1 = r(x) = xp g(x) mit g(0) 6= 0 und p ≥ 1.
f (x0 )
Somit ist
f (x0 + x)
g(x)
= 1 + xp
für alle x ∈ C.
f (x0 )
f (x0 )
Da |f | bei x0 ein Minimum hat, folgt
f (x0 ) 2
f (x0 + x) 2
p
p
2
p
≤ 1 = f (x0 ) = |1 + x g(x)| = (1 + x q(x))(1 + x q(x))
f (x0 ) = 1 + 2 Re (xp g(x)) + |xp g(x)|2 ,
also
0 ≤ 2 Re (xp g(x)) + |xp g(x)|2 für alle x ∈ C.
Ersetzt man x durch xj , so folgt nach Multiplikation mit j p
0 ≤ 2 Re
2
x x
1 p
xg
+ p x g
,
j
j
j p
und der Grenzübergang j → ∞ ergibt schließlich
0 ≤ Re (xp g(0)) für alle x ∈ C.
(∗)
Wir wählen nun eine Lösung z von z p = i. Mit x = z 0 , z 1 , z 2 , z 3 ergibt sich xp =
1, i, −1, −i, und aus (∗) folgt der Reihe nach
0
0
0
0
≤
≤
≤
≤
Re g(0)
Re (ig(0))
= −Im q(0)
Re (−g(0)) = −Re q(0)
Re (−ig(0)) = +Im q(0).
Hieraus folgt Re g(0) = Im g(0) = 0, also ist g(0) = 0 im Widerspruch zur Konstruktion
von g.
Das Verhalten gebrochen rationaler Funktionen in den Unstetigkeitspunkten und bei
Grenzübergang x → ±∞ ist in folgendem Satz zusammengefasst. Der Beweis ist offensichtlich.
Satz. Es sei
f (x) =
P (x)
Q(x)
80
6 STETIGKEIT
eine gebrochen rationale Funktion. Durch Division mit Rest kann sie in die Form
f (x) = H(x) +
p(x)
q(x)
mit ganzrationalen Funktionen H(x), p(x) und q(x), Grad p(x) < Grad q(x) und maximal gekürzten Quotienten p(x)/q(x) gebracht werden. Dann gelten
a) lim |f (x) − H(x)| = 0, die Funktion f verhält sich für x → ±∞ wie H.
x→±∞
p(x) = ∞ für q(x0 ) = 0, die Funktion f hat bei x0 einen Pol.
b) lim |f (x)| = lim x→x0
x→x0 q(x) Aufgaben zu Abschnitt 6.5
1. Man bestimme die drei Lösungen der Gleichungen z 3 = 1 und z 3 = i.
2. Unter Verwendung von Satz 6.33 beweise man die reelle Version des Fundamentalsatzes der klassischen Algebra:
Jede ganzrationale Funktion f mit reellen Koeffizienten besitzt in R eine Zerlegung
in lineare und quadratische Faktoren der Form
f (x) = an (x − x1 )l1 · . . . · (x − xr )lr · ((x − α1 )2 + β12 )k1 · . . . · ((x − αp )2 + βp2 )kp .
Dabei ist n = Grad(f ) = l1 + . . . + lr + 2k1 + . . . + 2kp .
3. Es sei f (x) eine ganzrationale Funktion vom Grad n ≥ 1. Zeigen Sie (im Vorgriff auf
gängige Differentiationsregeln): Eine Zahl x0 ist genau dann eine zweifache Nullstelle
von f , wenn f (x0 ) = f 0 (x0 ) = 0 und f 00 (x0 ) 6= 0. Charakterisieren Sie entsprechend
die m-fachen Nullstellen.
6.6
Sinus, Kosinus und Logarithmus in R und C
Wir untersuchen nun den Verlauf der in Definition 5.37 durch Potenzreihen definierten
trigonometrischen Funktionen sin x und cos x im Reellen. Wir wissen bereits aus Satz
6.10, dass beide Funktionen auf R stetig sind. Einen ersten Einblick in den Kurvenverlauf
gibt der folgende Satz:
Abbildung 14: Einschließung der sin-Funktion
6.6 Sinus, Kosinus und Logarithmus in R und C
81
Satz 6.34 Für alle x ∈ R mit 0 < x ≤ 2 gilt
0<x−
x3
< sin x < x.
3!
Beweis. Es ist
sin x =
∞
X
k=0
(−1)k
(s. Abb 14)
x2k+1
,
(2k + 1)!
und wir zeigen, dass für alle 0 < x ≤ 2 das Leibnizkriterium anwendbar ist. In der Tat
gilt für x2 < 6 die Ungleichung x2 ≤ (2k + 2)(2k + 3), woraus offenbar
2k+3 2k+1 x
x
≤
(2k + 3)! (2k + 1)! 2k+1 x
& 0, und hieraus ergibt sich wie für alle Reihen vom Leibniz–
folgt. Also gilt (2k + 1)! Typ die Ungleichung
s1 = x −
x3
< sin x < s0 = x.
3!
sin x
= 1.
x→0 x
Satz 6.35 lim
Beweis. Aus Satz 6.34 folgt für alle 0 < x ≤ 2 die Ungleichung
sin x
x2
<
< 1,
3!
x
die offenbar auch für alle x mit −2 ≤ x < 0 gilt. Der Grenzübergang x → 0 liefert die
Behauptung nach dem Vergleichskriterium.
0<1−
Satz 6.36 Es gibt genau eine Zahl 1 ≤ ω < 2 mit cos ω = 0. Wir definieren π = 2ω.
Bemerkung. Die auf diese Weise definierte Zahl π wird sich später als identisch mit der für
Kreisberechnungen wichtigen Konstanten π=Kreisumfang/Kreisdurchmesser erweisen.
Beweis. Existenz: Wir betrachten die stetige Funktion f (x) = cos(x) im Intervall [0, 2].
Es ist cos 0 = 1 > 0, und aus den Additionstheoremen und Satz 6.34 folgt
1 2
2
1
cos 2 = 1 − 2 sin2 1 ≤ 1 − 2 1 −
≤ 1 − 2 + = − < 0.
3!
3
3
Daher ergibt sich aus dem Satz von Bolzano die Existenz einer Nullstelle ω ∈ (0, 2).
Zum Nachweis der Einzigkeit zeigen wir zunächst, dass im Intervall (0, 1) keine Nullstelle
existieren kann. In der Tat gilt für 0 ≤ x < 1 wegen Satz 6.34 die Abschätzung
cos2 x = 1 − sin2 x > 1 − x2 > 0.
Seien nun 1 ≤ x < x0 < 2 mit cos x = cos x0 = 0 gegeben. Dann ist 0 < x0 − x < 1, woraus
wegen Satz 6.34 sicherlich sin(x0 − x) > 0 folgt. Das widerspricht der Gleichung
sin(x0 − x) = sin x0 cos x − cos x0 sin x = 0.
Daher kann im Intervall [1, 2) nur eine Nullstelle x von cos x existieren.
82
6 STETIGKEIT
Satz 6.37 Für 0 < x < π gilt sin x > 0.
Beweis. Es ist sin x = 2 sin x2 cos x2 , und wegen Satz 6.34 und Satz 6.36 sind sin x2 > 0 und
cos x2 > 0.
Satz 6.38 Für alle x ∈ R gelten
a) cos(x + π2 ) = − sin x, sin(x + π2 ) = cos x,
b) cos(x + 2π) = cos x,
sin(x + 2π) = sin x.
Beweis. Es ist sin2 π2 = 1 − cos2 π2 = 1 − 0 = 1. Hieraus folgt | sin π2 | = 1. Wegen Satz 6.37
ist dann sogar sin π2 = 1. Daher ergibt das Additionstheorem
cos(x + π2 )
sin(x + π2 )
= cos x · cos π2
= sin x · cos π2
sin x sin π2
cos x sin π2
–
+
=
=
0 –
0 +
sin x,
cos x.
Aus a) folgt nun
cos(x + π) = cos (x + π2 ) +
π
2
= − sin(x + π2 ) = − cos x.
Also ist cos(x + 2π) = − cos(x + π) = cos x.
Satz 6.39 Die Funktion f (x) = cos x ist auf dem Intervall [0, π] streng monoton fallend,
die Funktion f (x) = sin x ist auf [− π2 , π2 ] streng monoton wachsend.
Beweis. Es sei 0 ≤ x < x0 ≤ π. Mit a =
den Additionstheoremen
x0 +x
2
und b =
x0 −x
2
> 0 folgt aus Satz 6.37 und
cos x − cos x0 = cos(a − b) − cos(a + b)
= cos a cos b + sin a sin b − cos a cos b + sin a sin b
= 2 sin a sin b > 0.
Aus Satz 6.38a) folgt dann die entsprechende Behauptung für die Funktion sin x.
Definition 6.40 Die Funktionen cos x und sin x besitzen auf [0 , π] bzw. auf [− π2 , π2 ]
streng monotone Umkehrfunktionen, die als Arcus–Funktionen bezeichnet werden: Für
−1 ≤ x ≤ 1 ist
arcsin x
arccos x
=
=
t ⇔
t ⇔
sin t = x
cos t = x
und
und
− π2 ≤ t ≤ π2
0 ≤ t ≤ π.
In Abbildung 15 sind diese Funktionen graphisch dargestellt. Schliesslich definiert man
wie üblich die Tangensfunktion durch
tan x =
sin x
cos x
für x 6=
π
+ kπ
2
(k ∈ Z)
Wir untersuchen nun die Exponentialfunktion im Komplexen. Überraschenderweise
stellt sich in imaginärer Richtung eine Periodizität von der Periodenlänge 2πi ein:
6.6 Sinus, Kosinus und Logarithmus in R und C
83
Abbildung 15: arcsin- und arccos- Funktion
Satz 6.41 Es gilt ez1 = ez2 genau dann, wenn z1 − z2 = 2kπi für ein k ∈ Z ist. Insbesondere gilt e2kπi = 1.
Beweis. Die Gleichungen ez1 = ez2 und ez1 −z2 = 1 sind äquivalent. Es sei also
ez = ea+bi = ea ebi = 1 mit a, b ∈ R.
Dann folgt ea = |ea ebi | = 1, was nur für a = 0 möglich ist. Hieraus ergibt sich
1 = ebi = cos b + i sin b,
also cos b = 1, was genau für b = 2kπ mit k ∈ Z gilt.
In Abbildung 16 ist der Realteil der Funktion f (z) = ez dargestellt, die Periodizität der
Exponentialfunktion wird hieraus deutlich.
Abbildung 16: Realteil der Funktion ez = ex+iy
Wir können nun auch die früher behauptete Existenz der trigonometrischen Darstellung komplexer Zahlen beweisen:
Satz 6.42 Jede komplexe Zahl z 6= 0 lässt sich in eindeutiger Weise in der Form
z = reiϕ = r(cos ϕ + i sin ϕ) mit r > 0 und − π < ϕ ≤ π
darstellen. Dabei ist r = |z| der Betrag von z, und die Zahl ϕ heißt das Argument von z.
Man schreibt ϕ = Argz.
84
6 STETIGKEIT
Beweis. Es sei z = a + bi gegeben. Wir setzen


arccos Re z
für Im z ≥ 0


|z|
√
r = a2 + b2 = |z| und ϕ =


 − arccos Re z für Im z < 0.
|z|
Man rechnet nun nach, dass z = reiϕ gilt: Im Fall Im z ≥ 0, also für 0 ≤ ϕ ≤ π, gelten
Re z
und
|z|
p
1p 2
|Im z|
Im z
0 ≤ sin ϕ =
1 − cos2 ϕ =
|z| − |Re z|2 =
=
.
|z|
|z|
|z|
cos ϕ =
Daher ist
reiϕ = r(cos ϕ + i sin ϕ) = Re z + i Im z = z.
Entsprechend wird der Fall Im z < 0, also −π < ϕ < 0, behandelt. Die Einzigkeit der
Darstellung ist eine Folgerung aus Satz 6.41.
Beispiel 6.43 Als Beispiel betrachten wir die Zahl z =
√
3 + i. Es ist
√
√
3
π
r = 3 + 1 = 2 und ϕ = arccos
= .
2
6
Das ergibt
π
z = 2 ei 6 .
Satz 6.44 (Die Moivreschen Formeln) Sind zj = rj eiϕj für j = 1, 2, so gelten
a) z1 · z2 = r1 r2 ei(ϕ1 +ϕ2 ) ,
b) z1n
n
= r1n eiϕ1 .
c) Die Lösungen der Gleichung z n = 1 sind genau die Zahlen zk = ei
2πk
n
, 0 ≤ k < n.
Beweis. Die Aussagen folgen aus den Potenzgesetzen für die Exponentialfunktion.
Folgerung 6.45 Die Gleichung z n = a mit a = r eiα 6= 0 hat genau die n verschiedenen
Lösungen
√
α
2π
zk = n r ei( n + n k) ; k = 0, . . . , n − 1.
Satz 6.46 (Die komplexe Logarithmusfunktion) Die Funktion f (z) = ez bildet den
Streifen
S = {a + bi : − π < b ≤ π, a ∈ R}
eineindeutig auf die punktierte komplexe Ebene C \ {0} ab. Die Umkehrfunktion ist durch
die Formel
Lnz = ln |z| + i Argz ; z ∈ C \ {0},
gegeben, und sie heißt (Hauptwert) der komplexen Logarithmusfunktion. Für z > 0 ist
Lnz = ln z.
6.6 Sinus, Kosinus und Logarithmus in R und C
85
Abbildung 17: Der Wertebereich von Ln(w)
Beweis. Die Eineindeutigkeit von f (z) = ez auf S folgt sofort aus Satz 6.41. Weiter gelten
für 0 6= z ∈ C mit ϕ = Argz die Gleichungen
eLnz = eln |z|+iϕ = eln |z| eiϕ = |z| eiϕ = z,
Ln ez = Ln ea+bi = Ln(ea ebi ) = ln ea + ib = a + ib = z.
Beispiel 6.47 Wegen Arg(−1) = π und Arg(i) =
π
2
gelten
Ln(−1) = ln | − 1| + iπ = iπ,
Ln i
= ln |i| + i π2
= i π2 ,
Ln 2i
= ln 2 + i π2 .
Aufgaben zu Abschnitt 6.6
1. Man zeige ez 6= 0 für alle z ∈ C. (Hinweis: Eulersche Formel)
2. Man zeige
a) Die Funktion f (z) = sin z hat in C genau die Nullstellen
z = kπ, k ∈ Z.
(Hinweis: Man benutze die Formel sin z = (eiz − e−iz )/2i.)
b) Die Funktion f (z) = cos z hat in C genau die Nullstellen
z = π2 + kπ, k ∈ Z.
3. Man beweise Ln(z1 z2 ) = (Ln z1 + Ln z2 ) mod (2πi) für 0 6= z1 , z2 ∈ C.
4. Definiert man az = ez·Lna für 0 6= a ∈ C, so erhält man auch Exponentialfunktionen
mit komplexer Basis. Man berechne ii , iπ , (−1)π .
5. Man beweise die Grenzwertformel aus Satz 6.35 in unter Verwendung der Folgendefinition der Zahl e (s. Satz 4.25).
6. a) Geben Sie alle Lösungen der Gleichung z 7 −1 = 0 in C an und stellen Sie die Zahlen in der komplexen Zahlenebene dar. (Hinweis: Benutzen Sie die trigonometrische
Darstellung.)
b) Ebenso für z 7 − i = 0.
86
6 STETIGKEIT
7. Es sei z = 0.75+0.5i. Stellen Sie die Folgenglieder {z 1 , z 2 , . . . , z 10 } in der komplexen
Ebene dar. (Hinweis: Benutzen Sie die de’Morganschen Formeln.)
8. Geben Sie die folgenden Zahlen in kartesischer Darstellung an:
a) Ln(3 + i), b) sin(1 + i), c) (1 + i)2+i ,
d) ie .
87
7
7.1
Differentialrechnung
Differenzierbarkeit und Differentiationsregeln
Obwohl die Grundzüge der Differentialrechnung zu großen Teilen in Reellen und Komplexen gemeinsam entwickelt werden können, beschränken wir uns hier im Wesentlichen
auf die reelle Theorie. Der interessierte Leser prüfe die folgenden Definitionen und Sätze
selbständig auf ihre Übertragbarkeit und Gültigkeit im Komplexen.
Definition 7.1 Es sei f eine Funktion aus R in sich und sei a ein innerer Punkt von
D(f ). Die Funktion f heißt differenzierbar bei a, wenn der Grenzwert des Differenzenquotienten
f (x) − f (a)
lim
x→a
x−a
existiert und endlich ist. Im Fall der Existenz heißt diese Zahl der Differentialquotient
oder die Ableitung f 0 (a) von f bei a.
Die Bedeutung der Differenzierbarkeit liegt in der hiermit verbundenen Linearisierbarkeit
”
im Kleinen“, die in geometrischer Fassung die Existenz der Tangente bedeutet (s. Abb.
18). Das ist der Inhalt der sogenannten Weierstraßschen Zerlegungsformel:
Satz 7.2 (Weierstraßsche Zerlegungsformel) Die Funktion f ist genau dann bei a
differenzierbar, wenn es eine Zahl m und eine Funktion ρ(a, x) in einer Umgebung von a
so gibt, dass
f (x) = f (a) + m(x − a) + ρ(x, a)(x − a) und lim ρ(x, a) = 0
x→a
gelten. Dabei ist dann m = f 0 (a).
Beweis. Setzt man ρ(a, x) =
lim
x→a
f (x) − f (a)
= m. ist.
x−a
f (x) − f (a)
− m, so gilt lim ρ(x, a) = 0 genau dann, wenn
x→a
x−a
Die Funktion h(x) = f (a) + m(x − a), die als Teilsumme in der Zerlegungsformel auftritt, hat geometrisch die Bedeutung der Tangente im Punkt (a, f (a)). In Abbildung 30.1
ist die Zerlegung grafisch dargestellt. Die Weierstraßsche Zerlegungsformel liefert lineare
Näherungen für eine Vielzahl von Funktionen. Als Kostprobe dafür notieren wir
sin x ≈ x,
√
1
1 + x ≈ 1 + x.
2
Eine Fehlerabschätzung, die diese Näherungen erst verwendbar macht, wird sich in Satz
7.30 ergeben.
Definition 7.3 Eine Funktion f aus R in R heißt differenzierbar auf einer offenen Teilmenge M ⊆ D(f ), wenn f in jedem Punkt von M differenzierbar ist.
88
7 DIFFERENTIALRECHNUNG
Abbildung 18: Differenzenquotient und Linearisierung
df
df
bezeichnet. Die Symbolik
geht
dx
dx
0
dabei auf Leibniz zurück, die Symbolik f (x) stammt von Newton (s. 7.8).
Die Ableitungsfunktion wird auch durch f 0 (x) =
Satz 7.4 Ist f in a differenzierbar, so ist f dort auch stetig.
Beweis. Die Weierstrasssche Zerlegungsformel ergibt
|f (x) − f (a)| ≤ |x − a| · |m + ρ(x, a)| → 0 für x → a.
Die Umkehrung gilt nicht, z.B. ist die Funktion f (x) = |x| auf ganz R stetig, aber an
der Stelle a = 0 offenbar nicht differenzierbar. Es gibt aber auch stetige Funktionen,
die in keinem Punkt ihres Definitionsbereiches differenzierbar sind (s. Aufgabe 2). Ohne
auf Details einzugehen sei bemerkt, dass die Brownsche Bewegung eines Teilchens oder
der zeitliche Verlauf eines Aktienkurses auch gute Modelle für nirgends differenzierbare
Funktionen sind (Warum?). Das zeigt, dass solche seltsamen Funktionen in der Praxis
durchaus auftreten und sogar von einiger Bedeutung sind.
Die einseitige Differenzierbarkeit ist eine Abschwächung des Differenzierbarkeitsbegriffes. Eine Funktion f heißt bei einem inneren Punkt a des Definitionsbereiches linksseitig differenzierbar, wenn der linksseitige Grenzwert
f (x) − f (a)
x%a
x−a
lim
existiert. Die Funktion f (x) = |x| hat bei a = 0 eine links– und eine rechtsseitige
Ableitung, die aber beide voneinander verschieden sind.
Wir leiten nun wichtige Differentiationsregeln her, mittels derer eine algorithmische Berechnung von Ableitungen möglich sein wird.
Satz 7.5 (Differentiationsregeln) Sind die Funktionen f und g in einem inneren
Punkt a von D(f ) ∩ D(g) differenzierbar, so sind auch skalare Vielfache, Summe, Differenz, Produkt und im Fall g(a) 6= 0 auch der Quotient der Funktionen f und g bei a
differenzierbar, und es gelten die Formeln:
7.1 Differenzierbarkeit und Differentiationsregeln
a)
(λf )0 (a)
b)
(f ± g)0 (a) =
(f · g)0 (a)
0
f
d)
g (a)
c)
=
89
λf( a),
f 0 (a) ± g 0 (a),
=
f (a)g 0 (a) + f 0 (a)g(a),
=
f 0 (a)g(a) − f (a)g 0 (a)
.
g(a)2
Beweis. Die Aussagen ergeben sich folgendermaßen aus den Grenzwertsätzen:
λf (x) − λf (a)
f (x) − f (a)
=λ
→ λf 0 (a),
x−a
x−a
f (x) − f (a) g(x) − g(a)
f (x) ± g(x) − (f (a) ± g(a))
=
±
→ f 0 (a) ± g 0 (a),
b)
x−a
x−a
x−a
f (x)g(x) − f (a)g(a)
g(x) − g(a) f (x) − f (a)
c)
= f (x)
+
g(a) → f (a)g 0 (a) + f 0 (a)g(a),
x−a
x−a
x−a
f (x)/g(x) − f (a)/g(a)
f (x)g(a) − f (a)g(x)
d)
=
=
x−a
(x − a)g(x)g(a)
1
f (x)g(a)−f (a)g(a)
f (a)g(x)−f (a)g(a)
1
=
−
→
(f 0 (a)g(a) − f (a)g 0 (a)).
x−a
x−a
g(x)g(a)
2
g(a)
a)
Wir betrachten jetzt Superpositionen von Funktionen.
Satz 7.6 (Die Kettenregel) Ist a ein innerer Punkt von D(g), ist g(a) ein innerer
Punkt von D(f ) und sind g bei a und f bei g(a) differenzierbar, so ist auch F = f ◦ g bei
a differenzierbar, und es gilt
(f ◦ g)0 (a) = f 0 (g(a)) · g 0 (a).
Beweis. Aus der Weierstraßschen Zerlegungsformel für f folgt
f (g(x)) − f (g(a)) = [f 0 (g(a)) + ρf (g(x), g(a))] · (g(x) − g(a)),
und für g folgt
g(x) − g(a) = [g 0 (a) + ρg (x, a)] · (x − a).
Einsetzen und Division durch (x − a) ergibt
f (g(x)) − f (g(a))
= [f 0 (g(a)) + ρf (g(x), g(a))] · [g 0 (a) + ρg (x, a)] → f 0 (g(a)) · g 0 (a)
x−a
und für x → a.
Unter Verwendung der Leibniz-Symbolik nimmt die Kettenregel die Form einer
Kürzungsregel“ an: Sind nämlich f und g differenzierbar und ist z = f (g(x)) und
”
y = g(x), so folgt
dz
dz dy
=
· .
dx
dy dx
90
7 DIFFERENTIALRECHNUNG
Satz 7.7 (Ableitung der Umkehrfunktion) Die reelle Funktion f sei auf der offenen Teilmenge M ⊆ R stetig und habe die Umkehrfunktion g, die an der Stelle f (a)
differenzierbar mit g 0 (f (a)) 6= 0 sei. Dann ist auch f bei a differenzierbar und es gilt
f 0 (a) =
1
g 0 (f (a))
.
Beweis. Aus Id = g ◦ f und der Zerlegungsformel für g folgt
x − a = g(f (x)) − g(f (a)) = g 0 (f (a))(f (x) − f (a)) + ρg (f (x), f (a))(f (x) − f (a)).
Die Division durch x − a und der Grenzübergang x → a ergibt nun
1=
f (x) − f (a) 0
(g (f (a)) + ρg (f (x), f (a))) → f 0 (a)g 0 (f (a)),
x−a
also 1 = f 0 (a)g 0 (f (a)). Hieraus folgt die Behauptung.
7.8 (Historische Bemerkungen) Die Differential-Integralrechnung wurde unabhängig voneinander aber gleichzeitig von Gottfried Wilhelm Leibniz und Isaac
Newton gegen Ende des 17. Jh. entwickelt. Für Leibniz stand im Zentrum des
Interesses die differentielle Abhängigkeit eine Größe y von einer anderen Größe x. Das
führte auf die Untersuchung der Differentialquotienten
∆y
dy
= lim
.
∆x→0
dx
∆x
Philosophisch wurde der Umgang mit den Differentialen von Leibniz durch seine Monadenlehre begründet. Newton benutzte die Differentialrechnung vor allem zur Beschreibung der zeitlichen Änderung physikalischer Größen. Er nannte diese zeitlichen Änderungen Fluxionen der Größen x = x(t) bzw. y = y(t), und er bezeichnete sie durch
∆x
∆t→0 ∆t
ẋ(t) = lim
Ableitungen von y und x traten bei Newton als Quotienten y 0 = ẏ/ẋ der Fluxionen auf.
dy
Wegen (7’) und (8) lässt sich dx
in der Tat als Quotient ẏ/ẋ schreiben:
dy
dy dt
dy 1
ẏ
=
·
=
·
= .
dx
dx
dt dx
dt
ẋ
dt
Das zeigt die Äquivalenz beider Begriffsapparate.
Definition 7.9 (Höhere Ableitungen) Eine Funktion f heißt auf einer offenen Menge
M zweimal differenzierbar, falls f 0 auf M existiert und selbst noch einmal differenzierbar
ist. Die Funktion f 00 = (f 0 )0 heißt dann die zweite Ableitung von f . Entsprechend wird
die k-te Ableitung im Fall der Existenz durch f (k) = (f k−1 )0 , k ≥ 1, definiert. Dabei setzt
man noch f (0) = f .
7.2 Differentiation elementarer Funktionen
91
Abbildung 19: Takagi-Funktion g
Aufgaben zu Abschnitt 7.1
1. Man berechne die Ableitung der Funktion f (x) = x2 an Hand der Definition. Man
bestimme die Gleichung der Tangente an die Funktion f (x) = x3 + 1 im Punkt
(2, f (2)).
2. (Takagi-Funktion) Es sei f : R → [0, 1] die 1-periodische Sägezahnfunktion, die
auf dem Intervall [0, 1] durch f (x) = 2x für 0 ≤ x ≤ 0.5 und f (x) = 2 − 2x für
0.5 ≤ x ≤ 1 definiert ist.
f (2k x)
für k ∈ N sind immer feinere Abbilder von f . Zeigen
Die Funktionen fk (x) =
2k
Sie
∞
P
fk (x) ist auf R gleichmäßig konvergent. (Daher
a) Die Funktionenreihe g(x) =
k=0
ist g stetig auf R. Die Funktion g heißt Takagi7 -Funktion, s. Abb. 19)
b) Zeigen Sie, dass g in keinem Punkt x ∈ R differenzierbar ist.
c) Zeigen Sie, dass g auf dem Intervall [0, 1] ebenso viele Maxima hat, wie es reelle
Zahlen gibt.
7.2
Differentiation elementarer Funktionen
In diesem Abschnitt leiten wir Differentiationsregeln für die uns interessierenden Funktionen her. Wir beginnen mit der Betrachtung von Polynomen.
Satz 7.10 Die Ableitung der Funktion fn (x) = xn ist fn0 (x) = n xn−1 für alle n ∈ N.
Beweis. Wir beweisen die Aussage induktiv. Für n = 0 ist f0 (x) ≡ 1. Daher ist f00 ≡ 0.
0
Für n > 0 ergibt sich induktiv aus der Produktregel fn+1
(x) = (xn+1 )0 = (x xn )0 =
1 · xn + nxxn−1 = (1 + n)xn .
Folgerung 7.11 Für P (x) =
n
P
l=0
7
Teiji Takagi 1875-1969, Tokio
an xk ist P 0 (x) =
n
P
k=1
kak xk−1 .
92
7 DIFFERENTIALRECHNUNG
Beweis. Die Formel folgt aus der Summenregel und aus Satz 7.10.
Satz 7.12 (Differentiation von Potenzreihen) Ist f (x) =
∞
X
an xk eine Potenzreihe
h=0
mit einem Konvergenzradius R > 0, so gilt
0
f (x) =
∞
X
kak xk−1
k=1
im Innern des Konvergenzkreises, und die Konvergenzradien beider Reihen sind gleich.
(Bemerkung: Satz und Beweis sind ebenso für komplexe Potenzreihen richtig.)
Beweis. Wir setzen g(x) =
∞
P
kak xk−1 und h(x) =
p
k
|k ak | = lim
k|ak |xk−1 . Wegen
k=1
k=1
lim sup
∞
P
√
k
k · lim sup
p
k
|ak | = lim sup
p
k
|ak | = R−1
sind die Konvergenzradius von g und h ebenfalls gleich R. Wir berechnen nun die Ableitung von f an einer beliebigen Stelle a mit |a| < R. Dazu zerlegen wir
X
X
f (x) = fN (x) + ϕN (x) =
ak x k +
ak x k ,
k≤N
g(x) = gN (x) + γN (x) =
X
k≤N
h(x) = hN (x) + ηN (x) =
X
k≤N
k>N
kak xk−1 +
X
kak xk−1 und
k>N
k|ak |xk−1 +
X
k|ak |xk−1 .
k>N
Nun sei a mit |a| < R beliebig gegeben. Wir wählen eine Zahl r mit |a| < r < R. Wegen
X
ϕN (x) − ϕN (a) X xk − ak
=
ak
=
ak (xk−1 + axk−2 + . . . + ak−1 )
x−a
x
−
a
k>N
k>N
ist
ϕN (x) − ϕN (a) X
≤
|ak | krk−1 = ηN (r) für alle |x| < r.
x−a
k>N
Für den Differenzenquotienten von f bei a gilt dann
f (x) − f (a)
fN (x) − fN (a)
ϕN (x) − ϕN (a) + |γN (a)|
− g(a) ≤ − gN (a) + x−a
x−a
x−a
fN (x) − fN (a)
≤ − gN (a) + 2|ηN (r)|.
x−a
Für gegebenes ε > 0 wählt man nun eine Zahl N so, dass |ηN (r)| < ε ist. Wegen fN0 (a) =
gN (a) nach Folgerung 7.11 existiert eine Zahl δ ≤ r − |a| so, dass
fN (x) − fN (a)
− gN (a) < ε für |x − a| < δ
x−a
7.2 Differentiation elementarer Funktionen
93
ausfällt. Daher gilt für alle |x − a| < δ die Abschätzung
f (x) − f (a)
≤ 3 ε.
−
g(a)
x−a
Das zeigt die Existenz des Grenzwertes und auch die Gleichung f 0 (a) = g(a).
Der Satz 7.12 ist speziell anwendbar auf die Potenzreihendarstellung der Funktionen
ex , sin x und cos x (s. Aufgabe 2). Wir berechnen die Ableitungen dieser Funktionen aber
auch auf die folgende, alternative Weise.
Satz 7.13 Für alle x ∈ R gilt (ex )0 = ex .
Beweis. Es ist
ex − ea
et − 1
ex−a − 1
= lim ea
= ea lim
= ea .
x→a x − a
x→a
t→0
x−a
t
lim
Satz 7.14 Für alle x > 0 gilt (ln x)0 = x1 .
Beweis. Die Funktion f (x) = ln x hat die Umkehrfunktion g(y) = ey mit g 0 (y) = ey . Die
Formel für die Differentiation der Umkehrkfunktion ergibt dann
f 0 (x) =
1
g 0 (f (x))
=
1
ef (x)
=
1
eln x
=
1
.
x
Folgerung 7.15 Für alle x > 0 und α 6= 0 gilt (xα )0 = α xα−1 .
Beweis. Es ist xα = eα ln x , und die Kettenregel ergibt
(xα )0 = (eα ln x )0 = eα ln x · α ·
1
= α xα−1 .
x
Satz 7.16 Für alle x ∈ R gelten (sin x)0 = cos x, (cos x)0 = − sin x.
Beweis. Mit a = x +
h
2
und b =
h
2
ergibt sich aus den Additionstheoremen die Gleichung
h
h
sin(x + h) − sin x = sin(a + b) − sin(a − b) = 2 cos a · sin b = 2 cos x +
sin .
2
2
Für h → 0 folgt nach Satz 6.35 hieraus
sin(x + h) − sin x
h
sin(h/2)
= cos x +
·
→ cos x.
h
2
h/2
Also ist (sin x)0 = cos x. Schließlich gilt
π 0
π
0
(cos x) = sin(x + ) = cos(x + ) = − sin x.
2
2
94
7 DIFFERENTIALRECHNUNG
Satz 7.17 Für alle − π2 < x <
π
2
gilt (tan x)0 = 1 + tan2 x =
Beweis. Die Aussage folgt aus tan x =
sin x
cos x
1
2
cos x
.
und der Quotientenregel.
Satz 7.18 Für alle −1 < x < 1 gelten (arcsin x)0 =
√ 1
1−x2
1
und (arccos x)0 = − √1−x
2.
Beweis. Die Umkehrfunktion zu f (x) = arcsin x ist g(y) = sin y. Daher ist
f 0 (a) =
1
g 0 (f (a))
=
1
1
1
=p
=p
2
cos(arcsin x)
1 − sin (arcsin x)
1 − sin2 x
wegen cos(arcsin x) > 0 für −1 < x < 1.
Bemerkung 7.19 Zur Berechnung von Ableitungen ist manchmal die Formel der sogenannten logarithmischen Differentiation nützlich:
Mit f (x) = ln g(x) gilt f 0 (x) =
· g 0 (x) nach der Kettenregel. Hieraus folgt
1
g(x)
g 0 (x) = g(x) · f 0 (x)
als Formel für die Ableitung von g.
Aufgaben zu Abschnitt 7.2
1. Man berechne die Ableitungen folgender Funktionen:
√
a) f (x) = x + 1, b) f (x) = sin(2 x2 + 1), c) f (x) = x2 e2x , d) f (x) = xx .
2. Berechnen Sie die Ableitungen der Funktionen
ex , sin x und cos x durch Differentiation der Potenzreihendarstellungen dieser Funktionen.
3. Fügen Sie durch geeignete Wahl der Parameer a, b die Funktionen f (x) =
e2x für x ≥ 0 und g(x) = x2 + ax + b für x < 0 so zusammen, dass eine auf ganz R
differenzierbare Funktion h(x) entsteht.
4. Prüfen Sie, ob die Funktion f (x) = x2 · sgnx auf R differenzierbar ist und berechnen
Sie ggf. die Ableitung. (Graphische Darstellung von f und f 0 ?)
5. Zeigen Sie, dass die Ableitung der Funktion f (x) = x2 sin x1 für x 6= 0 und f (0) = 0
überall existiert, dass aber f 0 aber nicht überall stetig ist.
6. Die Funktionen
Jn (x) =
∞
X
(−1)k ( x )2k+n
2
k=0
(n + k)! k!
, n ∈ N,
heißen Bessel-Funktionen erster Art. Zeigen Sie 2Jn0 = Jn−1 − Jn+1 .
7.3 Mittelwertsätze der Differentialrechnung
7.3
95
Mittelwertsätze der Differentialrechnung
Die sogenannten Mittelwertsätze der Differentialrechnung spielen eine zentrale Rolle bei
allen Aussagen, bei denen aus Eigenschaften der Ableitung einer Funktion auf die Funktion
selbst zurückgeschlossen werden soll. Grob gesagt erlauben sie es, Funktionswertdifferenzen durch Ableitungen auszudrücken.
Satz 7.20 (Satz von Michel Rolle (1690–1719)) Ist f stetig auf [a, b], differenzierbar auf (a, b) und gilt f (a) = f (b) = 0, so existiert mindestens ein Punkt ξ ∈ (a, b) mit
f 0 (ξ) = 0.
Beweis. Da f als differenzierbare Funktion auch auf [a, b] stetig ist, existieren wegen des
Satzes vom Minimum und Maximum zwei Zahlen x1 , x2 ∈ [a, b] mit f (x1 ) ≤ f (x) ≤ f (x2 )
für alle x ∈ [a, b]. Insbesondere ist f (x2 ) ≥ f (a) = 0. Gilt dabei sogar f (x2 ) > 0, so ist
sicher x2 ∈ (a, b). Daher existiert f 0 (x2 ). Wegen
f (x2 + h) − f (x2 )
≤ 0 für h > 0,
≥ 0 für h < 0
h
gilt dann aber
f (x2 + h) − f (x2 )
= 0,
h→0
h
und ξ = x2 genügt der Behauptung des Satzes. Im Fall f (x2 ) = 0 betrachten wir den
Minimumpunkt x1 . Gilt auch f (x1 ) = 0, so ist f ≡ 0 auf [a, b] und daher auch f 0 (x) = 0
für alle x ∈ (a, b). Ist aber f (x1 ) < 0, so betrachten wir die Funktion g(x) = −f (x), die
bei x1 ein Maximum g(x1 ) = −f (x1 ) > 0 hat. Daher gilt nach dem bereits diskutierten
Fall 0 = g 0 (x1 ) = −f 0 (x1 ), und ξ = x1 ist eine gesuchte Nullstelle von f 0 .
f 0 (x2 ) = lim
Als Verallgemeinerung ergibt sich der
Satz 7.21 (Mittelwertsatz der Differentialrechnung) Ist f auf [a, b] stetig und auf
(a, b) differenzierbar, so existiert ein Punkt a < ξ < b mit
f 0 (ξ) =
f (b) − f (a)
.
b−a
Jeder Differenzenquotient ist also als Ableitung realisierbar.
Beweis. Die Gerade durch die Punkte P1 = (a, f (a)) und P2 = (b, f (b)) ist durch die
Gleichung
g(x) =
f (b) − f (a)
f (b) − f (a)
(x − a) + f (a) mit der Ableitung g 0 (x) =
b−a
b−a
gegeben. Die Differenzfunktion h(x) = f (x) − g(x) erfüllt wegen h(a) = f (a) − g(a) = 0
und h(b) = f (b) − g(b) = 0 die Voraussetzungen des Satzes von Rolle. Daher existiert ein
ξ ∈ (a, b) mit 0 = h0 (ξ) = f 0 (ξ) − g 0 (ξ). Also ist
f 0 (ξ) = g 0 (ξ) =
f (b) − f (a)
.
b−a
96
7 DIFFERENTIALRECHNUNG
Abbildung 20: Der Mittelwertsatz der Differentialrechnung
Satz 7.22 (2. Version des Mittelwertsatzes) Es sei h > 0 und f sei auf dem Intervall [a − h, a + h] stetig und auf (a − h, a + h) differenzierbar. Dann existiert eine von a
und h abhängige Zahl 0 < θ < 1 derart, dass
f (a + h) = f (a) + h f 0 (a + θ h).
Beweis. Wir setzen F (t) = f (a + th). Dann ist F auf [0, 1] stetig und auf (0, 1) differenzierbar. Nach dem Mittelwertsatz, Satz 7.21, existiert daher eine Zahl 0 < θ < 1 mit
F 0 (θ) =
F (1) − F (0)
= f (a + h) − f (a).
1
Da wegen der Kettenregel die Gleichung F 0 (θ) = h · f 0 (a + θ h) gilt, folgt hieraus die
Behauptung.
Als erste globale Konsequenz ergibt sich:
Folgerung 7.23 Gilt f 0 (x) = 0 für alle x ∈ (a, b), so ist f ≡ const auf (a, b).
Beweis. Es seien a < x1 < x2 < b beliebig gegeben. Wegen Satz 7.21 existiert eine Zahl ξ
mit x1 ⊂ ξ < x2 und
f (x2 ) − f (x1 )
= f 0 (ξ).
x2 − x1
Da aber f 0 (ξ) = 0 nach Voraussetzung gilt, ergibt sich f (x1 ) = f (x2 ). Auf (a, b) sind also
alle Funktionswerte von f untereinander gleich.
Satz 7.24 Gilt f 0 (x) = g 0 (x) für zwei differenzierbare Funktionen f und g auf einem
Intervall (a, b), so unterscheiden sich f und g nur durch eine Konstante.
Beweis. Die Differenzfunktion h(x) = f (x) − g(x) erfüllt die Voraussetzungen von Satz
7.23 und ist daher konstant.
Satz 7.25 (Verallgemeinerter Mittelwertsatz) Es seien f und g auf [a, b] stetig, auf
(a, b) differenzierbar und es sei g 0 (x) 6= 0 auf (a, b). Dann existiert eine Zahl ξ ∈ (a, b)
mit
f (b) − f (a)
f 0 (ξ)
= 0 .
g(b) − g(a)
g (ξ)
7.3 Mittelwertsätze der Differentialrechnung
97
Beweis. Wäre g(a) = g(b), so gäbe es nach dem Mittelwertsatz eine Zahl x ∈ (a, b) mit
g 0 (x) = 0. Daher ist g(a) 6= g(b). Wir setzen p(x) = f (x) − λ g(x) mit
λ=
f (b) − f (a)
.
g(b) − g(a)
Dann ist offenbar p(a) = p(b). Nach dem Mittelwertsatz existiert daher ein a < ξ < b mit
p0 (ξ) = 0. Also ist 0 = f 0 (ξ) − λ g 0 (ξ), und hieraus folgt die Behauptung des Satzes.
Satz 7.26 (Die Regel von Bernoulli–de l’Hospital) Es seien f und g zwei in einer
Umgebung von x0 differenzierbare Funktionen mit f (x0 ) = g(x0 ) = 0. Existiert dann der
rechts stehende Limes, so existiert auch der andere und es gilt
lim
x→x0
f (x)
f 0 (x)
= lim 0
.
g(x) x→x0 g (x)
Beweis. Nach dem verallgemeinerten Mittelwertsatz existiert zu x und x0 ein ξx zwischen
x und x0 mit
f (x) − g(x0 )
f 0 (ξx )
f (x)
=
= 0
.
g(x)
g(x) − g(x0 )
g (ξx )
Da mit x → x0 auch ξx → x0 gilt, folgt aus der Existenz des rechts stehenden Limes auch
die Existenz des links stehenden Limes und die gewünschte Gleichheit.
Die Regel von Bernoulli–de l’Hospital ist sehr leistungsstark. Wir demonstrieren sie
an einigen Beispielen. Manchmal ist es dabei sinnvoll, die Regel wiederholt anzuwenden.
Überdies kann die Regel auch auf einseitige Grenzwerte und durch die Transformation
x → 1/x auch auf Grenzwerte mit x → ∞ übertragen werden.
a)
b)
c)
x
lim sin
x
=
lim cos x2− 1
x
=
2
lim xx
x→∞ e
=
x→0
x→0
x
lim cos
1
=
sin x
lim − 2x
=
lim 2x
ex
=
x→0
x→0
x→∞
1.
x
lim − cos
2
= − 21 .
lim 2x
e
=
x→0
x→∞
0.
Aufgaben zu Abschnitt 7.3
1. Zeigen Sie: Gilt f 0 (x) ≥ 0 auf einem Intervall (a, b), so ist f auf diesem Intervall
monoton wachsend.
2. Man beweise: Ist eine Funktion f auf [0, 1] stetig und auf (0, 1) differenzierbar, gilt
ferner f (0) = 0 und gibt es eine Konstante K ≥ 0 mit
|f 0 (x)| ≤ K|f (x)| für alle x ∈ (0, 1),
so ist f auf dem Intervall [0, 1] identisch Null.
98
7 DIFFERENTIALRECHNUNG
3. Man berechne die Limites
a)
7.4
lim ln x , b)
x→∞ x
√
lim x ln x, c)
lim
x→1
x&0
1 − x2
, d)
2x
1
1
−
.
x→0 sin x
x + x2
lim
Der Satz von Taylor
Wir stellen uns die Aufgabe, eine gegebene Funktion f in einer geeigneten Umgebung
U (x0 ) eines Punktes x0 durch Polynome Pn zu approximieren. Die Polynome sind dabei
zweckmäßiger Weise in folgender Form gegeben:
Pn (x) =
n
X
ak (x − x0 )k
k=0
Wir suchen also eine Zerlegung
f (x) = Pn (x) + Rn+1 (x0 , x)
mit einer Fehlerfunktion Rn+1 = Rn+1 (x0 , x), die für x → x0 möglichst schnell“ gegen
”
Null streben sollte. Diese Situation ist auf jeden Fall für solche Funktionen
f (x) =
∞
X
ak (x − x0 )k
k=0
gegeben, die durch Potenzreihen erzeugt werden, wenn man für die Polynome Pn einfach
die Partialsummen
n
X
ak (x − x0 )k
Pn (x) =
k=0
wählt. Wir stellen nun die Frage, wie die Koeffizienten ak durch die Funktion f ausgedrückt werden können.
Satz 7.27 Gilt f (x) =
∞
P
ak (x − x0 )k in U (x0 ), so ist ak =
k=0
ak =
f (k) (x0 )
,
k!
f (k) (x0 )
, k ∈ N.
k!
k ∈ N.
Beweis. Potenzreihen können gliedweise differenziert werden. Daher ist
f
(n)
(x) =
∞
X
k=n
ak
k!
(x − x0 )k−n ,
(k − n)!
und hieraus folgt f (n) (x0 ) = an · n!. Das ergibt die Behauptung.
Satz 7.28 (Identitätssatz für Potenzreihen, Prinzip des Koeffizientenvergleichs)
∞
∞
X
X
Aus
ak (x − x0 )k =
bk (x − x0 )k für alle x ∈ U (x0 ) folgt ak = bk für alle k ∈ N.
k=0
k=0
7.4 Der Satz von Taylor
99
Beweis. Definiert man eine Funktion f durch die obigen wertverlaufsgleichen Potenzreif (k) (x0 )
= bk .
hen, so folgt aus Satz 7.27 die Gleichung ak =
k!
Die soeben gefundenen Einsichten legen die folgenden Begriffsbildungen nahe:
Definition 7.29 (Taylorformel) Es sei f eine beliebige Funktion, die in einer Umgebung U (x0 ) n-mal differenzierbar ist.
Unter den Taylor-Koeffizienten von f bei x0 versteht man die Zahlen
ak =
f (k) (x0 )
für 0 ≤ k ≤ n.
k!
Unter dem Taylor-Polynom zu f vom Grad n an der Stelle x0 versteht man das Polynom
n
X
f (k) (x0 )
f 0 (x0 )
f (n) (x0 )
(x − x0 )k = f (x0 ) +
(x − x0 ) + . . . +
(x − x0 )n .
Pn (x) =
k!
1!
n!
k=0
Unter dem Restglied der Ordnung n + 1 versteht man den Ausdruck
Rn+1 (x0 , x) = f (x) − Pn (x).
Unter der Taylorformel versteht man schließlich die Formel
n
X
f (k) (x0 )
f (x) = Pn (x) + Rn+1 (x0 , x) =
(x − x0 )k + Rn+1 (x0 , x),
k!
k=0
Das Hauptproblem besteht nun in einer Fehlerabschätzung für das Restglied Rn+1 , denn
erst dann ist die Taylorformel zur Approximation zu gebrauchen. Dies ist der Inhalt des
folgenden Satzes:
Satz 7.30 (Satz von Taylor) Die Funktion f sei in U (x0 ) (n + 1)–mal stetig differenzierbar. Dann lässt sich das Restglied Rn+1 (x0 , x) für jedes x ∈ U (x0 ) wie folgt durch die
(n + 1)–te Ableitung von f ausdrücken:
Rn+1 (x0 , x) =
f (n+1) (x0 + ϑL (x − x0 ))
(x − x0 )n+1 für ein 0 < ϑL < 1
(n + 1)!
(Restglied nach Lagrange),
bzw.
Rn+1 (x0 , x) =
f (n+1) (x0 + ϑC (x − x0 ))
(x − x0 )n+1 (1 − ϑC )n für ein 0 < ϑC < 1
n!
(Restglied nach Cauchy).
100
7 DIFFERENTIALRECHNUNG
Beweis. Es sei 1 ≤ k ≤ n + 1. Es sei x ∈ U (x0 ) mit x > x0 fixiert. Wir wollen den
Quotienten Rn+1 (x0 , x)/(x − x0 )k untersuchen und definieren hierzu für t ∈ [x0 , x] die
Funktionen
n
X
f (k) (t)
(x − t)k
F (t) = Rn+1 (t, x) = f (x) −
k!
k=0
und
Gk (t) = (x − t)k .
Für die Randpunkte t = x0 bzw. t = x folgt dann
F (x0 )
Gk (x0 )
= Rn+1 (x0 , x) ,
= (x − x0 )k
,
F (x)
Gk (x)
= 0,
= 0.
Zur Anwendung des verallgemeinerten Mittelwertsatzes berechnen wir vorbereitend die
Ableitungen von F und G nach t. Es sind
F 0 (t) = −
n
n
X
X
f (k+1) (t)
f (k) (t)
f (n+1) (t)
(x − t)k +
(x − t)k−1 = −
(x − t)n ,
k!
(k
−
1)!
n!
k=0
k=1
G0k (t) = −k(x − t)k−1 .
Nach dem verallgemeinerten Mittelwertsatz gibt es dann eine Zahl ξk ∈ (x0 , x) mit
F (x0 ) − F (x)
F 0 (ξk )
f (n+1) (ξk )(x − ξk )n
f (n+1) (ξk )
Rn+1 (x0 , x)
=
=
=
=
(x − ξk )n+1−k .
(x − x0 )k
G(x0 ) − G(x)
G0 (ξk )
k · n!(x − ξk )k−1
k · n!
Setzt man
ϑk =
ξk − x0
,
x − x0
so ist ξk = x0 + ϑk (x − x0 ) und x − ξk = (x − x0 )(1 − ϑk ). Die Auflösung obiger Formel
nach Rn+1 ergibt
Rn+1 (x0 , x) =
=
f (n+1) (ξk )
· (x − x0 )k · (x − ξk )n+1−k
k · n!
f (n+1) (x0 + ϑk (x − x0 ))
(x − x0 )n+1 (1 − ϑk )n+1−k .
k · n!
Für k = n + 1 folgt hieraus die Lagrange–Darstellung, für k = 1 die Cauchy–Darstellung
für das Restglied Rn+1 .
Für den häufig auftretenden Spezialfall x0 = 0 ergibt der Satz von Taylor die Darstellung
f (x) =
n
X
f (k) (0) k f (n+1) (ϑ x) n+1
x +
x ,
k!
(n
+
1)!
k=0
die man auch als MacLaurin-Formel bezeichnet.
7.4 Der Satz von Taylor
101
Beispiel 7.31 Wir betrachten das Beispiel f (x) = (1 + x)α für x > −1 und α > 0. Für
α = n ∈ N ergibt sich aus der binomischen Formel die Darstellung
n
f (x) = (1 + x) =
n X
n
k=0
k
xk .
Für α 6∈ N ist eine Verallgemeinerung dieser Formel zu erwarten. Wir berechnen die
Taylorkoeffizienten an der Stelle x0 = 0:
f (x) = (1 + x)α
f 0 (x) = α(1 + x)α−1
..
.
(k)
f (x) = α · (α − 1) · . . . · (α − k + 1) (1 + x)α−k .
Somit ist
f (k) (0)
α · . . . · (α − k + 1)
ak =
=
=
k!
k!
α
.
k
Mit Cauchys Darstellung des Restgliedes folgt
n X
α k
α
(1 + x) =
x +
(1 + ϑ x)α−n−1 (n + 1)xn+1 (1 − ϑ)n .
k
n
+
1
k=0
α
Für α =
1
2
und n = 1 ergibt sich die einfache Näherungsformel
√
1+x≈1+
1
x.
2
Die Fehlerfunktion
1
R2 (0, x) =
kann für |x| <
1
2
2
2
(1 + ϑ x)−3/2 · 2 · x2 (1 − ϑ)
dann durch
|R2 (0, x)| ≤
1
· 23/2 · 2 · x2 ≤ x2
4·2
abgeschätzt werden. Also ist
√
1 + x − 1 + 1 x ≤ |x|2 für |x| < 1 .
2
2
Beispielsweise ist
p
1, 1 = 1, 05 ± 0, 01.
Dieses Verfahren ist auf zahlreiche weitere Funktionen anwendbar. Dabei ergibt sich die
Tabelle:
102
7 DIFFERENTIALRECHNUNG
Funktion Näherung Fehlerordnung
1
1+x
1−x
|x|2
sin x
x
|x|3
cos x
1
|x|2
sin x
x−
x3
6
|x|5
cos x
1−
x2
2
|x|4
x−1
|x|2
ln(1 + x)
Aufgaben zu Abschnitt 7.4
1. Geben Sie die Taylorformel für die Funktion f (x) = sin(x) bei Entwicklung an der
Stelle x0 = 0 bis zur Ordnung 2k + 1 an.
2. Geben Sie die Taylorformel für die Funktion f (x) = ln(1 + x) bei Entwicklung an
der Stelle x0 = 0 bis zur Ordnung k an.
7.5
Taylorreihen und analytische Funktionen
Wir untersuchen in diesem Abschnitt die Darstellung von Funktionen als Potenzreihen.
Definition 7.32 (Analytische Funktionen) Eine Funktion f heißt analytisch im
Punkt x0 ∈ D(f ), wenn es eine Umgebung U (x0 ) von x0 und eine auf U (x0 ) konvergente Potenzreihe so gibt, dass
f (x) =
∞
X
ak (x − x0 )k für alle x ∈ U (x0 )
k=0
gilt.
Ist f in einer Umgebung U (x0 ) beliebig (= unendlich) oft differenzierbar, so kann man
die Taylorreihe zu f
∞
X
f (k) (x0 )
T (x) =
(x − x0 )k
k!
k=0
bilden. Dabei ist weder die Konvergenz der Reihe noch die Wertverlaufsgleichheit zu f (x)
für Punkte x 6= x0 ohne zusätzliche Voraussetzungen gesichert. Ein Gegenbeispiel ist in
Aufgabe 4 angegeben.
7.5 Taylorreihen und analytische Funktionen
103
Satz 7.33 (Hauptsatz über analytische Funktionen) Folgende Bedingungen sind
äquivalent:
(a) f ist analytisch bei x0 ∈ D(f ).
(b) Es existiert eine Umgebung U (x0 ), auf der f mit seiner Taylorreihe übereinstimmt.
(c) Es existiert eine Umgebung U (x0 ) von x0 , in der f beliebig oft differenzierbar ist
und auf der
lim Rn (x0 , x) = 0 für alle x ∈ U (x0 )
n→∞
gilt. Dabei bezeichnet Rn (x0 , x) das Restglied der Ordnung n bei der Entwicklung
von f bei x0 .
(d) Es existiert eine Umgebung U (x0 ) von x0 und eine Zahl K > 0 so, dass f auf U (x0 )
beliebig oft differenzierbar ist und die folgende Abschätzung erfüllt
|f (k) | ≤ k! · K k für alle x ∈ U (x0 ) und alle k ∈ N.
Beweis. Wegen Satz 7.28 und Definition 7.29 sind die Beziehungen (a), (b) und (c) äquivalent. Es gelte nun (a), es sei also
f (x) =
∞
X
ak (x − x0 )k für x ∈ U (x0 ).
k=0
Der Konvergenzradius der Reihe sei R > 0. Dann ist sicherlich
p
1
lim sup k |ak | =
< ∞.
R
Daher existiert eine Zahl K0 < ∞ mit
|ak | ≤ K0k
Weiter ist
f
(n)
(x) =
∞
X
für alle
k ∈ N.
k(k − 1) · . . . · (k − n + 1)ak (x − x0 )k−n .
k=n
Wir wählen nun eine Zahl 0 < r < R mit q = r K0 < 1. Für |x − x0 | < r folgt dann
|f
(n)
(x)| ≤
∞
X
k · . . . · (k − n + 1) ·
K0k
k−n
·r
n
=
K0n
k=n
=
K0n
k · . . . · (k − n + 1) q k−n
k=n
n
= K0n
∞
X
d
d qn
∞
X
k=0
!
qk
= K0n
d
d qn
1
1−q
n!
K0n
·
≤ n!
= n! K n mit K = K0 /(1 − q)2 .
n+1
2n
(1 − q)
(1 − q)
Das beweist (d). Umgekehrt ergibt die Bedingung (d) die folgende Abschätzung für das
Restglied
(n)
f (x0 + ϑ(x − x0 ))
n
(x − x0 ) ≤ K n · |x − x0 |n = (K|x − x0 |)n → 0
Rn (x0 , x) = n!
für |x − x0 | <
1
.
K
Also gilt (c).
104
7 DIFFERENTIALRECHNUNG
Beispiel 7.34 Wir betrachten einige Beispiele und werden dabei Reihendarstellungen
für wichtige klassische Funktionen erhalten. Bereits bekannt sind die folgenden Reihendarstellungen, die wegen Satz 7.28 die einzig möglichen Darstellungen sind. Insbesondere
stimmen die Koeffizienten in diesen Reihen mit den Taylorkoeffizienten überein.
∞
P
xk
,
x∈R.
(4.1) ex
=
k!
(4.2)
(4.3)
sin x
cos x
=
=
k=0
∞
P
k=0
∞
P
(−1)k
x2k+1
,
(2k+1)!
x ∈ R.
(−1)k
x2k
,
(2k)!
x ∈ R.
k=0
Wir erhalten aber auch die folgenden bisher nicht bekannten Darstellungen:
∞
k
P
α
(4.4) (1 + x)α =
x ,
−1 < x < 1, α ∈ R (Binomialreihe)
k
(4.5)
(4.6)
ln(1 + x)
arctan x
=
=
k=0
∞
P
k=1
∞
P
k=0
(−1)k−1
k
xk ,
(−1)k x2k+1
,
2k+1
−1 < x ≤ 1
−1 < x ≤ 1.
Beweis zu (4.4): Wir benutzen die in Beispiel 7.31 hergeleitete Restgliedformel
α
Rn+1 (0, x) =
(n + 1)xn+1 · (1 + ϑ x)α−n−1 (1 − ϑ)n .
n+1
α
Wir setzen an+1 = n+1
(n + 1) und bn+1 = (1 + ϑ x)α−n−1 (1 − ϑ)n . Dann ist
1 − ϑ n
|1 + ϑ x|α−1 ≤ |1 + ϑ x|α−1
|bn+1 | = 1 + ϑ x
für alle x ∈ (−1, 1). Daher ist die Folge (bn ) beschränkt. Um an+1 xn+1 →
→∞
P 0 für nn+1
und alle |x| < 1 zu zeigen, weisen wir sogar die Konvergenz der Reihe
an+1 x
für
|x| < 1 nach. Dazu berechnen wir den Konvergenzradius. Es ist
α(α − 1) · . . . · (α − n) · n! · (n + 1) α − n an+1 an = (n + 1)!α(α − 1) · . . . · (α − n + 1) · n = n → 1.
Also ist der Konvergenzradius 1. Hieraus folgt an+1 xn+1 → 0 für |x| < 1, und damit ist
Rn+1 (0, x) → 0 bewiesen.
Beweis zu (4.5): Eine Möglichkeit würde ähnlich wie bei (4.4) in der Untersuchung des
Restgliedes bestehen. Wir gehen aber auf eine andere Weise vor. Dazu betrachten wir die
beiden Funktionen
∞
X
(−1)k−1 k
f (x) = ln(1 + x) und g(x) =
x .
k
k=1
Der Konvergenzradius der Reihe ist offensichtlich R = 1. Daher gilt
!0
∞
∞
k−1
X
X
(−1)
1
g 0 (x) =
xk =
(−1)k xk =
k
1+x
k=1
k=0
7.5 Taylorreihen und analytische Funktionen
105
1
für alle −1 < x < 1. Andererseits ist f 0 (x) = 1+x
. Das zeigt f 0 (x) = g 0 (x) auf (−1, 1).
Wegen Satz 7.24 ist dann f (x) = g(x)+ const auf (−1, 1). Für x = 0 ergibt sich 0 =
ln 1 = f (0) = g(0) + const = 0 + const, also ist const = 0. Das zeigt f = g auf (−1, 1).
Beweis zu (4.6): Wir gehen wie in (4.5) vor. Es gilt
∞
X
1
(arctan x) =
=
(−1)k x2k =
2
1+x
k=0
0
∞
X
(−1)k x2k+1
2k + 1
k=0
!0
für alle x mit |x| < 1. Daraus folgt
arctan x =
∞
X
(−1)k x2k+1
+ c,
2k
+
1
k=0
und für x = 0 ergibt sich c = 0.
P
Satz 7.35 (Abelscher Grenzwertsatz) Ist f (x) =
ak xk konvergent auf (−R, R)
∞
X
P
und konvergiert auch noch
ak Rk , so gilt lim f (x) =
ak R k .
x%R
k=0
Wir verzichten auf den Beweis dieses Satzes, wollen ihn aber auf die Reihen (4.5) und
(4.6) anwenden. (Einen vollständigen Beweis findet der Leser in Mangoldt–Knopp,
Höhere Mathematik Bd. 2 oder in Heuser, Lehrbuch der Analysis, Bd. 1.) Für x = 1
ist auf beide Reihen das Leibnizkriterium anwendbar, womit die Konvergenz gegeben ist.
Hieraus folgen die interessanten Formeln
ln 2 =
und
∞
∞
X
1 1 1
(−1)k−1 X (−1)k
=
=1− + − + −
k
k+1
2 3 4
k=0
k=1
∞
π X (−1)k
1 1 1
=
= 1 − + − + −...,
4
2k + 1
3 5 7
k=0
denn es ist arctan 1 = π4 , was man wie folgt sieht: Aus cos x = − sin(x − π2 ) folgt
π/4
cos π/4 = sin(π/4) und somit ist tan π4 = cos
= 1. Damit haben wir erstmals eine
sin π/4
Reihendarstellung für π erhalten:
∞
X
(−1)k
1 1
π=4
= 4 1 − + − +... .
2k
+
1
3 5
k=0
Leider konvergiert die Reihe aber sehr langsam, nach dem Leibnizkriterium hat man ja nur
4
|π − sn | ≤ 2n+1
. Die praktische Berechnung von π kann wie folgt erfolgen. Grundlage
ist das Additionstheorem
tan x + tan y
tan(x + y) =
.
1 − tan x tan y
106
7 DIFFERENTIALRECHNUNG
5
120
Mit α = arctan 15 folgen tan α = 15 , tan 2α = 12
und tan 4α = 119
. Mit β = 4α −
dann
120
−1
tan 4α − tan π4
1
119
tan β =
=
.
π
120 =
1 + tan 4α tan 4
239
1 + 119
π
4
folgt
Somit ist (mit n = 8)
π
1
1
= 4α − β = 4 arctan − arctan
= 4 · 0.197395 − 0.004184 ± 10−6 = 0.785396 ± 10−6 .
4
5
239
π = 3.14159 ± 10−5
Das zeigt schließlich
Aufgaben zu Abschnitt 7.5
1. Man finde Reihendarstellungen für die sogenannten hyperbolischen Funktionen
sinh x =
ex − e−x
,
2
cosh x =
ex + e−x
2
bei Entwicklung um 0.
2. Man finde die Reihendarstellung für die folgende Funktion zum Entwicklungspunkt
x0 = 0:
sin x
für x 6= 0, f (0) = 1.
f (x) =
x
3. Man finde die Reihendarstellung für die folgende Funktion zum Entwicklungspunkt
x0 = 0:
1+x
.
f (x) = ln
1−x
4. Man zeige durch vollständige Induktion, dass die Funktion
f (x) =
e−1/x
0
2
für x 6= 0
für x = 0
beliebig oft differenzierbar ist und dass f (k) (0) = 0 für alle k ∈ N gilt. Insbesondere
ist f bei x0 = 0 beliebig oft differenzierbar aber dort nicht analytisch.
7.6
Kurvendiskussionen
Die Differentialrechnung ist ein unverzichtbares Hilfsmittel für die Diskussion von Funktionsgraphen. Wir stellen hier die wichtigsten Ergebnisse zusammen.
Satz 7.36 Gilt f 0 (x) ≥ 0 für alle x ∈ (a, b), so ist f auf (a, b) monoton wachsend. Gilt
sogar f 0 (x) > 0 auf (a, b), so ist f auf (a, b) streng monoton wachsend.
7.6 Kurvendiskussionen
107
Beweis. Angenommen, f wäre nicht (streng) monoton wachsend auf (a, b). Dann würde
es Zahlen x1 , x2 ∈ (a, b) mit x1 < x2 und f (x1 ) > f (x2 ) bzw. f (x1 ) ≥ f (x2 ) geben. Nach
dem Mittelwertsatz existierte dann aber eine Zahl ξ ∈ (x1 , x2 ) mit
f( ξ) =
f (x2 ) − f (x1 )
< 0 bzw.
x2 − x1
≤0
im Widerspruch zur vorausgesetzten Positivität der ersten Ableitung.
Definition 7.37 Es sei f eine Funktion aus R in R, und es sei x0 ∈ D(f ).
(a) f hat bei x0 ein (absolutes) Maximum, wenn f (x0 ) ≥ f (x) für alle x ∈ D(f ) gilt.
(b) f hat bei x0 ein lokales Maximum bzw. ein eigentliches lokales Maximum, wenn
eine δ–Umgebung Uδ (x0 ) so existiert, dass f (x0 ) ≥ f (x) bzw. f (x0 ) > f (x) für alle
x ∈ D(f ) ∩ Uδ0 (x0 ) gilt.
Entsprechend werden die Begriffe Minimum, lokales Minimum und und eigentliches lokales
Minimum definiert. Oberbegriffe sind Extremwert und lokaler Extremwert. Die Differentialrechnung ist ein leistungsfähiges Hilfsmittel zur Ermittlung lokaler Extremwerte.
Satz 7.38 (Notwendiges Kriterium) Ist die Funktion f bei x0 differenzierbar und hat
f bei x0 einen lokalen Extremwert, so gilt f 0 (x0 ) = 0.
Beweis. Ohne Beschränkung der Allgemeinheit habe f bei x0 ein lokales Maximum, es sei
also
f (x) ≤ f (x0 ) für alle x ∈ Uδ (x0 ).
f (x) − f (x0 )
x − x0
Dann ist
Daher ist 0 ≤ lim
x%x0
(
≥0
für x ≤ x0 ,
x ∈ Uδ (x0 )
≤0
für x ≥ x0 ,
x ∈ Uδ (x0 ).
f (x) − f (x0 )
f (x) − f (x0 )
= f 0 (x0 ) = lim
≤ 0, also f 0 (x0 ) = 0.
x&x0
x − x0
x − x0
Satz 7.39 (Erstes Hauptkriterium für Extremwerte) Die reelle Funktion f sei in
einer Umgebung U (x0 ) definiert und erfülle folgende Bedingungen:
(a) f ist differenzierbar in U (x0 ).
(b) f 0 (x0 ) = 0.
(c) Für alle x ∈ U (x0 ) gilt f 0 (x) < 0 im Fall x < x0 und f 0 (x) > 0 im Fall x > x0 (f 0
hat bei x0 einen Vorzeichenwechsel).
Dann hat f bei x0 ein eigentliches Minimum.
108
7 DIFFERENTIALRECHNUNG
Beweis. Es sei x ∈ U (x0 ). Durch Anwendung des Mittelwertsatzes ergibt sich aus (c) in
beiden Fällen x < x0 und x > x0 die Ungleichung
f (x) − f (x0 ) = (x − x0 )f 0 (ξ) > 0.
Also ist f (x0 ) < f (x) für alle x ∈ U (x0 ).
Als Beispiel betrachten wir die Funktion
f (x) =
x2 − 1
x2 + 1
mit f 0 (x) =
(x2
4x
.
+ 1)2
Dann ist f 0 (0) = 0, sowie f 0 (x) < 0 für x < 0 und f 0 (x) > 0 für x > 0. Folglich hat f (x)
bei x = 0 ein lokales Minimum.
Satz 7.40 (Zweites Hauptkriterium für Extremwerte) Die Funktion f sei (2m +
2)-mal stetig differenzierbar in U (x0 ). Ist f (k) (x0 ) = 0 für alle 1 ≤ k ≤ 2m + 1 und gilt
f (2m+2) (x0 ) > 0 bzw. f (2m+2) (x0 ) < 0, so hat f bei x0 ein eigentliches lokales Minimum
bzw. Maximum.
Beweis. In der Taylorformel ergibt sich durch das Verschwinden der Ableitungen bei Entwicklung bis zu einem Restglied der Ordnung 2m + 2 die Vereinfachung
f (x0 + h) − f (x0 ) =
f (2m+2) (x0 + ϑ h) 2m+2
h
, x0 + h ∈ U (x0 ).
(2m + 2)!
Ist f (2m+2) (x0 ) > 0, so gilt wegen der Stetigkeit von f (2m+2) auch f (2m+2) (x0 + ϑ h) > 0
für hinreichend kleine |h|. Wegen h2m+2 > 0 für positive und negative h folgt daraus
f (x0 + h) − f (x0 ) ≥ 0
für hinreichend kleine |h|. Daher hat f bei x0 ein Minimum. Entsprechend ergibt sich im
Falle f (2m+2) (x0 ) < 0 bei x0 ein Maximum.
Definition 7.41 (Wendepunkte) Die Funktion f sei bei x0 differenzierbar und es sei
t(x) = f (x0 ) + f 0 (x0 ) · (x − x0 ) die Gleichung der Tangente. Dann hat f bei x0 einen
eigentlichen Wendepunkt, wenn es ein δ > 0 mit
t(x) < f (x) für alle x ∈ (x0 − δ, x) und f (x) < t(x) für alle x ∈ (x0 , x0 + δ) oder
t(x) > f (x) für alle x ∈ (x0 − δ, x) und f (x) > t(x) für alle x ∈ (x0 , x0 + δ) gibt.
(Die Funktion wechselt bei x0 die durch die Tangente bestimmten Halbebenen.)
Satz 7.42 Die differenzierbare Funktion f hat genau dann einen Wendepunkt bei x0 ,
wenn es ein δ > 0 mit
f (x) − f (x0 )
> f 0 (x0 ) für alle x ∈ (x0 − δ, x0 + δ)
x − x0
oder
f (x) − f (x0 )
< f 0 (x0 ) für alle x ∈ (x0 − δ, x0 + δ)
x − x0
gibt. (Die Sekantenanstiege sind immer > oder immer < als der Tangentenanstieg.)
7.6 Kurvendiskussionen
Beweis. Gilt
109
f (x) − f (x0 )
> f 0 (x0 ) für alle x ∈ (x0 − δ, x0 + δ),
x − x0
so folgen
˙ − x0 ) = t(x) für x > x0
f (x) > f (x0 ) + f 0 (x0 )(x
und
˙ − x0 ) = t(x) für x < x0 .
f (x) < f (x0 ) + f 0 (x0 )(x
Somit hat f bei x0 einen Wendepunkt. Die Umkehrung ist ebenso leicht zu sehen.
Satz 7.43 (Hinreichende Bedingung für Wendepunkte) Es sei f (2m+3)-mal stetig differenzierbar in U (x0 ). Gilt dann f (k) (x0 ) = 0 für alle 2 ≤ k ≤ 2m + 2 und
f (2m+3) (x0 ) 6= 0, so hat f bei x0 einen Wendepunkt.
Beweis. Der Beweis ergibt sich ähnlich zu Satz 7.40 aus der Taylorformel.
Definition 7.44 Eine Funktion f heißt konvex auf dem Intervall (a, b), falls für alle
a < a1 < ξ < b1 < b die Ungleichung
f (ξ) <
f (b1 ) − f (a1 )
(ξ − a1 ) + f (a1 )
b 1 − a1
gilt. Geometrisch bedeutet diese Ungleichung, dass die Sekantenabschnitte oberhalb des
Funktionsgraphen liegen.
Satz 7.45 Ist f 00 (x) > 0 für alle x ∈ (a, b), so ist f auf (a, b) konvex.
Beweis. Wegen f 00 > 0 ist f 0 monoton wachsend. Der Mittelwertsatz ergibt daher
f (ξ) − f (a1 )
f (b1 ) − f (ξ)
= f 0 (τ1 ) < f 0 (τ2 ) =
mit a1 < τ1 < ξ < τ2 < b1 .
ξ − a1
b1 − ξ
Durch Umstellen folgt
(f (ξ) − f (a1 ))(b1 − ξ) < (f (b1 ) − f (ξ))(ξ − a1 ),
f (ξ)(b1 − a1 ) < f (a1 )(b1 − ξ) + f (b1 )(ξ − a1 )
= f (a1 )(b1 − a1 ) + (f (b1 ) − f (a1 ))(ξ − a1 ).
Hieraus ergibt sich die geforderte Ungleichung.
Geometrisch beinhaltet die zweite Ableitung nach Satz 7.45 also eine Aussage über die
Konvexität bzw. die Krümmung“ des Graphen. Das lässt sich durch die Betrach”
tung von Krümmungskreisen präzisieren: Zu vorgegebener Funktion f und gegebenem
Punkt P0 = (x0 , f (x0 )) auf dem Graphen ist eine Kreislinie y = k(x) durch diesen Punkt
mit f (x0 ) = k(x0 ), f 0 (x0 ) = k 0 (x0 ) und f 00 (x0 ) = k 00 (x0 ) gesucht. Wieviele solcher Kreise
gibt es und wie errechnen sich deren Mittelpunkt und Radius? Wir behandeln das Problem
110
7 DIFFERENTIALRECHNUNG
Abbildung 21: Krümmungskreis
für den Spezialfall f 0 (x0 ) = 0. Die allgemeine Kreisgleichung
(x − a)2 + (y − b)2 = r2
wird implizit zweimal nach x differenziert. Das ergibt
2(x − a) + 2(y − b)y 0 = 0,
2 + 2y 0 y 0 + 2(y − b)y 00 = 0.
Die Forderungen y(x0 ) = f (x0 ) = y0 , y 0 (x0 ) = f 0 (x0 ) = 0, y 00 (x0 ) = f 00 (x0 ) führen dann
auf
1
1
und r = |y0 − b| = 00
.
x0 − a = 0, y0 − b = − 00
y (x0 )
|y (x0 )|
Damit haben wir bewiesen:
Satz 7.46 Für f 0 (x0 ) = 0 ist der Radius des Krümmungskreises der Kehrwert des Betrages der 2. Ableitung.
Aufgaben zu 7.6
1. Führen Sie eine Kurvendiskussion für die Funktion f (x) =
x
durch!
1 + x2
2. Beweisen Sie mittels Kurvendiskussion die Ungleichung
ab ≤
ap b q
1 1
+
für a, b ≥ 0 und 1 < p, q < ∞ mit + = 1.
p
q
p q
3. Zeigen Sie: Die Funktion f ist genau dann konvex auf dem Intervall I, wenn
f (αx + βy) ≤ αf (x) + βf (y) für alle x, y ∈ I und α, β ≥ 0 mit α + β = 1.
4. Beweisen Sie die allgemeine Formel r =
(1 + y002 )3/2
für den Krümmungsradius.
y000
5. Ein parabolischer Hohlspiegel mit Brennweite f soll durch eine Kugelfläche ersetzt
werden. Welcher Kugelradius ist zu wählen? (Hinweis: Zur Bestimmung der Gleichung y = ax2 unter Vorgabe der Brennweite f lassen Sie einen Lichtstrahl parallel
zur y-Achse auf einen Kurvenpunkt zum Anstieg 1 auftreffen.)
7.7 Partielle Ableitungen und Gradient
7.7
111
Partielle Ableitungen und Gradient
In diesem Abschnitt dehnen wir die Differentialrechnung auf reelle Funktionen mit mehreren reellen Variablen aus. Da wir auf solche Funktionen bisher nicht eingegangen sind,
beginnen wir mit einigen Bemerkungen zur Definition und graphischen Darstellung.
Definition 7.47 Eine Funktion f : G → R mit G ⊆ Rn heißt eine reellwertige Funktion
mit n-Variablen. Den Funktionswert von f zum Argument x = (x1 , . . . , xn ) bezeichnen
wir durch
z = f (x) = f (x1 , . . . , xn ).
Für n = 2 benutzen wir jedoch meistens die Symbolik z = f (x, y) mit x = (x, y).
Als Beispiel betrachten wir die auf R2 definierte Funktion
z = f (x, y) = y 2 − x2 .
Der Graph
Graph (f ) = {(x, y, z) : (x, y) ∈ D(f ), z = f (x, y)}
dieser Funktion ist dann eine Teilmenge von R3 und kann als Fläche im R3 dargestellt
werden. Eine alternative Möglichkeit für die graphische Darstellung ist die Verwendung
von Höhenlinienbildern, auch Isohypsen genannt (s. Abb. 22).
Abbildung 22: 3D-Darstellung und Höhenlinienbild von z = f (x, y) = y 2 − x2
Eine Möglichkeit der Untersuchung von Funktionen in mehreren Variablen besteht darin,
durch Fixieren von (n − 1) Variablen die Funktion auf eine Schar von Funktionen in einer
Variablen zurückzuführen. Wendet man diese Methode zur Definition von Ableitungen
an, so führt das auf den Begriff der partiellen Ableitung. In den folgenden Definitionen
und Sätzen werden wir uns meistens auf den Fall von n = 2 Variablen beschränken, die
Verallgemeinerung auf mehr Variablen wird offensichtlich sein.
Definition 7.48 (Partielle Ableitungen) Es sei f eine Abbildung aus R2 in R und es
sei x0 = (x0 , y0 ) ein innerer Punkt von D(f ). Dann heißt der Grenzwert
∂f
f (x0 + h, y0 ) − f (x0 , y0 )
(x0 , y0 ) = lim
h→0
∂x
h
112
7 DIFFERENTIALRECHNUNG
im Fall der Existenz die partielle Ableitung von f nach x im Punkt (x0 , y0 ). Entsprechend wird die partielle Ableitung von f nach y definiert. Zur Bezeichnung der partiellen
Ableitungen ist auch die folgende Symbolik üblich:
∂f
∂f
= ∂1 f = fx bzw.
= ∂2 f = fy .
∂x
∂y
Geometrisch bedeutet die partielle Ableitung nach x den Anstieg der Schnittkurve der
Fläche Graph(f ) mit der Ebene y = y0 parallel zur x-z-Ebene (Abb. 23). Entsprechend
wird die partielle Ableitung von f nach der zweiten Variablen y als Grenzwert des entsprechenden Differenzenquotienten definiert. Für Funktionen mit mehr als zwei Variablen
geht man analog vor.
Abbildung 23: Partielle Ableitungen
Beispiel 7.49 Es sei f (x, y) = x3 − 3x sin y + y 2 + 4. Dann sind
∂f
∂f
= fx (x, y) = 3x2 − 3 sin y und
= fy (x, y) = −3x cos y + 2y.
∂x
∂y
Definition 7.50 (Gradient) Besitzt die Funktion z = f (x, y) im Punkt x = (x, y) partielle Ableitungen nach allen Variablen, so heißt der Vektor
grad f (x) = ∇ f (x) = (fx (x, y), fy (x, y))
der Gradient von f bei x. Das Symbol ∇ wird als Nabla“ gelesen.
”
Für das Beispiel 7.49 ergibt sich
∇ f (x, y) = (3x2 − 3 sin y,
− 3x cos +2y).
Wir wollen jetzt die Weierstraßsche Zerlegungsformel auf den Fall von Funktionen mit
mehreren Variablen verallgemeinern. Die Rolle der Tangente wird nun durch die Tangentialebene übernommen. Wir reaktivieren dazu notwendige Kenntnisse aus der linearen
Algebra. Es sei h = (h, k) ∈ R2 ein beliebiger Vektor und es sei ∇ f = (fx , fy ) der
Gradient von f bei x = (x, y). Dann lässt sich das folgende Skalarprodukt bilden:
∇ f · h = (fx , fy ) · (h, k) = h fx + k fy .
Mit dieser Bezeichnung gilt der folgende Satz:
7.7 Partielle Ableitungen und Gradient
113
Satz 7.51 (Weierstraßsche Zerlegungsformel) Es sei x0 = (x0 , y0 ) ein innerer
Punkt von D(f ). In einer gewissen Umgebung Uε (x0 ) = {x ∈ R2 : |x − x0 | < ε} von x0
möge fx existieren und stetig sein, während fy wenigstens im Punkt x0 existiere. Dann
besitzt f in Uε (x0 ) eine Zerlegung der Form
f (x) = f (x0 ) + ∇ f (x0 ) · (x − x0 ) + ρ(x0 , x) · (x − x0 ) mit ρ(x0 , x) → 0 für x → x0 .
Die Funktion ρ(x0 , x) = (ρ1 (x0 , x), ρ2 (x0 , x)) ist dabei wieder die Fehlerfunktion.
Beweis. Wir setzen x = (x, y). Dann ergibt sich unter Anwendung des Mittelwertsatzes
für x, der Weierstraßschen Zerlegungsformel für y und der Stetigkeit von fx die Gleichung
f (x) − f (x0 ) =
=
=
=
=
f (x, y) − f (x0 , y) + f (x0 , y) − f (x0 , y0 )
(x − x0 )fx (ξ, y) + (y − y0 )(fy (x0 , y0 ) + ρ2 (x0 , x))
∇ f (x0 ) · (x − x0 ) + (x − x0 )(fx (ξ, y) − fx (x0 )) + (y − y0 ) · ρ2 (x0 , x)
∇ f (x0 ) · (x − x0 ) + (x − x0 ) · ρ1 (x0 , x) + (y − y0 ) · ρ2 (x0 , x)
∇ f (x0 ) · (x − x0 ) + ρ(x0 , x) · (x − x0 ).
mit ρ(x0 , x) → 0 für x → x0 wegen der vorausgesetzten Stetigkeit von fx .
Abbildung 24: Weierstraßsche Zerlegungsformel und Tangentialebene mit Normalenvektor
Bemerkung 7.52 .
a) Der lineare Teil
z = f (x0 ) + ∇ f (x0 ) · (x − x0 ) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 )
kann als Gleichung der Tangentialebene der durch z = f (x, y) gegebenen Fläche im Punkt
(x0 , y0 , f (x0 , y0 )) interpretiert werden. Die Weierstraßsche Zerlegungsformel bedeutet für
n = 2 also die näherungsweise Ersetzung der Fläche durch ihre Tangentialebene in einer
Umgebung des Punktes (x0 , y0 ).
xy
für (x, y) 6= (0, 0),
x2 +y 2
b) Die Funktion f (x, y) =
0
sonst
ist ein Beispiel dafür, dass die Voraussetzungen im Satz zur Weierstraßschen Zerlegungsformel nicht ohne weiteres verzichtbar sind (s. Abb. 25). Diese Funktion hat bei 0 = (0, 0)
partielle Ableitungen fx (0) = 0 und fy (0) = 0, sie ist aber bei 0 nicht einmal stetig,
geschweige denn linearisierbar.
114
7 DIFFERENTIALRECHNUNG
Abbildung 25: Gegenbeispiel zur Weierstraßschen Zerlegungsformel
Definition 7.53 (Glatte Kurven) Es sei I ein offenes reelles Intervall. Eine koordinatenweise differenzierbare Funktion
x = x(t) = (x1 (t), . . . , xn (t)) : I → Rn
heißt eine glatte Kurve in Rn , wenn x0 (t) = (x01 (t), . . . , x0n (t)) 6= 0 für alle t ∈ I ist.
Beispielsweise ist die Funktion
x(t) = (sin t, cos t),
0 < t < 2π
eine glatte Kurve. Diese Funktion beschreibt die Kreislinie. Die Gerade
x(t) = x0 + t a,
t∈R
mit 0 6= a ∈ Rn ist ebenfalls eine glatte Kurve.
Satz 7.54 Ist x = x(t) eine glatte Kurve, so existiert eine Zerlegung
x(t) = x(t0 ) + x0 (t0 ) · (t − t0 ) + ρ(t0 , t) · (t − t0 )
mit lim ρ(t0 , h) = 0. Die Gerade y(t) = x(t0 ) + x0 (t0 ) · (t − t0 ) heißt die Tangente an die
h→0
Kurve im Punkt x(t0 ).
Beweis. Es genügt, die Weierstraßsche Zerlegungsformel auf jede Koordinate von x separat
anzuwenden.
Satz 7.55 (Verallgemeinerte Kettenregel/Ableitung längs Kurven) Es sei f in
einer Umgebung von x0 = (x0 , y0 ) stetig partiell differenzierbar und es sei x(t) =
(x(t), y(t)) eine glatte Kurve mit x(t0 ) = x0 . Dann ist die zusammengesetzte Funktion
F (t) = f (x(t), y(t))
bei t0 differenzierbar, und es gilt
dF
∂f dx ∂f dy
(t0 ) = ∇ f (x0 ) · x0 (t0 ) =
·
+
· .
dt
∂x dt
∂y dt
Der formale Ausdruck dF = fx dx + fy dy =
Differential von F .
∂f
∂f
dx +
dy heißt auch das totale
∂x
∂y
7.7 Partielle Ableitungen und Gradient
115
Beweis. Mit der Abkürzung x = x(t) ergibt die Weierstraßsche Zerlegungsformel
F (t) − F (t0 ) = f (x(t)) − f (x0 ) = ∇ f (x0 ) · (x − x0 ) + ρ(x, x0 ) · (x − x0 ),
und die Division durch t − t0 liefert
x − x0
x − x0
F (t) − F (t0 )
= ∇ f (x0 ) ·
+ ρ(x, x0 ) ·
→ ∇ f (x0 ) · x0 (t0 ) + 0.
t − t0
t − t0
t − t0
Satz 7.56 (Differentiation implizit gegebener Funktionen) Es sei y = f (x) differenzierbar in x0 und es sei F (x, y(x)) = 0 für alle x ∈ U (x0 ). Ist F stetig partiell
differenzierbar in einer Umgebung V von (x0 , y0 ) und gilt Fy (x0 , y0 ) 6= 0, so ist
y 0 (x0 ) = −
Fx (x0 , y0 )
.
Fy (x0 , y0 )
Beweis. Wir setzen t = x und wenden die Kettenregel 7.55 auf die Gleichung 0 =
Fx
F (x, y(x)) an. Dann ist 0 = Fx · x0 + Fy · y 0 , also y 0 = − .
Fy
Beispiel 7.57 Die Kreislinie kann durch
√
y(x) = 1 − x2 ,
−1<x<1
beschrieben werden. Diese Funktion ergibt sich durch Auflösung der Kreisgleichung
F (x, y) = x2 + y 2 − 1 = 0,
y > 0.
Die Ableitung von y kann dann aus dieser Gleichung nach Satz 7.55 wie folgt berechnet
werden:
2x · 1 + 2y · y 0 + 0 = 0,
x
also y 0 = − .
y
7.58 (Die Richtungsableitung) Die Funktion f (x, y) sei in einer Umgebung von x0 =
(x0 , y0 ) definiert und dort stetig partiell differenzierbar. Es sei a ∈ R2 ein Richtungsvektor
mit |a| = 1. Dann heißt die Zahl
df
df (x0 + ta)
=
da
dt
die Richtungsableitung von f in Richtung a. Wegen der verallgemeinerten Kettenregel
gilt
df
= ∇f (x0 ) · a.
da
116
7 DIFFERENTIALRECHNUNG
7.59 (Geometrische Deutung des Gradienten) Es sei f in einer Umgebung U (x0 )
stetig partiell differenzierbar. Die Richtungsableitung nimmt wegen
∇f (x0 ) · a = |∇f (x0 )| · |a| · cos ∠ (∇f, a) → max
ihr Maximum für ∠ (∇f, a) = 0 an. Also zeigt ∇f in die Richtung der stärksten Änderung der Funktion f . Wir betrachten nun eine Niveaulinie f (x, y) = c. Die Tangente an
die Niveaulinie hat nach Satz 7.56 dann den Anstiegsvektor
fx
1
0
(1, y ) = 1, −
=
(fy , −fx ).
fy
fy
Hieraus folgt
1
(fy , −fx ) = 0.
fy
Also steht der Gradient senkrecht auf den Niveaulinien.
∇f · (1, y 0 ) = (fx , fy ) ·
Als erste Anwendung des Apparates der partiellen Ableitungen wollen wir das Problem der
implizit definierten Funktionen behandeln. Dieses Problem besteht darin, Bedingungen zu
finden, unter denen durch eine Gleichung F (x, y) = 0 eine Funktion y = y(x) definiert
wird. Betrachten wir als Beispiel die Kreisgleichung
F (x, y) = x2 + y 2 − 1 = 0.
Die Kreislinie C = {(x, y) : F (x, y) = 0} kann sicherlich nicht der Graph einer Funktion
Abbildung 26: Definition impliziter Funktionen
sein. Beschränkt man sich jedoch auf einen geeigneten Ausschnitt B, so kann C ∩ B
durchaus der Graph einer Funktion sein. Gibt es dann sogar eine differenzierbare Funktion
y = y(x), die die Gleichung
F (x, y(x)) = 0
erfüllt, so muss wegen y 0 = −Fx /Fy nach Satz 7.56 sicherlich Fy 6= 0 gelten. Diese Bedingung ist zusammen mit Stetigkeitsvoraussetzungen umgekehrt auch hinreichend, wie der
folgende wichtige Satz lehrt:
Satz 7.60 (Hauptsatz über implizite Funktionen) Die Funktion z = F (x, y) sei in
einer offenen Teilmenge G ⊆ R2 definiert und auf G stetig partiell differenzierbar nach x
und y. Ist dann (x0 , y0 ) ein Punkt in G mit F (x0 , y0 ) = 0 und Fy (x0 , y0 ) 6= 0, so existiert
ein Rechteck I1 × I2 = [x0 − δ, x0 + δ] × [y0 − ε, y0 + ε] derart, dass die Menge
{(x, y) ∈ R2 : F (x, y) = 0} ∩ I1 × I2
der Graph einer auf I1 definierten, stetig differenzierbaren Funktion y = y(x) ist, d.h., zu
jedem x ∈ I1 existiert genau ein y ∈ I2 mit F (x, y) = 0. Ferner gilt y 0 = −Fx / Fy auf I1 .
7.7 Partielle Ableitungen und Gradient
117
Beweis. Ohne Beschränkung der Allgemeinheit sei Fy (x0 , y0 ) > 0. Wegen der Stetigkeit
von Fy existiert ein Rechteck Q = [x0 −δ1 , x0 +δ1 ] × [y0 −ε , y0 +ε] ⊆ G so, dass Fy > 0 auf
diesem Rechteck gilt. Wegen F (x0 , y0 ) = 0 und Fy (x0 , y) > 0 für alle y ∈ [y0 − ε , y0 + ε]
gilt F (x0 , y0 + ε) > 0 > F (x0 , y0 − ε). Wegen der Stetigkeit von F existiert dann ein
Intervall I1 = [x0 − δ, x0 + δ] ⊆ [x0 − δ1 , x0 + δ1 ] so, dass F (x, y0 + ε) > 0 > F (x, y0 − ε)
für alle x ∈ I1 gilt. Für festes x ∈ I1 hat die Funktion g(y) = F (x, y) auf [y0 − ε, y0 + ε]
nach dem Nullstellensatz von Bolzano daher eine Nullstelle in I2 = [y0 + ε, y0 + ε]. Also
hat F (x, y) = 0 für jedes x ∈ I1 eine Lösung y ∈ I2 .
Wir zeigen nun die Einzigkeit der Lösung in I2 . Es seien y1 , y2 ∈ I2 zwei verschiedene
Zahlen mit F (x, y1 ) = 0 = F (x, y2 ). Nach dem Mittelwertsatz der Differentialrechnung
gibt es dann ein η ∈ I2 mit Fy (x, η) = 0, was im Widerspruch zur Konstruktion von Q
steht. Damit wird in I1 ×I2 durch die Gleichung F (x, y) = 0 genau eine Funktion y = y(x)
definiert.
Wir zeigen nun durch indirekten Beweis zunächst die Stetigkeit von y = y(x). Angenommen, die Funktion wäre an irgendeiner Stelle x ∈ I1 unstetig. Dann gäbe es eine Folge
hn → 0 derart, dass lim y(x+hn ) = y ? 6= y(x) gilt. Da aber nach Konstruktion der Funkn→∞
tion y = y(x) die Gleichheit F (x + hn , y(x + hn )) = 0 besteht, folgt nach Grenzübergang
F (x, y ? ) = 0, was aber y ? = y(x) nach sich ziehen würde. Dieser Widerspruch zeigt die
Stetigkeit von y = y(x).
Zum Nachweis der Differenzierbarkeit seien x und x + h zwei Punkte in I1 und es seien
y(x) und y(x + h) die zugehörigen Funktionswerte. Wir betrachten die Gerade durch die
Punkte (x, y(x)) und (x + h, y(x + h)). Sie ist in R2 durch die Gleichung
(X(t), Y (t)) = (x + th, y(x) + t(y(x + h) − y(x))
gegeben. Die Funktion
ϕ(t) = F (X(t), Y (t)),
0≤t≤1
erfüllt auf [0, 1] die Voraussetzungen des Mittelwertsatzes. Daher existiert eine Zahl ϑ ∈
(0, 1) derart, dass
ϕ0 (ϑ) = ϕ(1) − ϕ(0)
ist. Wegen
ϕ(0) = F (x, y(x)) = 0 und ϕ(1) = F (x + h, y(x + h)) = 0
ist dann
ϕ0 (ϑ) = Fx (X(ϑ), Y (ϑ)) · h + Fy (X(ϑ), Y (ϑ)) · (y(x + h) − y(x)) = 0.
Hieraus folgt
Fx (X(ϑ), Y (ϑ))
y(x + h) − y(x)
=−
.
h
Fy (X(ϑ), Y (ϑ))
Wegen der bereits nachgewiesenen Stetigkeit von y = y(x) existiert dann aber der Grenzwert
y 0 (x) = lim
h→0
y(x + h) − y(x)
Fx (x, y(x))
=−
.
h
Fy (x, y(x))
118
7 DIFFERENTIALRECHNUNG
Der Hauptsatz über implizite Funktionen kann auch auf vektorwertige Funktionen mit
mehr als zwei Variablen verallgemeinert werden. Die wichtige Voraussetzung Fy (x0 , y0 ) 6=
0 wird dabei durch die Invertierbarkeit einer gewissen Jakobi-Matrix ersetzt, und anstelle
des Satzes von Bolzano zur Auflösung von Gleichungen wird der Banachsche Fixpunktsatz
zur Auflösung der entsprechenden (nichtlinearen) Gleichungssysteme herangezogen.
Satz 7.61 (Satz über die Existenz der inversen Funktion) Es sei y = f (x) eine
im Intervall I definierte Funktion. Ist f in einer Umgebung von x0 ∈ I stetig differenzierbar und gilt f 0 (x0 ) 6= 0, so existiert zu y0 = f (x0 ) ein Intervall J = (y0 − δ, y0 + δ)
und eine Funktion g : J → R mit f ◦ g = Id|J .
Beweis. Wir setzen F (x, y) = y −f (x) . Dann ist F auf I ×R stetig partiell differenzierbar,
und der Satz über implizite Funktionen kann zur Ermittlung der Funktion g(y) = x(y)
benutzt werden.
Wir beschließen dieses Kapitel mit einer Exkursion zu höheren partiellen Ableitungen.
Für eine Funktion z = f (x, y) heißen die beiden Funktionen
fx =
∂f
∂x
und fy =
∂f
.
∂x
im Fall der Existenz die partiellen Ableitungen 1. Ordnung. Durch weiteres Differenzieren
(falls möglich) entstehen hieraus vier Ableitungen der 2. Ordnung, nämlich:
fxx
=
fyx
=
∂2f
∂x2
∂2f
∂x ∂y
=
=
∂ ∂f
∂x ∂x
∂ ∂f
∂x ∂y
,
fyy
=
,
fxy
=
∂2f
∂y 2
∂2f
∂y ∂x
=
=
∂ ∂f
∂y ∂y
∂ ∂f
∂y ∂x
,
.
Für diese zweiten partiellen Ableitungen gilt dabei der folgende Satz:
Satz 7.62 (Satz von H. A. Schwarz (1843–1921)) Ist f auf der offenen Menge U ⊆
R2 stetig partiell differenzierbar nach x und y und existiert auch eine stetige Ableitung
fyx auf U , so existiert auch fxy auf U und es ist
fxy = fyx auf U.
Der Satz kann leicht durch Betrachtung der entsprechenden Differenzenquotienten unter Verwendung von Mittelwertsätzen bewiesen werden. Wir werden aber später unter
Verwendung der Integralrechnung einen einfacheren Beweis erhalten.
Folgerung 7.63 Ist der Ausdruck A(x, y)dx + B(x, y)dy das totale Differential einer
zweimal stetig partiell differenzierbaren Funktion f auf einer offenen Menge U , so gilt
∂A
∂B
=
auf U.
∂y
∂x
7.7 Partielle Ableitungen und Gradient
119
Diese Bedingung heißt auch Integrabilitätsbedingung des sogenannten Vektorfeldes
(A(x, y), B(x, y)). Wir werden später sehen, dass die angegebene Bedingung auch hinreichend ist.
Beweis. Gilt A(x, y) = fx (x, y) und B(x, y) = fy (x, y) für eine zweimal stetig partiell
differenzierbare Funktion f , so folgt aus Satz 7.62 die Gleichung
Ay = fxy = fyx = Bx .
Aufgaben zu Abschnitt 7.7
1. Man zeige am Beispiel der Funktion
( 2 2
f (x, y) =
x −y
x2 +y 2
0
für
sonst
(x, y) 6= (0, 0)
,
dass die Existenz der partiellen Ableitungen allein nicht hinreichend für die Gültigkeit der Weierstraßschen Zerlegungsformel ist.
2. Man zeige durch Diskussion der Richtungsableitungen, dass es zu jedem Punkt des
durch F (x, y) = x2 − y 2 definierten hyperbolischen Paraboloids zwei Geraden gibt,
die ganz in der Fläche verlaufen.
3. Ermitteln Sie die Gleichung der Tangentialebene an die durch
z = f (x, y) = 3x2 + 4y 2
gegebene Fläche im Punkt (x0 , y0 , f (x0 , y0 )) = (1, 1, 7).
4. Man zeige unter Verwendung des Mittelwertsatzes:
Ist f 0 (x) > 0 für alle x im Intervall I, so ist f auf I streng monoton wachsend.
5. a) Wie lässt sich durch die Gleichung sin xy = 0 eine Funktion definieren?
b) Lässt sich die Funktion x = y cos y in einer Umgebung von (0, 0) nach y auflösen?
6. Es sei G ∈ R2 eine offene Menge, es seien z = f (x, y) und z = g(x, y) zwei auf G
stetig partiell differenzierbare Funktionen mit den Graphen F bzw. G. Finden Sie
Bedingungen an f und g derart, dass die Schnittmenge F ∩ G eine glatte Kurve
repräsentiert. (Hinweis: Verwenden Sie den Satz über implizite Funktionen.)
7. Der Differentialoperator
∂2
∂2
+
∂x2 ∂y 2
heißt zweidimensionaler Laplace–Operator, und die Lösungen der Laplace–
Gleichung
∂2f
∂2f
∆f =
+
=0
∂x2
∂y 2
p
heißen harmonische Funktionen. Zeigen Sie, dass die Funktion f (x, y) = ln x2 + y 2
auf R2 \ {(0, 0)} harmonisch ist.
∆=
8. Prüfen Sie, ob der Differentialausdruck (exy + xyexy ) dx + x2 exy dy in R2 ein totales
Differential ist!
120
7.8
7 DIFFERENTIALRECHNUNG
Extremwerte für Funktionen mit mehreren Variablen
Wir untersuchen nun Extremwerte für Funktionen mit zwei Variablen. Die Begriffe lokale
Extrema werden analog wie im eindimensionalen Fall definiert.
Satz 7.64 (Notwendiges Kriterium) Die Funktion z = f (x, y) sei in einer Umgebung
U (x0 , y0 ) von (x0 , y0 ) definiert, partiell differenzierbar in (x0 , y0 ) und habe bei (x0 , y0 ) ein
lokales Extremum. Dann gilt
fx (x0 , y0 ) = 0 und fy (x0 , y0 ) = 0.
Beweis. Die Funktionen ϕ(x) = f (x, y0 ) und ψ(y) = f (x0 , y) haben unter den obigen
Voraussetzungen auch ein lokales Extremum bei x0 bzw. y0 . Daher ist
0 = ϕ0 (x0 ) = fx (x0 , y0 ) und 0 = ψ 0 (y0 ) = fy (x0 , y0 ).
Satz 7.65 (Eine hinreichende Bedingung) Die Funktion z = f (x, y) sei in U (x0 , y0 )
definiert und erfülle die folgenden Bedingungen:
(a) f ist in U zweimal stetig partiell differenzierbar.
(b) Es sei fx (x0 , y0 ) = 0 und fy (x0 , y0 ) = 0.
fxx (x0 , y0 ) fxy (x0 , y0 )
(c) Es sei det
= fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 )2 > 0.
fyx (x0 , y0 ) fyy (x0 , y0 )
Dann hat f bei (x0 , y0 ) ein lokales Extremum. Im Fall fxx (x0 .y0 ) < 0 ist es ein Maximum,
im Fall fxx (x0 , y0 ) > 0 ein Minimum.
Beweis. Wegen (c) ist fxx (x0 , y0 ) 6= 0, und o.B.d.A. sei fxx (x0 , y0 ) > 0. Wegen der Stetigkeit der partiellen Ableitung gibt es eine Umgebung U (x0 , y0 ) > 0 so, dass die Bedingung
(c) und die Bedingung fxx (x, y) > 0 für alle (x, y) = (x0 + h, y0 + k) ∈ U (x0 , y0 ) erfüllt ist.
Es sei nun (x0 +h, y0 +k) ∈ U (x0 , y0 ) fest gewählt. Wir wollen f (x0 +h, y0 +k) > f (x0 , y0 )
für h · k 6= 0 zeigen. Dazu definieren wir
F (t) = f (x0 + t h, y0 + t k) für |t| ≤ 1.
Dann ist
F 0 (t) = fx (x0 + t h, y0 + t k) · h + fy (x0 + t h, y0 + t k)k,
F 00 (t) = fxx (x0 + t h, y0 + t k)h2 + 2fxy (x0 + t h, y0 + t k)hk + fyy (x0 + t h, y0 + t k)k 2 .
Wegen (b) ist F 0 (0) = 0. Daher ergibt die Taylorformel angewandt auf die Funktion F (t)
mit den Abkürzungen P0 = (x0 , y0 ) und Pϑ = (x0 + ϑh, y0 + ϑk) wegen (c) die Formel
1
f (x0 + h, y0 + k) = F (1) = F (0) + 0 + F 00 (ϑ)
2
1
= f (P0 ) +
fxx (Pϑ )h2 + 2fxy (Pϑ )hk + fyy (Pϑ )k 2
2
2
1
= f (P0 ) +
fxx (Pϑ ) · h + fxy (Pϑ ) · k
2fxx (Pϑ )
2
+ fyy (Pϑ )fxx (Pϑ ) − fxy (Pϑ ) k 2
> f (x0 , y0 )
7.8 Extremwerte für Funktionen mit mehreren Variablen
121
Abbildung 27: ellipt. Paraboloid, hyperbol. Paraboloid=Sattelfläche und Affensattel
Beispiel 7.66 Wir bestimmen die lokalen Extrema der Funktion
f (x, y) = x2 + 2xy + 4y 2 + 2x − 10y + 5.
Dazu haben wir zunächst das Gleichungssystem
fx (x, y) = 2x + 2y + 2
= 0
fy (x, y) = 2x + 8y − 10 = 0
zu lösen. Das ergibt den Punkt (x0 , y0 ) = (−3, 2) als Kandidaten für einen Extremwert.
Wegen
fxx (−3, 2)fyy (−3, 2) − fxy (−3, 2)2 = 16 − 4 > 0
liegt in der Tat ein Extremwert vor, und wegen fxx (−3, 2) = 2 > 0 ist es ein Minimum.
Der obige Satz besitzt die folgende Verallgemeinerung auf Funktionen mit n ≥ 2 Variablen.
Der Beweis wird ähnlich wie oben geführt, man muss nur die aus der Linearen Algebra
bekannten Tatsachen über quadratische Formen und ihre Beziehung zu positiv definiten
Matrizen ausnutzen:
Satz 7.67 Die Funktion z = f (x) mit n Variablen sei in U (x0 ) definiert und erfülle die
folgenden Bedingungen:
(a) f ist in U zweimal stetig partiell differenzierbar.
(b) Es sei ∇f (x0 ) = 0.
(c) Die sogenannte Hesse-Matrix
2
∂ f (x0 ) =
∂2f
∂xi ∂xj
sei positiv definit.
i,j
Dann hat f bei x0 ein lokales Minimum.
Implizit trat im Beweis zu Satz 7.65 bereits eine Taylorformel für zwei Variable auf.
Allgemein versteht man unter der Taylorformel für eine Funktion mit n reellen
Variablen die Formel
X ∂ α f (x0 )
f (x) =
(x − x0 )α + RN +1 (x0 , x),
α!
|α|≤N
122
7 DIFFERENTIALRECHNUNG
wobei α = (α1 , . . . , αn ) ein Multiindex ist und die folgenden Schreibweisen vereinbart
sind:
∂ |α| f (x0 )
|α| = α1 + . . . + αn , α! = α1 ! · . . . · αn !, ∂ α f (x0 ) =
, zα = z1α1 · . . . · znαn .
∂xα1 1 · · · ∂xαnn
Aufgaben zu Abschnitt 7.8
1. Bestimmen Sie die lokalen Extremwerte für die folgende Funktion:
f (x, y) = x2 + xy + y 2 + 2x + 1.
2. Entscheiden Sie durch Extremwertuntersuchungen, ob durch die Gleichung
z = x2 − 2xy + 4y 2 + 2x − y + 1
ein elliptisches oder ein hyperbolisches Paraboloid beschrieben wird.
3. Regressionsgerade Einer biologischen Größe y werde eine lineare Abhängigkeit
y = f (x) = ax + b von einer Größe x unterstellt. Zur Bestimmung der Parameter
a, b wurde eine Messreihe mit n Messwertpaaren (xi , yi ), 1 ≤ i ≤ n, n 2, aufgenommen. Bestimmen Sie a, b derart, dass die mittlere quadratische Abweichung“
”
n
1 X
|f (xi ) − yi |2 → min
n − 1 i=1
minimal wird. Die Gerade mit den so bestimmten Parametern heißt die Regressionsgerade zur gegebenen Messreihe.
Bestimmen Sie die Parameter a, b für die folgende Messreihe, die den Zusammenhang
zwischen der Auslenkung x einer Feder und der Federkraft F angibt (Hookesches
Gesetz):
xi
Fi
0.5 1.0 1.5 2.0 2.5 3.0
0.9 1.2 1.4 1.7 2.0 2.2
123
8
8.1
Integralrechnung
Das bestimmte Integral
Die Integration ermöglicht Volumen- und Flächenberechnungen, und sie erweist sich als
eine Umkehrung“ zur Differentiation. Daher wird sie auch ein wesentliches Hilfsmittel
”
zur Lösung von Differentialgleichungen sein. Die folgende, mehrstufige Definition orientiert
sich an Flächeninhaltsberechnungen und geht auf Bernhard Riemann zurück.
Definition 8.1 (Das Riemannsche Integral) Es sei f : [a, b] → R eine beschränkte,
reellwertige Funktion.
(a) Eine Zerlegung Z von [a, b] ist ein n + 1-Tupel Z = (x0 , . . . , xn ) von Elementen
xi ∈ [a, b] mit a = x0 < x1 < . . . < xn = b. Die Intervalle Ii = [xi−1 , xi ) sind dann
n
S
paarweise disjunkt und es gilt
Ii = [a, b).
i=1
(b) Die Untersumme bzw. Obersumme von f zur Zerlegung Z ist definiert durch
S(f, Z) =
n
X
f (Ii )µ(Ii ) bzw. S(f, Z) =
i=1
n
X
f (Ii )µ(Ii ).
i=1
Dabei sind
µ(Ii ) = xi − xi−1 = Länge des Intervalls Ii = [xi−1 , xi ),
f (Ii ) = inf f (x) und
x∈Ii
f (Ii ) = sup f (x).
x∈Ii
(c) Die Darbouxsche Untersumme bzw. Obersumme von f auf [a, b] ist definiert
durch
S(f ) = sup {S(f, z): Z
ist Zerlegung von [a, b]} bzw.
S(f ) = inf {S(f, z):
ist Zerlegung von [a, b]}.
Z
(d) Gilt nun
S(f ) = S(f ),
so heißt diese Zahl das (Riemannsche) Integral von f auf [a, b] und die Funktion f
heißt (Riemann–)integrierbar auf [a, b]. Man schreibt dafür kurz
Zb
f (x)dx = S(f ) = S(f ).
a
124
8 INTEGRALRECHNUNG
Beispiel 8.2 (a) Jede konstante Funktion f (x) ≡ c ist auf jedem Intervall [a, b] integrierbar, und es gilt
Zb
c dx = c(b − a),
a
denn alle Obersummen und alle Untersummen haben offenbar den Wert c(b − a).
(b) Die sogenannte Dirichlet–Funktion
D(x) =
0 für x ∈ R \ Q
1 für x ∈ Q
ist auf dem Intervall [0, 1] nicht integrierbar, denn für jede Zerlegung Z gelten offenbar
S(f, Z) = 0 und S(f, Z) = 1.
Daher sind auch die Darbouxschen Summen S(f ) = 0 und S(f ) = 1 voneinander verschieden.
Wir wollen nun allgemeine Integrabilitätskriterien herleiten. Zur Vorbereitung dienen die
folgenden Sätze.
Definition 8.3 Es seien Z und Z 0 zwei Zerlegungen von [a, b]. Dann heißt Z 0 feiner als
Z, in Zeichen Z 0 ≺ Z, wenn jeder Teilpunkt xi von Z auch in Z 0 vorkommt.
Satz 8.4 Aus Z 0 ≺ Z folgt S(f, Z) ≤ S(f, Z 0 ) ≤ S(f, Z 0 ) ≤ S(f, Z).
Beweis. Jedes Intervall Ii = [xi−1 , xi ) der Zerlegung Z zerfällt unter der gemachten Voraussetzung in eine disjunkte Vereinigung
0
Ii = Ij0 ∪ Ij+1 ∪ . . . ∪ Ij+r
0
von Intervallen Ij+l
= [x0j+l−1 , x0j+l ) der Zerlegung Z 0 . Daher ist
f (Ii ) µ(Ii ) ≤
r
X
l=0
0
0
) µ(Ij+l
)
f (Ij+l
≤
r
X
0
0
f (Ij+l
) µ(Ij+l
) ≤ f (Ii ) µ(Ii ),
l=0
und die Summation über i ergibt S(f, Z) ≤ S(f, Z 0 ) ≤ S(f, Z 0 ) = S(f, Z).
Satz 8.5 Für jede auf [a, b] beschränkte Funktion f gilt S(f ) ≤ S(f ).
Beweis. Sind Z und Z 0 beliebige Zerlegungen von [a, b], so bilde man eine gemeinsame
Verfeinerung Z ∗ dieser Zerlegungen durch Ineinanderfügen dieser beiden Ketten zu einer
neuen Kette Z ∗ = (y0 , . . . , yn+m−1 ). Aus Satz 8.4 folgt dann die Ungleichung
S(f, Z) ≤ S(f, Z ∗ ) ≤ S(f, Z ∗ ) ≤ S(f, Z 0 ).
8.1 Das bestimmte Integral
125
Also gilt S(f, Z) ≤ S(f, Z 0 ) für alle Zerlegungen Z und Z 0 von [a, b]. Hieraus folgt
S(f ) = sup S(f, Z) : Z ist eine Zerlegung von [a, b] ≤ S(f, Z 0 ),
und durch Übergang zum Infimum schließlich
S(f ) ≤ inf S(f, Z 0 ) : Z 0 ist eine Zerlegung von [a, b] = S(f ).
Damit ergibt sich der wichtige Satz:
Satz 8.6 (Riemannsches Integrabilitätskriterium) Es sei f eine auf [a, b] beschränkte Funktion. Diese Funktion ist auf [a, b] genau dann integrierbar, wenn es zu
jedem ε > 0 eine Zerlegung Z von [a, b] mit S(f, Z) − S(f, Z) < ε gibt.
Beweis. Aus der angegebenen Bedingung folgt
S(f ) − S(f ) ≤ S(f, Z) − S(f, Z) ≤ ε.
Für ε → 0 zeigt dies S(f ) − S(f ) ≤ 0, wegen Satz 8.5 folgt daraus S(f ) = S(f ). Folglich ist f integrierbar. Ist umgekehrt f integrierbar, so wählen wir zu gegebenem ε > 0
Zerlegungen Z und Z 0 mit
ε
ε
S(f, Z 0 ) − S(f ) <
und S(f ) − S(f, Z) < .
2
2
Für die gemeinsame Verfeinerung Z ∗ von Z und Z 0 gilt dann wegen S(f ) = S(f ) die
Abschätzung
S(f, Z ∗ ) − S(f, Z ∗ ) ≤ S(f, Z 0 ) − S(f, Z) = S(f, Z 0 ) − S(f ) + S(f ) − S(f, Z) ≤ ε.
Die folgende Formel ermöglicht u.a. auch die Berechnung von Integralen in einfachen
Fällen:
Folgerung 8.7 (Hauptkriterium) Die Funktion f sei auf [a, b] beschränkt. Ist (Zn )
eine Folge von Zerlegungen von [a, b] mit
lim S(f, Zn ) = lim S(f, Zn ),
n→∞
n→∞
so ist f auf [a, b] integrierbar, und es gilt
Zb
f (x)dx = lim S(f, Zn ) = lim S(f, Zn ).
n→∞
n→∞
a
Beweis. Wegen Satz 8.5 gilt
S(f, Zn ) ≤ S(f ) ≤ S(f ) ≤ S(f, Zn ),
und aus der Voraussetzung folgt
lim S(f, Zn ) = S(f ) = S(f ) = lim S(f, Zn ).
n→∞
Hieraus ergibt sich die Behauptung.
n→∞
126
8 INTEGRALRECHNUNG
Beispiel 8.8 Es sei a < b. Wir berechnen das Integral
Rb
x dx. Dazu setzen wir f (x) = x
a
und bilden die äquidistanten Zerlegungen
Zn = {xj : xj = a + j ·
b−a
= a + jh; j = 0, . . . , n}.
n
Mit h · n = b − a gilt dann
n−1
X
S(f, Zn ) =
(a + jh) · h =
j=0
n−1
X
2
2
a·h+j·h =a·h·n+h
j = a · h · n + h2 ·
j=0
j=0
= a · (b − a) +
n−1
X
n(n − 1)
2
(b − a)2 h
h2 n2 h
− · hn = a(b − a) +
− (b − a).
2
2
2
2
Analog ist
S(f, Zn ) =
n
X
(a + jh)h = a(b − a) + h2
j=1
Wegen h =
b−a
n
n(n + 1)
(b − a)2 h
= a(b − a) +
+ (b − a).
2
2
2
→ 0 für n → ∞ folgt
lim S(f, Zn ) = lim S(f, Zn ) = a(b − a) +
n→∞
b 2 a2
(b − a)2
=
− .
2
2
2
Also ist f (x) = x nach Satz 8.7 integrierbar, und es gilt
Zb
x dx =
b 2 a2
− .
2
2
a
Satz 8.9 (1. Existenzsatz) Ist f auf [a, b] stetig, so ist f auf [a, b] auch integrierbar.
Beweis. Wir werden Riemanns Integrabilitätskriterium anwenden. Dazu sei ε > 0 beliebig
vorgegeben. Da stetige Funktionen auf kompakten Intervallen sogar gleichmäßig stetig
sind (siehe Satz 6.17), existiert ein δ > 0 derart, dass gilt:
Aus |x − x0 | < δ folgt |f (x) − f (x0 )| < ε auf [a, b].
Wir wählen eine natürliche Zahl n so groß, dass
h=
b−a
n
b−a
n
< δ ausfällt. Dann setzen wir
xj = a + j · h
und
Für Ij = [xj−1 , xj ) gilt dann µ(Ij ) =
b−a
n
für j = 0, . . . , n.
< δ. Folglich ist
|f (Ij ) − f (Ij )| < ε.
Für die Zerlegung Z = (x0 , . . . , xn ) ergibt sich daher
S(f, Z) − S(f, Z) =
n
X
(f (Ij ) − f (Ij )) µ(Ij ) ≤ ε · (b − a).
j=1
Somit ist f nach dem Riemannschen Kriterium integrierbar.
8.1 Das bestimmte Integral
127
Satz 8.10 (2. Existenzsatz) Ist f auf [a, b] monoton, so ist f auf [a, b] auch integrierbar.
Beweis. Sei f monoton wachsend und sei ε > 0 vorgegeben. Wir wählen eine natürliche
Zahl n so, dass
(b − a)
· (f (b) − f (a)) < ε
n
ausfällt. Sodann setzen wir wie im vorigen Satz
b−a
, xj = a + j · h und Z = (x0 , . . . , xn ).
n
Wegen der Monotonie von f gelten
h=
f (Ij ) = f (xj−1 ) und f (Ij ) ≤ f (xj ).
Daher ist
n
X
n
b−a X
S(f, Z) − S(f, Z) ≤
(f (xj ) − f (xj−1 )) µ(Ij ) =
·
(f (xj ) − f (xj−1 ))
n
j=1
j=1
b−a
(f (b) − f (a)) < (b − a) ε.
n
Folglich ist f nach dem Riemannschen Integrabilitätskriterium auch integrierbar.
=
Definition 8.11 (Die Rechteckregel) Es sei f auf [a, b] beschränkt und es sei h =
Die Formel
n
X
Rn (f ) =
f (a + jh) · h
b−a
.
n
j=1
heißt Rechteckregel für f (s. Abb. 28).
Abbildung 28: Die Rechteckregel
In der numerischen Mathematik werden die Zahlen Rn (f ) als Näherungswerte für das
Integral von f benutzt. Wir wollen eine Fehlerabschätzung für
b
Z
f (x) dx − Rn (f )
a
in Abhängigkeit von n bzw. h ermitteln.
128
8 INTEGRALRECHNUNG
Satz 8.12 (Fehlerabschätzung für die Rechteckregel) Hat f auf [a, b] eine stetige
beschränkte Ableitung mit |f 0 | ≤ K, so ist
Z b
(b − a)2
.
f
(x)dx
−
R
(f
)
≤
2K
·
n
n
a
Beweis. Wegen des Mittelwertsatzes der Differentialrechnung ist
|f (x0 ) − f (x00 )| = |f 0 (ξ)| · |x0 − x00 | ≤ K · |x0 − x00 |.
Hieraus folgt für die Zerlegung Z = (x0 , x1 , . . . , xn ) mit den Teilpunkten xj = a + h · j
dem Zuwachs h = (b − a)/n und den Intervallen Ij = [xj−1 , xj ) die Abschätzung
|f (Ij ) − f (Ij )| ≤ K · µ(Ij ) = K · h, und insbesondere |f (xj ) − f (Ij )| ≤ K · h.
Somit ist
Z b
Z b
f (x)dx − Rn (f ) ≤ f (x)dx − S(f, Z) + S(f, Z) − Rn (f )
a
a
≤ |S(f, Z) − S(f, Z)| + |S(f, Z) − Rn (f )|
≤ K · h · (b − a) + K · h · (b − a)
= 2K · h · (b − a) = 2K
(b − a)2
n
Bessere Konvergenzgüten (z.B. ≤ M · 1/n2 ) ergeben sich bei der Verwendung der Trapezregel
!
n−1
X
1
1
f (a) +
f (a + jh) + f (b) · (b − a)
Tn (f ) =
2
2
j=1
anstelle der Rechteckregel (s. Aufgabe 6).
Aufgaben zu Abschnitt 8.1
Zb
1. Mit der in Beispiel 8.8 angegebenen Methode zeige man
Zb
2. Zeigen Sie
ex dx = eb − 1.
0
1
dx = ln b für b > 0 unter Verwendung sog. geometrischer Zerlex
1
gungsfolgen Zn = {xj = bj/n : j = 0, . . . , n}. (Satz 4.30 könnte dabei helfen.)
Za
3. Berechnen Sie
sgn x dx in Abhängigkeit von a.
−2
8.2 Eigenschaften Riemannscher Integrale
129
Zπ
4. Berechnen Sie
sin x dx unter Verwendung der Rechtecksregel.
0
π
(Hinweis: Zur Auswertung der Rn erweitern Sie Rn mit sin 2n
und verwenden Sie
die bekannte Formel 2 · sin x · sin y = cos(x − y) − cos(x + y).)
5. Es sei f auf [a, b] integrierbar. Zeigen Sie die Stetigkeit der Funktion
Zx
f (t) dt für a ≤ x ≤ b.
Φ(x) =
a
6. Finden Sie (unter von Ihnen diktierten Voraussetzungen an die Funktion f ) eine
gute Fehlerabschätzung für die Trapezregel. Was hat die Trapezregel mit Trapezen
zu tun?
7. Die Riemann-Funktion r : R → [0, ∞) ist wie folgt definiert:
r(x) =
0
1
q
für x irrational,
für x = pq mit teilerfremden p, q und q > 0.
a) Beweisen Sie, dass r in jedem irrationalen Punkt stetig und in jedem rationalen
Punkt unstetig ist.
b) Beweisen Sie, dass die Riemann-Funktion auf [0, 1] integrierbar ist und berechnen
Sie das Integral.
8.2
Eigenschaften Riemannscher Integrale
Satz 8.13 Es seien f und g auf [a, b] integrierbar und es sei λ ∈ R beliebig gegeben. Dann
sind auch f + g und λ f auf [a, b] integrierbar und es gelten:
(a)
Aus f ≥ 0 auf [a, b] folgt
Rb
f (x)dx ≥ 0.
(Positivität)
a
(b)
Rb
f (x) + g(x)dx =
a
(c)
Rb
Rb
f (x)dx +
a
λ f (x)dx = λ
a
Rb
Rb
g(x)dx
(Additivität)
a
f (x)dx
(Homogenität).
a
Zb
f (x)dx ≥ S(f ) ≥ 0.
Beweis. Zu a) Aus f ≥ 0 auf [a, b] folgt
a
Zu b) Offensichtlich gilt
S(f, Z) + S(g, Z) ≤ S(f + g, Z) ≤ S(f + g) ≤ S(f + g) ≤ S(f + g, Z) ≤ S(f, Z) + S(g, Z).
130
8 INTEGRALRECHNUNG
Zu ε > 0 existiert nun wegen der Integrierbarkeit von f und g eine Zerlegung Z von [a, b]
derart, dass
S(f, Z) − S(f, Z) < ε und S(g, Z) − S(g, Z) < ε
sind. Hieraus folgt
Zb
Zb
g(x)dx − 2ε ≤ S(f, Z) + S(g, Z) ≤ S(f + g) ≤ S(f + g)
f (x)dx +
a
a
Zb
≤ S(f, Z) + S(g, Z) ≤
Zb
f (x)dx +
a
g(x)dx + 2 ε.
a
Für ε → 0 zeigt das S(f + g) = S(f + g) und
Zb
Zb
f (x)dx +
a
Zb
g(x)dx = S(f + g) = S(f + g) =
a
f (x) + g(x)dx.
a
Zu c) Für λ ≥ 0 gilt S(λ f, Z) = λ S(f, Z), und hieraus folgt S(λ f ) = λ S(f ). Ebenso
zeigt man S(λ f ) = λ S(f ), und das liefert
S(λ f ) = λ S(f ) = λ S(f ) = S(λ f ).
Analog verfährt man für negative λ.
Definition 8.14 Es sei f auf [a, b] integrierbar und es sei f (x) ≥ 0 für alle x ∈ [a, b].
Als Flächeninhalt der Ordinatenmenge
I0f = {(x, y) : a ≤ x ≤ b, 0 ≤ y ≤ f (x)}
bezeichnen wir die durch
µ(I0f )
Zb
=
f (x)dx
a
definierte nichtnegative reelle Zahl.
Damit haben wir den Zusammenhang zur Inhaltslehre hergestellt. Das erlaubt zukünftig
auch eine geometrische Interpretation der auftretenden Formeln. Als Beispiel betrachte
man die Aussage (b) der nachstehenden Folgerung:
Folgerung 8.15 Es seien f und g auf [a, b] integrierbar. Dann gelten:
(a)
Aus f ≤ g folgt
Rb
f (x)dx ≤
a
(b)
Rb
g(x)dx
(Monotonie).
a
Aus K1 ≤ f ≤ K2 mit zwei Konstanten K1 , K2 ∈ R folgt
Rb
K1 (b − a) ≤ f (x)dx ≤ K2 (b − a)
a
( Beschränktheit).
8.2 Eigenschaften Riemannscher Integrale
131
R
R
R
R
R
Beweis. Aus f ≤ g folgt g − f ≥ 0, also 0 ≤ (g − f ) = g − f , und somit f ≤ g.
Die Ungleichung (b) folgt nun aus (a) wegen
Zb
Zb
K1 (b − a) =
Zb
K1 dx ≤
f (x)dx ≤
a
K2 dx = K2 (b − a).
a
a
Satz 8.16 (Additivität des Integrals bezüglich des Integrationsbereiches) Es
seien a < c < b. Eine reelle Funktion f ist genau dann auf [a, b] integrierbar, wenn f auf
[a, c] und auf [c, b] integrierbar ist. In diesem Fall gilt
Zb
Zc
f (x)dx =
a
Zb
f (x)dx +
a
f (x)dx.
c
Beweis. Es seien I 0 = [a, c], I 00 = [c, b] und I = [a, b]. Sind Z 0 und Z 00 Zerlegungen von I 0
bzw. I 00 , so ist Z = Z 0 ∪ Z 00 eine Zerlegung von I. Daher ist
0
00
S I (f, Z 0 ) + S I (f, Z 00 ) ≤ S I (f, Z) ≤ S I (f ).
Hieraus folgt
0
00
S I (f ) + S I (f ) ≤ S I (f ).
Ist umgekehrt Z eine Zerlegung von I, so sind Z 0 = (Z ∩ [a, c]) ∪ {c} und Z 00 = {c} ∪
(Z ∩ [c, b]) Zerlegungen von I 0 und I 00 , und es gilt Z 0 ∪ Z 00 ≺ Z. Daher ist
0
00
0
00
S I (f, Z) ≤ S I (f, Z 0 ∪ Z 00 ) = S I (f, Z 0 ) + S I (f, Z 00 ) ≤ S I (f ) + S I (f ),
also auch
0
00
S I (f ) ≤ S I (f ) + S I (f ).
Entsprechend ergibt sich für die Obersummen (f ; −f ) die Ungleichungen
I0
I 00
I
I0
I
I 00
S (f ) + S (f ) ≤ S (f ) und S (f ) ≤ S (f ) + S (f ).
Aus diesen wechselseitigen Abschätzungen folgt nun die Behauptung des Satzes.
Zur Verallgemeinerung der Formel aus Satz 8.16 definieren wir zusätzlich
Za
Za
f (x)dx = −
f (x)dx = 0 und
a
Zb
f (x)dx
für
a ≤ b.
a
b
Dann ergibt sich der Satz:
Satz 8.17 Ist f auf I integrierbar und sind a, b, c ∈ I beliebig gegeben, so ist
Zb
Zc
f (x)dx +
a
Za
f (x)dx +
b
f (x)dx = 0.
c
132
8 INTEGRALRECHNUNG
Beweis. Im Fall a = b oder a = c folgt die Behauptung aus der zusätzlichen Definition.
Ist a 6= b 6= c 6= a, so kann wegen der Symmetrie der Formel sogar a < c < b angenommen
werden. Für diesen Fall ergibt sich die Behauptung aber aus Satz 8.16.
Satz 8.18 Ist f auf [a, b] integrierbar, so ist auch |f | integrierbar, und es gilt
b
Z
Zb
f (x) dx ≤
|f (x) |dx
a
(Dreiecksungleichung).
a
Beweis. Es sei I ⊆ [a, b] beliebig gegeben. Für x1 , x2 ∈ I gilt dann
|f (x1 )| − |f (x2 )| ≤ |f (x1 ) − f (x2 )| ≤ f (I) − f (I),
und hieraus folgt
|f |(I) − |f |(I) ≤ f (I) − f (I).
Daher gilt für jede Zerlegung Z die Ungleichung
S(|f |, Z) − S(|f |, Z) ≤ S(f, Z) − S(f, Z).
Folglich ist mit f auch |f | nach dem Riemannschen Kriterium integrierbar. Ferner ist
wegen ±f ≤ |f | nach Satz 8.15
Zb
±
Zb
±f (x)dx ≤
f (x)dx =
a
Zb
a
a
b
Zb
Z
|f (x)|dx, also f (x) dx ≤ |f (x)|dx.
Satz 8.19 Ist f auf [a, b] stetig und ist
a
a
Rb
|f (x)|dx = 0, so ist f ≡ 0 auf [a, b].
a
Beweis. Wäre f (x0 ) 6= 0 für ein x0 ∈ [a, b], so ist die Zahl ε = 21 | f (x0 ) | > 0. Wegen der
Stetigkeit von f existiert ein Intervall I0 = [a0 , b0 ] ⊆ [a, b] um x0 mit
|f (x) − f (x0 )| < ε
für alle
x ∈ I0 .
Folglich ist |f (x)| ≥ |f (x0 )| − ε = 2ε − ε = ε > 0 und somit
Zb0
Zb
|f (x)|dx ≥
a
Zb0
|f (x)|dx ≥
a0
im Widerspruch zur Voraussetzung.
a0
ε dx = ε(b0 − a0 ) > 0
8.3 Mittelwertsätze der Integralrechnung
8.3
133
Mittelwertsätze der Integralrechnung
Die Kombination der Grobabschätzung von Integralen mit dem Zwischenwertsatz für
stetige Funktionen führt auf die überaus wichtigen Mittelwertsätze der Integralrechnung.
Satz 8.20 (Mittelwertsatz der Integralrechnung) Ist f stetig auf dem Intervall
[a, b], so existiert eine Zahl ξ ∈ (a, b) mit
Zb
f (x)dx = f (ξ)(b − a).
a
Beweis. Nach Satz 8.15 ist
Zb
min f (x) · (b − a) ≤
f (x)dx ≤ max f (x) · (b − a).
a≤x≤b
a≤x≤b
a
Daraus folgt
1
min f (x) ≤
a≤x≤b
b−a
Zb
f (x)dx ≤ max f (x).
a≤x≤b
a
Nach dem Zwischenwertsatz existiert folglich eine Zahl ξ ∈ (a, b) mit
1
f (ξ) =
b−a
Zb
f (x)dx,
a
und hieraus folgt die Behauptung.
Die folgende Umformulierung des Mittelwertsatzes ist oft sehr nützlich:
Folgerung 8.21 Ist f stetig auf dem Intervall I, so existiert zu je zwei Punkten x, x+h ∈
I eine Zahl 0 < ϑ < 1 mit
x+h
Z
f (t)dt = h · f (x + ϑ h).
x
Satz 8.22 (Verallgemeinerter Mittelwertsatz) Sind f und g auf [a, b] stetig und ist
g ≥ 0 auf [a, b], so existiert eine Zahl ξ ∈ (a, b) mit
Zb
Zb
f (x)g(x)dx = f (ξ)
a
g(x)dx.
a
134
8 INTEGRALRECHNUNG
Beweis. Ist
Rb
g(x)dx = 0, so gilt g ≡ 0 auf [a, b] nach Satz 8.19. Die Behauptung ist in
a
diesem Fall daher trivial. Im anderen Fall setzen wir zur Abkürzung
K1 = min f (x), K2 = max f (x).
Wegen g ≥ 0 folgt K1 g(x) ≤ f (x)g(x) ≤ K2 g(x) für alle x ∈ [a, b], und die Integration
Rb
und anschließende Division durch g(x)dx ergibt
a
Zb
Zb
K1 ≤
g(x)dx ≤ K2 .
f (x)g(x)dx
a
a
Der Zwischenwertsatz für f ergibt die Existenz einer Zahl ξ ∈ (a, b) mit
Zb
Zb
f (ξ) =
g(x)dx,
f (x)g(x)dx
a
a
und hieraus folgt wieder die Behauptung.
8.4
Hauptsatz der Differential– Integralrechnung
In diesem Abschnitt werden wir zeigen, dass Integral– und Differentialrechnung komplementär zueinander sind. Die genaue Formulierung wird den Inhalt des Hauptsatzes und
seiner Umkehrung ausmachen, und es war die Leistung von Isaac Newton und Gottfried
W. Leibniz eben diesen Zusammenhang erkannt zu haben. Wir beginnen dabei mit der
Problemstellung, zu einer auf einem offenen Intervall I gegebenen stetigen Funktion f
eine Funktion F mit F 0 (x) = f (x) für alle x ∈ I zu finden. Jede solche Funktion F nennen wir eine Stammfunktion von f auf dem Intervall I. Aus Satz 7.24 wissen wir bereits,
dass für zwei stetig differenzierbare Funktionen F und G aus F 0 = G0 auf einem Intervall
I sofort F = G + const folgt. Stammfunktionen einer gegeben Funktion unterscheiden
sich also höchstens durch eine Konstante. Der folgende Hauptsatz zeigt nun, dass man
Stammfunktionen durch Integration mit variabler oberer Grenze erhalten kann:
Satz 8.23 (Hauptsatz der Differential- Integralrechnung) Es sei f auf einem offenen Intervall I definiert und stetig und es sei a ein beliebiger Punkt aus I. Dann ist die
Funktion
Zx
Φ(x) = f (t) dt, x ∈ (a, b),
a
eine Stammfunktion von f auf I, es gilt also
d
dx
Zx
f (t) dt = f (x) für alle x ∈ I.
a
(Integration produziert Stammfunktionen und Differentiation hebt Integration auf.)
8.4 Hauptsatz der Differential– Integralrechnung
135
Beweis. Wir untersuchen den Differentialquotienten für Φ(x) und verwenden dabei den
Mittelwertsatz der Integralrechnung und die Stetigkeit von f . So ergibt sich:
 x+h

x+h
Z
Zx
Z
1
1
1
Φ(x + h) − Φ(x)
=
f (t)dt − f (t)dt =
f (t)dt = · h · f (x + ϑh) → f (x).
h
h
h
h
a
a
x
0
Das zeigt Φ (x) = f (x) für alle x ∈ I.
Satz 8.24 (Umkehrung des Hauptsatzes) Ist f auf dem offenen Intervall I stetig
und ist F eine Stammfunktion von f auf I, so gilt
Zx
f (t) dt = F (x) − F (a) für alle x, a ∈ I.
a
(Mittels Stammfunktionen lassen sich Integrale berechnen.)
Wir geben diesem Satz noch eine andere Fassung:
Satz 8.25 (Umkehrung des Hauptsatzes, zweite Fassung) Ist F stetig differenzierbar auf I, so ist
Zx
d
F (t) dt = F (x) − F (a).
dt
a
(Integration hebt die Differentiation bis auf eine Konstante auf.)
Beweis. Ist F eine Stammfunktion von f , so gilt F 0 (x) = f (x) für alle x ∈ I. Andererseits
ist nach Satz 8.23 aber auch Φ0 (x) = f (x) auf I. Daher ist F 0 = Φ0 auf I, und aus Satz
7.24 folgt die Gleichung
Φ(x) = F (x) + const, x ∈ I.
Für x = a folgt 0 = Φ(a) = F (a) + const, also ist const = −F (a) und somit
Zx
f (t)dt = Φ(x) = F (x) − F (a).
a
Definition 8.26 (Unbestimmtes Integral) Unter dem unbestimmten Integral einer
stetigen Funktion f (auf einem offenen Intervall I) versteht manRdie Menge aller Stammfunktionen von f (auf I). Das unbestimmte Integral wird durch f (x) dx bezeichnet.
R
Wegen Satz 7.24 ist F 0 (x) = f (x) äquivalent zu f (x)dx = F (x) + C. Nach den Sätzen
8.23 und 8.24 gilt ferner
 x

Z
Z

Menge aller Stammfunktionen von f = f (x) dx ⊇
f (t)dt : a ∈ I .


a
Die früheren Beispiele für die Ableitung von Funktionen führen zu der folgenden Tabelle
von Grundintegralen, wie man durch Differentiation leicht bestätigt. Diese Tabelle ist nach
Satz 8.24 für die explizite Berechnung von Integralen sehr wertvoll.
136
8 INTEGRALRECHNUNG
Tabelle einiger Grundintegrale
Gültigkeitsbereich
R
f (x)dx = F (x) + C
Probe
(0, ∞)
R
xα dx =
1
α+1
F0 = f
(−∞, 0) ∪ (0, ∞)
R
dx
x
(−∞, ∞)
R
ex dx = ex + C
(−∞, ∞)
R
sin x dx = − cos x + C
(−∞, ∞)
R
cos x dx = sin x + C
(− π2 , π2 )
R
dx
cos2 x
(−1, 1)
R
√ dx
1−x2
xα+1 + C, α 6= −1
= ln |x| + C
= tan x + C
= arcsin x + C
= − arccos x + C1
(−∞, ∞)
R
dx
1+x2
= arctan x + C
= −arccot x + C1
(−∞, ∞)
R
sinh x dx = cosh x + C
(−∞, ∞)
R
cosh x dx = sinh x + C
(−∞, 1) ∪ (1, ∞)
R
√ dx
x2 −1
= arcosh x + C
(−∞, ∞)
R
√ dx
x2 +1
= arsinh x + C
8.5 Integrationsmethoden
8.5
137
Integrationsmethoden
Der Hauptsatz 8.23 in Kombination mit bereits behandelten Differentiationsregeln ergibt
wichtige Integrationsmethoden.
Satz 8.27 (Partielle Integration) Sind u und v auf dem offenen Intervall I stetig differenzierbar, so gelten
Zb
b Z b
u(x)v (x)dx = u(x)v(x) −
u0 (x)v(x)dx und
0
a
a
Z
u(x)v 0 (x)dx = u(x)v(x) −
a
Z
u0 (x)v(x)dx.
b
Dabei bedeutet u(x)v(x) = u(b)v(b) − u(a)v(a).
a
Beweis. Durch Integration der Produktregel
(u · v)0 = u0 v + u v 0
ergibt sich nach Satz 8.23 die Formel
b Z b
Zb
0
u(x)v(x) =
u (x)v(x)dx +
u(x)v 0 (x)dx,
a
a
a
woraus die Behauptung folgt.
R
Beispiel 8.28 a) Zur Berechnung von x cos x dx setzen wir u(x) = x und v 0 (x) =
cos x. Dann ist erfreuerlicherweise u0 (x) = 1 und v(x) = sin x (+C). Somit ergibt sich
Z
Z
x cos x dx = x sin x −
1 · sin x dx = x sin x + cos x + C.
R
b) Für Anwendungen wichtig (z.B. Energieberechnung) ist das Integral sin2 x dx. Wir
schreiben sin2 x = sin x·sin x und setzen u(x) = sin x und v 0 (x) = sin x, v(x) = − cos x.
Das ergibt
Z
Z
Z
2
2
sin x dx = − sin x cos x +
cos x dx = − sin x cos x +
1 − sin2 x dx
Z
= − sin x cos x + x −
sin2 x dx.
R
Die Addition von sin2 x dx auf beiden Seiten ergibt
Z
1
2
sin2 x dx = − sin x cos x + x + C = x − sin 2x + C, also
2
Z
1
1
C
sin2 x dx =
x − sin 2x + C1 mit C1 = .
2
2
2
138
8 INTEGRALRECHNUNG
R
c) Ein weiterer Trick begegnet uns bei der Berechnung des Integrals ln x dx. Diesmal
setzen wir ln x = 1 · ln x und u0 (x) = 1, v(x) = ln x, u(x) = x. Das ergibt
Z
Z
Z
x
ln x dx =
1 · ln x dx = x ln x −
dx = x ln x − x + C = x(ln x − 1) + C.
x
Satz 8.29 (Die Substitutionsregel) Es sei f stetig auf I und es sei g stetig differenzierbar auf I1 mit g(I1 ) ⊆ I. Dann gelten für alle a, b ∈ I1 die Formeln
Zb
Zg(b)
0
f (g(x))g (x)dx =
a
Z
f (z) dz und
Z
0
f (g(x))g (x) dx =
f (z) dz g(a)
.
z=g(x)
Beweis. Die Kettenregel ergibt
d
dx
Zg(x)
d
f (z)dz =
dz
Z
f (z)dz g(a)
Also ist
g(x)
R
·
z=g(x)
d
g(x) = f (g(x)) · g 0 (x).
dx
f (z) dz eine Stammfunktion von f (g(x)) · g 0 (x).
g(a)
8.30 (Anwendung der Substitutionsregel von links nach rechts“)
”
Wenn der Integrand die Gestalt eines Produktes hat, das sogar in der Form f (g(x)) · g 0 (x)
oder g 0 (x)f (g(x)) geschrieben werden kann, so ist die Formel aus Satz 8.29 mit Erfolg
anwendbar. Wir geben einige Beispiele.
R
R
R
1
1
2
2
a)
x · sin x dx = 2 2x · sin x dx
= 2 sin z dz z=x2
= − 12 cos z b)
R
Z
c)
sin x
cos x e
ln x
dx
x
dx
=
R
e dz +C
z=x2
z
= − 21 cos x2 + C
= e
z
z=sin x
Z
=
=
1
· ln x dx
x
1 2 z
+C
2 Z
=
=
z=ln x
Z
d)
x
dx
1 + x2
=
=
Z
1
1
2x ·
dx
2
1 + x2
1
ln |z| +C
2
z=1+x2
=
=
+ C = esin x + C
z=sin x
z dz z=ln x
1
(ln x)2 + C.
2
Z
1
1 dz
2
z z=1+x2
1
2
ln(1 + x2 ) + C .
8.5 Integrationsmethoden
139
8.31 (Anwendung der Substitutionsregel von rechts nach links“)
”
Während in 8.30 die zu verwendenden Substitutionen meistens auf der Hand liegen, ist
bei der Anwendung von rechts nach links“ eine geeignete Substitution erst zu entdecken.
”R
2
dz
2
a) Für das Integral √1−z
2 bietet sich wegen cos t = 1 − sin t die Substitution z = sin t
an. Es ist dann z 0 = cos t, also
Z
Z
Z
1
cos t
dz
√
p
dt
=
· cos t dt =
| cos t|
1 − z2
1 − sin2 t
Z
= ± dt = ± t + C = ± arcsin z + C.
b) Zur Berechnung des Flächeninhaltes
√ des Einheitskreises haben wir den Inhalt der
Ordinatenmenge der Kreislinie f (z) = 1 − z 2 zu berechnen. Man setzt wiederum z =
sin t und erhält:
µ(I0f ) =
Z1 √
−1
1 − z 2 dz =
Zπ/2 p
1 − sin2 t · cos t dt =
−π/2
Zπ/2
cos2 t dt
−π/2
π/2
π
1
= .
=
(t + sin t cos t)
2
2
−π/2
8.32 (Die Lineare Substitution) z = ax + b ist problemlos möglich und führt auf
Z
Z
1
f (z)dz.
f (ax + b)dx =
a
Wir wenden dieses Ergebnis auf einige Beispiele an:
R
R
a) sin(2x − 1)dx = 21 sin z dz = − 21 cos z + C = − 12 cos(2x − 1) + C.
R
dx
b) Wir betrachten √x2 −4x+1
. Durch die quadratische Ergänzung ergibt sich x2 −4x+1 =
√
√
(x − 2)2 − 3. Mit z = x − 2 ist dx = dz, und mit u = z/ 3 ist dz = 3 du. Daraus folgt
Z
Z
Z
Z
dx
1
dx
dz
dz
√
p
√
q
=
=√
=
x2 − 4x + 1
z2 − 3
3
(x − 2)2 − 3
( √z3 )2 − 1
√ Z
3
du
x−2
√
= √
= Arcosh u + C = Arcosh √ + C.
u2 − 1
3
3
8.33 (Integration von Potenzreihen) Wir wissen bereits, dass Potenzreihen auf ihrem Konvergenzbereich gliedweise differenziert werden können. Wegen der Umkehrung
des Hauptsatzes gilt daher
Z X
∞
∞ Z
∞
X
X
ak
k
k
ak x dx =
ak x + C =
xk+1 + C.
k
+
1
k=0
k=0
k=0
140
8 INTEGRALRECHNUNG
8.34 (Die Grenzen der Berechnung von Stammfunktionen) Es erhebt sich die
Frage, ob man eigentlich durch geschickte Anwendung der Integrationsregeln zu jeder
vernünftigen Funktion eine Stammfunktion berechnen kann. Natürlich existiert zu jeder
stetigen Funktion eine Stammfunktion, hier wird jedoch die Frage nach der formelmäßigen
Berechnung gestellt. Zur Präzisierung der zu betrachtenden Funktionenklasse definieren
wir:
Es sei E die kleinste Menge von Funktionen mit folgenden Eigenschaften:
(a) E enthält alle Potenzfunktionen, alle Exponentialfunktionen, alle trigonometrischen
Funktionen.
(b) Sind f, g ∈ E, so sind auch f ± g, f · g, f / g, f ◦ g und f −1 in E, sofern diese
Bildungen definiert sind.
Die Menge E heißt die Menge der elementaren Funktionen.
Die Differentiationsregeln zeigen die Gültigkeit des folgenden Satzes:
Satz. Die Ableitung jeder elementaren Funktion ist wieder elementar.
Demgegenüber ist nicht jede Stammfunktion einer elementaren Funktion eine elementare
Funktion. Beispielsweise sind die Funktionen
Zx
Si(x)
=
Φ(x)
=
sin t
dt
t
0
Zx
t2
1
1
√
e− 2 dt +
2
2π
(Integralsinus)
(Gaußsche Fehlerfunktion)
0
keine elementaren Funktionen (J. Liouville 1809–1882). Für einen Beweis dieser Tatsache fehlen uns hier die Hilfsmittel. Beide der o.g. Funktionen haben in der höheren
Mathematik größere Bedeutung (Theorie der Fourierreihen und Wahrscheinlichkeitsrechnung). Nach 8.33 sind die Funktionen Si(x) und Φ(x) analytisch, denn die Integranden
sind analytisch:
sin t
1
t3 t5
t2 t4
=
t − + − +... = 1 − + − +...,
t
t
3! 5!
3! 5!
2 /2
e−t
=
∞
∞
X
(−t2 /2)k X (−1)k t2k
=
.
k · k!
k!
2
k=0
k=0
Die Integration kann nun zwar gliedweise erfolgen. Damit erhält man zwar eine Potenzreihendarstellung für Si(x) und Φ(x), aber, wie schon erwähnt, sind diese beiden
8.6 Integration rationaler Funktionen
141
Funktionen nachweisbar keine elementaren Funktionen.
Aufgaben zu Abschnitt 8.33
1. Berechnen Sie:
a)
R
2. Zeigen Sie
a)
R2π
b)
R2π
x2 sin x dx,
b)
R
x2 ex dx,
c)
R
sin x cos x dx.
einx e−imx dx = 0 für n, m ∈ N, n 6= m,
0
sin nx sin mx dx = 0 für alle n, m ∈ N, n 6= m.
0
3. Berechnen Sie:
R
d) √xx2 −1 dx,
a)
R
e)
R
tan x dx =
√ dx
2−x2
R
sin x
cos x
dx,
b)
R
2
x e−x dx,
R
ln(2x+1) dx,
dx.
4. Entscheiden Sie, für welche k ∈ N die Funktionen fk (x) = xk e−x
grierbar sind.
8.6
c)
2 /2
elementar inte-
Integration rationaler Funktionen
In diesem Abschnitt soll gezeigt werden, dass rationale Funktionen elementar integrierbar
sind. Wir werden dies am Beispiel demonstrieren und die notwendigen Verallgemeinerungen für den allgemeinen Fall diskutieren. Die Hauptidee für die Integration rationaler
Funktionen besteht in der Anwendung der Methode der Partialbruchzerlegung.
Unser Beispiel ist die Funktion
f (x) =
x2 + 6x + 3
.
x3 + x2 − 2
1. Schritt. Wir nehmen eine Zerlegung der Nennerfunktion N (x) = x3 + x2 − 2 in reell
irreduzible Faktoren vor (vgl. Aufgabe 2 aus Abschnitt 6.5). Die reelle Nullstelle x0 = 1
von N (x) ermöglicht die Abspaltung des Linearfaktors (x − 1), und es ist
N (x) = (x − 1)(x2 + 2x + 2)
mit dem irreduziblen Faktor (x2 + 2x + 2).
2. Schritt. Ausgehend von der Zerlegung der Nennerfunktion betrachten wir den Ansatz
f (x) =
A
x2 + 6x + 3
Bx + C
=
+ 2
3
2
x +x −2
x − 1 x + 2x + 2
und versuchen, Zahlen A, B und C geeignet zu bestimmen. Die Multiplikation mit der
Nennerfunktion N (x) ergibt
x2 + 6x + 3 = A(x2 + 2x + 2) + (Bx + C)(x − 1)
= (A + B)x2 + (2A − B + C)x + 2A − C .
Der Koeffizientenvergleich führt auf das eindeutig lösbare lineare Gleichungssystem
142
8 INTEGRALRECHNUNG
A
2A
2A
+ B
− B
+ C
− C
= 1
= 6
= 3
mit den Lösungen A = 2, B = − 1 und C = 1.
3. Schritt. Wir können nun die Einzelterme integrieren. Es ist
Z
2
a) I1 =
dx
=
2 ln | x − 1 | + C,
x
−
1
Z
Z
−x + 1
−x + 1
b) I2 =
dx =
dx,
2
x + 2x + 2
(x + 1)2 + 1
und die Substitution z = x + 1, dz = dx, ergibt
Z
Z
Z
−z + 2
z
dz
dz = −
dz + 2
I2 =
2
2
z +1
z +1
1 + z2
Z
1
2z
= −
dz + 2 arctan z
2
2
z +1
Z
1
1
du + 2 arctan z, (u = z 2 + 1),
= −
2
u
= −
= −
1
ln | z 2 + 1 | + 2 arctan z + C
2
1
ln((x + 1)2 + 1) + 2 arctan(x + 1) + C .
2
Zusammenfassend ist
Z
f (x)dx = 2 ln |x − 1| −
1
ln(x2 + 1) + arctan(x + 1) + C.
2
Damit ist das Beispiel vollständig behandelt.
Der allgemeine Fall einer echt gebrochenen rationalen Funktion
f (x) =
Z(x)
Z(x)
=
r
r
N (x)
(x − a1 ) 1 · . . . · (x − ak ) k · ((x − b1 )2 + c1 )s1 · . . . · (x − bl )2 + cl )sl
führt auf die Partialbruchzerlegung
f (x) =
A1
Ar 1
B1 x + C1
Bs1 x + Cs1
+...+
+...+
+...+
+...,
r
2
1
(x − a1 )
(x − a1 )
((x − b1 ) + c1 )
((x − b1 )2 + c1 )s1
und die Algebra lehrt, dass es eindeutig bestimmte reelle Zahlen Aj , Bj , Cj mit dieser
Eigenschaft wirklich gibt. Die Integration der Terme
Aj
(x − a1 )p
8.6 Integration rationaler Funktionen
143
ist durch die Substitution z = x − a1 zu erledigen. Für die Integration von
Bj x + Cj
((x − b1 )2 + C1 )q
substituieren wir u = x − b1 . Das führt auf einen Ausdruck der Form
Dj u
Ej
Dj u + Ej
=
+
.
2
q
2
q
2
(u + C1 )
(u + C1 )
(u + C1 )q
Der erste Summand wird durch die Substitution v = u2 +C1 , dv = 2u du, leicht
√zugänglich,
2
2
während der zweite Summand durch die Substitution u = C1 w , du = ± C1 dw, auf
die Form
Fj
2
(w + 1)q
gebracht werden kann. Für Integrale der Form
Z
1
Iq : =
dw
2
(w + 1)q
finden wir schließlich die folgende Rekursionsformeln
I1 = arctan w + C,
1
w
2q − 1
Iq+1 =
+
Iq .
2
q
2q (w + 1)
2q
In der Tat führt eine partielle Integration von Iq mit
1
,
g 0 (w) = 1,
(w2 + 1)q
2qw
h0 (w) = −
, g(w) = w,
2
(w + 1)q+1
h(w) =
auf die Gleichung
Z
w
dw
w2
=
=
+
2q
dw
(w2 + 1)q
(w2 + 1)q
(w2 + 1)q+1
Z
w
w2 + 1
1
=
+
2q
−
dw
(w2 + 1)q
(w2 + 1)q+1
(w2 + 1)q+1
Z
Iq
=
(w2
w
+ 2q (Iq − Iq+1 ),
+ 1)q
und die Auflösung dieser Gleichung nach Iq+1 ergibt die behauptete Rekursionsformel.
Aufgaben zu 8.6
1. Integrieren Sie die Funktion f (x) =
3x3 − 8x2 + 5x − 9
.
x4 − 3x3 + x2 + 4
2. Integrieren Sie die Funktion f (x) =
x3
.
x2 − 2x + 1
144
8.7
8 INTEGRALRECHNUNG
Vertauschung von Limes und Integral
Das Problem: Ist (fn ) eine Folge integrierbarer Funktionen auf dem Intervall I und
konvergiert die Folge (fn (x)) für jedes x ∈ I, so kann durch die Gleichung
f (x) = lim fn (x),
n→n
x ∈ I,
eine neue Funktion f auf I definiert werden. Es erhebt sich nun die Frage, ob f selbst
wieder integrierbar ist und ob sogar
Z
Z
lim fn (x)dx = lim
fn (x)dx
(?)
n→∞
n→∞
gilt. Eine solche Aussage war uns in 8.33 bei der Integration von Potenzreihen bereits
begegnet. Im allgemeinen ist aber für das Riemannsche Integral eine positive Antwort nur
unter ziemlich starken Voraussetzungen zu erhalten.
Wir betrachten zunächst zwei Gegenbeispiele. Es sei I = [0, 1]. Die Menge M = [0, 1] ∩ Q
der rationalen Zahlen im Intervall I werde zu einer Folge M = {r1 , r2 , . . .} angeordnet.
Wir definieren eine Folge (fn ) von Funktionen durch
(
fn (x) =
1
für x ∈ {r1 , . . . , rn },
0
sonst.
Dann ist jede Funktion fn integrierbar mit
R1
fn (x)dx = 0. Die Grenzfunktion
0
f (x) = lim fn (x)
n→∞
ist aber gerade die Dirichlet–Funktion, die sich als nicht Riemann–integrierbar erwiesen
hatte. Das zeigt, dass Grenzfunktionen Riemann–integrierbarer Funktionen nicht einmal
Riemann–integrierbar sein müssen. Dieser Mangel des Riemannschen Integrals war für H.
Lebesgue (1875 – 1941) der Anlass, ein leistungsfähigeres Integral, das heute Lebesgue–
Integral genannt wird und von größter Bedeutung in der modernen Mathematik ist, zu
schaffen. Die Einführung dieses Integrals geht über dem Rahmen dieses Lehrmaterials
hinaus und ist einem Kurs Maß– und Integrationstheorie vorbehalten.
Weiter zeigt sich (und dieser Effekt wird auch beim Lebesgue–Integral auftreten), dass im
Fall der Integrierbarkeit der Grenzfunktion die Gleichung (?) dennoch nicht gelten muss.
Für die in Abbildung 8.7 definierte Folge stetiger Funktionen fn gilt offenbar fn (x) → 0
für alle x ∈ [0, 1], aber andererseits ist
Z1
Z1
fn (x) dx = 1 6= 0 =
fn (x)dx = 1, also lim
0
Z1
0
0 dx.
0
Um zu positiven Ergebnissen zu kommen, müssen wir bei Verwendung des Riemannschen
Integrals stärkere Voraussetzungen an die Güte der Konvergenz fn (x) → f (x) machen.
Wir verallgemeinern dazu die Definition der gleichmäßigen Konvergenz (siehe Def. 6.18),
die wir bisher nur für stetige Funktionen eingeführt hatten, ein wenig:
8.7 Vertauschung von Limes und Integral
145
Abbildung 29: Eine Funktionenfolge mit limn
R
fn (x) dx 6=
R
limn fn (x) dx
Definition 8.35 Eine Folge von Funktionen fn heißt gleichmäßig konvergent gegen
die Funktion f auf dem Intervall I, wenn die folgende Bedingung erfüllt ist:
lim sup | fn (x) − f (x) | = 0.
n→∞
x∈I
Ein wichtiges Beispiel einer solchen Situation behandelt der folgende Satz, den wir auch
schon früher hätten beweisen können:
Satz 8.36 Die Folge der Partialsummen einer Potenzreihe f konvergiert auf jeder kompakten Teilmenge des Konvergenzkreises sogar gleichmäßig gegen f .
P
Beweis. Es sei f (x) =
an (x − x0 )n mit Konvergenzradius R > 0 gegeben. Zu jeder
kompakten Teilmenge M ⊆ KR (x0 ) = {x : |x − x0 | < R} existiert eine Zahl 0 ≤ ρ < R
mit M ⊆ {x : |x − x0 | ≤ ρ} ⊆ KR (x0 ). Also ist
∞
∞
n
X
X
X
ak ρk → 0,
ak (x − x0 )k ≤
ak (x − x0 )k ≤ sup sup f (x) −
x∈M
|x−x0 |≤ρ
k=n+1
k=1
k=n+1
was zu beweisen war.
Nun gilt der folgende Grenzwertsatz:
Satz 8.37 (Ein Grenzwertsatz) Konvergiert die Folge (fn ) von Riemannintegrierbaren Funktionen auf dem beschränkten, abgeschlossenen Intervall I gleichmäßig
gegen die Funktion f , so ist f integrierbar und es gilt
Z
Z
lim
fn (x)dx =
f (x)dx.
n→∞
I
I
Beweis. Die Funktion f ist als gleichmäßiger Grenzwert von beschränkten Funktionen
selbst beschränkt. Die Integrierbarkeit von f beweisen wir mit dem Riemannschen Integrabilitätskriterium. Es sei ε > 0 beliebig gegeben. Dann existiert eine Zahl N = N (ε)
derart, dass die folgende Ungleichung gilt:
ε
sup |f (x) − fn (x)| <
für alle n ≥ N.
µ(I)
x∈I
146
8 INTEGRALRECHNUNG
Zu fN wählen wir nun eine Zerlegung Z derart, dass S(fN , Z) − S(fN , Z) < ε gilt. Dann
ist
S(f, Z)−S(f, Z) ≤ |S(f, Z)−S(fN , Z)|+|S(fN , Z)−S(fN , Z)|+|S(fN , Z)−S(f, Z)| < 3ε.
Also ist f integrierbar. Überdies gilt
Z
Z
Z
|fn (x) − f (x)| dx ≤ ε für alle n ≥ N (ε),
f (x)dx ≤
fn (x)dx −
I
I
I
und das beweist die Behauptung des Satzes.
Anwendung betrachten wir die Formel für die Differentiation eines Integrals nach
einem Parameter. Es seien I und J zwei kompakte Intervalle, und die Funktion f (x, t) :
∂
I×J → R sei auf I×J stetig partiell differenzierbar nach t. Dann ist die Ableitung ∂t
f (x, t)
auf I × J sogar gleichmäßig stetig, und es gilt
Z
Z
d
∂
f (x, t) dx.
f (x, t) dx =
dt
∂t
I
I
Beweis. Unter Verwendung des Mittelwertsatzes der Differenzialrechnung sieht man, dass
die Folge der Differenzenquotienten bezüglich t gleichmäßig auf I gegen die partielle
Ableitung konvergiert. Daher ist der Satz 8.37 anwendbar.
Aufgaben zu Abschnitt 8.7
d
1. Berechnen Sie
dt
Z1
d
sin(tx) dx und
dt
0
Zt
sin(tx) dx.
0
2. Darf man für die Funktionenfolge (fn (x)) mit fn (x) =
R∞
mit dem Integral −∞ vertauschen?
8.8
√1
2πn
x2
e− 2n den Limes lim
n→∞
Uneigentliche Integrale
Wir wollen in diesem Abschnitt die Integration auf unbeschränkte Intervalle und auf
unbeschränkte Funktionen ausdehnen. Dazu definieren wir:
Definition 8.38 Die Funktion f sei auf dem Intervall [a, b) definiert und auf jedem abgeschlossenen Teilintervall [a, c] ⊆ [a, b) integrierbar. Dann heißt
Zb
Zc
f (x) dx = lim
f (x) dx
c%b
a
a
das uneigentliche Integral von f auf [a, b), falls der Limes existiert. Entsprechend wird
die Integration auf (a, b] und auf (a, b) definiert.
8.8 Uneigentliche Integrale
147
Bemerkung 8.39 Falls f auf dem Intervall [a, b] integrierbar ist, so fallen das eigentliche
und das soeben definierte uneigentliche Integral zusammen, so dass die Symbolik nicht
zweideutig ist. In der Tat gilt für integrierbare Funktionen die Abschätzung
Zc
Z b
Zb
f (x) dx =
f (x) dx≤ |b − c| · sup |f (x)| → 0 für c % b.
f (x) dx −
a≤x≤b
a
a
c
Beispiel 8.40 Wir betrachten einige Beispiele.
K
RK −x
R∞ −x
−x e dx = lim −e = 1 − lim (−e−K ) = 1.
(a) e dx = lim
(b)
R1
ln x dx = lim
R∞
1
R1
ε&0 ε
0
(c)
K→∞
K→∞ 0
0
1
x
RK
dx = lim
K→∞ 1
K→∞
0
1
ln x dx = lim x ln x − x = lim (−1 − ε ln ε + ε) = −1
ε&0
ε&0
ε
1
x
dx = lim ln K = ∞
K→∞
∞ (
R∞ dx
∞
x−α+1 = lim
=
(d)
1
α
K→∞ −α + 1
1 x
1
α−1
für 0 < α < 1
für α > 1.
Uneigentliche Integrale können auch vorteilhaft bei Konvergenzuntersuchungen unendlicher Reihen eingesetzt werden, wir hatten das folgende Kriterium bereits in 5.11 benutzt.
Satz 8.41 (Cauchyscher Integraltest) Es sei f eine monoton fallende nicht negative
Funktion auf [1, ∞). Dann gilt
Z∞
f (x) dx < ∞
genau dann, wenn
∞
X
f (n) < ∞.
n=1
1
Beweis. Die Idee des Beweises besteht darin, die Summen
K
P
f (n) als Ober- bzw. Un-
n=1
tersummen des Riemannschen Integrals aufzufassen. Es gelte zunächst
R∞
f (x) dx < ∞.
1
Wegen
∞
X
f (n) = lim
K→∞
n=2
K
X
n=2
f (n) = lim
K
X
K→∞
Z∞
ZK
f (n)·(n−(n−1)) ≤ lim
konvergiert dann die Reihe. Setzen wir umgekehrt
1
∞
P
f (x)dx < ∞
f (x)dx =
K→∞
n=2
1
f (n) < ∞ voraus, so folgt
n=1
ZK
Z2
f (x)dx ≤
1
ZK
f (x)dx ≤ f (1) +
f (x)dx +
1
2
K−1
X
n=1
f (n) ≤ f (1) +
∞
X
n=1
f (n) < ∞.
148
8 INTEGRALRECHNUNG
Daraus folgt lim
RK
K→∞ 1
f (x)dx < ∞.
In 5.11 haben wir das Kriterium bereits zur Untersuchung der Dirichlet-Reihen
∞
P
k=1
1
kα
in
Abhängigkeit von α > 0 benutzt und einen Umschlag im Konvergenzverhalten für α = 1
gefunden. Da wir inzwischen über leistuungsfähige Methoden zur Berechnung von Integralen verfügen, können wir aber mit Hilfe des Integraltestes sogar Feinuntersuchungen zu
dieser Reihe anstellen. Dies ist der Inhalt von Aufgabe 1. Als weiteres Beispiel betrachten
wir die Γ-Funktion.
8.42 (Die Γ-Funktion) Die Funktion
Z∞
Γ(s) =
xs−1 e−x dx,
s > 0,
0
heißt Gamma-Funktion. Der Name wurde zu Ehren von Carl Friedrich Gauss gewählt
und die Nützlichkeit dieser Funktion werden wir sogleich beleuchten. Wir weisen zunächst
die Konvergenz des Integrals nach. Es sei s > 0. Die Funktion f (x) = xs−1 e−x ist auf [1, ∞)
nichtnegativ und wegen
f 0 (x) = (s − 1)xs−2 e−x − xs−1 e−x = (s − 1 − x)xs−2 e−x < 0 für x > s − 1
auf (s − 1, ∞) auch monoton fallend. Für die Konvergenz von
R∞
f (x)dx genügt es daher
1
nach 8.41, die Konvergenz der Reihe
X
f (n) =
n≥s
∞
X
ns−1
en
n=1
nachzuweisen. Das Wurzelkriterium ergibt
√
n
ns−1 e−n →
also konvergiert die Reihe und damit auch
R∞
1
< 1,
e
f (x)dx. Weiter ist
1
Z1
x
0
s−1 −x
Z1
e dx ≤
x
0
s−1
Z1
dx = lim
x
ε→0
ε
s−1
1
xs 1
=
dx = lim
ε→0 s
s
ε
für alle s > 0. Das zeigt insgesamt, dass Γ(s) für alle s > 0 definiert ist. Wir beweisen
nun die wichtige Rekursionsformel:
Γ(1) = 1 und Γ(s + 1) = s Γ(s) für alle s > 0.
8.9 Integration und Inhaltslehre
149
In der Tat erhält man (Partielle Integration!):
∞
Z∞
Z∞
s −x
s −x xs−1 e−x dx = 0 + s Γ(s),
Γ(s + 1) =
x e dx = −x e + s
0
Z∞
Γ(1) =
0
0
∞
e−x dx = −e−x 0 = 1.
0
Als Folgerung ergibt sich
Γ(n + 1) = n! für alle n ∈ N.
Die Γ-Funktion ist also eine differenzierbare Fortsetzung der Fakultätsfunktion
(s. Aufgabe 4).
Aufgaben zu Abschnitt 8.8
1. Man zeige unter Verwendung von 8.41, dass die Reihe
die Reihe
∞
P
n=2
∞
P
n=2
1
n(ln n)2
1
n ln n
auch noch divergiert,
aber bereits konvergiert.
2. Man berechne die 1. kosmische Geschwindigkeit.
3. Fertigen Sie eine Skizze des Graphen der Γ-Funktion an.
4. Beweisen Sie, dass die Γ-Funktion auf (0, ∞) konvex ist.
8.9
Integration und Inhaltslehre
Den Flächeninhalt der Ordinatenmenge einer stetigen Funktion haben wir bereits in Definition 8.14 mit Hilfe des Integrals eungeführt. In diesem Abschnitt wollen wir nun allgemein und systematisch den Riemannschen Flächeninhaltsbegriff einführen, auch um eine
höherdimensionale Inhaltslehre zu begründen. Nach der bereits von Archimedes benutzten Exhaustionsmethode (= Methode des Ausschöpfens) gehen wir dabei folgendermaßen
und in großer Analogie zur Definition des Riemannschen Integrals vor:
Definition 8.43 (Der 2dim Riemannschen Inhalt) Der zweidimensionale
mannsche Inhalt einer Menge M ⊂ R2 wird schrittweise definiert:
Rie-
1. Unter einem Eichquadrat n–ter Ordnung verstehen wir eine Menge der Form
m m+1
k k+1
Qn;m,k = n ,
× n,
⊂ R2 für k, m, n ∈ Z.
2
2n
2
2n
Es sei Qn die Menge aller Eichquadrate n-ter Ordnung. Die Zahl en =
der elementare Flächeninhalt der Eichquadrate n-ter Ordnung.
1 2
2n
heißt
150
8 INTEGRALRECHNUNG
2. Für eine beschränkte Menge M ⊆ R2 definieren wir den inneren bzw. äußeren
Inhalt der Menge M vom Grad n durch
µn (M ) = en ·card{Q ∈ Qn : Q ⊆ M } bzw. µn (M ) = en ·card{Q ∈ Qn : M ∩Q 6= ∅}.
Weiter definieren wir den inneren bzw. äußeren Inhalt von M durch
µ(M ) = sup µn (M ) = lim µn (M ) bzw. µ(M ) = inf µn (M ) = lim µn (M ).
n∈N
n→∞
n→∞
n∈N
3. Schließlich heißt die Menge M quadrierbar, wenn µ(M ) = µ(M ) ist. In diesem
Fall heißt die Zahl µ(2) (M ) = µ(M ) = µ(M ) der 2–dimensionale Riemannsche
oder auch der Peano–Jordansche Inhalt von M .
Abbildung 30: Der Riemannsche Inhalt einer Menge M
Nicht jede Teilmenge M ⊂ R2 ist quadrierbar, ein solches Beispiel ist die Ordinatenmenge
der Dirichletfunktion, also die Menge
M = {(x, y) ∈ R2 : x ∈ Q ∩ [0, 1], y ∈ [0, 1]}.
Für diese Menge ist nämlich µ(M ) = 0 6= µ(M ) = 1.
Ohne große Mühe (bitte ausführen!) beweist man:
Satz 8.44 Der zweidimensionale Inhalt µ = µ(2) hat die folgenden Eigenschaften:
(a) µ(Q) = en für alle Eichquadrate Q ∈ Qn und µ(∅) = 0.
(b) Sind M1 , M2 ⊆ R2 quadrierbar mit M1 ⊆ M2 , so ist µ(M1 ) ≤ µ(M2 ). (Monotonie)
(c) Sind M1 , M2 ⊆ R2 quadrierbar und disjunkt, so ist M1 ∪ M2 quadrierbar und es gilt
µ(M1 ∪ M2 ) = µ(M1 ) + µ(M2 ).
(Additivität)
(d) Sind I1 , I2 Intervalle in R, so ist I1 × I2 quadrierbar und es gilt
µ(I1 ×I2 ) = µ(1) (I1 )·µ(1) (I2 ).
(Dimensionsredukion)
(e) Für jede Matrix A ∈ R2,2 und alle Eichquadrate Q gilt
µ(A(Q)) = µ{A~x : ~x ∈ Q} = | det A| · µ(Q).
8.9 Integration und Inhaltslehre
151
Wir wollen nun Methoden zur effektiven Berechnung von Inhalten entwickeln.
Definition 8.45 (Normalbereich) Eine Teilmenge M ⊆ R2 heißt ein Normalbereich
bezüglich der y-Achse, wenn es ein Intervall I = [a, b] ⊆ R und stetige Funktionen f und
g auf I so gibt, dass
M = Mgf = {(x, y) : x ∈ I, g(x) ≤ y ≤ f (x)}.
Die Verbindung von Inhaltslehre und Integration ist nun durch den folgenden Satz gegeben:
Satz 8.46 Normalbereiche Mgf sind quadrierbar, und es gilt
µ(Mgf ) =
f (x)
Zb Z
Zb
f (x) − g(x) dx =
a
dy dx.
a g(x)
Bemerkung. Das 2-dim. Cavallierische Prinzip ist ein Spezialfall dieses Satzes.
Beweis. Wir setzen M = Mgf . Es sei Z eine beliebige Zerlegung des Intervalls I. Dann gilt
nach Satz 8.44,(c)–(e), sicherlich
S(f, Z) − S(g, Z) ≥ µ(M ) ≥ µ(M ) ≥ S(f, Z) − S(g, Z).
Der Übergang zum Infimum (l. S.) bzw. Supremum (r. S.) über allen Zerlegungen liefert
Zb
Zb
f (x) − g(x) dx ≥ µ(M ) ≥ µ(M ) ≥
f (x) − g(x) dx.
a
a
Also ist µ(M ) = µ(M ) =
Rb
f (x) − g(x) dx.
a
Beispiel 8.47
(a) Für 0 < a < b sei M das durch das Intervall I = [a, b] und die Funktionen f (x) = x
und g(x) = 0 beschriebene Trapez. Dann ist
b
Zb
x2 b 2 − a2
(2)
µ (M ) = (x − 0)dx = =
.
2 a
2
a
(b) Wir berechnen den Flächeninhalt A der Ellipse mit den achsenparallelen Halbmessern a und b. Die Ellipse wird dann von den Funktionen
r
x 2
f± (x) = ±b 1 −
, x ∈ [−a, a],
a
berandet. Daher ist sie ein Normalbereich und es gilt (s.a. Beispiel 8.31b))
Za r
Z1 √
x 2
A=2 b 1−
dx = 2b a
1 − t2 dt = b · a · π.
a
−a
Aufgabe: Beweisen Sie die Formel e) in Satz 8.44.
−1
152
8 INTEGRALRECHNUNG
8.10
Gebietsintegrale
Will man die Masse eines Körpers B ⊆ R3 mit inhomogener Dichte ρ = ρ(x, y, z) ermitteln, so hat man ein Integral der Form
Z
ρ(x, y, z) d V (x, y, z)
m=
B
zu berechnen. Dabei wird dV (x, y, z) als ein Volumenelement bezeichnet. Es soll der Inhalt
dieses Abschnitts sein, ein solches Gebietsintegral zu definieren und dessen Eigenschaften zu untersuchen. Dabei gehen wir in Analogie zur Konstruktion des 1-dimensionalen
Riemann-Integrals vor.
Definition 8.48 (Gebietsintegrale) Es sei B ⊆ Rn eine beschränkte, abgeschlossene
und quadrierbare Menge, und es sei f (x) = f (x1 , . . . , xn ) = eine auf B definierte und
beschränkte Funktion.
1. Eine Zerlegung Z von B ist ein endliches System Z = {Mi : 1 ≤ i ≤ n} von
n
S
quadrierbaren Mengen Mi ⊆ B mit µ(Mi ∩ Mj ) = 0 für i 6= j und
Mi = B.
i=1
2. Die Obersumme bzw. Untersumme von f zur Zerlegung Z ist
S(f, Z) =
n
X
f (Mi ) µ(Mi )
bzw.
S(f, Z) =
i=1
n
X
f (Mi ) µ(Mi )
i=1
mit f (Mi ) = sup{f (x) : x ∈ Mi } und f (Mi ) = inf{f (x) : x ∈ Mi }.
3. Die Darbouxsche Obersumme bzw. Untersumme von f ist definiert durch
S(f ) = inf {S(f, Z) : Z Zerlegung von B},
S(f ) = sup {S(f, Z) : Z Zerlegung von B}.
4. Gilt S(f ) = S(f ), so heißt diese Zahl das Integral von f auf B, und man setzt
Z
Z
f (x) dx =
f (x1 , . . . , xn ) d(x1 , . . . , xn ) = S(f ) = S(f ).
B
B
Für das Gebietsintegral lassen sich ähnliche Kriterien wie für das 1-dimensionale Riemannsche Integral aufstellen. Insbesondere gilt wiederum:
Satz 8.49 (Riemannsches Integrabilitätskriterium) Eine Funktion f ist integrierbar auf der quadrierbaren Menge B ⊆ Rn genau dann, wenn es zu jedem ε > 0 eine
Zerlegung Z von B derart gibt, dass
S(f, Z) − S(f, Z) < ε
ausfällt.
8.10 Gebietsintegrale
153
Da für stetige Funktionen f auf abgeschlossenen beschränkten Teilmengen B ⊆ Rn wiederum der Satz vom Maximum und Minimum und der Satz von der gleichmäßigen Stetigkeit
gilt, beweist man wie in 8.9 den folgenden:
Satz 8.50 (Existenzsatz) IstR B ⊆ Rn abgeschlossen, beschränkt und quadrierbar und
ist f auf B stetig, so existiert f (x) dx.
B
Beweis. sei ε > 0 gegeben. Zu ε existiert wegen der gleichmäßigen Stetigkeit von f auf B
ein δ > 0 derart, dass für alle Punktepaare x, x0 ∈ B mit |x−x0 | ≤ δ auch |f (x)−f (x0 )| ≤
ε gilt. Wir wählen eine Zerlegung Z = {Mi : 1 ≤ i ≤ n} mit d(Mi ) = sup{|x−x0 | : x, x0 ∈
M } ≤ δ. Dann gilt f (Mi ) − f (Mi ) ≤ ε. Folglich ist
S(f, Z) − S(f, Z) =
n
X
(f (Mi ) − f (Mi )) µ(Mi ) ≤ ε ·
i=1
n
X
µ(Mi ) = ε µ(B).
i=1
Da ε beliebig war, ist f nach Satz 8.49 integrierbar.
Ohne Schwierigkeiten zeigt man, dass das Gebietsintegral positiv, additiv und homogen
ist. Ferner gilt für stetige Integranden der Mittelwertsatz, den man wiederum wie im
1-dimensionalen Fall beweist:
Satz 8.51 (Mittelwertsatz) Ist B ⊆ Rn quadrierbar, abgeschlossen, beschränkt und
zusammenhängend8 und ist f auf B stetig, so existiert ein x0 ∈ B mit
Z
f (x) dx = f (x0 ) · µ(B).
B
Wir sind nunmehr in der Lage, Gebietsintegrale unter geeigneten Voraussetzungen auf wiederholte eindimensionale Integration zurückzuführen und somit die Technik der Stammfunktionen auszunutzen. Wir begnügen uns dabei mit dem zweidimensionalen Fall.
Satz 8.52 (Reduktionssatz, iterierte Integration) Es sei Q = I × J ⊆ R2 ein abgeschlossenes Rechteck und es sei f auf Q definiert und stetig. Dann gilt
Z
Z Z
Z Z
f (x, y)dy dx.
f (x, y)d(x, y) =
f (x, y)dx dy =
Q
J
I
I
J
Das Gebietsintegral auf dem Rechteck Q kann also durch zwei iterierte 1-dimensionale
Integrale berechnet werden.
Beweis. Wir setzen
Z
α=
Z
f (x, y)d(x, y) und β =
Q
8
Z
f (x, y)dx dy.
J
I
Eine Menge B heißt (bogen-)zusammenhängend, wenn je zwei Punkten x, y ∈ B durch eine Kurve,
die ganz in B verl}äuft, verbunden werden können.
154
8 INTEGRALRECHNUNG
Es sei ε > 0 beliebig gegeben. Da f auf der kompakten Menge Q sogar gleichmäßig stetig
√
ist, existiert ein δ > 0 derart, dass | f (x)−f (x0 ) | < ε für alle x, x0 ∈ Q mit |x−x0 | ≤ 2 δ
gilt. Wir wählen disjunkte Zerlegungen {Ii : 1 ≤ i ≤ n} von I und {Jj : 1 ≤ j ≤ m} von
J mit d(Ii ) ≤ δ und d(Jj ) ≤ δ für alle i, j. Dann√ist {Ii × Jj : 1 ≤ i ≤ n, 1 ≤ j ≤ m}
eine disjunkte Zerlegung von Q mit d(Ii × Jj ) ≤ 2δ. Weiter ist
X Z
XZ Z
α=
f (x, y)d(x, y) und β =
f (x, y)dx dy.
i,j
i,j J
j
Ii ×Jj
Ii
Wir betrachten die Differenz zweier Summanden zum Index i, j. Es ist
Z
Z Z
f (x, y)d(x, y) −
f (x, y)dx dy ≤
Ii ×Jj
Jj
Ii
≤ max f (x, y) · µ(Ii × Jj ) − min f (x, y) · µ(2) (Ii )µ(2) (Jj )
Ii ×Jj
≤
Ii ×Jj
max f (x, y) − min f (x, y) · µ(2) (Ii × Jj ) ≤ εµ(2) (Ii × Jj ).
Ii ×Jj
Ii ×Jj
Das ergibt
α−β ≤ε·
X
µ(2) (Ii × Jj ) = ε · µ(2) (Q).
i,j
Entsprechend zeigt man β − α ≤ ε · µ(2) (Q). Folglich ist |α − β| ≤ ε · µ(2) (Q). Da ε > 0
beliebig war, ist das nur für α = β möglich.
Als Beispiel betrachten wir die Funktion f (x, y) = x2 y auf dem Rechteck B = [−1, 1] ×
[0, 1]. Es ist
Z
2
Z1 Z1
x y d(x, y) =
B
2
Z1
x y dy dx =
−1
0
x
−1
2y
2 1
dx =
2 0
Z1
−1
1
x3 2
x2
dx =
= .
2
6 −1 6
Der Reduktionssatz lässt sich von Rechtecken auf Normalbereiche verallgemeinern:
Satz 8.53 (Iterierte Integrale, Fubini) Es seien g, h : [a, b] → R stetige Funktionen,
und es sei Mgh = {(x, y) : a ≤ x ≤ b, g(x) ≤ y ≤ h(x)} ⊆ R2 der hierdurch definierte
Normalbereich. Ferner sei f : Mgh → R eine stetige Funktion. Dann ist
h(x)
Zb Z
Z
f (x, y)d(x, y) =
Mgh
f (x, y)dy dx.
a
g(x)
Beweis. Wie im Beweis zu Satz 8.46 gezeigt wurde, existiert zu jedem ε > 0 eine endliche
Menge von paarweise disjunkten Rechtecken Qi = Ii × Ji mit
n
[
X (2)
h
(2)
h
M=
Qi ⊆ Mg und µ (Qi ) − µ (Mg ) < ε.
i=1
i
8.10 Gebietsintegrale
155
Unter Verwendung der Additivität des Riemannschen Inhalts und des zweidimensionalen
Riemannschen Integrals folgt nun
Z
Z
Z
f (x, y)d(x, y) f (x, y)d(x, y) = f (x, y)d(x, y) −
M
Mgh
Mgh \M
≤ max | f | · µ(2) (Mgh \ M ) = max | f | · ε.
Für das Integral über M ergibt sich mit Satz 8.52 die Gleichung
Z
Z
X Z
X Z
f (x, y)d(x, y) =
f (x, y)d(x, y) =
f (x, y)d(x, y) =
S
M
i
Qi
i
Qi
Ii
Z
f (x, y)dy dx.
Ji
Sind die Intervalle Ii hinreichend schmal gewählt, so ist
(h(x) − g(x)) − µ(Ji ) ≤ ε für alle x ∈ Ii
auf Grund der gleichmäßigen Stetigkeit von h und g. Somit gilt
h(x)
Z
Z
f (x, y)dy ≤ max | f | · ε für alle x ∈ Ii .
f (x, y)dy −
Ji
g(x)
Das ergibt wegen des Reduktionssatzes für Rechtecke:
h(x)
Z
Zb Z
f
(x,
y)d(x,
y)
−
f
(x,
y)dy
dx
a
M
g(x)
Z
X
= Z
Ii
Ji
i
f (x, y)dy dx −
X Z
i
Ii
h(x)
Z
f (x, y)dy dx g(x)
h(x)
Z
X Z Z
dx
=
f
(x,
y)dy
−
f
(x,
y)dy
i
Ii
Ji
≤ max | f | · ε ·
g(x)
X
µ(Ii ) = (b − a) max | f | · ε.
i
Die Zusammensetzung beider Ungleichungen liefert schließlich
h(x)
Z
Zb Z
≤ ε · const
f
(x,
y)d(x,
y)
−
f
(x,
y)dy
dx
Mgh
a
g(x)
für alle ε > 0. Folglich sind beide Terme untereinander gleich.
156
8 INTEGRALRECHNUNG
Z
|x| d(x, y) mit EK = {(x, y) :
Beispiel 8.54 Wir berechnen
p
x2 + y 2 ≤ 1. Es ist
EK
√
Z1−x2
Z1
Z
|x| dy dx =
|x| d(x, y) =
√
− 1−x2
−1
EK
Z1
Z1
= 2
2x
√
√
|x| · 2 1 − x2 dx
−1
Z0
1−
x2
dx = −2
√
Z1
z dz = 2
1
0
0
√
√ 1
( z)3 1
z dz =
= .
3 0 3
8.55 (Ein Gegenbeispiel) Die Reduktionsformeln 8.52 und 8.53 lassen die Frage aufkommen, warum wir Gebietsintegrale nicht von Hause aus durch iterierte niederdimensionale Integrale definiert haben. Als Mahnung zur Vorsicht betrachten wir das folgende
Beispiel iterierter (uneigentlicher) Integrale,
RR
R R wo aus der Existenz des Integrals
f (x, y)dx dy nicht einmal die Existenz von
f (x, y)dy dx folgen muss. Dazu sei
f (x, y) =
Z1 Z1
Dann ist
Z1
f (x, y)dx dy =
0
−1
0
Z1 Z1
Z1
f (x, y)dy dx wegen
−1
0
x/y
0
für
für
y>0
.
y=0
1
Z1
x2 dy =
0 dy = 0, während das Integral
2y −1
0
x
dy = sgn(x) · ∞ für x 6= 0 nicht existiert.
y
0
R
Im Vorgriff auf dreidimensionale Inhaltslehre µ(3) und Integration
d(x, y, z) zeigen wir
unter Verwendung eines entsprechenden Satzes über iterierte Integrale die nützliche Formel. Sie ließe sich auch mittels Satz 8.58 und Zylinderkoordinaten beweisen.
Beispiel 8.56 (Volumenformel für Rotationskörper) Es sei
p
B = (x, y, z) : a ≤ x ≤ b, y 2 + z 2 ≤ f (x)
ein Körper, der durch Rotation der Kurve y = f (x) um die x-Achse entsteht. Dann gilt
[
p
B=
Kx mit Kx = {(y, z) :
y 2 + z 2 ≤ f (x)}.
a≤x≤b
Somit ist
(3)
Zb Z
Z
µ (B) =
d(x, y, z) =
d(y, z)dx =
a
B
(3)
Zb
a
Kx
Zb
Das ergibt schließlich µ (B) = π
a
µ
f (x)2 dx.
(2)
Zb
(Kx )dx =
a
f (x)2 π dx.
8.11 Die Transformationsformel
157
Abbildung 31: Rotationskörper
Für die dreidimensionale Kugel Kr mit Radius r > 0 ergibt das
(3)
Zr
2
2
(r − x ) dx = π
µ (Kr ) = π
−r
x3
r x−
3
2
r
= 4 π r3 .
3
−r
Aufgaben zu Abschnitt 8.10
1. Berechnen Sie das Volumen des Rotationsellipsoids
2
y2 z2
3 x
E = (x, y, z) ∈ R : 2 + 2 + 2 ≤ 1 .
a
b
b
Z
2. Berechnen Sie das Integral Θ =
x2 + y 2 d(x, y, z) für die Scheibe B vom Radius
B
r und der Dicke h, also B = {(x, y, z) : 0 ≤ z ≤ h, x2 + y 2 ≤ r2 } ⊆ R3 .
(Θ ist in der Physik das sogenannte axiale Trägheitsmoment der Scheibe B).
8.11
Die Transformationsformel
Wir stellen die Frage, wie sich eine Koordinatentransformation auf die Integration und
Inhaltsberechnung auswirkt. Im Ergebnis dieser Betrachtungen werden wir eine leistungsfähige Transformationsformel für mehrdimensionale Integrale erhalten, die als Verallgemeinerung der Substitutionsformel auf den mehrdimensionalen Fall aufgefasst werden
kann. Wir beginnen mit dem einfachsten Fall, der linearen Koordidatentransformation.
Dazu sei A ∈ Rn,n eine quadratische Matrix mit det A 6= 0. Diese Matrix erzeugt eine
Abbildung, die wir ebenfalls durch A bezeichnen:
A : Rn → Rn vermöge u 7→ x(u) = A · u.
In Koordinaten von u = (u1 , . . . , un ) und x = (x1 , . . . , xn ) ausgedrückt heißt das
xi =
n
X
j=1
aij uj mit A = (aij ),
158
8 INTEGRALRECHNUNG
und für späteres vermerken wir
∂ xi
= aij .
∂ uj
Es sei nun Q ⊆ Rn ein Quader. Dann ist sein Bild A(Q) ein Parallelepiped (s. Figur 8.11).
Abbildung 32: Affine Abbildung eines Rechtecks
Die lineare Algebra bzw. Satz 8.44e) zeigen, dass für die Inhalte die folgende Formel gilt:
µ(A(Q)) = | det A| · µ(Q).
(1)
Für die Integration stetiger Funktionen f auf A(Q) ergibt sich dann durch Approximation
der Integrale durch Zerlegungssummen die Beziehung
Z
Z
X
X
f (x) dx ≈
f (ξi ) µ (A(Qi )) =
f (ξi )· | det A|·µ(Qi ) ≈
f (x(u)) | det A| du,
Q
A(Q)
also die Transformationsformel
Z
Z
f (x)dx =
f (x(u)) · | det A| du
(2)
Q
A(Q)
für beliebige lineare Abbildungen A : Rn → Rn mit det A 6= 0 und alle auf A(Q) stetigen
Funktionen f .
Folgerung 8.57 Das mehrdimensionale Integral ist invariant bezüglich Kongruenzabbildungen des Raumes.
Beweis. Kongruenzabbildungen lassen sich in der Form x = T(u) = A · u + u0 beschreiben. Hierbei ist u0 ein fester Punkt in Rn und A ist eine orthogonale Matrix. Wegen
| det A| = 1 für solche Matrizen folgt die Behauptung aus (2).
Es sei nun T : Q → T (Q) ⊆ Rn eine nichtlineare Transformation, die die Punkte u ∈
Q auf x = x(u) abbildet. Die Weierstraßsche Zerlegungsformel ergibt die Linearisierung
x = x(u) = x0 +
∂ xi
∂ uj
(u − u0 ) + ρ(u0 , u − u0 ) · (u − u0 ).
(3)
8.11 Die Transformationsformel
159
Die hierin auftretende Matrix

∂ xi
∂ uj


= 


∂ x1
...
∂ u1
..
.
∂ xn
...
∂ u1

∂ x1
∂ un 



∂ xn 
∂ un
heißt Jacobi-Matrix , und sie gibt den wesentlichen Teil der Linearisierung an. Die Abbildung T lässt sich im Kleinen“ also durch eine lineare Abbildung ersetzen (s. Abb.
”
8.11).
Abbildung 33: Nichtlineare Abbildung eines Rechtecks
Folglich ergibt sich für kleine Quader Q mit den Formeln (1) und (3) die Näherungsformel
∂ xi µ(x(Q)) ≈ det
· µ(Q),
∂ uj die wir symbolisch auch in der Form
∂
x
i
· du
dx = det
∂ uj ausdrücken. Benutzt man diese Näherungen und die Überlegungen, die zur Formel (2)
führten so lässt sich der folgende Satz herleiten.
n
Satz 8.58 (Transformationsformel) Es sei Q ⊆ Rn ein Quader in R
, essei x = x(u)
eine stetig partiell differenzierbare Abbildung von Q auf x(Q) mit det ∂∂ uxji 6= 0 für alle
x ∈ Q. Dann gilt für jede auf x(Q) stetige Funktion f die Formel
Z
Z
∂
x
i
du.
f (x)dx =
f (x(u)) · det
∂ uj x(Q)
Q
Der detaillierte Beweis erfordert aber mit den beschränkten Mitteln der Riemannschen
Integrationstheorie erheblichen Aufwand. Da wir im Rahmen der Lebesguesschen Integrationstheorie noch weit stärkere Transformationsformeln mit eleganten Methoden erhalten
werden (Satz von Radon-Nikodym), verzichten wir im Gegensatz zum bisherigen Vorgehen
in diesem Material auf den präzisen Beweis und wenden uns stattdessen den vielfältigen
Anwendungen dieses wichtigen Satzes zu.
160
8 INTEGRALRECHNUNG
8.59 (Transformation auf Polarkoordinaten) Wir betrachten als Beispiel den
wichtigen Fall der Transformation auf Polarkoordinaten. Die kartesischen Koordinaten
(x, y) werden dabei vermöge der Gleichungen
x = r cos ϕ
y = r sin ϕ
durch
die
Polarkoordinaten
(r, ϕ)
ausgedrückt.
Ein
Rechteck
im
(r, ϕ)−Koordinatensystem von der Form Q = [r1 , r2 ] × [0, 2 π] wird dabei auf einen Kreisring mit den Radien r1 , r2 in der (x, y)-Ebene abgebildet. Die Funktionaldeterminante
hat den Wert

∂x
cos ϕ −r sin ϕ

∂ϕ 
=
∂y 
sin ϕ
r cos ϕ
∂ϕ
∂x
 ∂r
det 
 ∂y
∂r

= r cos2 ϕ + r sin2 ϕ = r,
und diese Transformation ist für alle ϕ ∈ [0, 2 π] und alle r > 0 zulässig.
Die Transformationsformel ergibt die Gleichung
Z
Z
f (x, y) d(x, y) =
f (x(r, ϕ), y(r, ϕ)) r d(r, ϕ).
Q
A(Q)
Symbolisch ist also d(x, y) = r d(r, ϕ).
Für den Flächeninhalt eines Kreissektors S vom Radius R und Winkel ϕ0 ergibt sich
beispielsweise
Z
µ(S) =
Zϕ0 ZR
Z
d(x, y) =
S
r dr dϕ =
0
[0,R]×[0,ϕ0 ]
R2
ϕ0 .
r dr dϕ =
2
0
Beispiel 8.60 Die Verwendung der Transformation von Polarkoordinaten erlaubt zusammen mit dem Reduktionssatz auch die Berechnung des in der Wahrscheinlichkeitsrechnung
R∞ −x2 /2
wichtigen Integrals α =
e
dx. Es ist nämlich
−∞
Z∞
α·α =
−x2 /2
e
Z∞
dx ·
−∞
−y 2 /2
e
Z
−∞
Z
=
−r 2 /2
e
[0,∞)×[0,2π]
e−(x
dy =
2 +y 2 )/2
d(x, y)
R2
Z2π Z∞
r d(r, ϕ) =
−r 2 /2
e
0
0
Z2π
− r 2 /2
−e
r dr dϕ =
0
∞
dϕ = 2 π.
0
8.11 Die Transformationsformel
Das ergibt
161
Z∞
α=
e− x
2 /2
dx =
√
2 π.
−∞
Aufgaben zu Abschnitt 8.11
1. Berechnen Sie das Volumen des Kreiszylinders mit Radius 1 und Achse = z-Achse,
der durch die Ebenen z = 0 und z = 4 − x − 2y abgeschnitten wird.
2. Der Schwerpunkt S = (xS , yS , zS ) eines Körpers V ⊆ R3 mit Dichte ρ = 1 berechnet
sich nach den Formeln (Summe aller Drehmomente ist Null):
Z
Z
Z
1
1
1
xS =
x d(x, y, z), yS =
y d(x, y, z), zS =
z d(x, y, z)
V
V
V
V
V
V
Man berechne den Schwerpunkt des Körpers aus Aufgabe 1.
3. Das Trägheitsmoment J einer um die z-Achse rotierenden Scheibe S vom Radius R
und Höhe h und Dichte ρ = 1 ergibt sich wie folgt. Berechnen Sie dies Integral.
Z
J = x2 + y 2 d(x, y, z).
S
4. Man berechne das Trägheitsmoment einer um eine Achse rotierenden Kugel vom
Radius R nach der Formel
Z
J=
x2 + y 2 d(x, y, z).
Kugel
5. Weisen Sie die folgenden Transformationsformeln nach:
a) Die Transformation auf Zylinderkoordinaten ist definiert durch
 


x
ρ cos ϕ
 y  =  ρ sin ϕ  für 0 < ρ und 0 ≤ ϕ < 2π.
z
z
Dabei ist ρ der Abstand des Punktes P (x, y, z) von der z-Achse, ϕ = arccos
x
ρ
und z die Höhe über der (x, y)-Ebene.
Erläutern Sie die Namensgebung und zeigen Sie d(x, y, z) = ρ d(ρ, ϕ, z) .
b) Die Transformation auf Kugelkoordinaten ist definiert durch
 


x
r cos ϕ cos ϑ
 y  =  r sin ϕ cos ϑ  für 0 < r, −π < ϕ ≤ π und − π/2 < ϑ < π/2.
z
r sin ϑ
Dabei ist r der Abstand des Punktes P (x, y, z) vom Ursprung, ϕ die geographische Länge und ϑ die geographische Breite (s. Abbildung 48.3). Erläutern
Sie die Namensgebung und zeigen Sie d(x, y, z) = r2 cos ϑ d(r, ϑ, ϕ) .
6. Berechnen Sie die Werte von Γ( 12 ) und Γ( 23 ).
162
8 INTEGRALRECHNUNG
Abbildung 34: Zylinder- und Kugelkoordinaten
8.12
Das Volumen der n-dimensionalen Kugel
Wir benutzen die Methoden der vorhergehenden Abschnitte zur Berechnung des Volumens
Vn (r) der n-dimensionalen Kugel
Kn (r) = {x ∈ Rn : |x| ≤ r}.
Die Dehnung u 7→ x(u) = r u überführt die Einheitskugel in die Kugel vom Radius r,
und die Funktionaldeterminante dieser Abbildung ist rn . Das zeigt
Z
Vn (r) = µ(Kn (r)) =
Z
rn du = rn µ(Kn (1)).
dx =
Kn (r)
Kn (1)
Also ist
Vn (r) = rn · Vn (1).
Es genügt daher, das Volumen Vn = Vn (1) der Einheitskugel in Abhängigkeit von n zu
ermitteln. Hierfür ergeben sich folgende Resultate:
V1
=
R1
dx
=
2,
d(x, y)
=
R2π R1
−1
V2
V3
=
=
R
K2
0
R
R1
d(x, y, z)
=
rdr dϕ = π,
0
R
d(y, z)dx =
−1 y 2 +z 2 ≤1−x2
K3
=
R1
−1
R1 R2π
−1
0
(1 − x ) · π dx = π x −
x3
3
2
√
1−x
R 2
ρ dρ dϕ dx
0
1
= 4 π.
3
−1
Durch Reduktion des vierdimensionalen Integrals auf zwei iterierte zweidimensionale
Integrale erhält man
8.12 Das Volumen der n-dimensionalen Kugel
V4
=
R
d(x, y, z, w)
R
=
163
R
d(x, y)d(w, z)
z 2 +w2 ≤1 x2 +y 2 ≤1−(z 2 +w2 )
K4
√
R2π R1 R2π
=
0
0
0
=
ρ dρ dϕ · σ dσ dψ
0
R1
4 π 2 12
1−σ
R 2
(1 − σ 2 ) σ d σ = 2 π 2
0
σ2
2
−
σ4
4
1 π 2
= .
2
0
Entsprechend dem Vorgehen zur Berechnung von V3 und V4 beweist man durch vollständige Induktion schließlich
V2k =
πk
2k+1 π k
und V2k+1 =
k!
3 · 5 · . . . · (2k + 1)
Tatsächlich gilt für k ≥ 1 :
Z
p
V2k =
V2k−2
1 − (x2 + y 2 ) d(x, y)
x2 +y 2 ≤1
π k−1
(1 − (x2 + y 2 ))k−1 d(x, y)
(k − 1)!
Z
=
x2 +y 2 ≤1
π k−1
=
(k − 1)!
Z2π Z1
0
πk
(1 − ρ2 )k−1 ρ dρ dϕ =
(k − 1)!
0
Z1
tk−1 dt =
πk
,
k!
0
und
Z1
V2k+1 =
1
Z
√
2
V2k ( 1 − x ) dx =
πk
πk
(1 − x2 )k dx =
k!
k!
−1
−1
R1
Für das Integral Ik =
Z1
(1 − x2 )k dx.
−1
(1 − x2 )k dx führt die Substitution x = sin t auf
−1
Zπ/2
Ik =
cos2k t cos t dt,
−π/2
und die partielle Integration ergibt
Zπ/2
Ik = 0 + 2k
2k−1
cos
Zπ/2
2
t · sin t dt = 2k
−π/2
−π/2
Zπ/2
= 2k
−π/2
cos2k−1 t · (1 − cos2 t) dt
cos2k−2 t · cos t dt − 2k
Zπ/2
−π/2
cos2k t cos t dt = 2k · Ik−1 − 2k Ik .
164
8 INTEGRALRECHNUNG
Das liefert die Rekursionsformel
2k
2k · (2k − 2) · . . . · 2
2k+1 · k!
Ik =
Ik−1 =
· 2=
.
2k + 1
(2k + 1) · . . . · 3
(2k + 1) · . . . · 3
Also ist
V2k+1 =
π k · 2k+1
.
3 · 5 · . . . · (2k + 1)
Abschließend untersuchen wir das Volumenverhältnis zwischen der n-dimensionalen Einheitskugel
n
X
Kn = {x ∈ Rn :
x2i ≤ 1}
i=1
und dem umschließenden n-dimensionalen Würfel
Wn = {x ∈ Rn : max | xi | ≤ 1}.
1≤i≤n
Da
P
2k /k! konvergiert (Quotientenkriterium), ist lim 2k /k! = 0. Daraus folgt
k→∞
lim
n→∞
µ(Kn )
=
µ(Wn )
lim
n→∞
Vn
= 0.
2n
Hochdimensionale Einheitskugeln haben also sehr kleine Volumina.
Aufgaben zu Abschnitt 8.12
1. Die Oberfläche der n-dimensionalen Kugel Kn (r) berechnet sich nach der Formel
d
Vn (r).
dr
Begründen Sie die Formel und ermitteln Sie die Oberfläche explizit.
|∂Kn (r)| =
2. Berechnen Sie das Volumen des Torus mit dem Seelenradius R und dem Radius
r < R der Querschnittsfläche.
8.13
Kurven und Bogenlängen
Zur Untersuchung von Kurven ist es notwendig, diesen Begriff mathematisch präzis zu
definieren.
Definition 8.61 (Kurve) Unter einer Parameterdarstellung einer Kurve versteht man
eine eindeutige, stetige Abbildung
t 7→ P (t) = (x1 (t), . . . , xn (t)) ∈ Rn
eines Intervalls [ta , te ] ⊆ R in den Raum Rn .Die Menge
C = {P (t) : ta ≤ t ≤ te }
heißt die zugehörige Kurve. Wir sprechen von einer glatten Kurve, wenn für alle t ∈
(ta , te ) die Ableitung P 0 (t) = (x01 (t), . . . , x0n (t)) existiert, stetig und für alle t ∈ (ta , te ) von
0 verschieden ist.
8.13 Kurven und Bogenlängen
165
Beispiel 8.62
1. Strecken sind gegeben durch P (t) = P0 + ta, ta ≤ t ≤ te , wobei a
ein beliebiger, von Null verschiedener Vektor des Rn ist.
2. Die Kreislinie in der Ebene mit Zentrum 0 und Radius R ist gegeben durch
R sin t
P (t) =
, 0 ≤ t ≤ 2π.
R cos t
3. Die Ellipsenlinie ist gegeben durch
A sin t
P (t) =
,
B cos t
0 ≤ t ≤ 2π,
wobei A und B die beiden Halbmesser der Ellipse sind.
4. Die Schraubenlinie im Raum um die z-Achse mit Steigung α ist gegeben durch




x(t)
R sin t
P (t) =  y(t)  =  R cos t  , 0 ≤ t ≤ 2π.
z(t)
αt/2π
Definition 8.63 (Bogenlänge) Es sei C eine Kurve mit Parameterdarstellung t 7→
P (t). Jede Zerlegung Z = {ta = t0 < t1 < t2 < . . . < tN = te } des Intervalls I = [ta , te ]
erzeugt eine Folge von Knotenpunkten {P (t0 ), P (t1 ), . . . , P (tN )} auf C, deren Verbindung
mit Geradenstücken einen Polygonzug Z ergibt, dessen Länge durch
Lg(C, Z) =
N
X
|P (tj ) − P (tj−1 )|
j=1
gegeben ist (s. Abb. 8.13). Unter der Kurvenlänge Lg(C) verstehen wir den (möglicherweise unendlichen Wert)
( N
)
X
Lg(C) = sup Lg(C, Z) = sup
|P (tj ) − P (tj−1 )| : Z = {tj }j=0,...,N ist eine Zerlegung .
j=1
Unter der Bogenlänge der Kurve verstehen wir die Funktion
s(t) = Lg(Ctta ) = Lg{P (τ ) : ta ≤ τ ≤ t}.
Es ist offensichtlich, dass die so definierte Länge Lg und die Bogenlänge s nicht von der
gewählten Parameterdarstellung abhängen (Beweis?).
Satz 8.64 Glatte Kurven t 7→ P (t) haben eine endliche Länge und es gelten
Zt
s(t) =
ta
|P 0 (τ )| dτ und s0 (t) = |P 0 (t)|.
166
8 INTEGRALRECHNUNG
Abbildung 35: Zur Definition der Bogenlänge
Beweis. Es sei Z = {t0 < t1 < . . . < tn } eine Zerlegung von It = [ta , t]. Nach dem
Hauptsatz der Differential–Integralrechnung gilt (koordinatenweise)
Ztk
P 0 (τ )dτ.
P (tk ) − P (tk−1 ) =
bk−1
Aus der linearen Algebra ist die Formel |~a| = max ~a · ~b bekannt. Hiermit folgt
|~b|≤1
Ztk
Ztk
Ztk
Ztk
P 0 (τ )dτ = max
P 0 (τ )·~b dτ ≤
max P 0 (τ )·~b dτ =
|P 0 (τ )| dτ.
|P (tk )−P (tk−1 )| = |~b|≤1
|~b|≤1
bk−1
bk−1
bk−1
bk−1
Das ergibt
n
X
|P (tk ) − P (tk−1 )| ≤
k=1
Damit ist s(t) ≤
Rt
Ztk
n
X
Zt
0
|P (τ )|dτ =
k=1 t
k−1
|P 0 (τ )|dτ.
ta
|P 0 (τ )|dτ bewiesen. Insbesondere ist Lg(C) = s(te ) ≤
Rte
|P 0 (τ )|dτ < ∞.
ta
ta
Wir betrachten jetzt das Kurvenstück {P (τ ), t ≤ τ ≤ t + h}. Dann gilt nach obigem
Zt+h
|P (t + h) − P (t)| ≤ s(t + h) − s(t) ≤
|P 0 (τ )| dτ,
t
also ist
Zt+h
P (t + h) − P (t) s(t + h) − s(t)
1
≤
≤
|P 0 (τ )|dτ = |P 0 (τ ∗ )|
h
h
h
t
∗
für ein geeignetes τ ∈ (t, t + h) nach dem Mittelwertsatz. Für h & 0 folgt daraus
|P 0 (t)| ≤ s0 (t) ≤ |P 0 (t)|,
also s0 (t) = |P 0 (t)|. (Der Vollständigkeit halber hätte auch noch der linksseitige Grenzwert h % 0 betrachtet werden müssen.) Die Integration dieser Gleichung ergibt wegen
s(ta ) = 0 die Behauptung des Satzes.
8.14 Oberflächeninhalte und Flächenintegrale
167
8.65 Wir betrachten einige Beispiele.
1. Der Kreisumfang ist
Z2π
0
|P (t)|dt =
Lg(C) =
0
Z2π p
r2 sin2 t + r2 cos2 t dt = 2π · r.
0
2. Der Umfang der Ellipse ist
Z2π
Lg(C) =
|P 0 (t)|dt =
Z2π p
Z2π r
0
0
0
a2 sin2 t + b2 cos2 t dt = a
sin2 t +
b2
cos2 t dt
a2
Z2π p
Z2π r
b2
2
1 − (1 − 2 ) cos t dt = a
1 − γ cos2 t dt
= a
a
0
0
2
mit γ = 1 − ab 2 . Dieses Integral ist für a 6= b nicht elementar auswertbar, es heißt
ein elliptisches Integral 2. Gattung.
3. Die Länge der Schraubenlinie für eine Umrundung ist
Lg(C) =
Z2π p
2
r2 sin t + r2 cos2 t + a2 dt =
0
Z2π √
r2 + a2 dt =
√
r2 + a2 · 2π.
0
Aufgaben zu Abschnitt 8.13
1. Berechnen Sie die Bogenlängenfunktion für die Schraubenlinie.
>
2. Die logarithmische Spirale ist definiert durch t 7→ et cos(2πt), sin(2πt) . Zeichnen Sie diese Kurve und berechnen Sie die Bogenlänge s(t) für t0 = 0.
>
3. Die Archimedische Spirale ist definiert durch t 7→ t · cos(2πt), sin(2πt) . Zeichnen Sie diese Kurve und berechnen Sie die Bogenlänge s(t) für t0 = 0.
8.14
Oberflächeninhalte und Flächenintegrale
Gekrümmte Flächen traten bereits wiederholt als Graphen von Funktionen z = f (x, y)
auf (s. z.B. Abb. 23 oder Abb. 36). Wir wollen uns dem Problem der Bestimmenung des
Flächeninhalts solcher Flächen zuwenden. Die Idee besteht wie im Fall der Bestimmung
von Bogenlängen wieder darin, die Fläche in kleine Parallelogramme“zu zerlegen und den
”
Flächeninhalt durch die Summe der Flächeninhalte der Parallelogramme zu definieren.
Es sei also F = {(x, y, f (x, y)) : (x, y) ∈ B} ⊆ R3 der Graph einer stetig differenzierbaren
Funktion f : B → R auf einer quadrierbaren Menge B ⊆ R2 . Wir wollen den Flächeninhalt
168
8 INTEGRALRECHNUNG
Abbildung 36: Flächeninhalt gekrümmter Flächen
|F | so definieren, dass er für den Fall planarer Figuren F (d.h. f=linear) mit dem 2dim
Riemannschen Inhalt µ(2) (F ) zusammenfällt. Wie oben bereits beschrieben nehmen wir
dazu eine Zerlegung von B in kleine Rechtecke Qi,j mit dem Flächeninhalt ∆x · ∆y vor.
Es sei Fi,j = {(x, y, f (x, y)) : (x, y) ∈ Qi,j } die zu Qi,j gehörige Fläche. Wir ersetzen diese
Fläche durch das von den Vektoren Px und Py aufgespannten Parallelogramm Pi,j . Dann
erhalten wir
q
|Fi,j | ≈ |Pi,j | = |Px × Py | = |(−fx , −fy , 1)| · ∆x · ∆y = 1 + fx2 + fy2 · ∆x · ∆y.
Somit wäre
|F | =
X
|Fi,j | ≈
i,j
X
|Pxi × Pyj | =
i,j
Xq
1 + fx2 + fy2 · ∆x · ∆y.
i,j
Ausgehend von diesen heuristischen überlegungen definieren wir daher
|F | =
Z q
1+
fx2
+
fy2
q
d(x, y) und symbolisch d|F | = 1 + fx2 + fy2 d(x, y),
B
und wenden uns der Behandlung eines Beispiels zu.
Beispiel 8.66 (Kugeloberfläche) Wir berechnen die Oberfläche der 3dim Kugel mit
Radius R. Dies ist die Menge F = {(x, y, z) : x2 + y 2 + z 2 = R2 }. Die Halbkugeloberfläche
HKF wird dann als Graph der Funktion
p
f (x, y) = R2 − (x2 + y 2 ) mit B = {(x, y) : x2 + y 2 ≤ R2 }
beschrieben. Die partiellen Ableitungen sind
−x
−y
fx (x, y) = p
und fy (x, y) = p
.
2
2
2
2
R − (x + y )
R − (x2 + y 2 )
8.14 Oberflächeninhalte und Flächenintegrale
169
Somit erhalten wir unter zusätzlicher Verwendung von Polarkoordinaten r2 = x2 + y 2 für
B die Formel
Z s
Z q
R2
1 + fx2 + fy2 d(x, y) = 2
d(x, y)
|F | = 2|HKF | = 2
R2 − (x2 + y 2 )
B
B
Z 2π Z R r
Z R
r 2
R
1
2
p
= 2
2
dr
r
dr
dϕ
=
2πR
R2 − r 2
R2
1 − ( Rr )2
0
0
0
= 2πR
2
Z1
√
1
dt = 4πR2 .
1−t
0
Alternativ gehen wir noch einen
p zweiten Weg zur Auswertung des Integrals, indem wir das
Flächendifferential d|F | = 1 + fx2 + fy2 d(x, y) sofort in Kugelkoordinaten ausdrücken.
Mit
x = R cos θ cos ϕ und y = R cos θ sin ϕ
ist x2 + y 2 = R2 cos2 θ und
∂(x, y)
2 − sin θ cos ϕ
det
=R − sin θ sin ϕ
∂(θ, ϕ)
− cos θ sin ϕ = −R2 sin θ cos θ.
cos θ cos ϕ Damit ergibt sich für das Flächenelement
r
q
R2
· R2 sin θ cos θ d(θ, ϕ) = R2 cos θ dθ dϕ.
d|F | = 1 + fx2 + fy2 d(x, y) =
2
2
2
R − R cos θ
Somit ist auf diesem Weg
Z
|F | =
B
d|F | = R2
Z2π Zπ/2
cos θ dθ ϕ = R2 · 2 · 2π = 4πR2 .
0 −pi/2
Die so erhaltene Formel für das Flächenelement in Kugelkoordinaten lässt sich aber unter
vollständiger Umgehung der langwierigen Herleitung auch sofort aus Abb. 37
ablesen: Für das Flächenstückchen d|F | erhält man mit der Formel Länge × Breite sofort
Abbildung 37: Das Flächenelement der Kugeloberfläche in Kugelkoordinaten
170
8 INTEGRALRECHNUNG
das Ergebnis
d|F | = R2 · cos θ dθ dϕ.
Dieses Vorgehen ist dadurch gerechtfertigt, dass der Inhalt ja bewegungsinvariant ist und
dass für Rechtecke die genannte Flächenformel angewandt werden kann. Dieses anschauliche Vorgehen, das insbesondere von Physikern meistens praktiziert wird, ist wegen seiner
Effektivität sehr zu empfehlen. Im Zweifelsfall kann ja dann immer noch der lange Weg
über nachträgliche Koordinatentransformationen und die Jacobi-Determinante gegangen
werden.
Abschließend bemerken wir, dass das Rechnen mit Volumen-, Kurven- und Flächenintegrals maßgeblich auf dem Umgang mit Ausdrücken der Form g(u1 , . . . , un ) d(u1 , . . . , un )
beruht. Dieser Weg wird systematisch im Analysisteil IV zur Vektoranalysis verfolgt werden, das zentrale Objekt werden dort eben solche Differentialformen“ sein.
”
Aufgaben zu Abschnitt 8.14
1. Berechnen Sie den Inhalt der Paraboloidfläche zur Funktion f (x, y) = x2 + y 2 , die
in der Höhe z = 1 abgeschnitten ist.
2. Berechnen Sie die Oberfläche eines geraden Kreiskegels mit Radius 1 und Höhe 1
(Grundfläche eingeschlossen.).
3. Zeigen, dass die Torusoberfläche |T | den Inhalt |F | = 4π 2 rR hat.
p
Hinweis: Am besten zeigen Sie d|T | = 1 + fx2 + fy2 d(x, y) = (R + r cos ϕ)r dϕ dψ.
8.15
Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ?
Die bekannte Kochsche Kurve hat keine endliche Länge,
schlimmer noch, jeder noch so kleine Ausschnitt hat eine
unendliche Länge. Andererseits ist der zweidimensionale Inhalt der Kurve Null. Mit den bisherigen Inhaltsbegriffen ist die Kochsche Kurve also nicht zu analysieren.
Dieses Phänomen tritt in der Natur häufig auf: Küstenlinien von Inseln, Reliefs zerklüfteter Gebirge, Oberfläche
von Schwämmen, Wolken oder Gebirge usw. B. Mandelbrodt lenkte 1960 die mathematische Öffentlichkeit auf
dieses Problem. Bekannt ist seine Frage: Wie lang ist die
Küstenlinie von England wirklich?
Wir wollen hier analytische Mittel entwickeln, um Phänomene dieser Art behandeln zu
können. Erinnern wir uns an die Definition des d-dimensionalen äußeren Riemannschen
Inhalts einer Menge M ⊆ Rd (in 8.43 hatten wir dies für d = 2 eingeführt.). Es ist
µ(M ) = inf 2−n·d card Q ∈ Qdn : Q ∩ M 6= ∅ ,
n∈N
8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ?
171
wobei Qdn die Menge aller achsenparallelen d-dimensionalen Quadrate“ in dyadischen
”
Gitter mit der Gitterbreite 2−n bezeichnet. Definiert man für Teilmengen M ⊆ Rd einen
α-dimensionalen äußeren Inhalt durch
µα (M ) = inf 2−n·α card{Q ∈ Qdn : Q ∩ M 6= ∅},
n
so ergibt sich für α = d der d-dimensionale äußere Inhalt, und α = 1, 2, 3, . . . liefert
den 1-, 2- bzw. 3-dimensionalen äußeren Inhalt. Ist M eine glatte Kurve in Rd , so gelten
µ1 (M ) 6= 0 und µ2 (M ) = 0. Die äußeren Inhalte sind also geeignet, die Dimension zu
beschreiben. Derart motiviert lassen wir nun für α beliebige positive reelle Zahlen zu und
nennen die Zahl
dim M = inf α > 0 : µα (M ) = 0 = sup α > 0 : µα (M ) > 0
die Hausdorff-Dimension von M . Man kann zeigen (und das ist zur endgültigen Rechtfertigung der Definition nötig), dass diese Zahl nicht von der Dimension des einbettenden
Raumes Rd abhängt. Zur praktischen Bestimmung der Hausdorff-Dimension sind die folgenden offensichtlichen Rechenregeln sehr nützlich:
Satz 8.67 Für 0 < α ≤ d und M, M1 , M2 ⊂ Rd gelten:
1) µα (M1 ∪ M2 ) = µα (M1 ) + µα (M2 ) für M1 ∩ M2 = ∅.
Additivität
2) µα (A · M ) = | det A|α/d · µα (M ) für A ∈ Rd,d mit det A 6= 0. (Transformationsformel)
Wir berechnen nun die Hausdorff-Dimension für einige Beispiele.
1. Eine Strecke hat die Hausdorff-Dimension 1.
2. Die Kochsche Kurve K entsteht aus der primitiven Figur
durch wiederholtes Ersetzen der vier Segmente durch im Maßstab 1:3 verkleinerter
Kopien der primitiven Figur. Also gilt mit Satz 8.67
1
α
α
α
µ (K) = µ (K1 ∪ K2 ∪ K3 ∪ K4 ) = 4 · µ
· K = 4 · 3−α · µα (K),
3
und für µα (K) folgt hieraus 4 = 3α , also
dim K =
log 4
≈ 1.26.
log 3
3. Die Cantormenge C ⊆ R (auch Cantor-Staub genannt) entsteht aus dem Einheitsintervall I = [0, 1] durch Herausschneiden des mittleren Drittels 13 , 23 und
fortgesetzter Wiederholung dieses Verfahrens auf die verbleibenden Teilintervalle.
172
8 INTEGRALRECHNUNG
Die Menge C ist also wieder eine disjunkte Vereinigung von zwei auf ein Drittel
verkleinerten Kopien von C. Daher gilt
1
α
α
· C = 2 · 3−α · µα (C).
µ (C) = 2 · µ
3
Für µα (C) 6= 0 folgt also 2 = 3α , und somit dim C = α =
ln 2
≈ 0.63.
ln 3
Aufgaben zu Abschnitt 8.15
1. Man berechne die Hausdorff-Dimension
des Sierpinski-Dreiecks, das aus einem
gleichseitigen Dreick durch Zerlegung in vier
gleichseitige Teildreiecke mit halber Seitenlänge, der Wegnahme des inneren Dreiecks und fortgesetzter Wiederholung des Prozesses auf die entstehenden Teildreiecke entsteht.
2. Es sei C die übliche Cantormenge. Berechnen Sie die Hausdorff-Dimension von C × C.
3. In den Harry-Potter-Romanen fährt der Zug nach Hogwarts von Gleis 9 3 /4 . Konstruieren Sie eine Menge der Dimension 9 3 /4 .
Hinweis: Versuchen Sie dazu, die Konstruktion der Cantormenge zu modifizieren oder
einen binären Baum zu verwenden.
Anhang: Computerprogramme zur Erzeugung von Fraktalen
Fraktale (natürlich nur deren Approximationen!!) können mit der Programmiersprache
LOGO sehr einfach produziert werden. Die Programmiersprache LOGO (eine listenorientierte Sprache) kann frei über die Adresse
http://www.softronix.com/logo.html ⇒ MWS Logo Kits ⇒ Setup Kit
bezogen werden. Hier sind die in der Vorlesung verwendeten Programme:
1. Schneeflocke (v. Koch-Kurve, Hausdorff-Dim = ln 4/ ln 3 )
to SCHNEEFLOCKE :N
MAKE ”s 729
MAKE ”i :n WHILE [:i>1] [MAKE ”i :i-1 MAKE ”s :s/3]
HOME SETPOS [-250 -250] CLEAN
RIGHT 30 SEITE :N RIGHT 120 SEITE :N RIGHT 120 SEITE :N RIGHT 90
end
to SEITE :N
IFELSE :N=1 [FD :S] [SEITE :N-1 LEFT 60 SEITE :N-1 RIGHT 120 SEITE :N-1
LEFT 60 SEITE :N-1]
end
8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ?
173
2. Binärer Baum mit Stauchung F < 1/2 (Hausdorff-Dim = ln 2/ ln F −1 )
to BAUM :N :F
HOME SETPOS [50 -500] CLEAN
MAKE ”S 500
ZWEIG :N :S
end
to ZWEIG :N :S
IF :N>0 [FD :S LEFT 45 ZWEIG :N-1 :S*:F RIGHT 90 ZWEIG :N-1 :S*:F LEFT
45 BACK :S]
end
3. FARN
to FARN
CLEARSCREEN SETPOS [0 -400] CLEAN
F1 10 180
end
to F1 :N :S
IFELSE :N=0 [ ][FD :S left 30 F1 :N-1 0.35*:S RIGHT 32 F1 :N-1 0.8*:S RIGHT
40 F1 :N-1 0.35*:S left 42 BACK :S]
end
4. Hilbertkurve (raumfüllende Kurve, Hausdorff-Dim =2)
to HILBERT :N
CLEARSCREEN SETPOS [-200 200] CLEAN
MAKE ”I :N MAKE ”S 256
WHILE [:I>1] [MAKE ”I :I-1 MAKE ”S :S/2]
RIGHT 90 H :N 90
end
to H :N :W
IFELSE :N=0 [ ][left -:W H :N-1 -:W FD :S RIGHT -:W H :N-1 :W FD :S H :N-1
:W RIGHT -:W FD :S H :N-1 -:W left -:W ]
end
Abbildung 38: Fraktale: v. Kochkurve, binärer Baum, Farn, Hilbertkurve
174
9
9 ERGÄNZUNGEN
Ergänzungen
9.1
Der Approximationssatz von Weierstrass
Satz 9.1 (Weierstrassscher Approximationssatz) Zu jeder auf dem Intervall [0, 1]
stetigen Funktion f existiert eine Folge (Bn ) von Polynomen mit
lim max f (x) − Bn (x) = 0.
n→∞ x∈[0,1]
Beweis zu Satz 9.1: Die Konstruktion der approximierenden Polynome Bn basiert auf den
Polynomen
n k
pk (x) =
x (1 − x)n−k für k = 0, . . . , n,
k
die zur Abtastung der Funktion f besonders geeigent sind und die auch in der Stochastik
bei der Binomialverteilung auftreten. Sie geben nämlich die Wahscheinlichkeit dafür an,
bei einer Serie von n Versuchen genau k Treffer zu erzielen, wenn x die Einzelwahrscheinlichkeit für einen Treffer ist. In Abb. 39 sind einige dieser Polynome dargestellt.
Abbildung 39: Binomialverteilungen für n = 100 und einige k = 10, 20, . . .
Für diese Polynome beweist man die folgenden Gleichungen (Wie?):
1.
n
P
pk (x) = 1,
(Die Binomialverteilung ist eine Wahrscheinlichkeitsverteilung)
k=0
2.
n
P
k · pk (x) = nx,
(Erwartungswert der Binomialverteilung = nx)
k=0
3.
n
P
(k − nx)2 · pk (x) = nx(1 − x).
(Varianz der Binomialverteilung = nx(1 − x))
k=0
Nun sei eine stetige Funktion f : [0, 1] → R gegeben. Zu f und zu jedem n ∈ N definieren
wir auf [0, 1] das n-te Bernsteinpolynom
n
X
k
Bn (x) =
f
pk (x)
n
k=0
9.1 Der Approximationssatz von Weierstrass
175
und zeigen |f (x) − Bn (x)| < 2ε für hinreichend große n = n(ε).
Da f auf [0, 1] gleichmäßig stetig ist, existiert zu gegebenem ε > 0 ein δ > 0 mit
|f (x) − f (x0 )| < ε für |x − x0 | ≤ δ.
(1)
Nun ist
X
. . . .
. . . + |x−k/n|>δ |x−k/n|≤δ
n X
X
k
pk (x) ≤ f (x) − f
|f (x) − Bn (x)| = n
k=0
Für den ersten dieser Summanden haben wir dann wegen (1) die Abschätzung
X
n
X
<ε·
.
.
.
pk (x) = ε.
|x−k/n|≤δ k=0
Zur Abschätzung des zweiten Summanden setzen wir M = max |f (x)| < ∞ und erhalten
x∈[0,1]
n
X
X
X
X
(k − nx)2
. . . ≤ 2M pk (x) = 2M pk (x) ≤ 2M
· pk (x)
n2 δ 2
|x−k/n|>δ |x−k/n|>δ
|k−nx|>nδ
k=0
=
2M
M
M
· nx(1 − x) ≤ 2 < ε für n > 2 .
2
2
nδ
2δ n
2δ ε
Damit ist der Satz vollständig bewiesen.
Wir beweisen nun eine trigonometrische Variante des Approximationssatzes, die zur Approximation stetiger periodischer Funktionen benötigt wird.
Definition 9.2 Unter einem trigonometrischen Polynom (n-ten Grades) versteht man
eine Funktion der Form
h(x) =
n
X
k=0
ak cos kx +
n
X
ak sin kx (mit an 6= 0 oder bn 6= 0).
k=1
Die Menge aller trigonometrischen Polynome auf R wird durch T (R) bezeichnet.
Satz 9.3 Produkte und Linearkombinationen trigonometrischer Polynome ergeben wieder
trigonometrische Polynome. (Man sagt, diese Menge bildet eine Algebra).
P
P
Insbesondere sind die Funktionen k ck cosk x und k dk sink x als trigonometrische Polynome darstellbar.
Beweis. Die Addition bzw. Subtraktion der Formeln aus Satz 5.39 c), d) (siehe auch
Aufgabe 2 zum Abschnitt 5.5) liefert die Formeln
cos(n + m)x + cos(n − m)x
cos(n + m)x − cos(n − m)x
sin(n + m)x + sin(n − m)x
= 2 cos nx · cos mx,
= 2 sin nx · sin mx,
= 2 sin nx · cos mx.
176
9 ERGÄNZUNGEN
Durch wiederholte Anwendung dieser Formeln folgt die Behauptung.
Satz 9.4 (Approximationssatz von Weierstrass in trigonometrischer Form)
Jede 2π-periodische, stetige Funktion f : R → R lässt sich auf R gleichmäßig durch trigonometrische Polynome approximieren, d.h., zu jedem ε > 0 existiert ein trigonometrisches
Polynonom h ∈ T (R) mit
max |f (x) − h(x)| < ε.
x∈R
Beweis9 . Teil 1. Wir zeigen die Behauptung zunächst für gerade Funktionen f : [−π, π] →
R. Dazu führen wir eine Transformation
t = cos x für x ∈ [0, π] bzw. x = arccos t für t ∈ [−1, 1]
ein. Dann gehört die Funktion g(t) = f (arccos t) zu C[−1, 1]. Zu jedem ε > 0 existiert
n
P
daher ein Polynom P (t) =
ck tk mit max |P (t) − g(t)| < ε. Setzen wir
k=0
t∈[−1,1]
h(x) = P (cos x) =
n
X
ck cosk x ∈ T (R),
k=0
so gilt die Abschätzung
max |h(x)−f (x)| = max |h(x)−f (x)| = max |P (t)−f (arccos t)| = max |P (t)−g(t)| < ε.
x∈R
x∈[0,π]
t∈[−1,1]
t∈[−1,1]
Teil 2. Wir zeigen, dass sich Funktionen der Form g(x) = f (x) · sin2 x, wobei f eine 2πperiodische, stetige Funktion ist, durch trigonometrische Polynome approximieren lassen.
Dazu betrachten wir die beiden 2π-periodischen geraden Funktionen
g1 (x) =
f (x) − f (−x)
f (x) + f (−x)
· sin2 x und g2 (x) =
· sin x.
2
2
Diese Funktionen sind nach Teil 1 durch trigonometrische Polynome approximierbar.
Dann ist nach Satz 9.3 auch g2 (x) · sin x approximierbar, und wegen
g(x) = g1 (x) + g2 (x) · sin x
auch g.
Teil 3. Der allgemeine Fall: Es sei f : R → R stetig und 2π-periodisch. Wir zerlegen
f (x) = f (x) · sin2 x + f (x) · cos2 x.
Der erste Summand ist wegen Teil 2 appoximierbar. Für den zweiten Summanden gilt
mit der Substitution x = z − π2 die Gleichung f (x) · cos2 x = f (z − π2 ) · cos2 (z − π2 ) =
f (z − π2 ) · sin2 (z) = g(z). Nach Teil 2 ist g(z) durch trigonometrische Polynome h(z)
approximierbar. Somit ist f (x) · cos2 x = g(x + π2 ) durch Funktionen der Form h(x + π2 )
approximierbar. Diese Funktionen lassen sich aber offenbar als trigonometrische Polynome
in x schreiben.
9
Der Beweis folgt der Literatur Brehmer/Apelt: Analysis I, Abschnitt 2.7.3, Satz 2.
9.2 Metrische Räume
9.2
177
Metrische Räume
Viele Definitionen und Sätze lassen sich von R und C auf andere Situatuionen verallgemeinern. Dazu brauchen wir nur den in R, C, Rn benutzten Abstandsbegriff |x − y| zwischen
zwei Punkten axiomatisch zu fassen. Das führt auf der folgenden Begriff:
Definition 9.5 (Metrischer Raum) Es sei X eine nichtleere Menge: Eine Funktion
d : X × X → R+ heißt eine Metrik oder auch Distanzfunktion auf X, falls die nachfolgenden Bedingungen erfüllt sind. Das Paar (X, d) heißt in diesem Fall ein metrischer
Raum.
1. Für alle x, y ∈ X gilt d(x, y) ≥ 0, und d(x, y) = 0 impliziert x = y. (Separiertheit)
2. Stets ist d(x, y) = d(y, x).
(Symmetrie)
3. Für drei Punkte x, y, z ∈ X gilt d(x, z) ≤ d(x, y) + d(y, z).
(Dreiecksungleichung)
Beispiel 9.6 Neben R, C, Rn mit den kanonischen Metriken erwähnen wir die folgenden
wichtigen Beispiele.
1. X = C[a, b] = Menge aller stetigen Funtionen mit d(f, g) = max |f (x) − g(x)|.
x∈[a,b]
2. X = `∞ = Menge aller beschränkten Zahlenfolgen mit d (ξn ), (ηn ) = sup |ξn − ηn |.
n∈N
3. X = c0 = Menge aller Nullfolgen mit der Metrik d (ξn ), (ηn ) = max |ξn − ηn |.
n∈N
4. X = R mit der Metrik d(x, y) = | arctan x − arctan y|. (Dreiecksungleichung?)
5. X = `1 = Menge aller absolut summierbaren Zahlenfolgen x = (ξn ) mit der Metrik
∞
P
d1 (ξn ), (ηn ) =
|ξn − ηn |.
n=0
In metrischen Räumen kann man ε-Kugeln bzw. ε-Umgebungen eines Punktes x0 ∈ X
durch folgenden Ansatz einführen:
Uε (x0 ) = {x ∈ X : d(x, x0 ) < ε}.
Damit ist es nun möglich, die Begriffe des Grenzwertes oder Häufungspunktes einer Folge, des inneren Punktes einer Teilmenge M ⊆ X, die Begriffe offene bzw. abgeschlossene
Menge und den Begriff des Abschlusses wie früher für die Fälle R, C problemlos zu verallgemeinern. Als Beispiel nennen wir:
Definition 9.7 Eine Folge (xn ) ⊂ X heißt konvergent gegen a ∈ X lim d(xn , a) = 0.
n→∞
Also
a = lim xn ⇐⇒ lim d(xn , a) = 0.
n→∞
n→∞
Die Folge (xn ) heißt eine Cauchyfolge, wenn für jedes ε > 0 ein N = N (ε) so existiert,
dass d(xn , xm ) < ε für alle m, n ≥ N (ε) gilt.
178
9 ERGÄNZUNGEN
Auch grundlegende Sätze lassen sich problemlos übertragen. Beispielsweise gilt der Satz:
Satz 9.8 Eine Menge M ⊆ X ist genau dann abgeschlossen, wenn sie alle ihre Häufungspunkte enthält.
Zu den Sätzen, die nicht in allen Fällen richtig sind, gehören dagegen:
a) Jede Cauchyfolge ist konvergent. (Z.B. ist in Beispiel 9.6.4 die Folge (xn ) = (n) eine
Cauchyfolge ohne Grenzwert.)
b) Jede beschränkte Folge hat einen Häufungspunkt. (Die Folge aus a) hat keinen
Häufungspunkt, sie ist aber beschränkt. In Beispiel 9.13 wird ein weiteres Gegenbeispiel
angegeben.)
Metrische Räume mit a) heißen vollständige metrische Räume, Räume mit b) heißen
kompakte metrische Räume.
Zu den wichtigsten Beispielen vollständiger Räume gehören neben Rn die Räume stetiger
Funktionen:
Satz 9.9 Es sei C[a, b] die Menge aller stetigen Funktionen f : [a, b] → R mit der Metrik
d∞ (f, g) = max |f (x)−g(x)|.
(Tschebyscheff-Metrik)
x∈[a,b]
Dann ist C[a, b] ein vollständiger metrischer Raum.
Beweis. Offenbar ist die Konvergenz fn → f in dieser Metrik gerade die in 6.18 eingeführte
gleichmäßige Konvergenz. Die Behauptung folgt nun durch Anwendung der Beweisidee aus
Satz 6.19.
Kompakte Räume werden im folgenden Abschnitt genauer untersucht.
9.3
Kompakte Mengen
In diesem Abschnitt wird der Begriff der kompakten Menge, den wir im Fall R bzw. C in
Satz 6.20 bereits kennengelernt haben, auf allgemeine metrische Räume verallgemeinert.
Im Folgenden sei also X ein fixierter metrischer Raum.
Definition 9.10 Eine Teilmenge K eines metrischen Raumes X heißt kompakt, wenn
jede Folge von Elementen aus K einen zu K gehörenden Häufungspunkt hat.
Satz 9.11 Jede kompakte Menge ist beschränkt und abgeschlossen.
Beweis. Jede eine kompakte Menge K enthält nach Definition alle ihre Häufungspunkte. Somit ist sie abgeschlossen. Wäre die Menge K nicht beschränkt, so könnte man in
M eine Folge von Elementen an mit d(an , am ) ≥ 1 für m, n ∈ N mit m > n finden
(Wie denn?). Diese Folge kann aber keine Cauchyteilfolge enthalten, daher hat sie keinen
Häufungspunkt.
In den Räumen X = R, C oder Rn gilt bekanntlich auch die Umkehrung des obigen Satzes:
9.3 Kompakte Mengen
179
Satz 9.12 (Satz von Bolzano-Weierstrass) Eine Teilmenge K von R, Rn bzw. Cn ist
genau dann kompakt, wenn sie abgeschlossen und beschränkt ist.
Ein entsprechender Satz ist aber nicht in jedem metrischen Raum richtig, wie das folgende
Beispiel zeigt.
n
Beispiel 9.13 Die Teilmenge M = {en : n ∈ N} ⊂ c0 mit en = (0, .^. ., 1, 0, . . .) ∈ c0 ist
beschränkt und abgeschlossen, aber die Folge (ei )i∈N hat bzgl. der üblichen Metrik in c0
keinen Häufungspunkt. Somit ist M nicht kompakt.
Kompaktheit ist die entscheidende Eigenschaft, um die in Abschnitt 6.3 für stetige reelle
Funktionen auf Intervallen bewiesenen Eigenschaften auf stetige Funktionen f : X → R,
X ein metrischer Raum, zu verallgemeinern. Hierzu gehört der folgende Satz:
Satz 9.14 (Satz vom Maximum und Minimum) Ist K kompakt, so hat jede stetige
Funktion f : K → R auf K ein Maximum und ein Minimum.
Mit gleicher Technik ergibt sich:
Satz 9.15 Sind A, B zwei kompakte Teilmengen von X, so existieren zwei Punkte a0 ∈ A
und b0 ∈ B mit
d(a0 , b0 ) = inf{d(x, y) : x ∈ A, y ∈ B} = d(A, B),
der Abstand“ der Mengen A, B wird also angenommen.
”
Die folgenden Sätze zeigen die Verwandtschaft kompakter Mengen mit endlichen Mengen.
Sie sind von großer Wichtigkeit.
Satz 9.16 Jede kompakte Menge K ist präkompakt, d.h., zu jedem ε > 0 existiert eine
endliche Teilmenge F ⊂ K mit
[
K⊆
Uε (x).
x∈F
Beweis. Wir führen den Beweis indirekt. Angenommen, es gäbe ein ε0 > 0 derart, dass
obige Inklusion für keine endliche Teilmenge F ⊂ K erfüllt sei. Wir konstruieren nun
induktiv eine Folge (xn ) in K ohne Häufungspunkt. Es sei x0 ∈ K beliebig gewählt.
Wegen K \ Uε0 (x0 ) 6= ∅ existiert ein x1 ∈ K \ Uε0 (x0 ). Wegen K \ Uε0 (x0 ) ∪ Uε0 (x1 ) 6= ∅
existiert ein x2 ∈ K \ Uε0 (x0 ) ∪ Uε0 (x1 ) . So fortfahrend ergibt sich eine Folge (xn ) ⊆ K
mit d(xn , xm ) ≥ ε0 für n > m. Daher enthält (xn ) keine Cauchyteilfolge, sie kann also
keinen Häufungspunkt haben.
Satz 9.17 (Überdeckungssatz von Heine-Borel) Es sei X metrischer Raum. Eine
Menge K ⊆ X ist genau dann kompakt, wenn es zu jedem System (Oα )α∈A von offenen
n
S
S
Mengen mit K ⊆
Oα ein endliches Teilsystem {Oα1 , . . . , Oαn } mit K ⊆
Oαj gibt.
α∈A
Man sagt auch, dass K die endliche Überdeckungseigenschaft hat.
j=1
180
9 ERGÄNZUNGEN
Beweis. Wir zeigen die Notwendigkeit der Bedingung durch indirekten Schluss: Es sei K
kompakt, und es sei (Oα )α∈I eine offene Überdeckung von K derart, dass für jedes endliche
n
S
Teilsystem K \
Oαi 6= ∅ gilt. Wir konstruieren zwei Folgen (Kj ) und (xj ) auf folgende
i=1
Weise: Es sei K0 = S
K und ε1 = 1. Da K präkompakt ist, existiert eine endliche Menge
F1 ⊆ K0 mit K0 ⊆
U1 (x). Da K0 nicht von endlich vielen der {Oα } überdeckt werden
x∈F1
kann, existiert ein x ∈ F1 , wir nennen es x1 , derart, dass die Menge K1 = K0 ∩ U1a (x1 )
nicht von endlich vielen {Oα } überdeckt werden kann. Wir wiederholen das Verfahren mit
K1 und ε2 = 12 . Das ergibt eine Kette abgeschlossener Mengen
K0 ⊇ K1 ⊇ K 2 ⊇ . . .
und eine Folge (xj ) von Elementen mit
a
xj ∈ Kj = Kj−1 ∩ U1/j
(xj )
derart, dass kein Kj durch endlich viele {Oα } überdeckt werden kann. Da K = K0 kompakt ist, hat die Folge (xj ) einen Häufungspunkt x∗ . Da {Oα } die Menge K0 überdeckt, existiert ein Oα mit x∗ ∈ Oα . Da Oα offen ist, existiert ein δ > 0 mit Uδ (x∗ ) ⊆ Oα . Wir wählen
1
δ
a
ein n mit < und xn ∈ Uδ/2 (x∗ ). Dann ist Kn ⊆ Uδ/3
(xn ) ⊆ Uδ/2 (xn ) ⊆ Uδ (x∗ ) ⊆ Oα
n
3
im Widerspruch dazu, dass Kn nicht durch endlich viele {Oα } überdeckt werden kann.
Wir zeigen die Umkehrung durch indirekten Beweis. Angenommen, es gäbe eine Folge
(xj ) ⊂ K ohne Häufungspunkte. Wir konstruieren nun eine Überdeckung von K, die keine endliche Überdeckung besitzt. Da sich kein xj unendlich oft wiederholen kann, enthält
die Folge unendlich viele verschiedene Elemente. Wir können also durch eventuellen Übergang zu einer Teilfolge annehmen, dass bereits die Folge (xj ) aus paarweise verschiedenen
Elementen besteht. Da (xj ) keine Häufungspunkte besitzt, ist die Folge eine abgeschlossene Teilmenge von X, die Menge U = X \ (xj ) ist somit offen. Da insbesondere kein xj
ein Häufungspunkt der Folge sein kann, existiert zu jedem j ein εj > 0 mit xi 6∈ Uεj (xj )
für alle i 6= j. Daher ist {Uεi (xi ) : i ∈ N} ∪ {U } eine offene Überdeckung von K, die keine
endliche Teilüberdeckung besitzt.
Als elegante Anwendung beweisen wir die folgende Verallemeinerung von Satz 6.17:
Satz 9.18 (Satz über die gleichmäßige Stetigkeit) Es sei K kompakt und die Funktion f : K → R sei stetig. Dann ist f auf K sogar gleichmäßig stetig, d.h.
∀ε > 0∃δ > 0∀x, x0 ∈ K : d(x, x0 ) < δ ⇒ |f (x) − f (x0 )| < ε.
Beweis. Es sei ε > 0 fixiert. Da f : K → R stetig ist, existiert zu jedem Punkt x ∈ K ein
δx > 0 mit |f (x) − f (x0 )| < ε/2 für alle x0 ∈ Uδx (x). Wegen
[
K⊆
Uδx /2 (x)
x∈K
und der Kompaktheit von K existiert eine endliche Menge {x1 , . . . , xn } mit
K⊆
n
[
Uδxj /2 (xj ).
j=1
Die Zahl δ = min δxj /2 > 0 hat damit die gesuchte Eigenschaft.
j=1,...,n
9.4 Wege zur Einführung der Exponentialfunktion f (x) = ex
9.4
181
Wege zur Einführung der Exponentialfunktion f (x) = ex
1. Genetische Konstruktion
en
= e · . . . · e, n ∈ N
−n
n
e
= 1/e
, −n∈N
√
n m
m/n
e
=
e , m ∈ Z, n ∈ N
ex
= lim exn für xn → x mit xn ∈ Q
n→∞
(Diese Methode ist nur für reelle Argumente x ∈ R verwendbar!)
2. Folgendefinition
n
für x ∈ R
ex = lim 1 + nx
n→∞
(Diese Methode ist nur für reelle Argumente x ∈ R verwendbar!)
3. Potenzreihe
x
∞
X
xn
für x ∈ R, C, Rd,d
n!
(Diese Methode ist auch für komplexe Argumente x ∈ C oder sogar für x=quadratische Matrix
oder x=Operator verwendbar)
e
=
n=0
4. Differentialgleichung
y = ex ist die eindeutig bestimmte Lösung des sogenannten ”Anfangswertproblems”
y 0 = y mit y(0) = 1.
5. Funktionalgleichung
y = ex ist die eindeutig bestimmte, differenzierbare Lösung der Funktionalgleichung
y(x + s) = y(x) · y(s) für alle s, x ∈ R, und y(1) = e.
(Die Voraussetzung der Differenzierbarkeit kann sogar durch die schwächere Voraussetzung
der Stetigkeit ersetzt werden. Auch Monotonie oder sogar nur lokale Beschränktheit genügen!)
Begründungen:
1) Dies wurde in Satz 2.12 gezeigt.
2) Dies wurde in Satz 4.27 gezeigt.
3) Dies ist Inhalt von Satz 5.32 und Definition 5.33.
4) Offenbar löst die Funktion y = y(x) = ex das Anfangswertproblem. Zum Beweis der
Einzigkeit sei g eine weitere Lösung. Dann ist die Ableitung (Quotientenregel!) der
Funktion h(x) = g(x)/ex offenbar konstant Null, also ist h eine konstante Funktion.
Wegen h(1) = 1 ist h konstant 1, also ist g(x) = ex für alle x ∈ R.
182
9 ERGÄNZUNGEN
5) Einerseits erfüllt die e-Funktion die gestellten Bedingungen. Andererseits folgen aus
der gegebenen Bedingung y(0) = 1 und y 0 = a · y mit a = y 0 (0). Somit ist y(x) = eax
nach 4., und wegen y(1) = e folgt a = 1. Unter der Voraussetzung der Monotonie
wurde die Behauptung in Satz 2.14 gezeigt. Für stetige oder beschränkte Funktionen
überlassen wir den Nachweis dem Leser.
WARNUNG: Es gibt auch unstetige (sehr wilde) Lösungen der genannten Funktionalgleichung. Man muss dazu die Menge R als unendlichdimensionalen über Q
betrachten. Mit jeder Bassis dieses Vektorraumes kann man dann (sogar unendlich
viele) unstetige Lösungen konstruieren. Siehe zu diesem Thema auch: Die allgemeine
Lösung der Cauchyschen Funktionalgleichung f (x + y) = f (x) + f (y).
Aufgaben zu Abschnitt 9.4
1) Der Turmbau zu Babel: Es soll ein hoher (1000 m oder sogar ∞ hoch), runder
Turm aus Beton gebaut gebaut werden. Welches Profil ist aus statischen Gründen
zu wählen?
Hinweis: Beachten Sie, dass Baumaterialien nur eine bestimmte Druckbelastung
aushalten, oberhalb dieser sie zu Staub zerdrückt werden. Richten Sie das Profil
daher so ein, dass die Druckbelastung in jedem Punkt Ihres Bauwerks gleich ist.
Abbildung 40: Turmbau
9.5 Die logische Abhängigkeit der zentralen Sätze
9.5
Die logische Abhängigkeit der zentralen Sätze
183
184
9.6
9 ERGÄNZUNGEN
Kontrollfragen zur Analysis
1. Der geordnete Körper der reellen Zahlen
(a) Erläutern Sie die Axiome des geordneten Körpers der reellen Zahlen.
(b) Wie werden Wurzeln konstruiert?
(c) Wie werden Exponentialfunktionen f (x) = ax definiert/konstruiert?
2. Der Körper der komplexen Zahlen
(a) Wie lassen sich komplexe Zahlen in der Gaußschen Ebene veranschaulichen?
Wie werden Addition und Multiplikation analytisch und graphisch durchgeführt?
(b) Wie erfolgt die trigonometrische Darstellung komplexer Zahlen?
(c) Erläutern Sie die Eulersche Formel!
3. Folgen und Grenzwerte
(a) Was versteht man unter Folgen in R, C und Rd ? Wie lassen sie sich veranschaulichen?
(b) Erläutern Sie die Begriffe: Konvergente Folge, beschränkte Folge, monotone
Folge. Geben Sie Beziehungen zwischen diesen Eigenschaften an und begründen
Sie diese!
(c) Geben Sie einige Konvergenzkriterien an! Demonstrieren Sie die Kriterien an
Beispielen!
(d) Erläutern Sie das Prinzip der Intervallschachtelung! Gebeb Sie Anwendungen!
Geben Sie Beispiele an!
(e) Was sind Häufungspunkte einer Folge? Was besagt der Satz von BolzanoWeierstraß und wie wird er bewiesen?
(f) Was sind Cauchyfolgen? Formulieren Sie das Cauchy-Kriterium!
(g) Definieren und erläutern Sie wichtige topologische Grundbegriffe!
(h) Was ist der Inhalt des Banachschen Fixpunktsatzes (in R), welche Anwendungen kennen Sie?
(i) Was sind metrische Räume? Geben Sie Beispiele! Wann heißen Folgen in metrischen Räumen konvergent? Was sind Cauchyfolgen in metrischen Räumen?
Wann heißt ein metrischer Raum vollständig? Geben Sie Beispiele.
4. Reihen in R und C
(a) Was versteht man unter einer Reihe? Wann heißt eine Reihe konvergent und
was ist ihr Grenzwert?
(b) Geben Sie Konvergenzkriterien an! Erläutern Sie diese an Beispielen!
(c) Geben Sie Kriterien für die absolute Konvergenz von Reihen an!
(d) Wann und wie lassen sich Produkte von Reihen berechnen?
9.6 Kontrollfragen zur Analysis
185
(e) Erläutern Sie Begriff und Eigenschaften von Potenzreihen! Geben Sie Anwendungen!
5. Stetigkeit von Funktionen
(a) Wann heißt eine Funktion stetig an einer Stelle a? Geben Sie Beispiele und
Gegenbeispiele!
(b) Wie vererbt sich die Stetigkeit auf zusammengesetzte Funktionen?
(c) Was sind Grenzwerte von Funktionen? Nennen Sie wichtige Beispiele!
(d) Was besagt der Zwischenwertsatz, und wie wird er bewiesen?
(e) Nennen Sie fundamentale Eigenschaften stetiger Funktionen auf kompakten
Intervallen in R bzw. auf kompakten Mengen in metrischen Räumen.
6. Elementare Funktionen
(a) Was sind ganzrationale Funktionen? Erläutern Sie den Fundamentalsatz der
klassischen Algebra in R und in C!
(b) Geben Sie mehrere mögliche Definitionen der Exponentialfunktion f (x) = ex
und ihrer Umkehrfunktion an!
(c) Wie werden trigonometrische Funktionen in R und C definiert?
7. Differentialrechnung
(a) Wann heißt eine Funktion f bei a differenzierbar?
(b) Erläutern Sie das Prinzip der Linearisierbarkeit im Kleinen (Weierstraßsche
Zerlegungsformel)!
(c) Nennen Sie einige Differentiationsregeln und beweisen Sie die Produktregel!
(d) Wie lautet der Satz von Rolle? Wie wird er bewiesen?
(e) Was besagt der Mittelwertsatz der Differentialrechnung? Wie wird er bewiesen?
Geben Sie mindestens zwei Anwendungen!
(f) Erläutern Sie das Verfahren der Taylorentwicklung!
(g) Was sind analytische Funktionen? Geben Sie Beispiele und Gegenbeispiele an!
(h) Erläutern Sie Verfahren zur Kurvendiskussion!
(i) Was sind partielle Ableitungen?
(j) Was bedeutet Linearisierbarkeit im Kleinen für Funktionen z = f (x, y) mit
zwei Variablen?
(k) Nennen Sie Eigenschaften des Gradienten!
(l) Wie werden Extremwerte für Funktionen mit mehreren Variablen bestimmt?
(m) Wie sieht eine Taylorentwicklung für Funktionen mit zwei Variablen aus?
8. Integralrechnung
(a) Erläutern Sie die Konstruktionsschritte zur Bildung des Riemannschen Integrals!
186
9 ERGÄNZUNGEN
(b) Nennen Sie hinreichende Bedingungen für die Integrierbarkeit!
(c) Erläutern und beweisen Sie den Hauptsatz der Differential- und Integralrechnung mit allen seinen Teilen!
(d) Nennen und erläutern Sie Rechenregeln für das Riemannsche Integral und Methoden zur Ermittlung von Stammfunktionen!
(e) Erläutern Sie den Zusammenhang von Inhalt und Integral.
(f) Nennen Sie einige Methoden zur Berechnung mehrdimensionaler Integrale! Demonstrieren Sie dies an Beispielen.
(g) Wie werden Volumina, Bogenlängen und Flächeinhalte berechnet?
(h) Was wissen Sie zur Vertauschbarkeit von Limes und Integral?
9. Ergänzungen
(a) Was sind Fraktale?
(b) Definieren Sie den Raum C[a, b] und geben Sie einige gute und schlechte Eigenschaften dieses Raumes an!
(c) Was besagt der Approximationssatz von Weierstrass?
(d) Nennen Sie einige äquivalente Eigenschaften kompakter Mengen in R bzw. in
metrischen Räumen.
Index
Γ-Funktion, 148
e, Definition, 32
π
Berechnung, 106
Definition, 81
ε-Umgebung, 26
punktierte, 40
Äquivalenz
logische, 2
Überdeckungssatz von Heine-Borel, 179
arsinh, 19
Cesaro-Mittel, 30
Gaußsche Zahlenebene, 22
Riemann-Funktion, 129
Takagi-Funktion, 91
Cauchysche Produktreihe, 58
Cauchyscher Integraltest, 51, 147
Cavallierisches Prinzip , 151
cosh, 19
Darbouxsche Untersumme, 123
Dezimalbruchentwicklung, 10, 42, 52
Dichtheitsaxiom, 9
Differential
totales, 114
Differentialquotient, 87
Differentiationsregeln, 88
Kettenregel, 89
Potenzreihe, 92
Umkehrfunktion, 90
Differenziation
Umkehrfunktion, 90
Differenzierbarkeit, 87
linksseitige, rechtsseitige, 88
Divergenzkriterium, 59
Dominanzkriterium, 28
Abelscher Grenzwertsatz, 105
Ableitung, 87
höhere, 90
partielle, 111
Abschluss einer Menge, 44
Approximationssatz von Weierstrass, 174
Archimedisches Axiom, 8
arcosh, 19
Arcus-Funktionen, 82
Aussage, 2
Aussageform, 1
Eulersche Formel, 64
Eulersche Zahl, 32
Exponentialfunktion, 16
komplexe, 62
Extremwerte, 107
Flächeninhalt, 130
Folge, 25
konvergent, 26
Teil-, 25
Fundamentalsatz der klass. Algebra, 78
reelle Version, 80
Funktion
Dirichlet-, 68
Takagi, 91
analytische, 102
Dirichlet, 124
Eigenschaften, 13
Exponential–, 16
Charakterisierungssatz, 18
Reihendarstellung, 62
Gamma-, 148
ganzrationale, 76
Bernoulli–de l’Hospital, Regel von, 97
Bernsteinpolynome, 174
Besselfunktionen, 94
Betrag
komplexer Zahlen, 23
reeller Zahlen, 21
binärer Baum , 173
Binomialrreihe, 104
Binomischer Lehrsatz, 7
Bogenlänge, 165
Bolzano, Nullstellensatz von, 70
Cantormenge, 171
Cauchy-Kriterium
für Folgen, 42
für Reihen, 50
Cauchyfolge, 41, 177
187
188
INDEX
Grad, 77
implizite, 116
komplexe Logarithmus–, 84
Logarithmus–, 18
Potenz–, 13
transzendente, 80
trigonometrische–
Reihendarstellung, 64
Umkehr–, 14
voreindeutig, 13
Gebietsintegral, 152
geometrische Summe, 6
Gradient, 112
Grenzwert, 26
von Funktionen, 74
von links/rechts, 75
Grenzwertsätze, 50
für Folgen, 28
Grundintegrale, 135
Häufungspunkt, 43
einer Folge, 38
einer Menge, 40
Halbierungsverfahren, 39
Haufungspunkt
Stetigkeit, 74
Hauptsatz
über analytische Funktionen, 103
über implizite Fkt., 116
der Diff-Int-Rechn., Umkehrung, 135
der Diff-Integralrechnung, 134
Hausdorff-Dimension, 171
Hesse-Matrix, 121
Hilbertkurve, 173
Identitätssatz für Potenzreihen, 98
Infimum, 7
Inhalt
Riemannscher, 149
Injektion, 13
Integrabilitätsbedingung, 119
Integral
elliptisches, 167
iteriertes, 153
mehrdimensionales, 152
Riemannsches, 123
unbestimmtes, 135
uneigentliches, 146
Intervallschachtelung, 36
Jacobi-Matrix, 159
Kardinalzahl, 3
Kettenregel, 89
Verallgemeinerte, 114
Kochsche Kurve, 170
Koeffizientenvergleich, 76
Komlexe Zahlen, 22
komplexe Zahl
Betrag, 23
Imaginärteil, 23
konjugierte, 23
Realteil, 23
trigonometrische Darstellung, 83
komplexe Zahlen, 22
trigonometrische Darstellung, 65
konkav, 109
Konvergenz
absolute, 54
gleichm, 145
gleichmäßige, 72, 178
punktweise, 72
unbedingte, 55
Konvergenzbereich, 59
Konvergenzkriterium
Bolzano, 32
konvex, 109
Krümmungskreis, 109
Kreisscheibensatz, 37
Kreuzmenge, 3
Kugelkoordinaten, 161
Kurve, 114, 164
glatte, 164
Kurvendiskussion, 106
Lücke, 75
Leibnizkriterium, 53
Leibnizreihe, 37, 43
liminf, 39
limsup, 39
Logarithmusreihe, 104
Majorantenkriterium, 54
Menge
abgeschlossen, 43
INDEX
Abschluss, 44
kompakt, 73, 178
offen, 43
prkompakt, 179
zusammenhängend, 153
Mengenbildung, 2
Metrik, 177
metrischer Raum, 177
kompakter, 178
vollständig, 178
Mittelwertsatz
der Integralrechnung, 133
Mittelwertsatz der Diff.rechnung, 95
Moivresche Formeln, 84
Monotonie, 14
1. Hauptsatz, 15
2. Hauptsatz, 69
Normalbereich, 151
Nullfolge, 27
Nullstelle
ganzrat. Funktion, 78
Vielfachheit, 77
Nullstellensatz von Bolzano, 70
Partialsummen, 48
Partielle Integration, 137
Pol, 75
Polarkoordinaten, 160
Potenzmenge, 3
Potenzreihe, 59
Prinzip des Koeffizientenvergleichs, 98
Punkt
innerer, 43
Quotientenkriterium, 54
Randpunkt, 43
Rechteckregel, 127
Regel von Bernoulli-de l’Hospital, 97
Regressionsgerade, 122
Reihe, 48
Dirichlet, 51
absolute Konvergenz, 54
alternierende, 53
Bolzanosches Konvergenzkriterium,
50
geometrische, 49
189
harmonische, 49
notwendiges Konvergenzkriterium, 50
Restglied, 99
von MacLaurin, 100
Restgliedformel
von Cauchy, 99
von Lagrange, 99
Riemann-Integral, 123
Riemannscher Umordnungssatz, 55
Rolle, Satz von, 95
Satz
Approximationssatz von Weierstrass,
174
Approximationssatz von Weierstrass,
trigonometrische Form, 176
Heine-Borel, 179
vom Maximum und Minimum, 71
von Bolzano, 32
von Bolzano-Weierstraß, 39
von Bolzano-Weierstraß für Mengen,
40
von Cauchy-Hadamard, 60
von H. A. Schwarz, 118
von Riemann, 56
von Taylor, 99
Satz vom Maximum und Minimum, 179
Satz von Fubini, 154
Schranke, 7
Sierpinski-Dreieck, 172
sinh, 19
Spirale
Archimedische, 167
logarithmische, 167
Sprung, 75
Stammfunktion, 134
Stetigkeit, 66
ε − δ−Definition, 66
gleichmäßige, 71
Substitutionsregel, 138
Superposition, 13
Supremum, 7
Surjektion, 13
Tangente, 114
Taylor
-Koeffizienten, 99
-formel, 99
190
-formel für n Variable, 121
-polynom, 99
-reihe, 99
Transformationsformel, 159
Trapezregel, 128
Trigonometrische Polynome, 175
Tschebyscheff-Metrik, 178
Ungleichung
Bernoullische, 5
Vergleichskriterium, 30
Wahrheitswert, 1
Weierstraßsche Zerlegungsformel, 87, 113
Wendepunkt, 108
Wurzelkriterium, 54
Zahlenfolge
beschränkt, 27
quasistationär, 25
stationär, 25
Zerlegung, 123
äquidistante, 126
Zerlegungssumme, 123
Zetafunktion, 51
Zwischenwertsatz, 71
Zylinderkoordinaten, 161
INDEX