Analysis Grundkurs - Institut für Mathematik Potsdam

Werbung
Analysis Grundkurs
Heinz Junek
Vorlesung im WS/SS 2007-8
Institut für Mathematik
Universität Potsdam
e-mail: [email protected]
10. Juli 2008
2
INHALTSVERZEICHNIS
Inhaltsverzeichnis
1 Grundlagen der Analysis
1
1.1
Logik und Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Der Körper der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.3
Summenzeichen und binomische Formeln . . . . . . . . . . . . . . . . . . .
6
1.4
Suprema und Infima, Vollständigkeitsaxiom . . . . . . . . . . . . . . . . .
7
1.5
Die Approximation reeller Zahlen durch rationale Zahlen . . . . . . . . . .
9
1.6
Existenz- und Eindeutigkeit n-ter Wurzeln . . . . . . . . . . . . . . . . . . 10
2 Elementare Funktionen
13
2.1
Funktionen und deren Eigenschaften . . . . . . . . . . . . . . . . . . . . . 13
2.2
Monotone Funktionen
2.3
Potenzfunktionen mit rationalem Exponenten . . . . . . . . . . . . . . . . 15
2.4
Die Exponentialfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3 Beträge und komplexe Zahlen
21
3.1
Die Betragsfunktion in R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2
Der Körper C der komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . 21
4 Zahlenfolgen und Reihen
25
4.1
Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2
Reelle Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.3
Monotone Zahlenfolgen und Intervallschachtelungen . . . . . . . . . . . . . 32
4.4
Häufungspunkte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.5
Das Cauchysche Konvergenzkriterium . . . . . . . . . . . . . . . . . . . . . 41
4.6
Topologische Grundbegriffe
4.7
Der Banachsche Fixpunktsatz . . . . . . . . . . . . . . . . . . . . . . . . . 45
5 Zahlenreihen
. . . . . . . . . . . . . . . . . . . . . . . . . . 43
48
5.1
Begriffsbildung und Konvergenzkriterien . . . . . . . . . . . . . . . . . . . 48
5.2
Alternierende Reihen in R . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.3
Absolut konvergente Reihen in R und C . . . . . . . . . . . . . . . . . . . 53
5.4
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.5
Exponential- und trigonometrische Funktionen . . . . . . . . . . . . . . . . 61
INHALTSVERZEICHNIS
6 Stetigkeit
3
66
6.1
Einführung und Begriff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.2
Stetigkeit klassischer Funktionen
6.3
Stetige Funktionen auf kompakten Intervallen . . . . . . . . . . . . . . . . 70
6.4
Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.5
Ganzrationale und gebrochen rationale Funktionen . . . . . . . . . . . . . 76
6.6
Sinus, Kosinus und Logarithmus in R und C . . . . . . . . . . . . . . . . . 80
7 Differentialrechnung
. . . . . . . . . . . . . . . . . . . . . . . 68
87
7.1
Differenzierbarkeit und Differentiationsregeln . . . . . . . . . . . . . . . . . 87
7.2
Differentiation elementarer Funktionen . . . . . . . . . . . . . . . . . . . . 91
7.3
Mittelwertsätze der Differentialrechnung . . . . . . . . . . . . . . . . . . . 95
7.4
Der Satz von Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
7.5
Taylorreihen und analytische Funktionen . . . . . . . . . . . . . . . . . . . 102
7.6
Kurvendiskussionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
7.7
Partielle Ableitungen und Gradient . . . . . . . . . . . . . . . . . . . . . . 111
7.8
Extremwerte für Funktionen mit mehreren Variablen . . . . . . . . . . . . 120
8 Integralrechnung
123
8.1
Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.2
Eigenschaften Riemannscher Integrale . . . . . . . . . . . . . . . . . . . . . 129
8.3
Mittelwertsätze der Integralrechnung . . . . . . . . . . . . . . . . . . . . . 133
8.4
Hauptsatz der Differential– Integralrechnung . . . . . . . . . . . . . . . . . 134
8.5
Integrationsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
8.6
Integration rationaler Funktionen . . . . . . . . . . . . . . . . . . . . . . . 141
8.7
Vertauschung von Limes und Integral . . . . . . . . . . . . . . . . . . . . . 144
8.8
Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
8.9
Integration und Inhaltslehre . . . . . . . . . . . . . . . . . . . . . . . . . . 149
8.10 Gebietsintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
8.11 Die Transformationsformel . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
8.12 Das Volumen der n-dimensionalen Kugel . . . . . . . . . . . . . . . . . . . 162
8.13 Kurven und Bogenlängen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
8.14 Oberflächeninhalte und Flächenintegrale . . . . . . . . . . . . . . . . . . . 167
8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ? . . . . . . . . . . . . . . . . 170
4
INHALTSVERZEICHNIS
9 Ergänzungen
174
9.1
Der Approximationssatz von Weierstrass . . . . . . . . . . . . . . . . . . . 174
9.2
Metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
9.3
Kompakte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
9.4
Wege zur Einführung der Exponentialfunktion f (x) = ex . . . . . . . . . . 181
9.5
Die logische Abhängigkeit der zentralen Sätze . . . . . . . . . . . . . . . . 183
9.6
Kontrollfragen zur Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 184
1
1
1.1
Grundlagen der Analysis
Logik und Mengenlehre
(1) Die mathematische Logik behandelt logische Aussagen, Wahrheitswertfunktionen
und deren Zusammensetzungen. Eine Aussage ist ein sprachliches Gebilde, dem genau
einer der Wahrheitswerte W oder F zukommt. Z.B. (3 teilt 6) = W oder (5 teilt 6) = F .
Eine Aussageform ist ein Ausdruck mit einer freien Variablen x, aus dem bei Belegung
der Variablen x mit Objekten eines Grundbereiches X eine Aussage entsteht. Eine
Aussageform ist z.B. x teilt 60“ Ḋies ist weder wahr noch falsch. Belegt man x aber mit
”
natürlichen Zahlen, so ergeben sich Aussagen:
(Für x = 3 gilt x teilt 60) = W und (Für x = 7 gilt x teilt 60) = F .
Über die Gültigkeit einer Aussage (Elementaraussage) entscheidet die jeweilige Wissenschaft. Die Logik untersucht dagegen den Wahrheitsgehalt von Zusammensetzungen von
Aussagen.
Die Wahrheitswertvariablen p, q, ... stehen für Aussagen. Wichtig ist in der Logik nur,
dass sie die Wahrheitswerte W oder F annehmen können.
(2) Für die Bildung zusammengesetzter logischer Ausdrücke sind die folgenden
klassischen Wahrheitswertfunktionen besonders wichtig:
Name
Konjunktion
Alternative
(nicht ausschließendes ”oder”)
Negation
Implikation
(Prämisse ⇒ Conclusio)
Äquivalenz
Sprachliche Bedeutung Bezeichnung
p und q
p∧q
p oder q
p∨q
nicht p
¬p
wenn p dann q
p⇒q
p gdw q
p⇔q
Diese Wahrheitswertfunktionen sind durch ihre Wertetabellen, die man in diesem Fall
Wahrheitswerttabellen nennt, definiert (Tabellen verstehen und lernen!):
p
W
W
F
F
q
W
F
W
F
p∧q
W
F
F
F
p∨q
W
W
W
F
p⇒q
W
F
W
W
p⇔q
W
F
F
W
¬p
F
W
-
Besonders hingewiesen werden sollte auf die Definition der Wertetafel für die Implikation.
Der Ansatz (F ⇒ W ) = W ist von vornherein nicht unbedingt klar. Sicher sollte
man aber (F ⇒ W ) 6= F setzen, die Zweiwertigkeit der Logik erfordert dann aber
(F ⇒ W ) = W .
2
1 GRUNDLAGEN DER ANALYSIS
(3) Zwei Aussageverbindungen heißen logisch äquivalent, wenn ihre Wahrheitswerttabellen wertverlaufsgleich sind. Äquivalente Aussagen können logisch als völlig
gleich-wertig betrachtet werden. Der Ersatz einer Aussage durch eine logisch äquivalente
Aussage ist eine wesentliche Grundtechnik beim Führen von Beweisen. Besonders wichtig
sind die folgenden Äquivalenzen:
¬¬p
äquivalent zu p
¬(p ∨ q) äquivalent zu ¬p ∧ ¬q
¬(p ∧ q) äquivalent zu ¬p ∨ ¬q

(Doppelte Negation) 
(Negation der Alternative) (Begründung?)

(Negation der Konjunktion)
Für den Nachweis der Gültigkeit von Implikationen werden folgende Äquivalenzen sehr
oft benutzt:
p ⇒ q äquivalent zu ¬p ∨ q
¬(p ⇒ q) äquivalent zu p ∧ ¬q
und äquivalent zu ¬q ⇒ ¬p
(Kontraposition)
(Indirekter Beweis)
(Beweis ebenfalls durch Vergleich der Wahrheitswerttabellen).
(4) Die Mengenlehre wurde als sprachliches Instrument der Mathematik um
1880 von Georg Cantor bei der Untersuchung komplizierter analytischer Sachverhalte
(Konvergenzpunkte von Fourier–Reihen) in naiver Form geschaffen. Nach Georg
Cantor entsteht eine Menge durch Anwendung des sogenannten
Mengenbildungsaxioms: Ist H(x) eine beliebige Aussageform über einem Grundbereich X, so kann die Menge M aller Elemente x aus X, für die H(x) wahr wird, gebildet
werden. In Zeichen schreibt man:
M = {x : H(x) = W} oder einfach M = {x : H(x)}.
Gehört ein Element x aus X zu M , so schreibt man x ∈ M . Bertrand Russell zeigte
mit seiner berühmten Antinomie, dass die naive Mengenlehre bei zu großzügiger Interpretation der Mengenbildung zu Widersprüchen führt. Nach Cantor müsste es nämlich
möglich sein, die Menge
M = {A : A ist eine Menge und A 6∈ A}
zu bilden. Da aber sowohl die Annahme M 6∈ M als auch die Annahme M ∈ M zum
Widerspruch führt, kann M nicht existieren. Im Grunde ist diese Antinomie bereits aus
der Antike bekannt: Ein Kreter behauptet, dass alle Kreter lügen.
Dieser Antinomie kann dadurch ausgewichen werden, dass man der Enthaltenseins–
Relation ∈ die Restriktion auferlegt, dass eine Menge sich nicht selbst als Element
enthalten kann. Damit wird die Existenz einer Menge aller Mengen ausgeschlossen,
und die Russellsche Menge kann nicht mehr gebildet werden. Die exakte Ausführung
dieses Ansatzes wurde in der Form eines Stufenaufbaus von Russell und in der Form
eines Klassenkalküls von v.Neumann/Bernays/Gödel in den vierziger Jahren des
20. Jh. durchgeführt. Heutzutage benutzt man alternativ das Axiomensystem von
1.1 Logik und Mengenlehre
3
Zermelo/Fraenkel (ZF). Auf Details der axiomatischen Mengenlehre soll hier aber nicht
eingegangen werden.
(5) Mengenoperationen: Die Wahrheitswertfunktionen erlauben ein Operieren mit
Mengen. Die wichtigsten Mengenoperationen sind die folgenden: Es seien A und B
irgendwelche Teilmengen eines Grundbereiches X. Man bildet:
A∪B = {x : x ∈ A∨x ∈ B}
A∩B = {x : x ∈ A∧x ∈ B}
A \ B = {x : x ∈ A ∧ x 6∈ B}
A = {x ∈ X : x 6∈ A}
Vereinigung von A und B
Durchschnitt von A und B
Differenz von A und B
Komplementärmenge von A.
Vereinigung und Durchschnitt können auch für Systeme (Aj )j∈J von Mengen statt nur
für zwei Mengen definiert werden.
(6) Unter den vielen Rechenregeln für Mengen sind die folgenden besonders wichtig:
A∩B =A∪B
A∪B =A∩B
o
de Morgansche Formeln
A=A
(Beweis der Formeln?)
(7) Weitere Mengen werden auf folgende Weise konstruiert. Es seien X, Y beliebige Mengen.
Potenzmenge:
Kreuzmenge:
P(X) = {M : M ⊆ X} = Menge aller Teilmengen von X
X × Y = {(x, y) : x ∈ X ∧ y ∈ Y }
Die Kreuzmenge wird z.B. zur Definition des n–dimensionalen reellen Raumes benötigt:
Rn := R × . . . × R = {(x1 , . . . , xn ) : xi ∈ R}.
Schließlich führen wir die Menge aller Funktionen von X nach Y ein:
Y X = {f : f ist Funktion von X in Y }.
(8) Endliche Mengen sind solche Mengen, deren Elemente sich mit einem Abschnitt
[1, . . . , n] von natürlichen Zahlen durchnummerieren lassen. Endliche Mengen lassen sich
daher durch Aufzählung ihrer Elemente, z.B. in der Form M = {x1 , . . . , xn } angeben. Die
eindeutig bestimmte Zahl n heißt dabei die Anzahl der Elemente von M oder auch die
Kardinalzahl von M , bezeichnet durch card(M ). Sind X und Y endliche Mengen, so
gelten (Beweis?):
card(P(X)) = 2card(X) , card(Y X ) = card(Y )card(X) .
Die letzte Gleichung zeigt insbesondere, dass die Bezeichnung Y X für die Menge aller
Funktionen von X in Y sehr geschickt gewählt ist. Man mache sich klar, dass auch die
Bezeichnung Rn oder genauer R{1,...,n} als Spezialfall dieser Symbolik aufgefasst werden
kann.
4
1 GRUNDLAGEN DER ANALYSIS
1.2
Der Körper der reellen Zahlen
(1) Zur Bezeichnung der uns bekannten Zahlbereiche benutzen wir folgende Symbolik:
Natürliche Zahlen: N = {0, 1, 2, . . .};
N∗ = N \ {0}
Ganze Zahlen:
Z = {0, ±1, ±2, . . .}
Rationale Zahlen: Q
Reelle Zahlen:
R
Komplexe Zahlen: C
Die Axiome des geordneten Körpers der reellen Zahlen:1
Axiom 1: Addition und Multiplikation in R sind wohldefiniert und es gelten:
(a + b) + c = a + (b + c) und (a · b) · c = a · (b · c).
(Assoziativgesetze)
Axiom 2: Stets gelten a + b = b + a und a · b = b · a.
(Kommutativgesetze)
Axiom 3: Die Addition ist umkehrbar, die Multiplikation ist bedingt umkehrbar, d.h.:
Jede Gleichung der Form a + x = b besitzt genau eine Lösung x, die mit x = b − a
bezeichnet wird, und jede Gleichung a · y = b besitzt im Fall a 6= 0 genau eine Lösung
y = b : a = b/a.
(Umkehrbarkeit der Operationen)
Axiom 4: Stets gilt (a + b) · c = a · c + b · c.
(Distributivgesetz)
Axiom 5: Für alle x ∈ R gilt x ≤ x.
(Reflexivität)
Axiom 6: Aus x ≤ y und y ≤ x folgt stets x = y.
(Antisymmetrie)
Axiom 7: Aus x ≤ y und y ≤ z folgt stets x ≤ z.
(Transitivität)
Axiom 8: Für alle Paare x, y ∈ R gilt einer der Fälle x ≤ y oder x ≥ y.
(Linearität)
Axiom 9: Aus a < b folgt a + c < b + c für alle c ∈ R. (Monotoniegesetz der Addition)
Axiom 10: Aus a < b und c > 0 folgt a · c < b · c. (Monotoniegesetz der Multiplikation)
Axiom 11 Jede nach oben beschränkte, nichtleere Menge A ⊆ R hat in R ein Supremum.
.
(Vollständigkeitsaxiom, Details s. später.)
1
Zahlen haben sich als ein sehr geeignetes Instrument zur quantitativen Analysis von Sachverhalten
in Theorie und Praxis erwiesen. Die Mindestanforderung an eine quantitative Methode besteht nämlich
darin, dass man die Daten vergleichen und mittels der vier Grundrechenoperationen verarbeiten kann.
Die kleinste mathematische Struktur mit diesen Eigenschaften ist der Körper Q der rationalen Zahlen.
Für höhere Rechenoperationen, etwa das Wurzelziehen, ist dieser Zahlenbereich jedoch noch zu klein,
z.B. hat die Gleichung x2 = 2 keine rationalen Lösungen.Die Basis für die Analysis ist daher der größere
Körper R der reellen Zahlen. Die Existenz und die Eigenschaften dieser Struktur postulieren wir in den
folgenden Axiomen. Den diffizilen Nachweis, dass es eine solche Struktur überhaupt gibt, holen wir später
nach.
1.2 Der Körper der reellen Zahlen
5
Aus diesen wenigen Axiomen lassen sich nun weitere wichtige Formeln ableiten. Von
besonderer Bedeutung für den Aufbau der Analysis sind dabei die nachfolgenden
Sachverhalte. Wir beginnen mit einer Ergänzung zu Axiom 10:
Satz 1.1 Aus a < b und c < 0 folgt a · c > b · c.
Beweis: Aus c < 0 folgt durch Addition von −c aus Axiom 9 die Ungleichung 0 < −c. Die
Multiplikation der Ungleichung a < b mit der positiven (!) Zahl −c ergibt nach Axiom
10 die Aussage −a · c < −b · c, und durch Umstellen mit Axiom 9 folgt die Behauptung
b · c < a · c.
Heimlich haben wir bei diesem Beweis noch von der Gleichung a · (−c) = −(a · c) Gebrauch gemacht. Die Gültigkeit dieser Formel folgt mit Axiom 4 aber aus der Gleichung
a · c + a · (−c) = a · (c − c) = a · 0 = 0, denn dann muss das Produkt a · (−c) nach Axiom
3 das eindeutig bestimmte Entgegengesetzte zu a · c sein.
Satz 1.2 Für alle x ∈ R gilt x2 ≥ 0.
Beweis: Ungleichungen beweist man häufig durch Fallunterscheidungen, die auf Axiom 8
beruhen: Aus x = 0 folgt x2 = 0. Ist x > 0, so folgt x · x > x · 0 nach Multiplikation mit
x wegen Axiom 10. Ist x < 0, so folgt auch x · x > x · 0 = 0, diesmal wegen Satz 1.1
Satz 1.3 (Bernoullische2 Ungleichung) Für alle h ≥ −1 und alle natürlichen Zahlen
n ≥ 0 gilt 1 + nh ≤ (1 + h)n .
Beweis: Aussagen mit natürlichzahligen Parametern werden häufig mittels vollständiger
Induktion bewiesen. Für den Induktionsanfang n = 0 ist die Ungleichung trivial gültig.
Sie gelte nun für festes n ∈ N. Durch Multiplikation von (1 + h)n ≥ 1 + nh mit der
nichtnegativen (!) Zahl 1 + h ergibt sich die Abschätzung
(1+h)n+1 = (1+h)(1+h)n ≥ (1+h)(1+nh) = 1+h+nh+nh2 ≥ 1+h+nh = 1+(n+1)h.
Damit ist die Bernoullische Ungleichung für alle n ∈ N bewiesen.
An dieser Stelle eine Bemerkung zur Bedeutung von Ungleichungen. Durch die Vorsilbe
”un” ist dieses Wort im Deutschen negativ belegt und betont die Ungleichheit. Daraus
resultiert beim Anfänger häufig eine Unterschätzung des Wertes von Ungleichungen. Man
muss sich aber klar machen, dass eine Ungleichung bereits eine ”halbe” Gleichung ist und
dass in den Fällen, in denen ein äquivalentes Umformen von Ausdrücken zu schwierig
oder gar nicht mehr möglich ist, mit einer Abschätzung wenigstens noch eine Teilaussage
erhalten werden kann. Die Bernoullische Ungleichung lässt auch eine geometrische Interpretation zu: Der Graph der linearen Funktion g(h) = 1 + nh liegt unterhalb des Graphen
von f (h) = (1 + h)n und wegen g(0) = f (0) = 1 ist g(h) = 1 + nh die Gleichung der
Tangente im Punkt (0, 1).
2
Jakob Bernoulli (1654-1705). Zum Bernoullischen Stammbaum gehören ferner die Mathematiker:
Johann B. (1667-1748, jüngster Bruder Jakobs); Niklaus B. (1687-1759), Neffe und Schüler von Jakob
und Johann); Daniel B. (1700-1782, Sohn von Johann).
6
1 GRUNDLAGEN DER ANALYSIS
1.3
Summenzeichen und binomische Formeln
Definition 1.4 (Das Summenzeichen)
Zahlen definieren wir:

n
 am + . . . + an
X
am
ai =

i=m
0
Für jedes System a0 , a1 , . . . , an von reellen
für
für
für
m < n,
m = n,
m > n.
(leere Summe)
Satz 1.5 (Rechenregeln) (Beweis?)
(a)
n
P
ai +
i=0
(b)
n
P
n
P
i=0
ai =
i=0
(c)
bi =
n
P
i=m
m
P
(ai + bi ),
(Additivität)
i=0
n
P
ai +
i=0
ai =
n
P
ai
für
0 ≤ m ≤ n,
(Zerlegungsformel)
i=m+1
n+k
P
ai−k
für alle
k ∈ N.
(Indexverschiebung)
i=m+k
Aufgabe: Beweisen Sie die arithmetische Summenformel:
n
P
i=1
i=
n(n+1)
!
2
Wir wollen nun die bekannten binomischen Formeln
(x ± y)2 = x2 ± 2xy + y 2 und x2 − y 2 = (x − y)(y + x)
auf höhere Potenzen als 2 verallgemeinern. Wir beginnen mit der letzten dieser Formeln:
Satz 1.6 (Drei Varianten der geometrischen Summenformel) Für alle x, y ∈ R
und alle n ∈ N gelten:
x
n+1
−y
n+1
= (x − y) ·
1 − y n+1 = (1 − y)
n
X
xn−k y k
k=0
n
X
y k = (1 − y)(1 + y + . . . + y n )
(1)
(2)
k=0
n
X
k=0
yk =
1 − y n+1
1−y
(3)
Der Beweis kann durch Polynomdivision oder durch vollständige Induktion geführt
werden. (Ausführen!) Die zweite Formel ist ein Spezialfall der ersten (x = 1).
Die Verallgemeinerung der ”ersten” binomischen Formel erfordert eine Vorbereitung:
1.4 Suprema und Infima, Vollständigkeitsaxiom
7
Definition 1.7 (Der Binomialkoeffizient) Für n, p ∈ N setzen wir
n
n(n − 1) · . . . · (n − p + 1)
(gelesen: n über p)
=
p
1 · 2 · ... · p
Für p > n ist np = 0, für n ≥ p gibt np die Anzahl der Auswahlmöglichkeiten von p
Objekten aus einem Vorrat von n Objekten an. Durch Nachrechnen (ausführen!) beweist
man für n ≥ p die Formel:
n
n
n+1
+
=
(Additionstheorem für Binomialkoeffizienten)
p
p+1
p+1
Auf dieser Formel beruht das Pascalsche Dreieck zur Berechnung der Zahlen np .
Satz 1.8 (Binomischer Lehrsatz)
n X
n n−j j
n
(x + y) =
x y für alle x, y ∈ R und n ∈ N.
j
j=0
Beweis: Induktiv unter Verwendung des Additionstheorems oder alternativ durch kombinatorische Überlegungen, wie oft der Term xn−j y j beim Ausmultiplizieren entsteht.
1.4
Suprema und Infima, Vollständigkeitsaxiom
Die Axiome 1 - 10 sind auch im Zahlbereich Q erfüllt, aber die besondere Qualität von R
gegenüber Q besteht in dem nun zu erörternden Axiom 11, dem Vollständigkeitsaxiom.
Wir schaffen uns zunächst das notwendige Instrumentarium:
Definition 1.9 Es sei A eine beliebige Teilmenge von R.
1. A heißt nach oben beschränkt, wenn es eine Zahl x ∈ R mit a ≤ x für alle a ∈ A gibt.
Jedes x mit dieser Eigenschaft heißt eine obere Schranke von A.
2. Falls A eine kleinste obere Schranke hat, so heißt diese das Supremum von A. Es gilt
also
x = sup A ⇔ a) x ist eine obere Schranke von A und
b) ist x0 eine weitere obere Schranke von A, so gilt x ≤ x0 .
Die Bedingung b) ist äquivalent zu:
∗
b ) keine Zahl z < x ist eine obere Schranke von A, d.h.:
Zu jedem z < x existiert ein a ∈ A mit z < a ≤ x.
Untere Schranken und Infima (größte untere Schranken) werden analog definiert.
Axiom 11 (Vollständigkeitsaxiom in R): Jede nach oben beschränkte, nichtleere Menge
A ⊆ R hat in R ein Supremum.
Diese Axiom bildet die Grundlage für die gesamte Analysis, wir werden es sehr bald in
Aktion erleben! Vorerst leiten wir einige Konsequenzen ab.
8
1 GRUNDLAGEN DER ANALYSIS
Satz 1.10 Sind ∅ =
6 A, B ⊆ R nach oben beschränkte Mengen, so gilt
sup A + sup B = sup(A + B).
Ist zusätzlich ∅ =
6 A, B ⊆ R+ , so ist
sup A · sup B = sup(A · B)
Hierbei bedeuten A + B = {a + b : a ∈ A, b ∈ B} und A · B = {a · b : a ∈ A, b ∈ B}.
Beweis: Wir begnügen uns mit dem Beweis der additiven Formel: Es seien x = sup A und
y = sup B. Dann gilt a+b ≤ x+y für alle a ∈ A und alle b ∈ B nach dem Monotoniegesetz.
Insbesondere existiert s = sup(A + B), und es gilt s ≤ x + y. Wäre aber s < x + y, so
wäre g = x + y − s > 0. Wegen x = sup A und y = sup B existieren nach Definition des
Supremums Zahlen a ∈ A und b ∈ B mit x − g2 < a und y − g2 < b, und hieraus würde
s = x + y − g < a + b ≤ s folgen. Widerspruch.
Satz 1.11 (Archimedisches3 Axiom oder Axiom des Messens): Sind a, b beliebige
reelle Zahlen mit a > 0, so existiert eine natürliche Zahl n ∈ N mit b < na.
Beweis: Wäre na ≤ b für alle n ∈ N, so wäre die Menge A = {na : n ∈ N} nach oben
durch b beschränkt. Wegen Axiom 11 existiert s = sup A, und nach (2) führt das auf den
Widerspruch s < s + a = sup{0, a, 2a, . . .} + sup{a} = sup{a, 2a, 3a, · · · } ≤ s.
Aufgaben zu Suprema, Infima, Maxima und Minima
Die Begriffe Supremum und Infimum bereiten Anfängern immer Schwierigkeiten. Das
liegt in der Natur der Sache, denn hiermit wird man erstmals in voller Schärfe mit
dem Unendlichen konfrontiert! Bei der Übertragung der Erfahrungen im Umgang mit
endlichen Mengen auf unendliche Mengen muss höchste Vorsicht geboten sein. So gibt es
in jeder endlichen Menge A von Zahlen natürlich eine kleinste Zahl, die das Minimum von
A genannt wird. Unendliche Mengen müssen aber kein Minimum haben, beispielsweise
gibt es keine kleinste positive reelle Zahl! Supremum und Infimum dienen in gewisser
Weise als Ersatz für Maxima und Minima.
(1) Aufgabe: Man berechne: a) sup
n
n+1
∗
: n ∈ N , b) sup n+1
:
n
∈
N
!
n
(2) Aufgabe: Es sei A eine nichtleere Teilmenge von R. Man sagt, dass A ein (absolutes
oder globales) Maximum hat, wenn es ein Element x ∈ A mit a ≤ x für alle a ∈ A gibt.
Analog wird das Minimum definiert. Beantworten Sie:
a) Ist das Maximum einer Menge auch ihr Supremum?
b) Hat die Menge A = {x : x ∈ R und x < 0} ein Maximum/Supremum?
c) Hat die Menge A = {arctan x : x ∈ R} ein Maximum/Supremum?
3
Archimedes (287?-212 v.Chr.), Syrakus, ”Integralrechnung”, Hebelgesetz, Archimedisches Prinzip.
1.5 Die Approximation reeller Zahlen durch rationale Zahlen
9
d) Welchen Wert hat inf{x2 − 4x + 6 : x ∈ R}?
(3) Aufgabe: a) Geben Sie die ausführliche Definition des Infimums an!
b) Es sei ∅ =
6 A ⊆ R, und es sei B = {−a : a ∈ A} die Menge der entgegengesetzen
Elemente. Zeigen Sie inf A = − sup B, falls wenigstens eine der beiden Größen existiert!
c) Beweisen Sie die zu Axiom 11 ergänzende Aussage: Jede nach unten beschränkte,
nichtleere Teilmenge A ⊆ R hat in R ein Infimum.
(4) Aufgabe: Beweisen Sie das Komplement zu Satz 1.10: Sind ∅ 6= A, B ⊆ R nach
unten beschränkt, so gilt inf A + inf B = inf(A + B).
(5) Aufgabe: Beweisen Sie die multiplikative Formel in Satz 1.10: Sind die Mengen
∅=
6 A, B ⊆ R+ nach oben beschränkt, so gilt sup A · sup B = sup(A · B).
(6) Aufgabe: Das Archimedische Axiom ermöglicht das Messen großer Entfernungen.
Zeigen Sie, dass damit auch das Teilen im Mikrobereich möglich wird: Zu jeder (kleinen)
positiven Zahl a gibt es eine natürliche Zahl n mit 0 < n1 < a! Beweisen Sie dies!
(7) Bemerkung: a) Wegen Aufgabe (6) gibt gibt es Grenzen in der Anwendbarkeit der
rellen Zahlen zur Beschreibung des Mikrokosmos, denn die Heisenbergsche Unschärferelation verbietet in gewissem Sinn ein Messen beliebig kleiner Abstände. Verzichtet man
jedoch auf das Archimedische Axiom, so ist wegen des Beweises zu Satz 1.11 auch das
Vollständigkeitsaxiom nicht mehr zu haben! Das Ergebnis wäre eine sehr viel schwierigere
nichtarchimedische Analysis, die neuerdings als p-adische Analysis auch entwickelt wurde.
b) In Anbetracht der soeben genannten Bedenken und den noch zu erörternden, weitreichenden Konsequenzen aus dem Vollständigkeitsaxiom erhebt sich die grundlegende Frage
nach der Existenz des Zahlbereiches R überhaupt! Hier ist keine Zeit für dieses knifflige
Problem, lesen Sie in der Literatur nach (z.B. Junek, Analysis, Abschnitte 1.3, 3.4 und
3.7).
1.5
Die Approximation reeller Zahlen durch rationale Zahlen
Wir zeigen in diesem Abschnitt, dass reelle Zahlen näherungsweise durch rationale Zahlen
beschrieben werden können.
Satz 1.12 Zu jeder rellen Zahl b existiert genau eine ganze Zahl m mit m ≤ b < m + 1.
Diese heißt der ganze Teil von b, in Zeichen m = Int(b). (integer = ganze Zahl)
Beweis: Es genügt, den Beweis für b > 0 zu führen. Mit a = 1 folgt aus dem Archimedischen Axiom, dass eine natürliche Zahl m mit b < (m + 1) · 1 = m + 1 existiert. Es sei m
die kleinste natürliche Zahl mit dieser Eigenschaft. Dann ist also m ≤ b < m + 1.
Satz 1.13 (Dichtheitsaxiom): Zu jedem Paar x, y reeller Zahlen mit x < y existiert
eine rationale Zahl r mit x < r < y.
10
1 GRUNDLAGEN DER ANALYSIS
Beweis: Wegen y − x > 0 existiert nach dem Archimedischen Axiom ein n ∈ N mit
1 < n · (y − x). Weiter gibt es zu nx nach (1) ein m ∈ Z mit m ≤ nx < m + 1. Also ist
< y.
nx < m + 1 ≤ nx + 1 < nx + n(y − x) = ny und folglich x < m+1
n
Satz 1.14 (Approximation reeller Zahlen durch rationale Zahlen): Für jede reelle
Zahl x gilt x = sup{r ∈ Q : r < x}.
Beweis: Es sei A = {r ∈ Q : r < x}. Wegen (1) ist A 6= ∅. Daher existiert s = sup A und
sicher ist s ≤ x. Wäre aber s < x, so gäbe es nach dem Dichtheitsaxiom eine rationale
Zahl r mit s < r < x im Widerspruch zur Definition von s.
1.15 (Die Dezimalbruchdarstellung reeller Zahlen) Es sei x ∈ R mit x ≥ 0 beliebig gegeben. Die Zahlen xk = 10−k · Int (10k · x) für k ∈ N sind rational, haben eine kstellige Dezimalbruchdarstellung
xk = a0 , a1 a2 . . . ak und erfüllen die Ungleichung xk ≤ x.
√
(Für x = 2 ist z.B. x0 = 1; x1 = 1, 4; x2 = 1, 41; . . .) Sie heißen daher untere dezimale
Näherungen von x. Wir zeigen x = sup{xk : k ∈ N}. Falls x0 = sup{xk : k ∈ N} < x
wäre, so existierte nach Archimedes eine Zahl n ∈ N mit 1 < n(x − x0 ) < 10n (x − x0 ) =
10n x − 10n x0 . Dann wäre aber 10n xn = Int (10n x) ≥ Int (10n x0 + 1) > 10n x0 im Widerspruch zu xn ≤ x0 . In diesem Sinn kann jedem x ≥ 0 eine
Dezimalbruchentwicklung: x = a0 , a1 a2 a3 . . .
zugeordnet werden. Das Rechnen mit den dezimalen Näherungen beruht auf Satz 1.10:
Sind {xk : k ∈ N} und {yk : k ∈ N} die unteren dezimalen Näherungen zu x, y ≥ 0, so
gelten:
x + y = sup{xk : k ∈ N} + sup{yk : k ∈ N} = sup{xk + yk : k ∈ N},
x · y = sup{xk : k ∈ N} · sup{yk : k ∈ N} = sup{xk · yk : k ∈ N}.
1.6
Existenz- und Eindeutigkeit n-ter Wurzeln
Die Nichtlösbarkeit der Gleichung x2 = 2 im Zahlbereich Q war ein Hauptmotiv für die
Erweiterung von Q zu R . Wir zeigen nun, dass in R diese und ähnliche Aufgaben lösbar
sind.
Satz 1.16 Zu jeder natürlichen Zahl n ≥ 1 und jeder reellen Zahl a ≥ 0 existiert genau
√
eine Zahl w ≥ 0 mit wn = a. Diese Zahl heißt die n-te Wurzel aus a, in Zeichen w = n a.
Beweis: Eindeutigkeit: Aus 0 ≤ w1 < w2 folgt w1n < w2n , aus w1 6= w2 also w1n 6= w2n .
Existenz: Es sei a > 0. Zunächst gilt xn = a genau dann, wenn x eine Nullstelle der
Funktion f (x) = xn − a ist. Zur Ermittlung der Nullstellen von f wenden wir das Newtonsche4 Tangentenverfahren an (s. Fig. 38). Die Idee besteht in folgendem: Wir wählen
einen beliebigen Startwert x0 > 0 mit xn0 ≥ a. (Eine solche Zahl existiert wegen des
4
Isaac Newton (1643-1727), Professor in Cambridge, England
1.6 Existenz- und Eindeutigkeit n-ter Wurzeln
11
Abbildung 1: Newtonsches Tangentenverfahren
Archimedischen Axioms). Dann legen wir die ”Tangente” g im Punkt (x0 , f (x0 )) an die
Kurve y = f (x). Die Nullstelle der linearen Funktion g ist dann eine Verbesserung von
x0 , und wir erwarten, dass bei fortgesetzter Wiederholung des Verfahrens näherungsweise
eine Nullstelle von f berechnet werden kann. Zur analytischen Durchführung dieser Idee
auf der Basis der bisherigen Axiome benötigen wir die Gleichung der ”Tangente”. Aus
der Bernoullischen Ungleichung 1 + nh ≤ (1 + h)n folgt mit h = xx0 − 1 für alle x ≥ 0 die
Ungleichung
xn
x
≤ n.
1+n
x0
x0
Nach Multiplikation mit xn0 und Subtraktion von a ergibt sich daraus
g(x) := (xn0 − a) + nxn−1
(x − x0 ) ≤ xn − a = f (x) für alle x ≥ 0.
0
(∗)
Also stellt die soeben eingeführte lineare Funktion g wirklich eine Tangente an f im Punkt
(x0 , f (x0 )) mit Nullstelle bei
xn − a
x1 = x0 − 0 n−1
nx0
dar. Wegen (*) ist g(0) ≤ 0 − a < 0 ≤ xn0 − a = g(x0 ). Somit gelten 0 < x1 ≤ x0 und
0 = g(x1 ) ≤ xn1 − a (nochmals (*)). Wir können daher das Verfahren mit x1 statt x0
wiederholen. Auf diese Weise erhalten wir rekursiv Zahlen
xj+1 = xj −
xnj − a
mit 0 < xj+1 ≤ xj und 0 ≤ xnj+1 −a für alle j ∈ N.
nxn−1
j
(∗∗)
Wegen Axiom 11 existiert das Infimum w = inf{xj : j ∈ N}. Wir zeigen wn = a: Durch
Umstellen von (**) folgt xj+1 · n · xjn−1 + xnj − a = nxnj , und der Übergang zum Infimum
liefert wegen Satz 1.10 wie gewünscht wn = a.
Die im Beweis zu Satz 1.16 verwendete Iterationsformel (**) liefert auch eine effektive und
sehr schnell konvergierende Methode zur näherungsweisen Berechnung von Wurzeln. Geometrisch ergeben sich die xn wie in Abbildung 7.1 dargestellt. Das angegebene Verfahren
hat weit über die Berechnung reeller Wurzeln Bedeutung, die gleiche Technik kann beispielsweise auch angewandt werden, um sogenannte positiv definite Matrizen als Quadrate
von Matrizen zu schreiben.
Aufgaben
1. Berechnen Sie w =
√
2 auf 18 Dezimalstellen (Taschenrechner erlaubt).
12
1 GRUNDLAGEN DER ANALYSIS
p√
√
√ √
√
2. Beweisen Sie durch Probe n ab = n a · n b und n m a = n·m a für a, b ≥ 0.
√
3. Zeigen Sie 2 ∈
/ Q. Geben Sie eine irrationale Zahl x ∈ [0, 1] an.
4. Zeigen Sie: Zu je zwei rationalen Zahlen p < q existiert eine irrationale Zahl x mit
p < x < q.
√
5. Zeigen Sie inf{ n x : n ∈ N∗ } = 1 für alle x > 1. Hinweis: Beweisen Sie unter
Verwendung der Bernoullischen Ungleichung zunächst die Ungleichung:
√
n
x≤1+
x−1
.
n
13
2
2.1
Elementare Funktionen
Funktionen und deren Eigenschaften
Funktionen werden in der modernen Mathematik losgelöst von der Frage ihrer Berechnungsmöglichkeit zunächst als reine Objekte der Mengenlehre definiert.
Definition 2.1 Es seien X und Y nichtleere Mengen. Unter einer Funktion verstehen
wir ein Tripel (X, g, Y ), wobei g eine Teilmenge von X × Y mit der folgenden Eigenschaft
ist :
Sind (x, y1 ), (x, y2 ) ∈ g, so ist y1 = y2 . (Nacheindeutigkeit)
Die Menge X heißt Vorbereich der Funktion, die Menge Y heißt Nachbereich von g.
Statt (X, g, Y ) werden meistens die ausdrucksvollere Symbolik g : X → Y benutzen oder
auch einfach g schreiben. Die Mengen
D(g) = {x ∈ X : Es existiert ein y ∈ Y mit (x, y) ∈ g},
W (g) = {y ∈ Y : Es existiert ein x ∈ Xmit (x, y) ∈ g}
heißen Definitions- bzw. Wertebereich von g.
Nach obigem gehört zu jedem x ∈ D(g) genau ein Wert y ∈ Y mit (x, y) ∈ g. Dieser Wert
heißt der Funktionswert von x und wird durch y = g(x) bezeichnet. Zwei Funktionen
f : X → Y und g : X → Y sind gleich, wenn sie wertverlaufsgleich sind, d.h., wenn
D(f ) = D(g) und wenn g(x) = f (x) für alle x ∈ D(f ) gilt.
Definition 2.2 Eine Funktion g = (X, g, Y ) heißt eine Funktion von X in Y , wenn
D(g) = X gilt. Die Funktion g heißt Funktion von X auf Y oder eine Surjektion, wenn
D(g) = X und W (g) = Y gelten. Die Funktion g heißt eine voreindeutige Funktion
oder eine Injektion, wenn für alle x1 , x2 ∈ D(f ) aus g(x1 ) = g(x2 ) stets x1 = x2 folgt.
Während in der diskreten Mathematik Funktionen oft durch Wertetafeln gegeben sind (es
sei an die Wahrheitswertfunktionen erinnert), werden Funktionen in der Analysis häufig
durch eine Funktionsgleichung oder eine Berechnungsvorschrift gegeben. So heißen z.B.
die durch die Gleichung
fn (x) = xn , x ∈ R
auf R definierten Funktionen Potenzfunktionen.
Definition 2.3 Sind f : X → Y und g : Y → Z zwei Funktionen, so läßt sich durch
Aneinanderfügen eine neue Funktion g ◦ f : X → Z durch
g ◦ f = {(x, z) ∈ X × Z : Es existiert ein y ∈ Y mit y = f (x) und z = g(y)}
definieren. Diese Funktion heißt die Superposition oder Nacheinanderausführung von f
und g. Dabei gilt offenbar
(g ◦ f )(x) = g(f (x)) für alle x ∈ D(g ◦ f ) und D(g ◦ f ) = {x ∈ D(f ) : f (x) ∈ D(g)}.
14
2 ELEMENTARE FUNKTIONEN
Natürlich ist streng auf die Reihenfolge der Anwendung der Funktionen zu achten.
Unwesentlich ist bei der Superposition von mehr als zwei Funktionen jedoch die Art
der Beklammerung, denn es gilt für f : X → Y , g : Y → Z und h : Z → W stets
h ◦ (g ◦ f ) = (h ◦ g) ◦ f , also eine Art Assoziativgesetz.
Auf jeder Menge X 6= ∅ existiert die identische Funktion bezeichnet durch idX : X → X,
die durch idX (x) = x definiert wird.
Definition 2.4 Eine Funktion g : Y → X heißt Umkehrfunktion zur Funktion f : X →
Y , wenn g ◦ f = idX und f ◦ g = idY gelten.
Die Umkehrfunktion zu f ist im Fall der Existenz durch f eindeutig bestimmt, denn wären
g1 und g2 zwei solche Funktionen, so ergäbe sich D(g1 ) = Y = D(g2 ) wegen f ◦ g = idY .
Da aber ferner g1 (y) = ((g2 ◦ f ) ◦ g1 )(y) = (g2 ◦ (f ◦ g1 ))(y) = g2 (y) für alle y ∈ Y gilt,
folgt g1 = g2 . Die Umkehrfunktion zu f wird im Fall der Existenz durch f −1 bezeichnet.
Satz 2.5 Eine Funktion f : X → Y besitzt genau dann eine Umkehrfunktion, wenn
D(f ) = X und W (f ) = Y sind und wenn f eineindeutig ist.
Beweis. Hat f eine Umkehrfunktion g, so gilt D(f ) = X wegen g ◦ f = idX und
W (f ) = Y wegen f ◦ g = idY . Wendet man die Funktion g auf eine Gleichung der Form
f (x1 ) = f (x2 ) an, so folgt x1 = x2 . Das zeigt die Eineindeutigkeit von f . Sind umgekehrt
die Bedingungen im Satz erfüllt, so definiere man g := {(y, x) : (x, y) ∈ f }. Dann ist g
offenbar eine Umkehrfunktion zu f .
Aufgaben
Prüfen Sie, ob die Mengen
A = {(x, y) ∈ R2 : y 2 − x2 = 0} und B = {(x, y) ∈ R2 : y − x2 = 0}
Graphen von Funktionen von R in R sind.
2.2
Monotone Funktionen
Wir betrachten in diesem Abschnitt ausschließlich reelle Funktionen einer reellen
Veränderlichen, d.h. Funktionen aus R in R.
Definition 2.6 Eine Funktion f aus R in R heißt (streng) monoton wachsend auf einer
Teilmenge M ihres Definitionsbereiches für alle x1 , x2 ∈ M aus
x1 < x 2
stets
f (x1 ) ≤ f (x2 )
bzw.
f (x1 ) < f (x2 ))
folgt. Entsprechend werden monoton fallende Funktionen definiert.
2.3 Potenzfunktionen mit rationalem Exponenten
15
Als Beispiele betrachten wir die Potenzfunktionen fn (x) = xn für n ∈ N∗ . Auf der positiven Halbachse R+ = {x : x ≥ 0} sind diese Funktionen streng monoton wachsend,
denn aus 0 ≤ x1 < x2 folgt x21 < x1 x2 < x22 , und durch einen induktiven Beweis in analoger Weise xn1 < xn2 . Entsprechend zeigt man, daß fn (x) = xn auf dem Intervall (−∞, 0]
für geradzahliges n streng monoton fallend und für ungeradzahliges n streng monoton
wachsend sind.
Satz 2.7 (1. Hauptsatz über monotone Funktionen) Ist f : I → f (I) auf dem Intervall I streng monoton wachsend, so hat f eine Umkehrfunktion f −1 : f (I) → I, die
selbst streng monoton wachsend ist.
Beweis. Eine streng monoton wachsende Funktion f ist offenbar voreindeutig. Daher existiert die Umkehrfunktion f −1 . Seien nun z1 , z2 ∈ W (f ) mit z1 < z2 gegeben und seien
x1 = f −1 (z1 ), x2 = f −1 (z2 ). Dann gilt x1 < x2 , da die Ungleichung x1 ≥ x2 wegen der
Monotonie von f nicht z1 < z2 verträglich ist. Also ist f −1 streng monoton wachsend.
Folgerung 2.8 Die Funktionen fn (x) = xn (n 6= 0) haben auf [0, ∞) streng monoton
√
wachsende Umkehrfunktionen, dies sind die Wurzelfunktionen gn (y) = n y.
2.3
Potenzfunktionen mit rationalem Exponenten
Zur Vorbereitung der Definition von Potenzfunktionen mit rationalem Exponenten beweisen wir:
Satz 2.9 Es seien n, p ∈ N∗ und m, p ∈ Z mit
√
n
xm =
m
n
= pq . Dann gilt
p
√
q
x für alle x ≥ 0.
√
√
Beweis. Es seien a = n xm , b = ( q x)p und t = mq = np. Dann folgt unter Verwendung
der Potenzgesetze für natürlichzahlige Exponenten
√
at = anp = xmp = ( q x)qmp = bqm = bt .
Also ist a = b.
Definition 2.10 Für jede rationale Zahl r ∈ Q wird durch die Gleichung
fr (x) := xr =
√
n
√
m
xm = ( n x)m , r = , n > 0
n
im Fall r > 0 eine streng monoton wachsende Funktion und im Fall r < 0 eine streng
monoton fallende Funktion auf dem Intervall (0, ∞), die Potenzfunktion mit rationalem
Exponenten, definiert.
16
2 ELEMENTARE FUNKTIONEN
2.4
Die Exponentialfunktionen
In diesem Absschnitt wird die Exponentialfunktion f (x) = ax auf ordnungstheoretischer
Grundlage eingeführt. Im 1. Charakterisierungssatz wird gezeigt, dass die Exponentialfunktion auch abstrakt durch ihre Eigenschaften, insbesondere durch ihr Additionstheorem eindeutig bestimmt ist. Das erklärt auch, warum jede Beschreibung eines Wachstumsund Sterbeprozesses auf Exponentialfunktionen als Modelle führen muss. Im Verlauf des
Kurses werden wir weitere Beschreibungsmöglichkeiten der Exponentialfunktionen kennen
lernen. Das unterstreicht einmal mehr die fundamentale Bedeutung dieser Funktion und
gibt Anlass, Exponentialfunktionen auch in anderen Strukturen als Zahlbereichen (z.B. in
Matrizenräumen) einzuführen. Das hat besondere Bedeutung in der Theorie dynamischer
Systeme und in der Quantenmechanik.
Satz 2.11 Es sei a > 1. Die durch f (r) = ar =
hat die folgenden Eigenschaften:
a)
b)
c)
d)
√
n
am für r =
m
n
auf Q definierte Funktion
D(f ) = Q ,
f ist streng monoton wachsend auf Q,
f (r + s) = ar+s = ar as = f (r)f (s) für alle r, s ∈ Q,
f (r) > 0 für alle r ∈ Q .
Beweis. a) folgt aus Definition 2.10. Für den Nachweis von b) seien r und s rationale Zahlen
mit r < s. Da beide Brüche gleichnamig gemacht werden können, kann r = nk < nj = s
√
√
n
n
angenommen werden. Dann ist k < j, und hieraus folgen ak < aj und ak < aj .
Zu c): Aus r =
k
n
und s =
j
n
ar+s = a
k+j
n
folgt
=
√
n
ak+j =
√
n
ak ·
√
n
k
j
aj = a n · a n = ar as .
r
Schließlich ergibt sich d) aus ar = (a 2 )2 ≥ 0 . Wegen b) ist ar = 0 dabei unmöglich.
Der bisher noch mit Lücken behaftete Graph der Funktion f (x) = ax kann nun mit
dem folgenden Satz ausgefüllt werden. Auf diese Weise entsteht die auf ganz R definierte
Exponentialfunktion.
Satz 2.12 (Die monotone Fortsetzung der Exponentialfunktion) Es sei a > 1.
Dann heißt die durch die folgende Formel definierte Funktion
F (x) = ax := sup{ar : r ≤ x, r ∈ Q}
die
a)
b)
c)
d)
Exponentialfunktion zur Basis a. Sie hat die folgenden Eigenschaften:
D(F ) = R,
F ist streng monoton wachsend auf R,
F (x + y) = ax+y = ax ay = F (x) · F (y) für alle x, y ∈ R,
W (F ) = (0, ∞).
2.4 Die Exponentialfunktionen
17
Beweis. Wegen Satz 2.11b) gilt F (r) = ar = f (r) für alle r ∈ Q. Daher ist F eine
Fortsetzung von f . Wir zeigen jetzt D(F ) = R. Für x ∈ R sei
Ax := {ar : r ≤ x, r ∈ Q}.
Dann ist Ax 6= ∅ und nach oben beschränkt wegen Satz 2.11. Folglich existiert sup Ax
wegen Axiom 11. Das zeigt D(F ) = R.
Für x ∈ R setzen wir nun
A0x := {ar : r < x, r ∈ Q}
und zeigen zunächst, daß auch sup Ax = sup A0x gilt. Im Fall x ∈ R \ Q bleibt nichts
zu beweisen. Sei also jetzt x ∈ Q. Natürlich ist sup A0x ≤ sup Ax = ax . Wäre aber
c = sup A0x < ax , so gäbe es wegen inf{a1/n : n ∈ N∗ } = 1 (s. Aufgabe 3 aus Abschnitt
1.6) eine Zahl n ∈ N∗ , so dass auch noch c · a1/n < ax und somit c < ax−1/n gelten. Da
aber x − 1/n ∈ A0x gilt, steht das im Widerspruch zu c = sup A0x .
Zum Beweis von b) wählen wir zu x < y zwei rationale Zahlen r, s mit x < r < s < y.
Dann ist Ax ≤ ar < as ≤ ay , also ax < ay .
Das Additionstheorem c) ergibt sich durch folgende Rechnung:
ax · ay = sup A0x · sup A0y = sup A0x · A0y
= sup{ar+s : r < x, s < y; r, s ∈ Q}
= sup{at : t < x + y, t ∈ Q} = ax+y .
Zum Beweis von d) ist schließlich zu zeigen, dass jede Gleichung der Form ay = c mit
c > 0 eine Lösung hat. Wir bilden dazu die Menge Mc = {r ∈ Q : ar ≤ c} und werden
zeigen, dass y = sup Mc obige Gleichung löst. Zunächst ist Mc 6= ∅, denn wegen dem
archimedischen Axiom und der Bernoullischen Ungleichung existiert ein n ∈ N∗ mit
c−1 ≤ 1 + n(a − 1) ≤ an .
Also ist a−n ≤ c und damit −n ∈ Mc . Die Menge Mc ist aber auch nach oben beschränkt,
da sie andererseits wegen b) die Menge aller natürlichen Zahlen enthalten müßte. Die
Ungleichung an ≤ c kann aber nach nicht für alle natürlichen Zahlen gelten, denn für
hinreichend große n ∈ N ist
c < 1 + n(a − 1) ≤ an ,
wiederum nach der Bernoullischen Ungleichung. Also ist Mc nicht leer und nach oben
beschränkt, und daher existiert y = sup Mc . Es bleibt ay = c zu zeigen. Zu r < y existiert
0
ein r0 ∈ Mc mit r < r0 . Also gilt ar < ar ≤ c. Das zeigt A0y ≤ c, also ay ≤ c. Wäre
aber ay < c , so gäbe es wiederum wegen inf{a1/n : n ∈ N∗ } = 1 eine Zahl n ∈ N∗ mit
ay · a1/n < c. Zu diesem n wählen wir eine Zahl r ∈ Mc mit y − n1 < r ≤ y, also y < r + n1
. Dann folgt aber
1
1
1
ar+ n = ar · a n ≤ ay · a n < c,
also r +
1
n
∈ Mc im Widerspruch zu y < r +
1
n
. Das beweist ay = c.
Bisher haben wir Exponentialfunktionen nur mit einer Basis a > 1 eingeführt. Der Fall
0 < a < 1 wird durch die Definition ax := (a−1 )−x hierauf zurückgeführt. Ergänzend
definieren wir 1x = 1 für alle x ∈ R.
18
2 ELEMENTARE FUNKTIONEN
Bemerkung 2.13 Die für die Exponentialfunktion typische Gleichung F (x + y) =
F (x) · F (y) läßt folgende Interpretation zu. Deutet man x als Zeit und setzt man y = 1
Zeiteinheit, so bedeutet
F (x + 1) = F (1) · F (x),
dass diese Funktion F Wachstumsprozesse mit einem Wachstumsfaktor F (1) modelliert.
Insbesondere sind Exponentialfunktionen also zur Modellierung von bakteriellen Wachstumsprozessen, von Verzinsungsprozessen und von radioaktiven Zerfallsprozessen geeignet.
Der folgende Satz zeigt, daß umgekehrt nur Exponentialfunktionen zur Beschreibung
ungebremsten Wachstums geeignet sind:
Satz 2.14 (Erster Charakterisierungssatz für Exponentialfunktionen) Es sei f
eine nicht identisch verschwindende Funktion mit folgenden Eigenschaften:
a) D(f ) = R ,
b) f ist monoton wachsend,
c) Es gilt f (x + y) = f (x) · f (y) für alle x, y ∈ R.
Dann ist f eine Exponentialfunktion, und es gilt f (x) = ax mit a = f (1) für alle x ∈ R.
Insbesondere ist W (f ) = (0, ∞), sofern f (1) 6= 1.
Beweis. Nach Voraussetzung existiert ein x0 ∈ R mit f (x0 ) 6= 0. Wegen f (x0 ) = f (x0 +
0) = f (x0 ) · f (0) folgt hieraus f (0) = 1. Das ergibt weiterhin a := f (1) ≥ f (0) = 1. Für
alle x ∈ R und alle n ∈ N∗ gilt f (nx) = f (x + . . . + x) = f (x)n wegen c). Für m, n ∈ N∗
ergibt sich speziell
m m n
= f
,
am = f (1)m = f (m) = f n ·
n
n
also f ( m
) = am/n . Das zeigt f (r) = ar für alle rationalen Zahlen r > 0. Wegen
n
f (−x)f (x) = f (x + (−x)) = f (0) = 1
folgt weiter f (−x) = f (x)−1 für alle x ∈ R . Hieraus ergibt sich insbesondere f (r) = ar
alle r ∈ Q. Also gilt auch
ax = sup{ar : r ≤ x, r ∈ Q} = sup{f (r) : r ≤ x, r ∈ Q} ≤ f (x)
für alle x ∈ R. Ebenso ist a−x ≤ f (−x) und folglich f (x) ≤ ax . Beide Ungleichungen
zusammen zeigen nun f (x) = ax für alle x ∈ R.
Definition 2.15 (Logarithmusfunktionen) Die Umkehrfunktion g = loga zur Exponentialfunktion F (x) = ax mit a > 0 und a 6= 1 heißt Logarithmusfunktion zur Basis a.
Es gilt also
x = loga y genau dann, wenn ax = y.
2.4 Die Exponentialfunktionen
19
Satz 2.16 Die Funktion g(y) = loga y hat folgende Eigenschaften:
a) D(g) = (0, ∞) und W (g) = R,
b) loga a = 1 und loga 1 = 0,
c) loga ist für a > 1 streng monoton wachsend,
d) loga (x1 x2 ) = log2 x1 + loga x2 ,
e) loga xb = b loga x für alle b ∈ R.
Beweis. Die Aussagen a), b) und c) ergeben sich aus Satz 2.12 und Satz 2.7. Zum Beweis
von d) seien ci = loga xi für i = 1, 2. Dann ist aci = xi , und folglich ac1 +c2 = x1 · x2 .
Hieraus folgt c1 + c2 = loga (x1 x2 ). Wir übergehen den Beweis zu e).
Die Logarithmen zur Basis 2, 10 und e bezeichnet man kurz durch ld, lg bzw. ln (für
logarithmus dualis, Briggscher Logarithmus und logarithmus naturalis).
Satz 2.17 Für alle reellen Zahlen a, b > 0 mit a, b 6= 1 gilt
ax = bx·logb a für alle x ∈ R.
Insbesondere lässt sich jede Exponentialfunktion durch Stauchung der x-Achse in jede
andere Exponentialfunktion überführen.
Beweis. Der Ansatz ax = bx·z führt durch Logarithmieren zur Basis b auf x · logb a = x · z,
also z = logb a.
Die folgenden Funktionen stehen in engem Zusammenhang mit der Exponentialfunktion.
Ihr Nutzen wird später klar werden (z.B. im Abschnitt zur Berechnung von Integralen
oder in der hyperbolischen Geometrie).
Definition 2.18 Die Funktionen
sinh x =
ex − e−x
2
und
cosh x =
ex + e−x
2
heißen der hyperbolische Sinus bzw. der hyperbolische Kosinus,, ihre Umkehrfunktionen
(soweit definiert) heißen Areasinus Hyperbolicus bzw. Areacosinus Hyperbolicus, sie werden durch arsinh bzw. arcosh bezeichnet.
Aufgaben zu Abschnitt 2.4
1. Beweisen Sie mit der Methode aus dem Beweis zu Satz 2.12 die Gleichung
(ax )y = axy für alle x, y ∈ R.
2. Beweisen Sie mittels der Formel aus Aufgabe 1 die Formel e) aus Satz 2.16.
3. Beweisen Sie die Transformationsformel logb x = loga x · logb a.
4. Beweisen sie für alle Zahlen a, b, c > 0 und a, b, c 6= 1 die Gleichung
loga b · logb c · logc a = 1.
20
2 ELEMENTARE FUNKTIONEN
5. Lösen Sie die Gleichung log16 x + log4 x + log2 x = 7.
6. Skizzieren Sie den Verlauf der Funktionen sinh und cosh.
7. Beweisen Sie die Additionstheoreme für die hyperbolischen Funktionen:
sinh(x + y) = sinh(x) cosh(y) + cosh(x) sinh(y),
cosh(x + y) = cosh(x) cosh(y) + sinh(x) sinh(y).
21
3
Beträge und komplexe Zahlen
Ziel aller Bemühungen in der Analysis ist die Untersuchung von Funktionen. Im Abschnitt
II haben wir als Hauptwerkzeug die Ordnungsrelation im Bereich der reellen Zahlen mit
ihren Eigenschaften benutzt. Am Beispiel der Konstruktion der Wurzel- und der Exponentialfunktion konnte die Leistungsfähigkeit dieses Apparates demonstriert werden.
Ordnungstheoretische Techniken wie diese finden auch in der modernen Analysis in der
Theorie der Vektorverbände ihre Weiterentwicklung. Dennoch erweist sich dieser Apparat
als etwas schwerfällig, und die Einbeziehung komplexwertiger Funktionen ist grundsätzlich
ausgeschlossen, da der Bereich der komplexen Zahlen keine mit Addition und Multiplikation verträgliche (totale) Ordnung zulässt. Wir benutzen daher von nun ab hauptsächlich
den Abstandsbegriff, der durch die Betragsfunktion sowohl in R als auch im Körper C
der komplexen Zahlen eingeführt werden kann. Es sei bemerkt, dass dies Konzept später
sogar auf endlich- und unendlich dimensionale Vektorräume verallgemeinert werden kann.
Damit haben wir für alle diese Fälle eine einheitliche Methode.
3.1
Die Betragsfunktion in R
Definition 3.1 Im Körper R der reellen
gende Formel eingeführt:

 x für
0 für
|x| =

−x für
Zahlen wird die Betragsfunktion durch die fol
x>0 
x=0
= max{x, −x}

x<0
Satz 3.2 Die Betragsfunktion | · | : R → R hat die folgenden drei Eigenschaften:
(B1) Stets ist |x| ≥ 0, und es gilt |x| = 0 genau dann, wenn x = 0 ist.
(B2) Für alle x, y ∈ R gilt |xy| = |x| · |y| .
(B3) Für alle x, y ∈ R gilt |x + y| ≤ |x| + |y|.
(Dreiecksungleichuung)
Beweis. Die Behauptungen ergeben sich durch Fallunterscheidungen.
3.2
Der Körper C der komplexen Zahlen
Der Körper der komplexen Zahlen wird als Erweiterung von R mit dem Ziel konstruiert,
in diesem Bereich eine Lösung der Gleichung x2 = −1 zu finden. In R ist diese Gleichung wegen 1.2 nämlich nicht lösbar. Um diese Konstruktion vorzubereiten, nehmen wir
zunächst an, daß ein Erweiterungsbereich C von R derartig existiert, daß in C eine den
Axiomen Ax1 - Ax4 aus Abschnitt 1.2 genügende Addition und Multiplikation erklärt ist
und daß in C eine Lösung der Gleichung x2 = −1 existiert. Wir bezeichnen eine solche
Lösung (wie L. Euler) mit i. Dann enthält C wegen der Axiome Ax1 - Ax4 zumindestens
alle Elemente der Form a + bi mit a, b ∈ R. Wegen Ax1 - Ax4, i 6∈ R und i2 = −1 gelten
für diese Zahlen die folgenden Aussagen:
22
3 BETRÄGE UND KOMPLEXE ZAHLEN
a) a + bi = a0 + b0 i genau dann, wenn a = a0 und b = b0 .
b) (a + bi) + (c + di) = (a + c) + (b + d)i .
c) (a + bi) · (c + di) = (ac − bd) + (ad + bc)i .
d) Es ist i = 0 + 1 · i und 1 = 1 + 0 · i .
Damit ist umgekehrt die Konstruktion von C als kleinste derartige Erweiterung von R
vorbereitet.
Definition 3.3 (Der Körper C) Wir setzen C = {(a, b) : a ∈ R, b ∈ R} = R × R und
definieren eine Addition und Multiplikation in C durch
(a, b) + (c, d) = (a + c, b + d),
(a, b) · (c, d) = (ac − bc, ac + bd).
Es ist reine Schreibarbeit, die Gültigkeit der Rechenregeln Ax1, Ax2 und Ax4 nachzuweisen. Für die Division (Ax3) benötigt man einen kleinen Trick, den wir in (4) besprechen.
Führt man in Anlehnung an d) die Abkürzungen 1 = (1, 0) und i = (0, 1) ein, so folgt für
die Elemente (a, b) ∈ C die Darstellung
(a, b) = a(1, 0) + b(0, 1) = a · 1 + bi.
Der Teilbereich {a · 1 : a ∈ R} ⊆ C lässt sich vermöge a · 1 7→ a eineindeutig auf R
abbilden, und da a · 1 + a0 · 1 = (a + a0 ) · 1 sowie (a · 1) · (b · 1) = (a · b) · 1 gelten, können
wir die Elemente der Form a · 1 mit den reellen Zahlen und das Element 1 speziell mit
der Zahl 1 identifizieren. Damit lässt sich C auch wie folgt schreiben:
C = {a + b i : a, b ∈ R}.
Die so konstruierte Erweiterung C von R heißt der Körper der komplexen Zahlen.
Definition 3.4 Unter der Gaußschen Zahlenebene versteht man die durch die Zuordnung
z = a + b i 7→ (a, b) ∈ R2 hergestellte eineindeutige Abbildung von C auf R2 (s. Abbildung
2).
Abbildung 2: Gaußsche Zahlenebene
Wegen Definition 3.3 vollzieht sich die Addition in C dabei genau so, wie die Addition
der zugehörigen Vektoren in R2 .
3.2 Der Körper C der komplexen Zahlen
23
Definition 3.5 Die Funktionen
Re : C → R vermöge Re(a + bi) = a
Im : C → R vermöge Im(a + bi) = b
heißen Real- bzw. Imaginärteil, und die durch
z = a + bi 7→ z := a − bi
definierte Spiegelung an der reellen Achse heißt Konjugieren. Die Zahl z heißt die zu z
konjugierte reelle Zahl. (S. Abbildung 2)
Satz 3.6 Es seien z, z1 , z2 ∈ C und z = a + bi. Dann gelten:
1)
2)
3)
4)
5)
z = z,
z1 + z2 = z1 + z2 ,
z1 · z2 = z1 · z2 ,
z · z = (a + bi)(a + bi) = a2 + b2 ≥ 0,
Rez = z+z
, Imz = z−z
.
2
2i
Beweis. Nachrechnen!
Die Division komplexer Zahlen kann nun durch Erweitern mit dem konjugiert komplexen
Nenner leicht ausgeführt werden. So ist beispielsweise
(3 + 5i)(2 − i)
6 + 5 + (10 − 3)i
11 7
3 + 5i
=
=
=
+ i.
2+i
(2 + i)(2 − i)
4+1
5
5
Bemerkung 3.7 Im Zahlbereich R folgt aus z n = z m für z 6= 0, 1 sofort n = m. Beachten
Sie, dass dieser Schluss in C nicht richtig ist! Finden Sie ein Gegenbeispiel!
Definition 3.8 (Betrag) Für jede Zahl z = a + bi ∈ C heißt die Zahl
√
√
|z| := a2 + b2 = zz
der Betrag von z. In der Gaußschen Zahlenebene ist der Betrag der Zahl z = a + bi als
Abstand des Punktes P (a, b) zum Nullpunkt realisiert.
Satz 3.9 Die Betragsfunktion | · | : C → R hat folgende Eigenschaften:
(B1) Stets ist |z| ≥ 0 , und es gilt |z| = 0 genau dann, wenn z = 0 ist.
(B2) Für alle z1 , z2 ∈ C gilt |z1 · z2 | = |z1 | · |z2 |.
(B3) Für alle z1 , z2 ∈ C ist |z1 + z2 | ≤ |z1 | + |z2 |.
(Dreiecksungleichung)
Beweis. Die Aussagen (B1) und (B2) ergeben sich aus Satz 3.6. Die Dreiecksungleichung
(B3) ergibt sich wie folgt: Wegen Rez ≤ |z| und Satz 3.6 gilt
|z1 + z2 |2 = (z1 + z2 )(z1 + z2 ) = |z1 |2 + (z1 z2 + z1 z2 ) + |z2 |2
= |z1 |2 + 2Re(z1 z2 ) + |z2 |2 ≤ |z1 |2 + 2|z1 ||z2 | + |z2 |2 = (|z1 | + |z2 |)2 ,
und hieraus folgt die Dreiecksungleichung.
24
3 BETRÄGE UND KOMPLEXE ZAHLEN
Aufgaben zu Kapitel 3
1+i
,
1−i
1
b) z2 = 3−2i
, c) z3 =
2. Berechnen Sie: a) Re (2 + i)5 , b) |(2 + i)5 |.
1. Berechnen Sie: a) z1 =
3−i
.
5
3. Bestimmen Sie alle Lösungen der Gleichungen a) z 2 = i , b) z 3 = 8 in C.
4. Beweisen Sie die Ungleichung |z| − |w| ≤ |z − w| für alle z, w ∈ C.
5. Skizzieren Sie die Menge M = {z : |z − i| ≤ 2} in der Gaußschen Zahlenebene.
25
4
Zahlenfolgen und Reihen
Zahlenfolgen und deren Eigenschaften sind eines der wichtigsten Instrumente für die Untersuchung von Funktionen. Dieses Kapitel hat daher eine grundsätzliche und zentrale
Bedeutung für das Verständnis der Analysis und der Leser muss sich unbedingt sichere
Kenntnisse zu diesem Gegenstand aneignen.
4.1
Zahlenfolgen
Definition 4.1 Unter einer reellen bzw. komplexen Zahlenfolge (an )n∈N versteht man eine
Abbildung (an ) : N → R bzw. (an ) : N → C. Die Zahlen an für n ∈ N heißen die Glieder
der Folge.
Die Menge aller reeller bzw. komplexer Zahlenfolgen wird (in übereinstimmung mit Abschnitt 1.1(7)) durch RN bzw. CN bezeichnet.
Für Zahlenfolgen können gemäß nachfolgender Definition Rechenoperationen eingeführt
werden:
(an )n∈N ± (bn )n∈N = (an ± bn )n∈N ,
(an )n∈N · (bn )n∈N = (an · bn )n∈N ,
c · (an )n∈N = (c · an )n∈N für c ∈ C.
Insbesondere sind RN und CN mit diesen Rechenoperationen (unendlich dimensionale)
Vektorräume.
Definition 4.2 Ist (an )n∈N eine Zahlenfolge und ist (nk )k∈N eine streng monoton wachsende Folge natürlicher Zahlen n1 < n2 < . . ., so heißt die Folge (ank )k∈N eine Teilfolge
von (an ).
So sind z.B. (an )n≥10 , (a2n ) oder (a2n+1) drei Teilfolgen von (an ).
Definition 4.3 Eine Folge (an ) heißt
a) stationär, falls an = an+1 für alle n ∈ N gilt.
b) quasistationär, falls eine Zahl n0 ∈ N so existiert, dass an = an+1 für alle n ≥ n0 gilt.
Wir führen nun den grundlegenden Begriff der Konvergenz von Folgen ein, wie er von
A. L. Cauchy5 1832 in seinen ,,Vorlesungen zur Infinitesimalrechnungßur strengen Begründung der Analysis entwickelt wurde.
5
Der Name Analysis leitet sich aus dem Titel des Buches ,,Cours d’analyse de l’École Polytechnique”
von Augustin Louis Cauchy (1789-1857) aus dem Jahr 1821 ab. Die Mathematiker vor Cauchy wie
Leibniz, Newton, die Bernoullis, Euler oder Lagrange hatten oft ohne saubere mathematische Definitionen gearbeitet und viel intuitives Verständnis von Funktionen benutzt. Bei der Vorbereitung zu seinen
Vorlesungen fielen Cauchy diese Lücken auf, und so stellte er als erster die Analysis auf eine strenge
methodische Basis. Deswegen betrachtet man ihn als einen der ersten modernen Mathematiker.
26
4 ZAHLENFOLGEN UND REIHEN
Definition 4.4 (Konvergenz) Eine Zahlenfolge (an ) heißt konvergent gegen a und a
heißt Grenzwert von (an ), wenn zu jedem ε > 0 eine Zahl n0 (ε) so existiert, dass für alle
n ∈ N mit n ≥ n0 (ε) die Abschätzung |an − a| < ε gilt. In diesem Fall schreibt man
lim an = a oder einfach an → a für n → ∞. In Kurzform könnten wir schreiben:
n→∞
lim an = a ⇐⇒ ∀ε > 0 ∃n0 ∈ N ∀n ∈ N : n ≥ n0 ⇒ |an − a| < ε.
n→∞
Die Kontraposition der in der Definition enthaltenen Implikation ergibt das Kriterium
lim an = a ⇐⇒ Für alle ε > 0 gilt |an − a| ≥ ε höchstens für endlich viele n ∈ N.
n→∞
Wir werden sagen, dass eine Aussage H(n) über natürliche Zahlen fast immer gilt, wenn
H(n) für höchstens endlich viele natürliche Zahlen nicht erfüllt ist. In dieser Formulierung
kann man sagen:
lim an = a ⇐⇒ Für jedes ε > 0 gilt fast immer |an − a| < ε.
n→∞
Definition 4.5 (ε-Umgebungen) Unter der ε-Umgebung einer Zahl a in R bzw. C versteht man die folgenden Mengen:
Im Fall R: Uε (a) = {x ∈ R : |x − a| < ε} = (a − ε, a + ε), Intervall mit Mittelpunkt a.
Im Fall C: Uε (a) = {x ∈ C : |x − a| < ε}, offene Kreisscheibe mit Zentrum a.
Kehren wir nun zu Folgen zurück. Da die Ungleichung |an − a| < ε mit an ∈ Uε (a)
äquivalent ist, können wir feststellen:
lim an = a ⇐⇒ Für jedes ε > 0 gilt fast immer an ∈ Uε (a).
n→∞
Alle der soeben eingeführten Charakterisierungen der Konvergenz werden wir gleichberechtigt benutzen. Schließlich definieren wir noch:
Definition 4.6 Eine Folge (an ) heißt konvergent, wenn sie einen Grenzwert hat.
Abbildung 3: Konvergente Folgen an → a in C und R
4.1 Zahlenfolgen
27
2n2
= 2, denn es ist
n→∞ n2 + 1
Beispiel 4.7 Wir betrachten ein Beispiel: Es gilt lim
2n2
2n2 − 2n2 − 2 2
2
− 2 = ≤ 2 ≤ε
2
= 2
2
n +1
n +1
n +1
n
p
p
für alle n > 2/ε. Also könnte z.B. n0 (ε) = Int( 2/ε) + 1 gewählt werden.
Satz 4.8 Jede Folge hat höchstens einen Grenzwert.
Beweis. Seien a 6= a0 zwei verschiedene Grenzwerte der Folge (an ). Wir wählen ε =
1
|a − a0 | > 0. Dann ist Uε (a0 ) ∩ Uε (a) = ∅. Daher kann im Widerspruch zur Voraussetzung
2
höchstens eine der beiden Mengen fast alle Folgenglieder an enthalten.
Es ist nicht immer leicht zu entscheiden, ob eine Folge konvergiert oder nicht. Wir wollen
daher im Folgenden einige Konvergenzkriterien aufstellen. Als erstes Hilfsmittel dient dazu
der Begriff der Beschränktheit.
Definition 4.9 (Beschränktheit) Eine Zahlenfolge (an ) heißt beschränkt, wenn es eine
Konstante K > 0 mit |an | ≤ K für (fast) alle n ∈ N gibt.
Satz 4.10 (Ein notwendiges Konvergenzkriterium) Jede konvergente Folge ist beschränkt.
Beweis. Es sei (an ) konvergent gegen a. Dann gibt es zu ε = 1 eine Zahl n0 mit |an −a| < 1
für alle n ≥ n0 . Also ist
|an | = |an − a + a| ≤ |an − a| + |a| ≤ 1 + |a| für alle n ≥ n0 .
Setzen wir nun K = max{1 + |a|, |a0 |, . . . , |an0 |}, so gilt |an | ≤ K für alle n ∈ N. Also ist
(an ) beschränkt.
Definition 4.11 Folgen mit Grenzwert 0 heißen Nullfolgen.
Unmittelbar aus der Definition folgt:
Satz 4.12 Es gilt an → a genau dann, wenn (an − a) eine Nullfolge ist.
Beispiel 4.13 Wir betrachten einige Beispiele reeller Nullfolgen:
a) Die Folge (an ) = ( n1 ) ist eine Nullfolge, denn wegen des archimedischen Axioms gilt
für jedes ε > 0 fast immer die Ungleichung 1ε < n und damit n1 < ε. Nach analogem
Argument gilt auch lim n1α = 0 für alle α > 0.
n→∞
b) Die geometrische Folge (an ) = (q n ) ist im Fall 0 < |q| < 1 eine Nullfolge, für |q| > 1
ist die Folge unbeschränkt.
√
√
c) Es gilt lim ( n + 1 − n) = 0, denn es ist
n→∞
√
√ √
√
√
√
( n + 1 − n)( n + 1 + n)
1
1
√
| n + 1 − n| =
≤ √ ≤√ ,
√
2 n
n
n+1+ n
und für gegebenes ε > 0 gilt fast immer
√1
n
< ε, wie in a) gezeigt wurde.
28
4 ZAHLENFOLGEN UND REIHEN
Die in Beispiel 4.13c) verwendete Methode zum Nachweis der Nullfolgeneigenschaft lässt
sich zu folgendem Kriterium verallgemeinern:
Satz 4.14 (Dominanzkriterium) Sind (an ) und (bn ) zwei Zahlenfolgen, ist (bn ) eine
Nullfolge und gibt es eine Konstante K > 0 so, dass |an | ≤ K|bn | für (fast) alle n ∈ N
gilt, so ist auch (an ) eine Nullfolge.
Beweis. Zu gegebenem ε > 0 betrachten wir die Ungleichung |an | ≤ K · |bn | < ε, die wegen
bn → 0 fast immer erfüllt ist. Daher ist auch (an ) eine Nullfolge.
Als einfaches Beispiel betrachten wir die Folge (an ) = n25+2 . Aus der Abschätzung
5
5
1
≤
= bn → 0
≤
5
·
n2 + 2
n2
n
folgt sofort, dass die Folge (an ) eine Nullfolge ist.
0<
Satz 4.15 a) Summe und Differenz von Nullfolgen sind Nullfolgen.
b) Ist (an ) eine Nullfolge und ist (bn ) beschränkt, so ist (an · bn ) eine Nullfolge.
Insbesondere bilden die Mengen aller reellen bzw. komplexen Nullfolgen zwei (unendlich
dimensionale) Vektorräume, die einfach mit c0 bezeichnet werden.
Beweis. Es seien (an ) und (bn ) zwei Nullfolgen. Zu vorgegebenem ε > 0 existiert dann
eine Zahl n1 ∈ N mit |an | < 2ε für alle n ≥ n1 . Entsprechend existiert eine Zahl n2 ∈ N
mit |bn | < 2ε für alle n ≥ n2 . Setzen wir n0 = max{n1 , n2 }, so folgt
ε ε
|an + bn | ≤ |an | + |bn | ≤ + = ε für alle n ≥ n0 .
2 2
Also ist (an + bn ) eine Nullfolge. Die Aussage b) folgt aus 4.14.
Der folgende Satz erleichtert manchmal die Untersuchung komplexer Zahlenfolgen:
Satz 4.16 Für komplexe Zahlenfolgen (zn ) mit zn = an + bn i gilt:
zn → 0 ⇐⇒ an → 0 und bn → 0.
Beweis. (⇒): Die Behauptung folgt wegen |an |, |bn | ≤ |zn | aus Satz 4.14.
(⇐) : Die Behauptung folgt wegen |zn | ≤ |an | + |bn | aus Satz 4.14 und Satz 4.15a).
Mit Satz 4.12 lassen sich die für Nullfolgen gefundenen Aussagen auf konvergente Folgen
übertragen:
Satz 4.17 (Grenzwertsätze) Es seien (an ) und (bn ) konvergente Zahlenfolgen. Dann
konvergieren auch die Summen- und Produktfolgen, und es gelten
lim an ± bn = lim an ± lim bn und lim an · bn = lim an · lim bn .
n→∞
n→∞
n→∞
n→∞
n→∞
n→∞
Ferner ist lim |an | = | lim an |. Gelten überdies an 6= 0 für alle n ∈ N und lim an 6= 0,
n→∞
n→∞
n→∞
so gilt auch
1
1
lim
=
.
n→∞ an
lim an
n→∞
4.1 Zahlenfolgen
29
Beweis. Es seien an → a und bn → b. Dann folgt
|(an + bn ) − (a + b)| = |(an − a) − (bn − b)| ≤ |an − a| + |bn − b| → 0.
Das Dominanzkriterium zusammen mit Satz 4.15 zeigt dann an + bn → a + b. Wir betrachten nun Produkte. Da (an ) als konvergente Folge auch beschränkt ist, gibt es eine
Konstante K > 0 mit |an | ≤ K für alle n ∈ N. Nun ist
|an bn − ab| = |an bn − an b + an b − ab| ≤ |an bn − an b| + |an b − ab|
≤ |an ||bn − b| + |an − a||b| ≤ K|bn − b| + |an − a||b| → 0.
Die mögliche Vertauschung von lim mit dem Betrag ergibt sich aus der Abschätzung
n→∞
||an | − |a| ≤ |an − a| → 0.
Zum Beweis der Divisionsformel beachten wir zunächst, dass wegen a 6= 0 eine Zahl n0 ∈ N
so gefunden werden kann, dass |a − an | ≤ |a|
für alle n ≥ n0 gilt. Hieraus folgt
2
|an | = |a − (a − an )| ≥ |a| − |a − an | ≥ |a| −
|a|
1
2
|a|
=
, also
≤
2
2
|an |
|a|
für alle n ≥ n0 . Dies zeigt nun
1
1 a − an 1
2
= |a − an |
≤ |a − an | · 2 → 0.
− =
an a
an a
|an ||a|
|a|
Damit ist der Satz vollständig bewiesen.
Beispiel 4.18 Als Anwendung der Grenzwertsätze betrachten wir das folgende Beispiel:
n2 (2 + n1 − n12 )
2 + n1 −
2n2 + n − 1
lim
=
lim
=
lim
n→∞
n→∞
n→∞
5n2 − n
n2 (5 − n1 )
5 − n1
1
n2
lim (2 +
=
n→∞
1
n
−
lim (5 −
n→∞
1
)
n2
1
)
n
2
= .
5
Man sieht leicht, dass nach diesem Verfahren alle Probleme der Form
P (n)
mit beliebigen Polynomen P (n) und Q(n)
n→∞ Q(n)
lim
bearbeitet werden können.Wir überlassen dem Leser die Formulierung eines entsprechenden Satzes.
Aufgaben zu Abschnitt 4.1
1. Man zeige: Aus an → a und bn → a folgt an − bn → 0.
2. Für jede Folge an → 0 existiert max{|an | : n ∈ N}.
3. Berechnen Sie
2n+n2
2,
n→∞ 1−3n
a) lim
2k+k2
4
k→∞ 1−3k
b) lim
j2
.
j→∞ j!
und c) lim
30
4 ZAHLENFOLGEN UND REIHEN
4. Zeigen Sie lim
√
n
n→∞
a = 1 für alle a > 0.
1
2
n→∞ 1−3n
5. Berechnen Sie lim
+
n
2n+1
i.
a1 + . . . + an
. Die Folge (cn ) heißt
n
auch Folge der Cesaro-Mittel von (an ). Zeigen Sie:
6. Es sei (an ) eine beliebige Folge und es sei cn =
an → a =⇒ cn → a.
Diskutieren Sie am Beispiel an = (−1)n die Frage, ob auch die Umkehrung der
Implikation gilt.
4.2
Reelle Zahlenfolgen
Das in Satz 4.14 formulierte Dominanzkriterium für Nullfolgen kann zu folgendem Vergleichskriterium für beliebige reelle Zahlenfolgen verallgemeinert werden. Wir werden dieses Kriterium im weiteren oft anwenden. Manchmal wird es in der Literatur aus offensichtlichen Gründen auch Sandwich-Kriterium genannt.
Satz 4.19 (Vergleichskriterium) Sind (an ), (bn ) und (cn ) drei reelle Zahlenfolgen mit
an ≤ cn ≤ bn für fast alle n ∈ N und ist lim an = lim bn = a, so konvergiert auch die
n→∞
n→∞
Folge (cn ) gegen a.
Beweis. Es sei a = lim an . Dann ist
n→∞
|cn − a| = |cn − an + an − a| ≤ |cn − an | + |an − a|
≤ |bn − an | + |an − a| ≤ |bn − a| + |an − a| + |an − a| → 0.
Damit ist alles bewiesen.
Wir dehnen nun die Grenzwertsätze aus Satz 4.17 auf ”höhere” Rechenoperationen aus.
Durch mehrfache Anwendung der Grenzwertsätze folgt aus an → a, dass auch akn → ak für
alle k ∈ N konvergiert. Die Ausdehnung dieser Aussage auf beliebige reelle Exponenten
ist ein Spezialfall des folgenden viel allgemeineren Satzes:
Satz 4.20 Es sei f eine monoton wachsende Funktion von [a, b] auf das Intervall
[f (a), f (b)]. Dann gilt:
lim f (xn ) = f lim xn für alle konvergenten Folgen (xn ) ⊆ [a, b].
n→∞
n→∞
Für monoton fallende Funktionen gilt eine entsprechende Aussage.
4.2 Reelle Zahlenfolgen
31
Beweis. Wir betrachten zunächst den Fall, dass f auf [a, b] streng monoton wächst. Es sei
(xn ) eine Folge in [a, b] mit xn → x und es sei a < x < b. Wir fixieren ein ε > 0. Durch
eventuelle Verkleinerung von ε können wir dabei
f (a) < f (x) − ε < f (x) < f (x) + ε < f (b)
annehmen. Wir setzen nun c1 = f (x) − ε, c2 = f (x) + ε und u1 = f −1 (c1 ), u2 = f −1 (c2 ).
Dann gilt u1 < x < u2 , und wegen xn → x existiert eine Zahl n0 ∈ N mit xn ∈ (u1 , u2 ) für
alle n ≥ n0 . Hieraus folgt f (xn ) ∈ (f (u1 ), f (u2 )) = (c1 , c2 ) = Uε (f (x)). Also gilt f (xn ) →
f (x). Im Fall x = a oder x = b setzen wir die Funktion f linear und streng monoton
auf das Intervall [a − 1, b + 1] fort, damit ist dieser Fall auf den ersten zurückgeführt. Im
Fall, dass f nur monoton wachsend ist, ”stören” wir die Funktion f durch Addition der
linearen Funktion h(t) = t − a, wir setzen also
g(t) = f (t) + h(t) für t ∈ [a, b].
Dann ist g eine streng monoton wachsende Funktion von [a, b] auf [f (a), f (b) + (b − a)].
Aus xn → x folgt also nach dem bereits Bewiesenen
f (xn ) = g(xn ) − h(xn ) → g(x) − h(x) = f (x).
Damit ist alles bewiesen.
Folgerung 4.21 Aus xn → x folgen xαn → xα für alle α ∈ R, axn → ax für alle a > 0 und
ln xn → ln x, sofern die Elemente xn und x im Definitionsbereich der jeweiligen Funktion
liegen.
Satz 4.22 Es gelten
√
n
a → 1 für alle a > 0 und
√
n
n → 1.
Beweis. Die erste Formel ist wegen a1/n → a0 = 1 ein Spezialfall von Folgerung 4.21, sie
trat außerdem in anderer Formulierung bereits in Aufgabe 5 aus Abschnitt 1.6 auf. Für
den Beweis der zweiten Formel erhalten wir aus der Bernoullischen Ungleichung zunächst
√
q
q
q
√
√
n
1
n √
n
n
n=
n≤ 1+ n≤1+
1≤
=1+ √ →1 .
n
n
Also gilt
p√
n
n → 1 und daher
√
n
n → 1.
Aufgaben
1. Man zeige
√
n
2n → 1.
√
n
n2 + 2n − 5 → 1.
p
1
1
3. Man berechne lim 102+ n und lim e− n2 .
2. Man zeige
n→∞
n→∞
32
4.3
4 ZAHLENFOLGEN UND REIHEN
Monotone Zahlenfolgen und Intervallschachtelungen
Die Grenzwertsätze waren ein nützliches Instrument, um in günstig gelagerten Fällen die
Existenz und die Berechnung von Grenzwerten auf bekannte Grenzwerte zurückzuführen.
In zahlreichen anderen Situationen wird diese Methode jedoch nicht greifen. So ist z.B.
die später zu beweisende und bereits G.W. Leibniz (1646-1716) bekannte Formel
(−1)n
π
1 1 1
=
lim 1 − + − + − . . . +
n→∞
3 5 7
2n + 1
4
mit den bisherigen Methoden nicht zu verifizieren. Das betrifft sowohl die Existenz des
Grenzwertes als auch die noch schwierigere Frage der Ermittlung seines Wertes. Wir werden diese beide Fragen gesondert behandeln. Für das Existenzproblem werden in diesem
Abschnitt erste grundsätzliche und leistungsfähige Konvergenzkriterien entwickelt, die
letztendlich auf dem Vollständigkeitsaxiom (Ax 11) beruhen.
Definition 4.23 Eine reelle Zahlenfolge (an ) heißt monoton wachsend, wenn an ≤ an+1
für alle n ∈ N gilt. Wir bezeichnen diesen Sachverhalt häufig durch an %. Gilt an ≥ an+1
für alle n ∈ N, so heißt die Folge (an ) monoton fallend, und wir schreiben an &.
Es ist sofort zu sehen, dass eine Zahlenfolge (an ) monoton ist, wenn sie im Sinn der
Definition 2.6 eine monotone Funktion als Abbildung von N nach R ist.
Satz 4.24 (Bolzano-Kriterium für monotone Folgen) Eine monotone Zahlenfolge
ist genau dann konvergent, wenn sie beschränkt ist. Dabei gilt
sup{an : n ∈ N}, falls (an ) monoton wächst.
lim an =
inf {an : n ∈ N}, falls (an ) monoton fällt.
n→∞
Für monotone Folgen schreiben wir statt an → a auch an % a bzw. an & a.
Beweis. Es genügt zu zeigen, dass beschränkte, monoton wachsende Folgen (an ) auch
konvergent sind. Wegen des Vollständigkeitsaxioms existiert a = sup{an : n ∈ N}. Sei
nun ε > 0 gegeben. Da a − ε keine obere Schranke für {an : n ∈ N} sein kann, existiert
ein n0 ∈ N mit a − ε < an0 ≤ a. Für alle n ∈ N mit n ≥ n0 folgt wegen an % dann
a − ε ≤ an0 ≤ an ≤ a, also gilt |an − a| < ε für alle n ≥ n0 . Das zeigt a = lim an .
Wir verwenden dieses Kriterium nun zur weiteren Untersuchung von Exponentialfunktionen und konstruieren zunächst die Zahl Eulersche Zahl e.
Satz 4.25 Die Folge (1 + n1 )n
n≥1
ist monoton wachsend und konvergent, ihr Grenzwert
e = lim
n→∞
heißt Eulersche Zahl, und es gilt 2 < e < 3.
1
1+
n
n
4.3 Monotone Zahlenfolgen und Intervallschachtelungen
Beweis. Wir setzen an = (1 + n1 )n =
an
=
an−1
n+1
n
n+1 n
.
n
33
Dann ist
n n−1 2
n
n
n−1
n −1
n
1
n
·
=
·
=
1
−
·
,
n
n2
n−1
n2
n−1
und die Bernoullische Ungleichung mit h = −1/n2 ergibt
an
1
n
1
n
≥ 1−n· 2 ·
= 1−
=1.
an−1
n
n−1
n n−1
Also ist (an ) monoton wachsend.
Wir zeigen nun die Beschränktheit der Folge. Wegen der binomischen Formel und der
leicht einzusehenden Ungleichung
n
1
1
1
· k ≤
≤ k−1
k
n
k!
2
gilt
n
n
n
n X
X
X
1
1
1 n X n 1
2−k < 1 + 2 = 3.
≤
≤
1
+
≤
1
+
2
1+
=
k
n
k
n
k!
k!
k=0
k=1
k=1
k=0
Dabei haben wir noch von der geometrischen Summenformel (Satz 1.6(3)) Gebrauch gemacht. Aus Satz 4.24 ergibt sich somit die Konvergenz der Folge, und es ist 2 = a1 <
lim an < 3.
Bemerkung 4.26 Obige Grenzwertdarstellung lässt die folgende Interpretation zu. Eine
Größe y = y(t) unterliege auf dem Zeitintervall [0, 1] einem Wachstum mit Wachstumsgeschwindigkeit 1. Wir wollen y(1) = e · y(0) zeigen. Dazu zerlegen wir das Zeitintervall in
die Abschnitte 0 < n1 < n2 < . . . < nn und setzen yk = y( nk ). Rechnen wir innerhalb eines
Zeitintervalls mit einem anteiligen Wachstumsfaktor von 1 + n1 , so ergibt sich
1
yk = yk−1 · 1 +
n
1
= y(0) · 1 +
n
k
.
Also ist yn = y0 (1 + n1 )n eine Näherung für y(1). Der Grenzübergang n → ∞ ergibt dann
y(1) = e · y(0). Eleganter und präziser kann dieser Prozess mit Hilfe der Differentialrechnung beschrieben werden.
Satz 4.27 (Approximation von ex durch Polynome) Für jedes x ∈ R konvergiert
die Folge der Zahlen (1 + nx )n , n > −x, monoton gegen ex . Es gilt also
x n
lim 1 +
= ex .
n→∞
n
Beweis. Es sei x ∈ R fixiert. Wir zeigen zuerst, dass
n+1
x n
x
1+
≤ 1+
für alle n > −x
n
n+1
34
4 ZAHLENFOLGEN UND REIHEN
gilt. Wegen n > −x ist 1 + nx > 0. Wir wählen eine Zahl h > −1 als Lösung der Gleichung
(1 + h)n+1 =
n
1
=
n+x
1+
x
n
.
Die Bernoullische Ungleichung ergibt
n
= (1 + h)n+1 ≥ 1 + (n + 1)h .
n+x
Addition von n und Multiplikation mit
n+x
n(n+1)
ergibt der Reihe nach
n
≥ (n + 1)(1 + h) ,
n+x
n+x
x
x
≥
(1 + h) = 1 +
(1 + h).
1+
n+1
n
n
n+
Potenzbildung mit n + 1 liefert schließlich die Behauptung.
Zum Nachweis der Beschränktheit der Folge wählen wir eine Zahl 0 6= k ∈ N mit | xk | ≤ 1.
Dann folgt aus der bereits bewiesenen Monotonie und aus Satz 4.25 die Ungleichung
n k
x n x nk
1
1+
≤ 3k .
≤ 1+
≤
1+
n
kn
n
Wegen Satz 4.24 konvergiert daher die in Rede stehende Folge, und wir können durch
x n
f (x) = lim 1 +
,
x∈R,
n→∞
n
eine Funktion f auf R definieren. Für x = −1 gilt
n+1
n
1
n
n
1
1
n · 1 = .
=
= lim
· lim
f (−1) = lim 1 −
n+1
n→∞
n→∞ n + 1
n→∞
n+1
n+1
e
lim n
n→∞
Nun sei x eine positive rationale Zahl der Form x =
n = kp gilt nx = m1 und n = mp
. Daraus folgt
q
f (±x) = lim
n→∞
p
q
mit p, q > 0. Mit m = kq und
mp/q
1
x n
1±
= lim 1 ±
= e±p/q = e±x ,
m→∞
n
m
womit f (x) = ex für alle x ∈ Q bewiesen ist. Wir zeigen als nächstes, dass die Funktion f
monoton wachsend ist. Es seien x, y ∈ R mit x < y gegeben. Wir wählen n ∈ N so groß,
dass 1 + nx , 1 + ny > 0 sind. Aus
x
y
x n y n
1 + < 1 + folgt nun 1 +
< 1+
.
n
n
n
n
Mithin gilt f (x) ≤ f (y), da Limites als Suprema gebildet werden können. Es sei schließlich
x eine beliebige reelle Zahl. Wir wählen eine Folge rationaler Zahlen rn mit rn % x. Dann
gilt
ex = sup{ern : n ∈ N} = sup{f (rn ) : n ∈ N} ≤ f (x).
Also ist ex ≤ f (x). Wäre aber ex < f (x), so wäre x < ln f (x). Wählt man eine rationale
Zahl r mit x < r < ln f (x), so folgte f (r) = er < f (x). Das steht im Widerspruch zur
Monotonie von f .
4.3 Monotone Zahlenfolgen und Intervallschachtelungen
35
Folgerung 4.28 Für alle n ∈ N und alle x ∈ (−n, ∞) gilt (1 + nx )n ≤ ex . Insbesondere
ist 1 + x ≤ ex für alle x ∈ R.
Der in der Folgerung beschriebene Sachverhalt ist in Abbildung 4 dargestellt.
Abbildung 4: Approximation der e-Funktion durch Polynome
Folgerung 4.29 Für alle k ∈ N gilt lim nk e−n = 0. Die Exponentialfunktion wächst also
n→∞
schneller als alle Potenzfunktionen.
Beweis. Wegen Folgerung 4.28 ist
k+1
1
x
≤ ex und folglich xk e−x ≤ (k + 1)k+1 ·
k+1
x
für alle x > 0. Mit x = n folgt hieraus die Behauptung.
Durch Übergang zu den Umkehrfunktionen können wir nun auch die entsprechende Darstellung für die Logarithmusfunktion ln x gewinnen. Setzen wir
x n
y = fn (x) = 1 +
,
x > −n ,
n
so ergibt die Auflösung nach x die Funktionenschar
√
x = gn (y) = n( n y − 1) ,
y≥0.
Für alle n ∈ N gilt nun gn (y) ≥ gn+1 (y) = v, denn die entgegengesetzte Annahme
u = gn (y) < gn+1 (y) führt wegen
y = fn (u) ≤ fn+1 (u) < fn+1 (v) = y
zum Widerspruch. Also ist die Folge (gn (y))n∈N monoton fallend. Dies ist die Grundlage
für den folgenden Satz:
Satz 4.30 (Approximation der Logarithmusfunktion) Für alle y > 0 konvergiert
√
die monoton fallende Folge der Zahlen n( n y − 1) und es gilt
√
ln y = loge y = lim n( n y − 1) .
n→∞
36
4 ZAHLENFOLGEN UND REIHEN
Beweis. Wir zeigen die Existenz des Grenzwertes
√
L(y) = lim n( n y − 1) für alle y > 0.
n→∞
Für y ≥ 1 ist die fragliche Folge nach unten durch 0 beschränkt. Zusammen mit der
bereits gezeigten Monotonie zeigt das die Existenz des Grenzwertes wegen des BolzanoKriteriums für monotone Folgen. Nun sei 0 < y < 1. Dann ist
p
p
√
√
√
n( n y − 1) = n(1 − n y −1 ) · n y = −n( n y −1 − 1) · n y.
Die rechte Seite der Gleichung konvergiert wegen y −1 ≥ 1 nach dem bereits gezeigten
gegen −L(y −1 ). Also konvergiert auch die linke Seite, und es gilt L(y) = −L(y −1 ).
Wir zeigen nun x = L(ex ) für alle x. Aus (1 + nx )n ≤ ex folgt durch Umstellen x ≤
√
n( n ex − 1), und der Übergang zum Limes ergibt x ≤ L(ex ) für alle x ∈ R. Insbesondere
ist auch −x ≤ L(e−x ) = −L(ex ), woraus x ≥ L(ex ) und damit die Gleichheit x = L(ex )
folgen. Also ist L die Umkehrfunktion von f (x) = ex , und daher gilt L(y) = ln y für alle
y ∈ R.
Wir wenden uns wieder der allgemeinen Theorie zu und leiten das folgende wichtige
Konvergenzprinzip her.
Definition 4.31 (Intervallschachtelung) Eine Intervallschachtelung (an |bn ) ist ein
Paar reeller Folgen (an ), (bn ) mit folgenden Eigenschaften:
a) an %,
b) bn &,
c) an ≤ bn für alle n ∈ N,
d) bn − an → 0 für n → ∞.
Satz 4.32 Ist (an |bn ) eine Intervallschachtelung, so existiert genau eine Zahl a ∈ R mit
an ≤ a ≤ bn für alle n ∈ N. Insbesondere gilt
\
[an , bn ] = {a} .
n∈N
Die Folgen (an ) und (bn ) konvergieren gegen a und man hat die ,,a priori Fehlerabschätzung”
|a − an | ≤ |bn − an | .
Beweis. Wegen am ≤ am+n ≤ bm+n ≤ bn gilt am ≤ bn für alle m, n ∈ N. Insbesondere ist
an ≤ a := sup{am : m ∈ N} ≤ bn
für alle n ∈ N .
Ist a0 eine weitere Zahl mit an ≤ a0 ≤ bn für alle n ∈ N, so folgt
0 ≤ |a − a0 | ≤ |bn − an | → 0 ,
also ist a = a0 . Speziell ist
lim bn = inf{bn : n ∈ N} = a .
n→∞
Die Fehlerabschätzung folgt aus bn ≥ a.
4.3 Monotone Zahlenfolgen und Intervallschachtelungen
37
Satz 4.33 (Intervallschachtelung für e) Durch (1 + n1 )n (1 + n1 )n+1 ist eine Intervallschachtelung in R gegeben, die sich auf die Zahl e zusammenzieht. Insbesondere gilt
|e − (1 + n1 )n | ≤ n3 .
Beweis. Es seien an = 1 +
b−1
n
=
n
n+1
1 n
n
und bn = 1 +
n+1
=
n+1−1
n+1
1 n+1
.
n
n+1
Dann ist an % bereits bekannt. Aus
=
1
1−
n+1
n+1
= cn+1
und cn+1 % e−1 nach (5) folgt bn & e . Also ist an < e < bn und
lim(bn −an ) = lim n1 ·an = 0. Hieraus folgt wegen an ≤ e ≤ 3 auch die Fehlerabschätzung.
Beispiel 4.34 (Leibnizreihe) Abschließend betrachten wir die zu Beginn des Paragraphen gestellte Frage nach der Konvergenz der Folge (sn ) mit
sn = 1 −
1 1
1
+ − . . . + (−1)n
.
3 5
2n + 1
Wir setzen
1
1 1
+ − +... −
und
3 5
4n − 1
1 1
1
1
= 1 − + − +... −
+
3 5
4n − 1 4n + 1
an = 1 −
bn
für n ≥ 1. Dann ist (an |bn ) offenbar eine Intervallschachtelung. Also konvergieren (an )
und (bn ) gegen den gleichen Wert. Dann konvergiert aber auch die gemischte Folge (sn ) =
(a1 , b1 , a2 , b2 , . . .). Der Nachweis, daß dieser Grenzwert gerade π/4 ist, kann aber noch
nicht erbracht werden.
Das Prinzip der Intervallschachtelung lässt auf C verallgemeinern:
Satz 4.35 (Kreisscheibensatz) Ist K1 ⊇ K2 ⊇ . . . eine Folge von abgeschlossenen
Kreisscheiben in C mit
T gegen Null strebenden Durchmessern. Dann gibt es genau eine
Zahl z ∈ C mit z ∈
Kn .
n∈N
Beweis. Wir betrachten das Problem in der Gaußschen Zahleneben. Die Projektionen der
Kreisscheiben auf die reelle bzw. imaginäre Achse erzeugen dort Intervallschachtelungen.
Bezeichnen α bzw. β die dadurch eingefangenen Zahlen, so ist z = α + β · i die einzige, in
allen Kreisscheiben Kn enthaltene Zahl.
Aufgaben
1. Zeigen Sie, dass die rekursiv definierte Folge
√
p
a0 = 2 , an = 2 + an−1
monoton wächst und beschränkt ist. Berechnen Sie den Grenzwert.
38
4 ZAHLENFOLGEN UND REIHEN
ln n
& 0.
n
n − 7 n + 3
3. Zeigen Sie, dass
eine Intervallschachtelung ist. Bestimmen Sie
n + 2 n + 2 n∈N
den eingefangenen Punkt.
2. Zeigen Sie
4. Es sei c > 1 und die Folgen (an ) und (bn ) seien rekursiv wie folgt definiert:
a0 = 1, b0 = c, an+1 =
c
bn+1
, an =
an + b n
.
2
Zeigen Sie, dass (an |bn√
) eine Intervallschachtelung ist
√ und zeigen Sie, dass der eingefangene Punkt gerade c ist. Berechnen Sie damit 2 auf vier Dezimalen (Benutzen
Sie die a priori Fehlerabschätzung.)
Hinweis: Zeigen Sie zuerst durch vollständige Induktion die Ungleichung b2n ≥ c.
√ √
√
5. Zeigen Sie, dass die Folge (an ) mit an = n( n + 1 − n) monoton wachsend und
beschränkt ist. Bestimmen Sie den Grenzwert.
Hinweis: Zeigen Sie an+1 /an ≥ 1.
6. Zeigen Sie
lim
n→∞
1
1+ α
n
n

 1
e
=

∞
für
für
für
α > 1,
α=1
0 < α < 1.
Hinweis: Benutzen Sie die Bernoullische Ungleichung und die aus Folgerung 4.28
bekannte Ungleichung (1 + nx )n ≤ ex für x ≥ 0.
4.4
Häufungspunkte
Bevor wir weiteren Konvergenzkriterien nachgehen, schwächen wir den Begriff des Grenzwertes etwas ab:
Definition 4.36 Es sei (an ) eine Zahlenfolge. Eine Zahl a heißt ein Häufungspunkt von
(an ), wenn für jedes ε > 0 unendlich viele Folgenglieder an in Uε (a) = {x : |x − a| < ε}
liegen, wenn also zu jedem n ∈ N ein Index k ≥ n so existiert, dass |a − ak | ≤ ε ist.
n−1
die beiden Zahlen
So hat beispielsweise die Zahlenfolge mit den Gliedern an = (−1)n
n
a = ±1 als Häufungspunkte. Die Beziehung zum Grenzwertbegriff ist durch die folgenden
beiden Sätze gegeben:
Satz 4.37 Konvergiert die Folge (an ) gegen a, so ist a der einzige Häufungswert von (an ).
Beweis. Offenbar ist a als Grenzwert auch ein Häufungspunkt. Ist aber b 6= a ein weiterer
Punkt, so gilt Uε (a) ∩ Uε (b) = ∅ für ε = |a − b|/2. Daher kann Uε (b) höchstens endlich
viele Folgenglieder an enthalten.
4.4 Häufungspunkte
39
Satz 4.38 Eine Zahl a ist genau dann ein Häufungspunkt der Folge (an ), wenn (an ) eine
gegen a konvergente Teilfolge (ank ) besitzt.
Beweis. Offensichtlich ist jeder Grenzwert einer Teilfolge von (an ) auch ein Häufungspunkt
von (an ). Sei umgekehrt a ein Häufungspunkt von (an ). Wir konstruieren eine gewünschte
Teilfolge dann so: Zu ε = 1 existiert mindestens ein Index n1 mit an1 ∈ U1 (a). Seien nun
bereits k Indizes n1 < n2 < . . . < nk mit ank ∈ U 1 (a) konstruiert. Dann gibt es aber auch
k
1
mindestens einen Index nk+1 > nk mit ank+1 ∈ U 1 (a). Die auf diese Weise
zu ε = k+1
k+1
konstruierte Folge (ank ) konvergiert nun gegen a, denn es gilt |ank − a| < k1 → 0.
Dem folgenden Satz kommt in der Analysis eine zentrale Bedeutung zu:
Satz 4.39 (Satz von Bolzano-Weierstraß) Jede beschränkte Zahlenfolge besitzt einen
Häufungspunkt.
Beweis. Wir betrachten zuerst den Fall reeller Zahlenfolgen und bedienen uns des sogenannten Halbierungsverfahrens:
Zu der beschränkten Folge (an ) wählen wir Zahlen A0 und B0 mit A0 ≤ an ≤ B0 für alle
0
. Falls das linke Teilintervall [A0 , C0 ] unendlich
n ∈ N. Wir setzen n0 = 0 und C0 = A0 +B
2
viele Folgenglieder an enthält, so wählen wir ein n1 > n0 mit an1 ∈ [A0 , C0 ] und setzen
A1 = A0 und B1 = C0 . In anderen Fall enthält aber [C0 , B0 ] unendlich viele Folgenglieder,
und wir wählen ein n1 > n0 mit an1 ∈ [C0 , B0 ] und setzen A1 = C0 und B1 = B0 .
In jedem Fall enthält [A1 , B1 ] dann unendlich viele Folgenglieder, und das Verfahren kann
wiederholt werden. Auf diese Weise entsteht eine Intervallschachtelung
B0 − A0
und Ak ≤ ank ≤ Bk für alle k ∈ N.
(Ak |Bk ) mit |Bk − Ak | =
2k
Nach Satz 4.32 existiert daher ein Grenzwert a der Folgen (Ak ) und (Bk ), der wegen
Satz 4.19 auch ein Grenzwert von (ank ) und damit ein Häufungspunkt von (an ) ist. Nach
Konstruktion ist dies sogar der kleinste Häufungspunkt von (an ).
Ist (zn ) nun eine komplexe, beschränkte Zahlenfolge, so setzen wir an = Re(zn ) und
bn = Im(zn ). Nach Obigem hat (an ) eine konvergente Teilfolge (ank ). Die Folge (bnk ) hat
wiederum eine konvergente Teilfolge (bnkj ). Somit ist (znkj ) konvergent.
Wir bemerken, dass das obige Verfahren im eigentlichen Sinn nicht konstruktiv, genauer
nicht algorithmisierbar ist, da die Entscheidung, ob ein Intervall unendlich viele Folgenglieder enthält, nicht algorithmisch entscheidbar ist. Trotz dieses grundsätzlichen Makels
ist das obige Kriterium jedoch von herausragender Bedeutung, da es keinen besseren Satz
gibt.
Eine genauere Analyse des Halbierungsverfahrens führt zu folgender Verschärfung des
Satzes von Bolzano-Weierstraß, die wir im Beweis zu diesem Satz bereits erwähnt hatten:
Satz 4.40 Jede beschränkte reelle Zahlenfolge (an ) besitzt einen größten und einen kleinsten Häufungswert. Diese heißen der Limes inferior bzw. der Limes superior von (an )
und sie werden durch
lim inf an bzw. durch lim sup an
n→∞
bezeichnet.
n→∞
40
4 ZAHLENFOLGEN UND REIHEN
Folgerung 4.41 Eine reelle Zahlenfolge ist genau dann konvergent, wenn sie beschränkt
ist und höchstens einen Häufungspunkt hat.
Beweis. Konvergente Folgen haben die genannten Eigenschaften. Sei umgekehrt (an ) beschränkt mit höchstens einem Häufungspunkt und sei a = lim inf an . Wäre a kein Grenzwert, so gäbe es ein ε > 0 derart, daß die Menge {n : |an − a| > ε} unendlich ist. Die
Teilfolge dieser an hat aber nach Bolzano-Weierstraß wiederum ein Häufungspunkt, der
natürlich von a verschieden ist. Dieser Widerspruch beweist den Satz.
Definition 4.42 Es sei E die Menge R oder C, es sei M eine Teilmenge von E. Eine
Zahl a heißt ein Häufungspunkt von M in E, wenn jede punktierte ε-Umgebung
Uε0 (a) = {x ∈ E : |x − a| < ε, x 6= a}
von a mindestens einen Punkt von M enthält.
Die Beziehung zwischen Häufungspunkten von Mengen und konvergenten Folgen ist durch
folgenden Satz gegeben:
Satz 4.43 Wie oben seien E = R, C und M ⊆ E. Ein Punkt a ∈ E ist genau dann ein
Häufungspunkt von M in E, wenn eine Folge von Elementen xn ∈ M mit xn 6= a und
xn → a existiert.
Beweis. Ist a ein Häufungspunkt, so können wir zu jedem ε = n1 ein Element xn ∈
0
(a) wählen. Wegen |xn − a| < n1 gilt xn → a. Ist umgekehrt eine Folge (xn ) mit
M ∩ U1/n
den im Satz genannten Eigenschaften gegeben, so gilt ist offenbar Uε (a)0 ∩ M 6= 0 für alle
ε > 0.
Satz 4.44 (Satz von Bolzano-Weierstraß für Mengen) Jede beschränkte unendliche Menge M in R oder C hat einen Häufungspunkt.
Beweis. Da M als unendlich vorausgesetzt wurde, kann eine Folge paarweise verschiedener
Punkte xn in M ausgewählt werden. Der Häufungspunkt dieser Folge ist nach aber ein
Häufungspunkt von M .
Für unbeschränkte reelle Zahlenfolgen führen wir schließlich die Werte +∞ und −∞ als
uneigentliche Grenzwerte bzw. Häufungspunkte ein:
Definition 4.45 Eine reelle Zahlenfolge (an ) heißt uneigentlich konvergent oder bestimmt
divergent gegen +∞, wenn zu jeder (großen) Zahl K > 0 ein Index N ∈ N so existiert,
dass |an | > K für alle n ≥ N gilt. In diesem Fall schreiben wir auch
an → +∞ oder lim an = +∞.
n→∞
Der Wert +∞ heißt ein Häufungspunkt von (an ), wenn eine Teilfolge (ank ) existiert, die
uneigentlich konvergent gegen ∞ ist.
Analog sind die Definitionen mit −∞ zu bilden.
4.5 Das Cauchysche Konvergenzkriterium
41
Aufgaben zu Abschnitt 4.4
1. Führen Sie den Beweis des Satzes von Bolzano-Weierstraß (4.39) für komplexe Zahlenfolgen aus.
2. Bestimmen Sie die Häufungspunkte der Folge ((−1)n e1/n ).
3. Man zeige, dass die nach folgender Vorschrift konstruierte Folge jede positive reelle Zahl als Häufungspunkt hat: Man trage die Brüche m/n in einer unendlichen
zweidimensionalen Tabelle ein und bilde hieraus wie in Figur 8 eine Folge.
4. Man zeige: Für jede beschränkte Zahlenfolge (an ) gelten
lim inf an =
n→∞
lim sup an =
n→∞
lim (inf ak )
n→∞ k≥n
und
lim (sup ak ) .
n→∞ k≥n
5. Man zeige, dass jeder Punkt des Intervalls [−1, 1] ein Häufungspunkt der Folge
an = sin(n) ist.
4.5
Das Cauchysche Konvergenzkriterium
Kern dieses Abschnitts ist die Bereitstellung des fundamentalen Cauchyschen Konvergenzkriteriums. Der hierfür entscheidende Begriff wurde 1832 von A. Cauchy gefunden:
Definition 4.46 Eine Zahlenfolge (an ) heißt eine Cauchy- oder Fundamentalfolge, wenn
es zu jedem ε > 0 eine natürliche Zahl n0 = n0 (ε) derart gibt, dass für alle m, n ≥ n0 die
Ungleichung |an − am | < ε besteht.
Satz 4.47 Jede Cauchy-Folge ist beschränkt.
Beweis. Zu ε = 1 sei n0 so gewählt, dass |an − am | ≤ 1 für alle m, n ≥ n0 gilt. Dann gilt
für alle n ≥ n0 die Abschätzung
|an | ≤ |an − an0 + an0 | ≤ |an − an0 | + |an0 | ≤ 1 + |an0 |.
Setzt man
K = max{|a1 |, . . . , |an0 |, 1 + |an0 |},
so folgt |an | ≤ K für alle n ∈ N.
Satz 4.48 Jede konvergente Zahlenfolge ist eine Cauchy-Folge.
Beweis. Es sei (an ) konvergent gegen a. Zu gegebenem ε > 0 existiert dann eine Zahl n0
so, dass |an − a| < ε/2 für alle n ≥ n0 gilt. Für beliebiges n, m ≥ n0 folgt dann
|an − am | ≤ |an − a| + |a − am | <
ε ε
+ =ε.
2 2
42
4 ZAHLENFOLGEN UND REIHEN
Satz 4.49 (Cauchysches Konvergenzkriterium) Eine Zahlenfolge ist genau dann
konvergent, wenn sie eine Cauchy-Folge ist.
Beweis. Es bleibt zu zeigen, dass jede Cauchy-Folge konvergent ist. Es sei (xn ) eine
Cauchy-Folge. Da Cauchy-Folgen beschränkt sind, hat (xn ) wegen des Satzes von BolzanoWeierstraß einen Häufungspunkt x∗ . Wir zeigen, dass x∗ sogar der Grenzwert von (xn ) ist.
Dazu sei ε > 0 beliebig gegeben. Wir wählen ein n0 = n0 (ε) derart, dass |xn − xm | ≤ ε/2
für alle n, m ≥ n0 gilt. Da x∗ ein Häufungspunkt von (xn ) ist, existiert ein Folgenglied
xn1 mit n1 ≥ n0 und |x∗ − xn1 | < ε/2. Hieraus folgt
|xn − x∗ | ≤ |xn − xn1 | + |xn1 − x∗ | <
ε ε
+ =ε
2 2
für alle n ≥ n0 (ε).
Wir demonstrieren die Leistungsfähigkeit des Kriteriums an folgender Aussage.
Satz 4.50 Es sei (ak ) eine beschränkte Zahlenfolge und es sei 0 < x < 1. Dann konvergiert die Folge (sn ) mit den Gliedern
sn =
n
X
ak x k .
k=0
Beweis. Es sei K eine Schranke für (ak ) und es seien m > n ≥ 0 beliebig gegeben. Dann
ist
|sm − sn | ≤
m
X
k
|ak | |x| ≤ K ·
k=n+1
m
X
k
n+1
|x| = K · |x|
m−n−1
X
k=n+1
|x|k ≤ K · |x|n+1 ·
k=0
1
→0
1 − |x|
für n → ∞. Also ist (sn ) eine Cauchy-Folge und daher konvergent in R.
1
Setzt man x = 10
und ist (ak ) eine Folge natürlicher Zahlen aus der Menge {0, 1, . . . , 9},
so bedeutet obiger Satz, dass eine formale Dezimalbruchentwicklung
u = 0.a1 a2 a3 . . .
auch als unendliche Reihe“
”
u = lim
n→∞
n
X
k=1
−k
ak 10
=
∞
X
ak 10−k
k=1
aufgefasst werden kann.
Beispiel 4.51 Wir können erneut die Konvergenz der zu Beginn von Abschnitt 4.3
erwähnten Folge nachweisen. In der Tat gilt für m > n
0 < s m − sn =
1
1
1
2
−
+ −... ±
≤
→ 0 für n → ∞ .
n+1 n+2
m
n+1
Also ist (sn ) eine Cauchy-Folge und daher konvergent.
4.6 Topologische Grundbegriffe
43
Aufgaben zu Abschnitt 4.5
1. Weisen Sie die Konvergenz der schon in Abschnitt 4.3 und Beispiel 4.34 erwähnten
Folge (sn ) mit
n
X
(−1)k
sn =
2k + 1
k=0
(Leibnizreihe)
erneut nach, indem Sie zeigen, dass (sn ) eine Cauchyfolge ist.
2. Wandeln Sie den periodischen Dezimalbruch a = 0, 123456789 in einen Bruch der
Form a = m
um.
n
4.6
Topologische Grundbegriffe
Die bisherigen Begriffsbildungen erlauben es, Punkte und Teilmengen von R bzw. C in
ihren ,,Lagebeziehungenßueinander zu beschreiben. Das Hilfsmittel ist dabei der bereits
mehrfach verwendete Umgebungsbegriff Uε (a). In diesem Abschnitt bezeiche E = R oder
E = C.
Definition 4.52 Es sei M ⊆ E eine beliebige Teilmenge von E. Eine Zahl a ∈ E heißt
dann:
a) ein innerer Punkt von M , wenn es eine Umgebung Uε (a) mit Uε (a) ⊆ M gibt.
b) ein äußerer Punkt von M , wenn es eine Umgebung Uε (a) mit Uε (a) ∩ M = ∅ gibt.
c) ein Randpunkt von M , wenn jede Umgebung Uε (a) sowohl Punkte aus M als auch
Punkte aus dem Komplement M enthält.
d) ein Häufungspunkt von M , wenn jede punktierte ε-Umgebung Uε0 (a) = Uε (a) \ {a}
einen Punkt aus M enthält.
Ein Punkt x ist genau dann ein innerer Punkt einer Menge M , wenn x ein äußerer Punkt
des Komplements M = E \ M ist (Beweis?). Jeder innere Punkt einer Menge ist auch ein
Häufungspunkt dieser Menge.
Abbildung 5: Randpunkte, innere und äußere Punkte
Definition 4.53 Eine Teilmenge M ⊆ E heißt
a) offen, wenn jeder ihrer Punkte ein innerer Punkt ist.
b) abgeschlossen, wenn das Komplement M = E \ M offen ist.
44
4 ZAHLENFOLGEN UND REIHEN
Satz 4.54 Jede ε-Kugel Uε (x0 ) = {x ∈ E : |x − a| < ε} ist offen.
Beweis. Übungsaufgabe.
Abgeschlossene Mengen lassen sich wie folgt charakterisieren:
Satz 4.55 Eine Menge M ⊂ E ist genau dann abgeschlossen, wenn sie alle ihre
Häufungspunkte in E enthält.
Beweis. Ein Häufungspunkt x von M kann kein innerer Punkt von M = E \ M sein.
Wird daher M als abgeschlossen vorausgesetzt, so folgt x 6∈ M , also ist x ∈ M . Enthält
umgekehrt die Menge M alle ihre Häufungspunkte, so gibt es zu jedem Punkt y 6∈ M
eine ε-Umgebung mit Uε (y) ∩ M = ∅. Also ist y ein innerer Punkt von M = E \ M .
Diese Menge M besteht daher nur aus inneren Punkten, sie ist also offen. Folglich ist M
abgeschlossen.
Definition 4.56 Für eine beliebige Menge M ⊆ E heißt die Vereinigung von M mit der
Menge aller ihrer Häufungspunkte der Abschluss M a von M .
Satz 4.57 Der Abschluss einer Menge M ist die kleinste abgeschlossene Menge, die M
enthält. Insbesondere gilt M a = M aa .
Beweis. Wir haben vor allem zu zeigen, dass M a abgeschlossen ist. Dazu sei x 6∈ M ein
Häufungspunkt von M a . Dann existiert zu jedem ε > 0 ein Punkt y ∈ Uε0 (x) ∩ M a . Ist
dabei bereits y ∈ M , so ergibt das y ∈ Uε0 (x)∩M . Im anderen Fall ist y aber zumindestens
ein Häufungspunkt von M . Zu δ = ε − |x − y| > 0 existiert daher ein m ∈ M ∩ Uδ0 (y).
Also ist |x − m| ≤ |x − y| + |y − m| < |x − y| + δ = ε. Das heißt m ∈ Uε0 (x). Also
ist x ein Häufungspunkt von M , woraus x ∈ M a folgt. Ist schließlich A eine beliebige
abgeschlossene Menge, die M enthält, so folgt aus Satz 4.55 die Inklusion M a ⊆ A.
Häufig werden Vereinigungen oder Durchschnitte offener oder abgeschlossener Mengen zu
bilden sein. Hierfür gilt der folgende Satz.
Satz 4.58 a) Die Vereinigung beliebig vieler offener Mengen ist offen.
b) Der Durchschnitt endlich vieler offener Mengen ist offen.
c) Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen.
d) Der Durchschnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen.
Beweis. Es ist sehr leicht zu sehen, dass die Vereinigung offener Mengen nur aus inneren
Punkten besteht. Ebenso leicht erkennt man, dass der Durchschnitt von zwei (und damit
von endlich vielen) offenen Mengen wieder offen ist. Die Behauptungen c) und d) folgen
dann aus a) und b) durch Betrachtung der Komplementärmengen und Verwendung der
de Morganschen Formeln.
Abzählbare Durchschnitte offener Mengen müssen nicht mehr offen sein. So ist beispielsweise die Menge
\
1
0, 1 +
= (0, 1]
n
n∈N
weder offen noch abgeschlossen.
4.7 Der Banachsche Fixpunktsatz
45
Definition 4.59 Eine Teilmenge M ⊆ E heißt (topologisch) dicht in E, wenn ihr Abschluss gleich E ist.
Nach Satz 1.13 ist zum Beispiel die Menge Q der rationalen Zahlen (auch topologisch)
dicht in R.
Aufgaben zu Abschnitt 4.6
1. Beweisen Sie den Satz 4.54.
2. Für Teilmengen M1 , M2 von R oder C beweise man folgende Aussagen:
a) M1aa = M1a ,
b) Aus M1 ⊆ M2 f olgt M1a ⊆ M2a ,
c) (M1 ∪ M2 )a = M1a ∪ M2a .
3. Es sei α > 0 eine reelle Zahl und es sei H = {m + nα : m, n ∈ Z} .
Man zeige der Reihe nach:
a) Ist α irrational, so hat H kein minimales positives Element (und umgekehrt).(Hinweis: Verwenden Sie, dass aus h1 , h2 ∈ H stets h1 ± h2 ∈ H folgt.)
b) Ist α irrational, so ist H dicht in R. (Benutzen Sie a)).
4. Beweisen Sie: Sind ∅ =
6 A, B abgeschlossene, beschränkte und nichtleere Teilmengen
von R oder C, so gibt es Punkte a0 ∈ A und b0 ∈ B mit der Eigenschaft
|a0 − b0 | = dist(A, B) = inf{|a − b| : a ∈ A, b ∈ B}.
4.7
Der Banachsche Fixpunktsatz
In R oder und C existiert ein sehr leistungsfähiges Verfahren zur näherungsweisen Lösung
von Gleichungen. Konkrete Aufgabenstellungen sind beispielsweise die reellen Gleichungen
ex = x3 oder auch cos(x) = x. Beide Gleichungen sind mit elementaren Umformungen
nicht aufzulösen. Es sei also E = R oder E = C. Es seien f und g zwei Abbildungen von
E in sich. Die Gleichung f (x) = 0 heißt dann eine Gleichung 1. Art, die Gleichung g(x) =
x heißt Gleichung 2. Art oder auch Fixpunktgleichung. Beide Aufgabenstellungen sind
äquivalent, da zum Beispiel durch Addition bzw. Subtraktion von x die eine Gleichung in
die andere Gleichung überführt werden kann. Die Gleichung g(x) = x erweist sich dabei für
die näherungsweise Lösung als zugänglicher. Rückt man nämlich den Abbildungscharakter
von g ins Blickfeld, so kann eine Lösung der Gleichung g(x) = x als Fixpunkt der Funktion
g gedeutet werden. Lösen der Gleichung bedeutet daher das Auffinden von Fixpunkten.
In den im folgenden zu präzisierenden günstigen Fällen erweist sich dieser Fixpunkt als
anziehend, d.h., er kann als Limes der iterativ gebildeten Folge xn+1 = g(xn ) gewonnen
werden. Wir präzisieren diesen Umstand durch die folgende Definition.
Definition 4.60 Es sei X eine Teilmenge von E. Eine Abbildung g : X → X heißt eine
Kontraktion in X, wenn es eine Zahl 0 < q < 1 mit
|g(x) − g(x0 )| ≤ q|x − x0 |
gibt.
für alle x, x0 ∈ X ,
46
4 ZAHLENFOLGEN UND REIHEN
Satz 4.61 (Banachscher Fixpunktsatz) Es sei X eine abgeschlossene Teilmenge von
E und es sei g eine Kontraktion in X mit einer Zahl 0 < q < 1. Dann existiert in X
genau eine Lösung x∗ der Gleichung g(x∗ ) = x∗ . Man erhält sie als Grenzwert der durch
die Vorschrift
xn+1 = g(xn )
gebildeten Folge mit beliebigem Startwert x0 ∈ X. Überdies gilt die Fehlerabschätzung
|x∗ − xn | ≤
qn
· |x1 − x0 |.
1−q
Beweis. Zum Beweis der Einzigkeit nehmen wir an, dass zwei Lösungen g(x∗ ) = x∗ und
g(x∗∗ ) = x∗∗ existieren. Die Kontraktionsbedingung ergibt
|x∗ − x∗∗ | = |g(x∗ ) − g(x∗∗ )| ≤ q|x∗ − x∗∗ | ,
woraus wegen q < 1 die Gleichung |x∗ − x∗∗ | = 0 , also x∗ = x∗∗ folgt.
Für den Existenzbeweis bilden wir eine Folge (xn ) nach der im Satz angegebenen Vorschrift. Dann ist
|xn+1 − xn | = |g(xn ) − g(xn−1 )| ≤ q|xn − xn−1 | ≤ q 2 |xn−1 − xn−2 | ≤ . . . ≤ q n |x1 − x0 |.
Hieraus folgt
|xn+m+1 − xn | ≤
m
X
|xn+j+1 − xn+j | ≤
j=0
m
X
q n+j |x1 − x0 | ≤ q n
j=0
1
|x1 − x0 | → 0 (∗).
1−q
Also ist (xn ) eine Cauchy-Folge. Es sei x∗ = lim xn . Da X abgeschlossen ist, gilt x∗ ∈ X.
n→∞
Wir zeigen g(x∗ ) = x∗ . Dazu sei ε > 0 beliebig vorgegeben. Dann existiert ein Index n0
mit |x∗ − xn | < 2ε für alle n ≥ n0 . Hieraus folgt
|g(x∗ ) − x∗ | = |g(x∗ ) − g(xn0 ) + g(xn0 ) − x∗ | ≤ |g(x∗ ) − g(xn0 )| + |g(xn0 ) − x∗ |
ε ε
≤ q|x∗ − xn0 | + |xn0 +1 − x∗ | < + = ε .
2 2
Da ε beliebig war, folgt g(x∗ ) = x∗ . Die Fehlerabschätzung ergibt sich aus der Ungleichung
(∗) durch Grenzübergang m → ∞.
Beispiel 4.62 Betrachten wir als erstes Beispiel die Gleichung cos(x) = x. Die Funktion
g(x) = cos(x) bildet das Intervall X = [0, 1] in sich ab. Die Kontraktionseigenschaft von
g auf X ergibt sich aus der folgenden Abschätzung, in der die Ungleichung | sin(t)| ≤ |t|
und ein Additionstheorem für den Kosinus verwendet werden:
| cos(x) − cos(x0 )| = |2 sin
x + x0
x − x0
1
· sin
| ≤ 2 · · sin 1 · |x − x0 | = sin 1 · |x − x0 |.
2
2
2
Wegen 0 < sin 1 < 1 liegt eine Kontraktion vor. Die Konstruktion der Iterationsfolge ist in
Abbildung 6 veranschaulicht, numerisch ergibt sich x∗ = 0.74... als Lösung der Gleichung
cos(x) = x.
4.7 Der Banachsche Fixpunktsatz
47
Abbildung 6: Iterationsfolge zur Lösung der Gleichung cos x = x.
Beispiel 4.63 Als zweites Beispiel betrachten wir eine zur Berechnung von
k-ten Wurzeln geeignete Kontraktion
x=x+
a − xk
,
k
0<a≤1.
Man kann zeigen, dass die Funktion
k
g(x) = x + a−x
eine Abbildung des Ink
a
tervalls X = [ k , 1] in sich ist. Weiter
ist
1
k
k
|g(x) − g(y)| = x − y − (x − y ) = |x − y|
k
a k−1 .
< |x − y| · 1 −
k
1
k−1
k−1
1 − (x
+ . . . + y )
k
Also ist g eine Kontraktion mit q = 1 − (a/k)k−1 , und der Banachsche Fixpunktsatz
liefert eine Lösung von a − xk = 0. Das hier benutzte Verfahren wird auch als vereinfachtes Newton-Verfahren bezeichnet.
Für a = 1/2 und k = 2 und x0 = 0.6 ergibt sich
p
∗
eine Näherungsfolge für x = 1/2 = 0, 707... gemäß der Werte in obiger Tabelle. Die
Näherungsfolge hat die in Satz 4.61 vorausgesagte lineare Konvergenzgeschwindigkeit.
Wir erinnern, dass die Iterationsfolge aus Kapitel 1 quadratisch konvergierte.
Aufgaben zu Abschnitt 4.7
1. Man berechne den nach Folgerung 4.29 zu vermutenden dritten Schnittpunkt von
y = x20 mit y = ex .
(Hinweis. Transformieren Sie die Schnittpunktgleichung durch Logarithmieren in
eine Fixpunktgleichung und zeigen Sie, dass die Funktion g(x) = 20 ln x eine Kontraktion auf dem Intervall [20 · ln 20, 202 ] ist. Iterieren Sie dann.)
48
5
5.1
5 ZAHLENREIHEN
Zahlenreihen
Begriffsbildung und Konvergenzkriterien
Definition 5.1 Es sei (ak )k∈N eine Zahlenfolge.
a) Unter der n-ten Partialsumme dieser Folge versteht man die Zahl
s n = a0 + . . . + an =
n
X
ak .
k=0
b) Unter der unendlichen Reihe der Folge (an ) versteht man die Folge (sn )n∈N der
Partialsummen, in Zeichen
!
∞
n
X
X
ak =
ak
.
k=0
k=0
n∈N
Mit dieser Begriffsbildung wird die Reihenlehre auf die Theorie der Folgen zurückgeführt.
Definition 5.2 Eine Reihe
∞
P
ak heißt konvergent (mit Grenzwert s), wenn die zu-
k=0
gehörige Folge der Partialsummen (sn )n∈N (gegen s) konvergiert. In diesem Fall benutzt
man das Reihensymbol auch zur Bezeichnung des Grenzwertes, man schreibt also
s=
∞
X
ak = lim
k=0
n→∞
n
X
ak .
k=0
Diese Doppelbedeutung der Symbolik wird zu Verwechselungen keinen Anlass geben.
Nach dem bisherigen ist die Reihenlehre ein Teilgebiet der Theorie der Folgen. Der nächste
Satz zeigt aber, dass auch umgekehrt jede Folge als eine Reihe (die sogenannte Teleskopsumme) aufgefasst werden kann. Diese Dualität ist ein wichtiges beweistechnisches
Hilfsmittel. Wir haben dies z.B. schon im Beweis zu Satz 4.61 ausgenutzt.
Satz 5.3 Es sei (an )n∈N eine beliebige Folge und es sei bn =
n
P
(ak+1 − ak ). Dann gilt:
k=0
lim an = a genau dann, wenn
n→∞
∞
X
(ak+1 − ak ) = a − a0 .
k=0
Beweis. Für jedes a ∈ E gilt
a − an+1 = a − (an+1 − an + an − + . . . − a0 + a0 ) = (a − a0 ) − bn ,
also
|a − an+1 | = |(a − a0 ) − bn |.
Hieraus folgt für n → ∞ die Behauptung.
5.1 Begriffsbildung und Konvergenzkriterien
Beispiel 5.4 Es gilt
∞
X
k=1
denn es ist
n
X
k=1
n
X
1
=
k(k + 1) k=1
49
1
= 1,
k(k + 1)
1
1
−
k+1 k
=1−
1
→ 1.
n+1
Definition 5.5 Unter einer geometrischen Reihe versteht man eine Reihe der Form
∞
X
xk mit x ∈ C.
k=0
Die Partialsummen der geometrischen Reihe wurden bereits in Satz 1.6 berechnet, es galt
sn =
n
X
k=0
xk =
1 − xn+1
.
1−x
Dieser Ausdruck konvergiert genau dann, wenn |x| < 1 ist, und der Grenzwert ist dann
1
. Das ergibt die wichtige Formel
1−x
∞
P
k=0
xk =
1
für |x| < 1.
1−x
Beispiel 5.6 Beispiel einer divergenten Reihe ist die harmonische Reihe:
∞ 1
P
= ∞.
k=1 k
Die Divergenz erkennt man aus der Abschätzung
1
1 1
1
1
1
1
s 2n = 1 + +
+
+
+ ... +
+ ... +
+ ... + n
2
3 4
5
8
2n−1 − 1
2
n−1
1 2 4
2
n
≥ 1 + + + + ... + n ≥ .
2 4 8
2
2
Daher ist die Teilfolge (s2n ) unbeschränkt, also nicht konvergent.
Aus den Konvergenzkriterien für Folgen gewinnt man entsprechende Konvergenzkriterien
für Reihen:
Satz 5.7 (Ein notwendiges Konvergenzkriterium) Wenn
∞
P
ak konvergent ist,
k=1
dann ist (ak ) eine Nullfolge.
(Das Beispiel der harmonischen Reihe zeigt, dass die Umkehrung obiger Aussage nicht
richtig ist.)
50
5 ZAHLENREIHEN
Beweis. Falls (sn ) konvergent ist, so ist (sn ) auch eine Cauchy-Folge. Hieraus folgt
|an | = |sn − sn−1 | → 0 für n → ∞.
Also ist (an ) eine Nullfolge.
Satz 5.8 (Cauchysches Konvergenzkriterium)
∞
X
k=1
n+p
X
ak ist konvergent ⇐⇒ ∀ε > 0 ∃n0 = n0 (ε) ∀p ≥ 1 ∀n ≥ n0 : ak < ε.
k=n+1
Beweis. Es ist
n+p
n+p
n
X
X
X
ak .
ak −
ak = |sn+p − sn | = k=1
k=n+1
k=1
Die im Satz angegebene Bedingung bedeutet daher, dass (sn ) eine Cauchy-Folge ist. Dies
ist in R oder C aber mit der Konvergenz der Folge äquivalent.
Das Cauchy-Kriterium für Reihen findet z.B. seine Anwendung beim Majorantenkriterium, das wir in Abschnitt 5.3 herleiten werden. Daher betrachten wir an dieser Stelle keine
weiteren Beispiele.
P
P
Satz 5.9 (Grenzwertsätze) Sind dieP
Reihen
ak und
P bk konvergent und ist λ eine
Zahl, so konvergieren auch die Reihen (ak ± bk ) und
λak und es gelten
∞
X
(ak ± bk ) =
k=0
∞
X
ak ±
k=0
∞
X
bk und
k=0
∞
X
λak = λ
k=0
∞
X
ak .
k=0
Beweis. Für die zugehörigen Partialsummen gilt
n
X
(ak ± bk ) =
k=0
n
X
k=0
ak ±
n
X
bk .
k=0
Daher folgt die Behauptung aus den entsprechenden Grenzwertsätzen für Folgen.
Produkte von Reihen verhalten sich wesentlich komplizierter, wir kommen in Satz 5.25
hierauf zurück.
Abschließend betrachten wir Reihen mit reellen Gliedern.
Satz 5.10 (Bolzano-Kriterium für Reihen mit nichtnegativen Gliedern) Es
∞
P
gelte an ≥ 0 für alle n ∈ N. Dann
an genau dann wenn die zugehörige Folge (sn ) der
n=1
Partialsummen beschränkt ist.
Beweis. Wegen sn+1 = sn + an+1 ≥ sn ist die Partialsummenfolge (sn ) monoton wachsend.
Die Beschränktheit von (sn ) ist somit nach Bolzanos Kriterium 4.24 mit der Konvergenz
von (sn ) äquivalent.
5.1 Begriffsbildung und Konvergenzkriterien
51
Beispiel 5.11 Als Anwendung untersuchen wir die sogenannten Dirichlet-Reihen
und beweisen
∞
X
1
konvergent für 1 < α < ∞
ζ(α) =
ist
.
α
divergent für 0 < α ≤ 1
k
k=1
Die Funktion ζ = ζ(α) heißt auch Riemannsche Zeta-Funktion.
Wir beginnen nun mit dem Nachweis der Divergenzbehauptung. Für α = 1 erhalten wir
die harmonische Reihe, deren Divergenz wir bereits
nkennen.
Für 0 < α < 1 gilt aber
P
1
1
≤ k1α gilt, also muß auch die Partialsummenfolge
unbeschränkt und daher
k
kα
k=1
divergent sein.
n∈N
Für α = 2 folgt
n
n
n
X
X
X
1
1
1
=1+
≤1+
≤1+1=2
2
2
k
k
k(k + 1)
k=1
k=2
k=1
nach Beispiel 5.4. Daher ist die zugehörige Partialsummenfolge beschränkt, und die
Dirichlet-Reihe ist für α = 2 konvergent. Für α ≥ 2 ist die Dirichlet-Reihe wegen k1α ≤ k12
dann ebenfalls konvergent.
Es bleibt die Lücke 1 < α < 2 zu untersuchen. Das gelingt mit einem Vorgriff auf die
Integralrechnung (siehe Satz 8.41). Es ist nämlich (Figur 7):
n
Zn
n
X
1
1
x1−α 1
1
=
≤
dx =
(n1−α − 1) ≤
α
α
k
x
1−α 1
1−α
α−1
k=2
1
für alle α > 1. Also ist
n
X
1
α
1
≤
1
+
=
.
α
k
α
−
1
α
−
1
k=1
Die Partialsummenfolge ist daher beschränkt, also konvergent.
Abbildung 7: Cauchys Integraltest
Die soeben angewandte Methode eines Konvergenznachweises wird auch Cauchyscher
Integraltest genannt.
Satz 5.12 (Verdichtungskriterium) Es sei an & 0. Dann gilt:
∞
P
n=0
an konvergiert genau dann, wenn
∞
P
k=0
a2k 2k konvergiert.
52
5 ZAHLENREIHEN
Beweis. Wegen an & 0 gilt
1
a2k · 2k = a2k · 2k−1 ≤ a2k−1 + . . . + a2k −1 ≤ a2k−1 · 2k−1
2
für alle k ∈ N. Hieraus folgt
N
N
2X
−1
N
X
1X
k
a2 k · 2 ≤
an ≤
a2k−1 · 2k−1 .
2 k=1
k=1
k=1
Somit sind die Partialsummenfolgen der beiden Reihen entweder beide beschränkt oder
beide unbeschränkt. Die Behauptung des Satzs folgt nun aus dem Bolzano-Kriterium für
Reihen mit nichtnegativen Gliedern.
Beispiel 5.13 Mit Hilfe dieses Kriteriums lässt sich erneut die Konvergenz der DirichletReihen untersuchen. Wegen
1
· 2k = 2k(1−α)
(2k )α
ist
X 1
X
k
2k(1−α) ,
·
2
=
k )α
(2
k
k
und diese geometrische Reihe konvergiert genau dann, wenn 1 − α < 0 also α > 1 ist.
Dies besätigt das bereits erhaltene Ergebnis.
Aufgaben zu Abschnitt 5.1
1. Man zeige
∞
P
n=1
1
qn
=
q
q−1
für |q| < 1.
2. Rechtfertigung der Dezimalbruchentwicklung (s.a. Satz 4.50) Es sei (an ) eine
Folge von Zahlen aus der Menge {0, 1, 2, . . . , 9} (die Ziffern in der Dezimalentwick∞
P
lung). Man beweise die Konvergenz der Reihe
ak · 10−k mittels:
k=1
a) dem Cauchykriterium (s.o.)
b) Satz 5.10.
3. Man zeige unter Verwendung des Cauchy-Kriteriums: Ist (an ) eine beschränkte Zah∞
P
an z n .
lenfolge und ist z ∈ C mit |z| < 1 eine beliebige Zahl, so konvergiert
n=0
4. Für welche s ∈ R konvergiert die Reihe
∞
X
k=2
1
?
n · (ln k)s
Hinweis: Verwenden Sie das Verdichtungskriterium.
5. Finden Sie eine geschlossene Formel für die Partialsummen der folgenden Reihe und
berechnen Sie deren Grenzwert:
∞
X
1
.
k · (k + 1) · (k + 2)
k=1
Hinweis: Verwenden Sie eine Partialbruchzerlegung.
5.2 Alternierende Reihen in R
5.2
53
Alternierende Reihen in R
∞
P
Definition 5.14 Eine Reihe
an heißt alternierend, wenn an · an+1 < 0 für alle n ∈ N
n=0
gilt.
Die bereits wiederholt untersuchte Leibnizreihe
∞
P
(−1)n
n=0
1
ist ein Beispiel für eine
2n + 1
alternierende Reihe. Für solche Reihen gilt das:
Satz 5.15 (Leibnizsches Konvergenzkriterium) Jede alternierende Reihe
∞
P
an mit
n=0
|an | & 0 ist konvergent, und es gilt |s − sn | ≤ |an+1 | für alle n ∈ N. Dabei bezeichnet (sn )
die Folge der Partialsummen.
Beweis. Ohne Beschränkung der Allgemeinheit sei a0 > 0. Für alle n ∈ N gilt dann
a2n > 0 > a2n+1 . Aus den nachfolgenden Überlegungen folgt, dass (s2n+1 |sn ) eine Intervallschachtelung ist:
s2n+1
s2n+1
s2n+2
s2n − s2n+1
=
≤
=
=
s2n + a2n+1 < s2n ,
s2n+1 + a2n+2 + a2n+3 = s2n+3 ,
s2n + a2n+1 + a2n+2 ≤ s2n und
−a2n+1 → 0 .
Nach dem Prinzip der Intervallschachtelung konvergieren daher die Folgen (s2n+1 ) und
(s2n ) gegen den gleichen Wert s. Also konvergiert auch (sn ) gegen s. Schließlich ist
0 ≤ s2k − s
0 ≤ s − s2k+1
≤ s2k − s2k+1
≤ s2k+2 − s2k+1
= |a2k+1 |,
= a2k+2 .
Hieraus folgt 0 ≤ |s − sn | ≤ |an+1 | für alle n ∈ N.
Das Leibniz-Kriterium ergibt sofort die Konvergenz der nachfolgenden Beispiele, die angegebenen Grenzwerte sind mit diesen Mitteln aber noch nicht zu berechnen. Zu bemerken
ist auch, dass die angegebenen Reihen sehr langsam konvergieren:
∞
X
(−1)n
n=0
∞
X
n=0
5.3
1
n+1
(−1)n
1
2n + 1
(= ln 2) ,
(=
π
).
4
Absolut konvergente Reihen in R und C
In diesem Abschnitt werden wir einige sehr einfach zu handhabende hinreichende Konvergenzkriterien kennen lernen.
54
5 ZAHLENREIHEN
Definition 5.16 Eine Reihe
vergiert.
P
ak heißt absolut konvergent, wenn die Reihe
P
|ak | kon-
Satz 5.17 Jede absolut konvergente Reihe ist auch konvergent.
Beweis. Jede absolut konvergente Reihe erfüllt das Cauchy-Kriterium
n+m
n+m
X
X
ak ≤
|ak | → 0 für n → ∞
k=n
k=n
und ist daher konvergent.
Es sei bemerkt, dass es konvergente Reihen gibt, die nicht absolut konvergent sind. Die
∞
P
1
Reihe
(−1)k+1 ist ein Beispiel dafür.
k
k=1
P
Satz 5.18 (Majorantenkriterium) P
Eine Reihe
ak ist genau dann absolut konvergent, wenn es eine konvergente Reihe
ck nichtnegativer
reeller Zahlen ck so gibt, dass
P
|a
ck heißt eine konvergente Majorante für
Pk | ≤ ck für (fast) alle k ∈ N gilt. (Die Reihe
ak .)
P
P
Beweis. Ist
ak absolut konvergent, so ist die Reihe
|ak | selbst als konvergente
MaP
jorante
geeignet.
Gilt umgekehrt
ck , so ist
P
P
P |ak | ≤ ck mit einer konvergenten Reihe
|ak | ≤ ck < ∞, also ist
|ak | konvergent nach dem Bolzanokriterium Satz 5.10.
Zur Anwendung dieses Majorantenkriteriums benötigt man einen Vorrat an reellen konvergenten Reihen mit positiven Gliedern. Häufig sind dafür geometrische Reihen geeignet.
Das führt auf die folgenden beiden Spezialisierungen des Majorantenkriteriums:
Satz 5.19 (Das Wurzelkriterium) Falls es eine Konstante q mit
p
0 ≤ q < 1 und k |ak | ≤ q für fast alle k ∈ N
P
gibt, sopist
ak absolut konvergent. Die Bedingung ist sicher dann erfüllt, wenn
k
lim sup |ak | < 1 ist.
k→∞
Beweis. Unter den Voraussetzungen des Satzes ist die Reihe
P
ak geeignet.
P
q k als Majorantenreihe für
Satz 5.20 (Das Quotientenkriterium) Falls es eine Konstante q mit
0 ≤ q < 1 und
gibt, so ist
P
ak absolut konvergent.
|ak+1 |
≤ q für fast alle k ∈ N
|ak |
5.3 Absolut konvergente Reihen in R und C
55
Beweis. Ohne Beschränkung der Allgemeinheit gelte obige Ungleichung für alle k ∈ N.
Durch wiederholte Anwendung folgt
|ak | |ak−1 |
|a1 |
|ak |
=
·
· ... ·
≤ qk .
|a0 |
|ak−1 | |ak−2 |
|a0 |
P
P
Daher ist |ak | ≤ |a0 | · q k , und
|a0 |q k ist eine konvergente Majorante für
an .
Beispiel 5.21 Die Reihe
∞ 1
P
ist konvergent, denn es gilt
k=0 k!
|ak+1 |
k!
1
=
=
→0.
|ak |
(k + 1)!
k+1
Wir wenden uns jetzt der Frage zu, ob der Wert einer Reihe von Umordnungen der
Reihenglieder unbeeinflußt bleibt. Für endliche Summen ist das wegen des Kommutativund Assoziativgesetzes selbstverständlich, und wir werden sehen, dass auch absolut konvergente Reihen diese Eigenschaft haben. Es gibt aber auch andere Situationen:
Beispiel 5.22 Das Beispiel der konvergenten Reihe
s=
∞
X
(−1)k
k=0
k+1
=1−
1 1 1
+ − + −...
2 3 4
zeigt, dass Umordnungen die Konvergenz zerstören und Grenzwerte verändern können.
Dazu ordnen wir die Reihenglieder {1, − 21 , 13 , − 14 , . . .} neu an. Wir setzen also
1 1 1
+ − + − . . . und
2 3 4
1 1 1 1 1 1
= 1 − − + − − + − − + − − +...
2 4 3 6 8 5
1
1
1 1
1
=
1−
− +
−
− + ...
2
4
3 6
8
1 1 1 1
1
1 1 1
1
=
− + − + −... =
1 − + − + − . . . = s 6= s.
2 4 6 8
2
2 3 4
2
s = 1−
s0
Man kann überdies zeigen, dass zu jeder(!) reellen Zahl x eine Umordnung obiger Reihe
mit Grenzwert x existiert (Riemannscher Umordnungssatz).
Derartig gewarnt suchen wir nun nach positiven Aussagen.
Definition 5.23 Unter einer UmordnungPoder Permutation der Menge N verstehen
wir eine Bijektion p : N → N. Eine Reihe P ak heißt unbedingt konvergent, wenn
Pfür
jede Permutation p von N auch die Reihe
ap(k) gegen den gleichen Grenzwert wie
ak
konvergiert.
56
5 ZAHLENREIHEN
Satz 5.24 (Satz von Riemann) Für Zahlenreihen
äquivalent:
1. Die Reihe
P
P
ak sind folgende Bedingungen
ak ist absolut konvergent.
2. Für jede Folge (σk ) von Zahlen σk ∈ {0, 1} ist die Reihe
reihenkonvergenz)
P
3. Die Reihe
ak ist unbedingt konvergent.
P
σk ak konvergent. (Teil-
Beweis. Wir betrachten zunächst nur reelle Reihen.
P
(1 ⇒ 3) Es sei ak eine absolut konvergent. Zum Beweis von 3) genügt es, die Bedingung
n
n
X
X
ak −
ap(k) = 0
(∗)
lim n→∞ k=0
k=0
für jede Permutation p von N zu zeigen. Es sei ε > 0 gegeben. Nach der vorausgesetzten
absoluten Konvergenz existiert eine Zahl N = N (ε) derart, dass
m
X
|ak | < ε für alle m ≥ N
k=N
gilt. Da p eine Permutation ist, existiert eine Zahl N1 ≥ N derart, dass {0, 1, . . . , N } ⊆
{p(0), . . . , p(N1 )} gilt. Für festes n ≥ N1 sei nun n∗ = max{n, p(0), . . . , p(n)}. Dann folgt
n
n
X
X
ak −
ap(k) ≤ |aN +1 | + . . . + |an∗ | < ε .
k=0
k=0
Damit ist (∗) bewiesen.
(3 ⇒ 2) Wir führen diesen Beweis indirekt und nehmen
P das Gegenteil an. Dann existiert
eine Folge (σk ) von Zahlen σk ∈ {0, 1} derart, dass
σk xk nicht konvergiert. Nach dem
Cauchy-Kriterium für Reihen bedeutet das
R
X
∃ε > 0 ∀n ∃r > n ∃R > r : σk ak ≥ ε.
k=r
Daher kann man induktiv zwei Folgen (rn ) und (Rn ) mit
X
Rj
r1 < R1 < r2 < R2 < r3 < R3 < . . . und σk ak ≥ ε für alle j ∈ N
k=rj
bilden.
Nun konstruieren wir eine Permutation p von N auf folgende Weise. Wir zerlegen die
Intervalle Ij = [rj , Rj ] in die Mengen in die Mengen Ij0 = {k ∈ Ij : σk = 1} und
Ij00 = {k ∈ Ij : σk = 0}. Wir wählen eine Bijektion pj : Ij → Ij derart, dass die Elemente
5.3 Absolut konvergente Reihen in R und C
57
von Ij0 vor die Elemente von Ij00 gesetzt werden. Hieraus konstruieren wir p : N → N auf
folgende Weise:

∞
S
 n
für n ∈
/
Ij ,
p(n) =
j=1

pj (n) für n ∈ Ij .
Es seien mj die Anzahl der Elemente von Ij0 . Nach Konstruktion von p gilt dann
rj +m
rj +mj −1
Rj
j −1
X
X
X
=
=
>ε
a
σ
a
σ
a
k
k
k
k
p(k)
k=rj
k=rj
k=rj
P
für alle k ∈ N. Daher erfüllt die Reihe
ap(k) kein Cauchy-Kriterium und kann folglich
nicht konvergieren.
P
(2 ⇒ 1) Die Reihe
ak sei teilreihenkonvergent. Wir setzen
0 für ak < 0,
1 für ak < 0,
σk =
bzw. τk =
1 sonst
0 sonst.
Nach Voraussetzung konvergieren die Reihen
X
|ak | =
X
P
σk ak und
σk ak −
X
P
τk ak , und wegen
τ k ak
P
konvergiert auch
|ak |.
P
Nun sei
zk eine komplexe Reihe
P und es seien ak = Re(zk ) und bk = Im(zk ). Wegen
P
|ak |, |b
|
≤
|z
|
≤
|a
|
+
|b
|
ist
z
genau
dann
absolut
konvergent,
wenn
dies
auf
ak
k
k
k
k
k
P
und
bk zutrifft. Damit ist der komplexe Fall auf den reellen zurückgeführt.
Abschließend untersuchen wir Produkte von Reihen. Für endliche Summen gilt nach
den einschlägigen Gesetzen (Distributiv- und Assoziativgesetz) bekanntlich die Formel
! m !
n
n
m
X
X
X
X
ai
bj =
ai b j ,
i=0
j=0
i=0
j=0
das Produkt
zweier
P
P Summen ist also die Summe aller möglichen Produkte ai bj der Glieder.
Sind
an und
bn unendliche Reihen, so hat man daher zunächst alle Produkte der
Form ai bj zu bilden. Sie lassen sich zweckmäßig in einer unendlichen Tabelle (Matrix)
notieren:
a0
a1
a2
a3
..
.
b0
a0 b 0
a1 b 0
a2 b 0
a3 b 0
b1
a0 b 1
a1 b 1
a2 b 1
a3 b 1
b2
a0 b 2
a1 b 2
a2 b 2
a3 b 2
b3
a0 b 3
a1 b 3
a2 b 3
a3 b 3
...
...
...
...
...
...
...
...
...
...
58
5 ZAHLENREIHEN
Abbildung 8: Anordnung nach Dreiecken bzw. Quadraten
Diese Produkte ai bj kann man auf verschiedenste Weisen zu einer Folge anordnen. Jedesmal wird man eine andere Partialsummenfolge erhalten, und die Konvergenz dieser
Reihen ist zunächst offen (s. Aufgabe 2 als Gegenbeispiel). Häufig finden die folgenden
beiden Summationsvorschriften Anwendung (z.B. in Satz 5.25):
Summation nach Dreiecken: (Cauchysche Produktreihe) Hierunter versteht man die
Partialsummenfolge
l
n X
X
ak bl−k ).
(
Sn =
(s. Figur 8)
l=0 k=0
Summation nach Quadraten: Darunter versteht man die Partialsummenfolge
sn =
n X
n
X
ai · b j =
i=0 j=0
n
X
ai ·
i=0
n
X
bj .
(s. Figur 8)
j=0
Für absolut konvergente Reihen gilt nun der wichtige:
P
P
Satz 5.25 (Multiplikationssatz) Sind
an und
bn absolut konvergente Zahlenreihen, so ist die Reihe aller Produkte ai bj in beliebiger
Reihenfolge
absolut konvergent und
P
P
ihr Reihenwert ist das Produkt der Werte von
an und
bn . Insbesondere gilt
∞
X
ai ·
i=0
∞
X
bj =
∞
n
X
X
n=0
j=0
ak bn−k .
k=0
Beweis. Die Aussage des Satzes bedeutet präzisiert, dass für jede Bijektion h : N → N × N
vermöge k 7→ h(k) = (i(k), j(k)) von N auf die Menge N × N aller Indexpaare die Reihe
∞
X
ai(k) bj(k)
k=0
absolut konvergiert und dass ihr Wert gleich dem Produkt der gegebenen Reihen ist. Nach
Voraussetzung konvergieren
α=
∞
X
i=0
|ai | und β =
∞
X
|bj | .
j=0
Zu jeder Zahl n ∈ N lässt sich nun eine Zahl N ∈ N so finden, dass
{h(0), . . . , h(n)} ⊆ {0, . . . , N } × {0, . . . , N }
5.4 Potenzreihen
59
gilt. Dann ist aber
n
X
|ai(k) bj(k) | ≤
N X
N
X
|ar · bs | =
r=0 s=0
k=0
N
X
|ar | ·
N
X
r=0
|bs | ≤ αβ < ∞.
s=0
Das zeigt die absolute Konvergenz der Reihe. Daher ist die Reihe auch unbedingt konvergent, und wir können den Grenzwert durch Summation nach Rechtecken ausrechnen.
Hierfür gilt aber
!
n
n
n
n
X
X
X
X
lim sn = lim
ai ·
bj = lim
ai · lim
bj .
n→∞
n→∞
i=0
j=0
n→∞
n→∞
i=0
j=0
Aufgaben zu Abschnitt 5.3
1. Zeigen Sie die Konvergenz der folgenden Reihen:
∞
∞ √
∞
∞
X
X
X
X
k
s!
j
10j
a)
,
b)
,
c)
,
d)
,
j
s
2
k!
s
(2j
+
1)!
s=0
j=0
j=0
k=0
e)
∞
X
k2
.
(2k)!
k=0
∞
X
(−1)k
√
2. Man zeige, dass die Reihe
konvergiert, dass aber das Cauchy-Produkt
k+1
k=0
dieser Reihe mit sich selbst divergent ist.
∞
∞
∞
X
X
1 X 1
2r
3. Beweisen Sie die Formel
·
=
.
j! k=0 k!
r!
r=0
j=0
4. Beweisen Sie in Ergänzung zum Wurzelkriterium (Satz 5.19) das folgende
p
P
ak .
Divergenzkriterium: Aus lim inf n |an | > 1 folgt die Divergenz der Reihe
n→∞
5. Geben Sie eine konvergente und eine divergente Reihe
5.4
P
ak mit lim
k→∞
p
k
|ak | = 1 an.
Potenzreihen
Definition 5.26 Eine reelle bzw. komplexe Potenzreihe ist eine Reihe der Form
f (x) =
∞
X
cn (x − x0 )n
mit cn , x0 ∈ R
bzw.
cn , x0 ∈ C.
n=0
Dabei heißen x0 der Mittelpunkt und die cn die Koeffizienten der Potenzreihe.
In vielen Anwendungen wird x0 = 0 sein. Die reelle bzw. komplexe Variable x kann
als freier Parameter betrachtet werden. Potenzreihen sind also Verallgemeinerungen von
Polynomen in x. Unter dem Konvergenzbereich der Reihe versteht man die Menge
n
o
X
B = x ∈ R bzw. C :
cn (x − x0 )n konvergiert .
Diese Menge ist durch ein Wechselspiel der cn mit den Werten |x − x0 | bestimmt. Der
folgende Satz charakterisiert diesen Konvergenzbereich genauer:
60
5 ZAHLENREIHEN
P
Satz 5.27 (Satz von Cauchy-Hadamard) Es sei
cn (x − x0 )n eine Potenzreihe in
C und es seien
 −1
für 0 < L < ∞
 L
p
∞
für L = 0
L = lim sup n |cn | und R =

n→∞
0
für L = ∞.
Dann ist die Potenzreihe im Innern der Kreisscheibe mit Mittelpunkt R absolut konvergent
und außerhalb dieses Kreises divergent. Es gilt also
{x ∈ C : |x − x0 | < R} ⊆ B ⊆ {x ∈ C : |x − x0 | ≤ R}.
Reihen mit R = ∞ heißen beständig konvergent, Reihen mit R = 0 heißen nirgends
konvergent. Die Zahl R heißt der Konvergenzkreisradius.
Im reellen Fall gilt entsprechend {x ∈ R : |x − x0 | < R} ⊆ B ⊆ {x ∈ R : |x − x0 | ≤ R},
der Konvergenzbereich ist also ein Intervall.
Beweis. Wir wenden das Wurzelkriterium an und setzen
p
p
q = lim sup n |cn (x − x0 )n | = |x − x0 | · lim sup n |cn | = |x − x0 | · L.
n→∞
n→∞
Sei zunächst 0 < L < ∞. Für |x − x0 | < R = L−1 ist q < 1, die Reihe ist also absolut
konvergent. Im Fall |x − x0 | > R = L−1 folgt q > 1 und somit die Divergenz der Reihe.
Die Randfälle L = 0 und L = ∞ sind ebenso leicht einzusehen.
Für die Punkte auf dem Kreisrand können mittels dieses Kriteriums keine Konvergenzaussagen gemacht werden. Beispielsweise ist für die drei Reihen
X 1
X
X1
xn ,
xn ,
xn ,
n
n2
der Konvergenzradius R = 1, das Verhalten auf dem Rande ist aber bei den drei Reihen
sehr unterschiedlich. (Wie nämlich ?)
∞ xn
√
P
n
Beispiel 5.28 Für die Reihe
ist
L
=
lim
2−n = 12 , also R = 2. Die Reihe
n
n=0 2
konvergiert daher zumindestens im Innern des Kreises {x : |x| < 2}. Für |x| ≥ 2 ist die
xn
Reihe divergent, denn n ist dann keine Nullfolge.
2
Gelegentlich ist die Berechnung des Konvergenzradius mittels des Quotientenkriteriums
einfacher.
Satz 5.29 Ist
P
cn (x − x0 )n eine Potenzreihe und existiert
|cn+1 |
,
n→∞ |cn |
l = lim
so gilt R = l−1 .
5.5 Exponential- und trigonometrische Funktionen
61
Beweis. Für |x − x0 | < l−1 gilt
|cn+1 (x − x0 )n+1 |
= |x − x0 | · l < 1,
lim
n→∞
|cn (x − x0 )n |
also ist die Reihe für dieses x absolut konvergent. Das zeigt l−1 ≤ R. Entsprechend folgt
aus |x − x0 | > l−1 die Divergenz der Reihe, daher ist l−1 ≥ R . Das zeigt l−1 = R.
Aufgaben zu Abschnitt 5.4
1. Man bestimme die Konvergenzbereiche für die folgenden Potenzreihen:
∞
X
∞
X
n
(x − 2) ,
n=0
5.5
n!x ,
n=0
∞
X
(−1)n+1 xn
,
n
n=n
1
n
∞
X
xn
n=0
∞
X
(x + 3)n
,
n2
n=n
1
nn
,
∞
X
in xn .
n=0
Exponential- und trigonometrische Funktionen
Wir nutzen nun Potenzreihen zur Definition bzw. Fortsetzung klassischer reeller Funktionen in das Komplexe und beginnen dabei mit der Exponentialfunktion.
Satz 5.30 Durch die Gleichung
exp(x) =
∞
X
xk
k=0
k!
wird auf C eine Funktion definiert, die die folgende Funktionalgleichung erfüllt:
exp(x + y) = exp(x) · exp(y)
Beweis. Es ist
für alle x, y ∈ C
cn+1 n!
1
= lim
=
lim
=0.
L = lim n→∞
cn n→∞ (n + 1)! n→∞ n + 1
Daher ist die obige Potenzreihe auf ganz C absolut konvergent. Wir rechnen nun unter
Verwendung der Cauchyschen Produktreihe und der binomischen Formel die Gültigkeit
der Funktionalgleichung nach:
!
!
!
∞
∞
∞
n
X
X
X
X
xj
yk
xn−k y k
exp(x) · exp(y) =
·
=
j!
k!
(n − k)! k!
n=0
j=0
k=0
k=0
∞
n ∞
X
1 X n n−k k X 1
=
x y =
(x + y)n = exp(x + y).
n!
k
n!
n=0
n=0
k=0
62
5 ZAHLENREIHEN
5.31 (Hilfssatz:) Für x ∈ R gelten exp(x) ≥ 0 und exp
x
n
=
p
n
exp(x).
Beweis. Nach Satz 5.30 gilt für alle x ∈ R die Gleichung
x n
x
x
x
x
exp
= exp
· . . . · exp
= exp
+ ... +
= exp(x).
n
n
n
n
n
x 2
Speziell ist ferner exp(x) = exp
≥0
2
Satz 5.32 (Die Reihendarstellung der Exponentialfunktion) Für alle x ∈ R gilt
ex = exp(x) =
X xn
n!
.
Beweis. Wegen Satz 4.30 und Hilfssatz 5.31 ist
x
p
ln(exp(x)) = lim n( n exp(x) − 1) = lim n exp
−1
n→∞
n→∞
n
∞
∞
X
1 X 1 xk
1 xk
= x + lim
= x + 0 = x.
= lim n
n→∞
n→∞ n
k! nk
k! nk−2
k=1
k=2
Dabei haben wir noch folgende Abschätzung benutzt:
∞
∞
X
k 1
x
X 1
|x|k ≤ exp(|x|) < ∞.
≤
k! nk−2 k!
k=2
k=2
Definition 5.33 (Die komplexe Exponentialfunktion) Durch die Formel
ez = exp(z) =
∞
X
zk
k=0
k!
,
z ∈ C,
wird die reelle Exponentialfunktion in das Komplexe fortgesetzt.
5.34 (Die Berechnung der Zahl e) Für x = 1 ergibt sich aus Satz 5.32 die Formel
∞
X
1
e=
,
k!
k=0
die zur Berechnung von e wegen der schnellen Konvergenz sehr gut geeignet ist. Für die
n−te Partialsumme sn ergibt sich nämlich der kleine Fehler
∞
X
1
1
1
1
|e − sn | =
=
1+
+
+ ...
k!
(n
+
1)!
(n
+
2)
(n
+
2)(n
+
3)
k=n+1
1
1
1
e
3
≤
1 + + + ... ≤
≤
.
(n + 1)!
2! 3!
(n + 1)!
(n + 1)!
5.5 Exponential- und trigonometrische Funktionen
Also ist z.B.
|e − s9 | ≤
63
3
≤ 10−6 .
10!
Das zeigt
e = s9 ± 10−6 = 2, 718281 ± 10−6 .
Folgerung 5.35 Die Zahl e ist irrational.
Beweis. Angenommen, es gäbe zwei natürliche Zahlen p, q > 1 mit e = p/q. Dann ist
q
∞
X
p X 1
1
1
1
1
q −1
1
1
1
0< −
=
≤ ·
+ 2 + ... = ·
.
= ·
−1
q k=0 k! k=q+1 k!
q!
q q
q! 1 − q
q! q − 1
Die Multiplikation mit q! ergibt
q
X
q!
1
0 < p (q − 1)! −
≤
,
k!
q−1
k=0
aber diese Ungleichung steht im Widerspruch dazu, dass die linksstehende Differenz ganzzahlig und positiv ist.
Folgerung 5.36 (Schwache Stirling-Formel) Für alle natürlichen Zahlen n gilt:
n n
e
≤ n! ≤ nn .
Beweis. Die rechte Ungleichung folgt aus n! = 1 · 2 · . . . · n ≤ nn , die linke aus
en =
∞
X
nk
nn
n n n n
≥
, also n! ≥ n =
.
k!
n!
e
e
k=0
Unter Verwendung der Formel nn = en ln n lässt sich obige Ungleichung auch in der Form
en(ln n−1) ≤ n! ≤ en·ln n
schreiben. Die Fakultät wächst also hyperexponentiell. Die Ungleichung ist zur
Abschätzung des Wachstums der Fakultätsfunktion nützlich. Für n = 1000 ergibt sich
z.B. aus
1000
1000
2000
1000
10
= 100
≤
≤ 1000! ≤ 10001000 = 103000
e
die Abschätzung 102000 ≤ 1000! ≤ 103000 . Die Formel lässt sich noch verfeinern und führt
dann zur sogenannten Stirlingschen Formel.
64
5 ZAHLENREIHEN
Definition 5.37 Unabhängig von geometrischen Zusammenhängen definieren wir die beiden trigonometrischen Funktionen
∞
X
(−1)k 2k+1
sin z =
z
(2k + 1)!
k=0
und
cos z =
∞
X
(−1)k
k=0
(2k)!
z 2k
für z ∈ C.
Man sieht wie im Beweis zu Satz 5.30, dass beide Reihen beständig konvergent sind.
eiz = cos z + i sin z.
Satz 5.38 (Die Eulersche Formel) Für alle z ∈ C gilt:
Beweis. Es ist
e
iz
=
∞
X
(iz)k
k=0
k!
=
∞
X
(iz)2k
k=0
∞
∞
∞
X
X
X
(iz)2k+1
(−1)k 2k
(−1)k 2k+1
+
=
z +i
z
(2k)!
(2k + 1)! k=0 (2k)!
(2k + 1)!
k=0
k=0
= cos z + i sin z.
Die Eulersche Formel zeigt den engen Zusammenhang zwischen der Exponentialfunktion
und den trigonometrischen Funktionen, der sich allerdings erst durch die Betrachtung
im Komplexen offenbart. Als erste Anwendung der Eulerschen Formel beweisen wir die
folgenden Eigenschaften der Sinus- und Kosinusfunktion:
Satz 5.39 Für alle x, y ∈ C gelten:
a) sin 0 = 0, cos 0 = 1.
b) sin(−x) = − sin x und cos(−x) = cos x,
c) sin(x ± y) = sin x cos y ± cos x sin y,
d) cos(x ± y) = cos x cos y ∓ sin x sin y.
e) cos2 x + sin2 x = 1,
f ) Für reelles x ∈ R gelten | sin x|, | cos x| ≤ 1.
(Anfangswerte)
(ungerade/gerade Funktion)
(Additionstheorem)
(Additionstheorem)
(Satz des Pythagoras)
(Beschränktheit im Reellen)
Beweis. Die Formeln a) und b) ergeben sich direkt aus der Reihendarstellung der beiden
Funktionen. Zum Beweis von c) und d) betrachten wir
e±i(x+y) = e±ix e±iy = (cos x ± i sin x)(cos y ± i sin y)
= (cos x cos y − sin x sin y) ± i(sin x cos y + cos x sin y) .
Andererseits ist aber wiederum nach 5.38
e±i(x+y) = cos(x + y) ± i sin(x + y) .
Also ist
cos(x + y) ± i sin(x + y) = (cos x cos y − sin x sin y) ± i(sin x cos y + cos x sin y).
Die Addition bzw. Subtraktion dieser beiden Formeln voneinander ergibt c) bzw. d). Aus
d) folgt mit y = −x die Formel e).
Da für reelles x auf Grund der Reihendarstellung auch die Werte cos x und sin x reell
sind, gelten in diesem Fall sin2 x, cos2 x ≥ 0. Daher folgt f) aus e).
5.5 Exponential- und trigonometrische Funktionen
65
5.40 Wir stellen nun Beziehungen zur Trigonometrie her. Aus
eix = cos x + i sin x
erhalten wir für reelle Zahlen x die Gleichung
|eix |2 = (cos x + i sin x)(cos x − i sin x) = cos2 x + sin2 x = 1 .
Die Zahlen der Form eix liegen also auf der Peripherie des Einheitskreises, und cos x bzw.
sin x sind Real- bzw. Imaginärteil von eix (s. Figur 9)
Abbildung 9: Komplexe Zahlen vom Betrag 1
Es bleibt die später zu beantwortende Frage, ob jede Zahl auf dem Einheitskreis eine
Darstellung der Form eix zulässt, um x endgültig als Bogenmaß auf dem Einheitskreis zu
deuten.
Aus der Eulerschen Formel folgt weiter die Formel
ex+iy = ex eiy = ex (cos y + i sin y) ,
x, y ∈ R,
die man die trigonometrische Darstellung der komplexen Zahlen nennt. Es bleibt
wiederum die Frage, ob sich jede komplexe Zahl z 6= 0 in dieser Form schreiben lässt. Das
ist mit der Frage äquivalent, ob der Wertebereich der komplexen Exponentialfunktion
gleich C \ {0} ist. Der Leser schlage schon einmal bei Satz 6.42 nach!
Aufgaben zu Abschnitt 5.5
1. Man beweise:
a) |ez | ≤ eRe z ≤ e|z| und ez = ez für alle z ∈ C,
b) eix = e−ix für x ∈ R.
2. Man beweise
cos x − cos y = −2 sin
3. Man beweise
sin z =
x+y
x−y
sin
für alle x, y ∈ C.
2
2
eiz − e−iz
,
2i
cos z =
eiz + e−iz
.
2
4. Zeigen Sie, dass die Exponentialfunktion f (z) = ez in C keine Nullstellen hat.
66
6
6.1
6 STETIGKEIT
Stetigkeit
Einführung und Begriff
Die Analyse von Funktionen ist die zentrale Aufgabenstellung der Analysis. Konvergenzuntersuchungen sind hierfür ein wichtiges Hilfsmittel. Von A. Cauchy wurde die grundlegende Bedeutung des Stetigkeitsbegriffes bei der Untersuchung von Funktionen erkannt.
Die weitreichenden Folgerungen aus dieser Eigenschaft sollen in diesem Kapitel dargelegt
werden. In Satz 4.20 haben wir bewiesen, dass jede streng monoton wachsende reelle Funktion f in R mit lückenlosem Wertebereich die folgende Eigenschaft besitzt: Aus xn → x
in D(f ) folgt f (xn ) → f (x) in W (f ). Wir nehmen diese Eigenschaft zum Anlass für die
folgende Definition. Wie bisher sei dabei E = R oder = C.
Definition 6.1 (Die Folgendefinition der Stetigkeit) Eine Funktion f aus E in E
heißt stetig in a ∈ D(f ), wenn für alle Folgen von Elementen xn ∈ D(f ) aus
xn → a stets f (xn ) → f (a)
folgt. Als Kurzformel gilt also
lim f (xn ) = f ( lim xn ).
n→∞
n→∞
Die Funktion f heißt stetig auf D(f ), wenn f in allen Punkten a ∈ D(f ) stetig ist.
Beispiel 6.2 Beispiele stetiger reeller Funktionen ergaben sich bereits in Folgerung 4.21.
Insbesondere sind die Funktionen
f (x) = xα ,
f (x) = ax ,
f (x) = ln x,
α∈R
a>0
auf ihren Definitionsbereichen stetig. Aber auch die Funktionen
f (z) = Re z ,
f (z) = Im z
und f (z) = |z|
sind stetig auf C. Das ergibt sich aus den Ungleichungen
|Re zn − Re a| = |Re (zn − a)| ≤ |zn − a| und |zn | − |a| ≤ |zn − a|.
In vielen theoretischen Untersuchungen ist die folgende Fassung des Stetigkeitsbegriffs
zweckmäßiger.
Satz 6.3 (ε-δ-Definition der Stetigkeit) Eine Funktion f aus E in E ist genau dann
bei a ∈ D(f ) stetig, wenn gilt:
∀ε > 0 ∃δ = δ(ε) > 0 ∀x ∈ D(f ) : |x − a| < δ ⇒ |f (x) − f (a)| < ε.
(s. Abb. 10).
6.1 Einführung und Begriff
67
Abbildung 10: ε-δ-Definition der Stetigkeit
In dieser Fassung bedeutet die Stetigkeit einer Abbildung oder eines Prozesses, dass kleine Ursachen kleine Wirkungen haben. Daher können alle evolutionären Prozesse durch
stetige Abbildungen modelliert werden. Das zeigt die überaus große Anwendungsbreite
des Stetigkeitsbegriffes.
Beweis zu Satz 3. Es sei f bei a ∈ D(f ) stetig. Wäre die im Satz angegebene Bedingung
nicht erfüllt, so gäbe es ein ε0 > 0 derart, dass zu jedem δ > 0 ein x ∈ D(f ) mit
|x − a| < δ und |f (x) − f (a)| ≥ ε0 existieren würde. Wählt man für δ der Reihe nach
die Zahlen δ = 1/n, so erhält man eine Folge zugehöriger xn ∈ D(f ) mit |xn − a| < n1
und |f (xn ) − f (a)| ≥ ε0 . Die erste Bedingung sichert xn → a, die zweite Bedingung
widerspricht dann aber der vorausgesetzten Stetigkeit.
Umgekehrt sei die angegebene ε − δ−Bedingung erfüllt, und es sei (xn ) eine Folge mit
xn ∈ D(f ) und xn → a . Wir haben f (xn ) → f (a) zu zeigen. Zu ε > 0 wählen wir ein
δ = δ(ε) > 0 gemäß obiger Bedingung. Wegen xn → a existiert ein n0 derart, dass für
alle n ≥ n0 die Ungleichung |xn − a| < δ besteht. Nach Voraussetzung folgt für diese n
dann aber auch |f (xn ) − f (a)| < ε, was zu beweisen war.
Viele Zusammensetzungen von Funktionen erhalten die Stetigkeit:
Satz 6.4 Es seien f, g Funktionen aus E in E, es sei a ∈ E.
a) Sind f und g bei a stetig, so auch f ± g und f · g.
b) Sind f bei a und g bei f (a) stetig, so ist (g ◦ f )(x) = g(f (x)) bei a stetig.
Beweis. Die Behauptungen ergeben sich sofort aus der Folgendefinition der Stetigkeit unter
Verwendung der Grenzwertsätze.
Aufgaben zu 6.1
1. Man zeige die Stetigkeit der Funktion f (x) = x2 unter Verwendung des ε-δKriteriums.
2. Ist f stetig auf E, so ist die Menge {x ∈ E : f (x) = 0} abgeschlossen.
68
6 STETIGKEIT
3. Die Dirichlet-Funktion D(x) ist wie folgt definiert: D(x) = 1, falls x rational, und
D(x) = 0, falls x irrational ist. Zeigen Sie, dass die Funktion D in keinem Punkt
x ∈ R stetig ist.
4. Es sei f eine Abbildung von E in E. Man beweise: f ist stetig auf E genau dann,
wenn das volle Urbild f −1 (U ) jeder offenen Teilmenge U ⊆ E offen in E ist.
5. Eine Funktion f : R → R heißt periodisch, wenn es eine Zahl p > 0 mit f (x) =
f (x + p) für alle x ∈ R gibt. Man zeige:
a) Ist f : R → R periodisch, stetig und nicht konstant, so existiert eine kleinste
positive Zahl p mit f (x) = f (x + p) für alle x ∈ R. Diese Zahl p heißt primitive
Periode.
b) Man finde ein Beispiel einer periodischen (nicht stetigen) Funktion, die keine
kleinste positive Periode besitzt.
6.2
Stetigkeit klassischer Funktionen
Satz 6.5 Jede ganzrationale Funktion
P (x) =
n
X
ak x k ,
x∈R,
x∈C
k=0
ist auf R bzw. auf C stetig.
Beweis. Die konstanten Funktionen P0 (x) = a und die lineare Funktion P1 (x) = x sind
offensichtlich überall stetig. Eine beliebige ganzrationale Funktion lässt sich aber durch
endlich viele Produkt– und Summenbildungen aus diesen Funktionen gewinnen und ist
daher nach Satz 6.4 selbst stetig.
Satz 6.6 Die Funktion f (x) =
Punkt a 6= 0 stetig.
1
x
von R \ {0} in sich bzw. von C \ {0} in sich ist in jedem
Beweis. Die Aussage ergibt sich aus dem Grenzwertsatz für Quotienten.
Folgerung 6.7 Jede gebrochen rationale Funktion
n
P
R(x) = k=0
m
P
ak x k
bj x j
j=0
ist auf ihrem Definitionsbereich in R bzw. C stetig.
6.2 Stetigkeit klassischer Funktionen
69
Beweis. Zähler– und Nennerfunktionen sind für sich nach Satz 6.5 auf C stetig, und der
Quotient ist nach Satz 6.6 außerhalb der Nullstellen des Nenners stetig.
Die Stetigkeit vieler klassischer Funktionen kann aus dem Satz 4.20 in Abschnitt 4.2
hergeleitet werden. Wir wiederholen diesen Satz hier in leicht veränderter Formulierung:
Satz 6.8 (Zweiter Hauptsatz über streng monoton wachsende Funktion) Ist f
eine reellwertige, streng monoton wachsende Funktion von dem Intervall [a, b] auf das
Intervall [f (a), f (b)], so ist f auf [a, b] stetig.
Folgerung 6.9 Die reellen Funktionen
chen stetig.
√
n
x, ex und ln x sind auf ihren Definitionsberei-
Satz 6.10 Jede Potenzreihe der Form
f (z) =
∞
X
ak z k
k=0
ist im Innern ihres Konvergenzbereiches stetig.
Beweis. Die Reihen
∞
X
ak z k
und
∞
X
kak z k
k=0
k=0
haben den gleichen Konvergenzradius R, denn es gilt
p
p
p
√
k
lim sup k |kak | = lim k · lim sup k |ak | = lim sup k |ak |.
Sei nun a ∈ C mit |a| < R gegeben. Wir wählen eine Zahl ρ > 0 mit |a| < ρ < R . Dann
ist nach obigem
∞
X
k|ak |ρk = M < ∞ .
k=0
Für alle z ∈ C mit |z| < ρ gilt nun
∞
∞
X
X
|f (z) − f (a)| = ak (z k − ak ) = ak (z − a)(z k−1 + az k−2 + . . . + ak−1 )
k=0
≤ |z − a|
k=1
∞
X
k=1
|ak |kρk−1 = |z − a|
M
.
ρ
Hieraus folgt die Behauptung, denn aus zn → a folgt nun f (zn ) → f (a).
Da eine beliebige Potenzreihe mit Mittelpunkt z0 immer als Zusammensetzung aus einer
Verschiebung h(z) = z − z0 und einer Potenzreihe mit Mittelpunkt 0 aufgefasst werden
kann, folgt aus Satz 6.10, dass jede Potenzreihe im Innern ihres Konvergenzbereiches stetig
ist.
Folgerung 6.11 Die Funktionen ez , sin z und cos z sind auf R und auf C stetig.
70
6.3
6 STETIGKEIT
Stetige Funktionen auf kompakten Intervallen
In diesem Abschnitt sollen weitreichende Folgerungen aus der Stetigkeit abgeleitet werden.
Dabei wird es sich zeigen, dass die Stetigkeit eine hinreichende Bedingung für viele naiv
zu erwartenden Eigenschaften von Funktionen ist. Wir beginnen mit der Betrachtung reellwertiger Funktionen auf abgeschlossenen und beschränkten (= kompakten) Intervallen.
Einige der Sätze (z. B. Satz vom Maximum und Minimuum, Satz über die gleichmäßige
Stetigkeit) gelten aber sogar für reellwertige Funktionen auf beliebigen kompakten Mengen.
Satz 6.12 (Der Nullstellensatz von Bolzano) Ist f eine stetige reellwertige Funktion auf [a, b] mit f (a) · f (b) < 0 , so hat f in [a, b] mindestens eine Nullstelle.
Abbildung 11: Nullstellensatz von Bolzano
Beweis. Der Beweis wird mit dem Halbierungsverfahren geführt: Ohne Beschränkung der
Allgemeinheit können wir f (a) < 0 < f (b) annehmen, andernfalls würden wir die Funktion −f betrachten. Wir setzen a0 = a und b0 = b und konstruieren induktiv eine Intervallschachtelung
(an | bn ) mit f (an ) < 0 ≤ f (bn ) und |an − bn | ≤
b−a
.
2n
Sei also bereits eine Folge von Intervallen [ak , bk ] mit obiger Eigenschaft für 1 ≤ k ≤ n
konstruiert. Wir bilden den Mittelpunkt
cn =
an + b n
2
des n−ten Intervalls. Ist f (cn ) < 0, so setzen wir an+1 = cn und bn+1 = bn , ist aber f (cn ) ≥
0, so setzen wir an+1 = an und bn+1 = cn . Für die so konstruierte Intervallschachtelung
(an | bn ) sei nun
x0 = lim an = lim bn .
Dann folgt aus der Stetigkeit
f (x0 ) = lim f (an ) ≤ 0 ≤ lim f (bn ) = f (x0 ).
Also ist f (x0 ) = 0. Zusätzlich gilt die a–priori–Fehlerabschätzung
|x0 − an | ≤ |bn − an | = |b − a| · 2−n .
6.3 Stetige Funktionen auf kompakten Intervallen
71
Satz 6.13 (Zwischenwertsatz) Ist f eine stetige, reellwertige Funktion auf [a, b], so
existiert zu jeder Zahl c mit f (a) < c < f (b) eine Zahl x0 ∈ (a, b) mit f (x0 ) = c. Jeder
Wert zwischen f (a) und f (b) wird also als Funktionswert angenommen.
Beweis. Die Funktion g(x) = f (x) − c ist ebenfalls stetig auf [a, b], und es ist
g(a) = f (a) − c < 0 < f (b) − c = g(b) .
Daher hat g eine Nullstelle x0 ∈ (a, b) und es folgt
f (x0 ) = g(x0 ) + c = c.
Satz 6.14 (Der Satz vom Maximum und Minimum) Es sei I = [a, b] ein kompaktes Intervall und es sei f : I → R stetig. Dann existieren Zahlen x∗ , x∗∗ ∈ I mit
f (x∗∗ ) ≤ f (x) ≤ f (x∗ ) für alle x ∈ [a, b].
Es gelten also f (x∗∗ ) = min f (x) und f (x∗ ) = max f (x).
x∈I
x∈I
Beweis. Es sei M = sup f (x), wobei der Wert M = ∞ zunächst nicht ausgeschlossen sei.
x∈I
Wir wählen eine Folge (xn ) von Elementen aus [a, b] mit f (xn ) → M . Nach dem Satz von
Bolzano–Weierstrass existiert eine konvergente Teilfolge (xkn ) von (xn ), deren Grenzwert
x∗ = lim xkn zu [a, b] gehört. Da f stetig ist, folgt
f (x∗ ) = lim f (xkn ) = M .
n→∞
Also nimmt die Funktion bei x∗ den Wert M an. Insbesondere ist M endlich. Zur Konstruktion von x∗∗ betrachte man die Funktion g(x) = −f (x). Nach dem bereits Bewiesenen
hat g ein Maximum, etwa bei x∗∗ . Für diese Zahl gilt dann
f (x∗∗ ) = −g(x∗∗ ) ≤ −g(x) = f (x) für alle x ∈ I.
Die Zusammenfassung des Satzes vom Maximum und des Zwischenwertsatzes ergibt:
Satz 6.15 Ist f eine stetige reelle Funktion in R, so ist das Bild jedes kompakten Intervalls I ⊆ D(f ) ein kompaktes Intervall.
Beweis. Es sei I = [a, b] ⊆ D(f ). Wegen des Satzes vom Maximum und Minimum existieren die Zahlen y1 = min f (x) und y2 = max f (x). Also ist f (I) ⊆ [y1 , y2 ]. Wegen des
x∈I
x∈I
Zwischenwertsatzes existiert aber zu jedem c ∈ [y1 , y2 ] ein x ∈ [a, b] mit f (x) = c. Also
gilt f (I) = [y1 , y2 ] .
Definition 6.16 (Gleichmäßige Stetigkeit) Eine Funktion f heißt gleichmäßig stetig
auf einer Menge M ⊆ D(f ), wenn gilt:
∀ε > 0 ∃δ > 0 ∀x, x0 ∈ M : |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε.
72
6 STETIGKEIT
Gleichmäßige Stetigkeit zieht Stetigkeit nach sich, die Umkehrung ist aber im allgemeinen
nicht richtig: Beispielsweise ist die Funktion f (x) = x1 auf dem Intervall (0, 1] zwar stetig,
aber nicht gleichmäßig stetig (s. Aufgabe 1).
Satz 6.17 (Satz über die gleichmäßige Stetigkeit) Ist f auf dem kompakten Intervall I stetig, so ist f auf I sogar gleichmäßig stetig.
Beweis. Wir führen den Beweis indirekt und nehmen an, dass ein ε > 0 derart existiert,
dass zu jedem δn = n1 Elemente xn , x0n ∈ I mit
|xn − x0n | <
1
und |f (xn ) − f (x0n )| ≥ ε
n
existieren. Da I kompakt ist, existiert eine konvergente Teilfolge (xkn ) von (xn ). Es sei
x∗ = lim xkn . Wegen
|x0kn − x∗ | ≤ |x0kn − xkn | + |xkn − x∗ | → 0
gilt auch x∗ = lim x0kn . Das ergibt den Widerspruch
ε ≤ lim |f (xkn )−f (x0kn )| = | lim f (xkn )−lim f (x0kn )| = |f (x∗ )−f (x∗ )| = 0.
Definition 6.18 (Konvergenzarten) Mit C[a, b] bezeichnet man die Menge aller stetigen, reellwertigen Funktionen f : [a, b] → R. Es sei (fn ) eine Folge in C[a, b]. Wir
definieren:
pktw
1. (fn ) heißt punktweise konvergent gegen f auf [a, b] (in Zeichen fn −→ f ), wenn
lim fn (x) = f (x) für alle x ∈ [a, b] gilt.
n→∞
Diese Bedingung ist äquivalent zu:
∀ε > 0 ∀x ∈ [a, b] ∃n0 ∀n : n ≥ n0 ⇒ |fn (x) − f (x)| < ε.
glm
2. (fn ) heißt gleichmäßig konvergent gegen f auf [a, b] (in Zeichen fn −→ f ), wenn
lim max |fn (x) − f (x)| = 0.
n→∞ x∈[a,b]
Diese Bedingung ist äquivalent zu:
∀ε > 0 ∃n0 ∀x ∈ [a, b] ∀n : n ≥ n0 ⇒ |fn (x) − f (x)| < ε.
Satz 6.19 Ist (fn ) eine Folge stetiger Funktionen fn ∈ C[a, b], die auf [a, b] gleichmäßig
gegen f konvergiert, so ist f auch stetig auf [a, b].
6.3 Stetige Funktionen auf kompakten Intervallen
73
Beweis. Es sei z ∈ [a, b] ein fester Punkt. Die Stetigkeit von f bei z ergibt sich nun wie
folgt. Zu ε > 0 wählt man ein n0 so, dass |fn0 (x) − f (x)| < ε für alle x ∈ [a, b] gilt. Da fn
(gleichmäßig) stetig ist, existiert ein δ > 0 mit
|fn0 (x) − fn0 (z)| < ε sofern |x − z| < δ.
Hieraus folgt nun
|f (x) − f (z)| ≤ |f (x) − fn0 (x)| + |fn0 (x) − fn0 (z)| + |fn0 (z) − f (z)| < ε + ε + ε
für alle x mit |x − z| < δ. Somit ist f stetig.
Beachten Sie, dass punktweise Grenzwerte stetiger Funktionen nicht zu stetigen Funktionen führen müssen (s. Aufgabe 2).
Satz 6.20 Es sei ∅ =
6 K beliebige kompakte6 Teilmenge von R oder C. Dann gelten:
a) Jede stetige Funktion f : K → R hat auf K ein Maximum und ein Minimum.
b) Ist f : K → R stetig, so ist f auf K sogar gleichmäßig stetig.
Beweis: Eine Analyse der entsprechenden Beweise für den Fall K = I, I ein kompaktes
Intervall, zeigt, dass dort nur der Bolzano-Weierstrass, also die Kompaktheit als Argument verwendet worden ist. Daher gelten die Beweise auch im Fall beliebiger kompakter
Mengen.
Bemerkung 6.21 Man könnte vermuten, dass ein Zwischenwertsatz auch für stetige
Funktionen f : [a, b] → C gültig wäre. Dem ist aber nicht so: Die Funktion f (t) = eit
ist eine stetige Funktion f : [0, π] → C mit f (0) = 1 und f (π) = cos π = −1, aber die
Gleichung f (t) = 0 hat keine Lösung.
Aufgaben Abschnitt 6.3
1. Man zeige, dass die Funktion f (x) =
1
x
auf (0, 1] nicht gleichmäßig stetig ist.
2. Wir betrachten die Potenzfunktionen fn (x) = xn auf [0, 1]. Zeigen Sie:
0 für 0 ≤ x < 1,
lim fn (x) =
1 für x = 1.
n→∞
Man begründe, warum die Folge (fn ) nicht gleichmäßig konvergiert.
3. Ist f (x) =
∞
P
ck xk eine Potenzreihe mit Konvergenzradius R < ∞, so konvergiert
k=0
die Folge der Polynome
Pn (x) =
n
X
ck xk
k=0
auf jedem kompakten Intervall I ⊂ (−R, R) gleichmäßig gegen f .
4. Bestimmen Sie mit Hilfe des Nullstellensatzes von Bolzano eine Nullstelle des Polynoms f (x) = x5 − x + 1 im Intervall [−2, 2] auf eine Dezimalstelle genau.
6
hat.
Eine Teilmenge M ⊂ R, C heißt kompakt, wenn jede Folge (xn ) ⊆ M einen Häufungspunkt in M
74
6.4
6 STETIGKEIT
Grenzwerte von Funktionen
Wie bisher sei E = R oder E = C. Wir betrachten die reelle Funktion
x3 + 2x2 − x − 2
f (x) =
,
3x − 3
die in allen Punkten x 6= 1 definiert und stetig ist und deren Graph in Abbildung 12
dargestellt ist.
Abbildung 12: Graph mit Lücke
An der Stelle a = 1 ist die Funktion zwar nicht stetig, sie hat aber wenigstens einen
Grenzwert im Sinn der folgenden Definition:
Definition 6.22 (Grenzwert) Es sei f eine Funktion aus E in E, und es sei a ∈ E
ein Häufungspunkt von D(f ). Dann heißt ein Punkt b ∈ E der Grenzwert von f an der
Stelle a, wenn für jede Folge (xn ) ⊆ D(f ) mit xn 6= a für alle n ∈ N aus xn → a auch
f (xn ) → b folgt. Wir schreiben für diesen Sachverhalt auch
lim f (x) = b.
x→a
Durch Vergleich der Definition der Stetigkeit an der Stelle a mit obiger Definition ergibt
sich sofort:
Satz 6.23 Ist a ∈ D(f ) ein Häufungspunkt von D(f ), so ist f genau dann bei a stetig,
wenn f bei a den Grenzwert f (a) hat.
Beispiel 6.24 Für stetige Funktionen bringt die Untersuchung von Grenzwerten in Punkten ihres Definitionsbereiches also keine neue Information über die Funktion. Anders ist es
jedoch mit Punkten, die nicht zum Definitionsbereich gehören. Wir kehren zum einführenden Beispiel zurück. Durch Polynomdivision ergibt sich
x3 + 2x2 − x − 2
lim
= lim
x→1
x→1
3x − 3
1 2
3
x +x+
3
2
=
1
3
17
+1+ = ,
3
2
6
die Funktion f hat also bei a = 1 den Grenzwert 17
. Erweitert man den Definitionsbereich
6
der Funktion f (x) durch die zusätzliche Definition
f (1) = lim f (x) =
x→1
17
,
6
so erhält man eine auf ganz R stetige Funktion. Man sagt dazu, dass die Funktion f stetig
fortgesetzt wurde.
6.4 Grenzwerte von Funktionen
75
Für Funktionen einer reellen Veränderlichen kann man überdies links– und rechtsseitige
Grenzwerte einführen:
Definition 6.25 (Einseitige Grenzwerte) .
a) Wir setzen (linksseitiger Grenzwert)
lim f (x) = lim f (x) = b,
x→a−0
x%a
wenn lim f (xn ) = b für alle Folgen xn % a mit xn ∈ D(f ) und xn 6= a gilt.
n→∞
b) Wir setzen (rechtsseitiger Grenzwert)
lim f (x) = lim = b,
x→a+0
x&a
wenn lim f (xn ) = b für alle Folgen xn & a mit xn ∈ D(f ) und xn 6= a gilt.
n→∞
1
x&0 x
Beispielsweise sind lim
1
x→0+0 x
= lim
1
x%0 x
= + ∞ und lim
1
x→0−0 x
= lim
= − ∞.
Mit Hilfe von Grenzwerten lassen sich die Unstetigkeitspunkte einer Funktion klassifizieren:
Definition 6.26 (Unstetigkeitspunkte) Es sei f eine Funktion aus R in R, es sei
a 6∈ D(f ) und es gäbe ein ε > 0 so, dass die punktierte ε-Umgebung Uε0 (a) zu D(f )
gehört. Dann hat f bei a
(i) eine Lücke, wenn lim f (x) existiert und endlich ist.
x→a
(ii) einen Sprung, wenn lim f (x) und lim f (x) existieren, endlich und verschieden sind.
x%a
x&a
(iii) einen Pol, wenn lim f (x) und lim f (x) existieren und ±∞ sind.
x%a
x&a
(iv) eine wesentliche Singularität in den verbleibenden Fällen.
Lücken waren uns bereits im einführenden Beispiel begegnet. Hat f eine Lücke bei a, so
lässt sich f durch den Ansatz f (a) = lim f (x) in den Punkt a hinein stetig fortsetzen.
x→a
x
Dagegen hat die Funktion f (x) = |x|
bei a = 0 einen Sprung von −1 zu +1, sie ist nicht
stetig fortsetzbar in den Punkt a = 0.
Die Funktion f (x) =
1
x
hat bei a = 0 einen Pol.
Schließlich ist f (x) = sin x1 ein Beispiel für eine Funktion, die bei a = 0 eine wesentliche
Singularität hat. Ihr Graph ist in Abb. 13 dargestellt.
Aufgaben zu Abschnitt 6.4
76
6 STETIGKEIT
Abbildung 13: f (x) = sin x1
1. Man berechne lim e−x und lim e−x .
x→∞
x→−∞
2. Man berechne
x2 −4
,
x→2 x−2
a) lim xn e−x ,
x2 −1
,
x%2 x−2
b) lim
x→∞
c) lim
1
2.
x→∞ 1+x
d) lim
3. Unter Verwendung der Potenzreihendarstellung der auftretenden Funktionen berechne man:
sin x − 1
cos x − 1
ex − 1
,
b) lim
,
c) lim
.
a) lim
x→0
x→0
x→0
x
x
x2
6.5
Ganzrationale und gebrochen rationale Funktionen
Die bisher entwickelten Techniken sind geeignet, einen umfassenden Einblick in die ganzrationalen und rationalen Funktionen zu gewinnen. Wir beginnen mit der Untersuchung
des Verhaltens im Unendlichen.
Satz 6.27 Es sei f (x) =
n
P
aj xj eine ganzrationale Funktion mit an 6= 0 und n ≥ 1.
j=0
Dann gilt
lim |f (x)| = ∞.
x→∞
Beweis. Es ist
f (x) = an x
n
an−1
a0 1+
+ ... + n .
x
x
Der zweite Faktor strebt für |x| → ∞ gegen 1, der erste Faktor strebt im Betrag gegen
Unendlich.
Satz 6.28 (Prinzip des Koeffizientenvergleichs) Sind zwei ganzrationale Funktionen wertverlaufsgleich, so stimmen sie in allen Koeffizienten überein.
6.5 Ganzrationale und gebrochen rationale Funktionen
77
Beweis. Es genügt zu zeigen, dass für jede ganzrationale Funktion
g(x) =
n
X
aj x j
j=0
aus g(x) = 0 für alle x ∈ R die Bedingung a0 = . . . = an = 0 folgt. Wegen 0 = g(0) = a0
ist a0 = 0. Wäre nun an > 0 für n ≥ 1, so hätte man lim g(x) = ∞ nach Satz 6.27 im
x→∞
Widerspruch zu g(x) = 0 für alle x ∈ R.
Definition 6.29 Für eine ganzrationale Funktion f (x) =
n
P
aj xj 6≡ 0 heißt die Zahl
j=0
Grad(f ) = max{j : aj 6= 0} der Grad von f . Ferner setzen wir Grad(0) = −∞.
Von grundsätzlicher Bedeutung ist die Frage nach der Existenz und Anzahl von Nullstellen
ganzrationaler Funktionen. Wir wollen beweisen, dass jede ganzrationale Funktion vom
Grad n ≥ 1 auch n (evtl. komplexe) Nullstellen hat. Dazu ist es zuerst nötig, den Begriff
der Vielfachheit einer Nullstelle einzuführen.
Satz 6.30 Eine Zahl x0 ∈ C ist genau dann eine Nullstelle der ganzrationalen Funktion
f (x), wenn eine Zerlegung
f (x) = (x − x0 ) · g(x)
mit einer geeigneten ganzrationalen Funktion g(x) möglich ist.
Beweis. Hat man eine derartige Zerlegung, so ist f (x0 ) = 0 · g(x0 ) = 0. Sei umgekehrt
f (x0 ) = 0. Die Polynomdivision f (x) : (x − x0 ) ergibt eine Zerlegung f (x) = (x − x0 ) ·
g(x) + q mit einer Zahl q. Aus f (x0 ) = 0 folgt dann aber q = 0.
Hat man eine Zerlegung f (x) = (x − x0 )g(x) gegeben, so könnte es sein, dass x0 auch
noch eine Nullstelle von g(x) ist. Dann lässt sich der Faktor (x − x0 ) nochmals abspalten,
es gilt dann also f (x) = (x − x0 )2 · g1 (x) mit einer neuen ganzrationalen Funktion g1 . Das
legt folgende Definition nahe:
Definition 6.31 Unter der Vielfachheit einer Nullstelle x0 einer ganzrationalen Funktion
f (x) versteht man die größte natürliche Zahl m, für die eine Zerlegung
f (x) = (x − x0 )m · g(x)
möglich ist. Insbesondere ist g(x0 ) 6= 0.
Folgerung 6.32 Für jede ganzrationale Funktion f ist die Summe der Vielfachheiten
ihrer Nullstellen nicht grösser als der Grad von f . Insbesondere hat f höchstens so viele
Nullstellen, wie der Grad von f angibt.
78
6 STETIGKEIT
Beweis. Es seien x0 , . . . , xk die Nullstellen von f mit den Vielfachheiten m0 , . . . , mk . Dann
existiert eine Zerlegung
f (x) = (x − x0 )m0 · . . . · (x − xk )mk g(x)
mit einer geeigneten ganzrationalen Funktion g(x). Ein Gradvergleich ergibt
Gradf = m0 + . . . + mk + Grad g ≥ m0 + . . . + mk ,
womit die Behauptung bewiesen ist.
Ein seit Vieta (1540–1603) bis zur berühmten Dissertation von C.F. Gauss im Jahr
1799 offenes Problem war die Frage, ob jede ganzrationale Funktion f vom Grad f = n ≥ 1
auch mindestens eine Nullstelle (und damit n–Nullstellen) hat. Wir werden diesen Satz
jetzt beweisen. Dazu beginnen wir mit dem Spezialfall:
Satz. Jede (sog. reine) Gleichung xn = a mit n ≥ 1 hat mindestens eine Lösung in C.
Beweis. Wir beweisen diesen Satz unter der Voraussetzung, dass die Zahl a eine Darstellung der Form
a = r eiϕ , r > 0 , ϕ ∈ R ,
besitzt. (In Satz 6.42 werden wir zeigen, dass eine solche Darstellung immer möglich ist.)
Für solche Zahlen a ist die Zahl
√
x = n r eiϕ/n
wegen xn = r(eiϕ/n )n = r eiϕ = a eine gesuchte Lösung von xn = a.
Satz 6.33 (Fundamentalsatz der klassischen Algebra) (Gauss 1799)
a) Jede ganzrationale Funktion f vom Grad(f ) ≥ 1 hat mindestens eine Nullstelle in C.
b) Jede ganzrationale Funktion f vom Grad(f ) ≥ 1 lässt sich in C in Linearfaktoren
f (x) = an (x − x1 )m1 · . . . · (x − xk )mk
zerlegen. Dabei ist m1 + . . . + mk = n.
Beweis. Es genügt, die Aussage a) zu beweisen. Die Zerlegung von f in das angegebene
Produkt ergibt sich dann durch wiederholte Anwendung von Satz 6.30. Die Idee zum
Beweis von a) besteht darin nachzuweisen, dass die Funktion |f (x)| ein Minimum hat und
dass dieses Minimum = 0 ist.
Wir zeigen als Erstes die Existenz des Minimums. Nach Satz 6.27 existiert eine Zahl K > 0
derart, dass
|f (x)| ≥ |f (0)| für alle |x| ≥ K
gilt. Auf der kompakten Menge {x : |x| ≤ K} hat die stetige Funktion |f | nach Satz 6.14
aber ein Minimum, etwa bei x0 . Wegen |f (x0 )| ≤ |f (0)| gilt dann aber sogar
|f (x0 )| = min |f (x)|.
x∈C
Wir wollen f (x0 ) = 0 zeigen und nehmen dazu das Gegenteil f (x0 ) 6= 0 an.
6.5 Ganzrationale und gebrochen rationale Funktionen
79
Die ganzrationale Funktion
r(x) =
f (x0 + x)
f (x0 + x) − f (x0 )
=
−1
f (x0 )
f (x0 )
hat offenbar bei x = 0 eine Nullstelle. Daher existiert eine Zerlegung
f (x0 + x)
− 1 = r(x) = xp g(x) mit g(0) 6= 0 und p ≥ 1.
f (x0 )
Somit ist
f (x0 + x)
g(x)
= 1 + xp
für alle x ∈ C.
f (x0 )
f (x0 )
Da |f | bei x0 ein Minimum hat, folgt
f (x0 ) 2
f (x0 + x) 2
p
p
2
p
≤ 1 = f (x0 ) = |1 + x g(x)| = (1 + x q(x))(1 + x q(x))
f (x0 ) = 1 + 2 Re (xp g(x)) + |xp g(x)|2 ,
also
0 ≤ 2 Re (xp g(x)) + |xp g(x)|2 für alle x ∈ C.
Ersetzt man x durch xj , so folgt nach Multiplikation mit j p
0 ≤ 2 Re
2
x x
1 p
xg
+ p x g
,
j
j
j p
und der Grenzübergang j → ∞ ergibt schließlich
0 ≤ Re (xp g(0)) für alle x ∈ C.
(∗)
Wir wählen nun eine Lösung z von z p = i. Mit x = z 0 , z 1 , z 2 , z 3 ergibt sich xp =
1, i, −1, −i, und aus (∗) folgt der Reihe nach
0
0
0
0
≤
≤
≤
≤
Re g(0)
Re (ig(0))
= −Im q(0)
Re (−g(0)) = −Re q(0)
Re (−ig(0)) = +Im q(0).
Hieraus folgt Re g(0) = Im g(0) = 0, also ist g(0) = 0 im Widerspruch zur Konstruktion
von g.
Das Verhalten gebrochen rationaler Funktionen in den Unstetigkeitspunkten und bei
Grenzübergang x → ±∞ ist in folgendem Satz zusammengefasst. Der Beweis ist offensichtlich.
Satz. Es sei
f (x) =
P (x)
Q(x)
80
6 STETIGKEIT
eine gebrochen rationale Funktion. Durch Division mit Rest kann sie in die Form
f (x) = H(x) +
p(x)
q(x)
mit ganzrationalen Funktionen H(x), p(x) und q(x), Grad p(x) < Grad q(x) und maximal gekürzten Quotienten p(x)/q(x) gebracht werden. Dann gelten
a) lim |f (x) − H(x)| = 0, die Funktion f verhält sich für x → ±∞ wie H.
x→±∞
p(x) = ∞ für q(x0 ) = 0, die Funktion f hat bei x0 einen Pol.
b) lim |f (x)| = lim x→x0
x→x0 q(x) Aufgaben zu Abschnitt 6.5
1. Man bestimme die drei Lösungen der Gleichungen z 3 = 1 und z 3 = i.
2. Unter Verwendung von Satz 6.33 beweise man die reelle Version des Fundamentalsatzes der klassischen Algebra:
Jede ganzrationale Funktion f mit reellen Koeffizienten besitzt in R eine Zerlegung
in lineare und quadratische Faktoren der Form
f (x) = an (x − x1 )l1 · . . . · (x − xr )lr · ((x − α1 )2 + β12 )k1 · . . . · ((x − αp )2 + βp2 )kp .
Dabei ist n = Grad(f ) = l1 + . . . + lr + 2k1 + . . . + 2kp .
3. Es sei f (x) eine ganzrationale Funktion vom Grad n ≥ 1. Zeigen Sie (im Vorgriff auf
gängige Differentiationsregeln): Eine Zahl x0 ist genau dann eine zweifache Nullstelle
von f , wenn f (x0 ) = f 0 (x0 ) = 0 und f 00 (x0 ) 6= 0. Charakterisieren Sie entsprechend
die m-fachen Nullstellen.
6.6
Sinus, Kosinus und Logarithmus in R und C
Wir untersuchen nun den Verlauf der in Definition 5.37 durch Potenzreihen definierten
trigonometrischen Funktionen sin x und cos x im Reellen. Wir wissen bereits aus Satz
6.10, dass beide Funktionen auf R stetig sind. Einen ersten Einblick in den Kurvenverlauf
gibt der folgende Satz:
Abbildung 14: Einschließung der sin-Funktion
6.6 Sinus, Kosinus und Logarithmus in R und C
81
Satz 6.34 Für alle x ∈ R mit 0 < x ≤ 2 gilt
0<x−
x3
< sin x < x.
3!
Beweis. Es ist
sin x =
∞
X
k=0
(−1)k
(s. Abb 14)
x2k+1
,
(2k + 1)!
und wir zeigen, dass für alle 0 < x ≤ 2 das Leibnizkriterium anwendbar ist. In der Tat
gilt für x2 < 6 die Ungleichung x2 ≤ (2k + 2)(2k + 3), woraus offenbar
2k+3 2k+1 x
x
≤
(2k + 3)! (2k + 1)! 2k+1 x
& 0, und hieraus ergibt sich wie für alle Reihen vom Leibniz–
folgt. Also gilt (2k + 1)! Typ die Ungleichung
s1 = x −
x3
< sin x < s0 = x.
3!
sin x
= 1.
x→0 x
Satz 6.35 lim
Beweis. Aus Satz 6.34 folgt für alle 0 < x ≤ 2 die Ungleichung
sin x
x2
<
< 1,
3!
x
die offenbar auch für alle x mit −2 ≤ x < 0 gilt. Der Grenzübergang x → 0 liefert die
Behauptung nach dem Vergleichskriterium.
0<1−
Satz 6.36 Es gibt genau eine Zahl 1 ≤ ω < 2 mit cos ω = 0. Wir definieren π = 2ω.
Bemerkung. Die auf diese Weise definierte Zahl π wird sich später als identisch mit der für
Kreisberechnungen wichtigen Konstanten π=Kreisumfang/Kreisdurchmesser erweisen.
Beweis. Existenz: Wir betrachten die stetige Funktion f (x) = cos(x) im Intervall [0, 2].
Es ist cos 0 = 1 > 0, und aus den Additionstheoremen und Satz 6.34 folgt
1 2
2
1
cos 2 = 1 − 2 sin2 1 ≤ 1 − 2 1 −
≤ 1 − 2 + = − < 0.
3!
3
3
Daher ergibt sich aus dem Satz von Bolzano die Existenz einer Nullstelle ω ∈ (0, 2).
Zum Nachweis der Einzigkeit zeigen wir zunächst, dass im Intervall (0, 1) keine Nullstelle
existieren kann. In der Tat gilt für 0 ≤ x < 1 wegen Satz 6.34 die Abschätzung
cos2 x = 1 − sin2 x > 1 − x2 > 0.
Seien nun 1 ≤ x < x0 < 2 mit cos x = cos x0 = 0 gegeben. Dann ist 0 < x0 − x < 1, woraus
wegen Satz 6.34 sicherlich sin(x0 − x) > 0 folgt. Das widerspricht der Gleichung
sin(x0 − x) = sin x0 cos x − cos x0 sin x = 0.
Daher kann im Intervall [1, 2) nur eine Nullstelle x von cos x existieren.
82
6 STETIGKEIT
Satz 6.37 Für 0 < x < π gilt sin x > 0.
Beweis. Es ist sin x = 2 sin x2 cos x2 , und wegen Satz 6.34 und Satz 6.36 sind sin x2 > 0 und
cos x2 > 0.
Satz 6.38 Für alle x ∈ R gelten
a) cos(x + π2 ) = − sin x, sin(x + π2 ) = cos x,
b) cos(x + 2π) = cos x,
sin(x + 2π) = sin x.
Beweis. Es ist sin2 π2 = 1 − cos2 π2 = 1 − 0 = 1. Hieraus folgt | sin π2 | = 1. Wegen Satz 6.37
ist dann sogar sin π2 = 1. Daher ergibt das Additionstheorem
cos(x + π2 )
sin(x + π2 )
= cos x · cos π2
= sin x · cos π2
sin x sin π2
cos x sin π2
–
+
=
=
0 –
0 +
sin x,
cos x.
Aus a) folgt nun
cos(x + π) = cos (x + π2 ) +
π
2
= − sin(x + π2 ) = − cos x.
Also ist cos(x + 2π) = − cos(x + π) = cos x.
Satz 6.39 Die Funktion f (x) = cos x ist auf dem Intervall [0, π] streng monoton fallend,
die Funktion f (x) = sin x ist auf [− π2 , π2 ] streng monoton wachsend.
Beweis. Es sei 0 ≤ x < x0 ≤ π. Mit a =
den Additionstheoremen
x0 +x
2
und b =
x0 −x
2
> 0 folgt aus Satz 6.37 und
cos x − cos x0 = cos(a − b) − cos(a + b)
= cos a cos b + sin a sin b − cos a cos b + sin a sin b
= 2 sin a sin b > 0.
Aus Satz 6.38a) folgt dann die entsprechende Behauptung für die Funktion sin x.
Definition 6.40 Die Funktionen cos x und sin x besitzen auf [0 , π] bzw. auf [− π2 , π2 ]
streng monotone Umkehrfunktionen, die als Arcus–Funktionen bezeichnet werden: Für
−1 ≤ x ≤ 1 ist
arcsin x
arccos x
=
=
t ⇔
t ⇔
sin t = x
cos t = x
und
und
− π2 ≤ t ≤ π2
0 ≤ t ≤ π.
In Abbildung 15 sind diese Funktionen graphisch dargestellt. Schliesslich definiert man
wie üblich die Tangensfunktion durch
tan x =
sin x
cos x
für x 6=
π
+ kπ
2
(k ∈ Z)
Wir untersuchen nun die Exponentialfunktion im Komplexen. Überraschenderweise
stellt sich in imaginärer Richtung eine Periodizität von der Periodenlänge 2πi ein:
6.6 Sinus, Kosinus und Logarithmus in R und C
83
Abbildung 15: arcsin- und arccos- Funktion
Satz 6.41 Es gilt ez1 = ez2 genau dann, wenn z1 − z2 = 2kπi für ein k ∈ Z ist. Insbesondere gilt e2kπi = 1.
Beweis. Die Gleichungen ez1 = ez2 und ez1 −z2 = 1 sind äquivalent. Es sei also
ez = ea+bi = ea ebi = 1 mit a, b ∈ R.
Dann folgt ea = |ea ebi | = 1, was nur für a = 0 möglich ist. Hieraus ergibt sich
1 = ebi = cos b + i sin b,
also cos b = 1, was genau für b = 2kπ mit k ∈ Z gilt.
In Abbildung 16 ist der Realteil der Funktion f (z) = ez dargestellt, die Periodizität der
Exponentialfunktion wird hieraus deutlich.
Abbildung 16: Realteil der Funktion ez = ex+iy
Wir können nun auch die früher behauptete Existenz der trigonometrischen Darstellung komplexer Zahlen beweisen:
Satz 6.42 Jede komplexe Zahl z 6= 0 lässt sich in eindeutiger Weise in der Form
z = reiϕ = r(cos ϕ + i sin ϕ) mit r > 0 und − π < ϕ ≤ π
darstellen. Dabei ist r = |z| der Betrag von z, und die Zahl ϕ heißt das Argument von z.
Man schreibt ϕ = Argz.
84
6 STETIGKEIT
Beweis. Es sei z = a + bi gegeben. Wir setzen


arccos Re z
für Im z ≥ 0


|z|
√
r = a2 + b2 = |z| und ϕ =


 − arccos Re z für Im z < 0.
|z|
Man rechnet nun nach, dass z = reiϕ gilt: Im Fall Im z ≥ 0, also für 0 ≤ ϕ ≤ π, gelten
Re z
und
|z|
p
1p 2
|Im z|
Im z
0 ≤ sin ϕ =
1 − cos2 ϕ =
|z| − |Re z|2 =
=
.
|z|
|z|
|z|
cos ϕ =
Daher ist
reiϕ = r(cos ϕ + i sin ϕ) = Re z + i Im z = z.
Entsprechend wird der Fall Im z < 0, also −π < ϕ < 0, behandelt. Die Einzigkeit der
Darstellung ist eine Folgerung aus Satz 6.41.
Beispiel 6.43 Als Beispiel betrachten wir die Zahl z =
√
3 + i. Es ist
√
√
3
π
r = 3 + 1 = 2 und ϕ = arccos
= .
2
6
Das ergibt
π
z = 2 ei 6 .
Satz 6.44 (Die Moivreschen Formeln) Sind zj = rj eiϕj für j = 1, 2, so gelten
a) z1 · z2 = r1 r2 ei(ϕ1 +ϕ2 ) ,
b) z1n
n
= r1n eiϕ1 .
c) Die Lösungen der Gleichung z n = 1 sind genau die Zahlen zk = ei
2πk
n
, 0 ≤ k < n.
Beweis. Die Aussagen folgen aus den Potenzgesetzen für die Exponentialfunktion.
Folgerung 6.45 Die Gleichung z n = a mit a = r eiα 6= 0 hat genau die n verschiedenen
Lösungen
√
α
2π
zk = n r ei( n + n k) ; k = 0, . . . , n − 1.
Satz 6.46 (Die komplexe Logarithmusfunktion) Die Funktion f (z) = ez bildet den
Streifen
S = {a + bi : − π < b ≤ π, a ∈ R}
eineindeutig auf die punktierte komplexe Ebene C \ {0} ab. Die Umkehrfunktion ist durch
die Formel
Lnz = ln |z| + i Argz ; z ∈ C \ {0},
gegeben, und sie heißt (Hauptwert) der komplexen Logarithmusfunktion. Für z > 0 ist
Lnz = ln z.
6.6 Sinus, Kosinus und Logarithmus in R und C
85
Abbildung 17: Der Wertebereich von Ln(w)
Beweis. Die Eineindeutigkeit von f (z) = ez auf S folgt sofort aus Satz 6.41. Weiter gelten
für 0 6= z ∈ C mit ϕ = Argz die Gleichungen
eLnz = eln |z|+iϕ = eln |z| eiϕ = |z| eiϕ = z,
Ln ez = Ln ea+bi = Ln(ea ebi ) = ln ea + ib = a + ib = z.
Beispiel 6.47 Wegen Arg(−1) = π und Arg(i) =
π
2
gelten
Ln(−1) = ln | − 1| + iπ = iπ,
Ln i
= ln |i| + i π2
= i π2 ,
Ln 2i
= ln 2 + i π2 .
Aufgaben zu Abschnitt 6.6
1. Man zeige ez 6= 0 für alle z ∈ C. (Hinweis: Eulersche Formel)
2. Man zeige
a) Die Funktion f (z) = sin z hat in C genau die Nullstellen
z = kπ, k ∈ Z.
(Hinweis: Man benutze die Formel sin z = (eiz − e−iz )/2i.)
b) Die Funktion f (z) = cos z hat in C genau die Nullstellen
z = π2 + kπ, k ∈ Z.
3. Man beweise Ln(z1 z2 ) = (Ln z1 + Ln z2 ) mod (2πi) für 0 6= z1 , z2 ∈ C.
4. Definiert man az = ez·Lna für 0 6= a ∈ C, so erhält man auch Exponentialfunktionen
mit komplexer Basis. Man berechne ii , iπ , (−1)π .
5. Man beweise die Grenzwertformel aus Satz 6.35 in unter Verwendung der Folgendefinition der Zahl e (s. Satz 4.25).
6. a) Geben Sie alle Lösungen der Gleichung z 7 −1 = 0 in C an und stellen Sie die Zahlen in der komplexen Zahlenebene dar. (Hinweis: Benutzen Sie die trigonometrische
Darstellung.)
b) Ebenso für z 7 − i = 0.
86
6 STETIGKEIT
7. Es sei z = 0.75+0.5i. Stellen Sie die Folgenglieder {z 1 , z 2 , . . . , z 10 } in der komplexen
Ebene dar. (Hinweis: Benutzen Sie die de’Morganschen Formeln.)
8. Geben Sie die folgenden Zahlen in kartesischer Darstellung an:
a) Ln(3 + i), b) sin(1 + i), c) (1 + i)2+i ,
d) ie .
87
7
7.1
Differentialrechnung
Differenzierbarkeit und Differentiationsregeln
Obwohl die Grundzüge der Differentialrechnung zu großen Teilen in Reellen und Komplexen gemeinsam entwickelt werden können, beschränken wir uns hier im Wesentlichen
auf die reelle Theorie. Der interessierte Leser prüfe die folgenden Definitionen und Sätze
selbständig auf ihre Übertragbarkeit und Gültigkeit im Komplexen.
Definition 7.1 Es sei f eine Funktion aus R in sich und sei a ein innerer Punkt von
D(f ). Die Funktion f heißt differenzierbar bei a, wenn der Grenzwert des Differenzenquotienten
f (x) − f (a)
lim
x→a
x−a
existiert und endlich ist. Im Fall der Existenz heißt diese Zahl der Differentialquotient
oder die Ableitung f 0 (a) von f bei a.
Die Bedeutung der Differenzierbarkeit liegt in der hiermit verbundenen Linearisierbarkeit
”
im Kleinen“, die in geometrischer Fassung die Existenz der Tangente bedeutet (s. Abb.
18). Das ist der Inhalt der sogenannten Weierstraßschen Zerlegungsformel:
Satz 7.2 (Weierstraßsche Zerlegungsformel) Die Funktion f ist genau dann bei a
differenzierbar, wenn es eine Zahl m und eine Funktion ρ(a, x) in einer Umgebung von a
so gibt, dass
f (x) = f (a) + m(x − a) + ρ(x, a)(x − a) und lim ρ(x, a) = 0
x→a
gelten. Dabei ist dann m = f 0 (a).
Beweis. Setzt man ρ(a, x) =
lim
x→a
f (x) − f (a)
= m. ist.
x−a
f (x) − f (a)
− m, so gilt lim ρ(x, a) = 0 genau dann, wenn
x→a
x−a
Die Funktion h(x) = f (a) + m(x − a), die als Teilsumme in der Zerlegungsformel auftritt, hat geometrisch die Bedeutung der Tangente im Punkt (a, f (a)). In Abbildung 30.1
ist die Zerlegung grafisch dargestellt. Die Weierstraßsche Zerlegungsformel liefert lineare
Näherungen für eine Vielzahl von Funktionen. Als Kostprobe dafür notieren wir
sin x ≈ x,
√
1
1 + x ≈ 1 + x.
2
Eine Fehlerabschätzung, die diese Näherungen erst verwendbar macht, wird sich in Satz
7.30 ergeben.
Definition 7.3 Eine Funktion f aus R in R heißt differenzierbar auf einer offenen Teilmenge M ⊆ D(f ), wenn f in jedem Punkt von M differenzierbar ist.
88
7 DIFFERENTIALRECHNUNG
Abbildung 18: Differenzenquotient und Linearisierung
df
df
bezeichnet. Die Symbolik
geht
dx
dx
0
dabei auf Leibniz zurück, die Symbolik f (x) stammt von Newton (s. 7.8).
Die Ableitungsfunktion wird auch durch f 0 (x) =
Satz 7.4 Ist f in a differenzierbar, so ist f dort auch stetig.
Beweis. Die Weierstrasssche Zerlegungsformel ergibt
|f (x) − f (a)| ≤ |x − a| · |m + ρ(x, a)| → 0 für x → a.
Die Umkehrung gilt nicht, z.B. ist die Funktion f (x) = |x| auf ganz R stetig, aber an
der Stelle a = 0 offenbar nicht differenzierbar. Es gibt aber auch stetige Funktionen,
die in keinem Punkt ihres Definitionsbereiches differenzierbar sind (s. Aufgabe 2). Ohne
auf Details einzugehen sei bemerkt, dass die Brownsche Bewegung eines Teilchens oder
der zeitliche Verlauf eines Aktienkurses auch gute Modelle für nirgends differenzierbare
Funktionen sind (Warum?). Das zeigt, dass solche seltsamen Funktionen in der Praxis
durchaus auftreten und sogar von einiger Bedeutung sind.
Die einseitige Differenzierbarkeit ist eine Abschwächung des Differenzierbarkeitsbegriffes. Eine Funktion f heißt bei einem inneren Punkt a des Definitionsbereiches linksseitig differenzierbar, wenn der linksseitige Grenzwert
f (x) − f (a)
x%a
x−a
lim
existiert. Die Funktion f (x) = |x| hat bei a = 0 eine links– und eine rechtsseitige
Ableitung, die aber beide voneinander verschieden sind.
Wir leiten nun wichtige Differentiationsregeln her, mittels derer eine algorithmische Berechnung von Ableitungen möglich sein wird.
Satz 7.5 (Differentiationsregeln) Sind die Funktionen f und g in einem inneren
Punkt a von D(f ) ∩ D(g) differenzierbar, so sind auch skalare Vielfache, Summe, Differenz, Produkt und im Fall g(a) 6= 0 auch der Quotient der Funktionen f und g bei a
differenzierbar, und es gelten die Formeln:
7.1 Differenzierbarkeit und Differentiationsregeln
a)
(λf )0 (a)
b)
(f ± g)0 (a) =
(f · g)0 (a)
0
f
d)
g (a)
c)
=
89
λf( a),
f 0 (a) ± g 0 (a),
=
f (a)g 0 (a) + f 0 (a)g(a),
=
f 0 (a)g(a) − f (a)g 0 (a)
.
g(a)2
Beweis. Die Aussagen ergeben sich folgendermaßen aus den Grenzwertsätzen:
λf (x) − λf (a)
f (x) − f (a)
=λ
→ λf 0 (a),
x−a
x−a
f (x) − f (a) g(x) − g(a)
f (x) ± g(x) − (f (a) ± g(a))
=
±
→ f 0 (a) ± g 0 (a),
b)
x−a
x−a
x−a
f (x)g(x) − f (a)g(a)
g(x) − g(a) f (x) − f (a)
c)
= f (x)
+
g(a) → f (a)g 0 (a) + f 0 (a)g(a),
x−a
x−a
x−a
f (x)/g(x) − f (a)/g(a)
f (x)g(a) − f (a)g(x)
d)
=
=
x−a
(x − a)g(x)g(a)
1
f (x)g(a)−f (a)g(a)
f (a)g(x)−f (a)g(a)
1
=
−
→
(f 0 (a)g(a) − f (a)g 0 (a)).
x−a
x−a
g(x)g(a)
2
g(a)
a)
Wir betrachten jetzt Superpositionen von Funktionen.
Satz 7.6 (Die Kettenregel) Ist a ein innerer Punkt von D(g), ist g(a) ein innerer
Punkt von D(f ) und sind g bei a und f bei g(a) differenzierbar, so ist auch F = f ◦ g bei
a differenzierbar, und es gilt
(f ◦ g)0 (a) = f 0 (g(a)) · g 0 (a).
Beweis. Aus der Weierstraßschen Zerlegungsformel für f folgt
f (g(x)) − f (g(a)) = [f 0 (g(a)) + ρf (g(x), g(a))] · (g(x) − g(a)),
und für g folgt
g(x) − g(a) = [g 0 (a) + ρg (x, a)] · (x − a).
Einsetzen und Division durch (x − a) ergibt
f (g(x)) − f (g(a))
= [f 0 (g(a)) + ρf (g(x), g(a))] · [g 0 (a) + ρg (x, a)] → f 0 (g(a)) · g 0 (a)
x−a
und für x → a.
Unter Verwendung der Leibniz-Symbolik nimmt die Kettenregel die Form einer
Kürzungsregel“ an: Sind nämlich f und g differenzierbar und ist z = f (g(x)) und
”
y = g(x), so folgt
dz
dz dy
=
· .
dx
dy dx
90
7 DIFFERENTIALRECHNUNG
Satz 7.7 (Ableitung der Umkehrfunktion) Die reelle Funktion f sei auf der offenen Teilmenge M ⊆ R stetig und habe die Umkehrfunktion g, die an der Stelle f (a)
differenzierbar mit g 0 (f (a)) 6= 0 sei. Dann ist auch f bei a differenzierbar und es gilt
f 0 (a) =
1
g 0 (f (a))
.
Beweis. Aus Id = g ◦ f und der Zerlegungsformel für g folgt
x − a = g(f (x)) − g(f (a)) = g 0 (f (a))(f (x) − f (a)) + ρg (f (x), f (a))(f (x) − f (a)).
Die Division durch x − a und der Grenzübergang x → a ergibt nun
1=
f (x) − f (a) 0
(g (f (a)) + ρg (f (x), f (a))) → f 0 (a)g 0 (f (a)),
x−a
also 1 = f 0 (a)g 0 (f (a)). Hieraus folgt die Behauptung.
7.8 (Historische Bemerkungen) Die Differential-Integralrechnung wurde unabhängig voneinander aber gleichzeitig von Gottfried Wilhelm Leibniz und Isaac
Newton gegen Ende des 17. Jh. entwickelt. Für Leibniz stand im Zentrum des
Interesses die differentielle Abhängigkeit eine Größe y von einer anderen Größe x. Das
führte auf die Untersuchung der Differentialquotienten
∆y
dy
= lim
.
∆x→0
dx
∆x
Philosophisch wurde der Umgang mit den Differentialen von Leibniz durch seine Monadenlehre begründet. Newton benutzte die Differentialrechnung vor allem zur Beschreibung der zeitlichen Änderung physikalischer Größen. Er nannte diese zeitlichen Änderungen Fluxionen der Größen x = x(t) bzw. y = y(t), und er bezeichnete sie durch
∆x
∆t→0 ∆t
ẋ(t) = lim
Ableitungen von y und x traten bei Newton als Quotienten y 0 = ẏ/ẋ der Fluxionen auf.
dy
Wegen (7’) und (8) lässt sich dx
in der Tat als Quotient ẏ/ẋ schreiben:
dy
dy dt
dy 1
ẏ
=
·
=
·
= .
dx
dx
dt dx
dt
ẋ
dt
Das zeigt die Äquivalenz beider Begriffsapparate.
Definition 7.9 (Höhere Ableitungen) Eine Funktion f heißt auf einer offenen Menge
M zweimal differenzierbar, falls f 0 auf M existiert und selbst noch einmal differenzierbar
ist. Die Funktion f 00 = (f 0 )0 heißt dann die zweite Ableitung von f . Entsprechend wird
die k-te Ableitung im Fall der Existenz durch f (k) = (f k−1 )0 , k ≥ 1, definiert. Dabei setzt
man noch f (0) = f .
7.2 Differentiation elementarer Funktionen
91
Abbildung 19: Takagi-Funktion g
Aufgaben zu Abschnitt 7.1
1. Man berechne die Ableitung der Funktion f (x) = x2 an Hand der Definition. Man
bestimme die Gleichung der Tangente an die Funktion f (x) = x3 + 1 im Punkt
(2, f (2)).
2. (Takagi-Funktion) Es sei f : R → [0, 1] die 1-periodische Sägezahnfunktion, die
auf dem Intervall [0, 1] durch f (x) = 2x für 0 ≤ x ≤ 0.5 und f (x) = 2 − 2x für
0.5 ≤ x ≤ 1 definiert ist.
f (2k x)
für k ∈ N sind immer feinere Abbilder von f . Zeigen
Die Funktionen fk (x) =
2k
Sie
∞
P
fk (x) ist auf R gleichmäßig konvergent. (Daher
a) Die Funktionenreihe g(x) =
k=0
ist g stetig auf R. Die Funktion g heißt Takagi7 -Funktion, s. Abb. 19)
b) Zeigen Sie, dass g in keinem Punkt x ∈ R differenzierbar ist.
c) Zeigen Sie, dass g auf dem Intervall [0, 1] ebenso viele Maxima hat, wie es reelle
Zahlen gibt.
7.2
Differentiation elementarer Funktionen
In diesem Abschnitt leiten wir Differentiationsregeln für die uns interessierenden Funktionen her. Wir beginnen mit der Betrachtung von Polynomen.
Satz 7.10 Die Ableitung der Funktion fn (x) = xn ist fn0 (x) = n xn−1 für alle n ∈ N.
Beweis. Wir beweisen die Aussage induktiv. Für n = 0 ist f0 (x) ≡ 1. Daher ist f00 ≡ 0.
0
Für n > 0 ergibt sich induktiv aus der Produktregel fn+1
(x) = (xn+1 )0 = (x xn )0 =
1 · xn + nxxn−1 = (1 + n)xn .
Folgerung 7.11 Für P (x) =
n
P
l=0
7
Teiji Takagi 1875-1969, Tokio
an xk ist P 0 (x) =
n
P
k=1
kak xk−1 .
92
7 DIFFERENTIALRECHNUNG
Beweis. Die Formel folgt aus der Summenregel und aus Satz 7.10.
Satz 7.12 (Differentiation von Potenzreihen) Ist f (x) =
∞
X
an xk eine Potenzreihe
h=0
mit einem Konvergenzradius R > 0, so gilt
0
f (x) =
∞
X
kak xk−1
k=1
im Innern des Konvergenzkreises, und die Konvergenzradien beider Reihen sind gleich.
(Bemerkung: Satz und Beweis sind ebenso für komplexe Potenzreihen richtig.)
Beweis. Wir setzen g(x) =
∞
P
kak xk−1 und h(x) =
p
k
|k ak | = lim
k|ak |xk−1 . Wegen
k=1
k=1
lim sup
∞
P
√
k
k · lim sup
p
k
|ak | = lim sup
p
k
|ak | = R−1
sind die Konvergenzradius von g und h ebenfalls gleich R. Wir berechnen nun die Ableitung von f an einer beliebigen Stelle a mit |a| < R. Dazu zerlegen wir
X
X
f (x) = fN (x) + ϕN (x) =
ak x k +
ak x k ,
k≤N
g(x) = gN (x) + γN (x) =
X
k≤N
h(x) = hN (x) + ηN (x) =
X
k≤N
k>N
kak xk−1 +
X
kak xk−1 und
k>N
k|ak |xk−1 +
X
k|ak |xk−1 .
k>N
Nun sei a mit |a| < R beliebig gegeben. Wir wählen eine Zahl r mit |a| < r < R. Wegen
X
ϕN (x) − ϕN (a) X xk − ak
=
ak
=
ak (xk−1 + axk−2 + . . . + ak−1 )
x−a
x
−
a
k>N
k>N
ist
ϕN (x) − ϕN (a) X
≤
|ak | krk−1 = ηN (r) für alle |x| < r.
x−a
k>N
Für den Differenzenquotienten von f bei a gilt dann
f (x) − f (a)
fN (x) − fN (a)
ϕN (x) − ϕN (a) + |γN (a)|
− g(a) ≤ − gN (a) + x−a
x−a
x−a
fN (x) − fN (a)
≤ − gN (a) + 2|ηN (r)|.
x−a
Für gegebenes ε > 0 wählt man nun eine Zahl N so, dass |ηN (r)| < ε ist. Wegen fN0 (a) =
gN (a) nach Folgerung 7.11 existiert eine Zahl δ ≤ r − |a| so, dass
fN (x) − fN (a)
− gN (a) < ε für |x − a| < δ
x−a
7.2 Differentiation elementarer Funktionen
93
ausfällt. Daher gilt für alle |x − a| < δ die Abschätzung
f (x) − f (a)
≤ 3 ε.
−
g(a)
x−a
Das zeigt die Existenz des Grenzwertes und auch die Gleichung f 0 (a) = g(a).
Der Satz 7.12 ist speziell anwendbar auf die Potenzreihendarstellung der Funktionen
ex , sin x und cos x (s. Aufgabe 2). Wir berechnen die Ableitungen dieser Funktionen aber
auch auf die folgende, alternative Weise.
Satz 7.13 Für alle x ∈ R gilt (ex )0 = ex .
Beweis. Es ist
ex − ea
et − 1
ex−a − 1
= lim ea
= ea lim
= ea .
x→a x − a
x→a
t→0
x−a
t
lim
Satz 7.14 Für alle x > 0 gilt (ln x)0 = x1 .
Beweis. Die Funktion f (x) = ln x hat die Umkehrfunktion g(y) = ey mit g 0 (y) = ey . Die
Formel für die Differentiation der Umkehrkfunktion ergibt dann
f 0 (x) =
1
g 0 (f (x))
=
1
ef (x)
=
1
eln x
=
1
.
x
Folgerung 7.15 Für alle x > 0 und α 6= 0 gilt (xα )0 = α xα−1 .
Beweis. Es ist xα = eα ln x , und die Kettenregel ergibt
(xα )0 = (eα ln x )0 = eα ln x · α ·
1
= α xα−1 .
x
Satz 7.16 Für alle x ∈ R gelten (sin x)0 = cos x, (cos x)0 = − sin x.
Beweis. Mit a = x +
h
2
und b =
h
2
ergibt sich aus den Additionstheoremen die Gleichung
h
h
sin(x + h) − sin x = sin(a + b) − sin(a − b) = 2 cos a · sin b = 2 cos x +
sin .
2
2
Für h → 0 folgt nach Satz 6.35 hieraus
sin(x + h) − sin x
h
sin(h/2)
= cos x +
·
→ cos x.
h
2
h/2
Also ist (sin x)0 = cos x. Schließlich gilt
π 0
π
0
(cos x) = sin(x + ) = cos(x + ) = − sin x.
2
2
94
7 DIFFERENTIALRECHNUNG
Satz 7.17 Für alle − π2 < x <
π
2
gilt (tan x)0 = 1 + tan2 x =
Beweis. Die Aussage folgt aus tan x =
sin x
cos x
1
2
cos x
.
und der Quotientenregel.
Satz 7.18 Für alle −1 < x < 1 gelten (arcsin x)0 =
√ 1
1−x2
1
und (arccos x)0 = − √1−x
2.
Beweis. Die Umkehrfunktion zu f (x) = arcsin x ist g(y) = sin y. Daher ist
f 0 (a) =
1
g 0 (f (a))
=
1
1
1
=p
=p
2
cos(arcsin x)
1 − sin (arcsin x)
1 − sin2 x
wegen cos(arcsin x) > 0 für −1 < x < 1.
Bemerkung 7.19 Zur Berechnung von Ableitungen ist manchmal die Formel der sogenannten logarithmischen Differentiation nützlich:
Mit f (x) = ln g(x) gilt f 0 (x) =
· g 0 (x) nach der Kettenregel. Hieraus folgt
1
g(x)
g 0 (x) = g(x) · f 0 (x)
als Formel für die Ableitung von g.
Aufgaben zu Abschnitt 7.2
1. Man berechne die Ableitungen folgender Funktionen:
√
a) f (x) = x + 1, b) f (x) = sin(2 x2 + 1), c) f (x) = x2 e2x , d) f (x) = xx .
2. Berechnen Sie die Ableitungen der Funktionen
ex , sin x und cos x durch Differentiation der Potenzreihendarstellungen dieser Funktionen.
3. Fügen Sie durch geeignete Wahl der Parameer a, b die Funktionen f (x) =
e2x für x ≥ 0 und g(x) = x2 + ax + b für x < 0 so zusammen, dass eine auf ganz R
differenzierbare Funktion h(x) entsteht.
4. Prüfen Sie, ob die Funktion f (x) = x2 · sgnx auf R differenzierbar ist und berechnen
Sie ggf. die Ableitung. (Graphische Darstellung von f und f 0 ?)
5. Zeigen Sie, dass die Ableitung der Funktion f (x) = x2 sin x1 für x 6= 0 und f (0) = 0
überall existiert, dass aber f 0 aber nicht überall stetig ist.
6. Die Funktionen
Jn (x) =
∞
X
(−1)k ( x )2k+n
2
k=0
(n + k)! k!
, n ∈ N,
heißen Bessel-Funktionen erster Art. Zeigen Sie 2Jn0 = Jn−1 − Jn+1 .
7.3 Mittelwertsätze der Differentialrechnung
7.3
95
Mittelwertsätze der Differentialrechnung
Die sogenannten Mittelwertsätze der Differentialrechnung spielen eine zentrale Rolle bei
allen Aussagen, bei denen aus Eigenschaften der Ableitung einer Funktion auf die Funktion
selbst zurückgeschlossen werden soll. Grob gesagt erlauben sie es, Funktionswertdifferenzen durch Ableitungen auszudrücken.
Satz 7.20 (Satz von Michel Rolle (1690–1719)) Ist f stetig auf [a, b], differenzierbar auf (a, b) und gilt f (a) = f (b) = 0, so existiert mindestens ein Punkt ξ ∈ (a, b) mit
f 0 (ξ) = 0.
Beweis. Da f als differenzierbare Funktion auch auf [a, b] stetig ist, existieren wegen des
Satzes vom Minimum und Maximum zwei Zahlen x1 , x2 ∈ [a, b] mit f (x1 ) ≤ f (x) ≤ f (x2 )
für alle x ∈ [a, b]. Insbesondere ist f (x2 ) ≥ f (a) = 0. Gilt dabei sogar f (x2 ) > 0, so ist
sicher x2 ∈ (a, b). Daher existiert f 0 (x2 ). Wegen
f (x2 + h) − f (x2 )
≤ 0 für h > 0,
≥ 0 für h < 0
h
gilt dann aber
f (x2 + h) − f (x2 )
= 0,
h→0
h
und ξ = x2 genügt der Behauptung des Satzes. Im Fall f (x2 ) = 0 betrachten wir den
Minimumpunkt x1 . Gilt auch f (x1 ) = 0, so ist f ≡ 0 auf [a, b] und daher auch f 0 (x) = 0
für alle x ∈ (a, b). Ist aber f (x1 ) < 0, so betrachten wir die Funktion g(x) = −f (x), die
bei x1 ein Maximum g(x1 ) = −f (x1 ) > 0 hat. Daher gilt nach dem bereits diskutierten
Fall 0 = g 0 (x1 ) = −f 0 (x1 ), und ξ = x1 ist eine gesuchte Nullstelle von f 0 .
f 0 (x2 ) = lim
Als Verallgemeinerung ergibt sich der
Satz 7.21 (Mittelwertsatz der Differentialrechnung) Ist f auf [a, b] stetig und auf
(a, b) differenzierbar, so existiert ein Punkt a < ξ < b mit
f 0 (ξ) =
f (b) − f (a)
.
b−a
Jeder Differenzenquotient ist also als Ableitung realisierbar.
Beweis. Die Gerade durch die Punkte P1 = (a, f (a)) und P2 = (b, f (b)) ist durch die
Gleichung
g(x) =
f (b) − f (a)
f (b) − f (a)
(x − a) + f (a) mit der Ableitung g 0 (x) =
b−a
b−a
gegeben. Die Differenzfunktion h(x) = f (x) − g(x) erfüllt wegen h(a) = f (a) − g(a) = 0
und h(b) = f (b) − g(b) = 0 die Voraussetzungen des Satzes von Rolle. Daher existiert ein
ξ ∈ (a, b) mit 0 = h0 (ξ) = f 0 (ξ) − g 0 (ξ). Also ist
f 0 (ξ) = g 0 (ξ) =
f (b) − f (a)
.
b−a
96
7 DIFFERENTIALRECHNUNG
Abbildung 20: Der Mittelwertsatz der Differentialrechnung
Satz 7.22 (2. Version des Mittelwertsatzes) Es sei h > 0 und f sei auf dem Intervall [a − h, a + h] stetig und auf (a − h, a + h) differenzierbar. Dann existiert eine von a
und h abhängige Zahl 0 < θ < 1 derart, dass
f (a + h) = f (a) + h f 0 (a + θ h).
Beweis. Wir setzen F (t) = f (a + th). Dann ist F auf [0, 1] stetig und auf (0, 1) differenzierbar. Nach dem Mittelwertsatz, Satz 7.21, existiert daher eine Zahl 0 < θ < 1 mit
F 0 (θ) =
F (1) − F (0)
= f (a + h) − f (a).
1
Da wegen der Kettenregel die Gleichung F 0 (θ) = h · f 0 (a + θ h) gilt, folgt hieraus die
Behauptung.
Als erste globale Konsequenz ergibt sich:
Folgerung 7.23 Gilt f 0 (x) = 0 für alle x ∈ (a, b), so ist f ≡ const auf (a, b).
Beweis. Es seien a < x1 < x2 < b beliebig gegeben. Wegen Satz 7.21 existiert eine Zahl ξ
mit x1 ⊂ ξ < x2 und
f (x2 ) − f (x1 )
= f 0 (ξ).
x2 − x1
Da aber f 0 (ξ) = 0 nach Voraussetzung gilt, ergibt sich f (x1 ) = f (x2 ). Auf (a, b) sind also
alle Funktionswerte von f untereinander gleich.
Satz 7.24 Gilt f 0 (x) = g 0 (x) für zwei differenzierbare Funktionen f und g auf einem
Intervall (a, b), so unterscheiden sich f und g nur durch eine Konstante.
Beweis. Die Differenzfunktion h(x) = f (x) − g(x) erfüllt die Voraussetzungen von Satz
7.23 und ist daher konstant.
Satz 7.25 (Verallgemeinerter Mittelwertsatz) Es seien f und g auf [a, b] stetig, auf
(a, b) differenzierbar und es sei g 0 (x) 6= 0 auf (a, b). Dann existiert eine Zahl ξ ∈ (a, b)
mit
f (b) − f (a)
f 0 (ξ)
= 0 .
g(b) − g(a)
g (ξ)
7.3 Mittelwertsätze der Differentialrechnung
97
Beweis. Wäre g(a) = g(b), so gäbe es nach dem Mittelwertsatz eine Zahl x ∈ (a, b) mit
g 0 (x) = 0. Daher ist g(a) 6= g(b). Wir setzen p(x) = f (x) − λ g(x) mit
λ=
f (b) − f (a)
.
g(b) − g(a)
Dann ist offenbar p(a) = p(b). Nach dem Mittelwertsatz existiert daher ein a < ξ < b mit
p0 (ξ) = 0. Also ist 0 = f 0 (ξ) − λ g 0 (ξ), und hieraus folgt die Behauptung des Satzes.
Satz 7.26 (Die Regel von Bernoulli–de l’Hospital) Es seien f und g zwei in einer
Umgebung von x0 differenzierbare Funktionen mit f (x0 ) = g(x0 ) = 0. Existiert dann der
rechts stehende Limes, so existiert auch der andere und es gilt
lim
x→x0
f (x)
f 0 (x)
= lim 0
.
g(x) x→x0 g (x)
Beweis. Nach dem verallgemeinerten Mittelwertsatz existiert zu x und x0 ein ξx zwischen
x und x0 mit
f (x) − g(x0 )
f 0 (ξx )
f (x)
=
= 0
.
g(x)
g(x) − g(x0 )
g (ξx )
Da mit x → x0 auch ξx → x0 gilt, folgt aus der Existenz des rechts stehenden Limes auch
die Existenz des links stehenden Limes und die gewünschte Gleichheit.
Die Regel von Bernoulli–de l’Hospital ist sehr leistungsstark. Wir demonstrieren sie
an einigen Beispielen. Manchmal ist es dabei sinnvoll, die Regel wiederholt anzuwenden.
Überdies kann die Regel auch auf einseitige Grenzwerte und durch die Transformation
x → 1/x auch auf Grenzwerte mit x → ∞ übertragen werden.
a)
b)
c)
x
lim sin
x
=
lim cos x2− 1
x
=
2
lim xx
x→∞ e
=
x→0
x→0
x
lim cos
1
=
sin x
lim − 2x
=
lim 2x
ex
=
x→0
x→0
x→∞
1.
x
lim − cos
2
= − 21 .
lim 2x
e
=
x→0
x→∞
0.
Aufgaben zu Abschnitt 7.3
1. Zeigen Sie: Gilt f 0 (x) ≥ 0 auf einem Intervall (a, b), so ist f auf diesem Intervall
monoton wachsend.
2. Man beweise: Ist eine Funktion f auf [0, 1] stetig und auf (0, 1) differenzierbar, gilt
ferner f (0) = 0 und gibt es eine Konstante K ≥ 0 mit
|f 0 (x)| ≤ K|f (x)| für alle x ∈ (0, 1),
so ist f auf dem Intervall [0, 1] identisch Null.
98
7 DIFFERENTIALRECHNUNG
3. Man berechne die Limites
a)
7.4
lim ln x , b)
x→∞ x
√
lim x ln x, c)
lim
x→1
x&0
1 − x2
, d)
2x
1
1
−
.
x→0 sin x
x + x2
lim
Der Satz von Taylor
Wir stellen uns die Aufgabe, eine gegebene Funktion f in einer geeigneten Umgebung
U (x0 ) eines Punktes x0 durch Polynome Pn zu approximieren. Die Polynome sind dabei
zweckmäßiger Weise in folgender Form gegeben:
Pn (x) =
n
X
ak (x − x0 )k
k=0
Wir suchen also eine Zerlegung
f (x) = Pn (x) + Rn+1 (x0 , x)
mit einer Fehlerfunktion Rn+1 = Rn+1 (x0 , x), die für x → x0 möglichst schnell“ gegen
”
Null streben sollte. Diese Situation ist auf jeden Fall für solche Funktionen
f (x) =
∞
X
ak (x − x0 )k
k=0
gegeben, die durch Potenzreihen erzeugt werden, wenn man für die Polynome Pn einfach
die Partialsummen
n
X
ak (x − x0 )k
Pn (x) =
k=0
wählt. Wir stellen nun die Frage, wie die Koeffizienten ak durch die Funktion f ausgedrückt werden können.
Satz 7.27 Gilt f (x) =
∞
P
ak (x − x0 )k in U (x0 ), so ist ak =
k=0
ak =
f (k) (x0 )
,
k!
f (k) (x0 )
, k ∈ N.
k!
k ∈ N.
Beweis. Potenzreihen können gliedweise differenziert werden. Daher ist
f
(n)
(x) =
∞
X
k=n
ak
k!
(x − x0 )k−n ,
(k − n)!
und hieraus folgt f (n) (x0 ) = an · n!. Das ergibt die Behauptung.
Satz 7.28 (Identitätssatz für Potenzreihen, Prinzip des Koeffizientenvergleichs)
∞
∞
X
X
Aus
ak (x − x0 )k =
bk (x − x0 )k für alle x ∈ U (x0 ) folgt ak = bk für alle k ∈ N.
k=0
k=0
7.4 Der Satz von Taylor
99
Beweis. Definiert man eine Funktion f durch die obigen wertverlaufsgleichen Potenzreif (k) (x0 )
= bk .
hen, so folgt aus Satz 7.27 die Gleichung ak =
k!
Die soeben gefundenen Einsichten legen die folgenden Begriffsbildungen nahe:
Definition 7.29 (Taylorformel) Es sei f eine beliebige Funktion, die in einer Umgebung U (x0 ) n-mal differenzierbar ist.
Unter den Taylor-Koeffizienten von f bei x0 versteht man die Zahlen
ak =
f (k) (x0 )
für 0 ≤ k ≤ n.
k!
Unter dem Taylor-Polynom zu f vom Grad n an der Stelle x0 versteht man das Polynom
n
X
f (k) (x0 )
f 0 (x0 )
f (n) (x0 )
(x − x0 )k = f (x0 ) +
(x − x0 ) + . . . +
(x − x0 )n .
Pn (x) =
k!
1!
n!
k=0
Unter dem Restglied der Ordnung n + 1 versteht man den Ausdruck
Rn+1 (x0 , x) = f (x) − Pn (x).
Unter der Taylorformel versteht man schließlich die Formel
n
X
f (k) (x0 )
f (x) = Pn (x) + Rn+1 (x0 , x) =
(x − x0 )k + Rn+1 (x0 , x),
k!
k=0
Das Hauptproblem besteht nun in einer Fehlerabschätzung für das Restglied Rn+1 , denn
erst dann ist die Taylorformel zur Approximation zu gebrauchen. Dies ist der Inhalt des
folgenden Satzes:
Satz 7.30 (Satz von Taylor) Die Funktion f sei in U (x0 ) (n + 1)–mal stetig differenzierbar. Dann lässt sich das Restglied Rn+1 (x0 , x) für jedes x ∈ U (x0 ) wie folgt durch die
(n + 1)–te Ableitung von f ausdrücken:
Rn+1 (x0 , x) =
f (n+1) (x0 + ϑL (x − x0 ))
(x − x0 )n+1 für ein 0 < ϑL < 1
(n + 1)!
(Restglied nach Lagrange),
bzw.
Rn+1 (x0 , x) =
f (n+1) (x0 + ϑC (x − x0 ))
(x − x0 )n+1 (1 − ϑC )n für ein 0 < ϑC < 1
n!
(Restglied nach Cauchy).
100
7 DIFFERENTIALRECHNUNG
Beweis. Es sei 1 ≤ k ≤ n + 1. Es sei x ∈ U (x0 ) mit x > x0 fixiert. Wir wollen den
Quotienten Rn+1 (x0 , x)/(x − x0 )k untersuchen und definieren hierzu für t ∈ [x0 , x] die
Funktionen
n
X
f (k) (t)
(x − t)k
F (t) = Rn+1 (t, x) = f (x) −
k!
k=0
und
Gk (t) = (x − t)k .
Für die Randpunkte t = x0 bzw. t = x folgt dann
F (x0 )
Gk (x0 )
= Rn+1 (x0 , x) ,
= (x − x0 )k
,
F (x)
Gk (x)
= 0,
= 0.
Zur Anwendung des verallgemeinerten Mittelwertsatzes berechnen wir vorbereitend die
Ableitungen von F und G nach t. Es sind
F 0 (t) = −
n
n
X
X
f (k+1) (t)
f (k) (t)
f (n+1) (t)
(x − t)k +
(x − t)k−1 = −
(x − t)n ,
k!
(k
−
1)!
n!
k=0
k=1
G0k (t) = −k(x − t)k−1 .
Nach dem verallgemeinerten Mittelwertsatz gibt es dann eine Zahl ξk ∈ (x0 , x) mit
F (x0 ) − F (x)
F 0 (ξk )
f (n+1) (ξk )(x − ξk )n
f (n+1) (ξk )
Rn+1 (x0 , x)
=
=
=
=
(x − ξk )n+1−k .
(x − x0 )k
G(x0 ) − G(x)
G0 (ξk )
k · n!(x − ξk )k−1
k · n!
Setzt man
ϑk =
ξk − x0
,
x − x0
so ist ξk = x0 + ϑk (x − x0 ) und x − ξk = (x − x0 )(1 − ϑk ). Die Auflösung obiger Formel
nach Rn+1 ergibt
Rn+1 (x0 , x) =
=
f (n+1) (ξk )
· (x − x0 )k · (x − ξk )n+1−k
k · n!
f (n+1) (x0 + ϑk (x − x0 ))
(x − x0 )n+1 (1 − ϑk )n+1−k .
k · n!
Für k = n + 1 folgt hieraus die Lagrange–Darstellung, für k = 1 die Cauchy–Darstellung
für das Restglied Rn+1 .
Für den häufig auftretenden Spezialfall x0 = 0 ergibt der Satz von Taylor die Darstellung
f (x) =
n
X
f (k) (0) k f (n+1) (ϑ x) n+1
x +
x ,
k!
(n
+
1)!
k=0
die man auch als MacLaurin-Formel bezeichnet.
7.4 Der Satz von Taylor
101
Beispiel 7.31 Wir betrachten das Beispiel f (x) = (1 + x)α für x > −1 und α > 0. Für
α = n ∈ N ergibt sich aus der binomischen Formel die Darstellung
n
f (x) = (1 + x) =
n X
n
k=0
k
xk .
Für α 6∈ N ist eine Verallgemeinerung dieser Formel zu erwarten. Wir berechnen die
Taylorkoeffizienten an der Stelle x0 = 0:
f (x) = (1 + x)α
f 0 (x) = α(1 + x)α−1
..
.
(k)
f (x) = α · (α − 1) · . . . · (α − k + 1) (1 + x)α−k .
Somit ist
f (k) (0)
α · . . . · (α − k + 1)
ak =
=
=
k!
k!
α
.
k
Mit Cauchys Darstellung des Restgliedes folgt
n X
α k
α
(1 + x) =
x +
(1 + ϑ x)α−n−1 (n + 1)xn+1 (1 − ϑ)n .
k
n
+
1
k=0
α
Für α =
1
2
und n = 1 ergibt sich die einfache Näherungsformel
√
1+x≈1+
1
x.
2
Die Fehlerfunktion
1
R2 (0, x) =
kann für |x| <
1
2
2
2
(1 + ϑ x)−3/2 · 2 · x2 (1 − ϑ)
dann durch
|R2 (0, x)| ≤
1
· 23/2 · 2 · x2 ≤ x2
4·2
abgeschätzt werden. Also ist
√
1 + x − 1 + 1 x ≤ |x|2 für |x| < 1 .
2
2
Beispielsweise ist
p
1, 1 = 1, 05 ± 0, 01.
Dieses Verfahren ist auf zahlreiche weitere Funktionen anwendbar. Dabei ergibt sich die
Tabelle:
102
7 DIFFERENTIALRECHNUNG
Funktion Näherung Fehlerordnung
1
1+x
1−x
|x|2
sin x
x
|x|3
cos x
1
|x|2
sin x
x−
x3
6
|x|5
cos x
1−
x2
2
|x|4
x−1
|x|2
ln(1 + x)
Aufgaben zu Abschnitt 7.4
1. Geben Sie die Taylorformel für die Funktion f (x) = sin(x) bei Entwicklung an der
Stelle x0 = 0 bis zur Ordnung 2k + 1 an.
2. Geben Sie die Taylorformel für die Funktion f (x) = ln(1 + x) bei Entwicklung an
der Stelle x0 = 0 bis zur Ordnung k an.
7.5
Taylorreihen und analytische Funktionen
Wir untersuchen in diesem Abschnitt die Darstellung von Funktionen als Potenzreihen.
Definition 7.32 (Analytische Funktionen) Eine Funktion f heißt analytisch im
Punkt x0 ∈ D(f ), wenn es eine Umgebung U (x0 ) von x0 und eine auf U (x0 ) konvergente Potenzreihe so gibt, dass
f (x) =
∞
X
ak (x − x0 )k für alle x ∈ U (x0 )
k=0
gilt.
Ist f in einer Umgebung U (x0 ) beliebig (= unendlich) oft differenzierbar, so kann man
die Taylorreihe zu f
∞
X
f (k) (x0 )
T (x) =
(x − x0 )k
k!
k=0
bilden. Dabei ist weder die Konvergenz der Reihe noch die Wertverlaufsgleichheit zu f (x)
für Punkte x 6= x0 ohne zusätzliche Voraussetzungen gesichert. Ein Gegenbeispiel ist in
Aufgabe 4 angegeben.
7.5 Taylorreihen und analytische Funktionen
103
Satz 7.33 (Hauptsatz über analytische Funktionen) Folgende Bedingungen sind
äquivalent:
(a) f ist analytisch bei x0 ∈ D(f ).
(b) Es existiert eine Umgebung U (x0 ), auf der f mit seiner Taylorreihe übereinstimmt.
(c) Es existiert eine Umgebung U (x0 ) von x0 , in der f beliebig oft differenzierbar ist
und auf der
lim Rn (x0 , x) = 0 für alle x ∈ U (x0 )
n→∞
gilt. Dabei bezeichnet Rn (x0 , x) das Restglied der Ordnung n bei der Entwicklung
von f bei x0 .
(d) Es existiert eine Umgebung U (x0 ) von x0 und eine Zahl K > 0 so, dass f auf U (x0 )
beliebig oft differenzierbar ist und die folgende Abschätzung erfüllt
|f (k) | ≤ k! · K k für alle x ∈ U (x0 ) und alle k ∈ N.
Beweis. Wegen Satz 7.28 und Definition 7.29 sind die Beziehungen (a), (b) und (c) äquivalent. Es gelte nun (a), es sei also
f (x) =
∞
X
ak (x − x0 )k für x ∈ U (x0 ).
k=0
Der Konvergenzradius der Reihe sei R > 0. Dann ist sicherlich
p
1
lim sup k |ak | =
< ∞.
R
Daher existiert eine Zahl K0 < ∞ mit
|ak | ≤ K0k
Weiter ist
f
(n)
(x) =
∞
X
für alle
k ∈ N.
k(k − 1) · . . . · (k − n + 1)ak (x − x0 )k−n .
k=n
Wir wählen nun eine Zahl 0 < r < R mit q = r K0 < 1. Für |x − x0 | < r folgt dann
|f
(n)
(x)| ≤
∞
X
k · . . . · (k − n + 1) ·
K0k
k−n
·r
n
=
K0n
k=n
=
K0n
k · . . . · (k − n + 1) q k−n
k=n
n
= K0n
∞
X
d
d qn
∞
X
k=0
!
qk
= K0n
d
d qn
1
1−q
n!
K0n
·
≤ n!
= n! K n mit K = K0 /(1 − q)2 .
n+1
2n
(1 − q)
(1 − q)
Das beweist (d). Umgekehrt ergibt die Bedingung (d) die folgende Abschätzung für das
Restglied
(n)
f (x0 + ϑ(x − x0 ))
n
(x − x0 ) ≤ K n · |x − x0 |n = (K|x − x0 |)n → 0
Rn (x0 , x) = n!
für |x − x0 | <
1
.
K
Also gilt (c).
104
7 DIFFERENTIALRECHNUNG
Beispiel 7.34 Wir betrachten einige Beispiele und werden dabei Reihendarstellungen
für wichtige klassische Funktionen erhalten. Bereits bekannt sind die folgenden Reihendarstellungen, die wegen Satz 7.28 die einzig möglichen Darstellungen sind. Insbesondere
stimmen die Koeffizienten in diesen Reihen mit den Taylorkoeffizienten überein.
∞
P
xk
,
x∈R.
(4.1) ex
=
k!
(4.2)
(4.3)
sin x
cos x
=
=
k=0
∞
P
k=0
∞
P
(−1)k
x2k+1
,
(2k+1)!
x ∈ R.
(−1)k
x2k
,
(2k)!
x ∈ R.
k=0
Wir erhalten aber auch die folgenden bisher nicht bekannten Darstellungen:
∞
k
P
α
(4.4) (1 + x)α =
x ,
−1 < x < 1, α ∈ R (Binomialreihe)
k
(4.5)
(4.6)
ln(1 + x)
arctan x
=
=
k=0
∞
P
k=1
∞
P
k=0
(−1)k−1
k
xk ,
(−1)k x2k+1
,
2k+1
−1 < x ≤ 1
−1 < x ≤ 1.
Beweis zu (4.4): Wir benutzen die in Beispiel 7.31 hergeleitete Restgliedformel
α
Rn+1 (0, x) =
(n + 1)xn+1 · (1 + ϑ x)α−n−1 (1 − ϑ)n .
n+1
α
Wir setzen an+1 = n+1
(n + 1) und bn+1 = (1 + ϑ x)α−n−1 (1 − ϑ)n . Dann ist
1 − ϑ n
|1 + ϑ x|α−1 ≤ |1 + ϑ x|α−1
|bn+1 | = 1 + ϑ x
für alle x ∈ (−1, 1). Daher ist die Folge (bn ) beschränkt. Um an+1 xn+1 →
→∞
P 0 für nn+1
und alle |x| < 1 zu zeigen, weisen wir sogar die Konvergenz der Reihe
an+1 x
für
|x| < 1 nach. Dazu berechnen wir den Konvergenzradius. Es ist
α(α − 1) · . . . · (α − n) · n! · (n + 1) α − n an+1 an = (n + 1)!α(α − 1) · . . . · (α − n + 1) · n = n → 1.
Also ist der Konvergenzradius 1. Hieraus folgt an+1 xn+1 → 0 für |x| < 1, und damit ist
Rn+1 (0, x) → 0 bewiesen.
Beweis zu (4.5): Eine Möglichkeit würde ähnlich wie bei (4.4) in der Untersuchung des
Restgliedes bestehen. Wir gehen aber auf eine andere Weise vor. Dazu betrachten wir die
beiden Funktionen
∞
X
(−1)k−1 k
f (x) = ln(1 + x) und g(x) =
x .
k
k=1
Der Konvergenzradius der Reihe ist offensichtlich R = 1. Daher gilt
!0
∞
∞
k−1
X
X
(−1)
1
g 0 (x) =
xk =
(−1)k xk =
k
1+x
k=1
k=0
7.5 Taylorreihen und analytische Funktionen
105
1
für alle −1 < x < 1. Andererseits ist f 0 (x) = 1+x
. Das zeigt f 0 (x) = g 0 (x) auf (−1, 1).
Wegen Satz 7.24 ist dann f (x) = g(x)+ const auf (−1, 1). Für x = 0 ergibt sich 0 =
ln 1 = f (0) = g(0) + const = 0 + const, also ist const = 0. Das zeigt f = g auf (−1, 1).
Beweis zu (4.6): Wir gehen wie in (4.5) vor. Es gilt
∞
X
1
(arctan x) =
=
(−1)k x2k =
2
1+x
k=0
0
∞
X
(−1)k x2k+1
2k + 1
k=0
!0
für alle x mit |x| < 1. Daraus folgt
arctan x =
∞
X
(−1)k x2k+1
+ c,
2k
+
1
k=0
und für x = 0 ergibt sich c = 0.
P
Satz 7.35 (Abelscher Grenzwertsatz) Ist f (x) =
ak xk konvergent auf (−R, R)
∞
X
P
und konvergiert auch noch
ak Rk , so gilt lim f (x) =
ak R k .
x%R
k=0
Wir verzichten auf den Beweis dieses Satzes, wollen ihn aber auf die Reihen (4.5) und
(4.6) anwenden. (Einen vollständigen Beweis findet der Leser in Mangoldt–Knopp,
Höhere Mathematik Bd. 2 oder in Heuser, Lehrbuch der Analysis, Bd. 1.) Für x = 1
ist auf beide Reihen das Leibnizkriterium anwendbar, womit die Konvergenz gegeben ist.
Hieraus folgen die interessanten Formeln
ln 2 =
und
∞
∞
X
1 1 1
(−1)k−1 X (−1)k
=
=1− + − + −
k
k+1
2 3 4
k=0
k=1
∞
π X (−1)k
1 1 1
=
= 1 − + − + −...,
4
2k + 1
3 5 7
k=0
denn es ist arctan 1 = π4 , was man wie folgt sieht: Aus cos x = − sin(x − π2 ) folgt
π/4
cos π/4 = sin(π/4) und somit ist tan π4 = cos
= 1. Damit haben wir erstmals eine
sin π/4
Reihendarstellung für π erhalten:
∞
X
(−1)k
1 1
π=4
= 4 1 − + − +... .
2k
+
1
3 5
k=0
Leider konvergiert die Reihe aber sehr langsam, nach dem Leibnizkriterium hat man ja nur
4
|π − sn | ≤ 2n+1
. Die praktische Berechnung von π kann wie folgt erfolgen. Grundlage
ist das Additionstheorem
tan x + tan y
tan(x + y) =
.
1 − tan x tan y
106
7 DIFFERENTIALRECHNUNG
5
120
Mit α = arctan 15 folgen tan α = 15 , tan 2α = 12
und tan 4α = 119
. Mit β = 4α −
dann
120
−1
tan 4α − tan π4
1
119
tan β =
=
.
π
120 =
1 + tan 4α tan 4
239
1 + 119
π
4
folgt
Somit ist (mit n = 8)
π
1
1
= 4α − β = 4 arctan − arctan
= 4 · 0.197395 − 0.004184 ± 10−6 = 0.785396 ± 10−6 .
4
5
239
π = 3.14159 ± 10−5
Das zeigt schließlich
Aufgaben zu Abschnitt 7.5
1. Man finde Reihendarstellungen für die sogenannten hyperbolischen Funktionen
sinh x =
ex − e−x
,
2
cosh x =
ex + e−x
2
bei Entwicklung um 0.
2. Man finde die Reihendarstellung für die folgende Funktion zum Entwicklungspunkt
x0 = 0:
sin x
für x 6= 0, f (0) = 1.
f (x) =
x
3. Man finde die Reihendarstellung für die folgende Funktion zum Entwicklungspunkt
x0 = 0:
1+x
.
f (x) = ln
1−x
4. Man zeige durch vollständige Induktion, dass die Funktion
f (x) =
e−1/x
0
2
für x 6= 0
für x = 0
beliebig oft differenzierbar ist und dass f (k) (0) = 0 für alle k ∈ N gilt. Insbesondere
ist f bei x0 = 0 beliebig oft differenzierbar aber dort nicht analytisch.
7.6
Kurvendiskussionen
Die Differentialrechnung ist ein unverzichtbares Hilfsmittel für die Diskussion von Funktionsgraphen. Wir stellen hier die wichtigsten Ergebnisse zusammen.
Satz 7.36 Gilt f 0 (x) ≥ 0 für alle x ∈ (a, b), so ist f auf (a, b) monoton wachsend. Gilt
sogar f 0 (x) > 0 auf (a, b), so ist f auf (a, b) streng monoton wachsend.
7.6 Kurvendiskussionen
107
Beweis. Angenommen, f wäre nicht (streng) monoton wachsend auf (a, b). Dann würde
es Zahlen x1 , x2 ∈ (a, b) mit x1 < x2 und f (x1 ) > f (x2 ) bzw. f (x1 ) ≥ f (x2 ) geben. Nach
dem Mittelwertsatz existierte dann aber eine Zahl ξ ∈ (x1 , x2 ) mit
f( ξ) =
f (x2 ) − f (x1 )
< 0 bzw.
x2 − x1
≤0
im Widerspruch zur vorausgesetzten Positivität der ersten Ableitung.
Definition 7.37 Es sei f eine Funktion aus R in R, und es sei x0 ∈ D(f ).
(a) f hat bei x0 ein (absolutes) Maximum, wenn f (x0 ) ≥ f (x) für alle x ∈ D(f ) gilt.
(b) f hat bei x0 ein lokales Maximum bzw. ein eigentliches lokales Maximum, wenn
eine δ–Umgebung Uδ (x0 ) so existiert, dass f (x0 ) ≥ f (x) bzw. f (x0 ) > f (x) für alle
x ∈ D(f ) ∩ Uδ0 (x0 ) gilt.
Entsprechend werden die Begriffe Minimum, lokales Minimum und und eigentliches lokales
Minimum definiert. Oberbegriffe sind Extremwert und lokaler Extremwert. Die Differentialrechnung ist ein leistungsfähiges Hilfsmittel zur Ermittlung lokaler Extremwerte.
Satz 7.38 (Notwendiges Kriterium) Ist die Funktion f bei x0 differenzierbar und hat
f bei x0 einen lokalen Extremwert, so gilt f 0 (x0 ) = 0.
Beweis. Ohne Beschränkung der Allgemeinheit habe f bei x0 ein lokales Maximum, es sei
also
f (x) ≤ f (x0 ) für alle x ∈ Uδ (x0 ).
f (x) − f (x0 )
x − x0
Dann ist
Daher ist 0 ≤ lim
x%x0
(
≥0
für x ≤ x0 ,
x ∈ Uδ (x0 )
≤0
für x ≥ x0 ,
x ∈ Uδ (x0 ).
f (x) − f (x0 )
f (x) − f (x0 )
= f 0 (x0 ) = lim
≤ 0, also f 0 (x0 ) = 0.
x&x0
x − x0
x − x0
Satz 7.39 (Erstes Hauptkriterium für Extremwerte) Die reelle Funktion f sei in
einer Umgebung U (x0 ) definiert und erfülle folgende Bedingungen:
(a) f ist differenzierbar in U (x0 ).
(b) f 0 (x0 ) = 0.
(c) Für alle x ∈ U (x0 ) gilt f 0 (x) < 0 im Fall x < x0 und f 0 (x) > 0 im Fall x > x0 (f 0
hat bei x0 einen Vorzeichenwechsel).
Dann hat f bei x0 ein eigentliches Minimum.
108
7 DIFFERENTIALRECHNUNG
Beweis. Es sei x ∈ U (x0 ). Durch Anwendung des Mittelwertsatzes ergibt sich aus (c) in
beiden Fällen x < x0 und x > x0 die Ungleichung
f (x) − f (x0 ) = (x − x0 )f 0 (ξ) > 0.
Also ist f (x0 ) < f (x) für alle x ∈ U (x0 ).
Als Beispiel betrachten wir die Funktion
f (x) =
x2 − 1
x2 + 1
mit f 0 (x) =
(x2
4x
.
+ 1)2
Dann ist f 0 (0) = 0, sowie f 0 (x) < 0 für x < 0 und f 0 (x) > 0 für x > 0. Folglich hat f (x)
bei x = 0 ein lokales Minimum.
Satz 7.40 (Zweites Hauptkriterium für Extremwerte) Die Funktion f sei (2m +
2)-mal stetig differenzierbar in U (x0 ). Ist f (k) (x0 ) = 0 für alle 1 ≤ k ≤ 2m + 1 und gilt
f (2m+2) (x0 ) > 0 bzw. f (2m+2) (x0 ) < 0, so hat f bei x0 ein eigentliches lokales Minimum
bzw. Maximum.
Beweis. In der Taylorformel ergibt sich durch das Verschwinden der Ableitungen bei Entwicklung bis zu einem Restglied der Ordnung 2m + 2 die Vereinfachung
f (x0 + h) − f (x0 ) =
f (2m+2) (x0 + ϑ h) 2m+2
h
, x0 + h ∈ U (x0 ).
(2m + 2)!
Ist f (2m+2) (x0 ) > 0, so gilt wegen der Stetigkeit von f (2m+2) auch f (2m+2) (x0 + ϑ h) > 0
für hinreichend kleine |h|. Wegen h2m+2 > 0 für positive und negative h folgt daraus
f (x0 + h) − f (x0 ) ≥ 0
für hinreichend kleine |h|. Daher hat f bei x0 ein Minimum. Entsprechend ergibt sich im
Falle f (2m+2) (x0 ) < 0 bei x0 ein Maximum.
Definition 7.41 (Wendepunkte) Die Funktion f sei bei x0 differenzierbar und es sei
t(x) = f (x0 ) + f 0 (x0 ) · (x − x0 ) die Gleichung der Tangente. Dann hat f bei x0 einen
eigentlichen Wendepunkt, wenn es ein δ > 0 mit
t(x) < f (x) für alle x ∈ (x0 − δ, x) und f (x) < t(x) für alle x ∈ (x0 , x0 + δ) oder
t(x) > f (x) für alle x ∈ (x0 − δ, x) und f (x) > t(x) für alle x ∈ (x0 , x0 + δ) gibt.
(Die Funktion wechselt bei x0 die durch die Tangente bestimmten Halbebenen.)
Satz 7.42 Die differenzierbare Funktion f hat genau dann einen Wendepunkt bei x0 ,
wenn es ein δ > 0 mit
f (x) − f (x0 )
> f 0 (x0 ) für alle x ∈ (x0 − δ, x0 + δ)
x − x0
oder
f (x) − f (x0 )
< f 0 (x0 ) für alle x ∈ (x0 − δ, x0 + δ)
x − x0
gibt. (Die Sekantenanstiege sind immer > oder immer < als der Tangentenanstieg.)
7.6 Kurvendiskussionen
Beweis. Gilt
109
f (x) − f (x0 )
> f 0 (x0 ) für alle x ∈ (x0 − δ, x0 + δ),
x − x0
so folgen
˙ − x0 ) = t(x) für x > x0
f (x) > f (x0 ) + f 0 (x0 )(x
und
˙ − x0 ) = t(x) für x < x0 .
f (x) < f (x0 ) + f 0 (x0 )(x
Somit hat f bei x0 einen Wendepunkt. Die Umkehrung ist ebenso leicht zu sehen.
Satz 7.43 (Hinreichende Bedingung für Wendepunkte) Es sei f (2m+3)-mal stetig differenzierbar in U (x0 ). Gilt dann f (k) (x0 ) = 0 für alle 2 ≤ k ≤ 2m + 2 und
f (2m+3) (x0 ) 6= 0, so hat f bei x0 einen Wendepunkt.
Beweis. Der Beweis ergibt sich ähnlich zu Satz 7.40 aus der Taylorformel.
Definition 7.44 Eine Funktion f heißt konvex auf dem Intervall (a, b), falls für alle
a < a1 < ξ < b1 < b die Ungleichung
f (ξ) <
f (b1 ) − f (a1 )
(ξ − a1 ) + f (a1 )
b 1 − a1
gilt. Geometrisch bedeutet diese Ungleichung, dass die Sekantenabschnitte oberhalb des
Funktionsgraphen liegen.
Satz 7.45 Ist f 00 (x) > 0 für alle x ∈ (a, b), so ist f auf (a, b) konvex.
Beweis. Wegen f 00 > 0 ist f 0 monoton wachsend. Der Mittelwertsatz ergibt daher
f (ξ) − f (a1 )
f (b1 ) − f (ξ)
= f 0 (τ1 ) < f 0 (τ2 ) =
mit a1 < τ1 < ξ < τ2 < b1 .
ξ − a1
b1 − ξ
Durch Umstellen folgt
(f (ξ) − f (a1 ))(b1 − ξ) < (f (b1 ) − f (ξ))(ξ − a1 ),
f (ξ)(b1 − a1 ) < f (a1 )(b1 − ξ) + f (b1 )(ξ − a1 )
= f (a1 )(b1 − a1 ) + (f (b1 ) − f (a1 ))(ξ − a1 ).
Hieraus ergibt sich die geforderte Ungleichung.
Geometrisch beinhaltet die zweite Ableitung nach Satz 7.45 also eine Aussage über die
Konvexität bzw. die Krümmung“ des Graphen. Das lässt sich durch die Betrach”
tung von Krümmungskreisen präzisieren: Zu vorgegebener Funktion f und gegebenem
Punkt P0 = (x0 , f (x0 )) auf dem Graphen ist eine Kreislinie y = k(x) durch diesen Punkt
mit f (x0 ) = k(x0 ), f 0 (x0 ) = k 0 (x0 ) und f 00 (x0 ) = k 00 (x0 ) gesucht. Wieviele solcher Kreise
gibt es und wie errechnen sich deren Mittelpunkt und Radius? Wir behandeln das Problem
110
7 DIFFERENTIALRECHNUNG
Abbildung 21: Krümmungskreis
für den Spezialfall f 0 (x0 ) = 0. Die allgemeine Kreisgleichung
(x − a)2 + (y − b)2 = r2
wird implizit zweimal nach x differenziert. Das ergibt
2(x − a) + 2(y − b)y 0 = 0,
2 + 2y 0 y 0 + 2(y − b)y 00 = 0.
Die Forderungen y(x0 ) = f (x0 ) = y0 , y 0 (x0 ) = f 0 (x0 ) = 0, y 00 (x0 ) = f 00 (x0 ) führen dann
auf
1
1
und r = |y0 − b| = 00
.
x0 − a = 0, y0 − b = − 00
y (x0 )
|y (x0 )|
Damit haben wir bewiesen:
Satz 7.46 Für f 0 (x0 ) = 0 ist der Radius des Krümmungskreises der Kehrwert des Betrages der 2. Ableitung.
Aufgaben zu 7.6
1. Führen Sie eine Kurvendiskussion für die Funktion f (x) =
x
durch!
1 + x2
2. Beweisen Sie mittels Kurvendiskussion die Ungleichung
ab ≤
ap b q
1 1
+
für a, b ≥ 0 und 1 < p, q < ∞ mit + = 1.
p
q
p q
3. Zeigen Sie: Die Funktion f ist genau dann konvex auf dem Intervall I, wenn
f (αx + βy) ≤ αf (x) + βf (y) für alle x, y ∈ I und α, β ≥ 0 mit α + β = 1.
4. Beweisen Sie die allgemeine Formel r =
(1 + y002 )3/2
für den Krümmungsradius.
y000
5. Ein parabolischer Hohlspiegel mit Brennweite f soll durch eine Kugelfläche ersetzt
werden. Welcher Kugelradius ist zu wählen? (Hinweis: Zur Bestimmung der Gleichung y = ax2 unter Vorgabe der Brennweite f lassen Sie einen Lichtstrahl parallel
zur y-Achse auf einen Kurvenpunkt zum Anstieg 1 auftreffen.)
7.7 Partielle Ableitungen und Gradient
7.7
111
Partielle Ableitungen und Gradient
In diesem Abschnitt dehnen wir die Differentialrechnung auf reelle Funktionen mit mehreren reellen Variablen aus. Da wir auf solche Funktionen bisher nicht eingegangen sind,
beginnen wir mit einigen Bemerkungen zur Definition und graphischen Darstellung.
Definition 7.47 Eine Funktion f : G → R mit G ⊆ Rn heißt eine reellwertige Funktion
mit n-Variablen. Den Funktionswert von f zum Argument x = (x1 , . . . , xn ) bezeichnen
wir durch
z = f (x) = f (x1 , . . . , xn ).
Für n = 2 benutzen wir jedoch meistens die Symbolik z = f (x, y) mit x = (x, y).
Als Beispiel betrachten wir die auf R2 definierte Funktion
z = f (x, y) = y 2 − x2 .
Der Graph
Graph (f ) = {(x, y, z) : (x, y) ∈ D(f ), z = f (x, y)}
dieser Funktion ist dann eine Teilmenge von R3 und kann als Fläche im R3 dargestellt
werden. Eine alternative Möglichkeit für die graphische Darstellung ist die Verwendung
von Höhenlinienbildern, auch Isohypsen genannt (s. Abb. 22).
Abbildung 22: 3D-Darstellung und Höhenlinienbild von z = f (x, y) = y 2 − x2
Eine Möglichkeit der Untersuchung von Funktionen in mehreren Variablen besteht darin,
durch Fixieren von (n − 1) Variablen die Funktion auf eine Schar von Funktionen in einer
Variablen zurückzuführen. Wendet man diese Methode zur Definition von Ableitungen
an, so führt das auf den Begriff der partiellen Ableitung. In den folgenden Definitionen
und Sätzen werden wir uns meistens auf den Fall von n = 2 Variablen beschränken, die
Verallgemeinerung auf mehr Variablen wird offensichtlich sein.
Definition 7.48 (Partielle Ableitungen) Es sei f eine Abbildung aus R2 in R und es
sei x0 = (x0 , y0 ) ein innerer Punkt von D(f ). Dann heißt der Grenzwert
∂f
f (x0 + h, y0 ) − f (x0 , y0 )
(x0 , y0 ) = lim
h→0
∂x
h
112
7 DIFFERENTIALRECHNUNG
im Fall der Existenz die partielle Ableitung von f nach x im Punkt (x0 , y0 ). Entsprechend wird die partielle Ableitung von f nach y definiert. Zur Bezeichnung der partiellen
Ableitungen ist auch die folgende Symbolik üblich:
∂f
∂f
= ∂1 f = fx bzw.
= ∂2 f = fy .
∂x
∂y
Geometrisch bedeutet die partielle Ableitung nach x den Anstieg der Schnittkurve der
Fläche Graph(f ) mit der Ebene y = y0 parallel zur x-z-Ebene (Abb. 23). Entsprechend
wird die partielle Ableitung von f nach der zweiten Variablen y als Grenzwert des entsprechenden Differenzenquotienten definiert. Für Funktionen mit mehr als zwei Variablen
geht man analog vor.
Abbildung 23: Partielle Ableitungen
Beispiel 7.49 Es sei f (x, y) = x3 − 3x sin y + y 2 + 4. Dann sind
∂f
∂f
= fx (x, y) = 3x2 − 3 sin y und
= fy (x, y) = −3x cos y + 2y.
∂x
∂y
Definition 7.50 (Gradient) Besitzt die Funktion z = f (x, y) im Punkt x = (x, y) partielle Ableitungen nach allen Variablen, so heißt der Vektor
grad f (x) = ∇ f (x) = (fx (x, y), fy (x, y))
der Gradient von f bei x. Das Symbol ∇ wird als Nabla“ gelesen.
”
Für das Beispiel 7.49 ergibt sich
∇ f (x, y) = (3x2 − 3 sin y,
− 3x cos +2y).
Wir wollen jetzt die Weierstraßsche Zerlegungsformel auf den Fall von Funktionen mit
mehreren Variablen verallgemeinern. Die Rolle der Tangente wird nun durch die Tangentialebene übernommen. Wir reaktivieren dazu notwendige Kenntnisse aus der linearen
Algebra. Es sei h = (h, k) ∈ R2 ein beliebiger Vektor und es sei ∇ f = (fx , fy ) der
Gradient von f bei x = (x, y). Dann lässt sich das folgende Skalarprodukt bilden:
∇ f · h = (fx , fy ) · (h, k) = h fx + k fy .
Mit dieser Bezeichnung gilt der folgende Satz:
7.7 Partielle Ableitungen und Gradient
113
Satz 7.51 (Weierstraßsche Zerlegungsformel) Es sei x0 = (x0 , y0 ) ein innerer
Punkt von D(f ). In einer gewissen Umgebung Uε (x0 ) = {x ∈ R2 : |x − x0 | < ε} von x0
möge fx existieren und stetig sein, während fy wenigstens im Punkt x0 existiere. Dann
besitzt f in Uε (x0 ) eine Zerlegung der Form
f (x) = f (x0 ) + ∇ f (x0 ) · (x − x0 ) + ρ(x0 , x) · (x − x0 ) mit ρ(x0 , x) → 0 für x → x0 .
Die Funktion ρ(x0 , x) = (ρ1 (x0 , x), ρ2 (x0 , x)) ist dabei wieder die Fehlerfunktion.
Beweis. Wir setzen x = (x, y). Dann ergibt sich unter Anwendung des Mittelwertsatzes
für x, der Weierstraßschen Zerlegungsformel für y und der Stetigkeit von fx die Gleichung
f (x) − f (x0 ) =
=
=
=
=
f (x, y) − f (x0 , y) + f (x0 , y) − f (x0 , y0 )
(x − x0 )fx (ξ, y) + (y − y0 )(fy (x0 , y0 ) + ρ2 (x0 , x))
∇ f (x0 ) · (x − x0 ) + (x − x0 )(fx (ξ, y) − fx (x0 )) + (y − y0 ) · ρ2 (x0 , x)
∇ f (x0 ) · (x − x0 ) + (x − x0 ) · ρ1 (x0 , x) + (y − y0 ) · ρ2 (x0 , x)
∇ f (x0 ) · (x − x0 ) + ρ(x0 , x) · (x − x0 ).
mit ρ(x0 , x) → 0 für x → x0 wegen der vorausgesetzten Stetigkeit von fx .
Abbildung 24: Weierstraßsche Zerlegungsformel und Tangentialebene mit Normalenvektor
Bemerkung 7.52 .
a) Der lineare Teil
z = f (x0 ) + ∇ f (x0 ) · (x − x0 ) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 )
kann als Gleichung der Tangentialebene der durch z = f (x, y) gegebenen Fläche im Punkt
(x0 , y0 , f (x0 , y0 )) interpretiert werden. Die Weierstraßsche Zerlegungsformel bedeutet für
n = 2 also die näherungsweise Ersetzung der Fläche durch ihre Tangentialebene in einer
Umgebung des Punktes (x0 , y0 ).
xy
für (x, y) 6= (0, 0),
x2 +y 2
b) Die Funktion f (x, y) =
0
sonst
ist ein Beispiel dafür, dass die Voraussetzungen im Satz zur Weierstraßschen Zerlegungsformel nicht ohne weiteres verzichtbar sind (s. Abb. 25). Diese Funktion hat bei 0 = (0, 0)
partielle Ableitungen fx (0) = 0 und fy (0) = 0, sie ist aber bei 0 nicht einmal stetig,
geschweige denn linearisierbar.
114
7 DIFFERENTIALRECHNUNG
Abbildung 25: Gegenbeispiel zur Weierstraßschen Zerlegungsformel
Definition 7.53 (Glatte Kurven) Es sei I ein offenes reelles Intervall. Eine koordinatenweise differenzierbare Funktion
x = x(t) = (x1 (t), . . . , xn (t)) : I → Rn
heißt eine glatte Kurve in Rn , wenn x0 (t) = (x01 (t), . . . , x0n (t)) 6= 0 für alle t ∈ I ist.
Beispielsweise ist die Funktion
x(t) = (sin t, cos t),
0 < t < 2π
eine glatte Kurve. Diese Funktion beschreibt die Kreislinie. Die Gerade
x(t) = x0 + t a,
t∈R
mit 0 6= a ∈ Rn ist ebenfalls eine glatte Kurve.
Satz 7.54 Ist x = x(t) eine glatte Kurve, so existiert eine Zerlegung
x(t) = x(t0 ) + x0 (t0 ) · (t − t0 ) + ρ(t0 , t) · (t − t0 )
mit lim ρ(t0 , h) = 0. Die Gerade y(t) = x(t0 ) + x0 (t0 ) · (t − t0 ) heißt die Tangente an die
h→0
Kurve im Punkt x(t0 ).
Beweis. Es genügt, die Weierstraßsche Zerlegungsformel auf jede Koordinate von x separat
anzuwenden.
Satz 7.55 (Verallgemeinerte Kettenregel/Ableitung längs Kurven) Es sei f in
einer Umgebung von x0 = (x0 , y0 ) stetig partiell differenzierbar und es sei x(t) =
(x(t), y(t)) eine glatte Kurve mit x(t0 ) = x0 . Dann ist die zusammengesetzte Funktion
F (t) = f (x(t), y(t))
bei t0 differenzierbar, und es gilt
dF
∂f dx ∂f dy
(t0 ) = ∇ f (x0 ) · x0 (t0 ) =
·
+
· .
dt
∂x dt
∂y dt
Der formale Ausdruck dF = fx dx + fy dy =
Differential von F .
∂f
∂f
dx +
dy heißt auch das totale
∂x
∂y
7.7 Partielle Ableitungen und Gradient
115
Beweis. Mit der Abkürzung x = x(t) ergibt die Weierstraßsche Zerlegungsformel
F (t) − F (t0 ) = f (x(t)) − f (x0 ) = ∇ f (x0 ) · (x − x0 ) + ρ(x, x0 ) · (x − x0 ),
und die Division durch t − t0 liefert
x − x0
x − x0
F (t) − F (t0 )
= ∇ f (x0 ) ·
+ ρ(x, x0 ) ·
→ ∇ f (x0 ) · x0 (t0 ) + 0.
t − t0
t − t0
t − t0
Satz 7.56 (Differentiation implizit gegebener Funktionen) Es sei y = f (x) differenzierbar in x0 und es sei F (x, y(x)) = 0 für alle x ∈ U (x0 ). Ist F stetig partiell
differenzierbar in einer Umgebung V von (x0 , y0 ) und gilt Fy (x0 , y0 ) 6= 0, so ist
y 0 (x0 ) = −
Fx (x0 , y0 )
.
Fy (x0 , y0 )
Beweis. Wir setzen t = x und wenden die Kettenregel 7.55 auf die Gleichung 0 =
Fx
F (x, y(x)) an. Dann ist 0 = Fx · x0 + Fy · y 0 , also y 0 = − .
Fy
Beispiel 7.57 Die Kreislinie kann durch
√
y(x) = 1 − x2 ,
−1<x<1
beschrieben werden. Diese Funktion ergibt sich durch Auflösung der Kreisgleichung
F (x, y) = x2 + y 2 − 1 = 0,
y > 0.
Die Ableitung von y kann dann aus dieser Gleichung nach Satz 7.55 wie folgt berechnet
werden:
2x · 1 + 2y · y 0 + 0 = 0,
x
also y 0 = − .
y
7.58 (Die Richtungsableitung) Die Funktion f (x, y) sei in einer Umgebung von x0 =
(x0 , y0 ) definiert und dort stetig partiell differenzierbar. Es sei a ∈ R2 ein Richtungsvektor
mit |a| = 1. Dann heißt die Zahl
df
df (x0 + ta)
=
da
dt
die Richtungsableitung von f in Richtung a. Wegen der verallgemeinerten Kettenregel
gilt
df
= ∇f (x0 ) · a.
da
116
7 DIFFERENTIALRECHNUNG
7.59 (Geometrische Deutung des Gradienten) Es sei f in einer Umgebung U (x0 )
stetig partiell differenzierbar. Die Richtungsableitung nimmt wegen
∇f (x0 ) · a = |∇f (x0 )| · |a| · cos ∠ (∇f, a) → max
ihr Maximum für ∠ (∇f, a) = 0 an. Also zeigt ∇f in die Richtung der stärksten Änderung der Funktion f . Wir betrachten nun eine Niveaulinie f (x, y) = c. Die Tangente an
die Niveaulinie hat nach Satz 7.56 dann den Anstiegsvektor
fx
1
0
(1, y ) = 1, −
=
(fy , −fx ).
fy
fy
Hieraus folgt
1
(fy , −fx ) = 0.
fy
Also steht der Gradient senkrecht auf den Niveaulinien.
∇f · (1, y 0 ) = (fx , fy ) ·
Als erste Anwendung des Apparates der partiellen Ableitungen wollen wir das Problem der
implizit definierten Funktionen behandeln. Dieses Problem besteht darin, Bedingungen zu
finden, unter denen durch eine Gleichung F (x, y) = 0 eine Funktion y = y(x) definiert
wird. Betrachten wir als Beispiel die Kreisgleichung
F (x, y) = x2 + y 2 − 1 = 0.
Die Kreislinie C = {(x, y) : F (x, y) = 0} kann sicherlich nicht der Graph einer Funktion
Abbildung 26: Definition impliziter Funktionen
sein. Beschränkt man sich jedoch auf einen geeigneten Ausschnitt B, so kann C ∩ B
durchaus der Graph einer Funktion sein. Gibt es dann sogar eine differenzierbare Funktion
y = y(x), die die Gleichung
F (x, y(x)) = 0
erfüllt, so muss wegen y 0 = −Fx /Fy nach Satz 7.56 sicherlich Fy 6= 0 gelten. Diese Bedingung ist zusammen mit Stetigkeitsvoraussetzungen umgekehrt auch hinreichend, wie der
folgende wichtige Satz lehrt:
Satz 7.60 (Hauptsatz über implizite Funktionen) Die Funktion z = F (x, y) sei in
einer offenen Teilmenge G ⊆ R2 definiert und auf G stetig partiell differenzierbar nach x
und y. Ist dann (x0 , y0 ) ein Punkt in G mit F (x0 , y0 ) = 0 und Fy (x0 , y0 ) 6= 0, so existiert
ein Rechteck I1 × I2 = [x0 − δ, x0 + δ] × [y0 − ε, y0 + ε] derart, dass die Menge
{(x, y) ∈ R2 : F (x, y) = 0} ∩ I1 × I2
der Graph einer auf I1 definierten, stetig differenzierbaren Funktion y = y(x) ist, d.h., zu
jedem x ∈ I1 existiert genau ein y ∈ I2 mit F (x, y) = 0. Ferner gilt y 0 = −Fx / Fy auf I1 .
7.7 Partielle Ableitungen und Gradient
117
Beweis. Ohne Beschränkung der Allgemeinheit sei Fy (x0 , y0 ) > 0. Wegen der Stetigkeit
von Fy existiert ein Rechteck Q = [x0 −δ1 , x0 +δ1 ] × [y0 −ε , y0 +ε] ⊆ G so, dass Fy > 0 auf
diesem Rechteck gilt. Wegen F (x0 , y0 ) = 0 und Fy (x0 , y) > 0 für alle y ∈ [y0 − ε , y0 + ε]
gilt F (x0 , y0 + ε) > 0 > F (x0 , y0 − ε). Wegen der Stetigkeit von F existiert dann ein
Intervall I1 = [x0 − δ, x0 + δ] ⊆ [x0 − δ1 , x0 + δ1 ] so, dass F (x, y0 + ε) > 0 > F (x, y0 − ε)
für alle x ∈ I1 gilt. Für festes x ∈ I1 hat die Funktion g(y) = F (x, y) auf [y0 − ε, y0 + ε]
nach dem Nullstellensatz von Bolzano daher eine Nullstelle in I2 = [y0 + ε, y0 + ε]. Also
hat F (x, y) = 0 für jedes x ∈ I1 eine Lösung y ∈ I2 .
Wir zeigen nun die Einzigkeit der Lösung in I2 . Es seien y1 , y2 ∈ I2 zwei verschiedene
Zahlen mit F (x, y1 ) = 0 = F (x, y2 ). Nach dem Mittelwertsatz der Differentialrechnung
gibt es dann ein η ∈ I2 mit Fy (x, η) = 0, was im Widerspruch zur Konstruktion von Q
steht. Damit wird in I1 ×I2 durch die Gleichung F (x, y) = 0 genau eine Funktion y = y(x)
definiert.
Wir zeigen nun durch indirekten Beweis zunächst die Stetigkeit von y = y(x). Angenommen, die Funktion wäre an irgendeiner Stelle x ∈ I1 unstetig. Dann gäbe es eine Folge
hn → 0 derart, dass lim y(x+hn ) = y ? 6= y(x) gilt. Da aber nach Konstruktion der Funkn→∞
tion y = y(x) die Gleichheit F (x + hn , y(x + hn )) = 0 besteht, folgt nach Grenzübergang
F (x, y ? ) = 0, was aber y ? = y(x) nach sich ziehen würde. Dieser Widerspruch zeigt die
Stetigkeit von y = y(x).
Zum Nachweis der Differenzierbarkeit seien x und x + h zwei Punkte in I1 und es seien
y(x) und y(x + h) die zugehörigen Funktionswerte. Wir betrachten die Gerade durch die
Punkte (x, y(x)) und (x + h, y(x + h)). Sie ist in R2 durch die Gleichung
(X(t), Y (t)) = (x + th, y(x) + t(y(x + h) − y(x))
gegeben. Die Funktion
ϕ(t) = F (X(t), Y (t)),
0≤t≤1
erfüllt auf [0, 1] die Voraussetzungen des Mittelwertsatzes. Daher existiert eine Zahl ϑ ∈
(0, 1) derart, dass
ϕ0 (ϑ) = ϕ(1) − ϕ(0)
ist. Wegen
ϕ(0) = F (x, y(x)) = 0 und ϕ(1) = F (x + h, y(x + h)) = 0
ist dann
ϕ0 (ϑ) = Fx (X(ϑ), Y (ϑ)) · h + Fy (X(ϑ), Y (ϑ)) · (y(x + h) − y(x)) = 0.
Hieraus folgt
Fx (X(ϑ), Y (ϑ))
y(x + h) − y(x)
=−
.
h
Fy (X(ϑ), Y (ϑ))
Wegen der bereits nachgewiesenen Stetigkeit von y = y(x) existiert dann aber der Grenzwert
y 0 (x) = lim
h→0
y(x + h) − y(x)
Fx (x, y(x))
=−
.
h
Fy (x, y(x))
118
7 DIFFERENTIALRECHNUNG
Der Hauptsatz über implizite Funktionen kann auch auf vektorwertige Funktionen mit
mehr als zwei Variablen verallgemeinert werden. Die wichtige Voraussetzung Fy (x0 , y0 ) 6=
0 wird dabei durch die Invertierbarkeit einer gewissen Jakobi-Matrix ersetzt, und anstelle
des Satzes von Bolzano zur Auflösung von Gleichungen wird der Banachsche Fixpunktsatz
zur Auflösung der entsprechenden (nichtlinearen) Gleichungssysteme herangezogen.
Satz 7.61 (Satz über die Existenz der inversen Funktion) Es sei y = f (x) eine
im Intervall I definierte Funktion. Ist f in einer Umgebung von x0 ∈ I stetig differenzierbar und gilt f 0 (x0 ) 6= 0, so existiert zu y0 = f (x0 ) ein Intervall J = (y0 − δ, y0 + δ)
und eine Funktion g : J → R mit f ◦ g = Id|J .
Beweis. Wir setzen F (x, y) = y −f (x) . Dann ist F auf I ×R stetig partiell differenzierbar,
und der Satz über implizite Funktionen kann zur Ermittlung der Funktion g(y) = x(y)
benutzt werden.
Wir beschließen dieses Kapitel mit einer Exkursion zu höheren partiellen Ableitungen.
Für eine Funktion z = f (x, y) heißen die beiden Funktionen
fx =
∂f
∂x
und fy =
∂f
.
∂x
im Fall der Existenz die partiellen Ableitungen 1. Ordnung. Durch weiteres Differenzieren
(falls möglich) entstehen hieraus vier Ableitungen der 2. Ordnung, nämlich:
fxx
=
fyx
=
∂2f
∂x2
∂2f
∂x ∂y
=
=
∂ ∂f
∂x ∂x
∂ ∂f
∂x ∂y
,
fyy
=
,
fxy
=
∂2f
∂y 2
∂2f
∂y ∂x
=
=
∂ ∂f
∂y ∂y
∂ ∂f
∂y ∂x
,
.
Für diese zweiten partiellen Ableitungen gilt dabei der folgende Satz:
Satz 7.62 (Satz von H. A. Schwarz (1843–1921)) Ist f auf der offenen Menge U ⊆
R2 stetig partiell differenzierbar nach x und y und existiert auch eine stetige Ableitung
fyx auf U , so existiert auch fxy auf U und es ist
fxy = fyx auf U.
Der Satz kann leicht durch Betrachtung der entsprechenden Differenzenquotienten unter Verwendung von Mittelwertsätzen bewiesen werden. Wir werden aber später unter
Verwendung der Integralrechnung einen einfacheren Beweis erhalten.
Folgerung 7.63 Ist der Ausdruck A(x, y)dx + B(x, y)dy das totale Differential einer
zweimal stetig partiell differenzierbaren Funktion f auf einer offenen Menge U , so gilt
∂A
∂B
=
auf U.
∂y
∂x
7.7 Partielle Ableitungen und Gradient
119
Diese Bedingung heißt auch Integrabilitätsbedingung des sogenannten Vektorfeldes
(A(x, y), B(x, y)). Wir werden später sehen, dass die angegebene Bedingung auch hinreichend ist.
Beweis. Gilt A(x, y) = fx (x, y) und B(x, y) = fy (x, y) für eine zweimal stetig partiell
differenzierbare Funktion f , so folgt aus Satz 7.62 die Gleichung
Ay = fxy = fyx = Bx .
Aufgaben zu Abschnitt 7.7
1. Man zeige am Beispiel der Funktion
( 2 2
f (x, y) =
x −y
x2 +y 2
0
für
sonst
(x, y) 6= (0, 0)
,
dass die Existenz der partiellen Ableitungen allein nicht hinreichend für die Gültigkeit der Weierstraßschen Zerlegungsformel ist.
2. Man zeige durch Diskussion der Richtungsableitungen, dass es zu jedem Punkt des
durch F (x, y) = x2 − y 2 definierten hyperbolischen Paraboloids zwei Geraden gibt,
die ganz in der Fläche verlaufen.
3. Ermitteln Sie die Gleichung der Tangentialebene an die durch
z = f (x, y) = 3x2 + 4y 2
gegebene Fläche im Punkt (x0 , y0 , f (x0 , y0 )) = (1, 1, 7).
4. Man zeige unter Verwendung des Mittelwertsatzes:
Ist f 0 (x) > 0 für alle x im Intervall I, so ist f auf I streng monoton wachsend.
5. a) Wie lässt sich durch die Gleichung sin xy = 0 eine Funktion definieren?
b) Lässt sich die Funktion x = y cos y in einer Umgebung von (0, 0) nach y auflösen?
6. Es sei G ∈ R2 eine offene Menge, es seien z = f (x, y) und z = g(x, y) zwei auf G
stetig partiell differenzierbare Funktionen mit den Graphen F bzw. G. Finden Sie
Bedingungen an f und g derart, dass die Schnittmenge F ∩ G eine glatte Kurve
repräsentiert. (Hinweis: Verwenden Sie den Satz über implizite Funktionen.)
7. Der Differentialoperator
∂2
∂2
+
∂x2 ∂y 2
heißt zweidimensionaler Laplace–Operator, und die Lösungen der Laplace–
Gleichung
∂2f
∂2f
∆f =
+
=0
∂x2
∂y 2
p
heißen harmonische Funktionen. Zeigen Sie, dass die Funktion f (x, y) = ln x2 + y 2
auf R2 \ {(0, 0)} harmonisch ist.
∆=
8. Prüfen Sie, ob der Differentialausdruck (exy + xyexy ) dx + x2 exy dy in R2 ein totales
Differential ist!
120
7.8
7 DIFFERENTIALRECHNUNG
Extremwerte für Funktionen mit mehreren Variablen
Wir untersuchen nun Extremwerte für Funktionen mit zwei Variablen. Die Begriffe lokale
Extrema werden analog wie im eindimensionalen Fall definiert.
Satz 7.64 (Notwendiges Kriterium) Die Funktion z = f (x, y) sei in einer Umgebung
U (x0 , y0 ) von (x0 , y0 ) definiert, partiell differenzierbar in (x0 , y0 ) und habe bei (x0 , y0 ) ein
lokales Extremum. Dann gilt
fx (x0 , y0 ) = 0 und fy (x0 , y0 ) = 0.
Beweis. Die Funktionen ϕ(x) = f (x, y0 ) und ψ(y) = f (x0 , y) haben unter den obigen
Voraussetzungen auch ein lokales Extremum bei x0 bzw. y0 . Daher ist
0 = ϕ0 (x0 ) = fx (x0 , y0 ) und 0 = ψ 0 (y0 ) = fy (x0 , y0 ).
Satz 7.65 (Eine hinreichende Bedingung) Die Funktion z = f (x, y) sei in U (x0 , y0 )
definiert und erfülle die folgenden Bedingungen:
(a) f ist in U zweimal stetig partiell differenzierbar.
(b) Es sei fx (x0 , y0 ) = 0 und fy (x0 , y0 ) = 0.
fxx (x0 , y0 ) fxy (x0 , y0 )
(c) Es sei det
= fxx (x0 , y0 )fyy (x0 , y0 ) − fxy (x0 , y0 )2 > 0.
fyx (x0 , y0 ) fyy (x0 , y0 )
Dann hat f bei (x0 , y0 ) ein lokales Extremum. Im Fall fxx (x0 .y0 ) < 0 ist es ein Maximum,
im Fall fxx (x0 , y0 ) > 0 ein Minimum.
Beweis. Wegen (c) ist fxx (x0 , y0 ) 6= 0, und o.B.d.A. sei fxx (x0 , y0 ) > 0. Wegen der Stetigkeit der partiellen Ableitung gibt es eine Umgebung U (x0 , y0 ) > 0 so, dass die Bedingung
(c) und die Bedingung fxx (x, y) > 0 für alle (x, y) = (x0 + h, y0 + k) ∈ U (x0 , y0 ) erfüllt ist.
Es sei nun (x0 +h, y0 +k) ∈ U (x0 , y0 ) fest gewählt. Wir wollen f (x0 +h, y0 +k) > f (x0 , y0 )
für h · k 6= 0 zeigen. Dazu definieren wir
F (t) = f (x0 + t h, y0 + t k) für |t| ≤ 1.
Dann ist
F 0 (t) = fx (x0 + t h, y0 + t k) · h + fy (x0 + t h, y0 + t k)k,
F 00 (t) = fxx (x0 + t h, y0 + t k)h2 + 2fxy (x0 + t h, y0 + t k)hk + fyy (x0 + t h, y0 + t k)k 2 .
Wegen (b) ist F 0 (0) = 0. Daher ergibt die Taylorformel angewandt auf die Funktion F (t)
mit den Abkürzungen P0 = (x0 , y0 ) und Pϑ = (x0 + ϑh, y0 + ϑk) wegen (c) die Formel
1
f (x0 + h, y0 + k) = F (1) = F (0) + 0 + F 00 (ϑ)
2
1
= f (P0 ) +
fxx (Pϑ )h2 + 2fxy (Pϑ )hk + fyy (Pϑ )k 2
2
2
1
= f (P0 ) +
fxx (Pϑ ) · h + fxy (Pϑ ) · k
2fxx (Pϑ )
2
+ fyy (Pϑ )fxx (Pϑ ) − fxy (Pϑ ) k 2
> f (x0 , y0 )
7.8 Extremwerte für Funktionen mit mehreren Variablen
121
Abbildung 27: ellipt. Paraboloid, hyperbol. Paraboloid=Sattelfläche und Affensattel
Beispiel 7.66 Wir bestimmen die lokalen Extrema der Funktion
f (x, y) = x2 + 2xy + 4y 2 + 2x − 10y + 5.
Dazu haben wir zunächst das Gleichungssystem
fx (x, y) = 2x + 2y + 2
= 0
fy (x, y) = 2x + 8y − 10 = 0
zu lösen. Das ergibt den Punkt (x0 , y0 ) = (−3, 2) als Kandidaten für einen Extremwert.
Wegen
fxx (−3, 2)fyy (−3, 2) − fxy (−3, 2)2 = 16 − 4 > 0
liegt in der Tat ein Extremwert vor, und wegen fxx (−3, 2) = 2 > 0 ist es ein Minimum.
Der obige Satz besitzt die folgende Verallgemeinerung auf Funktionen mit n ≥ 2 Variablen.
Der Beweis wird ähnlich wie oben geführt, man muss nur die aus der Linearen Algebra
bekannten Tatsachen über quadratische Formen und ihre Beziehung zu positiv definiten
Matrizen ausnutzen:
Satz 7.67 Die Funktion z = f (x) mit n Variablen sei in U (x0 ) definiert und erfülle die
folgenden Bedingungen:
(a) f ist in U zweimal stetig partiell differenzierbar.
(b) Es sei ∇f (x0 ) = 0.
(c) Die sogenannte Hesse-Matrix
2
∂ f (x0 ) =
∂2f
∂xi ∂xj
sei positiv definit.
i,j
Dann hat f bei x0 ein lokales Minimum.
Implizit trat im Beweis zu Satz 7.65 bereits eine Taylorformel für zwei Variable auf.
Allgemein versteht man unter der Taylorformel für eine Funktion mit n reellen
Variablen die Formel
X ∂ α f (x0 )
f (x) =
(x − x0 )α + RN +1 (x0 , x),
α!
|α|≤N
122
7 DIFFERENTIALRECHNUNG
wobei α = (α1 , . . . , αn ) ein Multiindex ist und die folgenden Schreibweisen vereinbart
sind:
∂ |α| f (x0 )
|α| = α1 + . . . + αn , α! = α1 ! · . . . · αn !, ∂ α f (x0 ) =
, zα = z1α1 · . . . · znαn .
∂xα1 1 · · · ∂xαnn
Aufgaben zu Abschnitt 7.8
1. Bestimmen Sie die lokalen Extremwerte für die folgende Funktion:
f (x, y) = x2 + xy + y 2 + 2x + 1.
2. Entscheiden Sie durch Extremwertuntersuchungen, ob durch die Gleichung
z = x2 − 2xy + 4y 2 + 2x − y + 1
ein elliptisches oder ein hyperbolisches Paraboloid beschrieben wird.
3. Regressionsgerade Einer biologischen Größe y werde eine lineare Abhängigkeit
y = f (x) = ax + b von einer Größe x unterstellt. Zur Bestimmung der Parameter
a, b wurde eine Messreihe mit n Messwertpaaren (xi , yi ), 1 ≤ i ≤ n, n 2, aufgenommen. Bestimmen Sie a, b derart, dass die mittlere quadratische Abweichung“
”
n
1 X
|f (xi ) − yi |2 → min
n − 1 i=1
minimal wird. Die Gerade mit den so bestimmten Parametern heißt die Regressionsgerade zur gegebenen Messreihe.
Bestimmen Sie die Parameter a, b für die folgende Messreihe, die den Zusammenhang
zwischen der Auslenkung x einer Feder und der Federkraft F angibt (Hookesches
Gesetz):
xi
Fi
0.5 1.0 1.5 2.0 2.5 3.0
0.9 1.2 1.4 1.7 2.0 2.2
123
8
8.1
Integralrechnung
Das bestimmte Integral
Die Integration ermöglicht Volumen- und Flächenberechnungen, und sie erweist sich als
eine Umkehrung“ zur Differentiation. Daher wird sie auch ein wesentliches Hilfsmittel
”
zur Lösung von Differentialgleichungen sein. Die folgende, mehrstufige Definition orientiert
sich an Flächeninhaltsberechnungen und geht auf Bernhard Riemann zurück.
Definition 8.1 (Das Riemannsche Integral) Es sei f : [a, b] → R eine beschränkte,
reellwertige Funktion.
(a) Eine Zerlegung Z von [a, b] ist ein n + 1-Tupel Z = (x0 , . . . , xn ) von Elementen
xi ∈ [a, b] mit a = x0 < x1 < . . . < xn = b. Die Intervalle Ii = [xi−1 , xi ) sind dann
n
S
paarweise disjunkt und es gilt
Ii = [a, b).
i=1
(b) Die Untersumme bzw. Obersumme von f zur Zerlegung Z ist definiert durch
S(f, Z) =
n
X
f (Ii )µ(Ii ) bzw. S(f, Z) =
i=1
n
X
f (Ii )µ(Ii ).
i=1
Dabei sind
µ(Ii ) = xi − xi−1 = Länge des Intervalls Ii = [xi−1 , xi ),
f (Ii ) = inf f (x) und
x∈Ii
f (Ii ) = sup f (x).
x∈Ii
(c) Die Darbouxsche Untersumme bzw. Obersumme von f auf [a, b] ist definiert
durch
S(f ) = sup {S(f, z): Z
ist Zerlegung von [a, b]} bzw.
S(f ) = inf {S(f, z):
ist Zerlegung von [a, b]}.
Z
(d) Gilt nun
S(f ) = S(f ),
so heißt diese Zahl das (Riemannsche) Integral von f auf [a, b] und die Funktion f
heißt (Riemann–)integrierbar auf [a, b]. Man schreibt dafür kurz
Zb
f (x)dx = S(f ) = S(f ).
a
124
8 INTEGRALRECHNUNG
Beispiel 8.2 (a) Jede konstante Funktion f (x) ≡ c ist auf jedem Intervall [a, b] integrierbar, und es gilt
Zb
c dx = c(b − a),
a
denn alle Obersummen und alle Untersummen haben offenbar den Wert c(b − a).
(b) Die sogenannte Dirichlet–Funktion
D(x) =
0 für x ∈ R \ Q
1 für x ∈ Q
ist auf dem Intervall [0, 1] nicht integrierbar, denn für jede Zerlegung Z gelten offenbar
S(f, Z) = 0 und S(f, Z) = 1.
Daher sind auch die Darbouxschen Summen S(f ) = 0 und S(f ) = 1 voneinander verschieden.
Wir wollen nun allgemeine Integrabilitätskriterien herleiten. Zur Vorbereitung dienen die
folgenden Sätze.
Definition 8.3 Es seien Z und Z 0 zwei Zerlegungen von [a, b]. Dann heißt Z 0 feiner als
Z, in Zeichen Z 0 ≺ Z, wenn jeder Teilpunkt xi von Z auch in Z 0 vorkommt.
Satz 8.4 Aus Z 0 ≺ Z folgt S(f, Z) ≤ S(f, Z 0 ) ≤ S(f, Z 0 ) ≤ S(f, Z).
Beweis. Jedes Intervall Ii = [xi−1 , xi ) der Zerlegung Z zerfällt unter der gemachten Voraussetzung in eine disjunkte Vereinigung
0
Ii = Ij0 ∪ Ij+1 ∪ . . . ∪ Ij+r
0
von Intervallen Ij+l
= [x0j+l−1 , x0j+l ) der Zerlegung Z 0 . Daher ist
f (Ii ) µ(Ii ) ≤
r
X
l=0
0
0
) µ(Ij+l
)
f (Ij+l
≤
r
X
0
0
f (Ij+l
) µ(Ij+l
) ≤ f (Ii ) µ(Ii ),
l=0
und die Summation über i ergibt S(f, Z) ≤ S(f, Z 0 ) ≤ S(f, Z 0 ) = S(f, Z).
Satz 8.5 Für jede auf [a, b] beschränkte Funktion f gilt S(f ) ≤ S(f ).
Beweis. Sind Z und Z 0 beliebige Zerlegungen von [a, b], so bilde man eine gemeinsame
Verfeinerung Z ∗ dieser Zerlegungen durch Ineinanderfügen dieser beiden Ketten zu einer
neuen Kette Z ∗ = (y0 , . . . , yn+m−1 ). Aus Satz 8.4 folgt dann die Ungleichung
S(f, Z) ≤ S(f, Z ∗ ) ≤ S(f, Z ∗ ) ≤ S(f, Z 0 ).
8.1 Das bestimmte Integral
125
Also gilt S(f, Z) ≤ S(f, Z 0 ) für alle Zerlegungen Z und Z 0 von [a, b]. Hieraus folgt
S(f ) = sup S(f, Z) : Z ist eine Zerlegung von [a, b] ≤ S(f, Z 0 ),
und durch Übergang zum Infimum schließlich
S(f ) ≤ inf S(f, Z 0 ) : Z 0 ist eine Zerlegung von [a, b] = S(f ).
Damit ergibt sich der wichtige Satz:
Satz 8.6 (Riemannsches Integrabilitätskriterium) Es sei f eine auf [a, b] beschränkte Funktion. Diese Funktion ist auf [a, b] genau dann integrierbar, wenn es zu
jedem ε > 0 eine Zerlegung Z von [a, b] mit S(f, Z) − S(f, Z) < ε gibt.
Beweis. Aus der angegebenen Bedingung folgt
S(f ) − S(f ) ≤ S(f, Z) − S(f, Z) ≤ ε.
Für ε → 0 zeigt dies S(f ) − S(f ) ≤ 0, wegen Satz 8.5 folgt daraus S(f ) = S(f ). Folglich ist f integrierbar. Ist umgekehrt f integrierbar, so wählen wir zu gegebenem ε > 0
Zerlegungen Z und Z 0 mit
ε
ε
S(f, Z 0 ) − S(f ) <
und S(f ) − S(f, Z) < .
2
2
Für die gemeinsame Verfeinerung Z ∗ von Z und Z 0 gilt dann wegen S(f ) = S(f ) die
Abschätzung
S(f, Z ∗ ) − S(f, Z ∗ ) ≤ S(f, Z 0 ) − S(f, Z) = S(f, Z 0 ) − S(f ) + S(f ) − S(f, Z) ≤ ε.
Die folgende Formel ermöglicht u.a. auch die Berechnung von Integralen in einfachen
Fällen:
Folgerung 8.7 (Hauptkriterium) Die Funktion f sei auf [a, b] beschränkt. Ist (Zn )
eine Folge von Zerlegungen von [a, b] mit
lim S(f, Zn ) = lim S(f, Zn ),
n→∞
n→∞
so ist f auf [a, b] integrierbar, und es gilt
Zb
f (x)dx = lim S(f, Zn ) = lim S(f, Zn ).
n→∞
n→∞
a
Beweis. Wegen Satz 8.5 gilt
S(f, Zn ) ≤ S(f ) ≤ S(f ) ≤ S(f, Zn ),
und aus der Voraussetzung folgt
lim S(f, Zn ) = S(f ) = S(f ) = lim S(f, Zn ).
n→∞
Hieraus ergibt sich die Behauptung.
n→∞
126
8 INTEGRALRECHNUNG
Beispiel 8.8 Es sei a < b. Wir berechnen das Integral
Rb
x dx. Dazu setzen wir f (x) = x
a
und bilden die äquidistanten Zerlegungen
Zn = {xj : xj = a + j ·
b−a
= a + jh; j = 0, . . . , n}.
n
Mit h · n = b − a gilt dann
n−1
X
S(f, Zn ) =
(a + jh) · h =
j=0
n−1
X
2
2
a·h+j·h =a·h·n+h
j = a · h · n + h2 ·
j=0
j=0
= a · (b − a) +
n−1
X
n(n − 1)
2
(b − a)2 h
h2 n2 h
− · hn = a(b − a) +
− (b − a).
2
2
2
2
Analog ist
S(f, Zn ) =
n
X
(a + jh)h = a(b − a) + h2
j=1
Wegen h =
b−a
n
n(n + 1)
(b − a)2 h
= a(b − a) +
+ (b − a).
2
2
2
→ 0 für n → ∞ folgt
lim S(f, Zn ) = lim S(f, Zn ) = a(b − a) +
n→∞
b 2 a2
(b − a)2
=
− .
2
2
2
Also ist f (x) = x nach Satz 8.7 integrierbar, und es gilt
Zb
x dx =
b 2 a2
− .
2
2
a
Satz 8.9 (1. Existenzsatz) Ist f auf [a, b] stetig, so ist f auf [a, b] auch integrierbar.
Beweis. Wir werden Riemanns Integrabilitätskriterium anwenden. Dazu sei ε > 0 beliebig
vorgegeben. Da stetige Funktionen auf kompakten Intervallen sogar gleichmäßig stetig
sind (siehe Satz 6.17), existiert ein δ > 0 derart, dass gilt:
Aus |x − x0 | < δ folgt |f (x) − f (x0 )| < ε auf [a, b].
Wir wählen eine natürliche Zahl n so groß, dass
h=
b−a
n
b−a
n
< δ ausfällt. Dann setzen wir
xj = a + j · h
und
Für Ij = [xj−1 , xj ) gilt dann µ(Ij ) =
b−a
n
für j = 0, . . . , n.
< δ. Folglich ist
|f (Ij ) − f (Ij )| < ε.
Für die Zerlegung Z = (x0 , . . . , xn ) ergibt sich daher
S(f, Z) − S(f, Z) =
n
X
(f (Ij ) − f (Ij )) µ(Ij ) ≤ ε · (b − a).
j=1
Somit ist f nach dem Riemannschen Kriterium integrierbar.
8.1 Das bestimmte Integral
127
Satz 8.10 (2. Existenzsatz) Ist f auf [a, b] monoton, so ist f auf [a, b] auch integrierbar.
Beweis. Sei f monoton wachsend und sei ε > 0 vorgegeben. Wir wählen eine natürliche
Zahl n so, dass
(b − a)
· (f (b) − f (a)) < ε
n
ausfällt. Sodann setzen wir wie im vorigen Satz
b−a
, xj = a + j · h und Z = (x0 , . . . , xn ).
n
Wegen der Monotonie von f gelten
h=
f (Ij ) = f (xj−1 ) und f (Ij ) ≤ f (xj ).
Daher ist
n
X
n
b−a X
S(f, Z) − S(f, Z) ≤
(f (xj ) − f (xj−1 )) µ(Ij ) =
·
(f (xj ) − f (xj−1 ))
n
j=1
j=1
b−a
(f (b) − f (a)) < (b − a) ε.
n
Folglich ist f nach dem Riemannschen Integrabilitätskriterium auch integrierbar.
=
Definition 8.11 (Die Rechteckregel) Es sei f auf [a, b] beschränkt und es sei h =
Die Formel
n
X
Rn (f ) =
f (a + jh) · h
b−a
.
n
j=1
heißt Rechteckregel für f (s. Abb. 28).
Abbildung 28: Die Rechteckregel
In der numerischen Mathematik werden die Zahlen Rn (f ) als Näherungswerte für das
Integral von f benutzt. Wir wollen eine Fehlerabschätzung für
b
Z
f (x) dx − Rn (f )
a
in Abhängigkeit von n bzw. h ermitteln.
128
8 INTEGRALRECHNUNG
Satz 8.12 (Fehlerabschätzung für die Rechteckregel) Hat f auf [a, b] eine stetige
beschränkte Ableitung mit |f 0 | ≤ K, so ist
Z b
(b − a)2
.
f
(x)dx
−
R
(f
)
≤
2K
·
n
n
a
Beweis. Wegen des Mittelwertsatzes der Differentialrechnung ist
|f (x0 ) − f (x00 )| = |f 0 (ξ)| · |x0 − x00 | ≤ K · |x0 − x00 |.
Hieraus folgt für die Zerlegung Z = (x0 , x1 , . . . , xn ) mit den Teilpunkten xj = a + h · j
dem Zuwachs h = (b − a)/n und den Intervallen Ij = [xj−1 , xj ) die Abschätzung
|f (Ij ) − f (Ij )| ≤ K · µ(Ij ) = K · h, und insbesondere |f (xj ) − f (Ij )| ≤ K · h.
Somit ist
Z b
Z b
f (x)dx − Rn (f ) ≤ f (x)dx − S(f, Z) + S(f, Z) − Rn (f )
a
a
≤ |S(f, Z) − S(f, Z)| + |S(f, Z) − Rn (f )|
≤ K · h · (b − a) + K · h · (b − a)
= 2K · h · (b − a) = 2K
(b − a)2
n
Bessere Konvergenzgüten (z.B. ≤ M · 1/n2 ) ergeben sich bei der Verwendung der Trapezregel
!
n−1
X
1
1
f (a) +
f (a + jh) + f (b) · (b − a)
Tn (f ) =
2
2
j=1
anstelle der Rechteckregel (s. Aufgabe 6).
Aufgaben zu Abschnitt 8.1
Zb
1. Mit der in Beispiel 8.8 angegebenen Methode zeige man
Zb
2. Zeigen Sie
ex dx = eb − 1.
0
1
dx = ln b für b > 0 unter Verwendung sog. geometrischer Zerlex
1
gungsfolgen Zn = {xj = bj/n : j = 0, . . . , n}. (Satz 4.30 könnte dabei helfen.)
Za
3. Berechnen Sie
sgn x dx in Abhängigkeit von a.
−2
8.2 Eigenschaften Riemannscher Integrale
129
Zπ
4. Berechnen Sie
sin x dx unter Verwendung der Rechtecksregel.
0
π
(Hinweis: Zur Auswertung der Rn erweitern Sie Rn mit sin 2n
und verwenden Sie
die bekannte Formel 2 · sin x · sin y = cos(x − y) − cos(x + y).)
5. Es sei f auf [a, b] integrierbar. Zeigen Sie die Stetigkeit der Funktion
Zx
f (t) dt für a ≤ x ≤ b.
Φ(x) =
a
6. Finden Sie (unter von Ihnen diktierten Voraussetzungen an die Funktion f ) eine
gute Fehlerabschätzung für die Trapezregel. Was hat die Trapezregel mit Trapezen
zu tun?
7. Die Riemann-Funktion r : R → [0, ∞) ist wie folgt definiert:
r(x) =
0
1
q
für x irrational,
für x = pq mit teilerfremden p, q und q > 0.
a) Beweisen Sie, dass r in jedem irrationalen Punkt stetig und in jedem rationalen
Punkt unstetig ist.
b) Beweisen Sie, dass die Riemann-Funktion auf [0, 1] integrierbar ist und berechnen
Sie das Integral.
8.2
Eigenschaften Riemannscher Integrale
Satz 8.13 Es seien f und g auf [a, b] integrierbar und es sei λ ∈ R beliebig gegeben. Dann
sind auch f + g und λ f auf [a, b] integrierbar und es gelten:
(a)
Aus f ≥ 0 auf [a, b] folgt
Rb
f (x)dx ≥ 0.
(Positivität)
a
(b)
Rb
f (x) + g(x)dx =
a
(c)
Rb
Rb
f (x)dx +
a
λ f (x)dx = λ
a
Rb
Rb
g(x)dx
(Additivität)
a
f (x)dx
(Homogenität).
a
Zb
f (x)dx ≥ S(f ) ≥ 0.
Beweis. Zu a) Aus f ≥ 0 auf [a, b] folgt
a
Zu b) Offensichtlich gilt
S(f, Z) + S(g, Z) ≤ S(f + g, Z) ≤ S(f + g) ≤ S(f + g) ≤ S(f + g, Z) ≤ S(f, Z) + S(g, Z).
130
8 INTEGRALRECHNUNG
Zu ε > 0 existiert nun wegen der Integrierbarkeit von f und g eine Zerlegung Z von [a, b]
derart, dass
S(f, Z) − S(f, Z) < ε und S(g, Z) − S(g, Z) < ε
sind. Hieraus folgt
Zb
Zb
g(x)dx − 2ε ≤ S(f, Z) + S(g, Z) ≤ S(f + g) ≤ S(f + g)
f (x)dx +
a
a
Zb
≤ S(f, Z) + S(g, Z) ≤
Zb
f (x)dx +
a
g(x)dx + 2 ε.
a
Für ε → 0 zeigt das S(f + g) = S(f + g) und
Zb
Zb
f (x)dx +
a
Zb
g(x)dx = S(f + g) = S(f + g) =
a
f (x) + g(x)dx.
a
Zu c) Für λ ≥ 0 gilt S(λ f, Z) = λ S(f, Z), und hieraus folgt S(λ f ) = λ S(f ). Ebenso
zeigt man S(λ f ) = λ S(f ), und das liefert
S(λ f ) = λ S(f ) = λ S(f ) = S(λ f ).
Analog verfährt man für negative λ.
Definition 8.14 Es sei f auf [a, b] integrierbar und es sei f (x) ≥ 0 für alle x ∈ [a, b].
Als Flächeninhalt der Ordinatenmenge
I0f = {(x, y) : a ≤ x ≤ b, 0 ≤ y ≤ f (x)}
bezeichnen wir die durch
µ(I0f )
Zb
=
f (x)dx
a
definierte nichtnegative reelle Zahl.
Damit haben wir den Zusammenhang zur Inhaltslehre hergestellt. Das erlaubt zukünftig
auch eine geometrische Interpretation der auftretenden Formeln. Als Beispiel betrachte
man die Aussage (b) der nachstehenden Folgerung:
Folgerung 8.15 Es seien f und g auf [a, b] integrierbar. Dann gelten:
(a)
Aus f ≤ g folgt
Rb
f (x)dx ≤
a
(b)
Rb
g(x)dx
(Monotonie).
a
Aus K1 ≤ f ≤ K2 mit zwei Konstanten K1 , K2 ∈ R folgt
Rb
K1 (b − a) ≤ f (x)dx ≤ K2 (b − a)
a
( Beschränktheit).
8.2 Eigenschaften Riemannscher Integrale
131
R
R
R
R
R
Beweis. Aus f ≤ g folgt g − f ≥ 0, also 0 ≤ (g − f ) = g − f , und somit f ≤ g.
Die Ungleichung (b) folgt nun aus (a) wegen
Zb
Zb
K1 (b − a) =
Zb
K1 dx ≤
f (x)dx ≤
a
K2 dx = K2 (b − a).
a
a
Satz 8.16 (Additivität des Integrals bezüglich des Integrationsbereiches) Es
seien a < c < b. Eine reelle Funktion f ist genau dann auf [a, b] integrierbar, wenn f auf
[a, c] und auf [c, b] integrierbar ist. In diesem Fall gilt
Zb
Zc
f (x)dx =
a
Zb
f (x)dx +
a
f (x)dx.
c
Beweis. Es seien I 0 = [a, c], I 00 = [c, b] und I = [a, b]. Sind Z 0 und Z 00 Zerlegungen von I 0
bzw. I 00 , so ist Z = Z 0 ∪ Z 00 eine Zerlegung von I. Daher ist
0
00
S I (f, Z 0 ) + S I (f, Z 00 ) ≤ S I (f, Z) ≤ S I (f ).
Hieraus folgt
0
00
S I (f ) + S I (f ) ≤ S I (f ).
Ist umgekehrt Z eine Zerlegung von I, so sind Z 0 = (Z ∩ [a, c]) ∪ {c} und Z 00 = {c} ∪
(Z ∩ [c, b]) Zerlegungen von I 0 und I 00 , und es gilt Z 0 ∪ Z 00 ≺ Z. Daher ist
0
00
0
00
S I (f, Z) ≤ S I (f, Z 0 ∪ Z 00 ) = S I (f, Z 0 ) + S I (f, Z 00 ) ≤ S I (f ) + S I (f ),
also auch
0
00
S I (f ) ≤ S I (f ) + S I (f ).
Entsprechend ergibt sich für die Obersummen (f ; −f ) die Ungleichungen
I0
I 00
I
I0
I
I 00
S (f ) + S (f ) ≤ S (f ) und S (f ) ≤ S (f ) + S (f ).
Aus diesen wechselseitigen Abschätzungen folgt nun die Behauptung des Satzes.
Zur Verallgemeinerung der Formel aus Satz 8.16 definieren wir zusätzlich
Za
Za
f (x)dx = −
f (x)dx = 0 und
a
Zb
f (x)dx
für
a ≤ b.
a
b
Dann ergibt sich der Satz:
Satz 8.17 Ist f auf I integrierbar und sind a, b, c ∈ I beliebig gegeben, so ist
Zb
Zc
f (x)dx +
a
Za
f (x)dx +
b
f (x)dx = 0.
c
132
8 INTEGRALRECHNUNG
Beweis. Im Fall a = b oder a = c folgt die Behauptung aus der zusätzlichen Definition.
Ist a 6= b 6= c 6= a, so kann wegen der Symmetrie der Formel sogar a < c < b angenommen
werden. Für diesen Fall ergibt sich die Behauptung aber aus Satz 8.16.
Satz 8.18 Ist f auf [a, b] integrierbar, so ist auch |f | integrierbar, und es gilt
b
Z
Zb
f (x) dx ≤
|f (x) |dx
a
(Dreiecksungleichung).
a
Beweis. Es sei I ⊆ [a, b] beliebig gegeben. Für x1 , x2 ∈ I gilt dann
|f (x1 )| − |f (x2 )| ≤ |f (x1 ) − f (x2 )| ≤ f (I) − f (I),
und hieraus folgt
|f |(I) − |f |(I) ≤ f (I) − f (I).
Daher gilt für jede Zerlegung Z die Ungleichung
S(|f |, Z) − S(|f |, Z) ≤ S(f, Z) − S(f, Z).
Folglich ist mit f auch |f | nach dem Riemannschen Kriterium integrierbar. Ferner ist
wegen ±f ≤ |f | nach Satz 8.15
Zb
±
Zb
±f (x)dx ≤
f (x)dx =
a
Zb
a
a
b
Zb
Z
|f (x)|dx, also f (x) dx ≤ |f (x)|dx.
Satz 8.19 Ist f auf [a, b] stetig und ist
a
a
Rb
|f (x)|dx = 0, so ist f ≡ 0 auf [a, b].
a
Beweis. Wäre f (x0 ) 6= 0 für ein x0 ∈ [a, b], so ist die Zahl ε = 21 | f (x0 ) | > 0. Wegen der
Stetigkeit von f existiert ein Intervall I0 = [a0 , b0 ] ⊆ [a, b] um x0 mit
|f (x) − f (x0 )| < ε
für alle
x ∈ I0 .
Folglich ist |f (x)| ≥ |f (x0 )| − ε = 2ε − ε = ε > 0 und somit
Zb0
Zb
|f (x)|dx ≥
a
Zb0
|f (x)|dx ≥
a0
im Widerspruch zur Voraussetzung.
a0
ε dx = ε(b0 − a0 ) > 0
8.3 Mittelwertsätze der Integralrechnung
8.3
133
Mittelwertsätze der Integralrechnung
Die Kombination der Grobabschätzung von Integralen mit dem Zwischenwertsatz für
stetige Funktionen führt auf die überaus wichtigen Mittelwertsätze der Integralrechnung.
Satz 8.20 (Mittelwertsatz der Integralrechnung) Ist f stetig auf dem Intervall
[a, b], so existiert eine Zahl ξ ∈ (a, b) mit
Zb
f (x)dx = f (ξ)(b − a).
a
Beweis. Nach Satz 8.15 ist
Zb
min f (x) · (b − a) ≤
f (x)dx ≤ max f (x) · (b − a).
a≤x≤b
a≤x≤b
a
Daraus folgt
1
min f (x) ≤
a≤x≤b
b−a
Zb
f (x)dx ≤ max f (x).
a≤x≤b
a
Nach dem Zwischenwertsatz existiert folglich eine Zahl ξ ∈ (a, b) mit
1
f (ξ) =
b−a
Zb
f (x)dx,
a
und hieraus folgt die Behauptung.
Die folgende Umformulierung des Mittelwertsatzes ist oft sehr nützlich:
Folgerung 8.21 Ist f stetig auf dem Intervall I, so existiert zu je zwei Punkten x, x+h ∈
I eine Zahl 0 < ϑ < 1 mit
x+h
Z
f (t)dt = h · f (x + ϑ h).
x
Satz 8.22 (Verallgemeinerter Mittelwertsatz) Sind f und g auf [a, b] stetig und ist
g ≥ 0 auf [a, b], so existiert eine Zahl ξ ∈ (a, b) mit
Zb
Zb
f (x)g(x)dx = f (ξ)
a
g(x)dx.
a
134
8 INTEGRALRECHNUNG
Beweis. Ist
Rb
g(x)dx = 0, so gilt g ≡ 0 auf [a, b] nach Satz 8.19. Die Behauptung ist in
a
diesem Fall daher trivial. Im anderen Fall setzen wir zur Abkürzung
K1 = min f (x), K2 = max f (x).
Wegen g ≥ 0 folgt K1 g(x) ≤ f (x)g(x) ≤ K2 g(x) für alle x ∈ [a, b], und die Integration
Rb
und anschließende Division durch g(x)dx ergibt
a
Zb
Zb
K1 ≤
g(x)dx ≤ K2 .
f (x)g(x)dx
a
a
Der Zwischenwertsatz für f ergibt die Existenz einer Zahl ξ ∈ (a, b) mit
Zb
Zb
f (ξ) =
g(x)dx,
f (x)g(x)dx
a
a
und hieraus folgt wieder die Behauptung.
8.4
Hauptsatz der Differential– Integralrechnung
In diesem Abschnitt werden wir zeigen, dass Integral– und Differentialrechnung komplementär zueinander sind. Die genaue Formulierung wird den Inhalt des Hauptsatzes und
seiner Umkehrung ausmachen, und es war die Leistung von Isaac Newton und Gottfried
W. Leibniz eben diesen Zusammenhang erkannt zu haben. Wir beginnen dabei mit der
Problemstellung, zu einer auf einem offenen Intervall I gegebenen stetigen Funktion f
eine Funktion F mit F 0 (x) = f (x) für alle x ∈ I zu finden. Jede solche Funktion F nennen wir eine Stammfunktion von f auf dem Intervall I. Aus Satz 7.24 wissen wir bereits,
dass für zwei stetig differenzierbare Funktionen F und G aus F 0 = G0 auf einem Intervall
I sofort F = G + const folgt. Stammfunktionen einer gegeben Funktion unterscheiden
sich also höchstens durch eine Konstante. Der folgende Hauptsatz zeigt nun, dass man
Stammfunktionen durch Integration mit variabler oberer Grenze erhalten kann:
Satz 8.23 (Hauptsatz der Differential- Integralrechnung) Es sei f auf einem offenen Intervall I definiert und stetig und es sei a ein beliebiger Punkt aus I. Dann ist die
Funktion
Zx
Φ(x) = f (t) dt, x ∈ (a, b),
a
eine Stammfunktion von f auf I, es gilt also
d
dx
Zx
f (t) dt = f (x) für alle x ∈ I.
a
(Integration produziert Stammfunktionen und Differentiation hebt Integration auf.)
8.4 Hauptsatz der Differential– Integralrechnung
135
Beweis. Wir untersuchen den Differentialquotienten für Φ(x) und verwenden dabei den
Mittelwertsatz der Integralrechnung und die Stetigkeit von f . So ergibt sich:
 x+h

x+h
Z
Zx
Z
1
1
1
Φ(x + h) − Φ(x)
=
f (t)dt − f (t)dt =
f (t)dt = · h · f (x + ϑh) → f (x).
h
h
h
h
a
a
x
0
Das zeigt Φ (x) = f (x) für alle x ∈ I.
Satz 8.24 (Umkehrung des Hauptsatzes) Ist f auf dem offenen Intervall I stetig
und ist F eine Stammfunktion von f auf I, so gilt
Zx
f (t) dt = F (x) − F (a) für alle x, a ∈ I.
a
(Mittels Stammfunktionen lassen sich Integrale berechnen.)
Wir geben diesem Satz noch eine andere Fassung:
Satz 8.25 (Umkehrung des Hauptsatzes, zweite Fassung) Ist F stetig differenzierbar auf I, so ist
Zx
d
F (t) dt = F (x) − F (a).
dt
a
(Integration hebt die Differentiation bis auf eine Konstante auf.)
Beweis. Ist F eine Stammfunktion von f , so gilt F 0 (x) = f (x) für alle x ∈ I. Andererseits
ist nach Satz 8.23 aber auch Φ0 (x) = f (x) auf I. Daher ist F 0 = Φ0 auf I, und aus Satz
7.24 folgt die Gleichung
Φ(x) = F (x) + const, x ∈ I.
Für x = a folgt 0 = Φ(a) = F (a) + const, also ist const = −F (a) und somit
Zx
f (t)dt = Φ(x) = F (x) − F (a).
a
Definition 8.26 (Unbestimmtes Integral) Unter dem unbestimmten Integral einer
stetigen Funktion f (auf einem offenen Intervall I) versteht manRdie Menge aller Stammfunktionen von f (auf I). Das unbestimmte Integral wird durch f (x) dx bezeichnet.
R
Wegen Satz 7.24 ist F 0 (x) = f (x) äquivalent zu f (x)dx = F (x) + C. Nach den Sätzen
8.23 und 8.24 gilt ferner
 x

Z
Z

Menge aller Stammfunktionen von f = f (x) dx ⊇
f (t)dt : a ∈ I .


a
Die früheren Beispiele für die Ableitung von Funktionen führen zu der folgenden Tabelle
von Grundintegralen, wie man durch Differentiation leicht bestätigt. Diese Tabelle ist nach
Satz 8.24 für die explizite Berechnung von Integralen sehr wertvoll.
136
8 INTEGRALRECHNUNG
Tabelle einiger Grundintegrale
Gültigkeitsbereich
R
f (x)dx = F (x) + C
Probe
(0, ∞)
R
xα dx =
1
α+1
F0 = f
(−∞, 0) ∪ (0, ∞)
R
dx
x
(−∞, ∞)
R
ex dx = ex + C
(−∞, ∞)
R
sin x dx = − cos x + C
(−∞, ∞)
R
cos x dx = sin x + C
(− π2 , π2 )
R
dx
cos2 x
(−1, 1)
R
√ dx
1−x2
xα+1 + C, α 6= −1
= ln |x| + C
= tan x + C
= arcsin x + C
= − arccos x + C1
(−∞, ∞)
R
dx
1+x2
= arctan x + C
= −arccot x + C1
(−∞, ∞)
R
sinh x dx = cosh x + C
(−∞, ∞)
R
cosh x dx = sinh x + C
(−∞, 1) ∪ (1, ∞)
R
√ dx
x2 −1
= arcosh x + C
(−∞, ∞)
R
√ dx
x2 +1
= arsinh x + C
8.5 Integrationsmethoden
8.5
137
Integrationsmethoden
Der Hauptsatz 8.23 in Kombination mit bereits behandelten Differentiationsregeln ergibt
wichtige Integrationsmethoden.
Satz 8.27 (Partielle Integration) Sind u und v auf dem offenen Intervall I stetig differenzierbar, so gelten
Zb
b Z b
u(x)v (x)dx = u(x)v(x) −
u0 (x)v(x)dx und
0
a
a
Z
u(x)v 0 (x)dx = u(x)v(x) −
a
Z
u0 (x)v(x)dx.
b
Dabei bedeutet u(x)v(x) = u(b)v(b) − u(a)v(a).
a
Beweis. Durch Integration der Produktregel
(u · v)0 = u0 v + u v 0
ergibt sich nach Satz 8.23 die Formel
b Z b
Zb
0
u(x)v(x) =
u (x)v(x)dx +
u(x)v 0 (x)dx,
a
a
a
woraus die Behauptung folgt.
R
Beispiel 8.28 a) Zur Berechnung von x cos x dx setzen wir u(x) = x und v 0 (x) =
cos x. Dann ist erfreuerlicherweise u0 (x) = 1 und v(x) = sin x (+C). Somit ergibt sich
Z
Z
x cos x dx = x sin x −
1 · sin x dx = x sin x + cos x + C.
R
b) Für Anwendungen wichtig (z.B. Energieberechnung) ist das Integral sin2 x dx. Wir
schreiben sin2 x = sin x·sin x und setzen u(x) = sin x und v 0 (x) = sin x, v(x) = − cos x.
Das ergibt
Z
Z
Z
2
2
sin x dx = − sin x cos x +
cos x dx = − sin x cos x +
1 − sin2 x dx
Z
= − sin x cos x + x −
sin2 x dx.
R
Die Addition von sin2 x dx auf beiden Seiten ergibt
Z
1
2
sin2 x dx = − sin x cos x + x + C = x − sin 2x + C, also
2
Z
1
1
C
sin2 x dx =
x − sin 2x + C1 mit C1 = .
2
2
2
138
8 INTEGRALRECHNUNG
R
c) Ein weiterer Trick begegnet uns bei der Berechnung des Integrals ln x dx. Diesmal
setzen wir ln x = 1 · ln x und u0 (x) = 1, v(x) = ln x, u(x) = x. Das ergibt
Z
Z
Z
x
ln x dx =
1 · ln x dx = x ln x −
dx = x ln x − x + C = x(ln x − 1) + C.
x
Satz 8.29 (Die Substitutionsregel) Es sei f stetig auf I und es sei g stetig differenzierbar auf I1 mit g(I1 ) ⊆ I. Dann gelten für alle a, b ∈ I1 die Formeln
Zb
Zg(b)
0
f (g(x))g (x)dx =
a
Z
f (z) dz und
Z
0
f (g(x))g (x) dx =
f (z) dz g(a)
.
z=g(x)
Beweis. Die Kettenregel ergibt
d
dx
Zg(x)
d
f (z)dz =
dz
Z
f (z)dz g(a)
Also ist
g(x)
R
·
z=g(x)
d
g(x) = f (g(x)) · g 0 (x).
dx
f (z) dz eine Stammfunktion von f (g(x)) · g 0 (x).
g(a)
8.30 (Anwendung der Substitutionsregel von links nach rechts“)
”
Wenn der Integrand die Gestalt eines Produktes hat, das sogar in der Form f (g(x)) · g 0 (x)
oder g 0 (x)f (g(x)) geschrieben werden kann, so ist die Formel aus Satz 8.29 mit Erfolg
anwendbar. Wir geben einige Beispiele.
R
R
R
1
1
2
2
a)
x · sin x dx = 2 2x · sin x dx
= 2 sin z dz z=x2
= − 12 cos z b)
R
Z
c)
sin x
cos x e
ln x
dx
x
dx
=
R
e dz +C
z=x2
z
= − 21 cos x2 + C
= e
z
z=sin x
Z
=
=
1
· ln x dx
x
1 2 z
+C
2 Z
=
=
z=ln x
Z
d)
x
dx
1 + x2
=
=
Z
1
1
2x ·
dx
2
1 + x2
1
ln |z| +C
2
z=1+x2
=
=
+ C = esin x + C
z=sin x
z dz z=ln x
1
(ln x)2 + C.
2
Z
1
1 dz
2
z z=1+x2
1
2
ln(1 + x2 ) + C .
8.5 Integrationsmethoden
139
8.31 (Anwendung der Substitutionsregel von rechts nach links“)
”
Während in 8.30 die zu verwendenden Substitutionen meistens auf der Hand liegen, ist
bei der Anwendung von rechts nach links“ eine geeignete Substitution erst zu entdecken.
”R
2
dz
2
a) Für das Integral √1−z
2 bietet sich wegen cos t = 1 − sin t die Substitution z = sin t
an. Es ist dann z 0 = cos t, also
Z
Z
Z
1
cos t
dz
√
p
dt
=
· cos t dt =
| cos t|
1 − z2
1 − sin2 t
Z
= ± dt = ± t + C = ± arcsin z + C.
b) Zur Berechnung des Flächeninhaltes
√ des Einheitskreises haben wir den Inhalt der
Ordinatenmenge der Kreislinie f (z) = 1 − z 2 zu berechnen. Man setzt wiederum z =
sin t und erhält:
µ(I0f ) =
Z1 √
−1
1 − z 2 dz =
Zπ/2 p
1 − sin2 t · cos t dt =
−π/2
Zπ/2
cos2 t dt
−π/2
π/2
π
1
= .
=
(t + sin t cos t)
2
2
−π/2
8.32 (Die Lineare Substitution) z = ax + b ist problemlos möglich und führt auf
Z
Z
1
f (z)dz.
f (ax + b)dx =
a
Wir wenden dieses Ergebnis auf einige Beispiele an:
R
R
a) sin(2x − 1)dx = 21 sin z dz = − 21 cos z + C = − 12 cos(2x − 1) + C.
R
dx
b) Wir betrachten √x2 −4x+1
. Durch die quadratische Ergänzung ergibt sich x2 −4x+1 =
√
√
(x − 2)2 − 3. Mit z = x − 2 ist dx = dz, und mit u = z/ 3 ist dz = 3 du. Daraus folgt
Z
Z
Z
Z
dx
1
dx
dz
dz
√
p
√
q
=
=√
=
x2 − 4x + 1
z2 − 3
3
(x − 2)2 − 3
( √z3 )2 − 1
√ Z
3
du
x−2
√
= √
= Arcosh u + C = Arcosh √ + C.
u2 − 1
3
3
8.33 (Integration von Potenzreihen) Wir wissen bereits, dass Potenzreihen auf ihrem Konvergenzbereich gliedweise differenziert werden können. Wegen der Umkehrung
des Hauptsatzes gilt daher
Z X
∞
∞ Z
∞
X
X
ak
k
k
ak x dx =
ak x + C =
xk+1 + C.
k
+
1
k=0
k=0
k=0
140
8 INTEGRALRECHNUNG
8.34 (Die Grenzen der Berechnung von Stammfunktionen) Es erhebt sich die
Frage, ob man eigentlich durch geschickte Anwendung der Integrationsregeln zu jeder
vernünftigen Funktion eine Stammfunktion berechnen kann. Natürlich existiert zu jeder
stetigen Funktion eine Stammfunktion, hier wird jedoch die Frage nach der formelmäßigen
Berechnung gestellt. Zur Präzisierung der zu betrachtenden Funktionenklasse definieren
wir:
Es sei E die kleinste Menge von Funktionen mit folgenden Eigenschaften:
(a) E enthält alle Potenzfunktionen, alle Exponentialfunktionen, alle trigonometrischen
Funktionen.
(b) Sind f, g ∈ E, so sind auch f ± g, f · g, f / g, f ◦ g und f −1 in E, sofern diese
Bildungen definiert sind.
Die Menge E heißt die Menge der elementaren Funktionen.
Die Differentiationsregeln zeigen die Gültigkeit des folgenden Satzes:
Satz. Die Ableitung jeder elementaren Funktion ist wieder elementar.
Demgegenüber ist nicht jede Stammfunktion einer elementaren Funktion eine elementare
Funktion. Beispielsweise sind die Funktionen
Zx
Si(x)
=
Φ(x)
=
sin t
dt
t
0
Zx
t2
1
1
√
e− 2 dt +
2
2π
(Integralsinus)
(Gaußsche Fehlerfunktion)
0
keine elementaren Funktionen (J. Liouville 1809–1882). Für einen Beweis dieser Tatsache fehlen uns hier die Hilfsmittel. Beide der o.g. Funktionen haben in der höheren
Mathematik größere Bedeutung (Theorie der Fourierreihen und Wahrscheinlichkeitsrechnung). Nach 8.33 sind die Funktionen Si(x) und Φ(x) analytisch, denn die Integranden
sind analytisch:
sin t
1
t3 t5
t2 t4
=
t − + − +... = 1 − + − +...,
t
t
3! 5!
3! 5!
2 /2
e−t
=
∞
∞
X
(−t2 /2)k X (−1)k t2k
=
.
k · k!
k!
2
k=0
k=0
Die Integration kann nun zwar gliedweise erfolgen. Damit erhält man zwar eine Potenzreihendarstellung für Si(x) und Φ(x), aber, wie schon erwähnt, sind diese beiden
8.6 Integration rationaler Funktionen
141
Funktionen nachweisbar keine elementaren Funktionen.
Aufgaben zu Abschnitt 8.33
1. Berechnen Sie:
a)
R
2. Zeigen Sie
a)
R2π
b)
R2π
x2 sin x dx,
b)
R
x2 ex dx,
c)
R
sin x cos x dx.
einx e−imx dx = 0 für n, m ∈ N, n 6= m,
0
sin nx sin mx dx = 0 für alle n, m ∈ N, n 6= m.
0
3. Berechnen Sie:
R
d) √xx2 −1 dx,
a)
R
e)
R
tan x dx =
√ dx
2−x2
R
sin x
cos x
dx,
b)
R
2
x e−x dx,
R
ln(2x+1) dx,
dx.
4. Entscheiden Sie, für welche k ∈ N die Funktionen fk (x) = xk e−x
grierbar sind.
8.6
c)
2 /2
elementar inte-
Integration rationaler Funktionen
In diesem Abschnitt soll gezeigt werden, dass rationale Funktionen elementar integrierbar
sind. Wir werden dies am Beispiel demonstrieren und die notwendigen Verallgemeinerungen für den allgemeinen Fall diskutieren. Die Hauptidee für die Integration rationaler
Funktionen besteht in der Anwendung der Methode der Partialbruchzerlegung.
Unser Beispiel ist die Funktion
f (x) =
x2 + 6x + 3
.
x3 + x2 − 2
1. Schritt. Wir nehmen eine Zerlegung der Nennerfunktion N (x) = x3 + x2 − 2 in reell
irreduzible Faktoren vor (vgl. Aufgabe 2 aus Abschnitt 6.5). Die reelle Nullstelle x0 = 1
von N (x) ermöglicht die Abspaltung des Linearfaktors (x − 1), und es ist
N (x) = (x − 1)(x2 + 2x + 2)
mit dem irreduziblen Faktor (x2 + 2x + 2).
2. Schritt. Ausgehend von der Zerlegung der Nennerfunktion betrachten wir den Ansatz
f (x) =
A
x2 + 6x + 3
Bx + C
=
+ 2
3
2
x +x −2
x − 1 x + 2x + 2
und versuchen, Zahlen A, B und C geeignet zu bestimmen. Die Multiplikation mit der
Nennerfunktion N (x) ergibt
x2 + 6x + 3 = A(x2 + 2x + 2) + (Bx + C)(x − 1)
= (A + B)x2 + (2A − B + C)x + 2A − C .
Der Koeffizientenvergleich führt auf das eindeutig lösbare lineare Gleichungssystem
142
8 INTEGRALRECHNUNG
A
2A
2A
+ B
− B
+ C
− C
= 1
= 6
= 3
mit den Lösungen A = 2, B = − 1 und C = 1.
3. Schritt. Wir können nun die Einzelterme integrieren. Es ist
Z
2
a) I1 =
dx
=
2 ln | x − 1 | + C,
x
−
1
Z
Z
−x + 1
−x + 1
b) I2 =
dx =
dx,
2
x + 2x + 2
(x + 1)2 + 1
und die Substitution z = x + 1, dz = dx, ergibt
Z
Z
Z
−z + 2
z
dz
dz = −
dz + 2
I2 =
2
2
z +1
z +1
1 + z2
Z
1
2z
= −
dz + 2 arctan z
2
2
z +1
Z
1
1
du + 2 arctan z, (u = z 2 + 1),
= −
2
u
= −
= −
1
ln | z 2 + 1 | + 2 arctan z + C
2
1
ln((x + 1)2 + 1) + 2 arctan(x + 1) + C .
2
Zusammenfassend ist
Z
f (x)dx = 2 ln |x − 1| −
1
ln(x2 + 1) + arctan(x + 1) + C.
2
Damit ist das Beispiel vollständig behandelt.
Der allgemeine Fall einer echt gebrochenen rationalen Funktion
f (x) =
Z(x)
Z(x)
=
r
r
N (x)
(x − a1 ) 1 · . . . · (x − ak ) k · ((x − b1 )2 + c1 )s1 · . . . · (x − bl )2 + cl )sl
führt auf die Partialbruchzerlegung
f (x) =
A1
Ar 1
B1 x + C1
Bs1 x + Cs1
+...+
+...+
+...+
+...,
r
2
1
(x − a1 )
(x − a1 )
((x − b1 ) + c1 )
((x − b1 )2 + c1 )s1
und die Algebra lehrt, dass es eindeutig bestimmte reelle Zahlen Aj , Bj , Cj mit dieser
Eigenschaft wirklich gibt. Die Integration der Terme
Aj
(x − a1 )p
8.6 Integration rationaler Funktionen
143
ist durch die Substitution z = x − a1 zu erledigen. Für die Integration von
Bj x + Cj
((x − b1 )2 + C1 )q
substituieren wir u = x − b1 . Das führt auf einen Ausdruck der Form
Dj u
Ej
Dj u + Ej
=
+
.
2
q
2
q
2
(u + C1 )
(u + C1 )
(u + C1 )q
Der erste Summand wird durch die Substitution v = u2 +C1 , dv = 2u du, leicht
√zugänglich,
2
2
während der zweite Summand durch die Substitution u = C1 w , du = ± C1 dw, auf
die Form
Fj
2
(w + 1)q
gebracht werden kann. Für Integrale der Form
Z
1
Iq : =
dw
2
(w + 1)q
finden wir schließlich die folgende Rekursionsformeln
I1 = arctan w + C,
1
w
2q − 1
Iq+1 =
+
Iq .
2
q
2q (w + 1)
2q
In der Tat führt eine partielle Integration von Iq mit
1
,
g 0 (w) = 1,
(w2 + 1)q
2qw
h0 (w) = −
, g(w) = w,
2
(w + 1)q+1
h(w) =
auf die Gleichung
Z
w
dw
w2
=
=
+
2q
dw
(w2 + 1)q
(w2 + 1)q
(w2 + 1)q+1
Z
w
w2 + 1
1
=
+
2q
−
dw
(w2 + 1)q
(w2 + 1)q+1
(w2 + 1)q+1
Z
Iq
=
(w2
w
+ 2q (Iq − Iq+1 ),
+ 1)q
und die Auflösung dieser Gleichung nach Iq+1 ergibt die behauptete Rekursionsformel.
Aufgaben zu 8.6
1. Integrieren Sie die Funktion f (x) =
3x3 − 8x2 + 5x − 9
.
x4 − 3x3 + x2 + 4
2. Integrieren Sie die Funktion f (x) =
x3
.
x2 − 2x + 1
144
8.7
8 INTEGRALRECHNUNG
Vertauschung von Limes und Integral
Das Problem: Ist (fn ) eine Folge integrierbarer Funktionen auf dem Intervall I und
konvergiert die Folge (fn (x)) für jedes x ∈ I, so kann durch die Gleichung
f (x) = lim fn (x),
n→n
x ∈ I,
eine neue Funktion f auf I definiert werden. Es erhebt sich nun die Frage, ob f selbst
wieder integrierbar ist und ob sogar
Z
Z
lim fn (x)dx = lim
fn (x)dx
(?)
n→∞
n→∞
gilt. Eine solche Aussage war uns in 8.33 bei der Integration von Potenzreihen bereits
begegnet. Im allgemeinen ist aber für das Riemannsche Integral eine positive Antwort nur
unter ziemlich starken Voraussetzungen zu erhalten.
Wir betrachten zunächst zwei Gegenbeispiele. Es sei I = [0, 1]. Die Menge M = [0, 1] ∩ Q
der rationalen Zahlen im Intervall I werde zu einer Folge M = {r1 , r2 , . . .} angeordnet.
Wir definieren eine Folge (fn ) von Funktionen durch
(
fn (x) =
1
für x ∈ {r1 , . . . , rn },
0
sonst.
Dann ist jede Funktion fn integrierbar mit
R1
fn (x)dx = 0. Die Grenzfunktion
0
f (x) = lim fn (x)
n→∞
ist aber gerade die Dirichlet–Funktion, die sich als nicht Riemann–integrierbar erwiesen
hatte. Das zeigt, dass Grenzfunktionen Riemann–integrierbarer Funktionen nicht einmal
Riemann–integrierbar sein müssen. Dieser Mangel des Riemannschen Integrals war für H.
Lebesgue (1875 – 1941) der Anlass, ein leistungsfähigeres Integral, das heute Lebesgue–
Integral genannt wird und von größter Bedeutung in der modernen Mathematik ist, zu
schaffen. Die Einführung dieses Integrals geht über dem Rahmen dieses Lehrmaterials
hinaus und ist einem Kurs Maß– und Integrationstheorie vorbehalten.
Weiter zeigt sich (und dieser Effekt wird auch beim Lebesgue–Integral auftreten), dass im
Fall der Integrierbarkeit der Grenzfunktion die Gleichung (?) dennoch nicht gelten muss.
Für die in Abbildung 8.7 definierte Folge stetiger Funktionen fn gilt offenbar fn (x) → 0
für alle x ∈ [0, 1], aber andererseits ist
Z1
Z1
fn (x) dx = 1 6= 0 =
fn (x)dx = 1, also lim
0
Z1
0
0 dx.
0
Um zu positiven Ergebnissen zu kommen, müssen wir bei Verwendung des Riemannschen
Integrals stärkere Voraussetzungen an die Güte der Konvergenz fn (x) → f (x) machen.
Wir verallgemeinern dazu die Definition der gleichmäßigen Konvergenz (siehe Def. 6.18),
die wir bisher nur für stetige Funktionen eingeführt hatten, ein wenig:
8.7 Vertauschung von Limes und Integral
145
Abbildung 29: Eine Funktionenfolge mit limn
R
fn (x) dx 6=
R
limn fn (x) dx
Definition 8.35 Eine Folge von Funktionen fn heißt gleichmäßig konvergent gegen
die Funktion f auf dem Intervall I, wenn die folgende Bedingung erfüllt ist:
lim sup | fn (x) − f (x) | = 0.
n→∞
x∈I
Ein wichtiges Beispiel einer solchen Situation behandelt der folgende Satz, den wir auch
schon früher hätten beweisen können:
Satz 8.36 Die Folge der Partialsummen einer Potenzreihe f konvergiert auf jeder kompakten Teilmenge des Konvergenzkreises sogar gleichmäßig gegen f .
P
Beweis. Es sei f (x) =
an (x − x0 )n mit Konvergenzradius R > 0 gegeben. Zu jeder
kompakten Teilmenge M ⊆ KR (x0 ) = {x : |x − x0 | < R} existiert eine Zahl 0 ≤ ρ < R
mit M ⊆ {x : |x − x0 | ≤ ρ} ⊆ KR (x0 ). Also ist
∞
∞
n
X
X
X
ak ρk → 0,
ak (x − x0 )k ≤
ak (x − x0 )k ≤ sup sup f (x) −
x∈M
|x−x0 |≤ρ
k=n+1
k=1
k=n+1
was zu beweisen war.
Nun gilt der folgende Grenzwertsatz:
Satz 8.37 (Ein Grenzwertsatz) Konvergiert die Folge (fn ) von Riemannintegrierbaren Funktionen auf dem beschränkten, abgeschlossenen Intervall I gleichmäßig
gegen die Funktion f , so ist f integrierbar und es gilt
Z
Z
lim
fn (x)dx =
f (x)dx.
n→∞
I
I
Beweis. Die Funktion f ist als gleichmäßiger Grenzwert von beschränkten Funktionen
selbst beschränkt. Die Integrierbarkeit von f beweisen wir mit dem Riemannschen Integrabilitätskriterium. Es sei ε > 0 beliebig gegeben. Dann existiert eine Zahl N = N (ε)
derart, dass die folgende Ungleichung gilt:
ε
sup |f (x) − fn (x)| <
für alle n ≥ N.
µ(I)
x∈I
146
8 INTEGRALRECHNUNG
Zu fN wählen wir nun eine Zerlegung Z derart, dass S(fN , Z) − S(fN , Z) < ε gilt. Dann
ist
S(f, Z)−S(f, Z) ≤ |S(f, Z)−S(fN , Z)|+|S(fN , Z)−S(fN , Z)|+|S(fN , Z)−S(f, Z)| < 3ε.
Also ist f integrierbar. Überdies gilt
Z
Z
Z
|fn (x) − f (x)| dx ≤ ε für alle n ≥ N (ε),
f (x)dx ≤
fn (x)dx −
I
I
I
und das beweist die Behauptung des Satzes.
Anwendung betrachten wir die Formel für die Differentiation eines Integrals nach
einem Parameter. Es seien I und J zwei kompakte Intervalle, und die Funktion f (x, t) :
∂
I×J → R sei auf I×J stetig partiell differenzierbar nach t. Dann ist die Ableitung ∂t
f (x, t)
auf I × J sogar gleichmäßig stetig, und es gilt
Z
Z
d
∂
f (x, t) dx.
f (x, t) dx =
dt
∂t
I
I
Beweis. Unter Verwendung des Mittelwertsatzes der Differenzialrechnung sieht man, dass
die Folge der Differenzenquotienten bezüglich t gleichmäßig auf I gegen die partielle
Ableitung konvergiert. Daher ist der Satz 8.37 anwendbar.
Aufgaben zu Abschnitt 8.7
d
1. Berechnen Sie
dt
Z1
d
sin(tx) dx und
dt
0
Zt
sin(tx) dx.
0
2. Darf man für die Funktionenfolge (fn (x)) mit fn (x) =
R∞
mit dem Integral −∞ vertauschen?
8.8
√1
2πn
x2
e− 2n den Limes lim
n→∞
Uneigentliche Integrale
Wir wollen in diesem Abschnitt die Integration auf unbeschränkte Intervalle und auf
unbeschränkte Funktionen ausdehnen. Dazu definieren wir:
Definition 8.38 Die Funktion f sei auf dem Intervall [a, b) definiert und auf jedem abgeschlossenen Teilintervall [a, c] ⊆ [a, b) integrierbar. Dann heißt
Zb
Zc
f (x) dx = lim
f (x) dx
c%b
a
a
das uneigentliche Integral von f auf [a, b), falls der Limes existiert. Entsprechend wird
die Integration auf (a, b] und auf (a, b) definiert.
8.8 Uneigentliche Integrale
147
Bemerkung 8.39 Falls f auf dem Intervall [a, b] integrierbar ist, so fallen das eigentliche
und das soeben definierte uneigentliche Integral zusammen, so dass die Symbolik nicht
zweideutig ist. In der Tat gilt für integrierbare Funktionen die Abschätzung
Zc
Z b
Zb
f (x) dx =
f (x) dx≤ |b − c| · sup |f (x)| → 0 für c % b.
f (x) dx −
a≤x≤b
a
a
c
Beispiel 8.40 Wir betrachten einige Beispiele.
K
RK −x
R∞ −x
−x e dx = lim −e = 1 − lim (−e−K ) = 1.
(a) e dx = lim
(b)
R1
ln x dx = lim
R∞
1
R1
ε&0 ε
0
(c)
K→∞
K→∞ 0
0
1
x
RK
dx = lim
K→∞ 1
K→∞
0
1
ln x dx = lim x ln x − x = lim (−1 − ε ln ε + ε) = −1
ε&0
ε&0
ε
1
x
dx = lim ln K = ∞
K→∞
∞ (
R∞ dx
∞
x−α+1 = lim
=
(d)
1
α
K→∞ −α + 1
1 x
1
α−1
für 0 < α < 1
für α > 1.
Uneigentliche Integrale können auch vorteilhaft bei Konvergenzuntersuchungen unendlicher Reihen eingesetzt werden, wir hatten das folgende Kriterium bereits in 5.11 benutzt.
Satz 8.41 (Cauchyscher Integraltest) Es sei f eine monoton fallende nicht negative
Funktion auf [1, ∞). Dann gilt
Z∞
f (x) dx < ∞
genau dann, wenn
∞
X
f (n) < ∞.
n=1
1
Beweis. Die Idee des Beweises besteht darin, die Summen
K
P
f (n) als Ober- bzw. Un-
n=1
tersummen des Riemannschen Integrals aufzufassen. Es gelte zunächst
R∞
f (x) dx < ∞.
1
Wegen
∞
X
f (n) = lim
K→∞
n=2
K
X
n=2
f (n) = lim
K
X
K→∞
Z∞
ZK
f (n)·(n−(n−1)) ≤ lim
konvergiert dann die Reihe. Setzen wir umgekehrt
1
∞
P
f (x)dx < ∞
f (x)dx =
K→∞
n=2
1
f (n) < ∞ voraus, so folgt
n=1
ZK
Z2
f (x)dx ≤
1
ZK
f (x)dx ≤ f (1) +
f (x)dx +
1
2
K−1
X
n=1
f (n) ≤ f (1) +
∞
X
n=1
f (n) < ∞.
148
8 INTEGRALRECHNUNG
Daraus folgt lim
RK
K→∞ 1
f (x)dx < ∞.
In 5.11 haben wir das Kriterium bereits zur Untersuchung der Dirichlet-Reihen
∞
P
k=1
1
kα
in
Abhängigkeit von α > 0 benutzt und einen Umschlag im Konvergenzverhalten für α = 1
gefunden. Da wir inzwischen über leistuungsfähige Methoden zur Berechnung von Integralen verfügen, können wir aber mit Hilfe des Integraltestes sogar Feinuntersuchungen zu
dieser Reihe anstellen. Dies ist der Inhalt von Aufgabe 1. Als weiteres Beispiel betrachten
wir die Γ-Funktion.
8.42 (Die Γ-Funktion) Die Funktion
Z∞
Γ(s) =
xs−1 e−x dx,
s > 0,
0
heißt Gamma-Funktion. Der Name wurde zu Ehren von Carl Friedrich Gauss gewählt
und die Nützlichkeit dieser Funktion werden wir sogleich beleuchten. Wir weisen zunächst
die Konvergenz des Integrals nach. Es sei s > 0. Die Funktion f (x) = xs−1 e−x ist auf [1, ∞)
nichtnegativ und wegen
f 0 (x) = (s − 1)xs−2 e−x − xs−1 e−x = (s − 1 − x)xs−2 e−x < 0 für x > s − 1
auf (s − 1, ∞) auch monoton fallend. Für die Konvergenz von
R∞
f (x)dx genügt es daher
1
nach 8.41, die Konvergenz der Reihe
X
f (n) =
n≥s
∞
X
ns−1
en
n=1
nachzuweisen. Das Wurzelkriterium ergibt
√
n
ns−1 e−n →
also konvergiert die Reihe und damit auch
R∞
1
< 1,
e
f (x)dx. Weiter ist
1
Z1
x
0
s−1 −x
Z1
e dx ≤
x
0
s−1
Z1
dx = lim
x
ε→0
ε
s−1
1
xs 1
=
dx = lim
ε→0 s
s
ε
für alle s > 0. Das zeigt insgesamt, dass Γ(s) für alle s > 0 definiert ist. Wir beweisen
nun die wichtige Rekursionsformel:
Γ(1) = 1 und Γ(s + 1) = s Γ(s) für alle s > 0.
8.9 Integration und Inhaltslehre
149
In der Tat erhält man (Partielle Integration!):
∞
Z∞
Z∞
s −x
s −x xs−1 e−x dx = 0 + s Γ(s),
Γ(s + 1) =
x e dx = −x e + s
0
Z∞
Γ(1) =
0
0
∞
e−x dx = −e−x 0 = 1.
0
Als Folgerung ergibt sich
Γ(n + 1) = n! für alle n ∈ N.
Die Γ-Funktion ist also eine differenzierbare Fortsetzung der Fakultätsfunktion
(s. Aufgabe 4).
Aufgaben zu Abschnitt 8.8
1. Man zeige unter Verwendung von 8.41, dass die Reihe
die Reihe
∞
P
n=2
∞
P
n=2
1
n(ln n)2
1
n ln n
auch noch divergiert,
aber bereits konvergiert.
2. Man berechne die 1. kosmische Geschwindigkeit.
3. Fertigen Sie eine Skizze des Graphen der Γ-Funktion an.
4. Beweisen Sie, dass die Γ-Funktion auf (0, ∞) konvex ist.
8.9
Integration und Inhaltslehre
Den Flächeninhalt der Ordinatenmenge einer stetigen Funktion haben wir bereits in Definition 8.14 mit Hilfe des Integrals eungeführt. In diesem Abschnitt wollen wir nun allgemein und systematisch den Riemannschen Flächeninhaltsbegriff einführen, auch um eine
höherdimensionale Inhaltslehre zu begründen. Nach der bereits von Archimedes benutzten Exhaustionsmethode (= Methode des Ausschöpfens) gehen wir dabei folgendermaßen
und in großer Analogie zur Definition des Riemannschen Integrals vor:
Definition 8.43 (Der 2dim Riemannschen Inhalt) Der zweidimensionale
mannsche Inhalt einer Menge M ⊂ R2 wird schrittweise definiert:
Rie-
1. Unter einem Eichquadrat n–ter Ordnung verstehen wir eine Menge der Form
m m+1
k k+1
Qn;m,k = n ,
× n,
⊂ R2 für k, m, n ∈ Z.
2
2n
2
2n
Es sei Qn die Menge aller Eichquadrate n-ter Ordnung. Die Zahl en =
der elementare Flächeninhalt der Eichquadrate n-ter Ordnung.
1 2
2n
heißt
150
8 INTEGRALRECHNUNG
2. Für eine beschränkte Menge M ⊆ R2 definieren wir den inneren bzw. äußeren
Inhalt der Menge M vom Grad n durch
µn (M ) = en ·card{Q ∈ Qn : Q ⊆ M } bzw. µn (M ) = en ·card{Q ∈ Qn : M ∩Q 6= ∅}.
Weiter definieren wir den inneren bzw. äußeren Inhalt von M durch
µ(M ) = sup µn (M ) = lim µn (M ) bzw. µ(M ) = inf µn (M ) = lim µn (M ).
n∈N
n→∞
n→∞
n∈N
3. Schließlich heißt die Menge M quadrierbar, wenn µ(M ) = µ(M ) ist. In diesem
Fall heißt die Zahl µ(2) (M ) = µ(M ) = µ(M ) der 2–dimensionale Riemannsche
oder auch der Peano–Jordansche Inhalt von M .
Abbildung 30: Der Riemannsche Inhalt einer Menge M
Nicht jede Teilmenge M ⊂ R2 ist quadrierbar, ein solches Beispiel ist die Ordinatenmenge
der Dirichletfunktion, also die Menge
M = {(x, y) ∈ R2 : x ∈ Q ∩ [0, 1], y ∈ [0, 1]}.
Für diese Menge ist nämlich µ(M ) = 0 6= µ(M ) = 1.
Ohne große Mühe (bitte ausführen!) beweist man:
Satz 8.44 Der zweidimensionale Inhalt µ = µ(2) hat die folgenden Eigenschaften:
(a) µ(Q) = en für alle Eichquadrate Q ∈ Qn und µ(∅) = 0.
(b) Sind M1 , M2 ⊆ R2 quadrierbar mit M1 ⊆ M2 , so ist µ(M1 ) ≤ µ(M2 ). (Monotonie)
(c) Sind M1 , M2 ⊆ R2 quadrierbar und disjunkt, so ist M1 ∪ M2 quadrierbar und es gilt
µ(M1 ∪ M2 ) = µ(M1 ) + µ(M2 ).
(Additivität)
(d) Sind I1 , I2 Intervalle in R, so ist I1 × I2 quadrierbar und es gilt
µ(I1 ×I2 ) = µ(1) (I1 )·µ(1) (I2 ).
(Dimensionsredukion)
(e) Für jede Matrix A ∈ R2,2 und alle Eichquadrate Q gilt
µ(A(Q)) = µ{A~x : ~x ∈ Q} = | det A| · µ(Q).
8.9 Integration und Inhaltslehre
151
Wir wollen nun Methoden zur effektiven Berechnung von Inhalten entwickeln.
Definition 8.45 (Normalbereich) Eine Teilmenge M ⊆ R2 heißt ein Normalbereich
bezüglich der y-Achse, wenn es ein Intervall I = [a, b] ⊆ R und stetige Funktionen f und
g auf I so gibt, dass
M = Mgf = {(x, y) : x ∈ I, g(x) ≤ y ≤ f (x)}.
Die Verbindung von Inhaltslehre und Integration ist nun durch den folgenden Satz gegeben:
Satz 8.46 Normalbereiche Mgf sind quadrierbar, und es gilt
µ(Mgf ) =
f (x)
Zb Z
Zb
f (x) − g(x) dx =
a
dy dx.
a g(x)
Bemerkung. Das 2-dim. Cavallierische Prinzip ist ein Spezialfall dieses Satzes.
Beweis. Wir setzen M = Mgf . Es sei Z eine beliebige Zerlegung des Intervalls I. Dann gilt
nach Satz 8.44,(c)–(e), sicherlich
S(f, Z) − S(g, Z) ≥ µ(M ) ≥ µ(M ) ≥ S(f, Z) − S(g, Z).
Der Übergang zum Infimum (l. S.) bzw. Supremum (r. S.) über allen Zerlegungen liefert
Zb
Zb
f (x) − g(x) dx ≥ µ(M ) ≥ µ(M ) ≥
f (x) − g(x) dx.
a
a
Also ist µ(M ) = µ(M ) =
Rb
f (x) − g(x) dx.
a
Beispiel 8.47
(a) Für 0 < a < b sei M das durch das Intervall I = [a, b] und die Funktionen f (x) = x
und g(x) = 0 beschriebene Trapez. Dann ist
b
Zb
x2 b 2 − a2
(2)
µ (M ) = (x − 0)dx = =
.
2 a
2
a
(b) Wir berechnen den Flächeninhalt A der Ellipse mit den achsenparallelen Halbmessern a und b. Die Ellipse wird dann von den Funktionen
r
x 2
f± (x) = ±b 1 −
, x ∈ [−a, a],
a
berandet. Daher ist sie ein Normalbereich und es gilt (s.a. Beispiel 8.31b))
Za r
Z1 √
x 2
A=2 b 1−
dx = 2b a
1 − t2 dt = b · a · π.
a
−a
Aufgabe: Beweisen Sie die Formel e) in Satz 8.44.
−1
152
8 INTEGRALRECHNUNG
8.10
Gebietsintegrale
Will man die Masse eines Körpers B ⊆ R3 mit inhomogener Dichte ρ = ρ(x, y, z) ermitteln, so hat man ein Integral der Form
Z
ρ(x, y, z) d V (x, y, z)
m=
B
zu berechnen. Dabei wird dV (x, y, z) als ein Volumenelement bezeichnet. Es soll der Inhalt
dieses Abschnitts sein, ein solches Gebietsintegral zu definieren und dessen Eigenschaften zu untersuchen. Dabei gehen wir in Analogie zur Konstruktion des 1-dimensionalen
Riemann-Integrals vor.
Definition 8.48 (Gebietsintegrale) Es sei B ⊆ Rn eine beschränkte, abgeschlossene
und quadrierbare Menge, und es sei f (x) = f (x1 , . . . , xn ) = eine auf B definierte und
beschränkte Funktion.
1. Eine Zerlegung Z von B ist ein endliches System Z = {Mi : 1 ≤ i ≤ n} von
n
S
quadrierbaren Mengen Mi ⊆ B mit µ(Mi ∩ Mj ) = 0 für i 6= j und
Mi = B.
i=1
2. Die Obersumme bzw. Untersumme von f zur Zerlegung Z ist
S(f, Z) =
n
X
f (Mi ) µ(Mi )
bzw.
S(f, Z) =
i=1
n
X
f (Mi ) µ(Mi )
i=1
mit f (Mi ) = sup{f (x) : x ∈ Mi } und f (Mi ) = inf{f (x) : x ∈ Mi }.
3. Die Darbouxsche Obersumme bzw. Untersumme von f ist definiert durch
S(f ) = inf {S(f, Z) : Z Zerlegung von B},
S(f ) = sup {S(f, Z) : Z Zerlegung von B}.
4. Gilt S(f ) = S(f ), so heißt diese Zahl das Integral von f auf B, und man setzt
Z
Z
f (x) dx =
f (x1 , . . . , xn ) d(x1 , . . . , xn ) = S(f ) = S(f ).
B
B
Für das Gebietsintegral lassen sich ähnliche Kriterien wie für das 1-dimensionale Riemannsche Integral aufstellen. Insbesondere gilt wiederum:
Satz 8.49 (Riemannsches Integrabilitätskriterium) Eine Funktion f ist integrierbar auf der quadrierbaren Menge B ⊆ Rn genau dann, wenn es zu jedem ε > 0 eine
Zerlegung Z von B derart gibt, dass
S(f, Z) − S(f, Z) < ε
ausfällt.
8.10 Gebietsintegrale
153
Da für stetige Funktionen f auf abgeschlossenen beschränkten Teilmengen B ⊆ Rn wiederum der Satz vom Maximum und Minimum und der Satz von der gleichmäßigen Stetigkeit
gilt, beweist man wie in 8.9 den folgenden:
Satz 8.50 (Existenzsatz) IstR B ⊆ Rn abgeschlossen, beschränkt und quadrierbar und
ist f auf B stetig, so existiert f (x) dx.
B
Beweis. sei ε > 0 gegeben. Zu ε existiert wegen der gleichmäßigen Stetigkeit von f auf B
ein δ > 0 derart, dass für alle Punktepaare x, x0 ∈ B mit |x−x0 | ≤ δ auch |f (x)−f (x0 )| ≤
ε gilt. Wir wählen eine Zerlegung Z = {Mi : 1 ≤ i ≤ n} mit d(Mi ) = sup{|x−x0 | : x, x0 ∈
M } ≤ δ. Dann gilt f (Mi ) − f (Mi ) ≤ ε. Folglich ist
S(f, Z) − S(f, Z) =
n
X
(f (Mi ) − f (Mi )) µ(Mi ) ≤ ε ·
i=1
n
X
µ(Mi ) = ε µ(B).
i=1
Da ε beliebig war, ist f nach Satz 8.49 integrierbar.
Ohne Schwierigkeiten zeigt man, dass das Gebietsintegral positiv, additiv und homogen
ist. Ferner gilt für stetige Integranden der Mittelwertsatz, den man wiederum wie im
1-dimensionalen Fall beweist:
Satz 8.51 (Mittelwertsatz) Ist B ⊆ Rn quadrierbar, abgeschlossen, beschränkt und
zusammenhängend8 und ist f auf B stetig, so existiert ein x0 ∈ B mit
Z
f (x) dx = f (x0 ) · µ(B).
B
Wir sind nunmehr in der Lage, Gebietsintegrale unter geeigneten Voraussetzungen auf wiederholte eindimensionale Integration zurückzuführen und somit die Technik der Stammfunktionen auszunutzen. Wir begnügen uns dabei mit dem zweidimensionalen Fall.
Satz 8.52 (Reduktionssatz, iterierte Integration) Es sei Q = I × J ⊆ R2 ein abgeschlossenes Rechteck und es sei f auf Q definiert und stetig. Dann gilt
Z
Z Z
Z Z
f (x, y)dy dx.
f (x, y)d(x, y) =
f (x, y)dx dy =
Q
J
I
I
J
Das Gebietsintegral auf dem Rechteck Q kann also durch zwei iterierte 1-dimensionale
Integrale berechnet werden.
Beweis. Wir setzen
Z
α=
Z
f (x, y)d(x, y) und β =
Q
8
Z
f (x, y)dx dy.
J
I
Eine Menge B heißt (bogen-)zusammenhängend, wenn je zwei Punkten x, y ∈ B durch eine Kurve,
die ganz in B verl}äuft, verbunden werden können.
154
8 INTEGRALRECHNUNG
Es sei ε > 0 beliebig gegeben. Da f auf der kompakten Menge Q sogar gleichmäßig stetig
√
ist, existiert ein δ > 0 derart, dass | f (x)−f (x0 ) | < ε für alle x, x0 ∈ Q mit |x−x0 | ≤ 2 δ
gilt. Wir wählen disjunkte Zerlegungen {Ii : 1 ≤ i ≤ n} von I und {Jj : 1 ≤ j ≤ m} von
J mit d(Ii ) ≤ δ und d(Jj ) ≤ δ für alle i, j. Dann√ist {Ii × Jj : 1 ≤ i ≤ n, 1 ≤ j ≤ m}
eine disjunkte Zerlegung von Q mit d(Ii × Jj ) ≤ 2δ. Weiter ist
X Z
XZ Z
α=
f (x, y)d(x, y) und β =
f (x, y)dx dy.
i,j
i,j J
j
Ii ×Jj
Ii
Wir betrachten die Differenz zweier Summanden zum Index i, j. Es ist
Z
Z Z
f (x, y)d(x, y) −
f (x, y)dx dy ≤
Ii ×Jj
Jj
Ii
≤ max f (x, y) · µ(Ii × Jj ) − min f (x, y) · µ(2) (Ii )µ(2) (Jj )
Ii ×Jj
≤
Ii ×Jj
max f (x, y) − min f (x, y) · µ(2) (Ii × Jj ) ≤ εµ(2) (Ii × Jj ).
Ii ×Jj
Ii ×Jj
Das ergibt
α−β ≤ε·
X
µ(2) (Ii × Jj ) = ε · µ(2) (Q).
i,j
Entsprechend zeigt man β − α ≤ ε · µ(2) (Q). Folglich ist |α − β| ≤ ε · µ(2) (Q). Da ε > 0
beliebig war, ist das nur für α = β möglich.
Als Beispiel betrachten wir die Funktion f (x, y) = x2 y auf dem Rechteck B = [−1, 1] ×
[0, 1]. Es ist
Z
2
Z1 Z1
x y d(x, y) =
B
2
Z1
x y dy dx =
−1
0
x
−1
2y
2 1
dx =
2 0
Z1
−1
1
x3 2
x2
dx =
= .
2
6 −1 6
Der Reduktionssatz lässt sich von Rechtecken auf Normalbereiche verallgemeinern:
Satz 8.53 (Iterierte Integrale, Fubini) Es seien g, h : [a, b] → R stetige Funktionen,
und es sei Mgh = {(x, y) : a ≤ x ≤ b, g(x) ≤ y ≤ h(x)} ⊆ R2 der hierdurch definierte
Normalbereich. Ferner sei f : Mgh → R eine stetige Funktion. Dann ist
h(x)
Zb Z
Z
f (x, y)d(x, y) =
Mgh
f (x, y)dy dx.
a
g(x)
Beweis. Wie im Beweis zu Satz 8.46 gezeigt wurde, existiert zu jedem ε > 0 eine endliche
Menge von paarweise disjunkten Rechtecken Qi = Ii × Ji mit
n
[
X (2)
h
(2)
h
M=
Qi ⊆ Mg und µ (Qi ) − µ (Mg ) < ε.
i=1
i
8.10 Gebietsintegrale
155
Unter Verwendung der Additivität des Riemannschen Inhalts und des zweidimensionalen
Riemannschen Integrals folgt nun
Z
Z
Z
f (x, y)d(x, y) f (x, y)d(x, y) = f (x, y)d(x, y) −
M
Mgh
Mgh \M
≤ max | f | · µ(2) (Mgh \ M ) = max | f | · ε.
Für das Integral über M ergibt sich mit Satz 8.52 die Gleichung
Z
Z
X Z
X Z
f (x, y)d(x, y) =
f (x, y)d(x, y) =
f (x, y)d(x, y) =
S
M
i
Qi
i
Qi
Ii
Z
f (x, y)dy dx.
Ji
Sind die Intervalle Ii hinreichend schmal gewählt, so ist
(h(x) − g(x)) − µ(Ji ) ≤ ε für alle x ∈ Ii
auf Grund der gleichmäßigen Stetigkeit von h und g. Somit gilt
h(x)
Z
Z
f (x, y)dy ≤ max | f | · ε für alle x ∈ Ii .
f (x, y)dy −
Ji
g(x)
Das ergibt wegen des Reduktionssatzes für Rechtecke:
h(x)
Z
Zb Z
f
(x,
y)d(x,
y)
−
f
(x,
y)dy
dx
a
M
g(x)
Z
X
= Z
Ii
Ji
i
f (x, y)dy dx −
X Z
i
Ii
h(x)
Z
f (x, y)dy dx g(x)
h(x)
Z
X Z Z
dx
=
f
(x,
y)dy
−
f
(x,
y)dy
i
Ii
Ji
≤ max | f | · ε ·
g(x)
X
µ(Ii ) = (b − a) max | f | · ε.
i
Die Zusammensetzung beider Ungleichungen liefert schließlich
h(x)
Z
Zb Z
≤ ε · const
f
(x,
y)d(x,
y)
−
f
(x,
y)dy
dx
Mgh
a
g(x)
für alle ε > 0. Folglich sind beide Terme untereinander gleich.
156
8 INTEGRALRECHNUNG
Z
|x| d(x, y) mit EK = {(x, y) :
Beispiel 8.54 Wir berechnen
p
x2 + y 2 ≤ 1. Es ist
EK
√
Z1−x2
Z1
Z
|x| dy dx =
|x| d(x, y) =
√
− 1−x2
−1
EK
Z1
Z1
= 2
2x
√
√
|x| · 2 1 − x2 dx
−1
Z0
1−
x2
dx = −2
√
Z1
z dz = 2
1
0
0
√
√ 1
( z)3 1
z dz =
= .
3 0 3
8.55 (Ein Gegenbeispiel) Die Reduktionsformeln 8.52 und 8.53 lassen die Frage aufkommen, warum wir Gebietsintegrale nicht von Hause aus durch iterierte niederdimensionale Integrale definiert haben. Als Mahnung zur Vorsicht betrachten wir das folgende
Beispiel iterierter (uneigentlicher) Integrale,
RR
R R wo aus der Existenz des Integrals
f (x, y)dx dy nicht einmal die Existenz von
f (x, y)dy dx folgen muss. Dazu sei
f (x, y) =
Z1 Z1
Dann ist
Z1
f (x, y)dx dy =
0
−1
0
Z1 Z1
Z1
f (x, y)dy dx wegen
−1
0
x/y
0
für
für
y>0
.
y=0
1
Z1
x2 dy =
0 dy = 0, während das Integral
2y −1
0
x
dy = sgn(x) · ∞ für x 6= 0 nicht existiert.
y
0
R
Im Vorgriff auf dreidimensionale Inhaltslehre µ(3) und Integration
d(x, y, z) zeigen wir
unter Verwendung eines entsprechenden Satzes über iterierte Integrale die nützliche Formel. Sie ließe sich auch mittels Satz 8.58 und Zylinderkoordinaten beweisen.
Beispiel 8.56 (Volumenformel für Rotationskörper) Es sei
p
B = (x, y, z) : a ≤ x ≤ b, y 2 + z 2 ≤ f (x)
ein Körper, der durch Rotation der Kurve y = f (x) um die x-Achse entsteht. Dann gilt
[
p
B=
Kx mit Kx = {(y, z) :
y 2 + z 2 ≤ f (x)}.
a≤x≤b
Somit ist
(3)
Zb Z
Z
µ (B) =
d(x, y, z) =
d(y, z)dx =
a
B
(3)
Zb
a
Kx
Zb
Das ergibt schließlich µ (B) = π
a
µ
f (x)2 dx.
(2)
Zb
(Kx )dx =
a
f (x)2 π dx.
8.11 Die Transformationsformel
157
Abbildung 31: Rotationskörper
Für die dreidimensionale Kugel Kr mit Radius r > 0 ergibt das
(3)
Zr
2
2
(r − x ) dx = π
µ (Kr ) = π
−r
x3
r x−
3
2
r
= 4 π r3 .
3
−r
Aufgaben zu Abschnitt 8.10
1. Berechnen Sie das Volumen des Rotationsellipsoids
2
y2 z2
3 x
E = (x, y, z) ∈ R : 2 + 2 + 2 ≤ 1 .
a
b
b
Z
2. Berechnen Sie das Integral Θ =
x2 + y 2 d(x, y, z) für die Scheibe B vom Radius
B
r und der Dicke h, also B = {(x, y, z) : 0 ≤ z ≤ h, x2 + y 2 ≤ r2 } ⊆ R3 .
(Θ ist in der Physik das sogenannte axiale Trägheitsmoment der Scheibe B).
8.11
Die Transformationsformel
Wir stellen die Frage, wie sich eine Koordinatentransformation auf die Integration und
Inhaltsberechnung auswirkt. Im Ergebnis dieser Betrachtungen werden wir eine leistungsfähige Transformationsformel für mehrdimensionale Integrale erhalten, die als Verallgemeinerung der Substitutionsformel auf den mehrdimensionalen Fall aufgefasst werden
kann. Wir beginnen mit dem einfachsten Fall, der linearen Koordidatentransformation.
Dazu sei A ∈ Rn,n eine quadratische Matrix mit det A 6= 0. Diese Matrix erzeugt eine
Abbildung, die wir ebenfalls durch A bezeichnen:
A : Rn → Rn vermöge u 7→ x(u) = A · u.
In Koordinaten von u = (u1 , . . . , un ) und x = (x1 , . . . , xn ) ausgedrückt heißt das
xi =
n
X
j=1
aij uj mit A = (aij ),
158
8 INTEGRALRECHNUNG
und für späteres vermerken wir
∂ xi
= aij .
∂ uj
Es sei nun Q ⊆ Rn ein Quader. Dann ist sein Bild A(Q) ein Parallelepiped (s. Figur 8.11).
Abbildung 32: Affine Abbildung eines Rechtecks
Die lineare Algebra bzw. Satz 8.44e) zeigen, dass für die Inhalte die folgende Formel gilt:
µ(A(Q)) = | det A| · µ(Q).
(1)
Für die Integration stetiger Funktionen f auf A(Q) ergibt sich dann durch Approximation
der Integrale durch Zerlegungssummen die Beziehung
Z
Z
X
X
f (x) dx ≈
f (ξi ) µ (A(Qi )) =
f (ξi )· | det A|·µ(Qi ) ≈
f (x(u)) | det A| du,
Q
A(Q)
also die Transformationsformel
Z
Z
f (x)dx =
f (x(u)) · | det A| du
(2)
Q
A(Q)
für beliebige lineare Abbildungen A : Rn → Rn mit det A 6= 0 und alle auf A(Q) stetigen
Funktionen f .
Folgerung 8.57 Das mehrdimensionale Integral ist invariant bezüglich Kongruenzabbildungen des Raumes.
Beweis. Kongruenzabbildungen lassen sich in der Form x = T(u) = A · u + u0 beschreiben. Hierbei ist u0 ein fester Punkt in Rn und A ist eine orthogonale Matrix. Wegen
| det A| = 1 für solche Matrizen folgt die Behauptung aus (2).
Es sei nun T : Q → T (Q) ⊆ Rn eine nichtlineare Transformation, die die Punkte u ∈
Q auf x = x(u) abbildet. Die Weierstraßsche Zerlegungsformel ergibt die Linearisierung
x = x(u) = x0 +
∂ xi
∂ uj
(u − u0 ) + ρ(u0 , u − u0 ) · (u − u0 ).
(3)
8.11 Die Transformationsformel
159
Die hierin auftretende Matrix

∂ xi
∂ uj


= 


∂ x1
...
∂ u1
..
.
∂ xn
...
∂ u1

∂ x1
∂ un 



∂ xn 
∂ un
heißt Jacobi-Matrix , und sie gibt den wesentlichen Teil der Linearisierung an. Die Abbildung T lässt sich im Kleinen“ also durch eine lineare Abbildung ersetzen (s. Abb.
”
8.11).
Abbildung 33: Nichtlineare Abbildung eines Rechtecks
Folglich ergibt sich für kleine Quader Q mit den Formeln (1) und (3) die Näherungsformel
∂ xi µ(x(Q)) ≈ det
· µ(Q),
∂ uj die wir symbolisch auch in der Form
∂
x
i
· du
dx = det
∂ uj ausdrücken. Benutzt man diese Näherungen und die Überlegungen, die zur Formel (2)
führten so lässt sich der folgende Satz herleiten.
n
Satz 8.58 (Transformationsformel) Es sei Q ⊆ Rn ein Quader in R
, essei x = x(u)
eine stetig partiell differenzierbare Abbildung von Q auf x(Q) mit det ∂∂ uxji 6= 0 für alle
x ∈ Q. Dann gilt für jede auf x(Q) stetige Funktion f die Formel
Z
Z
∂
x
i
du.
f (x)dx =
f (x(u)) · det
∂ uj x(Q)
Q
Der detaillierte Beweis erfordert aber mit den beschränkten Mitteln der Riemannschen
Integrationstheorie erheblichen Aufwand. Da wir im Rahmen der Lebesguesschen Integrationstheorie noch weit stärkere Transformationsformeln mit eleganten Methoden erhalten
werden (Satz von Radon-Nikodym), verzichten wir im Gegensatz zum bisherigen Vorgehen
in diesem Material auf den präzisen Beweis und wenden uns stattdessen den vielfältigen
Anwendungen dieses wichtigen Satzes zu.
160
8 INTEGRALRECHNUNG
8.59 (Transformation auf Polarkoordinaten) Wir betrachten als Beispiel den
wichtigen Fall der Transformation auf Polarkoordinaten. Die kartesischen Koordinaten
(x, y) werden dabei vermöge der Gleichungen
x = r cos ϕ
y = r sin ϕ
durch
die
Polarkoordinaten
(r, ϕ)
ausgedrückt.
Ein
Rechteck
im
(r, ϕ)−Koordinatensystem von der Form Q = [r1 , r2 ] × [0, 2 π] wird dabei auf einen Kreisring mit den Radien r1 , r2 in der (x, y)-Ebene abgebildet. Die Funktionaldeterminante
hat den Wert

∂x
cos ϕ −r sin ϕ

∂ϕ 
=
∂y 
sin ϕ
r cos ϕ
∂ϕ
∂x
 ∂r
det 
 ∂y
∂r

= r cos2 ϕ + r sin2 ϕ = r,
und diese Transformation ist für alle ϕ ∈ [0, 2 π] und alle r > 0 zulässig.
Die Transformationsformel ergibt die Gleichung
Z
Z
f (x, y) d(x, y) =
f (x(r, ϕ), y(r, ϕ)) r d(r, ϕ).
Q
A(Q)
Symbolisch ist also d(x, y) = r d(r, ϕ).
Für den Flächeninhalt eines Kreissektors S vom Radius R und Winkel ϕ0 ergibt sich
beispielsweise
Z
µ(S) =
Zϕ0 ZR
Z
d(x, y) =
S
r dr dϕ =
0
[0,R]×[0,ϕ0 ]
R2
ϕ0 .
r dr dϕ =
2
0
Beispiel 8.60 Die Verwendung der Transformation von Polarkoordinaten erlaubt zusammen mit dem Reduktionssatz auch die Berechnung des in der Wahrscheinlichkeitsrechnung
R∞ −x2 /2
wichtigen Integrals α =
e
dx. Es ist nämlich
−∞
Z∞
α·α =
−x2 /2
e
Z∞
dx ·
−∞
−y 2 /2
e
Z
−∞
Z
=
−r 2 /2
e
[0,∞)×[0,2π]
e−(x
dy =
2 +y 2 )/2
d(x, y)
R2
Z2π Z∞
r d(r, ϕ) =
−r 2 /2
e
0
0
Z2π
− r 2 /2
−e
r dr dϕ =
0
∞
dϕ = 2 π.
0
8.11 Die Transformationsformel
Das ergibt
161
Z∞
α=
e− x
2 /2
dx =
√
2 π.
−∞
Aufgaben zu Abschnitt 8.11
1. Berechnen Sie das Volumen des Kreiszylinders mit Radius 1 und Achse = z-Achse,
der durch die Ebenen z = 0 und z = 4 − x − 2y abgeschnitten wird.
2. Der Schwerpunkt S = (xS , yS , zS ) eines Körpers V ⊆ R3 mit Dichte ρ = 1 berechnet
sich nach den Formeln (Summe aller Drehmomente ist Null):
Z
Z
Z
1
1
1
xS =
x d(x, y, z), yS =
y d(x, y, z), zS =
z d(x, y, z)
V
V
V
V
V
V
Man berechne den Schwerpunkt des Körpers aus Aufgabe 1.
3. Das Trägheitsmoment J einer um die z-Achse rotierenden Scheibe S vom Radius R
und Höhe h und Dichte ρ = 1 ergibt sich wie folgt. Berechnen Sie dies Integral.
Z
J = x2 + y 2 d(x, y, z).
S
4. Man berechne das Trägheitsmoment einer um eine Achse rotierenden Kugel vom
Radius R nach der Formel
Z
J=
x2 + y 2 d(x, y, z).
Kugel
5. Weisen Sie die folgenden Transformationsformeln nach:
a) Die Transformation auf Zylinderkoordinaten ist definiert durch
 


x
ρ cos ϕ
 y  =  ρ sin ϕ  für 0 < ρ und 0 ≤ ϕ < 2π.
z
z
Dabei ist ρ der Abstand des Punktes P (x, y, z) von der z-Achse, ϕ = arccos
x
ρ
und z die Höhe über der (x, y)-Ebene.
Erläutern Sie die Namensgebung und zeigen Sie d(x, y, z) = ρ d(ρ, ϕ, z) .
b) Die Transformation auf Kugelkoordinaten ist definiert durch
 


x
r cos ϕ cos ϑ
 y  =  r sin ϕ cos ϑ  für 0 < r, −π < ϕ ≤ π und − π/2 < ϑ < π/2.
z
r sin ϑ
Dabei ist r der Abstand des Punktes P (x, y, z) vom Ursprung, ϕ die geographische Länge und ϑ die geographische Breite (s. Abbildung 48.3). Erläutern
Sie die Namensgebung und zeigen Sie d(x, y, z) = r2 cos ϑ d(r, ϑ, ϕ) .
6. Berechnen Sie die Werte von Γ( 12 ) und Γ( 23 ).
162
8 INTEGRALRECHNUNG
Abbildung 34: Zylinder- und Kugelkoordinaten
8.12
Das Volumen der n-dimensionalen Kugel
Wir benutzen die Methoden der vorhergehenden Abschnitte zur Berechnung des Volumens
Vn (r) der n-dimensionalen Kugel
Kn (r) = {x ∈ Rn : |x| ≤ r}.
Die Dehnung u 7→ x(u) = r u überführt die Einheitskugel in die Kugel vom Radius r,
und die Funktionaldeterminante dieser Abbildung ist rn . Das zeigt
Z
Vn (r) = µ(Kn (r)) =
Z
rn du = rn µ(Kn (1)).
dx =
Kn (r)
Kn (1)
Also ist
Vn (r) = rn · Vn (1).
Es genügt daher, das Volumen Vn = Vn (1) der Einheitskugel in Abhängigkeit von n zu
ermitteln. Hierfür ergeben sich folgende Resultate:
V1
=
R1
dx
=
2,
d(x, y)
=
R2π R1
−1
V2
V3
=
=
R
K2
0
R
R1
d(x, y, z)
=
rdr dϕ = π,
0
R
d(y, z)dx =
−1 y 2 +z 2 ≤1−x2
K3
=
R1
−1
R1 R2π
−1
0
(1 − x ) · π dx = π x −
x3
3
2
√
1−x
R 2
ρ dρ dϕ dx
0
1
= 4 π.
3
−1
Durch Reduktion des vierdimensionalen Integrals auf zwei iterierte zweidimensionale
Integrale erhält man
8.12 Das Volumen der n-dimensionalen Kugel
V4
=
R
d(x, y, z, w)
R
=
163
R
d(x, y)d(w, z)
z 2 +w2 ≤1 x2 +y 2 ≤1−(z 2 +w2 )
K4
√
R2π R1 R2π
=
0
0
0
=
ρ dρ dϕ · σ dσ dψ
0
R1
4 π 2 12
1−σ
R 2
(1 − σ 2 ) σ d σ = 2 π 2
0
σ2
2
−
σ4
4
1 π 2
= .
2
0
Entsprechend dem Vorgehen zur Berechnung von V3 und V4 beweist man durch vollständige Induktion schließlich
V2k =
πk
2k+1 π k
und V2k+1 =
k!
3 · 5 · . . . · (2k + 1)
Tatsächlich gilt für k ≥ 1 :
Z
p
V2k =
V2k−2
1 − (x2 + y 2 ) d(x, y)
x2 +y 2 ≤1
π k−1
(1 − (x2 + y 2 ))k−1 d(x, y)
(k − 1)!
Z
=
x2 +y 2 ≤1
π k−1
=
(k − 1)!
Z2π Z1
0
πk
(1 − ρ2 )k−1 ρ dρ dϕ =
(k − 1)!
0
Z1
tk−1 dt =
πk
,
k!
0
und
Z1
V2k+1 =
1
Z
√
2
V2k ( 1 − x ) dx =
πk
πk
(1 − x2 )k dx =
k!
k!
−1
−1
R1
Für das Integral Ik =
Z1
(1 − x2 )k dx.
−1
(1 − x2 )k dx führt die Substitution x = sin t auf
−1
Zπ/2
Ik =
cos2k t cos t dt,
−π/2
und die partielle Integration ergibt
Zπ/2
Ik = 0 + 2k
2k−1
cos
Zπ/2
2
t · sin t dt = 2k
−π/2
−π/2
Zπ/2
= 2k
−π/2
cos2k−1 t · (1 − cos2 t) dt
cos2k−2 t · cos t dt − 2k
Zπ/2
−π/2
cos2k t cos t dt = 2k · Ik−1 − 2k Ik .
164
8 INTEGRALRECHNUNG
Das liefert die Rekursionsformel
2k
2k · (2k − 2) · . . . · 2
2k+1 · k!
Ik =
Ik−1 =
· 2=
.
2k + 1
(2k + 1) · . . . · 3
(2k + 1) · . . . · 3
Also ist
V2k+1 =
π k · 2k+1
.
3 · 5 · . . . · (2k + 1)
Abschließend untersuchen wir das Volumenverhältnis zwischen der n-dimensionalen Einheitskugel
n
X
Kn = {x ∈ Rn :
x2i ≤ 1}
i=1
und dem umschließenden n-dimensionalen Würfel
Wn = {x ∈ Rn : max | xi | ≤ 1}.
1≤i≤n
Da
P
2k /k! konvergiert (Quotientenkriterium), ist lim 2k /k! = 0. Daraus folgt
k→∞
lim
n→∞
µ(Kn )
=
µ(Wn )
lim
n→∞
Vn
= 0.
2n
Hochdimensionale Einheitskugeln haben also sehr kleine Volumina.
Aufgaben zu Abschnitt 8.12
1. Die Oberfläche der n-dimensionalen Kugel Kn (r) berechnet sich nach der Formel
d
Vn (r).
dr
Begründen Sie die Formel und ermitteln Sie die Oberfläche explizit.
|∂Kn (r)| =
2. Berechnen Sie das Volumen des Torus mit dem Seelenradius R und dem Radius
r < R der Querschnittsfläche.
8.13
Kurven und Bogenlängen
Zur Untersuchung von Kurven ist es notwendig, diesen Begriff mathematisch präzis zu
definieren.
Definition 8.61 (Kurve) Unter einer Parameterdarstellung einer Kurve versteht man
eine eindeutige, stetige Abbildung
t 7→ P (t) = (x1 (t), . . . , xn (t)) ∈ Rn
eines Intervalls [ta , te ] ⊆ R in den Raum Rn .Die Menge
C = {P (t) : ta ≤ t ≤ te }
heißt die zugehörige Kurve. Wir sprechen von einer glatten Kurve, wenn für alle t ∈
(ta , te ) die Ableitung P 0 (t) = (x01 (t), . . . , x0n (t)) existiert, stetig und für alle t ∈ (ta , te ) von
0 verschieden ist.
8.13 Kurven und Bogenlängen
165
Beispiel 8.62
1. Strecken sind gegeben durch P (t) = P0 + ta, ta ≤ t ≤ te , wobei a
ein beliebiger, von Null verschiedener Vektor des Rn ist.
2. Die Kreislinie in der Ebene mit Zentrum 0 und Radius R ist gegeben durch
R sin t
P (t) =
, 0 ≤ t ≤ 2π.
R cos t
3. Die Ellipsenlinie ist gegeben durch
A sin t
P (t) =
,
B cos t
0 ≤ t ≤ 2π,
wobei A und B die beiden Halbmesser der Ellipse sind.
4. Die Schraubenlinie im Raum um die z-Achse mit Steigung α ist gegeben durch




x(t)
R sin t
P (t) =  y(t)  =  R cos t  , 0 ≤ t ≤ 2π.
z(t)
αt/2π
Definition 8.63 (Bogenlänge) Es sei C eine Kurve mit Parameterdarstellung t 7→
P (t). Jede Zerlegung Z = {ta = t0 < t1 < t2 < . . . < tN = te } des Intervalls I = [ta , te ]
erzeugt eine Folge von Knotenpunkten {P (t0 ), P (t1 ), . . . , P (tN )} auf C, deren Verbindung
mit Geradenstücken einen Polygonzug Z ergibt, dessen Länge durch
Lg(C, Z) =
N
X
|P (tj ) − P (tj−1 )|
j=1
gegeben ist (s. Abb. 8.13). Unter der Kurvenlänge Lg(C) verstehen wir den (möglicherweise unendlichen Wert)
( N
)
X
Lg(C) = sup Lg(C, Z) = sup
|P (tj ) − P (tj−1 )| : Z = {tj }j=0,...,N ist eine Zerlegung .
j=1
Unter der Bogenlänge der Kurve verstehen wir die Funktion
s(t) = Lg(Ctta ) = Lg{P (τ ) : ta ≤ τ ≤ t}.
Es ist offensichtlich, dass die so definierte Länge Lg und die Bogenlänge s nicht von der
gewählten Parameterdarstellung abhängen (Beweis?).
Satz 8.64 Glatte Kurven t 7→ P (t) haben eine endliche Länge und es gelten
Zt
s(t) =
ta
|P 0 (τ )| dτ und s0 (t) = |P 0 (t)|.
166
8 INTEGRALRECHNUNG
Abbildung 35: Zur Definition der Bogenlänge
Beweis. Es sei Z = {t0 < t1 < . . . < tn } eine Zerlegung von It = [ta , t]. Nach dem
Hauptsatz der Differential–Integralrechnung gilt (koordinatenweise)
Ztk
P 0 (τ )dτ.
P (tk ) − P (tk−1 ) =
bk−1
Aus der linearen Algebra ist die Formel |~a| = max ~a · ~b bekannt. Hiermit folgt
|~b|≤1
Ztk
Ztk
Ztk
Ztk
P 0 (τ )dτ = max
P 0 (τ )·~b dτ ≤
max P 0 (τ )·~b dτ =
|P 0 (τ )| dτ.
|P (tk )−P (tk−1 )| = |~b|≤1
|~b|≤1
bk−1
bk−1
bk−1
bk−1
Das ergibt
n
X
|P (tk ) − P (tk−1 )| ≤
k=1
Damit ist s(t) ≤
Rt
Ztk
n
X
Zt
0
|P (τ )|dτ =
k=1 t
k−1
|P 0 (τ )|dτ.
ta
|P 0 (τ )|dτ bewiesen. Insbesondere ist Lg(C) = s(te ) ≤
Rte
|P 0 (τ )|dτ < ∞.
ta
ta
Wir betrachten jetzt das Kurvenstück {P (τ ), t ≤ τ ≤ t + h}. Dann gilt nach obigem
Zt+h
|P (t + h) − P (t)| ≤ s(t + h) − s(t) ≤
|P 0 (τ )| dτ,
t
also ist
Zt+h
P (t + h) − P (t) s(t + h) − s(t)
1
≤
≤
|P 0 (τ )|dτ = |P 0 (τ ∗ )|
h
h
h
t
∗
für ein geeignetes τ ∈ (t, t + h) nach dem Mittelwertsatz. Für h & 0 folgt daraus
|P 0 (t)| ≤ s0 (t) ≤ |P 0 (t)|,
also s0 (t) = |P 0 (t)|. (Der Vollständigkeit halber hätte auch noch der linksseitige Grenzwert h % 0 betrachtet werden müssen.) Die Integration dieser Gleichung ergibt wegen
s(ta ) = 0 die Behauptung des Satzes.
8.14 Oberflächeninhalte und Flächenintegrale
167
8.65 Wir betrachten einige Beispiele.
1. Der Kreisumfang ist
Z2π
0
|P (t)|dt =
Lg(C) =
0
Z2π p
r2 sin2 t + r2 cos2 t dt = 2π · r.
0
2. Der Umfang der Ellipse ist
Z2π
Lg(C) =
|P 0 (t)|dt =
Z2π p
Z2π r
0
0
0
a2 sin2 t + b2 cos2 t dt = a
sin2 t +
b2
cos2 t dt
a2
Z2π p
Z2π r
b2
2
1 − (1 − 2 ) cos t dt = a
1 − γ cos2 t dt
= a
a
0
0
2
mit γ = 1 − ab 2 . Dieses Integral ist für a 6= b nicht elementar auswertbar, es heißt
ein elliptisches Integral 2. Gattung.
3. Die Länge der Schraubenlinie für eine Umrundung ist
Lg(C) =
Z2π p
2
r2 sin t + r2 cos2 t + a2 dt =
0
Z2π √
r2 + a2 dt =
√
r2 + a2 · 2π.
0
Aufgaben zu Abschnitt 8.13
1. Berechnen Sie die Bogenlängenfunktion für die Schraubenlinie.
>
2. Die logarithmische Spirale ist definiert durch t 7→ et cos(2πt), sin(2πt) . Zeichnen Sie diese Kurve und berechnen Sie die Bogenlänge s(t) für t0 = 0.
>
3. Die Archimedische Spirale ist definiert durch t 7→ t · cos(2πt), sin(2πt) . Zeichnen Sie diese Kurve und berechnen Sie die Bogenlänge s(t) für t0 = 0.
8.14
Oberflächeninhalte und Flächenintegrale
Gekrümmte Flächen traten bereits wiederholt als Graphen von Funktionen z = f (x, y)
auf (s. z.B. Abb. 23 oder Abb. 36). Wir wollen uns dem Problem der Bestimmenung des
Flächeninhalts solcher Flächen zuwenden. Die Idee besteht wie im Fall der Bestimmung
von Bogenlängen wieder darin, die Fläche in kleine Parallelogramme“zu zerlegen und den
”
Flächeninhalt durch die Summe der Flächeninhalte der Parallelogramme zu definieren.
Es sei also F = {(x, y, f (x, y)) : (x, y) ∈ B} ⊆ R3 der Graph einer stetig differenzierbaren
Funktion f : B → R auf einer quadrierbaren Menge B ⊆ R2 . Wir wollen den Flächeninhalt
168
8 INTEGRALRECHNUNG
Abbildung 36: Flächeninhalt gekrümmter Flächen
|F | so definieren, dass er für den Fall planarer Figuren F (d.h. f=linear) mit dem 2dim
Riemannschen Inhalt µ(2) (F ) zusammenfällt. Wie oben bereits beschrieben nehmen wir
dazu eine Zerlegung von B in kleine Rechtecke Qi,j mit dem Flächeninhalt ∆x · ∆y vor.
Es sei Fi,j = {(x, y, f (x, y)) : (x, y) ∈ Qi,j } die zu Qi,j gehörige Fläche. Wir ersetzen diese
Fläche durch das von den Vektoren Px und Py aufgespannten Parallelogramm Pi,j . Dann
erhalten wir
q
|Fi,j | ≈ |Pi,j | = |Px × Py | = |(−fx , −fy , 1)| · ∆x · ∆y = 1 + fx2 + fy2 · ∆x · ∆y.
Somit wäre
|F | =
X
|Fi,j | ≈
i,j
X
|Pxi × Pyj | =
i,j
Xq
1 + fx2 + fy2 · ∆x · ∆y.
i,j
Ausgehend von diesen heuristischen überlegungen definieren wir daher
|F | =
Z q
1+
fx2
+
fy2
q
d(x, y) und symbolisch d|F | = 1 + fx2 + fy2 d(x, y),
B
und wenden uns der Behandlung eines Beispiels zu.
Beispiel 8.66 (Kugeloberfläche) Wir berechnen die Oberfläche der 3dim Kugel mit
Radius R. Dies ist die Menge F = {(x, y, z) : x2 + y 2 + z 2 = R2 }. Die Halbkugeloberfläche
HKF wird dann als Graph der Funktion
p
f (x, y) = R2 − (x2 + y 2 ) mit B = {(x, y) : x2 + y 2 ≤ R2 }
beschrieben. Die partiellen Ableitungen sind
−x
−y
fx (x, y) = p
und fy (x, y) = p
.
2
2
2
2
R − (x + y )
R − (x2 + y 2 )
8.14 Oberflächeninhalte und Flächenintegrale
169
Somit erhalten wir unter zusätzlicher Verwendung von Polarkoordinaten r2 = x2 + y 2 für
B die Formel
Z s
Z q
R2
1 + fx2 + fy2 d(x, y) = 2
d(x, y)
|F | = 2|HKF | = 2
R2 − (x2 + y 2 )
B
B
Z 2π Z R r
Z R
r 2
R
1
2
p
= 2
2
dr
r
dr
dϕ
=
2πR
R2 − r 2
R2
1 − ( Rr )2
0
0
0
= 2πR
2
Z1
√
1
dt = 4πR2 .
1−t
0
Alternativ gehen wir noch einen
p zweiten Weg zur Auswertung des Integrals, indem wir das
Flächendifferential d|F | = 1 + fx2 + fy2 d(x, y) sofort in Kugelkoordinaten ausdrücken.
Mit
x = R cos θ cos ϕ und y = R cos θ sin ϕ
ist x2 + y 2 = R2 cos2 θ und
∂(x, y)
2 − sin θ cos ϕ
det
=R − sin θ sin ϕ
∂(θ, ϕ)
− cos θ sin ϕ = −R2 sin θ cos θ.
cos θ cos ϕ Damit ergibt sich für das Flächenelement
r
q
R2
· R2 sin θ cos θ d(θ, ϕ) = R2 cos θ dθ dϕ.
d|F | = 1 + fx2 + fy2 d(x, y) =
2
2
2
R − R cos θ
Somit ist auf diesem Weg
Z
|F | =
B
d|F | = R2
Z2π Zπ/2
cos θ dθ ϕ = R2 · 2 · 2π = 4πR2 .
0 −pi/2
Die so erhaltene Formel für das Flächenelement in Kugelkoordinaten lässt sich aber unter
vollständiger Umgehung der langwierigen Herleitung auch sofort aus Abb. 37
ablesen: Für das Flächenstückchen d|F | erhält man mit der Formel Länge × Breite sofort
Abbildung 37: Das Flächenelement der Kugeloberfläche in Kugelkoordinaten
170
8 INTEGRALRECHNUNG
das Ergebnis
d|F | = R2 · cos θ dθ dϕ.
Dieses Vorgehen ist dadurch gerechtfertigt, dass der Inhalt ja bewegungsinvariant ist und
dass für Rechtecke die genannte Flächenformel angewandt werden kann. Dieses anschauliche Vorgehen, das insbesondere von Physikern meistens praktiziert wird, ist wegen seiner
Effektivität sehr zu empfehlen. Im Zweifelsfall kann ja dann immer noch der lange Weg
über nachträgliche Koordinatentransformationen und die Jacobi-Determinante gegangen
werden.
Abschließend bemerken wir, dass das Rechnen mit Volumen-, Kurven- und Flächenintegrals maßgeblich auf dem Umgang mit Ausdrücken der Form g(u1 , . . . , un ) d(u1 , . . . , un )
beruht. Dieser Weg wird systematisch im Analysisteil IV zur Vektoranalysis verfolgt werden, das zentrale Objekt werden dort eben solche Differentialformen“ sein.
”
Aufgaben zu Abschnitt 8.14
1. Berechnen Sie den Inhalt der Paraboloidfläche zur Funktion f (x, y) = x2 + y 2 , die
in der Höhe z = 1 abgeschnitten ist.
2. Berechnen Sie die Oberfläche eines geraden Kreiskegels mit Radius 1 und Höhe 1
(Grundfläche eingeschlossen.).
3. Zeigen, dass die Torusoberfläche |T | den Inhalt |F | = 4π 2 rR hat.
p
Hinweis: Am besten zeigen Sie d|T | = 1 + fx2 + fy2 d(x, y) = (R + r cos ϕ)r dϕ dψ.
8.15
Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ?
Die bekannte Kochsche Kurve hat keine endliche Länge,
schlimmer noch, jeder noch so kleine Ausschnitt hat eine
unendliche Länge. Andererseits ist der zweidimensionale Inhalt der Kurve Null. Mit den bisherigen Inhaltsbegriffen ist die Kochsche Kurve also nicht zu analysieren.
Dieses Phänomen tritt in der Natur häufig auf: Küstenlinien von Inseln, Reliefs zerklüfteter Gebirge, Oberfläche
von Schwämmen, Wolken oder Gebirge usw. B. Mandelbrodt lenkte 1960 die mathematische Öffentlichkeit auf
dieses Problem. Bekannt ist seine Frage: Wie lang ist die
Küstenlinie von England wirklich?
Wir wollen hier analytische Mittel entwickeln, um Phänomene dieser Art behandeln zu
können. Erinnern wir uns an die Definition des d-dimensionalen äußeren Riemannschen
Inhalts einer Menge M ⊆ Rd (in 8.43 hatten wir dies für d = 2 eingeführt.). Es ist
µ(M ) = inf 2−n·d card Q ∈ Qdn : Q ∩ M 6= ∅ ,
n∈N
8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ?
171
wobei Qdn die Menge aller achsenparallelen d-dimensionalen Quadrate“ in dyadischen
”
Gitter mit der Gitterbreite 2−n bezeichnet. Definiert man für Teilmengen M ⊆ Rd einen
α-dimensionalen äußeren Inhalt durch
µα (M ) = inf 2−n·α card{Q ∈ Qdn : Q ∩ M 6= ∅},
n
so ergibt sich für α = d der d-dimensionale äußere Inhalt, und α = 1, 2, 3, . . . liefert
den 1-, 2- bzw. 3-dimensionalen äußeren Inhalt. Ist M eine glatte Kurve in Rd , so gelten
µ1 (M ) 6= 0 und µ2 (M ) = 0. Die äußeren Inhalte sind also geeignet, die Dimension zu
beschreiben. Derart motiviert lassen wir nun für α beliebige positive reelle Zahlen zu und
nennen die Zahl
dim M = inf α > 0 : µα (M ) = 0 = sup α > 0 : µα (M ) > 0
die Hausdorff-Dimension von M . Man kann zeigen (und das ist zur endgültigen Rechtfertigung der Definition nötig), dass diese Zahl nicht von der Dimension des einbettenden
Raumes Rd abhängt. Zur praktischen Bestimmung der Hausdorff-Dimension sind die folgenden offensichtlichen Rechenregeln sehr nützlich:
Satz 8.67 Für 0 < α ≤ d und M, M1 , M2 ⊂ Rd gelten:
1) µα (M1 ∪ M2 ) = µα (M1 ) + µα (M2 ) für M1 ∩ M2 = ∅.
Additivität
2) µα (A · M ) = | det A|α/d · µα (M ) für A ∈ Rd,d mit det A 6= 0. (Transformationsformel)
Wir berechnen nun die Hausdorff-Dimension für einige Beispiele.
1. Eine Strecke hat die Hausdorff-Dimension 1.
2. Die Kochsche Kurve K entsteht aus der primitiven Figur
durch wiederholtes Ersetzen der vier Segmente durch im Maßstab 1:3 verkleinerter
Kopien der primitiven Figur. Also gilt mit Satz 8.67
1
α
α
α
µ (K) = µ (K1 ∪ K2 ∪ K3 ∪ K4 ) = 4 · µ
· K = 4 · 3−α · µα (K),
3
und für µα (K) folgt hieraus 4 = 3α , also
dim K =
log 4
≈ 1.26.
log 3
3. Die Cantormenge C ⊆ R (auch Cantor-Staub genannt) entsteht aus dem Einheitsintervall I = [0, 1] durch Herausschneiden des mittleren Drittels 13 , 23 und
fortgesetzter Wiederholung dieses Verfahrens auf die verbleibenden Teilintervalle.
172
8 INTEGRALRECHNUNG
Die Menge C ist also wieder eine disjunkte Vereinigung von zwei auf ein Drittel
verkleinerten Kopien von C. Daher gilt
1
α
α
· C = 2 · 3−α · µα (C).
µ (C) = 2 · µ
3
Für µα (C) 6= 0 folgt also 2 = 3α , und somit dim C = α =
ln 2
≈ 0.63.
ln 3
Aufgaben zu Abschnitt 8.15
1. Man berechne die Hausdorff-Dimension
des Sierpinski-Dreiecks, das aus einem
gleichseitigen Dreick durch Zerlegung in vier
gleichseitige Teildreiecke mit halber Seitenlänge, der Wegnahme des inneren Dreiecks und fortgesetzter Wiederholung des Prozesses auf die entstehenden Teildreiecke entsteht.
2. Es sei C die übliche Cantormenge. Berechnen Sie die Hausdorff-Dimension von C × C.
3. In den Harry-Potter-Romanen fährt der Zug nach Hogwarts von Gleis 9 3 /4 . Konstruieren Sie eine Menge der Dimension 9 3 /4 .
Hinweis: Versuchen Sie dazu, die Konstruktion der Cantormenge zu modifizieren oder
einen binären Baum zu verwenden.
Anhang: Computerprogramme zur Erzeugung von Fraktalen
Fraktale (natürlich nur deren Approximationen!!) können mit der Programmiersprache
LOGO sehr einfach produziert werden. Die Programmiersprache LOGO (eine listenorientierte Sprache) kann frei über die Adresse
http://www.softronix.com/logo.html ⇒ MWS Logo Kits ⇒ Setup Kit
bezogen werden. Hier sind die in der Vorlesung verwendeten Programme:
1. Schneeflocke (v. Koch-Kurve, Hausdorff-Dim = ln 4/ ln 3 )
to SCHNEEFLOCKE :N
MAKE ”s 729
MAKE ”i :n WHILE [:i>1] [MAKE ”i :i-1 MAKE ”s :s/3]
HOME SETPOS [-250 -250] CLEAN
RIGHT 30 SEITE :N RIGHT 120 SEITE :N RIGHT 120 SEITE :N RIGHT 90
end
to SEITE :N
IFELSE :N=1 [FD :S] [SEITE :N-1 LEFT 60 SEITE :N-1 RIGHT 120 SEITE :N-1
LEFT 60 SEITE :N-1]
end
8.15 Fraktale Dimensionen - Wo ist das Gleis 9 3 /4 ?
173
2. Binärer Baum mit Stauchung F < 1/2 (Hausdorff-Dim = ln 2/ ln F −1 )
to BAUM :N :F
HOME SETPOS [50 -500] CLEAN
MAKE ”S 500
ZWEIG :N :S
end
to ZWEIG :N :S
IF :N>0 [FD :S LEFT 45 ZWEIG :N-1 :S*:F RIGHT 90 ZWEIG :N-1 :S*:F LEFT
45 BACK :S]
end
3. FARN
to FARN
CLEARSCREEN SETPOS [0 -400] CLEAN
F1 10 180
end
to F1 :N :S
IFELSE :N=0 [ ][FD :S left 30 F1 :N-1 0.35*:S RIGHT 32 F1 :N-1 0.8*:S RIGHT
40 F1 :N-1 0.35*:S left 42 BACK :S]
end
4. Hilbertkurve (raumfüllende Kurve, Hausdorff-Dim =2)
to HILBERT :N
CLEARSCREEN SETPOS [-200 200] CLEAN
MAKE ”I :N MAKE ”S 256
WHILE [:I>1] [MAKE ”I :I-1 MAKE ”S :S/2]
RIGHT 90 H :N 90
end
to H :N :W
IFELSE :N=0 [ ][left -:W H :N-1 -:W FD :S RIGHT -:W H :N-1 :W FD :S H :N-1
:W RIGHT -:W FD :S H :N-1 -:W left -:W ]
end
Abbildung 38: Fraktale: v. Kochkurve, binärer Baum, Farn, Hilbertkurve
174
9
9 ERGÄNZUNGEN
Ergänzungen
9.1
Der Approximationssatz von Weierstrass
Satz 9.1 (Weierstrassscher Approximationssatz) Zu jeder auf dem Intervall [0, 1]
stetigen Funktion f existiert eine Folge (Bn ) von Polynomen mit
lim max f (x) − Bn (x) = 0.
n→∞ x∈[0,1]
Beweis zu Satz 9.1: Die Konstruktion der approximierenden Polynome Bn basiert auf den
Polynomen
n k
pk (x) =
x (1 − x)n−k für k = 0, . . . , n,
k
die zur Abtastung der Funktion f besonders geeigent sind und die auch in der Stochastik
bei der Binomialverteilung auftreten. Sie geben nämlich die Wahscheinlichkeit dafür an,
bei einer Serie von n Versuchen genau k Treffer zu erzielen, wenn x die Einzelwahrscheinlichkeit für einen Treffer ist. In Abb. 39 sind einige dieser Polynome dargestellt.
Abbildung 39: Binomialverteilungen für n = 100 und einige k = 10, 20, . . .
Für diese Polynome beweist man die folgenden Gleichungen (Wie?):
1.
n
P
pk (x) = 1,
(Die Binomialverteilung ist eine Wahrscheinlichkeitsverteilung)
k=0
2.
n
P
k · pk (x) = nx,
(Erwartungswert der Binomialverteilung = nx)
k=0
3.
n
P
(k − nx)2 · pk (x) = nx(1 − x).
(Varianz der Binomialverteilung = nx(1 − x))
k=0
Nun sei eine stetige Funktion f : [0, 1] → R gegeben. Zu f und zu jedem n ∈ N definieren
wir auf [0, 1] das n-te Bernsteinpolynom
n
X
k
Bn (x) =
f
pk (x)
n
k=0
9.1 Der Approximationssatz von Weierstrass
175
und zeigen |f (x) − Bn (x)| < 2ε für hinreichend große n = n(ε).
Da f auf [0, 1] gleichmäßig stetig ist, existiert zu gegebenem ε > 0 ein δ > 0 mit
|f (x) − f (x0 )| < ε für |x − x0 | ≤ δ.
(1)
Nun ist
X
. . . .
. . . + |x−k/n|>δ |x−k/n|≤δ
n X
X
k
pk (x) ≤ f (x) − f
|f (x) − Bn (x)| = n
k=0
Für den ersten dieser Summanden haben wir dann wegen (1) die Abschätzung
X
n
X
<ε·
.
.
.
pk (x) = ε.
|x−k/n|≤δ k=0
Zur Abschätzung des zweiten Summanden setzen wir M = max |f (x)| < ∞ und erhalten
x∈[0,1]
n
X
X
X
X
(k − nx)2
. . . ≤ 2M pk (x) = 2M pk (x) ≤ 2M
· pk (x)
n2 δ 2
|x−k/n|>δ |x−k/n|>δ
|k−nx|>nδ
k=0
=
2M
M
M
· nx(1 − x) ≤ 2 < ε für n > 2 .
2
2
nδ
2δ n
2δ ε
Damit ist der Satz vollständig bewiesen.
Wir beweisen nun eine trigonometrische Variante des Approximationssatzes, die zur Approximation stetiger periodischer Funktionen benötigt wird.
Definition 9.2 Unter einem trigonometrischen Polynom (n-ten Grades) versteht man
eine Funktion der Form
h(x) =
n
X
k=0
ak cos kx +
n
X
ak sin kx (mit an 6= 0 oder bn 6= 0).
k=1
Die Menge aller trigonometrischen Polynome auf R wird durch T (R) bezeichnet.
Satz 9.3 Produkte und Linearkombinationen trigonometrischer Polynome ergeben wieder
trigonometrische Polynome. (Man sagt, diese Menge bildet eine Algebra).
P
P
Insbesondere sind die Funktionen k ck cosk x und k dk sink x als trigonometrische Polynome darstellbar.
Beweis. Die Addition bzw. Subtraktion der Formeln aus Satz 5.39 c), d) (siehe auch
Aufgabe 2 zum Abschnitt 5.5) liefert die Formeln
cos(n + m)x + cos(n − m)x
cos(n + m)x − cos(n − m)x
sin(n + m)x + sin(n − m)x
= 2 cos nx · cos mx,
= 2 sin nx · sin mx,
= 2 sin nx · cos mx.
176
9 ERGÄNZUNGEN
Durch wiederholte Anwendung dieser Formeln folgt die Behauptung.
Satz 9.4 (Approximationssatz von Weierstrass in trigonometrischer Form)
Jede 2π-periodische, stetige Funktion f : R → R lässt sich auf R gleichmäßig durch trigonometrische Polynome approximieren, d.h., zu jedem ε > 0 existiert ein trigonometrisches
Polynonom h ∈ T (R) mit
max |f (x) − h(x)| < ε.
x∈R
Beweis9 . Teil 1. Wir zeigen die Behauptung zunächst für gerade Funktionen f : [−π, π] →
R. Dazu führen wir eine Transformation
t = cos x für x ∈ [0, π] bzw. x = arccos t für t ∈ [−1, 1]
ein. Dann gehört die Funktion g(t) = f (arccos t) zu C[−1, 1]. Zu jedem ε > 0 existiert
n
P
daher ein Polynom P (t) =
ck tk mit max |P (t) − g(t)| < ε. Setzen wir
k=0
t∈[−1,1]
h(x) = P (cos x) =
n
X
ck cosk x ∈ T (R),
k=0
so gilt die Abschätzung
max |h(x)−f (x)| = max |h(x)−f (x)| = max |P (t)−f (arccos t)| = max |P (t)−g(t)| < ε.
x∈R
x∈[0,π]
t∈[−1,1]
t∈[−1,1]
Teil 2. Wir zeigen, dass sich Funktionen der Form g(x) = f (x) · sin2 x, wobei f eine 2πperiodische, stetige Funktion ist, durch trigonometrische Polynome approximieren lassen.
Dazu betrachten wir die beiden 2π-periodischen geraden Funktionen
g1 (x) =
f (x) − f (−x)
f (x) + f (−x)
· sin2 x und g2 (x) =
· sin x.
2
2
Diese Funktionen sind nach Teil 1 durch trigonometrische Polynome approximierbar.
Dann ist nach Satz 9.3 auch g2 (x) · sin x approximierbar, und wegen
g(x) = g1 (x) + g2 (x) · sin x
auch g.
Teil 3. Der allgemeine Fall: Es sei f : R → R stetig und 2π-periodisch. Wir zerlegen
f (x) = f (x) · sin2 x + f (x) · cos2 x.
Der erste Summand ist wegen Teil 2 appoximierbar. Für den zweiten Summanden gilt
mit der Substitution x = z − π2 die Gleichung f (x) · cos2 x = f (z − π2 ) · cos2 (z − π2 ) =
f (z − π2 ) · sin2 (z) = g(z). Nach Teil 2 ist g(z) durch trigonometrische Polynome h(z)
approximierbar. Somit ist f (x) · cos2 x = g(x + π2 ) durch Funktionen der Form h(x + π2 )
approximierbar. Diese Funktionen lassen sich aber offenbar als trigonometrische Polynome
in x schreiben.
9
Der Beweis folgt der Literatur Brehmer/Apelt: Analysis I, Abschnitt 2.7.3, Satz 2.
9.2 Metrische Räume
9.2
177
Metrische Räume
Viele Definitionen und Sätze lassen sich von R und C auf andere Situatuionen verallgemeinern. Dazu brauchen wir nur den in R, C, Rn benutzten Abstandsbegriff |x − y| zwischen
zwei Punkten axiomatisch zu fassen. Das führt auf der folgenden Begriff:
Definition 9.5 (Metrischer Raum) Es sei X eine nichtleere Menge: Eine Funktion
d : X × X → R+ heißt eine Metrik oder auch Distanzfunktion auf X, falls die nachfolgenden Bedingungen erfüllt sind. Das Paar (X, d) heißt in diesem Fall ein metrischer
Raum.
1. Für alle x, y ∈ X gilt d(x, y) ≥ 0, und d(x, y) = 0 impliziert x = y. (Separiertheit)
2. Stets ist d(x, y) = d(y, x).
(Symmetrie)
3. Für drei Punkte x, y, z ∈ X gilt d(x, z) ≤ d(x, y) + d(y, z).
(Dreiecksungleichung)
Beispiel 9.6 Neben R, C, Rn mit den kanonischen Metriken erwähnen wir die folgenden
wichtigen Beispiele.
1. X = C[a, b] = Menge aller stetigen Funtionen mit d(f, g) = max |f (x) − g(x)|.
x∈[a,b]
2. X = `∞ = Menge aller beschränkten Zahlenfolgen mit d (ξn ), (ηn ) = sup |ξn − ηn |.
n∈N
3. X = c0 = Menge aller Nullfolgen mit der Metrik d (ξn ), (ηn ) = max |ξn − ηn |.
n∈N
4. X = R mit der Metrik d(x, y) = | arctan x − arctan y|. (Dreiecksungleichung?)
5. X = `1 = Menge aller absolut summierbaren Zahlenfolgen x = (ξn ) mit der Metrik
∞
P
d1 (ξn ), (ηn ) =
|ξn − ηn |.
n=0
In metrischen Räumen kann man ε-Kugeln bzw. ε-Umgebungen eines Punktes x0 ∈ X
durch folgenden Ansatz einführen:
Uε (x0 ) = {x ∈ X : d(x, x0 ) < ε}.
Damit ist es nun möglich, die Begriffe des Grenzwertes oder Häufungspunktes einer Folge, des inneren Punktes einer Teilmenge M ⊆ X, die Begriffe offene bzw. abgeschlossene
Menge und den Begriff des Abschlusses wie früher für die Fälle R, C problemlos zu verallgemeinern. Als Beispiel nennen wir:
Definition 9.7 Eine Folge (xn ) ⊂ X heißt konvergent gegen a ∈ X lim d(xn , a) = 0.
n→∞
Also
a = lim xn ⇐⇒ lim d(xn , a) = 0.
n→∞
n→∞
Die Folge (xn ) heißt eine Cauchyfolge, wenn für jedes ε > 0 ein N = N (ε) so existiert,
dass d(xn , xm ) < ε für alle m, n ≥ N (ε) gilt.
178
9 ERGÄNZUNGEN
Auch grundlegende Sätze lassen sich problemlos übertragen. Beispielsweise gilt der Satz:
Satz 9.8 Eine Menge M ⊆ X ist genau dann abgeschlossen, wenn sie alle ihre Häufungspunkte enthält.
Zu den Sätzen, die nicht in allen Fällen richtig sind, gehören dagegen:
a) Jede Cauchyfolge ist konvergent. (Z.B. ist in Beispiel 9.6.4 die Folge (xn ) = (n) eine
Cauchyfolge ohne Grenzwert.)
b) Jede beschränkte Folge hat einen Häufungspunkt. (Die Folge aus a) hat keinen
Häufungspunkt, sie ist aber beschränkt. In Beispiel 9.13 wird ein weiteres Gegenbeispiel
angegeben.)
Metrische Räume mit a) heißen vollständige metrische Räume, Räume mit b) heißen
kompakte metrische Räume.
Zu den wichtigsten Beispielen vollständiger Räume gehören neben Rn die Räume stetiger
Funktionen:
Satz 9.9 Es sei C[a, b] die Menge aller stetigen Funktionen f : [a, b] → R mit der Metrik
d∞ (f, g) = max |f (x)−g(x)|.
(Tschebyscheff-Metrik)
x∈[a,b]
Dann ist C[a, b] ein vollständiger metrischer Raum.
Beweis. Offenbar ist die Konvergenz fn → f in dieser Metrik gerade die in 6.18 eingeführte
gleichmäßige Konvergenz. Die Behauptung folgt nun durch Anwendung der Beweisidee aus
Satz 6.19.
Kompakte Räume werden im folgenden Abschnitt genauer untersucht.
9.3
Kompakte Mengen
In diesem Abschnitt wird der Begriff der kompakten Menge, den wir im Fall R bzw. C in
Satz 6.20 bereits kennengelernt haben, auf allgemeine metrische Räume verallgemeinert.
Im Folgenden sei also X ein fixierter metrischer Raum.
Definition 9.10 Eine Teilmenge K eines metrischen Raumes X heißt kompakt, wenn
jede Folge von Elementen aus K einen zu K gehörenden Häufungspunkt hat.
Satz 9.11 Jede kompakte Menge ist beschränkt und abgeschlossen.
Beweis. Jede eine kompakte Menge K enthält nach Definition alle ihre Häufungspunkte. Somit ist sie abgeschlossen. Wäre die Menge K nicht beschränkt, so könnte man in
M eine Folge von Elementen an mit d(an , am ) ≥ 1 für m, n ∈ N mit m > n finden
(Wie denn?). Diese Folge kann aber keine Cauchyteilfolge enthalten, daher hat sie keinen
Häufungspunkt.
In den Räumen X = R, C oder Rn gilt bekanntlich auch die Umkehrung des obigen Satzes:
9.3 Kompakte Mengen
179
Satz 9.12 (Satz von Bolzano-Weierstrass) Eine Teilmenge K von R, Rn bzw. Cn ist
genau dann kompakt, wenn sie abgeschlossen und beschränkt ist.
Ein entsprechender Satz ist aber nicht in jedem metrischen Raum richtig, wie das folgende
Beispiel zeigt.
n
Beispiel 9.13 Die Teilmenge M = {en : n ∈ N} ⊂ c0 mit en = (0, .^. ., 1, 0, . . .) ∈ c0 ist
beschränkt und abgeschlossen, aber die Folge (ei )i∈N hat bzgl. der üblichen Metrik in c0
keinen Häufungspunkt. Somit ist M nicht kompakt.
Kompaktheit ist die entscheidende Eigenschaft, um die in Abschnitt 6.3 für stetige reelle
Funktionen auf Intervallen bewiesenen Eigenschaften auf stetige Funktionen f : X → R,
X ein metrischer Raum, zu verallgemeinern. Hierzu gehört der folgende Satz:
Satz 9.14 (Satz vom Maximum und Minimum) Ist K kompakt, so hat jede stetige
Funktion f : K → R auf K ein Maximum und ein Minimum.
Mit gleicher Technik ergibt sich:
Satz 9.15 Sind A, B zwei kompakte Teilmengen von X, so existieren zwei Punkte a0 ∈ A
und b0 ∈ B mit
d(a0 , b0 ) = inf{d(x, y) : x ∈ A, y ∈ B} = d(A, B),
der Abstand“ der Mengen A, B wird also angenommen.
”
Die folgenden Sätze zeigen die Verwandtschaft kompakter Mengen mit endlichen Mengen.
Sie sind von großer Wichtigkeit.
Satz 9.16 Jede kompakte Menge K ist präkompakt, d.h., zu jedem ε > 0 existiert eine
endliche Teilmenge F ⊂ K mit
[
K⊆
Uε (x).
x∈F
Beweis. Wir führen den Beweis indirekt. Angenommen, es gäbe ein ε0 > 0 derart, dass
obige Inklusion für keine endliche Teilmenge F ⊂ K erfüllt sei. Wir konstruieren nun
induktiv eine Folge (xn ) in K ohne Häufungspunkt. Es sei x0 ∈ K beliebig gewählt.
Wegen K \ Uε0 (x0 ) 6= ∅ existiert ein x1 ∈ K \ Uε0 (x0 ). Wegen K \ Uε0 (x0 ) ∪ Uε0 (x1 ) 6= ∅
existiert ein x2 ∈ K \ Uε0 (x0 ) ∪ Uε0 (x1 ) . So fortfahrend ergibt sich eine Folge (xn ) ⊆ K
mit d(xn , xm ) ≥ ε0 für n > m. Daher enthält (xn ) keine Cauchyteilfolge, sie kann also
keinen Häufungspunkt haben.
Satz 9.17 (Überdeckungssatz von Heine-Borel) Es sei X metrischer Raum. Eine
Menge K ⊆ X ist genau dann kompakt, wenn es zu jedem System (Oα )α∈A von offenen
n
S
S
Mengen mit K ⊆
Oα ein endliches Teilsystem {Oα1 , . . . , Oαn } mit K ⊆
Oαj gibt.
α∈A
Man sagt auch, dass K die endliche Überdeckungseigenschaft hat.
j=1
180
9 ERGÄNZUNGEN
Beweis. Wir zeigen die Notwendigkeit der Bedingung durch indirekten Schluss: Es sei K
kompakt, und es sei (Oα )α∈I eine offene Überdeckung von K derart, dass für jedes endliche
n
S
Teilsystem K \
Oαi 6= ∅ gilt. Wir konstruieren zwei Folgen (Kj ) und (xj ) auf folgende
i=1
Weise: Es sei K0 = S
K und ε1 = 1. Da K präkompakt ist, existiert eine endliche Menge
F1 ⊆ K0 mit K0 ⊆
U1 (x). Da K0 nicht von endlich vielen der {Oα } überdeckt werden
x∈F1
kann, existiert ein x ∈ F1 , wir nennen es x1 , derart, dass die Menge K1 = K0 ∩ U1a (x1 )
nicht von endlich vielen {Oα } überdeckt werden kann. Wir wiederholen das Verfahren mit
K1 und ε2 = 12 . Das ergibt eine Kette abgeschlossener Mengen
K0 ⊇ K1 ⊇ K 2 ⊇ . . .
und eine Folge (xj ) von Elementen mit
a
xj ∈ Kj = Kj−1 ∩ U1/j
(xj )
derart, dass kein Kj durch endlich viele {Oα } überdeckt werden kann. Da K = K0 kompakt ist, hat die Folge (xj ) einen Häufungspunkt x∗ . Da {Oα } die Menge K0 überdeckt, existiert ein Oα mit x∗ ∈ Oα . Da Oα offen ist, existiert ein δ > 0 mit Uδ (x∗ ) ⊆ Oα . Wir wählen
1
δ
a
ein n mit < und xn ∈ Uδ/2 (x∗ ). Dann ist Kn ⊆ Uδ/3
(xn ) ⊆ Uδ/2 (xn ) ⊆ Uδ (x∗ ) ⊆ Oα
n
3
im Widerspruch dazu, dass Kn nicht durch endlich viele {Oα } überdeckt werden kann.
Wir zeigen die Umkehrung durch indirekten Beweis. Angenommen, es gäbe eine Folge
(xj ) ⊂ K ohne Häufungspunkte. Wir konstruieren nun eine Überdeckung von K, die keine endliche Überdeckung besitzt. Da sich kein xj unendlich oft wiederholen kann, enthält
die Folge unendlich viele verschiedene Elemente. Wir können also durch eventuellen Übergang zu einer Teilfolge annehmen, dass bereits die Folge (xj ) aus paarweise verschiedenen
Elementen besteht. Da (xj ) keine Häufungspunkte besitzt, ist die Folge eine abgeschlossene Teilmenge von X, die Menge U = X \ (xj ) ist somit offen. Da insbesondere kein xj
ein Häufungspunkt der Folge sein kann, existiert zu jedem j ein εj > 0 mit xi 6∈ Uεj (xj )
für alle i 6= j. Daher ist {Uεi (xi ) : i ∈ N} ∪ {U } eine offene Überdeckung von K, die keine
endliche Teilüberdeckung besitzt.
Als elegante Anwendung beweisen wir die folgende Verallemeinerung von Satz 6.17:
Satz 9.18 (Satz über die gleichmäßige Stetigkeit) Es sei K kompakt und die Funktion f : K → R sei stetig. Dann ist f auf K sogar gleichmäßig stetig, d.h.
∀ε > 0∃δ > 0∀x, x0 ∈ K : d(x, x0 ) < δ ⇒ |f (x) − f (x0 )| < ε.
Beweis. Es sei ε > 0 fixiert. Da f : K → R stetig ist, existiert zu jedem Punkt x ∈ K ein
δx > 0 mit |f (x) − f (x0 )| < ε/2 für alle x0 ∈ Uδx (x). Wegen
[
K⊆
Uδx /2 (x)
x∈K
und der Kompaktheit von K existiert eine endliche Menge {x1 , . . . , xn } mit
K⊆
n
[
Uδxj /2 (xj ).
j=1
Die Zahl δ = min δxj /2 > 0 hat damit die gesuchte Eigenschaft.
j=1,...,n
9.4 Wege zur Einführung der Exponentialfunktion f (x) = ex
9.4
181
Wege zur Einführung der Exponentialfunktion f (x) = ex
1. Genetische Konstruktion
en
= e · . . . · e, n ∈ N
−n
n
e
= 1/e
, −n∈N
√
n m
m/n
e
=
e , m ∈ Z, n ∈ N
ex
= lim exn für xn → x mit xn ∈ Q
n→∞
(Diese Methode ist nur für reelle Argumente x ∈ R verwendbar!)
2. Folgendefinition
n
für x ∈ R
ex = lim 1 + nx
n→∞
(Diese Methode ist nur für reelle Argumente x ∈ R verwendbar!)
3. Potenzreihe
x
∞
X
xn
für x ∈ R, C, Rd,d
n!
(Diese Methode ist auch für komplexe Argumente x ∈ C oder sogar für x=quadratische Matrix
oder x=Operator verwendbar)
e
=
n=0
4. Differentialgleichung
y = ex ist die eindeutig bestimmte Lösung des sogenannten ”Anfangswertproblems”
y 0 = y mit y(0) = 1.
5. Funktionalgleichung
y = ex ist die eindeutig bestimmte, differenzierbare Lösung der Funktionalgleichung
y(x + s) = y(x) · y(s) für alle s, x ∈ R, und y(1) = e.
(Die Voraussetzung der Differenzierbarkeit kann sogar durch die schwächere Voraussetzung
der Stetigkeit ersetzt werden. Auch Monotonie oder sogar nur lokale Beschränktheit genügen!)
Begründungen:
1) Dies wurde in Satz 2.12 gezeigt.
2) Dies wurde in Satz 4.27 gezeigt.
3) Dies ist Inhalt von Satz 5.32 und Definition 5.33.
4) Offenbar löst die Funktion y = y(x) = ex das Anfangswertproblem. Zum Beweis der
Einzigkeit sei g eine weitere Lösung. Dann ist die Ableitung (Quotientenregel!) der
Funktion h(x) = g(x)/ex offenbar konstant Null, also ist h eine konstante Funktion.
Wegen h(1) = 1 ist h konstant 1, also ist g(x) = ex für alle x ∈ R.
182
9 ERGÄNZUNGEN
5) Einerseits erfüllt die e-Funktion die gestellten Bedingungen. Andererseits folgen aus
der gegebenen Bedingung y(0) = 1 und y 0 = a · y mit a = y 0 (0). Somit ist y(x) = eax
nach 4., und wegen y(1) = e folgt a = 1. Unter der Voraussetzung der Monotonie
wurde die Behauptung in Satz 2.14 gezeigt. Für stetige oder beschränkte Funktionen
überlassen wir den Nachweis dem Leser.
WARNUNG: Es gibt auch unstetige (sehr wilde) Lösungen der genannten Funktionalgleichung. Man muss dazu die Menge R als unendlichdimensionalen über Q
betrachten. Mit jeder Bassis dieses Vektorraumes kann man dann (sogar unendlich
viele) unstetige Lösungen konstruieren. Siehe zu diesem Thema auch: Die allgemeine
Lösung der Cauchyschen Funktionalgleichung f (x + y) = f (x) + f (y).
Aufgaben zu Abschnitt 9.4
1) Der Turmbau zu Babel: Es soll ein hoher (1000 m oder sogar ∞ hoch), runder
Turm aus Beton gebaut gebaut werden. Welches Profil ist aus statischen Gründen
zu wählen?
Hinweis: Beachten Sie, dass Baumaterialien nur eine bestimmte Druckbelastung
aushalten, oberhalb dieser sie zu Staub zerdrückt werden. Richten Sie das Profil
daher so ein, dass die Druckbelastung in jedem Punkt Ihres Bauwerks gleich ist.
Abbildung 40: Turmbau
9.5 Die logische Abhängigkeit der zentralen Sätze
9.5
Die logische Abhängigkeit der zentralen Sätze
183
184
9.6
9 ERGÄNZUNGEN
Kontrollfragen zur Analysis
1. Der geordnete Körper der reellen Zahlen
(a) Erläutern Sie die Axiome des geordneten Körpers der reellen Zahlen.
(b) Wie werden Wurzeln konstruiert?
(c) Wie werden Exponentialfunktionen f (x) = ax definiert/konstruiert?
2. Der Körper der komplexen Zahlen
(a) Wie lassen sich komplexe Zahlen in der Gaußschen Ebene veranschaulichen?
Wie werden Addition und Multiplikation analytisch und graphisch durchgeführt?
(b) Wie erfolgt die trigonometrische Darstellung komplexer Zahlen?
(c) Erläutern Sie die Eulersche Formel!
3. Folgen und Grenzwerte
(a) Was versteht man unter Folgen in R, C und Rd ? Wie lassen sie sich veranschaulichen?
(b) Erläutern Sie die Begriffe: Konvergente Folge, beschränkte Folge, monotone
Folge. Geben Sie Beziehungen zwischen diesen Eigenschaften an und begründen
Sie diese!
(c) Geben Sie einige Konvergenzkriterien an! Demonstrieren Sie die Kriterien an
Beispielen!
(d) Erläutern Sie das Prinzip der Intervallschachtelung! Gebeb Sie Anwendungen!
Geben Sie Beispiele an!
(e) Was sind Häufungspunkte einer Folge? Was besagt der Satz von BolzanoWeierstraß und wie wird er bewiesen?
(f) Was sind Cauchyfolgen? Formulieren Sie das Cauchy-Kriterium!
(g) Definieren und erläutern Sie wichtige topologische Grundbegriffe!
(h) Was ist der Inhalt des Banachschen Fixpunktsatzes (in R), welche Anwendungen kennen Sie?
(i) Was sind metrische Räume? Geben Sie Beispiele! Wann heißen Folgen in metrischen Räumen konvergent? Was sind Cauchyfolgen in metrischen Räumen?
Wann heißt ein metrischer Raum vollständig? Geben Sie Beispiele.
4. Reihen in R und C
(a) Was versteht man unter einer Reihe? Wann heißt eine Reihe konvergent und
was ist ihr Grenzwert?
(b) Geben Sie Konvergenzkriterien an! Erläutern Sie diese an Beispielen!
(c) Geben Sie Kriterien für die absolute Konvergenz von Reihen an!
(d) Wann und wie lassen sich Produkte von Reihen berechnen?
9.6 Kontrollfragen zur Analysis
185
(e) Erläutern Sie Begriff und Eigenschaften von Potenzreihen! Geben Sie Anwendungen!
5. Stetigkeit von Funktionen
(a) Wann heißt eine Funktion stetig an einer Stelle a? Geben Sie Beispiele und
Gegenbeispiele!
(b) Wie vererbt sich die Stetigkeit auf zusammengesetzte Funktionen?
(c) Was sind Grenzwerte von Funktionen? Nennen Sie wichtige Beispiele!
(d) Was besagt der Zwischenwertsatz, und wie wird er bewiesen?
(e) Nennen Sie fundamentale Eigenschaften stetiger Funktionen auf kompakten
Intervallen in R bzw. auf kompakten Mengen in metrischen Räumen.
6. Elementare Funktionen
(a) Was sind ganzrationale Funktionen? Erläutern Sie den Fundamentalsatz der
klassischen Algebra in R und in C!
(b) Geben Sie mehrere mögliche Definitionen der Exponentialfunktion f (x) = ex
und ihrer Umkehrfunktion an!
(c) Wie werden trigonometrische Funktionen in R und C definiert?
7. Differentialrechnung
(a) Wann heißt eine Funktion f bei a differenzierbar?
(b) Erläutern Sie das Prinzip der Linearisierbarkeit im Kleinen (Weierstraßsche
Zerlegungsformel)!
(c) Nennen Sie einige Differentiationsregeln und beweisen Sie die Produktregel!
(d) Wie lautet der Satz von Rolle? Wie wird er bewiesen?
(e) Was besagt der Mittelwertsatz der Differentialrechnung? Wie wird er bewiesen?
Geben Sie mindestens zwei Anwendungen!
(f) Erläutern Sie das Verfahren der Taylorentwicklung!
(g) Was sind analytische Funktionen? Geben Sie Beispiele und Gegenbeispiele an!
(h) Erläutern Sie Verfahren zur Kurvendiskussion!
(i) Was sind partielle Ableitungen?
(j) Was bedeutet Linearisierbarkeit im Kleinen für Funktionen z = f (x, y) mit
zwei Variablen?
(k) Nennen Sie Eigenschaften des Gradienten!
(l) Wie werden Extremwerte für Funktionen mit mehreren Variablen bestimmt?
(m) Wie sieht eine Taylorentwicklung für Funktionen mit zwei Variablen aus?
8. Integralrechnung
(a) Erläutern Sie die Konstruktionsschritte zur Bildung des Riemannschen Integrals!
186
9 ERGÄNZUNGEN
(b) Nennen Sie hinreichende Bedingungen für die Integrierbarkeit!
(c) Erläutern und beweisen Sie den Hauptsatz der Differential- und Integralrechnung mit allen seinen Teilen!
(d) Nennen und erläutern Sie Rechenregeln für das Riemannsche Integral und Methoden zur Ermittlung von Stammfunktionen!
(e) Erläutern Sie den Zusammenhang von Inhalt und Integral.
(f) Nennen Sie einige Methoden zur Berechnung mehrdimensionaler Integrale! Demonstrieren Sie dies an Beispielen.
(g) Wie werden Volumina, Bogenlängen und Flächeinhalte berechnet?
(h) Was wissen Sie zur Vertauschbarkeit von Limes und Integral?
9. Ergänzungen
(a) Was sind Fraktale?
(b) Definieren Sie den Raum C[a, b] und geben Sie einige gute und schlechte Eigenschaften dieses Raumes an!
(c) Was besagt der Approximationssatz von Weierstrass?
(d) Nennen Sie einige äquivalente Eigenschaften kompakter Mengen in R bzw. in
metrischen Räumen.
Index
Γ-Funktion, 148
e, Definition, 32
π
Berechnung, 106
Definition, 81
ε-Umgebung, 26
punktierte, 40
Äquivalenz
logische, 2
Überdeckungssatz von Heine-Borel, 179
arsinh, 19
Cesaro-Mittel, 30
Gaußsche Zahlenebene, 22
Riemann-Funktion, 129
Takagi-Funktion, 91
Cauchysche Produktreihe, 58
Cauchyscher Integraltest, 51, 147
Cavallierisches Prinzip , 151
cosh, 19
Darbouxsche Untersumme, 123
Dezimalbruchentwicklung, 10, 42, 52
Dichtheitsaxiom, 9
Differential
totales, 114
Differentialquotient, 87
Differentiationsregeln, 88
Kettenregel, 89
Potenzreihe, 92
Umkehrfunktion, 90
Differenziation
Umkehrfunktion, 90
Differenzierbarkeit, 87
linksseitige, rechtsseitige, 88
Divergenzkriterium, 59
Dominanzkriterium, 28
Abelscher Grenzwertsatz, 105
Ableitung, 87
höhere, 90
partielle, 111
Abschluss einer Menge, 44
Approximationssatz von Weierstrass, 174
Archimedisches Axiom, 8
arcosh, 19
Arcus-Funktionen, 82
Aussage, 2
Aussageform, 1
Eulersche Formel, 64
Eulersche Zahl, 32
Exponentialfunktion, 16
komplexe, 62
Extremwerte, 107
Flächeninhalt, 130
Folge, 25
konvergent, 26
Teil-, 25
Fundamentalsatz der klass. Algebra, 78
reelle Version, 80
Funktion
Dirichlet-, 68
Takagi, 91
analytische, 102
Dirichlet, 124
Eigenschaften, 13
Exponential–, 16
Charakterisierungssatz, 18
Reihendarstellung, 62
Gamma-, 148
ganzrationale, 76
Bernoulli–de l’Hospital, Regel von, 97
Bernsteinpolynome, 174
Besselfunktionen, 94
Betrag
komplexer Zahlen, 23
reeller Zahlen, 21
binärer Baum , 173
Binomialrreihe, 104
Binomischer Lehrsatz, 7
Bogenlänge, 165
Bolzano, Nullstellensatz von, 70
Cantormenge, 171
Cauchy-Kriterium
für Folgen, 42
für Reihen, 50
Cauchyfolge, 41, 177
187
188
INDEX
Grad, 77
implizite, 116
komplexe Logarithmus–, 84
Logarithmus–, 18
Potenz–, 13
transzendente, 80
trigonometrische–
Reihendarstellung, 64
Umkehr–, 14
voreindeutig, 13
Gebietsintegral, 152
geometrische Summe, 6
Gradient, 112
Grenzwert, 26
von Funktionen, 74
von links/rechts, 75
Grenzwertsätze, 50
für Folgen, 28
Grundintegrale, 135
Häufungspunkt, 43
einer Folge, 38
einer Menge, 40
Halbierungsverfahren, 39
Haufungspunkt
Stetigkeit, 74
Hauptsatz
über analytische Funktionen, 103
über implizite Fkt., 116
der Diff-Int-Rechn., Umkehrung, 135
der Diff-Integralrechnung, 134
Hausdorff-Dimension, 171
Hesse-Matrix, 121
Hilbertkurve, 173
Identitätssatz für Potenzreihen, 98
Infimum, 7
Inhalt
Riemannscher, 149
Injektion, 13
Integrabilitätsbedingung, 119
Integral
elliptisches, 167
iteriertes, 153
mehrdimensionales, 152
Riemannsches, 123
unbestimmtes, 135
uneigentliches, 146
Intervallschachtelung, 36
Jacobi-Matrix, 159
Kardinalzahl, 3
Kettenregel, 89
Verallgemeinerte, 114
Kochsche Kurve, 170
Koeffizientenvergleich, 76
Komlexe Zahlen, 22
komplexe Zahl
Betrag, 23
Imaginärteil, 23
konjugierte, 23
Realteil, 23
trigonometrische Darstellung, 83
komplexe Zahlen, 22
trigonometrische Darstellung, 65
konkav, 109
Konvergenz
absolute, 54
gleichm, 145
gleichmäßige, 72, 178
punktweise, 72
unbedingte, 55
Konvergenzbereich, 59
Konvergenzkriterium
Bolzano, 32
konvex, 109
Krümmungskreis, 109
Kreisscheibensatz, 37
Kreuzmenge, 3
Kugelkoordinaten, 161
Kurve, 114, 164
glatte, 164
Kurvendiskussion, 106
Lücke, 75
Leibnizkriterium, 53
Leibnizreihe, 37, 43
liminf, 39
limsup, 39
Logarithmusreihe, 104
Majorantenkriterium, 54
Menge
abgeschlossen, 43
INDEX
Abschluss, 44
kompakt, 73, 178
offen, 43
prkompakt, 179
zusammenhängend, 153
Mengenbildung, 2
Metrik, 177
metrischer Raum, 177
kompakter, 178
vollständig, 178
Mittelwertsatz
der Integralrechnung, 133
Mittelwertsatz der Diff.rechnung, 95
Moivresche Formeln, 84
Monotonie, 14
1. Hauptsatz, 15
2. Hauptsatz, 69
Normalbereich, 151
Nullfolge, 27
Nullstelle
ganzrat. Funktion, 78
Vielfachheit, 77
Nullstellensatz von Bolzano, 70
Partialsummen, 48
Partielle Integration, 137
Pol, 75
Polarkoordinaten, 160
Potenzmenge, 3
Potenzreihe, 59
Prinzip des Koeffizientenvergleichs, 98
Punkt
innerer, 43
Quotientenkriterium, 54
Randpunkt, 43
Rechteckregel, 127
Regel von Bernoulli-de l’Hospital, 97
Regressionsgerade, 122
Reihe, 48
Dirichlet, 51
absolute Konvergenz, 54
alternierende, 53
Bolzanosches Konvergenzkriterium,
50
geometrische, 49
189
harmonische, 49
notwendiges Konvergenzkriterium, 50
Restglied, 99
von MacLaurin, 100
Restgliedformel
von Cauchy, 99
von Lagrange, 99
Riemann-Integral, 123
Riemannscher Umordnungssatz, 55
Rolle, Satz von, 95
Satz
Approximationssatz von Weierstrass,
174
Approximationssatz von Weierstrass,
trigonometrische Form, 176
Heine-Borel, 179
vom Maximum und Minimum, 71
von Bolzano, 32
von Bolzano-Weierstraß, 39
von Bolzano-Weierstraß für Mengen,
40
von Cauchy-Hadamard, 60
von H. A. Schwarz, 118
von Riemann, 56
von Taylor, 99
Satz vom Maximum und Minimum, 179
Satz von Fubini, 154
Schranke, 7
Sierpinski-Dreieck, 172
sinh, 19
Spirale
Archimedische, 167
logarithmische, 167
Sprung, 75
Stammfunktion, 134
Stetigkeit, 66
ε − δ−Definition, 66
gleichmäßige, 71
Substitutionsregel, 138
Superposition, 13
Supremum, 7
Surjektion, 13
Tangente, 114
Taylor
-Koeffizienten, 99
-formel, 99
190
-formel für n Variable, 121
-polynom, 99
-reihe, 99
Transformationsformel, 159
Trapezregel, 128
Trigonometrische Polynome, 175
Tschebyscheff-Metrik, 178
Ungleichung
Bernoullische, 5
Vergleichskriterium, 30
Wahrheitswert, 1
Weierstraßsche Zerlegungsformel, 87, 113
Wendepunkt, 108
Wurzelkriterium, 54
Zahlenfolge
beschränkt, 27
quasistationär, 25
stationär, 25
Zerlegung, 123
äquidistante, 126
Zerlegungssumme, 123
Zetafunktion, 51
Zwischenwertsatz, 71
Zylinderkoordinaten, 161
INDEX
Herunterladen