1. Elementare Grundlagen 1.1. Vollständige Induktion und der

Werbung
1. Elementare Grundlagen
1.1. Vollständige Induktion und der binomische Lehrsatz. Wir folgen weitgehend
den Überlegungen in Forster, Kapitel 1. Die ohne Beweis aufgeführten Sätze sind mit den
Sätzen identisch, die bei Forster dieselbe Nummer tragen. Auch der in der Vorlesung gebrachte
Beweis wird sich an dem Beweis bei Forster orientieren.
Definition 1. Sei N = {0; 1; . . . } die Menge aller natürlichen Zahlen (alsoaller nichtnegativen ganzen Zahlen). Die Menge aller ganzen Zahlen bezeichnen wir mit Z = 0; ±1; ±2; . . . }.
Die Menge aller rationalen Zahlen bezeichnen wir mit Q und die Menge aller reellen Zahlen
mit R.
Fakt 1 (Vollständige Induktion). Sei no eine ganze Zahl, und sei An eine Behauptung über
ganze Zahlen n ≥ no . Die folgenden Aussagen seien bekannt:
Induktionsanfang: Es gilt Ano .
Induktionsschluß: Sei n > no , dann folgt An aus An−1 .
Dann gilt An für alle ganzen Zahlen n ≥ no .
Ein analoges Prinzip gibt es für die induktive Konstruktion einer Folge mathematischer
Objekte.
Die vollständige Induktion als Beweisprinzip ist intuitiv klar, denn im Fall no = 0 ergibt sich
A0 aus dem Induktionsanfang, sodann A1 aus A0 , A2 aus A1 , A3 aus A2 , und mit sehr viel Geduld erhält man durch analoge Überlegungen zum Beispiel auch A2003 . Allerdings würden uns
hartnäckige Skeptiker vielleicht trotzdem nicht glauben, daß auch A102003 richtig ist, denn ohne
das Induktionsprinzip zu benutzen läßt sich der Beweis von A102003 aus praktischen Gründen
nicht mehr in Worte fassen. Alternativ dazu kann man das Prinzip auch aus der intuitiv klaren Aussage herleiten, wonach jede nichtleere Menge natürlicher Zahlen ein kleinstes Element
enthält. Diese Herleitung sieht dann folgendermaßen aus:
Beweis. Wenn die Behauptung nicht richtig ist, gibt es irgendeine ganze Zahl n ≥ no , so
daß An falsch ist. Dieses n hat die Form no + k mit einer natürlichen Zahl k. Die Menge
M = k ∈ N Ano +k ist falsch
ist daher nicht leer. Wie vorhin bemerkt, hat M ein kleinstes Element k. Sei n = no + k. Es gilt
n > no , also k > 0, denn sonst wäre die Induktionsannahme Ano falsch. Es gilt k − 1 6∈ M auf
Grund der Minimalität von k. Wegen k − 1 6∈ M ist An−1 richtig. Nach dem Induktionsschluß
sollte also auch An richtig sein, was aber nicht der Fall war. Dieser Widerspruch beweist die
Behauptung.
Wir haben vorhin klargemacht, daß wir damit nur ein intuitiv klares Prinzip (das Induktionsprinzip) aus einem anderen intuitiv klaren Prinzip (jede nichtleere Menge natürlicher Zahlen
enthält ein kleinstes Element) hergeleitet haben. Ohne derartige intuitiv klare Prinzipien vorauszusetzen, kann man keine Mathematik treiben, so wie man sich nicht an seinem eigenen
Schopf aus dem Sumpf ziehen kann. Die als intuitiv klar vorausgesetzten Prinzipien nennt man
Axiome. Die heutige Mathematik beruht auf der Mengenlehre, die von Cantor eingeführt und
1
2
für die Zermelo und Fraenkel sowie von Neumann, Bernays und Gödel zwei zueinander äquivalente Axiomatisierungen gegeben haben. Im Prinzip kann man bei diesem Aufbau der Mathematik die natürlichen Zahlen aus der leeren Menge und den Operationen zur Mengenbildung,
die Bereiche der ganzen und rationalen Zahlen aus dem Bereich der natürlichen Zahlen und
die reellen Zahlen aus den rationalen Zahlen aufbauen, so daß im Prinzip das ganze imposante
Gebäude der modernen Mathematik aus der leeren Menge und den Mengenbildungsoperationen aufgebaut wird. Die Axiome sind dabei intuitiv klare Prinzipien zur Konstruktion und zum
Vergleich von Mengen, wobei aber eine gewisse Portion Vorsicht erforderlich ist, um Paradoxa
vom Typ der Antinomie des Lügners zu vermeiden.
Für uns wäre diese radikale Vorgehensweise zu ehrgeizig. Daher tragen für uns bestimmte
Aussagen über natürliche und reelle Zahlen axiomatischen Charakter, beispielsweise das vorhin benutzte Prinzip, wonach jede nichtleere Menge natürlicher Zahlen ein kleinstes Element
enthält. Wir setzen die Kenntnis des Rechnens mit reellen Zahlen (Addition, Multiplikation
und Division) voraus und betrachten die aus der Schule bekannten Gesetze der Kommutativität, Assoziativität und Distributivität für diese Rechenoperationen ebenfalls als Axiome.
Außerdem arbeiten wir manchmal mit bestimmten intuitiv klaren Eigenschaften des Abzählens
endlicher Mengen, ohne diese expressis verbis als Axiome zu formulieren. Ein Beispiel wäre das
Prinzip, wonach Zahl der Elemente einer disjunkten Vereinigung die Summe der Elementezahlen der Operanden ist. Ein anderes Beispiel sind unsere Überlegungen zum Beweis von Satz 3
weiter unten.
Definition 2. Wir definieren mehrfache Summen und Produkte reeller Zahlen durch
b
X
xi = xa + . . . + x b
i=a
b
Y
i=a
xi = xa · . . . ·xb
für a ≤ b und vereinbaren, daß eine leere Summe gleich 0 und ein leeres Produkt gleich 1 ist:
b
X
(1)
xi = 0
für b < a
xi = 1
für b < a
i=a
b
Y
(2)
i=a
Diese Konvention kann zusammen mit den Regeln
(3)
b
X
xi =
i=a
(4)
b
Y
i=a
b−1
X
i=a
xi =
b−1
Y
i=a
xi + xb
xi · xb
für a ≤ b
für a ≤ b
1. ELEMENTARE GRUNDLAGEN
3
zu einer induktiven Definition der mehrfachen Summen bzw. Produkte benutzt werden.
Wie schon gesagt, setzen wir die Gesetze der Kommutativität, Assoziativität und Distributivität für Summen und Produkte reeller Zahlen als bekannt voraus. Der Beweis des folgenden
Faktes gilt auch für jeden anderen Zahlbereich, in dem diese Gesetze gelten, etwa für die
rationalen Zahlen oder die später einzuführenden komplexen Zahlen.
Fakt 2. Für ganze Zahlen a − 1 ≤ b ≤ c und reelle Zahlen xi gilt
c
X
(5)
xi =
i=a
c
Y
b
X
xi +
i=a
xi =
i=a
b
Y
i=a
c
X
xi
i=b+1
xi ·
c
Y
xi
i=b+1
Für beliebige ganze Zahlen a, b, reelle xi , yi und λ gilt das Distributivitätsgesetz
b
X
(6)
i=a
b
X
(7)
(λxi ) = λ ·
(xi + yi ) =
i=a
b
X
b
X
i=a
b
Y
(xi yi ) =
b
Y
i=a
i=a
xi
i=a
b
X
xi +
yi
i=a
b
Y
xi ·
i=a
yi
τ→ a′ ; . . . , b′ eine bijektive Abbildung, dann gilt
Sei a; . . . ; b −−
(8)
b
X
(9)
′
xi =
b
X
i=a
j=a′
b
Y
b
Y
xτ (j)
′
xi =
i=a
xτ (j) .
j=a′
Die Behauptungen sind intuitiv klar, können aber auch mittels (3) und (4) aus (1) und (2)
durch Induktion hergeleitet werden.
Beweis. Zum induktiven Beweis der ersten beiden Behauptungen fixieren wir a und b
und verwenden Induktion nach c. Wir beweisen nur die erste Behauptung, da der induktive
Beweis der zweiten vollkommen analog verläuft. Für c = b (das kleinste c, für welches wir die
Behauptung aufstellen), gilt
c
X
i=a
xi =
b
X
i=a
xi =
b
X
i=a
xi + 0 =
b
X
i=a
xi +
c
X
i=b+1
xi ,
4
wobei wir nacheinander die Gleichung b = c, die für alle reellen Zahlen s gültige Gleichung
s + 0 = s sowie (1) benutzt haben. Sei c > b, und sei die Behauptung für das Tripel (a, b, c − 1)
bewiesen. Aus unseren Voraussetzungen folgt c ≥ b + 1 und c ≥ a, deswegen kann (3) sowohl
auf die Summe von a bis c als auch auf die Summe von b + 1 bis c angewendet werden. Es
kommt
c
c−1
b
c−1
b
c
X
X
X
X
X
X
xi =
xi + xc =
xi +
xi + xc =
xi +
xi ,
i=a
i=a
i=a
i=a
i=b+1
i=b+1
wobei das mittlere Gleichheitszeichen durch die Induktionsannahme gerechtfertigt ist, während
das rechte und linke Gleichheitszeichen Anwendungen von (3) sind. Die Induktionsbeweise von
(6) und (7) sind ähnlich einfach, wobei (6) das Distributivitätsgesetz a(b + c) = ab + ac und
(7) die Kommutativität der jeweils betrachteten Rechenoperation benutzt. Der Induktionsbeweis von (8) kann am einfachsten durch Benutzung von (5) sowie der Kommutativität der
betrachteten Rechenoperation geführt werden. Wir wollen nicht in Details eingehen, weil die
Behauptung intuitiv einleuchtend ist.
Satz 1. Für n ∈ N gilt die Summenformel
n
X
(10)
n(n + 1)
2
i=
i=1
Etwas allgemeiner ist
Satz 2 (Summenformel für arithmetische Reihen). Für beliebige reelle Zahlen a, b und
natürliche Zahlen n gilt
n
X
n(n + 1)
(a + bi) = an + b
.
2
i=1
(11)
Insbesondere gilt
n
X
(2i − 1) = n2 .
(12)
i=1
Beweis. Wir benutzen
n
X
1 = n,
i=1
was intuitiv klar ist (es handelt sich um n mal den Summanden 1), aber auch durch Induktion
nach der natürlichen Zahl n unter Benutzung von (3) gezeigt werden könnte. Durch Anwendung
von (7), (6) und (10) ergibt sich die erste Behauptung:
n
X
i=1
(a + bi) =
n
X
i=1
a+
n
X
i=1
bi = a
n
X
i=1
1+b
n
X
i=1
i = an + b
n(n + 1)
.
2
1. ELEMENTARE GRUNDLAGEN
Die zweite Behauptung ergibt sich als Spezialfall a = −1, b = 2 der ersten:
n
X
n(n + 1)
(2i − 1) = −n + 2
= −n + n(n + 1) = −n + n2 + n = n2 .
2
i=1
5
Definition 3. Sei X eine Menge. Eine k-gliedrige Folge von Elementen von X ist eine
x→ X, wobei wir in diesem Kontext meist xi statt x(i) schreiben. Die
Abbildung {1; . . . ; k} −−
Folge ist wiederholungsfrei, falls aus 0 < i < j ≤ k xi 6= xj folgt.
Bemerkung 1. Im Falle k = 0 ist diese Definition so zu interpretieren, daß es genau
eine Folge von 0 Elementen gibt. Es handelt sich um die leere Folge, definiert durch die leere
Abbildung. Sie ist wiederholungsfrei.
Bemerkung 2. Später werden wir auch die Möglichkeit zulassen, daß die Numerierung
der Folgenglieder nicht bei 1 startet.
Definition 4. Für natürliche Zahlen n definieren wir n! (sprich: n Fakultät) durch
n
Y
(13)
n! =
i.
i=1
Bemerkung 3. Als Konsequenz auf (2) und (4) haben wir 0! = 1 und (n + 1)! = (n + 1)n!
für alle natürlichen Zahlen n. Alternativ zur obigen Definition könnten diese Tatsachen auch
benutzt werden, um die Funktion n! induktiv zu definieren.
Definition 5. Seien n und k natürliche Zahlen, wir definieren den Binomialkoeffizienten
durch
Y
k
n+1−i
n· . . . ·(n + 1 − k)
n
=
=
.
(14)
k
i
k!
i=1
n
k
Bemerkung 4. Für k ≤ n berechnet sich durch Umordnen ((8)) und Anwendung von (5)
das Produkt im Nenner des letzten Ausdruckes auf der rechten Seite von (14) zu
Qn
k
n
Y
Y
i
n!
= ,
(n + 1 − i) =
i = Qi=1
k
k!
i=1 i
i=1
i=n+1−k
und es kommt
(15)
n!
n
=
.
k
k!(n − k)!
Der Beweis von Teil 3 und Teil 4 des folgenden Satzes wird bei Forster als Satz 3 und
Satz 4 durch Induktion bewiesen. Wir gehen ebenfalls durch Induktion vor, formulieren unsere
Überlegungen aber teilweise etwas laxer als Forster.
Satz 3. Sei X eine Menge mit n Elementen.
6
• Es gibt genau Q
nk verschiedene Folgen von k Elementen aus X.
• Es gibt genau ki=1 (n + 1 − i) = n · (n − 1)· . . . ·(n − k) verschiedene wiederholungsfreie
Folgen von k Elementen von X.
• Es gibt genau n! Möglichkeiten, die Elemente von X zu einer wiederholungsfreien Folge
anzuordnen.
• Es gibt genau nk verschiedene k-elementige Untermengen von X.
Beweis. Die ersten beiden Behauptungen beweisen wir durch Induktion nach k. Für k = 0
ergeben sich beide Behauptungen aus Bemerkung 1. Sei k > 0, und sei die erste Behauptung
für (k − 1)-gliedrige Folgen bewiesen. Jede der n(k−1) (k − 1)-gliedrigen Folgen von Elementen
von X kann durch Ergänzung mit einem beliebigen Element von X zu einer k-gliedrigen Folge
ergänzt werden. Für die Wahl dieses Elementes gibt es genau n Möglichkeiten. Also gibt es
genau n · nk−1 = nk verschiedene k-gliedrige Folgen.
Für wiederholungsfreie Folgen ist beim Induktionsschluß zwischen dem Fall k ≤ n und dem
Fall k > n zu unterscheiden. Im letzteren Fall gibt es offenbar keine wiederholungsfreien Folgen
der Länge k, wenn nur n Elemente
Qk für die Auswahl der Folgenglieder zur Verfügung stehen.
Für k ≤ n gibt es für jede der i=1 (n + 1 − i) wiederholungsfreien (k − 1)-gliedrigen Folgen
genau n − (k − 1) = n + 1 − k Möglichkeiten, das k-te Element so zu wählen, daß es von jedem
Qk−1
(n + 1 − i) k-gliedrige
der ersten (k − 1) Elemente verschieden ist. Also gibt es genau i=1
Folgen.
Qn
Die dritte Behauptung ist der Spezialfall
k
=
n
der
zweiten,
denn
das
Produkt
n!
=
i=1 i
Qn
ist eine Umordnung des Produktes i=1 (n + 1 − i). Die Abbildung τ (i) = n + 1 − i bildet
nämlich die Indexmenge {1; . . . ; n} bijektiv auf sich selbst ab.
Wir leiten die vierte Behauptung aus der zweiten und dritten her. Sei Cn,k die Zahl der kelementigen Untermengen Y von X. Für jedes derartige Y liefert jede der k! Möglichkeiten, Y
zu einer wiederholungsfreien Folge anzuordnen, eine k-gliedrige wiederholungsfreie Folge von
Elemeten von X, wobei offenbar jede dieser k!Cn,k Möglichkeiten eine andere Folge liefert und
Q
jede der ki=1 (n + 1 − i) k-gliedrigen wiederholungsfreien Folgen erhalten wird. Wir erhalten
Q
k!Cn,k = ki=1 (n + 1 − i). Durch Umformen nach Cn,k folgt die Behauptung.
Satz 4. Für 1 ≤ k ≤ n gilt
n
n−1
n−1
=
+
.
k
k−1
k
Der Satz wird bei Forster als Hilfssatz formuliert, wir bringen als Beweis dieselbe einfache
Rechnung wie Forster.
Bemerkung 5. Pascalsches Dreieck, siehe Forster für eine Abbildung des Pascalschen
Dreieckes.
Die Bedeutung der Binomialkoeffizienten für das Rechnen mit Potenzen ergibt sich aus
1. ELEMENTARE GRUNDLAGEN
7
Satz 5 (Binomischer Satz). Für jede natürliche Zahl n und beliebige reelle Zahlen x, y gilt
n X
n k n−k
n
x y .
(16)
(x + y) =
k
k=0
Der Beweis beruht auf einem Induktionsargument unter Benutzung von Satz 4, siehe Forster. Durch Ersetzen von y durch −y kommt
n X
n
n
(−1)n−k xk y n−k .
(17)
(x − y) =
k
k=0
Für kleine Werte von n ergeben sich die Spezialfälle (x + y)2 = x2 + 2xy + y 2 , (x − y)2 =
x2 − 2xy + y 2 , (x + y)3 = x3 + 3x2 y + 3xy 2 + y 3 und (x + y)4 = x4 + 4x3 y + 6x2 y 2 + 4xy 3 + y 4 .
Ebenfalls durch Induktion kann man die Summenformel für die geometrische Reihe beweisen:
Satz 6. Sei q eine von 1 verschiedene reelle und k eine natürliche Zahl, dann gilt
(18)
k
X
i=0
qi =
q k+1 − 1
.
q−1
Wir folgen dem Beweis bei Fischer. Ebenfalls durch Induktion, oder durch Anwendung von
(18) auf q = a/b und Multiplikation mit bk , ergibt sich die Gleichung
(19)
ak − bk = (a − b)
k
X
ai−1 bk−i .
i=1
Der Spezialfall k = 2 ist der aus der Schule bekannte dritte binomische Satz x2 − y 2 = (x −
y)(x + y).
1.2. Die Körperaxiome. Für die Rechenoperationen in R gelten die Körperaxiome. Wir
beginnen bei der Beschreibung dieser Axiome mit den Axiomen der Addition. Im Folgenden
sind x, y, a, b, c, d immer reelle Zahlen.
Fakt 1 (Axiome der Addition).
• x + y = y + x (Kommutativität)
• x + (y + z) = (x + y) + z (Assoziatitivtät)
• Es gibt eine Zahl 0 mit x + 0 = 0 für alle x ∈ R. (Existenz der 0).
• Zu jeder Zahl x ∈ R gibt es eine Zahl −x mit x + (−x) = 0. (Existenz des Negativen)
Fakt 2. Aus den Axiomen der Addition ergeben sich als Folgerungen:
• Die Eindeutigkeit der 0.
• Die Eindeutigkeit von −x.
• −0 = 0.
• Die Gleichung a + x = b mit reellen a, b hat die eindeutige Lösung x = b − a = b + (−a).
• −(−x) = x.
• −(x + y) = (−x) + (−y).
8
Fakt 3 (Axiome der Multiplikation).
• (xy)z = x(yz). (Assoziativität)
• xy = yx. (Kommutativität)
• Es gibt eine Zahl 1 mit x · 1 = x für alle reellen x. (Existenz der 1).
• Zu jedem x ∈ R − {0} gibt es ein x−1 ∈ R mit x · x−1 = 1.
Fakt 4 (Distributivität). x(y + z) = xy + xz.
Unter einem Körper versteht man einen Zahlbereich, der die obigen Axiome der Multiplikation, der Addition und das Gesetz der Distributivität erfüllt. Nähere Einzelheiten dazu
werden auch in der Vorlesung zur linearen Algebra behandelt werden. Aus den Körperaxiomen
ergeben sich folgende Konsequenzen:
Fakt 5.
• Die 1 und das Inverse einer von 0 verschiedenen reellen Zahl sind durch
die obigen Eigenschaften eindeutig bestimmt.
• Für a, b ∈ R mit a 6= 0 hat ax = b die einzige Lösung x = b · a−1 = b/a.
• (x + y)z = xz + yz.
• x0̇ = 0.
• Es gilt x · y = 0 genau dann, wenn x = 0 oder y = 0
• (−x)y = −(xy).
• (−1)x = −x.
• (−x)(−y) = xy.
• Falls x und y nicht verschwinden, gilt (x−1 )−1 = x und (xy)−1 = x−1 y −1 .
• Für ganze Zahlen a, b, c, d gilt
b X
d
d X
b
X
X
xij =
xij
i=a
j=c
d
b Y
Y
i=a
j=c
j=c
xij =
i=a
b
d Y
Y
j=c
xij
i=a
In derartigen Fällen können also die soeben noch geschriebenen Klammern weggelassen
werden.
• Unter denselben Voraussetzungen an a, b, c, d:
b
d
b X
d
X
X
X
xi ·
yj =
xi yj .
i=a
j=c
i=a j=c
Definition 1. Die Potenzen xn mit n ∈ N werden rekursiv durch x0 = 0 und xn+1 = x · xn
definiert. Für negative n ∈ Z und x ∈ R − {0} setzen wir xn = (x−1 )n .
Aus den Körperaxiomen ergeben sich die folgenden Rechenregeln für Potenzen:
Fakt 6. Falls beide Seiten der folgenden Gleichungen wohldefiniert sind (also x 6= 0 falls
einer der beteiligten Exponenten n oder m negativ ist, und im Falle von Punkt 3 auch y 6= 0
für n < 0), gilt:
1. ELEMENTARE GRUNDLAGEN
9
• xn+m = xn xm .
• xnm = (xn )m .
• (xy)n = xn y n .
1.3. Die Anordnungsaxiome.
Fakt 1. Es gelten die folgenden Anordnungsaxiome:
• Für jede reelle Zahl x tritt genau einer der drei Fälle x > 0, x = 0 und −x > 0 ein.
• Aus x > 0 und y > 0 folgen die Beziehungen x + y > 0 und xy > 0.
Wir schreiben x > y für die Bedingung x − y > 0 und x < y für die Bedingung y > x. Wir
schreiben x ≥ y für die Bedingung x > y oder x = y“ und x ≤ y für x < y oder x = y“. Die
”
”
Beweise der nachfolgenden Fakten können bei Forster, 3.1-3.12, nachgeschlagen werden:
Fakt 2. Im Folgenden sind x, y, a und b reele Zahlen.
• Die Aussagen x > 0 und −x < 0 sind äquivalent.
• Aus x > y und y > z folgt x > z (Transitivität der >-Relation).
• Aus x > y und a > b folgt x + a > y + b.
• Aus x > y und a > 0 folgt ax > ay.
• Aus 0 ≤ x < y und 0 ≤ a < b folgt ax < by.
• Aus x > y und a < 0 folgt ax < ay.
• Aus x 6= 0 folgt x2 > 0.
• Aus x > 0 (bzw. x < 0) folgt x−1 > 0 (bzw. x−1 < 0).
• Aus x > y > 0 oder 0 > x > y folgt y −1 > x−1 .
• 1 > 0.
• n > 0 für jede natürliche Zahl n.
Definition 1. Wir definieren |x| = x für x ≥ 0 und |x| = −x für x < 0.
Fakt 3. Sei x, y ∈ R.
• Es gilt |x| ≥ 0 mit Gleichheit genau für x = 0.
• Es gilt x ≤ |x|.
• |−x| = |x|.
• |xy| = |x| |y|.
• |xn | = |x|n
• |x/y| = |x| / |y|.
Satz 1 (Dreiecksungleichung). Für reelle x und y gilt |x + y| ≤ |x| + |y|.
Folgerung 1. Unter derselben Voraussetzung an x, y gilt |x + y| ≥ |x| − |y|.
Satz 2 (Bernoullische Ungleichung). Sei x ≥ −1. Dann gilt (1 + x)n ≥ 1 + nx für alle
n ∈ N.
Fakt 4 (Das Archimedische Axiom). Wenn x und y positive reelle Zahlen sind (maW
x, y ∈ R sowie x > 0 und y > 0), so gibt es eine natürliche Zahl n mit nx > y.
10
Fakt 5. Zu jeder positiven reellen Zahl ε gibt es ein n ∈ N mit 1/m < ε für alle Zahlen
m ≥ n.
Beweis. Man kann das Archimedisch Axiom auf 1 und 1/ε anwenden, denn es gilt 1/ε > 0
nach Fakt 2. Man erhält die Existenz einer natürlichen Zahl n mit n > 1/ε. Aus der in Fakt 2
bewiesenen fallenden Monotonie der Funktion 1/t ergibt sich 1/m ≤ 1/n < 1/(1/ε) = ε für
beliebige reelle Zahlen m ≥ x.
Zum Beweis des folgenden Satzes benötigen wir
Fakt 6. Sei b ≥ 1 reell, dann gilt bn ≥ 1 für alle n ∈ N, wobei die Gleichheit nur für b = 1
oder n = 0 eintritt.
Den Beweis führt man leicht durch Induktion.
Satz 3. Sei b > 1. Dann gibt es zu jeder rellen Zahl K ein n ∈ N mit bm > K für alle
natürlichen Zahlen m ≥ n.
Beweis. Aus der Bernoullischen Ungleichung und dem Archimedischen Axiom ergibt sich
die Existenz eines n ∈ N mit bn > K. Wegen b > 1 gilt bm = bn bm−n ≥ bn > K für m ≥ n,
denn wir haben vorhin bm−n ≥ 1 gezeigt.
Folgerung 2. Sei b eine relle Zahl mit |b| < 1. Dann gibt es zu jedem positiven rellen ε
eine Zahl n ∈ N mit |bn | < ε.
Beweis. Der Fall b > 0 wird wie bei Forster durch Anwendung des Satzes auf b−1 erledigt,
der Fall b < 0 ergibt sich wegen |b|n = |b|n und der Fall b = 0 ist trivial.
Der folgende Fakt kann als eine Variante des Archimedischen Axiomes angesehen werden:
Satz 4. Zu jeder rellen Zahl x gibt es eine eindeutig bestimmte ganze Zahl n mit n ≤ x <
n + 1.
Beweis. Die Menge M aller ganzen Zahlen l mit l > x ist nach nichtleer. Für x ≤ 0
gilt nämlich 1 ∈ M , und für x > 0 kann das Archimedische Axiom auf die Zahlen 1 und x
angewendet werden und ergibt die Existenz einer natürlichen Zahl m mit m · 1 > x.
Da die Menge M von unten beschränkt ist (nämlich durch die reelle Zahl x), hat sie nach
dem nachfolgenden Satz ein kleinstes Element l. Sei n = l − 1, dann gilt n ≤ x (sonst wäre
n > x im Widerspruch zur Minimalität von l) und n + 1 = l > x wegen l ∈ M .
Wir haben den Satz benutzt, wonach jede von unten beschränkte Menge natürlicher Zahlen
ein kleinstes Element enthält:
Satz 5. Sei M ⊆ R eine Untermenge, dann sind die folgenden Aussagen äquivalent:
• Es gibt eine ganze Zahl m mit l ≥ m für alle l ∈ M .
• Es gibt eine reelle Zahl m mit derselben Eigenschaft.
Eine derartige Menge nennt man von unten beschränkt. Jede von unten beschränkte nichtleere
Menge ganzer Zahlen enthält ein kleinstes Element.
1. ELEMENTARE GRUNDLAGEN
11
Beweis. Sei µ eine reelle Zahl mit l ≥ µ für alle l ∈ M , wir müssen die Existenz einer
ganzen Zahl n mit derselben Eigenschaft zeigen. Falls µ ≥ 0 gilt, kann n = 0 genommen werden.
Andernfalls ergibt sich aus der Anwendung des Archimedischen Axiomes auf die Zahlen 1 und
−µ die Existenz einer natürlichen Zahl k mit −k < µ, und man nimmt n = −k. Damit ist die
Äquivalenz der beiden Bedingungen gezeigt, denn die entgegengesetzte Implikation ist trivial.
Sei M eine von unten beschränkte nichtleere Menge ganzer Zahlen, es gibt eine ganze Zahl
l mit n ≥ l für n ∈ M . Dann ist
M̃ = m ∈ N l + m ∈ M
eine nichtleere Teilmenge von N. M̃ hat ein kleinstes Element m, und man zeigt leicht, daß
n = l + m ein kleinstes Element von N ist.
1.4. Der Körper der komplexen Zahlen. Die Menge aller Paare (a, b) reller Zahlen
bildet mit den Rechenoperationen
(a, b) + (x, y) = (a + x, b + y)
(a, b) · (x, y) = (ax − by, ay + bx)
einen Körper. Man schreibt a + bi statt (a, b), wobei sich die Rechenregeln aus i2 = −1 und
den Körperaxiomen ergeben. Die Zahlen a und b nennt man den Real- und Imaginärteil der
komplexen Zahl a + ib, a = ℜ(a + ib), b = ℑ(a + ib).
Die Kommutativität und Assoziativität beider Rechenoperationen rechnet man leicht nach,
ebenso die Distributivität. Das Negative zu a + bi ist (−a) + (−b)i. Das Inverse zu a + bi ist
a−bi
. Es gilt also
a2 +b2
x + iy
(x + iy)(a − ib)
xa + yb ay − bx
=
= 2
+ 2
i.
2
2
a + ib
a +b
a + b2
a + b2
√ Wir benutzen vorerst ohne Beweis, daß aus jeder reellen Zahl r ≥ 0 eine Quadratwurzel
r ≥ 0 existiert.
Wir definieren den Absolutbetrag einer komplexen Zahl durch
p
|x + iy| = x2 + y 2 ,
nach dem Lehrsatz des Pythagoras handelt es sich um den Abstand des Punktes (x, y) vom
Koordinatenursprung. Das konjugiert-komplexe zu a + ib ist a + ib = a − ib.
Satz 1.
• Das Tripel (C, +, ·) ist ein Körper.
• Für relle Zahlen stimmt der soeben definierte Absolutbetrag mit dem früher eingeführten
überein.
• Es gilt x + y = x + y, xy = x · y sowie |x| = |x| und x = x.
• Es gilt |z|2 = zz.
• Es gilt
(1)
|ab| = |a| |b|
12
(2)
• Es gilt
|z n | = |z|n
zn = zn
für alle z ∈ C, n ∈ Z unter der zusätzlichen Voraussetzung z 6= 0 im Falle n < 0.
• Es gilt
√
(3)
max(|ℜz| , |ℑz|) ≤ |z| ≤ 2 max(|ℜz| , |ℑz|)
(4)
• Eine komplexe Zahl verschwindet genau dann, wenn ihr Betrag verschwindet.
• Es gilt die Dreiecksungleichung
|x + y| ≤ |x| + |y| .
Beweis. Die meisten Behauptungen sind trivial, siehe auch Forster, Satz 13.1. Die Dreiecksungleichung ergibt sich aus
|x + y|2 = ℜ |x + y|2 = ℜ((x + y)(x + y)) = ℜ(xx) + ℜ(yy)
+ ℜ(xy) + ℜ(xy) ≤ |x|2 + |y|2 + |xy| |xy| = x2 + y 2 + 2 |x| |y| .
2. Grenzwerte
2.1. Grenzwerte von Folgen. Unter einer unendlichen Folge reeller Zahlen versteht man
a→ R, wobei man das Bild von n mit an bezeichnet. Man kann auch
eine Abbildung n −−
Folgen betrachten, deren Numerierung mit einer ganzen Zahl m beginnt, in diesem Fall ist
der Definitionsbereich der Abbildung a die Menge aller l ∈ Z mit l ≥ m. Auch beidseitig
unendliche Folgen sind erlaubt, in diesem Fall ist a auf ganz Z definiert.
Beispiel 1. Durch Ausdrücke wie an = 1/n (n ≥ 1) oder an = 2−n sind Folgen reeler
Zahlen definiert, ebenso durch die rekursive Vorschrift F0 = 1, F1 = 1 und Fn+2 = Fn + Fn+1
(Folge der Fibonacci-Zahlen).
In den folgenden Betrachtungen sei K = R oder K = C.
Definition 1. Die Zahl a ∈ K ist der Grenzwert für n → ∞ der Folge (an )∞
n=no , an ∈ K,
falls zu jedem ε > 0 eine ganze Zahl m mit |a − an | < ε für alle ganzen Zahlen n ≥ m, die
zum Definitionsbereich der Folge gehören. Wir schreiben a = limn→∞ an . Eine Folge nennt man
konvergent, falls sie einen Grenzwert hat, andernfalls nennt man sie divergent.
Die folgenden Hinweise auf Beweise in dem Buch von Forster beziehen sich auf den Fall
von Folgen reeller Zahlen. Soweit die Aussage auch im Fall komplexer Zahlen behauptet wird,
finden sich Beweise im Abschnitt 13 desselben Buches.
Satz 1. Jede Folge hat höchstens einen Grenzwert.
Der Satz entspricht Satz 2 im selben Kapitel bei Forster und wird auch genauso bewiesen.
Auch die folgenden Beispiele finden sich ähnlich bei Forster.
2. GRENZWERTE
13
Beispiel 2.
• Die konstante Folge an = a hat a als Grenzwert.
• limn→∞ 1/n = 0.
• Die Folge an = (−1)n hat keinen Grenzwert.
• Es gilt limn→∞ n/(n + 1) = 1.
• Der Grenzwert limn→∞ bn mit b ∈ R existiert genau für −1 < b ≤ 1, und er ist 0 für
−1 < b < 1 und 1 für b = 1.
Der Beweis der letzten Aussage hängt teilweise von Satz 3 ab und findet sich bei Forster,
§4.7.
Definition 2. Eine Folge reeller Zahlen ist von oben beschränkt, (bzw. von unten beschränkt, falls eine Zahl K mit xn ≤ K (bzw. mit xn ≥ K) für alle n im Definitionsbereich
der Folge existiert. Eine Folge (an ) reeller oder komplexer Zahlen ist beschränkt, falls eine Zahl
K ≥ 0 mit |an | ≤ K für alle Folgenglieder existiert.
Im den folgenden Betrachtungen wollen wir der Einfachheit halber voraussetzen, daß N
der Definitionsbereich der Folge ist. Die folgenden Sätze übertragen sich alle auf den einseitig
unendlichen Fall, aber ein Teil von ihnen ist für zweiseitig unendliche Folgen falsch.
Fakt 1.
• Eine Folge reeller Zahlen ist genau dann beschränkt, wenn sie von oben
und von unten beschränkt ist.
• Eine Folge (an ) ist genau dann beschränkt, wenn eine Zahl K und ein no ∈ N mit
|an | ≤ K für n ≥ no existieren.
Beweis. Zum ersten Punkt bemerkt man, daß eine betragsmäßig durch K beschränkte
Folge reeller Zahlen auf Grund der Regeln für Absolutbeträge an von unten durch −K und
von oben durch K beschränkt ist. Andererseits ist eine von oben durch A und von unten durch
B beschränkte reelle Folge dem Betrage nach durch max(A, −B) beschränkt.
Unter der im zweiten Punkt formulierten Bedingung sei K̃ das Maximum der endlich vielen
Zahlen K und |an | mit 0 ≤ n ≤ no , dann gilt |an | ≤ K̃ für n ∈ N. In die umgekehrte Richtung
ist der zweite Punkt trivial.
Zwischen der Konvergenz reeller und komplexer Zahlenfolgen besteht ein enger Zusammenhang.
Satz 2. Eine Folge komplexer Zahlen (zn )∞
n=no konvergiert genau dann gegen eine komplexe
Zahl z, wenn limn→∞ ℜ(zn ) = ℜ(z) und limn→∞ ℑ(zn ) = ℑ(z) gilt.
Folgerung 1. Eine Folge reeller Zahlen konvergiert genau dann in R (also im Sinne von
Definition 1 mit K = R), wenn sie in C (also im Sinne von Definition 1 mit K = C) existiert.
In diesem Fall stimmen ihre Limites in R und C überein.
Soweit keine anderen Voraussetzungen angegeben sind, sind die folgenden Sätze sowohl für
Folgen reeller als auch für Folgen komplexer Zahlen richtig. Der folgende Satz entspricht Satz 1
bei Forster.
Satz 3. Jede konvergente Zahlenfolge ist beschränkt.
14
Der folgende Satz faßt hauptsächlich die Sätze 3 und 4 sowie die Korollarien 1 und 2 bei
Forster zusammen:
Satz 4.
• Summe, Differenz und Produkt zweier konvergenter Folgen an und bn sind
konvergent, und es gilt
lim an + bn = lim an + lim bn
n→∞
n→∞
n→∞
lim an − bn = lim an − lim bn
n→∞
n→∞
n→∞
lim an · bn = lim an lim bn
n→∞
n→∞
n→∞
• Das Produkt einer konvergenten Folge mit einer Zahl λ ist konvergent, und es gilt
lim λan = λ lim an .
n→∞
n→∞
• Wenn die Folge an konvergiert, so konvergieren auch die Folgen |an | und an , und es gilt
lim |an | = lim an n→∞
n→∞
lim an = lim an
n→∞
n→∞
• Wenn die Folge an beschränkt ist und die Folge bn gegen 0 konvergiert, so konvergiert
auch die Folge an bn gegen 0.
Beispiel 3.
• Es gilt limn→∞
• Es gilt limn→∞ n2−n = 0.
2n −1
2n
= 1.
Der folgende Satz enspricht Satz 5 bei Forster:
Satz 5. Seien an und bn zwei konvergente Folgen reeller oder komplexer Zahlen, wobei der
Limes der Folge bn nicht verschwindet. Dann gibt es ein no mit bn 6= 0 für n ≥ no , die Folge
der Quotienten an /bn ist konvergent, und
limn→∞ an
an
=
.
lim
n→∞ bn
limn→∞ bn
Beispiel 4. Es gilt limn→∞
1+2n
1−2n
= 1.
Satz 6 bei Forster besagt:
Satz 6. Wenn an und bn zwei konvergente Folgen reeller Zahlen sind und wenn an ≤ bn
für genügend große n gilt (maW, falls ein no ∈ N mit an ≤ bn für n ≥ no existiert), so gilt
lim an ≤ lim bn .
n→∞
n→∞
Als Folgerung für den Spezialfall, in dem eine der betrachteten Folgen konstant ist, haben
wir
Folgerung 2. Wenn für eine konvergente Folge reeller Zahlen an ≤ A (bzw. an ≥ B) für
genügend große n gilt, so gilt limn→∞ an ≤ A (bzw. limn→∞ an ≥ B).
2. GRENZWERTE
15
Wir formulieren noch den folgenden
Fakt 2. Wenn an konvergent ist, so ist für jedes k ∈ Z auch die Folge an+k konvergent mit
demselben Limes.
P∞
Definition 3. Eine
unendliche
Reihe
n=a an konvergiert gegen s, falls die Folge der
Pm
Partialsummen sm = n=a an gegen s konvergiert. Eine nicht konvergente unendliche Reihe
nennt man divergent.
P
Satz 7.
• Wenn eine unendliche Reihe ∞
n=a an konvergiert, so konvergiert die Folge
der an gegen 0. Insbesondere ist diese
Folge
beschränkt.
P∞
P
• Sei b ≥ a, eine unendliche Reihe n=a an konvergiert genau dann, wenn ∞
n=b an konvergiert, und es gilt in diesem Fall
∞
X
an =
n=a
b−1
X
an +
n=a
∞
X
an .
n=b
Beweis. Im ersten Punkt möge die Reihe gegen s konvergieren, dann gilt
lim an = lim sn − lim sn−1 = s − s = 0.
n→∞
n→∞
Pm
P
Für die zweite Aussage seien sm = n=a an und s′m = m
n=b an die Teilsummen der betrachPb−1
′
teten Folgen, dann gilt sm = sm + n=a an für m ≥ b, und man kann die obigen Regeln für
Limites von Folgen anwenden.
n→∞
Die folgenden Sätze haben dieselbe Nummer und denselben Beweis wie bei Forster.
Satz 8. Sei q eine komplexe Zahl.
• Für |q| < 1 gilt limn→∞ q n = 0 und im Fall q = 1 gilt limn→∞ q n = 1. In allen anderen
Fällen hat die Folge q n für n → ∞ P
keinen Grenzwert in C.
n
• Die unendliche geometrische Reihe ∞
n=0 q konvergiert genau dann, wenn |q| < 1 gilt.
In diesem Fall gilt
∞
X
1
.
(1)
qn =
1
−
q
n=0
Beweis. Im ersten Punkte folgt die Konvergenz q n → 0 für |q| < 1 aus Folgerung .1.3.2,
und im Fall q = 1 liegt eine konstante Folge vor. Angenommen, es gilt |q| ≥ 1 und q 6= 1, und
die komplexe Zahl g ist Grenzwert von q n für n → ∞. Es gilt
|g| = lim |q n | = lim |q|n ≥ 1
n→∞
n→∞
nach Folgerung 2 und Satz 4. Es gilt also g 6= 0. Andererseits gilt
qg = lim q · q n = lim q n+1 = lim q n = g
n→∞
n→∞
n→∞
nach Satz 4 und Fakt 2. Es gilt also (q − 1)g = 0, und wegen q 6= 0 folgt g = 0 im Widerspruch
zum vorher Gezeigten. Also war unsere Annahme der Existenz des Grenzwertes g falsch.
16
Nach Satz 7 ist limn→∞ q n = 0 eine notwendige Bedingung für die Konvergenz der linken
Seite von (1). Nach dem ersten Punkt ist dies genau für |q| < 1 der Fall. Es verbleibt also,
(1) im Fall |q| < 1 zu zeigen. Der Beweis der Summenformel für endliche geometrische Reihen
benutzt nur die Körperaxiome und überträgt sich also auf den Fall komplexer Zahlen. Es gilt
also
k
X
q k+1 − 1
n
q =
,
q−1
n=0
wobei der Nenner wegen |q| < 1 nicht 0 ist. Die Behauptung folgt aus dem ersten Punkt,
wonach limk→∞ q k+1 = 0 aus |q| < 1 folgt.
Im folgenden setzen wir der Einfachheit halber voraus, daß die Summation der Reihen bei
0 beginnt. Der Satz gilt auch, wenn die Summation bei einem anderen Startindex beginnt.
Dieser muß aber bei beiden Reihen an und bn derselbe sein.
P
P∞
Satz 9. Seien ∞
unendlichePReihen, und sei λ ∈ R.
n=0 an und
n=0 bn zwei konvergente
P
Dann konvergieren auch die unendlichen Reihen ∞
(a
+
bn ) und ∞
n=0 n
n=0 λan , und
∞
X
(an + bn ) =
n=0
∞
X
n=0
∞
X
an +
n=0
∞
X
λan = λ
∞
X
bn
n=0
an .
n=0
P
P∞
Wenn an ≤ bn für alle n ∈ N gilt, so gilt ∞
a
≤
n
n=0
n=0 bn . Insbesondere ist die Summe
einer Reihe mit nichtnegativen Summanden nichtnegativ.
Der Satz ergibt sich sofort aus den entsprechenden Eigenschaften für endliche Summen und
für Grenzwerte.
Definition 4. Eine Folge an reeller Zahlen ist bestimmt divergent gegen +∞ (bzw. gegen
−∞), falls zu jeder reellen Zahl K ein m ∈ N mit an ≥ K (bzw. an ≤ K) für n ≥ m existiert.
Man drückt diesen Sachverhalt oft durch limn→∞ an = ∞ (bzw. limn→∞ an = −∞) aus.
Wenn man R = R ∪ {±∞} durch −∞ < t < ∞ für alle t ∈ R ordnet, so können die
Definitionen von Konvergenz und bestimmter Divergenz für Folgen wie folgt vereinheitlicht
werden:
Fakt 3. Sei (an ) eine Folge reeller Zahlen und A ∈ R. Genau dann gilt limn→∞ an = A,
wenn die folgenden Bedingungen beide richtig sind:
• Ist à ∈ R und gilt à < A, so gilt an > à für alle genügende großen n.
• Ist à ∈ R und gilt à > A, so gilt an < à für alle genügende großen n.
Beispiel 5. Die Folgen an = n bzw. an = 2n sind bestimmt divergent gegen ∞. Die Folge
an = (−1)n ist divergent, aber nicht bestimmt divergent.
2. GRENZWERTE
17
Beispiel 6. Sei q ∈ R. Es gilt limn→∞ q n = ∞ genau dann, wenn q > 1 gilt. Für kein
q ∈ R divergiert q n für n → ∞ bestimmt gegen −∞.
Der folgende Satz ist eine Zusammenfassung und leichte Verallgemeinerung der Sätze 9 und
10 bei Forster. Soweit die Behauptungen allgemeiner sind als bei Forster, ist der in der Vorlesung
gegebene Beweis eine offensichtliche Verallgemeinerung. Es ist ausreichend, die Beweise bei
Forster zu verstehen.
Satz 10. Wenn die Folge an bestimmt divergent gegen ∞ oder −∞ ist, so existiert 1/an
für genügend große n, und es gilt
lim 1/an = 0.
n→∞
Dasselbe gilt unter der schwächeren Voraussetzung, daß die Folge |an | gegen ∞ bestimmt divergiert und es gilt auch die Umkehrung dieser Aussage: Wenn die Folge 1/an für genügend
große n definiert ist und gegen 0 konvergiert, so divergiert die Folge der |an | bestimmt gegen
∞.
Folgerung 3. Eine Folge positiver bzw. negativer Zahlen konvergiert genau dann gegen
0, wenn die Folge ihrer Kehrwerte bestimmt gegen ∞ (bzw. −∞) divergiert.
Ohne den (einfachen) Beweis teilen wir noch mit:
Fakt 4. Das Produkt zweier bestimmt divergenter Folgen ist bestimmt divergent. Dasselbe
gilt auch für deren Summe, wenn sie beide in dieselbe Richtung bestimmt divergent sind, und
für deren Differenz, wenn sie in unterschiedliche Richtungen bestimmt divergieren. Die Regeln
aus Satz 4 gelten auch in dieser Situation, wobei man
und
∞ + ∞ = ∞ · ∞ = ∞ − (−∞) = (−∞) · (−∞) = ∞ · ∞ = ∞
(−∞) + (−∞) = (−∞) − ∞ = (−∞) · ∞ = ∞ · (−∞) = ∞
setzt. Die Summe aus einer beschränkten und einer bestimmt divergenten Folge divergiert
bestimmt in dieselbe Richtung, dasselbe gilt für da Produkt aus einer bestimmt divergenten
Folge und einer positiven reellen Zahl oder aus einer bestimmt divergenten Folge und einer von
unten durch eine positive Zahl beschränkten Folge.
2.2. Das Vollständigkeitsaxiom. Die bisher aufgestellten Axiome für den Bereich der
reellen Zahlen sind für unsere Zwecke nicht ausreichend. Es gibt nämlich viele für die Anwendungen wichtige Folgen, deren Konvergenz man nur mit Hilfe eines weiteren Axioms, des
Vollständigkeitsaxiomes, zeigen kann.
Definition 1. Monotone bzw. streng monotone Folge.
Fakt 1 (Vollständigkeitsaxiom). Es gelten die beiden folgenden Aussagen, die bereits auf
Grund der bisherigen Axiome äquivalent sind:
• Jede monoton wachsende und von oben beschränkte Folge reeller Zahlen konvergiert.
• Jede monoton fallende und von unten beschränkte Folge reeller Zahlen konvergiert.
18
Beweis. Nur die Äquivalenz der beiden Aussagen auf Grund der bisherigen Axiome muß
bewiesen werden, da ihre Gültigkeit ein neues Axiom ist. Wenn an die Voraussetzungen eines
Punktes erfüllt, so erfüllt −an die Voraussetzungen des anderen. Wenn −an konvergiert, so
konvergiert die Folge an = −1 · (−an ) auf Grund der letzten Aussage von Satz .2.1.4 (mit
λ = −1). Die Äquivalenz der beiden Behauptungen folgt.
Fakt 2. Jede monoton wachsende Folge reeller Zahlen ist konvergent oder gegen ∞ bestimmt divergent. Jede monoton fallende Folge reeller Zahlen ist konvergent oder gegen −∞
bestimmt divergent.
Aus dieser Fassung des Vollständigkeitsaxiomes ergibt sich die Existenz der Limites in der
folgenden Definition:
Definition 2. Sei (an ) eine Folge reeller Zahlen. Wir setzen
sup{an |n ≥ no } = lim max(ano , . . . , ak )
k→∞
inf{an |n ≥ no } = lim min(ano , . . . , ak )
k→∞
lim sup an = lim sup{ak |k ≥ n}
n→∞
n→∞
lim inf an = lim inf{ak |k ≥ n}
n→∞
n→∞
Für die beiden letzten Definitionen vereinbaren wir dabei, daß der Limes einer konstanten
Folge ±∞ gleich dem allgemeinen Folgenglied ±∞ ist.
Fakt 3. Es gilt
sup{an |n ≥ no } = − inf{−an |n ≥ no }
inf{an |n ≥ no } = − sup{−an |n ≥ no }
lim inf an = − lim sup −an
n→∞
n→∞
lim inf an = − lim sup −an .
n→∞
n→∞
sowie
sup{λan |n ≥ no } = λ inf{an |n ≥ no }
inf{λan |n ≥ no } = λ sup{an |n ≥ no }
lim inf λan = λ lim sup an
n→∞
n→∞
lim inf λan = λ lim sup an
n→∞
n→∞
für alle reellen Zahlen λ ≥ 0, wobei wir in diesem Fall ausnahmsweise 0 · ∞ = 0 · −∞ = 0
setzen dürfen.
Fakt 4. Sei (an ) eine Folge reeller Zahlen.
• Sei A = sup{ak |k ≥ n} ∈ R. Für alle k ≥ n gilt dann ak ≤ A, und A ist das kleinste
Element von R mit dieser Eigenschaft.
2. GRENZWERTE
19
• Sei A = inf{ak |k ≥ n} ∈ R. Für alle k ≥ n gilt dann ak ≥ A, und A ist das größte
Element von R mit dieser Eigenschaft.
• Sei A = lim supn→∞ an ∈ R. Dann gilt für jedes à ∈ R mit à > A die Ungleichung
an < Ã für alle genügend großen n, und A ist das größte Element von R mit dieser
Eigenschaft.
• Sei A = lim inf n→∞ an ∈ R. Dann gilt für jedes à ∈ R mit à < A die Ungleichung
an > Ã für alle genügend großen n, und A ist das kleinste Element von R mit dieser
Eigenschaft.
Fakt 5. Sei (an ) eine Folge reeller Zahlen und A ∈ R. Dann gilt limn→∞ an = A genau
dann, wenn lim inf n→∞ an = lim supn→∞ an = A gilt.
Für eine einfache und geschlossene Formulierung des Beweises nutzen wir Fakt .2.1.3.
Bemerkung 1. Im Unterschied zum Grenzwert sind die oberen und unteren Häufungsgrenzen lim sup und lim inf für Folgen reeller Zahlen stets definiert (sie können freilich ±∞
sein). Nach dem Fakt ist die Folge genau dann konvergent oder bestimmt divergent, wenn beide
Häufungsgrenzen übereinstimmen. Sind sie dabei endlich, so liegt Konvergenz vor, andernfalls
bestimmte Divergenz.
Definition 3. Eine Folge ist eine Fundamentalfolge (bzw. eine Cauchy-Folge bzw. in sich
konvergent, falls es zu jeder positiven reellen Zahl ε ein n ∈ N gibt, so daß |ak − al | < ε für
min(k, l) ≥ n gilt.
Fakt 6. Eine Folge komplexer Zahlen an ist genau dann eine Cauchyfolge, wenn die Folgen
ℜan und ℑan Cauchyfolgen sind.
Satz 1. Eine Zahlenfolge ist genau dann eine Cauchyfolge, wenn sie konvergiert.
Bemerkung 2. Ohne das Vollständigkeitsaxiom könnte immer noch bewiesen werden, daß
konvergente Folgen Cachy-Folgen sein müssen. Die umgekehrte Aussage ist eine äquivalente
Umformulierung des Vollständigkeitsaxiomes, ohne welches nicht die Existenz des Limes von
Cauchy-Folgen gezeigt werden kann, sondern nur deren Beschränktheit.
∞
Definition 4. Eine Teilfolge einer Folge (an )∞
n=no ist eine Folge der Form (aik )k=ko , wobei
∞
(ik )k=ko eine streng monoton wachsende Folge ganzzahliger Indizes ist, die alle ≥ no sind.
Fakt 7. Eine Teilfolge einer konvergenten Folge ist konvergent.
Satz 2. Sei (an )∞
n=no eine Folge reeller Zahlen, dann gibt des Teilfolgen dieser Folge, deren
Limites lim inf n→∞ an und lim supn→∞ an sind.
Beweis. Wir betrachten nur lim sup, der Fall lim inf geht analog dazu. Sei l = lim supn→∞ an .
(−)
(+)
Im Fall l < ∞ sei ln± = l ± 2−n , andernfalls ln = n und ln = ∞. In jedem Fall gilt, nach
(+)
Fakt 4, an < ln für alle genügend großen n. Nach der in Fakt 4 formulierten Minimalitätsei(−)
genschaft von lim sup gibt es beliebig große n mit an > ln .
20
(+)
Sei nun i−1 = no . Wenn k ≥ 0 und ik−1 schon gewählt ist, sei b > ik−1 so daß an < lk für
(−)
(−)
n ≥ b gilt. Nach der vorhin formulierten Eigenschaft von lk gibt es ein ik ≥ b mit aik > lk .
(−)
(+)
Die Folge der Indizes (ik )∞
< aik < lk für alle k, woraus
k=0 ist streng monoton, und lk
limk→∞ aik = l folgt.
Folgerung 1 (Bolzano-Weierstraß). Aus jeder beschränkten Folge reeller oder komplexer
Zahlen kann man eine konvergente Teilfolge auswählen.
Beweis. Für beschränkte Folgen reeller Zahlen gilt lim supn→∞ an < ∞, und die Behauptung folgt aus dem Satz. Für beschränkte Folgen komplexer Zahlen sind die Folgen der Realund Imaginärteile beschränkt. Man kann also nach dem soeben betrachteten Fall reeller Zahlen
erst eine streng monotone Indexfolge ik finden, so daß die Folge ℜaik konvergiert, und dann
eine weitere Indexfolge (kl )∞
l=0 , so daß die Folge ℑaikl konvergiert. Dann konvergiert die Folge
∞
(aikl )l=0 nach Satz .2.1.2.
2.3. Konvergenzkriterien für Reihen. Ohne Kapitelnummer aufgeführte Sätze aus
Forster stammen aus Forster, §8.
P
Satz 1. Ein Reihe ∞
nichtnegativer reeller Zahlen konvergiert geau dann, wenn die
k=0 akP
Folge der Partialsummen sn = nk=0 ak von oben beschränkt ist. Ist die Folge der Partialsummen unbeschränkt, so divergiert die Reihe gegen ∞ bestimmt.
Beweis. Die Aussage entspricht Satz 2 bei Forster und folgt leicht aus Fakt .2.2.1.
Bemerkung 1. Die Aussage gilt mutatis mutandis auch für Reihen mit nichtpositiven ak .
Satz 2 (Leibniz). Sei (an )∞
n=0 eine monoton fallende Folge nichtnegativer Zahlen.
P∞
k
• Die Reihe k=0 (−1) ak konvergiert genau dann, wenn limn→∞ an = 0 gilt.
P
Pl
k
k
• In diesem Fall sei s = ∞
k=0 (−1) ak und sl =
k=0 (−1) ak , dann gilt sl ≥ s für gerade
und sl ≤ s für ungerade l.
Die Notwendigkeit folgt aus Satz .2.1.7 und die Hinlänglichkeit ist Satz 4 bei Forster mit
demselben Beweis.
P∞
Definition
P∞ 1. Eine Reihe n=0 an reeller oder komplexer Zahlen konvergiert absolut, wenn
die Reihe n=0 an absolut konvergiert.
Fakt 1. Eine Reihe komplexer Zahlen konvergiert genau dann absolut, wenn sowohl die
Reihe der Realteile als auch die Reihe der Imaginärteile absolut konvergieren.
P
Satz 3. Eine absolut konvergente Reihe ∞
n=0 an reeller oder komplexer Zahlen konvergiert
auch im gewöhnlichen Sinne, und es gilt
∞
∞
X X
(1)
an ≤
|an | .
n=0 n=0
2. GRENZWERTE
21
P
P
Beweis. Sei sn = nk=0 ak , s′n = nk=0 |ak |. In beiden Fällen sei auch der Fall n = −1
zugelassen, welcher der leeren Summe entspricht. Dann folgt aus der Dreiecksungleichung für
endliche Summen
n
n
X
X
|sn − sm | = ak ≤
|ak | = s′n − s′m
k=m+1
k=m+1
P∞
für −1 ≤ m ≤ n < ∞. Da k=0 |ak | konvergiert, bilden die s′n eine Cauchyfolge. Unmittelbar
aus den Definitionen und der letzten Ungleichung folgt, daß auch die sn eine Cauchyfolge bilden.
Damit ergibt sich die Behauptung über die Konvergenz der Ausgangsreihe aus Satz .2.2.1. Als
Spezialfall m = −1 der vorhin gezeigten Ungleichung ergibt sich |sn | ≤ |s′n |, also gilt
lim sn = lim |sn | ≤ lim |s′n | ,
n→∞
n→∞
n→∞
und (1) folgt.
P∞
Satz 4. Die konvergente Reihe
P∞ n=0 an nichtnegativer reeller Zahlen sei eine absolut konvergente Majorante
der
Reihe
es gelte also |bn | ≤ an .
n=0 bn reeller oder komplexer Zahlen,P
P∞
Wenn die Reihe n=0 an konvergiert, so konvergiert auch die Reihe ∞
n=0 bn . Wenn für jede
P∞ (i)
P∞
natürliche Zahl i ein Reihe
n=0 an gegeben ist und
n=0 an eine gemeinsame Majorante
dieser Reihen ist, so gilt
∞
∞
X
X
lim a(i)
=
lim
a(i)
n
n
n=0
i→∞
i→∞
n=0
Beweis. Der erste Teil ist Satz 6 bei Forster und wird wie folgt bewiesen: Wir haben
n
X
k=0
|bk | ≤
n
X
ak ,
k=0
wobei die rechte Seite auf Grund von Satz 1 beschränkt ist. Also ist auch die linke Seite dieser
Ungleichung beschränkt, und die absolute Konvergenz der untersuchten Reihe folgt aus Satz 1.
Zum Beweis der zweiten Behauptung sei ε > 0 vorgegeben, wir wählen ein no mit
∞
X
n=no
ε
ak < ,
3
(m) was auf Grund der Konvergenz von n=0 an möglich ist, und ein mo mit bn − bn ≤
0 ≤ n < no und m > mo . Für m > mo gilt
∞
n −1
∞
nX
∞
∞
o
o −1
X
X
X
X
X
(m)
(m)
(m) bn −
bn = bn −
bn +
bn −
bn n=0
n=0
n=0
n=0
no
no
nX
∞
∞
o −1
X
X
(m) bn − b(m)
≤
+
b
+
b
n
n
n n=0
n=n
n=n
P∞
o
o
ε
3no
für
22
<
nX
o −1
n=0
ε ε
ε
+ + =ε
3no 3 3
wie für die zweite Aussage benötigt, wobei auf der letzten Zeile
∞
∞
∞
X X
X
ε
bn ≤
|bn | ≤
an <
n=n n=n
3
n=n
o
o
sowie eine analoge Ungleichung für die
(m)
bn
o
benutzt wurden.
(n)
Folgerung 1 (Satz über die monotone Konvergenz). Wenn (ak )∞
n,k=0 eine in n monoton
wachsende Doppelfolge nichtnegativer reeller Zahlen ist, so gilt
∞
∞
X
X
(n)
(n)
lim
ak =
lim ak .
n→∞
k=0
k=0
n→∞
P
Satz 5 (Quotientenkriterium). Es konvergiert jede Reihe ∞
n=0 an reeller oder komplexer
Zahlen, für die eine positive reelle Zahl Θ < 1 mit |an+1 | ≤ Θ |an | für genügend große n
existiert.
Der Satz entspricht Satz 7 bei Forster.
Satz 6. Die Exponentialreihe exp(x) =
absolut, und es gilt
P∞
xn
n=0 n!
konvergiert für beliebige komplexe Zahlen
exp(x) = lim (1 + x/i)i .
(2)
i→∞
Aus limm→∞ xm = x folgt limm→∞ exp(xm ) = exp(x). Wenn (xm )∞
m=0 eine gegen 0 konvergente
Folge von 0 verschiedner komplexer Zahlen ist, so gilt
exp(xm ) − exp(x)
= 1.
(3)
lim
m→∞
xm
Beweis. Die absolute Konvergenz der Exponentialreihe ergibt sich leicht aus dem Quotientenkriterium, siehe Satz 8.1 bei Forster. Zum Beweis von (2) berechnen wir die Folgenglieder
auf der linken Seite mit dem binomischen Lehrsatz:
m ∞
X
x m X m xn
(1 + ) =
=
b(m)
n
n
m
m
n
n=0
n=0
xn
(m)
. Aus
mit bn = m
n mn
b(m)
=
n
n
n−1
n−1
n−1
Y m−i
xn Y m − i
xn Y
(m
−
i)
=
=
b
n
n!mn i=0
n! i=0 m
m
i=0
(m)
x
mit bn = n! ergibt sich einmal limn→∞ bn = bn für jede natürliche Zahl n und zum zweiten
(m) bn ≤ |bn |. Man kann also Satz 4 mit der absolut konvergenten Exponentialreihe an = |bn | =
2. GRENZWERTE
|x|n /n! als Majorante anwenden und erhält
lim (1 + x/m)m = lim
m→∞
m→∞
∞
X
b(m)
=
n
n=0
23
∞
X
bn = exp(x).
n=0
Es gelte limm→∞ xm = x, dann existiert eine obere Schranke R für die xm , und mit bn =
n
(m)
(m)
x /n!, bn = xnm /n! gilt limm→∞ bn = bn , wobei Satz 4 mit an = Rn! als Majorante genommen
werden kann. Es gelte nun zusätzlich x = 0, und die x, seien alle von 0 verschieden. Da der
erste Summand der Exponentialreihe 1 ist, gilt
∞
∞
∞
k−1
X
X
X
xnm
xnm
xm
exp(xm ) − 1
= lim
=
= 1,
= lim
lim
lim
m→∞
m→∞
m→∞
xm
k!
(n + 1)! n=0 m→∞ (n + 1)!
n=0
k=1
n
wobei die Vertauschung von Limes und unendlicher Summation durch Anwendung von Satz 4
(m)
mit bn = xnm /(n + 1)!, bn = 0 und an = Rn /n! gerechtfertigt werden kann.
Die Betrachtung der Exponentialreihe zeigt, daß das Quotientenkriterium nützlich ist. Es
ist aber nicht der Weisheit letzter Schluß. Beispielsweise erfordert der Beweis des folgenden
Satzes eine andere Idee.
Satz 7. Die Zeta-Reihe
ζ(n) =
∞
X
i−n
i=1
konvergiert für ganze n > 1 und divergiert für alle anderen ganzen Zahlen n.
Beweis. Offenbar reicht es, den Fall n ≥ 0 zu betrachten.
2(k−1)(n−1) ≤
k −1
2X
i=2k−1
i−n ≤ 2k(n−1)−1 ,
und die Behauptung folgt leicht aus Aussagen über die Konvergenz der geometrischen Reihe.
Aus dem Satz über die majorisierte Konvergenz leiten wir den folgenden Doppelreihensatz
her:
Satz 8. Sei (an,m )∞
n,m=0 eine Doppelfolge reeller oder komplexer Zahlen.
• Wenn die Zahlen an,m reell und nichtnegativ sind, so gilt
∞ X
∞
X
(4)
n=0 m=0
an,m =
d
∞ X
X
d=0 m=0
am,d−m =
∞ X
∞
X
an,m
m=0 n=0
wobei (4) als Gleichung zwischen Elementen von R ∪ {∞} aufzufassen ist.1
1Wobei
P∞ P∞
P∞
der äußeren Summe n=0 m=0 an,m der Wert ∞ zugewiesen wird, wenn m=0 an,m für ein n
gilt. Ähnlich wird mit der Doppelsumme am rechten Ende von (4) verfahren.
24
• Gilt
P∞ P∞
m=0
n=0
|an,m | < ∞, so gilt (4) ebenfalls.
Beweis. Wir zeigen zunächst die erste Behauptung. Ist diese gezeigt, so ist schon erwiesen,
daß die Voraussetzung des zweiten Punktes symmetrisch in m und n ist. Es genügt daher
in beiden Fällen, die linke Gleichung in (4) zu zeigen. Die rechte ergibt sich sodann durch
Vertauschung der Rollen der Indizes n und m.
Wir haben
d
∞ D−n
∞
D X
X
X
X
X
am,d−m =
am,n =
(+)
sn(D) ,
d=0 m=0
n=0 m=0
n=0
(N )
es liegt hier eine Umordnung einer endlichen Summe vor, die Zahlen sn
)
s(N
=
n
D−n
X
sind durch
am,n
m=0
(N )
P∞
definiert. Es gilt limD→∞ s
=
m=0 an,m , wobei Konvergenz unter den Voraussetzungen
des ersten
P Punktes monoton und unter den Voraussetzungen des zweiten Punktes majorisiert
durch ∞
m=0 |an,m | erfolgt. Es gilt also
lim
D→∞
∞
X
sn(D)
n=0
=
∞ X
∞
X
an,m ,
n=0 m=0
nach dem Satz über die monotone bzw. die majorisierte Konvergenz. Auf der rechten Seite
dieser Gleichung steht gerade die linke Seite von (+). Auf der anderen Seite ist, auf Grund
der Definition der Summe unendlicher Reihen, der mittlere Term in (4) gerade der Limes für
D → ∞ der linken Seite von (+), und die Behauptung ist bewiesen.
Bemerkung 2. Ohne irgendwelche Voraussetzungen an die Doppelreihe ist (4) falsch. Als
Gegenbeispiel kann die folgende Doppelreihe genommen werden:


n=m
1
an,m = −1 n = m + 1

0
andernfalls.
Dann gilt
∞ X
∞
X
n=0 m=0
∞ X
∞
X
an,m = 0
an,m = 1,
m=0 n=0
während
P∞ Pd
d=0
m=0
am,d−m =
P∞
d
d=0 (−1)
unbestimmt divergent ist.
Eng verwandt mit der soeben betrachteten Frage der Vertauschbarkeit von Limes und
Summation unendlicher Reihen ist die Frage der Umordnung unendlicher Reihen.
2. GRENZWERTE
25
P
Satz 9 (Kleiner Umordnungssatz). Die Reihe ∞
n=0 an konvergiere absolut, und die FunkP
f→ N sei bijektiv. Dann konvergiert auch ∞ a absolut, und zwar gegen denselben
tion N −−
n=0 n
Wert wie die Ausgangsreihe.
Der Satz entspricht Satz 8 bei Forster mit demselben Beweis. Alternativ dazu kann Satz 8
auf die Doppelreihe
(
an m = f (n)
bn,m =
0 sonst
angewendet werden, denn es gilt
∞
X
n=0
∞
X
bn,m = an
bn,m = af (n) .
m=0
P∞
P∞
SatzP
10 (Produktsatz). Seien
a
und
n
n=0 bn zwei absolut konvergente Reihen, und
P n=0
sei cn = nk=0 ak bn−k . Dann ist ∞
c
absolut
konvergent,
und es gilt
n=0 n
∞
X
n=0
cn =
∞
X
n=0
an
∞
X
n=0
bn .
Beweis. Der Beweis
P∞sich durch Anwendung von Satz 8 auf die Doppelreihe (CAVE:
P ergibt
Genauer ausführen?) ∞
m=0 an bm .
n=0
Folgerung 2. Für komplexe Zahlen x, y gilt exp(x + y) = exp(x) exp(y).
Beweis. Sei an = xn /n! und bb = y n /n!. Wir haben schon gesehen, daß beide Reihen absolut konvergieren. Der Satz ist daher anwendbar, wobei man für die Glieder der Produktreihe
n
n
n
n
X
X
1 X k n−k
1 X k n−k n
(x + y)n
n!
xk y n−k
=
=
=
x y
x y
cn =
ak bn−k =
k!(n − k)!
n! k=0
k!(n − k)!
n! k=0
k
n!
k=0
k=0
erhält.
2.4. Einführung in den Stetigkeitsbegriff. Sei K = R oder K = C und M ⊆ K eine
Teilmenge.
f→ K und m ∈ M sind folgende Bedingungen äquivalent:
Satz 1. Für eine Funktion M −−
• Zu jedem ε > 0 existiert ein δ > 0 mit |f (x) − f (m)| < ε für x ∈ M und |x − m| < δ.
• Wenn xn eine gegen m konvergierende Folge von Elementen von M ist, so konvergiert
die Folge f (xn ) gegen f (m).
Definition 1. Eine derartige Funktion nennt man stetig an der Stelle m. Man nennt f
stetig, wenn f stetig an allen Stellen m ∈ M ist.
26
Satz 2.
• Die konstante Funktion f (x) = c und die identische Funktion f (x) = x
sind stetig.
• Summe und Produkt zweier an einer Stelle xo stetiger Funktion sind stetig daselbst.
Dasselbe gilt für den Kehrwert einer an der Stelle xo stetigen Funktion f mit f (xo ) 6= 0.
• Die Einschränkung einer an der Stelle xo stetigen Funktion f mit Definitionsbereich M
auf einen kleineren Definitionsbereich M̃ ⊆ M mit xo ∈ M̃ ist weiterhin stetig an der
Stelle xo . Insbesondere ist f |M̃ stetig auf ganz M̃ , wenn f stetig auf ganz M ist.
• Die Exponentialfunktion ist stetig auf ganz C.
Beispiel 1. Die Funktion f (x) = x2 = x · x ist nach den beiden ersten Punkten des Satzes
stetig.
Im Zusammenhang mit dem folgenden, sehr wichtigen Satz ergibt sich daraus die früher
behauptete Existenz von Quadratwurzeln nichtnegativer reeller Zahlen.
Definition 2. Definition der abgeschlossenen, halbabgeschlossenen und offenen Intervalle.
Satz 3 (Zwischenwertsatz für stetige Funktionen). Sei I = [a, b] ein abgeschlossenes Inf→ R stetig auf ganz I. Sei y eine reelle Zahl mit f (a) ≤ y ≤ f (b) oder
tervall und I −−
f (b) ≤ y ≤ f (a), dann existiert ein x ∈ I mit f (x) = y.
Wir beschreiben als Beweis ein Einschachtelungsverfahren von enormer praktischer Relevanz.
f→ [c, d] = I ′ streng monoton wachsend und stetig ist und
Satz 4. Wenn I = [a, b] −−
g→ I ist stetig
f (a) = c sowie f (b) = d gilt, so ist f bijektiv und die Umkehrfunktion I ′ −−
und streng monoton wachsend. Dasselbe gilt für streng monoton fallende f mit f (a) = d und
f (b) = c, in diesem Fall ist auch g streng monoton wachsend.
Beweis. Wir betrachten nur den Fall streng monoton wachsender f . Der Fall eines streng
monoton fallenden f geht analog oder kann durch Betrachtung von −f auf diesen zurückgeführt
werden. Für den Rest des Beweises sei also f als streng monoton wachsend vorausgesetzt.
Die Surjektivität von f ergibt sich aus Satz 3, und die Injektivität von f folgt aus der
g→ I. Wäre g nicht streng
strengen Monotonie von f . Daher hat f eine Umkehrfunktion I ′ −−
monoton wachsend, so gäbe es x < y, x, y ∈ I mit g(x) >= g(y). Auf Grund der Monotonie
von f folgt x = f (g(x)) ≥ f (g(y)) = y, ein Widerspruch zu unserer Annahme x < y. Also ist
g streng monoton wachsend.
Es verbleibt noch der Beweis der Stetigkeit von g. Wir benutzen das nachfolgende Lemma,
wonach zum Beweis der Stetigkeit von g an der Stelle x ∈ I ′ der Nachweis von limn→∞ g(xn ) =
g(x) für monoton wachsende oder fallende und gegen x konvergierende Folgen xn mit xn ∈ I ′
ausreicht. Auf Grund der Monotonie von g ist die Folge g(xn ) ebenfalls monoton, und wegen
g(xn ) ∈ I ist sie beschränkt. Nach Satz .2.3.1 existiert y = limn→∞ g(xn ), und auf Grund der
Stetigkeit von f gilt
f (y) = lim f (g(xn )) = lim xn = x.
n→∞
n→∞
2. GRENZWERTE
27
Da f und g zueinander inverse Funktionen sind, folgt g(x) = y. Die Stetigkeit von g ist damit
bewiesen.
Lemma 1. Sei M ⊆ R, f eine reell- oder komplexwertige Funktion auf M und m ∈ M .
Genau dann ist f stetig auf M an der Stelle m, wenn für jede monotone Folge (mk ) von
Elementen von M mit limk→∞ mk = m der Grenzwert der Folge f (mk ) existiert und mit f (m)
übereinstimmt.
Das Lemma wird am zweckmäßigsten im Zusammenhang mit allgemeinen Betrachtungen
über Limites von Funktionswerten gezeigt, so daß der Beweis noch etwas aufgeschoben werden
soll.
2
x−→
Satz
• Die Funktion [0, ∞) −−
−−x
−→ [0, ∞) ist bijektiv, und ihre Umkehrfunktion
√ 5.
x ist stetig.
exp
• Die Funktion R −−
−→ (0, ∞) ist bijektiv, und ihre Umkehrfunktion log ist stetig.
Definition 3. Wenn a eine positive reelle und b eine komplexe Zahl ist, so setzen wir
ab = exp(b log a).
Aus Folgerung .2.3.2 folgt
Fakt 1. Seien a, a′ positive reelle und b, b′ komplexe Zahlen, dann gilt:
• (aa′ )b = ab a′b .
′
′
• ab+b = ab ab
′
′
• Ist b reell, so gilt abb = (ab )b .
Bemerkung 1. Aus der Definition folgt a0 = 1 und a1 = a. Außerdem folgt aus Fakt 1
durch Induktion nach n, daß an für natürliche Exponenten mit den in Definition .1.2.1 eingeführten Potenzen übereinstimmt. Weil für beide Konstruktionen x−n ·xn = 1 gilt, stimmen sie
auch für ganzzahlige Exponenten überein.√Aus dem dritten Punkt von Fakt 1 folgt schließlich
√
x = x1/2 , denn (x1/2 )2 = x. Analog gilt n x = x1/n für ganze Zahlen n 6= 0.
Ähnlich wichtig ist der folgende Satz über die Extremwerte stetiger Funktionen.
Satz 6. Sei I = [a, b], −∞ < a < b < ∞, ein beschränktes abgeschlossenes Intervall. Wenn
f
I −−→ R stetig ist, so gibt es m, M ∈ I mit f (m) ≤ f (x) ≤ f (M ) für alle x ∈ I.
Beweis. Es genügt, die Existenz von m zu zeigen, denn dann ergibt sich durch Anwendung
dieser Existenzaussage auf −f die Existenz von M .
Wir konstruieren induktiv eine Folge In = [an , bn ] mit folgenden Eigenschaften:
• I0 = I und In+1 ⊆ In .
• bn − an = 2−n (b − a).
• Zu jedem n ∈ N und jedem x ∈ I gibt es ein y ∈ In mit f (y) ≤ f (x).
Aus dem ersten Punkt folgt, daß die Folge der an monoton wachsend ist. Da alle an zu I
gehören, ist die Folge beschränkt. Es konvergiert also m = limn→∞ an . Wir zeigen, daß m die
gewünschte Eigenschaft hat. Sei x ∈ I, dann gibt es yn ∈ In mit
(+)
f (yn ) ≤ f (x).
28
Wegen an ≤ yn ≤ bn folgt
b−a
.
2n
Daraus folgt limn→∞ (yn − an ) = 0, also limn→∞ yn = m. Aus (+) und der Stetigkeit von f folgt
so f (x) ≥ limn→∞ f (yn ) = f (m), und m hat in der Tat die gewünschte Minimalitätseigenschaft.
Es verbleibt die Konstruktion der Intervalle In mit den angegebenen Eigenschaften. Sei
a0 = a und b0 = b. Wenn an und bn schon konstruiert sind so daß die Folge der Intervalle
n
Ik mit 0 ≤ k ≤ n die geforderten Eigenschaften haben, so sei cn = an +b
, In′ = [an , cn ],
2
′′
′
′′
In = [cn , bn ]. Falls für alle x ∈ In ein y ∈ In mit f (y) < f (x) existiert, so sei In+1 = In′′ .
Andernfalls gibt es ein x ∈ In′ mit f (y) ≥ f (x) für alle y ∈ In′′ . In diesem Fall setzen wir
In+1 = In′ . In jedem Fall gibt es zu jedem υ in In ein ξ ∈ In+1 mit f (ξ) ≤ f (υ). Ist nun x ∈ I,
so kann dies auf ein υ ∈ In mit f (y) ≤ f (x) angewendet werden und zeigt die Existenz eines
ξ ∈ In+1 mit f (ξ) ≤ f (x). Die anderen Eigenschaften der Intervallfolge zeigt man wie beim
Beweis des Zwischenwertsatzes.
0 ≤ y n − an ≤ b n − an =
Zunächst ohne Beweis sei hier der folgende Satz formuliert:
Satz 7. Sei I = [a, b] und f eine stetige Funktion auf I. Dann ist f gleichmäßig stetig: zu
jedem ε > 0 existiert ein δ > 0 mit |f (x) − f (y)| < ε für x, y ∈ I und |x − y| < δ.
Fakt 2. Sei M ⊆ K mit K = R oder K = C. Für m ∈ K sind folgende Bedingungen
äquivalent:
• Es gibt eine Folge von Elementen von M \ {m}, welche gegen m konvergiert.
• Für jedes ε > 0 gibt es Elemente x von M \ {m} mit |x − m| < ε.
Definition 4. In diesem Fall nennt man m einen Häufungspunkt von M .
Fakt 3. Sei m ein Häufungspunkt von M und f eine auf M mit der möglichen Ausnahme
von M definierte Funktion. Dann sind folgende Bedingungen an φ ∈ L äquivalent:
• Zu jedem ε > 0 gibt es δ > 0 mit |f (x) − φ| < ε für m ∈ M \ {m} und |x − m| < ε.
• Für jede gegen m konvergierende Folge (mk ) von Elementen von M \{m} gilt limk→∞ f (mk ) =
φ.
Die Zahl φ ist durch diese Bedingungen eindeutig bestimmt.
Definition 5. Wir schreiben φ = limx→y f (x), falls diese Bedingungen erfüllt sind. Im
Fall K = R schreiben wir φ = limx↓y f (x), falls die Bedingungen für f |M ∩ [x, ∞) erfüllt sind,
und φ = limx↑y f (x), falls sie für f |M ∩ (−∞, x] erfüllt sind.
Fakt 4. Die folgenden Bedingungen sind äquivalent:
• φ = limx↓y f (x)
• Zu jedem ε > 0 existiert ein δ > 0 mit |f (x) − φ| < ε für y < x < y + δ.
• Für jede monoton fallende gegen x konvergente Folge (xk ) von Elementen von M gilt
limk→∞ f (xk ) = φ.
Eine analoge Charakterisierung gilt für φ = limx↑y f (x).
2. GRENZWERTE
29
Fakt 5. Im Fall K = R gilt limx→y f (x) = φ genau dann, wenn φ = limx↑y f (x) und
φ = limx↓y f (x) gilt.
Aus den beiden letzten Fakten folgt sofort Lemma 1.
Sei nun wieder K = R oder K = C.
Fakt 6. Für eine Teilmenge M ⊆ K sind die folgenden Bedingungen äquivalent:
• Jeder Häufungspunkt von M gehört zu M .
• Wenn eine Folge von Elementen von M konvergiert, so gehört ihr Limes zu M .
Definition 6. Eine Teilmenge von K ist abgeschlossen, wenn sie diese äquivalenten Bedingungen erfüllt.
Definition 7. Für ε > 0 definieren wir die ε-Umgebung Kε (x) = y ∈ K |x − y| < ε}.
Eine Teilmenge U von K ist eine Umgebung von x, falls es ein ε > 0 gibt, so daß U die
ε-Umgebung Kε (x) enthält.
Fakt 7. Für eine Teilmenge M ⊆ K sind die folgenden Bedingungen äquivalent:
• Für jedes m ∈ M gibt es ein ε > 0 mit Kε (m) ⊆ M .
• Die Menge M ist Umgebung jedes ihrer Elemente.
• Das Komplement K \ M ist abgeschlossen in K
Definition 8. Eine derartige Menge nennt man offen in K.
Fakt 8.
• Die leere Menge und K selbst sind sowohl offen als auch abgeschlossen in
K.
• Endliche Vereinigungen und beliebige Durchschnitte abgeschlossener Teilmengen sind
abgeschlossen.
• Endliche Durchschnitte und beliebige Vereinigungen offener Teilmengen sind offen.
• Eine Teilmenge von R ist genau dann abgeschlossen in R, wenn sie abgeschlossen in C
ist.
Fakt 9.
• R ist nicht offen in C.
• Für reelle Zahlen a < b ist [a, b] das einzige abgeschlossene und (a, b) das einzige (in R)
offene Intervall mit Intervallgrenzen a und b.
• Für reelle Zahlen a sind (−∞, a] und [a, ∞) abgeschlossen, aber nicht offen in R. Dagegen sind (a, ∞) aund (−∞, a) offen in R, aber nicht abgeschlossen.
2.5. Supremum und Infimum von Mengen. Wir haben schon in Definition .2.2.2 Supremum und Infimum von Folgen eingeführt. In den folgenden Ausführungen sollen Supremum
und Infimum von Mengen betrachtet werden.
Definition 1. Sei M ⊆ R eine Teilmenge.
Eine reelle Zahl m ist eine obere Schranke von M , falls für alle µ ∈ M µ ≤ m (bzw. µ ≥ m)
gilt.
Eine Zahl m ist ein Supremum (bzw. Infimum) von M , falls folgende Eigenschaften gelten:
• Die Zahl m ist eine obere (bzw. untere) Schranke für M .
30
• Sei m̃ eine beliebige obere (bzw. untere) Schranke von M , dann gilt m ≤ m̃ (bzw.
m ≥ m̃).
Das Supremum (bzw. Infimum) einer Menge reeller Zahlen bezeichnet man mit sup M bzw.
inf M .
Fakt 1.
• Wenn K eine obere (bzw. untere) Schranke von M ⊂ R ist, so ist auch
jede reelle Zahl L mit L ≥ K (bzw. L ≤ K) eine obere (bzw. untere) Schranke von M .
• Seien M und X Untermengen von R. Wenn jedes Element von X eine untere Schranke
von M ist und wenn das Supremum von X existiert, so ist sup X ebenfalls eine untere
Schranke von M . Eine analoge Behauptung gilt für das Infimum jeder Menge, deren
Elemente obere Schranken von X sind.
• Eine obere (bzw. untere) Schranke für M ist auch eine obere (bzw. untere) Schranke
für jede Teilmenge von M . Insbesondere ist jede Teilmenge einer beschränkten Menge
beschränkt.
• Wenn eine Teilmenge von R von oben (bzw. unten) beschränkt ist, so gibt es auch eine
ganze Zahl, welche obere (bzw. untere) Schranke dieser Teilmenge ist.
• Der Limes einer Folge von oberen (bzw. unteren) Schranken von M ist eine obere (bzw.
untere) Schranke von M .
Beweis. Die erste Behauptung ist eine triviale Konsquenz der Definitionen. Angenommen,
alle Elemente von X sind untere Schranken von M , und s = sup X existiert. Sei m ∈ M . Weil
X aus unteren Schranken von M besteht, gilt x ≤ m für jedes x ∈ X. Also ist m eine obere
Schranke von X, und aus der Definition des Begriffes Supremum folgt m ≥ s. Also ist auch
s eine untere Schranke von M . Diese Betrachtung überträgt sich mutatis mutandis auf obere
Schranken und Infima.
Zum Beweis des vorletzten Punktes sei etwa s eine untere Schranke von M , dann ist ⌊s⌋
ganzzahlig und (wegen ⌊s⌋ ≤ s) ebenfalls eine untere Schranke von M .
Für den letzten Punkt sei s = limk→∞ sk , wobei jede Zahl sk eine obere Schranke von M
ist. Für jedes m ∈ M und alle k gilt dann m ≤ sk . Nach Folgerung .2.1.2 folgt m ≤ s. Da dies
für alle m ∈ M gilt, ist s eine obere Schranke von M .
Fakt 2.
• Jede Menge reeller Zahlen hat höchstens ein Supremum und höchstens ein
Infimum. Es macht also Sinn, von dem Supremum bzw. Infimum zu sprechen.
• Wenn m das größte (bzw. kleinste) Element der Menge M ist, so ist m auch das Supremum (bzw. Infimum) von M .
• Eine Zahl m ist genau dann eine untere Schranke bzw. das Infimum
derMenge M
, wenn
−m eine obere Schranke bzw. das Supremum der Menge −M = −µ µ ∈ M ist.
• Sei N eine Teilmenge von M , es gilt
sup(N ) ≤ sup(M )
inf(N ) ≤ inf(M ),
sofern beide Seiten dieser Ungleichungen existieren.
2. GRENZWERTE
31
Beweis. Angenommen, m und m̃ sind zwei Infima von M . Aus der Definition folgt m ≥ m̃
und (mit vertauschten Rollen) m̃ ≥ m, woraus sich m = m̃ ergibt. Die zweite und die dritte
Behauptung ist offensichtliche Konsequenzen der Definition.
Offenbar muß nicht jede von unten beschränkte Menge reeller Zahlen ein kleinstes Element
enthalten. Sei dazu etwa M die Menge aller positiven reellen Zahlen. Für jedes m ∈ M gilt
m/2 ∈ M und m/2 < m, weswegen m nicht das kleinste Element von M sein kann.
Das Infimum ist, falls es existiert, die größte reelle Zahl, welche kleiner oder gleich jedem
Element von M ist. Beispielsweise ist 0 das Infimum der Menge aller positiven reellen Zahlen.
Wenn das Infimum einer Menge M existiert zu dieser gehört, so ist es deren kleinstes Element.
Andernfalls, also wenn das Infimum von M nicht existiert oder nicht zu M gehört, enthält M
kein kleinstes Element. Daß dem so ist, folgt unmittelbar aus den Definitionen bzw. aus dem
obigen Fakt.
Wir hatten am Anfang der Vorlesung im Zusammenhang mit der Methode der vollständigen Induktion das Prinzip aufgestellt, wonach jede nichtleere Menge natürlicher Zahlen (oder
jede von unten beschränkte nichtleere Menge ganzer Zahlen) ein kleinstes Element enthält. Ein
analoger Sachverhalt für nichtleere von unten beschränkte Mengen reeller Zahlen wäre, wie wir
gesehen haben, auf jeden Fall falsch, aber eine äquivalente Umformulierung des Vollständigkeitsaxiomes ist
Satz 1. Es gelten die beiden folgenden Behauptungen:
• Jede nichtleere von unten beschränkte Teilmenge von R hat ein Infimum.
• Jede nichtleere von oben beschränkte Teilmenge von R hat ein Supremum.
Bemerkung 1. Man kann zeigen, daß die beiden Behauptungen bereits auf Grund der
übrigen Axiome äquivalent zueinander und zum Vollständigkeitsaxiom sind. Die Äquivalenz
der beiden Behauptungen ist eine Folge von Fakt 2. Es genügt also, die Existenz des Supremums
nichtleerer von oben beschränkter Teilmengen von R zu zeigen.
Für den Beweis des Satzes brauchen wir den folgenden Fakt:
Fakt 3.
• Jede von oben beschränkte, nichtleere Teilmenge von Z enhält ein größtes
Element.
• Jede von unten beschränkte, nichtleere Teilmenge von Z enhält ein kleinstes Element.
Beweis. Es genügt der Nachweis des ersten Punktes, denn der zweite geht analog dazu.
Nach
Fakt
1 gibt
es eine Zahl b ∈ Z, welche obere Schranke von M ist. Dann ist b − M =
b − m m ∈ M eine nichtleere Teilmenge von N und hat daher, wie am Beginn des Skriptes
im Zusammenhang mit dem Prinzip der vollständigen Induktion erklärt, ein kleinstes Element
d. Dann ist b − d das größte Element von M .
Sei M ⊆ R von oben beschränkt und nichtleer. Für jedes k ∈ N ist dann Sk =
Beweis.
⌈2k m⌉ m ∈ M eine nichtleere Teilmenge von Z und hat daher ein größtes Element sk . Sei
sk+1 = ⌈2k+1 xk ⌉, dann gilt ⌈2k xk ⌉ ≥ sk+1 /2, also gilt sk+1 ≤ 2sk . Die Zahlen 2−k sk bilden also
eine monoton fallende Folge.
32
Sei x ∈ X, aus den Definitionen folgt sk ≥ 2k x, also
(+)
x ≤ 2−k sk .
Folglich ist x eine untere Schranke der Folge 2−k sk , nach dem Vollständigkeitsaxiom (Fakt .2.2.1)
existiert also s = limk→∞ sk .
Da (+) für alle x ∈ X gilt, ist s eine obere Schranke von M . Sei s̃ eine andere obere Schranke
von M . Aus den Definitionen folgt sk ≤ ⌈2k s̃⌉, wegen 2k s̃ > ⌈2k s̃⌉ − 1 gilt also s̃ > 2−k sk − 2−k .
Durch Übergang zum Limes k → ∞ folgt s̃ ≥ s. Also ist s Supremum von M .
2.6. Abzählbarkeit und Überabzählbarkeit.
Definition 1. Zwei Mengen werden gleichmächtig genannt, wenn zwischen ihnen eine
bijektive Abbildung existiert. Wir schreiben #(M ) = #(N ). Wir schreiben #(M ) ≤ #(N ),
falls eine injektive Abbildung von M nach N existiert. Eine Menge ist abzählbar unendlich,
falls sie zur Menge der natürlichen Zahlen gleichmächtig ist. Sie ist überabzählbar, falls sie
unendlich und nicht abzählbar ist. Wir schreiben #(M ) < #(N ), falls #(M ) ≤ #(N ) gilt und
die beiden Mengen M und N nicht gleichmächtig sind.
Der soeben eingeführte Gleichmäßigkeitsbegriff verblüfft anfänglich durch einige unerwartete Eigenschaften. Beispielsweise kann eine unendliche Menge zu einer ihrer echten Teilmengen
gleichmächtig sein (man kann ‘unendlich’ sogar so definieren – Unendlichkeit im Sinne von
Dedekind).
Beispiel 1. Die Mengen N der natürlichen und Z der ganzen Zahlen sind gleichmächtig.
f→ Z ist gegeben durch f (n) = n/2 für gerade
Beweis. Eine bijektive Abbildung N −−
Zahlen n und f (n) = −(n + 1)/2 für ungerade Zahlen n. Die Umkehrabbildung zu f ist durch
g(m) = 2m für m ≥ 0 und g(m) = (1 − m)/2 für m < 0 gegeben.
Wir bemerken noch:
Fakt 1.
• Wenn M zu M ′ und N zu N ′ gleichmächtig ist, so ist auch M × N zu
′
′
M × N gleichmächtig.
• Aus #M ≤ #M ′ und #N ≤ #N ′ folgt #(M × N ) ≤ #(M ′ × N ′ ).
• Aus N 6= ∅ folgt #(M ) ≤ #(M × N ).
µ→ M ′ und N −−
ν→ N ′ bijektive Abbildungen sind, so ist
Beweis. In der Tat, wenn M −−
µ−×
M × N −−
−−ν→ M ′ × N ′ bijektiv, wobei (µ × ν)(m, n) = (µ(m), ν(n)) gesetzt wird. Die inverse
Abbildung zu dieser Abbildung ist µ−1 × ν −1 . Damit ist der erste Punkt bewiesen. Der zweite
Punkt kann genauso gezeigt werden, denn aus der Injektivität von µ und ν folgt die Injektivität
von µ × ν. Zum Beweis der dritten Aussage sei n ∈ N , wir haben eine injekitve Abbildung
M → M × N , m → (m, n).
Es ist nicht ganz selbstverständlich, daß zwei Mengen mit |M | ≤ |N | und |N | ≤ |M |
gleichmächtig sein müssen.
2. GRENZWERTE
33
Satz 1 (Schröder-Bernstein). Aus |M | ≤ |N | und |N | ≤ |M | folgt die Gleichmächtigkeit
von M und N .
f→ N
Beweis. Auf Grund unserer Voraussetzung existieren injektive Abbildungen M −−
g→ M , dann haben wir disjunkte Vereinigungen
und N −−
M = M∞ ∪
N = N∞ ∪
mit M∞ =
T∞
k=0 (gf )
k
M , N∞ =
S∞
k=0 (f g)
k
∞
[
k=0
∞
[
k=0
N,
Mk′ ∪
Nk′ ∪
∞
[
Mk′′
k=0
∞
[
Nk′′
k=0
Mk′ = (gf )k M − g(f g)k N = (gf )k M − (gf )k gN,
Nk′ = (f g)k N − f (gf )k M = (f g)k N − (gf )k gN,
Mk′′ = g(f g)k N − (gf )(k+1) M = (gf )k gN − (gf )(k+1) M
sowie
Nk′′ = f (gf )k M − (f g)k+1 N = (f g)k N − (gf )k gN − (f g)k+1 N.
Dann bildet f Mk′ bijektiv auf Nk′′ ab, während g Nk′ bijektiv auf Mk′′ abbildet. Außerdem
f→ N bijektiv. Es gibt also genau eine Bijektion M −−
h→ N mit h(x) = f (x) für
ist M∞ −−
S∞ ∞ ′
S∞
′′
x ∈ M∞ ∪ k=0 Mk sowie mit g(h(x)) = x für x ∈ k=0 Mk .
Man könnte versucht sein, auch die folgende Aussage beweisen zu wollen:
Fakt 2 (Version des Auswahlaxiomes). Für je zwei Mengen M , N gilt eine der beiden
Ungleichungen #M ≤ #N oder #N ≤ #M .
Es wurde aber durch Gödel in eine Richtung und durch Frenkel und Cohen in die andere
gezeigt, daß das Auswahlaxiom den übrigen Axiomen der Mengenlehre (auf die wir hier nicht
eingegangen sind) weder widerspricht (falls deren Widerspruchslosigkeit vorausgesetzt wird)
noch aus ihnen herleitbar ist.
Wir bemerken noch:
f→ N
Fakt 3 (Folgerung aus dem Auswahlaxiom). Wenn eine surjektive Abbildung M −−
existiert, so gilt #N ≤ #N .
g→ M , indem für g(n) irgendein
Beweis. Wir definieren eine injektive Abbildung N −−
m ∈ M mit n = f (m) genommen wird. Wegen der Surjektivität von f existiert ein solches m,
aber die simultane Auswahl der jeweiligen m für unendlich viele n erfordert die Anwendung
des Auswahlaxiomes. Offenbar ist g injektiv, und die Behauptung ist bewiesen.
Fakt 4. Jede Teilmenge M von N ist endlich oder abzählbar unendlich.
34
f→ N, indem wir f (k) für k ∈ M
Beweis. Wir definieren eine injektive Abbildung M −−
gleich der Zahl der Elemente l ∈ M mit l < k setzen. Man kann sich davon überzeugen, daß
f M entweder bijektiv auf ganz N abbildet oder auf ein Anfangsstück davon (in welchem Fall
M endlich ist).
Zusammen mit Fakt 3 folgt
Fakt 5. Für jede unendliche Menge M gilt #(M ) ≥ #(N), jede unendliche Menge ist also
mindestens abzählbar.
Einige unserer Sätze über unendliche Summen können bequem auf abzählbarePIndexmengen
verallgemeinert werden. Für endliche Indexmengen I ist offenbar die Summe i∈I f (i) aller
f→ C wohldefiniert. Wir betrachten derartige
Funktionswerte von f auf I für jede Funktion I −−
Summen als trivialerweise absolut konvergent.
f→ C eine Funktion. Dann sind folgende
Satz 2. Sei I eine abzählbare Indexmenge und I −−
Bedingungen äquivalent:
ι M , so daß P∞ f (ι(k)) absolut konvergiert.
• Es gibt eine Bijektion N −→
k=0
ι M konvergiert P∞ f (ι(k)) absolut.
• Für jede Bijektion N −→
k=0
P
P∞
ι M ab.
→
In diesem Fall hängt i∈I f (i) = k=0 f (ι(k)) nicht von der Wahl der Bijektion N −P
Wir nennen derartige Summen über alle Elemente von I absolut konvergent. Wenn i∈I f (i)
S
absolut konvergiert und wenn I = lk=0 Ik mit l ∈ N∪{∞} eine höchstens abzählbare Zerlegung
von I in disjunkte Teilmengen ist, so gilt der große Umordnungssatz
X
i∈I
f (i) =
l X
X
f (i),
k=0 i∈Ik
wobei sowohl die inneren Summen als auch die äußere Summe auf der rechten Seite absolut
konvergieren.
Der Beweis ist nicht schwierig, soll aber ausgelassen werden. Statt dessen bringen wir die
beiden Cantorschen Diagonalargumente:
Satz 3 (Erstes Cantorsches Diagonalprinzip). Die Menge N × N ist abzählbar unendlich.
f→ N ist durch f (m, n) = (m+n)(m+n+1)/2+n
Beweis. Eine bijektive Abbildung N×N −−
gegeben. Offenbar ist f (m, n) die Nummer des Paares (m, n) bei der Durchnumerierung von
N × N in einem quadratischen Schema, das beim Beweis von Satz 9.1 (und im Tafelbild der
Vorlesung) angegeben ist.
Folgerung 1. Die folgenden Mengen sind abzählbar: Z × Z, Q, Q × Z, Q × Q, Q × Q × Q.
Beweis. Die Behauptung über die Abzählbarkeit von Z×Z ergibt sich durch Kombination
von Fakt 1 mit Beispiel 1. Zum Beweis der Abzählbarkeit von Q bemerken wir, daß jede
rationale Zahl x auf eindeutige Weise als x = a/b mit teilerfremden ganzen Zahlen a und b > 0
2. GRENZWERTE
35
dargestellt werden kann. Sei also M ⊂ Z × Z die Menge aller Paare (a, b) mit b > 0 und
f→ Q, f (a, b) = a/b, nach dem Gesagten bijektiv. Also ist Q zu der
ggT(a, b) = 1, dann ist M −−
Untermenge M der abzählbaren Menge Z × Z gleichmächtig und daher höchstens abzählbar,
#(Q) ≤ #(N). Wegen N ⊂ Q gilt auch #(N) ≤ #(Q). Aus dem Satz von Schröder-Bernstein
ergibt sich nun die Gleichmächtigkeit von N und Q.
Alle weiteren Behauptungen können nun ähnlich bewiesen werden wie die Abzählbarkeit
von Z × Z, wobei im Falle von Q × Q × Q zuerst die Abzählbarkeit von Q × Q bewiesen und
dann die Bijektion (Q × Q) × Q ∼
= Q × Q × Q benutzt wird.
Folgerung
2. Sei M eine unendliche Menge, wenn eine höchstens abzählbare Überdeckung
Sl
M = k=0 Ml , l ∈ N ∪ {∞}, von M durch höchstens abzählbare Mengen Ml existiert, so ist M
abzählbar unendlich.
Definition 2. Definition der abgeschlossenen und offenen Intervalle.
Satz 4 (Zweites Cantorsches Diagonalprinzip). Die Menge R aller reellen Zahlen ist überabzählbar.
Beweis. Es genügt offenbar der Beweis der Überabzählbarkeit von I = [0, 1]. Angenomf→ I. Sei φ die l-te Dezimalstelle von f (k). Wir setzen
men, es gäbe eine Bijektion N −−
k,l
ζk = φk,k + 1 im Falle 0 ≤ φk,l ≤ 7 und ζk = 0 im Falle 8 ≤ φk,k ≤ 9. Man bemerkt leicht,
daß ζk eine gültige Dezimalziffer ist, welche nicht mit der k-ten Dezimalstelle
f (k)
P∞ φk,k von
−1
übereinstimmt. Sei z die reelle Zahl mit dieser Dezimaldarstellung, z =
k=1 ζk 10 . Man
bemerkt, daß nur die Ziffern 0 bis 8 in dieser Dezimaldarstellung vorkommen und daher keine Neunerperiode vorliegt. Angenommen, es gäbe eine Zahl k mit z = f (k). Dann wäre die
k-te Nachkommastelle von z gleich φk,k 6= ζk , was ein Widerspruch ist. Also war f doch nicht
surjektiv.
Bemerkung 1. Da Q abzählbar und R überabzählbar ist, ergibt sich ein neuer Beweis für
die Existenz irrationaler Zahlen: es gibt in mengentheoretischem Sinne viel mehr reelle Zahlen
als rationale Zahlen.
Definition 3. Eine Menge hat die Mächtigkeit des Kontinuums, falls sie zu R gleichmächtig
ist.
Satz 5. Jedes Intervall I = [a, b], I = (a, b), I = [a, b) oder I = (a, b] mit a < b hat die
Mächtigkeit des Kontinuums und ist zu I × I gleichmächtig.
Beweis. Sein zunächst I = [0, 1). Man erhält eine surjektive Abbildung I → I × I, indem man x ∈ I das Paar (y, z) zuordnet, wobei die Dezimalbruchentwicklung (eventuell mit
Neunerperiode) von y mit den geraden und die von z mit den ungeraden Nachkommastellen
von x gebildet wird. Also gilt #(I × I) ≤ #(I). Die umgekehrte Ungleichung folgt aus Fakt 1,
und nach dem Satz von Schröder-Bernstein sind I und I × I gleichmächtig. Wir haben eine
bijektive Abbildung Z × I → R, welche (k, x) auf k + x abbildet (siehe Satz .1.3.4). Folglich
ist R zu Z × I und damit auch zu N × I gleichmächtig. Da I ein bijektives Bild von N enthält
36
(z. B. {1/(n + 1)|n ∈ N}), folgt #(R) = #(N × I) ≤ #(I × I) = #I. Wegen I ⊂ R gilt auch
#I ≤ #R. Folglich hat I die Mächtigkeit des Kontinuums.
Jedes halboffene Intervall [a, b) ist ein bijektives Bild von I (z. B. durch die Abbildung t →
a + (b − a)t) und hat daher ebenfalls die Mächtigkeit des Kontinuums. Sei nun I˜ ein beliebiges
(offenes, abgeschlossenes oder halboffenes) Intervall mit Anfangspunkt a und Endpunt b, wobei
a < b gelte. Wegen I˜ ⊂ R hat I˜ höchstens die Mächtigkeit des Kontinuums. Andererseits enthält
I˜ das halboffene Intervall [(2a+b)/3, (a+2b)/3), das nach dem Gezeigten zu R gleichmächtig ist.
Also hat I˜ auch mindestens die Mächtigkeit des Kontinuums, und aus dem Satz von SchröderBernstein folgt #I˜ = #R.
Folgerung 3. Die Mengen R, R × R, R × N, R × R × R haben die Mächtigkeit des
Kontinuums.
3. Differential- und Integralrechnung
3.1. Die Ableitung einer Funktion.
Definition 1. Eine R- oder C-wertige Funktion, die auf einer Umgebung von x ∈ R (bzw.
von x ∈ C) definiert ist, ist an der Stelle x differenzierbar (bzw. komplex differenzierbar), falls
f (x + h) − f (x)
h→0
h
f ′ (x) = lim
existiert, wobei im Fall komplexer Differenzierbarkeit alle genügend kleinen komplexen Zahlen
h 6= 0 zugelassen sind, während sonst nur relle h betrachtet werden. Wir nennen f ′ (x) die
df
Ableitung von f an der Stelle x, man schreibt auch f ′ = dx
. Eine Funktion auf einer offenen
Untermenge von R ist differenzierbar, falls sie an jedem Punkt dieser Menge differenzierbar
ist, und stetig differenzierbar, wenn zudem die Ableitung stetig ist. Eine Funktion auf einer
offenen Untermenge von C ist holomorph, falls sie an jedem Punkt dieser Menge komplex
differenzierbar ist.
Wenn f (x1 , . . . , xn ) eine Funktion mehrerer Veränderlicher ist, so daß für 1 ≤ j ≤ n mit
festem xj für j 6= i die Funktion g(z) = f (x1 , . . . , xj−1 , z, xj+1 , . . . , xn ) als Funktion von z an
der Stelle z = xj im soben beschriebenen Sinne differenzierbar ist, so schreiben wir
(1)
∂f
(x1 , . . . , xn ) = g ′ (xj )
∂xj
und nennen (1) die partielle Ableitung von f nach xj an der Stelle (x1 , . . . , xn ).
Bemerkung 1. Man kann zeigen, daß holomorphe Funktionen stetig sind und daß die
Ableitung einer holomorphen Funktion wieder holomorph ist. Daher gibt es kein sinnvolles
komplexes Gegenstück zur stetigen Differenzierbarkeit: Die Holomorphiebedingung kann nicht
auf diese Weise weiter verschärft werden.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
37
Bemerkung 2. Für auf Untermengen von R definierte Funktionen kann man auch die
einseitigen Ableitungen betrachten:
f (x + h) − f (x)
h↓0
h
f (x + h) − f (x)
f−′ (x) = lim
,
h↑0
h
f+′ (x) = lim
wobei für die Definition der rechtsseitigen Ableitung f+′ (x) nur vorausgesetzt werden muß, daß
eine Zahl ε > 0 existiert, so daß [x, +ε) im Definitionsbereich von f enthalten ist.
Fakt 1. Wenn f links- und rechtsseitig in x differenzierbar ist und beide einseitigen Ableitungen übereinstimmen, so ist f in x differenzierbar, und f ′ (x) stimmt mit dem Wert der
links- bzw. rechtsseitigen Ableitung überein.
Beispiel 1. Die folgenden Funktionen sind auf ganz R differenzierbar:
• Die konstante Funktion f (t) = a, ihre Ableitung verschwindet.
• Die identische Funktion f (x) = x, ihre Ableitung ist die konstante Funktion 1.
• Die Exponentialfunktion f (x) = exp(x), ihre Ableitung ist f ′ (x) = exp(x).
Die Funktion f (x) = |x| ist nur außerhalb 0 differenzierbar, dort gilt f ′ (t) = 1 für t > 0 und
f ′ (t) = −1 für t < 0. An der Stelle 0 gilt f+′ (0) = 1, f−′ (0) = −1.
Beweis. Für die beiden ersten Beispiele findet man
f (x + h) − f (x)
a−a
= lim
= lim 0 = 0
h→0
h→0
h→0
h
h
f ′ (t) = lim
bzw.
f (x + h) − f (x)
(x + h) − x
= lim
= lim 1 = 1.
h→0
h→0
h→0
h
h
Durch ähnlich einfache Rechnungen zeigt man auch unsere Behauptungen über f (x) = |x|.
Im Fall der Exponentialfunktion ergibt sich durch Anwendung von (.2.3.3) und (.2.3.3)
sowie der Rechenregeln für Grenzwerte:
f ′ (t) = lim
exp(h) − 1
exp(x + h) − exp(x)
f (x + h) − f (x)
= lim
= lim exp(x)
= exp(x).
h→0
h→0
h→0
h
h
h
f ′ (x) = lim
Das Beispiel überträgt sich wortwörtlich auf den komplexen Fall:
Beispiel 2. Die folgenden Funktionen sind auf ganz C holomorph:
• Die konstante Funktion f (t) = a, ihre Ableitung verschwindet.
• Die identische Funktion f (x) = x, ihre Ableitung ist die konstante Funktion 1.
• Die Exponentialfunktion f (x) = exp(x), ihre Ableitung ist f ′ (x) = exp(x).
Dagegen ist die Funktion f (z) = z nirgendwo komplex differenzierbar.
38
Beweis. Der vorige Beweis überträgt sich mit Ausnahme des letzten Punktes wortwörtlich,
beispielsweise ergibt sich im Fall der Exponentialfunktion durch Anwendung von (.2.3.3) und
(.2.3.3) sowie der Rechenregeln für Grenzwerte:
exp(h) − 1
exp(x + h) − exp(x)
f (x + h) − f (x)
= lim
= lim exp(x)
= exp(x),
h→0
h→0
h→0
h
h
h
wobei der einzige Unterschied zu vorhin darin besteht, daß nun auch komplexe h 6= 0 zugelassen
sind, was auch in (.2.3.3) gestattet ist.
Für den letzten Punkt betrachtet man
z+h−z
h
(+)
= ,
h
h
und für reelle h 6= 0 hat dieser Quotient den Wert 1, während er für h auf der imaginären
Achse den Wert −1 hat. Es gibt also bliebig kleine h 6= 0, für die (+) den Wert 1 hat, und
auch beliebig kleine h 6= 0, für die (+) den Wert −1 hat. Die Funktion f (z) = z ist daher nicht
komplex differenzierbar.
f ′ (x) = lim
Die folgende Aussage gilt sowohl für reelle (K = R als auch komplex (K = C) Ableitungen
einer Funktion, die in einer Umgebung von x ∈ K definiert ist:
Fakt 2. Die Funktion f ist genau dann differenzierbar an der Stelle x mit Ableitung φ,
wenn zu jedem ε > 0 ein δ > 0 mit
|f (x + h) − f (x) − φ · h| < ε |h|
für alle h ∈ K mit |h| < ε. Im Fall einseitiger reeller Ableitungen gilt eine analoge Charakterisierung, wobei die Bedingung |h| < δ durch 0 < h < δ für rechtsseitige bzw. −δ < h < 0 für
linksseitige Ableitungen zu ersetzen ist.
Satz 1. Jede in x differenzierbare Funktion ist stetig in x, und es existieren sogar positive
relle Zahlen L und ε mit
|f (t) − f (x)| ≤ L |t − x|
für |t − x| < ε. Im Fall von Funktionen auf Untermengen von R genügt es, die Existenz der
beiden einseitigen Ableitungen vorauszusetzen.
Wir benötigen folgende Rechenregeln für Ableitungen, wobei reellwertige oder komplexwertige Funktionen auf offenen Untermengen von R zugelassen sind. Wenn man sich an den
Randpunkten auf einseitige Ableitungen beschränkt, kann man auch abgeschlossene oder halboffene Intervalle zulassen.
Satz 2. Wenn f und g rell- oder komplexwertige Funktionen auf einer Umgebung von x ∈ R
sind, die beide in x differenzierbar sind, so sind auch f ± g und f g im Punkte x differenzierbar,
und es gilt
(2)
(3)
(f ± g)′ (x) = f ′ (x) ± g ′ (x)
(f g)′ (x) = f (x)g ′ (x) + f ′ (x)g(x).
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
39
Falls überdies g(x) 6= 0 sein sollte, so ist auch f /g an der Stelle x differenzierbar, und es gilt
f ′ (x)g(x) − f (x)g ′ (x)
.
(f /g) (x) =
g(x)2
′
(4)
Dieselben Regeln gelten für die links- bzw. rechtsseitigen Ableitungen, falls f und g in einer
Umgebung von x in (−∞, x] bzw. [x, ∞) definiert und an der Stelle x einseitig differenzierbar
sind. Falls f und g in einer Umgebung von x ∈ C definiert sind, gelten analoge Regeln auch
für die komplexen Ableitungen.
Beweis. Der Beweis ergibt sich unmittelbar aus den Rechenregeln für Grenzwerte sowie
aus der Stetigkeit von f und g an der Stelle x, z. B.
f (x + h)g(x + h) − f (x)g(x)
h→0
h
f (x + h)g(x + h) − f (x)g(x + h) + f (x)g(x + h) − f (x)g(x)
= lim
h→0
h
f (x + h) − f (x)
g(x + h) − g(x)
= lim g(x + h)
+ lim f (x)
h→0
h→0
h
h
g(x + h) − g(x)
f (x + h) − f (x)
+ f (x) lim
= g(x)f ′ (x) + f (x)g ′ (x)
= g(x) lim
h→0
h→0
h
h
(f g)′ (x) = lim
oder, im Fall von f /g und nach Übergang zum gemeinsamen Nenner g(x)g(x + h) im Differenzenquotienten:
f (x + h)g(x) − f (x)g(x + h)
h→0
g(x)g(x + h)h
1
f (x + h)g(x) − f (x)g(x) + f (x)g(x) − f (x)g(x + h)
=
lim
g(x)2 h→0
h
g(x + h) − g(x) f (x + h) − f (x)
1
lim g(x)
− f (x)
=
g(x)2 h→0
h
h
1
′
′
g(x)f
(x)
−
f
(x)g
(x)
.
=
g(x)2
(f /g)′ (x) = lim
In beiden Fällen wurde der vorherige Satz angewendet.
Beispiel 3.
• Durch Induktion nach n mittels (3) zeigt man f ′ (x) = nxn−1 für f (x) =
xn . Durch Anwendung von (4) ergibt sich, daß dies im Fall x 6= 0 auch für negative ganze
Zahlen n richtig bleibt. In beiden Fällen ist die Aussage auch im Sinne der komplexen
Differentialrechnung richtig.
• Die Ableitung der Funktion x3 + x2 + x + 1 ist 3x2 + 2x + 1.
Satz 3. Sei f eine rellwertige (bzw. C-wertige) Funktion, die auf einer Umgebung von
x ∈ R definiert ist, und sei g auf einer Umgebung von f (x) in R (bzw. von f (x) in C) definiert
40
und an der Stelle f (x) differenzierbar (bzw. komplex differenzierbar). Dann ist h(t) = g(f (t))
auf einer Umgebung von x wohldefiniert und an der Stelle x differenzierbar, und es gilt
(5)
h′ (x) = g ′ (f (x))f ′ (x).
Wenn nur die links- bezw. rechtsseitige Ableitung von h betrachtet werden soll, genügt es, die
Existenz der entsprechenden einseitigen Ableitung von f vorauszusetzen.
Für die Ableitung der Umkehrfunktion kann folgender Satz bewiesen werden:
Satz 4.
• Die Funktion f sei auf [a, b] definiert, streng monoton wachsend und stetig.
Dann bildet f das Intervall [a, b] bijektiv auf [f (a), f (b)] ab, und die Umkehrfunktion
g = f −1 ist stetig. Wenn f an der Stelle x ∈ (a, b) differenzierbar ist und f ′ (x) 6= 0 gilt,
so ist g an der Stelle f ′ (x) differenzierbar, und g ′ (f (x)) = 1/f ′ (x).
• Die holomorphe Funktion f bilde die offene Teilmenge U ⊆ C bijektiv auf die offene
g→ U holomorph, es gilt f ′ (z) 6=
Teilmenge V ⊆ C ab. Dann ist die
Umkehrfunktion
V −−
0 für alle z ∈ U , und g ′ (x) = 1 f ′ g(x) für alle x ∈ V .
√
Beispiel 4.
• Die Funktion f (x) = x ist auf der Menge der positiven rellen Zahlen
differenzierbar, und f ′ (x) = 2√1 x .
• Die Exponentialfunktion bildet R bijektiv auf die Menge aller positiven rellen Zahlen
ab. Die Umkehrfunktion f (x) = log(x) ist auf der Menge der positiven rellen Zahlen
differenzierbar, und f ′ (x) = 1/x.
• Es gilt
∂ax
(6)
= x · ax−1
∂a
∂ax
= log(a)ax
∂x
für reelle a > 0 und komplexe x, wobei die partielle Ableitung nach x auch als komplexe
Ableitung existiert.
Beweis. Die Voraussetzungen des Satzes sind im ersten Beispiel leicht direkt nachzuweisen
und folgen im zweiten Beispiel aus den Eigenschaften der Exponentialfunktion. Die benötigte
Monotonie der Exponentialfunktion ergibt sich für t ≥ 0 durch direkte Betrachtung der Exponentialreihe, für t < 0 daraus und aus exp(t) exp(−t) = 1, und auf ganz R durch Kombination
dieser beiden Monotonieaussagen. Durch ähnliche Argumente zeigt man die Positivität von
exp(t) für relle t sowie die Tatsache, daß exp(t) für t → ∞ bestimmt gegen ∞ divergiert und
für t → −∞ gegen 0 konvergiert. Die Behauptung folgt nun direkt durch Anwendung des
Satzes.
Die letzte Behauptung folgt aus der zweiten durch Anwendung der Kettenregel:
exp x log(a)
∂ax
=
∂a
∂a
d log(a)
exp x log(a)
=x
da
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
=
41
x x
a = xax−1
a
sowie
exp x log(a)
∂ax
=
∂x
∂x
= log(a) exp x log(a) = log(a)ax .
Die beiden zuletzt genannten Sätze finden sich als Satz 15.3 und 15.4 bei Forster, wenigstens
im Fall reller Funktionen. Der Beweis überträgt sich unmittelbar auf den komplexen Fall.
Manchmal brauchen wir eine Rechenregel für die Ableitung einer aus zwei Stücken zusammengesetzten Funktion.
Satz 5. Seien a < b < c reelle Zahlen. Die Funktionen f und g seien auf [a, b] bzw. [b, c]
definiert. Durch
(
f (x) a ≤ x ≤ b
h(x) =
g(x) b < x ≤ c
ist eine Funktion auf [a, c] definiert. Wenn f (b) = g(c) gilt, und f und g stetig sind, so ist
′
diese stetig. Wenn überdies f−′ (b) und g+
(b) existieren und übereinstimmen, so existiert h′ (b)
′
und stimmt mit f−′ (b) = g+
(b) überein. Wenn insbesondere f und g differenzierbar auf [a, b]
bzw. [b, c] sind und ihre Funktionswerte und Ableitungen an der Stelle b übereinstimmen, so ist
h differenzierbar auf [a, c], und h′ stimmt auf [a, b] mit f ′ und auf [b, c] mit g ′ überein.
Im Zusammenhang mit partiellen Ableitungen weisen wir noch auf die folgenden Rechenregeln hin, die wir zunächst ohne Beweis formulieren. Wir bemerken dabei, daß Stetigkeit von
Funktionen auf Teilmengen des Rn als Folgenstetigkeit definiert werden kann, wobei Folgenkonvergenz für Folgen von Punkten des Rn koordinatenweise definiert werden kann.
Satz 6.
• Die Funktion F sei auf einer offenen Teilmenge U ⊆ Rn nach allen n
∂F
stetig auf ganz U seien.
Koordinaten partiell differenzierbar, wobei die Ableitungen ∂x
i
Wenn I ⊆ R ein Intervall und ~a = (a1 , . . . , an ) ein n-Tupel von auf I differenzierbaren
Funktionen mit ~a(I) ⊆ U ist, so ist die Funktion
g(t) = F (~a(t)) = F a1 (t), . . . , an (t)
auf I differnzierbar, und es gilt die Kettenregel
′
(7)
g (t) =
n
X
i=1
daselbst.
a′i (t)
∂F
~a(t)
∂xi
42
f→ C eine stetige Funktion ist, für die die partiellen
• Wenn U ⊆ R2 offen und U −−
∂ ∂f
Ableitungen ∂f
, ∂f und ∂y
auf U existieren und stetig sind, so gilt auf ganz U
∂x ∂y
∂x
∂ ∂f
∂ ∂f
=
,
∂x ∂y
∂y ∂x
wobei auch die linke Seite der Gleichung auf ganz U existiert.
(8)
Ohne Stetigkeitsforderungen der angegebenen Art, die man freilich teilweise schwächer
formulieren könnte, sind beide Aussagen falsch. Die zweite Aussage hat die Vertauschbarkeit
partieller Ableitungen unter bestimmten technischen Voraussetzungen zum Inhalt, die in den
meisten Anwendungen erfüllt sind.
Die erste Aussage ist eine Art Verallgemeinerung der Kettenregel auf den Fall einer äußeren
Funktion, die von mehr als einer Variablen abhängt. Als Beispiel betrachten wir ~a(t) = xo + t~v
mit ~v ∈ Rn . In diesem Fall ergibt sich als Formel für die Richtungsableitung
n
X
dF ~a(t)
∂F
∂F
F (xo + h~v )
(9)
(xo ) = lim
=
|t=0 =
(xo ),
vi
h→0
∂v
h
dt
∂x
i
i=1
unter denselben Voraussetzungen an F wie im ersten Punkt von Satz 6.
3.2. Riemannsche Summen und Henstock-Kurzweil-Integration.
Definition 1. Sei I = [a, b] mit rellen Zahlen a ≤ b. Eine Riemannsche Zerlegung mit
Zwischenstellen für I ist eine Folge
˙ n−1 ≤ ξn ≤ an = a.
(1)
a = a0 ≤ ξ1 ≤ a1 ≤ ≤a
Die Riemannsche Summe einer auf [a, b] definierten Funktion f für eine Zerlegung mit Zwischenwertstellen definieren wir als
n
X
σ(Z, Ξ, f ) =
(ai − ai−1 )f (ξi ).
i=1
Fakt 1. Es gilt
(2)
σ(Z, Ξ, f + g) = σ(Z, Ξ, f ) + σ(Z, Ξ, g)
σ(Z, Ξ, λf ) = λσ(Z, Ξ, f )
sowie
(3)
|σ(Z, Ξ, f )| ≤ σ(Z, Ξ, |f |)
Wenn f und g reellwertig sind und f (x) ≤ g(x) auf I gilt, so gilt
(4)
σ(Z, Ξ, f ) ≤ σ(Z, Ξ, g).
Das Riemannsche Integral einer Funktion ist, wenn es existiert, der Grenzwert dieser Riemannschen Summen, wobei das Maximum der Schrittweiten ai − ai−1 gegen 0 strebt. Das
Henstock-Kurzweil-Integral erhält man durch Einführung einer flexiblen Schrittweitenbedingung.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
43
δ→ (0, ∞). Ein Paar
Definition 2.
• Eine Integraleichung auf I ist eine Funktion I −−
(Z, Ξ) wie in Definition 1 ist δ-fein, wenn ai − ai−1 < δ(ξi ) für 1 ≤ i ≤ n gilt.
• Wir sagen, daß eine Zahl ι das Henstock-Kurzweil-Integral der Funktion f auf I ist,
und schreiben
Z b
f (t) dt,
ι=
a
wenn zu jedem ε > 0 eine Eichung δ existiert, so daß
(5)
|ι − σ(Z, Ξ, f )| < ε
für jede δ-feine Zerlegung (Z, Ξ) gilt. Wir nennen f Henstock-Kurzweil-integrierbar oder
HK-integrierbar, wenn eine solche Zahl ι (die sich als eindeutig herausstellen wird) existiert. Wir sagen, daß f im Sinne von Riemann integrierbar ist, wenn dieselbe Bedingung
bereits mit konstanten Funktionen δ als Eichung erfüllbar ist.
• Falls f R-wertig ist sagen wir, daß das HK-Integral von f bestimmt gegen ∞ divergiert,
falls zu jedem A ∈ R eine Integraleichung δ existiert mit
σ(Z, Ξ, f ) > A
Rb
für jedes δ-feine (Z, Ξ). Wir sagen, daß es bestimmt gegen −∞ divergiert, wenn a −f (t) dt
bestimmt gegen ∞ divergiert.
Rb
Bemerkung 1. Die Idee hinter dieser Definition ist, daß a f (t) dt den Flächeninhalt der
Fläche unter dem Graphen von f bestimmt. Dies kann wie folgt motiviert werden. Zu jeder
Zerlegung Z, die durch (1) gegeben sei, und jedem Zwischenwertsystem Ξ kann man eine soganannte Treppenfunktion fZ,Ξ durch fZ,Ξ (t) = f (ξi ) für ai−1 ≤ t < ai definieren, wobei auch
t = b = am im Falle i = m zugelassen wird. Offenbar ist σ(Z, Ξ, f ) der Inhalt der Fläche unter
dem Graphen dieser Funktion, wobei der Inhalt vorzeichenbehaftet bestimmt wird, also negative Funktionswerte negative Flächeninhalte liefern. Für genügend feine Zerlegungen sollten
diese Flächeninhalte immer bessere Approximationen an den Inhalt der Fläche unter dem Graphen von f darstellen, jedenfalls für gutartige“ Funktionen f . Dies motiviert
R b die Definition
”
des (vorzeichenbehafteten) Inhalts der Fläche unter dem Graphen von f als a f (t) dt.
Definition 3. Seien a < c < b reelle Zahlen, I = [a, b], I ′ = [a, c] und I ′′ = [c, b]. Seien
(Z′ , Ξ′ ) : a = a′0 ≤ ξ1′ ≤ a′1 ≤ . . . ≤ ξn′ ′ ≤ a′n′ = c
(Z′′ , Ξ′′ ) : c = a′′0 ≤ ξ1′′ ≤ a′′1 ≤ . . . ≤ ξn′′′′ ≤ a′′n′′ = b
zwei Riemannsche Zerlegungen von I ′ und I ′′ . Wir definieren (Z′ , Ξ′ ) ◦ (Z′′ , Ξ′′ ) durch die Folgen
′
′′
n′ +n′′
(ai )i=0
und (ξi )ni=1+n mit

′

0 ≤ i < n′
a i
ai = a′n′ = a′′0 i = n′

a′′
n′ < i ≤ n′ + n′′
i−n′
44
(
ξi′
ξi =
′′
ξi−n
′
1 ≤ i ≤ n′
n′ < i ≤ n′ + n′′ .
Bemerkung 2.
• Mit anderen Worten handelt es sich bei (Z′ , Ξ′ ) ◦ (Z′′ , Ξ′′ ) darum,
(Z′′ , Ξ′′ ) von rechts an (Z′ , Ξ′ ) anzuhängen“.
”
• Wenn δ eine Integraleichung auf I und I ′ ⊆ I ein abgeschlossenes Teilintervall ist, so
ist δ |I ′ eine Integraleichung auf I ′ . Wir nennen eine Zerlegung von I ′ δ-fein, wenn sie
δ |I ′ -fein ist.
Fakt 2.
• In der Situation von Definition 3 ist (Z′ , Ξ′ ) ◦ (Z′′ , Ξ′′ ) genau dann δ-fein,
wenn (Z′ , Ξ′ ) und (Z′′ , Ξ′′ ) beide δ-fein sind.
• In der Situation von Definition 3 gilt
(6)
σ (Z′ , Ξ′ ) ◦ (Z, Ξ), f ) = σ(Z′ , Ξ′ , f ) + σ(Z′′ , Ξ′′ , f )
für jede Funktion f auf I.
• Wenn δ eine Integraleichung auf I ist, so existiert eine δ-feine Zerlegung (Z, Ξ) von I.
• Wenn δ 1 , . . . , δ n endlich viele Integraleichungen für I sind, so ist auch δ = min(δ 1 , . . . , δ n ),
definiert als
δ(x) = min δ 1 (x), . . . , δ n (x) ,
eine Integraleichung für I. Wenn (Z, Ξ) δ-fein ist, so ist (Z, Ξ) auch δ i -fein, für 1 ≤ i ≤ n.
• Das Henstock-Kurzweil-Integral einer Funktion ist, falls es existieren sollte, eindeutig
bestimmt.
Beweis. Der erste, zweite und vierte Punkt sind ziemlich einfach. Für den dritten Punkt
verwenden wir ein Halbierungsargument ähnlich dem Beweis von Satz .2.4.3 oder Satz .2.4.6.
Dazu nehmen wir an, daß keine δ-feine Zerlegung von I existiert und konstruieren induktiv
eine Folge von Intervallen In = [an , bn ] mit folgenden Eigenschaften:
• a = a0 ⊆ a1 ⊆ a2 . . . ⊆ b2 ⊆ b1 ⊆ b0 = b.
• bn − an = 2−n (b − a).
• Es gibt keine δ-feine Zerlegung von In .
Ähnlich wie beim Beweis der zitierten Sätze findet man, daß die Limites limn→∞ an und
limn→∞ bn existieren und übereinstimmen. Wir bezeichnen beide Limites mit ξ. Für genügend
große n gilt dann an > ξ − δ(ξ)/2 und bn < ξ + δ(ξ)/2. Dann aber ist an ≤ ξ ≤ bn eine δ-feine
Zerlegung von In , im Widerspruch zum dritten Punkt.
Zur Konstruktion der Intervallfolge geht man induktiv vor. Sind die Ik mit k ≤ n schon
konstruiert, so daß alle drei Punkte für die bereits konstruierten Intervalle gültig sind, so setzt
n
, In′ = [an , cn ] und In′′ = [cn , bn ]. Nach der ersten Aussage des Faktes muß es für
man cn = an +b
2
mindestens eines dieser Intervalle keine δ-feine Zerlegung geben, denn sonst erhielte man durch
Aneinanderhängung dieser Zerlegungen eine δ-feine Zerlegung für I. Man setzt also In+1 = In′ ,
falls für In′ keine δ-feine Zerlegung existiert. Andernfalls setzt man In+1 = In′′ . Man macht sich
leicht klar, daß alle drei Bedingungen an die Intervalle auch für I0 , . . . , In+1 gelten.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
45
Rb
Die dritte Aussage ist damit bewiesen. Zum Beweis der letzten nimmt man an, daß a f (t) dt
sowohl gegen ι1 als auch gegen ι2 konvergiert und ι1 6= ι2 gilt. Dann ist ε = |ι1 − ι2 | /2 positiv,
und es gibt Eichungen δ i mit
|ιi − σ(Z, Ξ, f )| < ε
(+)
für alle δ i -feinen Zerlegungen. Sei δ = min(δ 1 , δ 2 ), nach dem dritten Punkt gibt es eine δ-feine
Zerlegung. Diese ist auch δ i -fein für i ∈ {1; 2} und erfüllt daher (+) für i = 1 und i = 2. Man
erhält den Widerspruch
2ε = |ι1 − ι2 | ≤ |ι1 − σ(Z, Ξ, f )| + |ι2 − σ(Z, Ξ, f )| < ε + ε = 2ε.
Rb
Ähnlich führt man die Annahmen ad absurdum, daß a f (t) dt sowohl gegen ι konvergiert als
auch bestimmt diviergiert, oder in beide Richtungen bestimmt divergiert.
Man überzeugt sich leicht von der folgenden Tatsache:
Fakt 3. Eine komplexwertige Funktion ist genau dann HK-integrierbar, wenn ihr Realund Imaginärteil HK-integrierbar sind.
Satz 1.
• Die Summe zweier HK-integrierbarer Funktionen sowie das Produkt einer
HK-integrierbaren Funktion mit einer komplexen Zahl λ sind HK-integrierbar, und es
gilt
Z b
Z b
Z b
(7)
g(t) dt
f (t) dt +
(f + g)(t) dt =
a
a
a
Z b
Z b
(8)
(λf )(t) dt = λ
f (t) dt
a
a
• Wenn für zwei reellwertige HK-integrierbare Funktionen f und g auf [a, b] und alle t
aus diesem Intervall f (t) ≤ g(t) gilt, so gilt
Z b
Z b
g(t) dt.
f (t) dt ≤
(9)
a
a
• Für jede komplexwertige HK-integrierbare Funktion f gilt
Z b
Z b
≤
(10)
|f (t)| dt,
f
(t)
dt
a
(11)
a
falls das Integral auf der rechten Seite existiert. Allgemeiner gilt
Z b
Z b
≤
f
(t)
dt
Φ(t) dt,
a
a
falls die Integrale existieren und |f (t)| ≤ Φ(t) auf I gilt.
46
• Es sei f auf I = [a, b] HK-integrierbar, τ eine relle Zahl, ã = a + τ , b̃ = b + τ und
f˜(x) = f (x − τ ). Dann ist f˜ HK-integrierbar, und es gilt
Z b
Z b̃
˜
f (t) dt.
f (t) dt =
a
ã
Beweis von Satz 1. Zum Beweis von (7) wählt man für ε > 0 Eichungen δ̂ und δ̃ mit
Z b
ε
<
σ(Z, Ξ, f ) −
f
(t)
dt
(+)
2
a
für δ̂-feine und
Z b
ε
σ(Z, Ξ, g) −
g(t) dt <
(@)
2
a
Rb
Rb
für δ̃-feine Zerlegungen. Sei ι = a f (t) dt + a g(t) dt, dann gilt, auf Grund von (+), (@) und
(2),
|σ(Z, Ξ, f + g) − ι| < ε
für δ = min(δ̂, δ̃)-feine Zerlegungen. Da ein solches δ für alle ε > 0 gefunden werden kann,
Rb
konvergiert a f (t) + g(t) dt gegen ι, wie behauptet. Mit ähnlichen Argumenten kann auch (8)
gezeigt werden.
Rb
Rb
Zum Beweis von (9) soll die gegenteilige Annahme a f (t) dt > a g(t) dt ad absurdum
Rb
Rb
geführt werden. In diesem Fall ist ε = a f (t) dt − a g(t) dt positiv, man kann δ̂ und δ̃ mit
(+) und (@) wählen, und für eine min(δ̂, δ̃)-feine Zerlegung hat man unter Benutzung von (4)
den Widerspruch
Z b
Z b
Z b
ε
ε
f (t) dt < σ(Z, Ξ, f ) + ≤ σ(Z, Ξ, g) + <
f (t) dt.
g(t) dt + ε =
2
2
a
a
a
Ähnliche Argumente unter Benutzung von (3) zeigen (10) und (11).
Der letzte Punkt bringt die Verschiebungsinvarianz des HK-Integrales zum Ausdruck und
ergibt sich letztlich daraus, daß alle bei der Einführung dieses Integralbegriffes verwendeten
Begriffe und Konstruktionen verschiebungsinvariant sind.
Ein einfaches Beispiel für HK-integrierbare (und auch R-integrierbare) betrachten wir die
konstante Funktion:
Rb
Beispiel 1. Wenn f die konstante Funktion f (x) = φ ist, so gilt a f (t) dt = φ(b − a). In
der Tat gilt
(12)
σ(Z, Ξ, f ) = φ(b − a)
für jede Zerlegung (Z, Ξ) von I = [a, b].
Für andere Funktionen ist es nicht so leicht, die allgemeinen Riemannschen Summen direkt
auszurechnen. Deswegen ist der folgende Satz überaus hilfreich:
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
47
Theorem 1 (2. Hauptsatz der Integral- und Differentialrechnung). Die Funktion f sei
differenzierbar auf I = [a, b], dann gilt
Z b
(13)
f (b) − f (a) =
f ′ (t) dt
a
Bei Zugrundelegung des Riemannschen Integralbegriffes müßte zusätzlich die Existenz der
rechten Seite von (13) als R-Integral geforder werden, was sich nicht allein aus den Voraussetzungen des Theoremes ergibt.
Rb
Beweis. Sei ι = f (b)−f (a), wir zeigen, daß das HK-Integral a f ′ (t) dt gegen ι konvergiert.
Sei dazu ε > 0 vorgegeben. Nach Fakt .3.1.2 gibt es für jedes x ∈ I ein δ(x) > 0 mit
ε
(+)
|f (x) − f (y) − f ′ (x)(x − y)| ≤
· |x − y|
b−a
für y ∈ I und |x − y| ≤ δ(x). Die Zerlegung (Z, Ξ) sei durch a = a0 ≤ ξ0 ≤ a1 ≤ . . . ≤ an−1 ≤
ξn ≤ an = b gegeben und δ-fein, dann ergibt sich
ε
(ai − ai−1 )
(@)
|f (ai ) − f (ai−1 ) − f ′ (ξ)(ai − ai−1 )| ≤
b−a
durch Anwendung von (+) auf x = ξi , y = ai−1 sowie auf x = ξi , y = ai und Addition der
beiden entstehenden Ungleichungen. Summation von (@) über 1 ≤ i ≤ n ergibt
n
n
X ε X
ε
′
f (ai ) − f (ai−1 ) − f (ξ)(ai − ai−1 ) ≤
(b − a) = ε.
(ai − ai−1 ) =
b−a
b−a
i=1
i=1
Auf Grund von
n
X
f (ai ) − f (ai−1 ) = f (b) − f (a) = ι
i=1
n
X
i=1
f ′ (ξ)(ai − ai−1 ) = σ(Z, Ξ, f ′ )
erhält die vorige Ungleichung die Form |ι − σ(Z, Ξ, f ′ )| ≤ ε, was für alle δ-feinen Zerlegungen
gilt. Ein solches δ kann also für alle ε > 0 gefunden werden, so daß das HK-Integral auf der
rechten Seite von (13) in der Tat wie behauptet gegen ι konvergiert.
Damit können schon ziemlich viele Funktionen integriert werden, einfach auf Grund unserer
Kenntnis der Ableitung bestimmter Funktionen.
Definition 4. Die Funktion F ist Stammfunktion von f auf dem Intervall I ⊆ R, wenn F
daselbst differenzierbar mit Ableitung f ist.
Aus dem zweiten Hauptsatz der Integral- und Differentialrechnung folgt unter dieser Voraussetzung
Z d
f (t) dt = F (d) − F (c),
(14)
c
48
falls c, d ∈ I und c < d Rgilt.
Man schreibt auch f (t) dt, und nennt diesen Ausdruck ein unbestimtes Integral, um eine
Stammfunktion von f zu bezeichnen. Das Attribut unbstimmt“ ist dadurch motiviert, daß
”
Stammfunktionen offenbar nicht eindeutig sind. Mit F ist für jede Konstante C auch F + C
eine Stammfunktion von f . Umgekehrt folgt aus (14), daß jede Funktion auf einem Intervall I
mit daselbst verschwindender Ableitung (also jede Stammfunktion von 0) konstant auf I sein
muß. Es ergibt sich also
Fakt 4. Wenn F eine Stammfunktion von f auf I ist, so hat jede andere Stammfunktion
von f auf I die Form F + C, wobei C konstant ist.
Beispiel 2.
R,
(15)
• Für natürliche Zahlen n ist
Z
tn dt =
tn+1
n+1
eine Stammfunktion von tn auf ganz
tn+1
+C
n+1
n+1
• Für ganze Zahlen n 6= −1 ist tn+1 eine Stammfunktion von tn auf jedem in R \ {0}
enthaltenen Intervall. In diesem Sinne gilt (15) auch für negative n 6= −1.
• Die Funktion log |t| ist Stammfunktion von 1t auf jedem in R \ {0} enthaltenen Intervall:
Z
dt
(16)
= log |t| + C
t
a+1
• Für jede komplexe Zahl a 6= −1 ist ta+1 Stammfunktion von ta auf (0, ∞). In diesem
Sinne gilt also (15) auch für komplexe Exponenten n 6= −1.
• Die Exponentialfunktion ist Stammfunktion der Exponentialfunktion auf ganz R:
Z
(17)
exp(t) dt = exp(t) + C
Aus Theorem 1 ergibt sich ziemlich leicht:
Folgerung 1. Die Funktion f sei auf I = [a, b] differenzierbar.
• f ist genau dann monoton wachsend auf I, wenn f ′ (t) ≥ 0 auf I gilt. Falls die Ableitung
von f sogar positiv auf I ist, so ist f streng monoton wachsend. Generell ist f genau
dann streng monoton wachsend, wenn die Ableitung von f auf I nichtnegativ ist und
auf keinem Teilintervall von I, welches positive Länge hat, identisch verschwindet.
• f ist genau dann monoton fallend auf I, wenn f ′ (t) ≥ 0 auf I gilt. Falls die Ableitung
von f sogar negativ auf I ist, so ist f streng monoton wachsend. Generell ist f genau
dann streng monoton fallend, wenn die Ableitung von f auf I nichtpositiv ist und auf
keinem Teilintervall von I, welches positive Länge hat, identisch verschwindet.
Beweis. Offenbar genügt der Nachweis des ersten Punktes. Der zweite geht genauso oder
kann durch Betrachtung von −f auf den ersten zurückgeführt werden.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
49
(y)
Wenn f monoton wachsend auf I ist, so ist der Ausdruck f (x)−f
für y 6= x, x, y ∈ I
x−y
′
nichtnegativ. Da f (x) Grenzwert dieser Differenzenquotienten ist, ist auch f ′ (x) ≥ 0. Gilt
umgekehrt f ′ (t) ≥ 0 für alle t ∈ I, so gilt
Z d
Z d
′
0 dt = f (c)
f (t) dt ≥ f (c) +
f (d) = f (c) +
c
c
auf Grund von (14) und (9), so daß f monoton wachsend auf I ist.
Wenn die Ableitung von f auf einem Teilintervall I ′ ⊆ I positiver Länge verschwindet, so
ist f wegen Fakt 4 konstant auf I ′ und kann daher nicht streng monoton sein. Wenn umgekehrt
f monoton wachsend, aber nicht streng monoton wachsend ist, so gibt es Zahlen c < d aus I
mit f (c) = f (d). Für t ∈ I ′ = [c, d] gilt dann f (c) ≤ f (t) ≤ f (d) = f (c), also ist f konstant
auf I ′ , und die Ableitung von f verschwindet auf I ′ .
Eine andere Anwendung des zweiten Hauptsatzes betrifft lokale Extremstellen.
Definition 5. Die reellwertige Funktion f sei auf einer Umgebung von x ∈ R definiert.
• Wir sagen, daß bei x ein lokales Minimum von f vorliegt, wenn eine Umgebung U
von x mit f (y) ≥ f (x) für alle y ∈ U existiert. Gilt statt dessen f (y) ≤ f (x) unter
derselben Voraussetzung an U und y, so sprechen wir von einem lokalen Maximum. In
beiden Fällen nennen wir x eine lokale Extremstelle von f . Gilt im Fall y 6= x die echte
Ungleichtung f (y) > f (x) bzw. f (y) < f (x) auf einer Umgebung von x, so sprechen
wir von einem strengen lokalen Extremum.
• Wir sagen, daß f bei x das Vorzeichen von nichtnegativen zu nichtpositiven Werten
wechselt, wenn ein ε > 0 existiert, so daß f (y) ≥ 0 für x − ε < y < x und f (y) ≤ 0
für x < y < x + ε gilt. Wird diese Bedingung von −f erfüllt, so sprechen wir für f von
einem Vorzeichenwechsel von nichtnegativen zu nichtpositiven Werten. Gilt sogar die
strenge Ungleichung, sprechen wir von einem strengen Vorzeichenwechsel.
Satz 2. Die reellwertige Funktion f sei auf einer Umgebung von x ∈ R definiert.
• Wenn x eine lokale Extremstelle von f ist und f ′ (x) existiert, so gilt f ′ (x) = 0.
• Wenn f ′ (x) existiert und von 0 verschieden ist, so wechselt die Funktion f (t) − f (x) an
der Stelle x das Vorzeichen streng, und zwar erfolgt im Fall f ′ (x) > 0 der Vorzeichenwechsel von negativen zu positiven und im Fall f ′ (x) < 0 der Vorzeichenwechsel von
positiven zu negativen Werten.
• Es gelte f ′ (x) = 0. Wenn f ′ auf einer Umgebung von x existiert und bei x das Vorzeichen
von nichpositiv zu nichtnegativ wechselt, so hat f bei x ein lokales Minimum. Wechselt
statt dessen das Vorzeichen von f ′ bei x von nichtnegativ zu nichtpositiv, so hat f bei
x ein lokales Maximum. Im Fall eines strengen Vorzeichenwechsels liegt eine strenge
lokale Extremstelle vor.
Beweis. In beiden Fällen genügt es, den Fall lokaler Minima bzw. der Bedingungen dafür
zu betrachten.
Gilt f ′ (x) = ε > 0, so gibt es ein δ > 0 mit |f (t) − f (x) − ε(t − x)| < 2ε |t − x| für
|t − x| < δ. Für derartige t hat dann f (x) − f (x) dasselbe Vorzeichen wie t − x. Ähnlich
50
erledigt man den Fall f ′ (x) < 0, der überdies auch durch Betrachtung von −f auf den vorigen
zurückgeführt werden kann. Der zweite Punkt ist damit bewiesen. Offenbar kann bei x kein
lokales Extremum von f vorliegen, wenn f (t) − f (x) das Vorzeichen wechselt. Der erste Punkt
folgt also auch.
Wenn f ′ bei x das Vorzeichen von nichtpositiv zu nichtnegativ wechselt, so gibt es ein ε > 0
mit f ′ (t) ≤ 0 für x − ε ≤ t ≤ x und f ′ (t) ≥ 0 für x ≤ t ≤ x + ε, und wegen Folgerung 1
ist f monoton fallend auf [x − ε, x] und monoton wachsend auf [x, x + ε]. Für x − ε ≤ t ≤ x
gilt daher f (t) ≥ f (x), und dasselbe gilt auch für x ≤ t ≤ x + ε auf Grund der jeweiligen
Monotonieaussage. Also hat f bei x ein lokales Minimum.
Wir betrachten von nun an auch höhere Ableitungen und benötigen daher die folgende
Definition:
Definition 6. Die Funktion f ist auf einer offenen Untermenge von R einmal differenzierbar, wenn sie daselbst differenzierbar ist. In diesem Fall bezeichnen wir die erste Ableitung mit
f (1) = f ′ . Sei k > 1, und sei (k − 1)-fache Differenzierbarkeit sowie die k − 1-te Ableitung f (k−1)
schon definiert. Wir sagen, daß f k-fach (oder k-mal) differenzierbar ist, wenn f (k − 1)-fach
differenzierbar ist und zusätzlich die k-te Ableitung f (k) = (f (k−1) )′ existiert. Falls f (k) zusätzlich stetig ist, spricht man von k-facher stetiger Differnzierbarkeit (die Stetigkeit von f (j) mit
0 < j < k folgt automatisch aus Satz .3.1.1.
Bemerkung 3. Eine analoge Definition für komplexe Differenzierbarkeit ist nicht erforderlich. Es gilt nämlich der auf den ersten Blick überraschende Satz, daß die Ableitung einer
holomorphen Funktion wieder holomorph ist. Da der Beweis schwierig ist, kann in dieser Vorlesung nicht darauf eingegangen werden.
Satz 3. Die reellwertige Funktion f sei auf einer Umgebung von x ∈ R definiert und
daselbst k-mal differenzierbar, mit k ≥ 0. Es gelte f (l) (x) = 0 für 1 ≤ l ≤ k. Ferner sei f (k+1)
wohldefiniert und von 0 verschieden.
• Im Fall ungerader k liegt eine lokale Extremstelle von f bei x vor, und zwar ein lokales
Minimum im Fall f (k+1) (x) > 0 und ein lokales Maximum im Fall f (k+1) (x) < 0.
• Im Fall gerader k wechselt die Differenz f (t) − f (x) bei t = x das Vorzeichen, und zwar
von negativen zu positiven Werten im Fall f (k+1) (x) > 0 und von positiven zu negativen
Werten im Fall f (k+1) (x) < 0.
Beweis. Wir gehen durch Induktion vor. Der Fall k = 0 ist gerade der zweite Punkt von
Satz 2. Sei k > 0 und die Behauptung für k − 1 statt k bewiesen. Dann ist die Induktionsannahme auf f ′ anwendbar und ergibt im Fall ungerader k einen Vorzeichenwechsel von f ′
bei x. Nach dem dritten Punkt von Satz 2 ist also x eine lokale Extremstelle von f . Im Fall
gerader k ist hingegen f ′ (x) = 0 ein strenger lokaler Extremwert von f ′ , und nach Folgerung 1
ist f in einer Umgebung von x streng monoton, so daß f (t) − f (x) bei t = x einen strengen
Vorzeichenwechsel hat. Man überzeugt sich leicht davon, daß dieses Argument Aussagen über
Vorzeichenwechsel und Extremstellen gerade in die behauptete Richtung liefert.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
51
Als eine letzte Anwendung des Zusammenhanges zwischen Monotonieverhalten und Vorzeichen der Ableitung betrachten die Konvexität von Funktionen:
Satz 4. Sei f auf I = [a, b] reellwertig und differenzierbar, wobei die Ableitung f ′ auf I
monoton wächst. Dann ist f konvex, es gilt also
(18)
f (1 − λ)x + λy ≤ (1 − λ)f (x) + λf (y)
für x, y ∈ I und 0 ≤ λ ≤ 1.
Ist umgekehrt f ′ monoton fallend auf I, so gilt die zu (18) entgegengesetzte Ungleichung
(19)
f (1 − λ)x + λy ≥ (1 − λ)f (x) + λf (y).
Bemerkung 4. Ähnlich wie für Folgerung 1 lassen sich (18) und (19) für streng monotone
Ableitungen f ′ zu strengen Ungleichungen verschärfen, wenn noch x 6= y und 0 < λ < 1 gilt.
Auch kann die Aussage ähnlich wie Folgerung 1 umgekehrt werden. Wir gehen nicht auf die
Details ein.
Vor dem Beweis von Satz 4 halten wir noch die Abschätzung eines Integrales durch das
Produkt aus Länge des Integrationsweges und Maximum bzw. Minimum des Integranden fest:
Fakt 5. Gilt für eine reellwertige Funktion f (x) ≥ m (bzw. f (x) ≤ M ) auf I = [a, b], so
Rb
Rb
gilt a f (t) dt ≥ m(b − a) bzw. a f (t) dt ≤ M (b − a).
Beweis von Satz 4. Es genügt der Beweis der Aussage über Konvexität, denn die zweite
Aussage kann mit analogen Mitteln bewiesen oder durch Betrachtung von −f auf diesen Fall
zurückgeführt werden.
Wir dürfen beim Nachweis von (18) ohne Beschränkung der Allgemeinheit x < y annehmen,
denn im Fall x = y ist die Behauptung trivial und generell ändert sich keine der beiden Seiten
von (18) bei Vertauschung von x und y und gleichzeitiger Ersetzung von λ durch 1 − λ.
Sei also x < y und z = (1 − λ)x + λy, dann gilt
Z z
f ′ (ξ) dξ ≤ λ(z − x)f ′ (z) = λ(1 − λ)(y − x)f ′ (z)
(+) λ f (z) − f (x) = λ
x
Z y
′
f ′ (ξ) dξ = (1 − λ) f (y) − f (z) .
= (1 − λ)(y − z)f (z) ≤ (1 − λ)
z
Durch Addition von λf (x) + (1 − λ)f (z) zu beiden Seiten ergibt sich (19).
3.3. Das Verhalten der Exponentialfunktion im Komplexen. Wir beginnen mit
Fakt 1. Es gilt exp(z) = exp(z) für beliebige komplexe Zahlen z.
Beweis. In der Tat, aus den Rechenregeln für komplexe Gernzwerte folgt
exp(z) =
∞
X
zn
n=0
n!
=
∞
X
zn
n=0
n!
=
∞
X
zn
n=0
n!
= exp(z).
52
Satz 1. Für komplexe Zahlen z gilt |exp(z)| = exp(ℜz).
Beweis. In der Tat, es gilt
2
|exp(z)| = exp(z)exp(z) = exp(z) exp(z) = exp(z + z) = exp(2ℜ(z)) = exp ℜ(z)
Folgerung 1. Für jede reelle Zahl t hat die komplexe Zahl exp(it) den Betrag 1.
Wir wollen den Real- und den Imaginärteil von exp(it) genauer untersuchen. Es gilt:
und
exp(it) + exp(−it)
exp(it) + exp(−it)
=
= cos(t)
ℜ exp(it) =
2
2
exp(it) − exp(−it)
exp(it) − exp(−it)
ℑ exp(it) =
=
= sin(t),
2i
2i
wenn der Kosinus und der Sinus einer komplexen Zahl z durch
exp(iz) + exp(−iz)
(1)
cos(z) =
2
exp(iz) − exp(−iz)
sin(z) =
(2)
2i
definiert sind. Durch eine einfache Rechnung leitet man die Additionstheoreme für die Winkelfunktionen her, ebenso wie
sin′ = cos
(3)
cos′ = sin
und
(4)
sin(−z) = − sin(z)
cos(−z) = cos(z)
und die Potenzreihenentwicklung
(5)
cos(x) =
∞
X
(−1)k
x2 k
(2k)!
(−1)k
x2k+1
.
(2k + 1)!
k=0
(6)
sin(x) =
∞
X
k=0
Satz 2.
• Für 0 ≤ x ≤ 2 gilt sin(x) > 0.
• Es gibt genau eine Zahl π mit 0 ≤ π ≤ 4 und cos(π/2) = 0. Für diese Zahl gilt
sin(π) = 0, cos(π) = −1.
|x2 |
Beweis. Im Fall 0 ≤ x ≤ 2 ist wegen (2k)(2k+1) ≤ 1 für k ≥ 1 die Folge der Beträge der
Summanden der alternierenden Reihe (6) monoton fallend. Es gilt also nach dem zweiten Teil
von Satz .2.3.2
x2 x
x3
≥ >0
≥x 1−
sin(x) ≥ x −
6
6
3
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
53
für 0 < x ≤ 2. Wegen (3) und nach Folgerung .3.2.1 ist also cos auf [0, 2] streng fallend und
hat dort höchstens eine Nullstelle.
Um die Existenz einer Nullstelle zu zeigen, genügt der Nachweis von cos(2) < 0. Wegen
x2
< 1 für reelle x und |x| ≤ 2 und k ≥ 1 gilt, nach Anwendung des zweiten Teiles
(2k+1)(2k+2)
P
k x2 k
von Satz .2.3.2 auf die Reihe ∞
k=1 (−1) (2k)! , die Ungleichung
cos(x) ≤ 1 −
x2 x4
+
2
24
= − 31 < 0.
für derartige x, also cos 2 ≤ 1 − 2 + 16
24
Die übrigen Aussagen folgen aus den Additionstheoremen.
Satz 3.
• Die Funktion sin bildet das Intervall [−π/2, π/2] bijektiv auf [−1, 1] ab. Die
Umkehrfunktion arcsin ist stetig, ihre Ableitung ist auf (−1, 1) durch
1
arcsin′ (x) = √
1 − x2
gegeben.
• Die Funktion cos bildet das Intervall [0, π] bijektiv auf [−1, 1] ab. Die Umkehrfunktion
arccos ist stetig, ihre Ableitung ist auf (−1, 1) durch
1
arccos′ (x) = − √
1 − x2
gegeben.
Offenbar gilt arccos(x) + arcsin(x) = π/2.
Bemerkung 1. Natürlich ist die Wahl der beiden Intervalle willkürlich, etwa kann [−π/2, π/2]
im ersten Teil der Behauptung kann [−π/2, π/2 durch [k − π/2, k + π/2] ersetzt werden. Die
entsprechenden Umkehrfunktionen sind dann arcsink (x) = arcsin(x) + kπ für gerade und
arcsink (x) = (k + 1)π − arcsin(x) für ungerade k. Entsprechende Aussagen gelten auch für
den Cosinus.
Definition 1. Für eine komplexe Zahl z = x + iy mit x > 0 im Falle y = 0 sei log(z) die
eindeutig bestimmte komplexe Zahl mit exp(log(z)) = z und −π/2 < ℑ(log(z)) < π/2.
Satz 4. Diese Definition ist korrekt, es gibt also unter den angegebenen Voraussetzungen
and z genau eine komplexe Zahl log(z) mit den beschriebenen Eigenschaften. Der so definierte
Logarithmus ist stetig auf C − R≤0 .
Bemerkung 2. Der soeben definierte Logarithmus ist stetig (sogar holomorph) auf der
entlang der negativen rellen Achse aufgeschlitzten koplexen Ebene. Auf dieses Aufschlitzen
kann nicht verzichtet werden, es gibt also keine Möglichkeit, einen stetigen Logarithmus für von
0 verschiedene komplexe Zahlen zu definieren. Der Zusammenhang zwischen dem komplexen
Logarithmus und dem Arkussinus kann auch als
√
arcsin(x) = log ix + 1 − x2
54
formuliert werden.
√
arccos(x) = log x + i 1 − x2
Wir wollen nun die Funktionen
sin(s)
cos(s)
cos(s)
cot(s) =
sin(s)
tan(s) =
untersuchen, die durch tan(s) cot(s) = 1 verknüpft sind und die Periode π haben. Eine einfache
Rechnung ergibt
1
tan′ (s) =
(7)
= 1 + tan2 (s)
cos2 (s)
1
(8)
= −1 − cot2 (s)
cot′ (s) = − 2
sin (s)
tan(x) + tan(y)
tan(x + y) =
(9)
1 − tan(x) tan(y)
cot(x) cot(y) − 1
(10)
cot(x + y) =
cot(x) + cot(y)
Satz 5. Die Funktion tan bildet (−π/2, π/2) bijektiv auf R ab. Die Umkehrfunktion arctan
ist stetig, ihre Ableitung ist durch
1
arctan′ (x) =
1 + x2
gegeben. Es gilt
1 + ix 1
arctan(x) = log
.
2i
1 − ix
Zuweilen trifft man auch die Hyperbelfunktionen
exp(x) − exp(−x)
2
exp(x) + exp(−x)
cosh(x) =
2
sinh(x)
exp(x) − exp(−x)
tanh(x) =
=
cosh(x)
exp(x) + exp(−x)
sinh(x) =
an. Es gilt
cosh2 (z) − sinh2 (z) = 1
sinh(x + y) = sinh(x) cosh(y) + cosh(x) sinh(y)
cosh(x + y) = cosh(x) cosh(y) + sinh(x) sinh(y)
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
55
tanh(x) + tanh(y)
1 + tanh(x) tanh(y)
1 + coth(x) coth(y)
coth(x + y) =
coth(x) + coth(y)
′
sinh (x) = cosh(x)
tanh(x + y) =
cosh′ (x) = sinh(x)
1
= 1 − tanh2 (x)
tanh′ (x) =
2
cosh (x)
1
coth′ (x) = −
= 1 − coth2 (x).
2
sinh (x)
Die Umkehrfunktionen sind
√
x2 − 1
für x ≥ 1
√
arsinh(x) = log x + x2 + 1
1+x
1
für |x| < 1
artanh(x) = log
2
1−x
x−1
1
für |x| > 1
arcoth(x) = log
2
x+1
arcosh(x) = log x +
mit den Ableitungen
arcosh′ (x) = √
1
x2
−1
1
1 + x2
1
artanh′ (x) =
1 − x2
1
arcoth′ (x) =
.
1 − x2
arsinh′ (x) = √
3.4. Methoden der Berechnung von Stammfunktionen. Eine Stammfunktion
F von
R
f bezeichnet man als ein unbestimmtes Integral von f und schreibt F = f (t) dt. Daß die
Stammfunktion nur bis auf Addition einer Konstanten eindeutig ist, drückt man in der folgenden Tabelle durch die Addition einer frei wählbaren Integrationskonstanten C aus:
Beispiel 1 (Tabelle der Grundintegrale). Für s 6= −1 sowie unter der Bedingung x > 0
für nicht ganzzahlige s sowie x 6= 0 für negative ganzzahlige s gilt:
Z
xs+1
s
+ C.
(1)
x dx =
s+1
Die Bedingung x 6= 0 ist so zu verstehen, daß das Integrationsintervall die Zahl 0 nicht enthalten
darf, aber die rechte Seite von (1) eine Stammfunktion für xs mit negtivem ganzen s auf jedem
56
Teilintervall von (−∞, 0) oder (0, ∞) liefert. Unter genau derselben Bedingung gilt
Z
dx
(2)
= log(|x|) + C.
x
Außerdem hat man die Stammfunktionen
Z
(3)
exp(x) dx = exp(x) + C
Z
sin(x) dx = − cos(x) + C
Z
cos(x) dx = sin(x) + C
Z
dx
(4)
= arctan(x) + C
1 + x2
auf ganz R sowie
(5)
Z
√
dx
= arcsin(x) + C
1 − x2
auf [−1, 1].
Zum Beweis dieser Behauptungen genügt die Bemerkung, daß in jedem der Beispiele die
Ableitung der rechten Seite in den letzten Abschnitten bestimmt wurde und mit der linken
Seite übereinstimmt.
Für die praktische Beherrschung der Integralrechnung ist es notwendig, sich diese Tabelle
von Grundintegralen einzuprägen. Aus den Formeln für die Ableitung der Hyperbelfunktionen
und ihrer Umkehrung könnten weitere Grundintegrale hergeleitet werden. Das erübrigt sich
aber an dieser Stelle, da die betreffenden Stammfunktionen auch durch eine Anwendung der
weiter unten angegebenen Integrationsrezepte für bestimmte Klassen von speziellen Integranden berechnet werden können.
Leider ist es nicht immer möglich, einen in elementarer Form gegebenen Integranden in
einer genauso elementaren Form darzustellen. Beispiele dafür sind
Z
exp(−x2 ) dx
oder der Integrallogarithmus
dx
.
log x
Die Stammfunktionen des zuerst genannten Integranden besitzten große Bedeutung in der
Wahrscheinlichkeitsrechnung und werden bis auf einen Normierungsfaktor in den gängigen
Bibliotheken zur Programmiersprache C durch die Funktionen erf und erfc implementiert. In
vielen anderen Fällen ist man auf numerische Integrationsverfahren angewiesen, die hier nicht
näher erklärt werden können.
Z
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
57
Trotzdem ergeben sich aus dem Hauptsatz der Integral- und Differentialrechnung und aus
den Grundregeln für die Berechnung von Ableitungen verschiedene Grundregeln für die Umformung von Integralen, durch deren Anwedung Integrationsaufgaben oft vereinfacht werden
können. Allerdings erfordert dies meist mehr Kreativität als die Anwendung der Grundregeln
für das Differenzieren. Diesen Sachverhalt drückt das Mathematikersprichwort aus: Differenzieren ist ein Handwerk, aber Integrieren ist eine Kunst.
Als triviale Konsequenz aus (.3.1.2) sowie (.3.1.3) mit einem konstanten Faktor g ergibt
sich
Fakt 1. Wenn F und G Stammfunktionen der stetigen Funktionen f und g sind, so ist
F ± G eine Stammfunktion für f ± g, und für jede relle oder komplexe Konstante λ ist λF eine
Stammfunktion für λf .
Leider gibt es keine allgemein anwendbare Regel, die die Integration eines Produktes zweiter
nichtkonstanter Funktionen ermöglicht, deren Stammfunktionen bekannt sind. Aus der Regel
für das Differenzieren eines Produktes ergibt sich statt dessen die folgende Integrationsmethode,
deren Anwendung wesentlich mehr Fingerspitzengefühl erfordert:
Satz 1 (Partielle Integration). Seien f und g rell- oder komplexwertige differenzierbare
Funktionen auf I = [a, b]. Dann gilt
Z
Z
′
(6)
f (t)g (t) dt = f (t)g(t) − f ′ (t)g(t) dt.
Diese Formel ist so aufzufassen, daß für jede Wahl der Stammfunkion auf der rechten Seite
diese eine Stammfunktion des Integranden auf der linken Seite ist und daß für jede Wahl der
Stammfunktion auf der linken Seite die Stammfunktion auf der rechten Seite so gewählt werden
kann, daß die Gleichung gilt. Insbesondere existiert das unbestimmte Integral auf der rechten
Seite genau dann, wenn das unbestimmte Integral auf der rechten Seite existiert. Für bestimmte
Integrale ergibt sich die Regel
Z b
Z b
′
(7)
f (t)g (t) dt = f (b)g(b) − f (a)g(a) −
f ′ (t)g(t) dt
a
a
wobei das Integral auf der rechten Seite genau dann existiert, wenn das Integral auf der linken
Seite existiert.
Beweis. Nach der Produktregel der Differntialrechnung (.3.1.3) ist f g auf I differenzierbar
mit Ableitung f ′ g + f g ′ . Ist a eine Stammfunktion von f ′ g, so gilt (f g − a)′ = f g ′ , also ist
f g − a eine Stammfunktion von f g ′ . Analog ist f g − b eine Stammfunktion von f ′ g, wenn b
eine Stammfunktion von f g ′ ist. Unsere Behauptung über (6) ist damit gezeigt.
Wegen (f g)′ = f ′ g + f g ′ gilt
Z b
f (t)g ′ (t) + f ′ (t)g(t) dt = f (b)g(b) − f (a)g(a).
a
Unsere Behauptung (7) ergibt sich nun aus (.3.2.7) und (.3.2.8)
58
Beispiel 2. Durch partielle Integration (mit f (x) = log(x), g(x) = x) kann der Logarithmus integriert werden:
Z
Z
Z
′
(8)
log(t) dt = t log(t) − t log (t) dt = t log(t) −
dt = t log(t) − 1 = t(log(t) − 1).
k+1
Für k ≥ 1 ergibt sich entsprechend mit f (t) = log(t), g(t) = tk+1 :
Z
Z
tk+1
1
1
tk+1
k
(9)
t log(t) dt =
log(t) −
(log(x) −
),
tk dt =
k+1
k+1
k+1
k+1
Ähnlich gilt
(10)
Z
k
k
t exp(t) dt = t exp(t) − k
Z
tk−1 exp(t) dt,
was eine Behandlung derartiger Integranden durch Induktion nach k ermöglicht. Eine analoge
Vorgehensweise ist auch dann möglich, wenn die Funktion exp durch eine der Funktionen sin
oder cos eretzt wird.
Satz 2 (Substitution). Die differenzierbare Funktion φ bilde [a, b] nach einem Intervall
I ⊆ R ab, auf dem eine reell- oder komplexwertige Funktion f mit der Stammfunktion F
gegeben sei. Dann ist F (φ(x) eine Stammfunktion von f (φ(x))φ′ (x), es gilt also
Z b
Z φ(b)
′
f (φ(x))φ (x) dx =
F (t) dt
a
φ(a)
Der Beweis ergibt sich aus Theorem 1 und der Tatsache, daß nach der Kettenregel der
Differentialrechnung die Ableitung von F (φ(x)) durch f (φ(x))φ′ (x) gegeben ist.
Bemerkung 1. Die Anwendung der Substitionsregel prägt man sich gut durch formale
Rechnungen ein, bei denen sich Zähler und Nenner des Differentialquotienten verselbständigen,
wie
Z
Z
dφ
f (φ) dx = f (φ) dφ.
dx
Es kann hier nicht darauf eingegangen werden, wie man Ausdrücken wie df und dφ einen
eigenständigen Sinn verleiht.
Beispiel 3.
• Seien a 6= 0 und b relle Zahlen, wenn F eine Stammfunktion für f ist,
so ist a1 F (ax + b) eine Stammfunktion für f (ax + b). Auf diese Weise können Integranden durch Verschiebung und Skalierung oft auf eines der Grundintegrale zurückgeführt
werden, zum Beispiel
Z
(2003 + 2004)2006
.
(2003t + 2004)2005 dt =
2003 · 2006
• Oft kann die Substitutionregel mit f (x) = log(|x|), φ(x) = a(x) angewendet werden.
Sie ergibt dann
Z ′
a
(t) dt = log(|a(t)|) + C.
a
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
59
′
(11)
Den Ausdruck aa (t) nennt man logarithmische Ableitung von a. Hinter manchen Integranden verbirgt sich eine solche logarithmische Ableitund, zum Beispiel
Z
tan(t) dt = − log(|cos(t)|)
Z
cot(t) dt = log(|sin(t)|),
wovon man sich leicht durch Ausrechnen der logarithmischen Ableitungen des Sinus oder
Cosinus überzeugt. Das Integrationsintervall darf keine Punkte enthalten, an denen die
Winkelfunktion auf der rechten Seite verschwindet, also keine halb- bzw. ganzzahligen
Vielfachen von π.
• Die Stammfunktion von x exp(x2 ) kann durch die Substitution t = x2 , dt = 2x dx,
x dx = dt2 als
Z
1
exp(t)
1
= exp(x2 ).
exp(t), dt =
2
2
2
Das Rezept ist allgemein auf Integranden der Form tf (t2 ) anwendbar, wenn die Stammfunktion von f bekannt ist. Im Gegensatz dazu sind die Stammfunktionen von exp(±t2
nicht in geschlossener Form durch elementare Funktionen darstellbar, wie schon bemerkt
wurde.
Im Folgenden sollen Regeln zur Berechnung der wichtigsten unbestimmten Integrale gegeben werden, die sich auf die Integration rationaler Funktionen zurückführen lassen. Wir
beginnen mit der Integration rationaler Funktionen durch Partialbruchzerlegung.
P
k
Ein Polynom in einer Variablen ist eine Funktion der Form P (t) = ∞
k=0 pk T , wobei nur
endlich viele der Koeffizienten pk von 0 verschieden sein dürfen. Das größte k mit pk 6= 0
nennt man den Grad und pk den führenden Koeffizienten von P , wobei man vereinbart, daß
der Grad des Nullpolynomes −∞ ist. Falls die pk ihrerseits Polynome in einer Variablen S sind,
spricht man von einem Polynom in den zwei Variablen S und T . Entsprechend definiert man
induktiv, was man einem Polynom in mehr als zwei Variablen versteht. Wir werden aber nur
den Fall von ein oder zwei Variablen benötigen. Unter einer rationalen Funktion versteht man
einen Quotienten zweier Polynome, wobei der Nenner nicht das Nullpolynom sein darf. Ein
derartiger Quotient definiert eine beliebig oft differenzierbare Funktion auf dem Komplement
der Nullstelenmenge des Nenners.
Die Integration von rationalen Funktionen einer Variablen beginnt damit, daß man den
Bruch durch Polynomdivision mit Rest vereinfacht. Die Polynomdivision mit Rest ermöglicht
es, zu zwei Polynomen A, B 6= 0 Polynome Q und R mit P = QB + R zu finden, wobei
der Grad von R kleiner als der Grad von P ist. Die Vorgehensweise besteht darin, daß man
durch absteigende Induktion sukzessive die Koeffizienten von Q so festlegt, daß der führende
Koeffizient von P anulliert wird, bis nur noch ein Polynom von kleinerem Grad als B verbleibt.
Beispielsweise für A(t) = T 4 , B(t) = t2 + 1:
A(T ) = T 2 B(T ) − T 2 = (T 2 − 1)B(T ) + 1,
60
also Q(T ) = T 2 − 1, R(T ) = 1. Man kann sich die Prozedur durch ein ähnliches Schema wie
bei der Division ganzer Zahlen mit Rest veranschaulichen.
Die Polynomdivision mit Rest erlaubt es, jede rationale Funktion einer Variablen als
A(T )
R(T ) =
+ P (T )
B(T )
P
pk
k+1
,
zu schreiben, wobei A einen kleineren Grad als B hat. Die Stammfunktion von P ist ∞
k=0 k+1 T
wobei pk der k-te Koeffizient von P ist. Es verbleibt die Integration des ersten Summanden
auf der rechten Seite. Man kann zeigen, daß B(T ) in Linearfaktoren zerfällt, also
m
Y
(12)
B(T ) =
(T − βi )ki
i=1
mit natürlichen Zahlen ki > 0 und paarweise verschiedenen komplexen Zahlen βi . Diese Tatsache ist als Fundamentalsatz der Algebra bekannt. Wenn B in der obigen Weise dargestellt wird
und A einen kleineren Grad als B hat, kann die Partialbruchzerlegung des Quotienten A/B als
m
(13)
k
i
XX
A
αi,j
(T ) =
B
(T − βi )j
i=1 j=1
angesetzt werden.
Beispielsweise ist die Partialbruchzerlegung von
1
x3 −x
als
A
B
C
1
= +
+
−x
x x−1 x+1
3
anzusetzen. Nach Multiplikation mit x − x = x(x − 1)(x + 1) kommt
x3
(14)
1 = A(x − 1)(x + 1) + Bx(x + 1) + Cx(x − 1)
zunächst auf R − {0; ±1}, was aus Stetigkeitsgründen auch auf ganz R gilt. Setzt man x = 0,
so kommt A = −1. Durch Einsetzen von x = 1 erhält man B = 21 und mit x = −1 kommt
C = 12 , wobei jeweils nur einer der Summanden auf der linken Seite von 0 verschieden ist. Wir
erhalten
Z
Z
(x − 1)(x + 1) dx
1
1
1
1
2
.
dx = log =
+
−
x3 − x
2
x−1 x+1 x
2
x2
Eine analoge Vorgehensweise ist auch bei ähnlichgearteten Aufgaben möglich: Multiplikation
mit dem Nennerpolynom und Auswerten der entstehenden, zu (14) analogen Polynomgleichung
an den Nullstellen des Nennerpolynomes. Hat des Nennerpolynom Nullstellen höherer Ordnung
(also ki > 1 in (12)), so sind auch die ersten und höheren Ableitung des Analogons zu (14) an
diesen Stellen auszuwerten, und zwar alle Ableitungen bis zum Grade ki −1 an der Stelle βi . Die
Prozedur entpricht der Polynominterpolation, die in Bulirsch/Stoer, Numerische Mathematik,
Band 1 beschrieben wird. In den Aufgaben werden nur sehr einfache Spezialfälle auftreten, die
mit den obigen Hinweisen leicht gelöst werden können.
Leider kann auch für rellwertige Integranden nicht ausgeschlossen werden, daß unter den βi
in (12) komplexe Zahlen auftauchen. In diesem Fall möchte man natürlich einen Ausdruck für
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
61
die Stammfunktion erhalten, der ebenfalls nur relle Funktionen enthält. Die Stammfunktion
der Summanden mit j > 1 in (13) ist auch für nicht relle βi durch
Z
dT
1
αi,j
αi,j
·
=
j
(T − βi )
j + 1 (T − βi )j+1
gegeben, wie man durch Differenzieren der rechten Seite leicht einsieht. Die Summe dieser
Ausdrücke über alle (i, j) mit j > 1 ergibt eine rationalen Funktion mit reellen Koeffizienten.
Eine Stammfunktion der Summanden mit j = 1 ist durch den komplexen Logarithmus gegeben,
etwa
Z
dT
= αi,1 log(T − βi ),
αi,1
T − βi
was für nicht relle βi eine Stammfunktion auf ganz R liefert. Man kann zeigen, daß sich die
Summe dieser Ausdrücke durch relle Logarithmen und Arkusfunktionen ausdrücken läßt. Zu
jeder echt komplexen Nullstelle βi gibt es nämlich ein k mit βk = βi , es gilt αi,j = αk,j , und
die Linearkombination der komplexen Logarithmen kann als
αi,1 log(T − βi ) + αi,1 log(T − βi )
T − ℜ(βi,1 ) +C
= ℜ(αi,1 ) log (T − ℜ(βi ))2 + ℑ(βi )2 − 2ℑ(αi,1 ) arctan
ℑ(βi,1 )
dargestellt werden, wobei C = ±πℑ(αi,1 ) (wobei das Vorzeichen vom Vorzeichen von ℜ(βi,1 )
abhängt) in die frei wählbare Integrationskonstante C der Stammfunktion assimiliert werden
kann. In den Aufgaben werden aber nur einfche Fälle auftauchen, die man durch Verschiebung
oder Translation auf eines der Integrale
Z
t dt
1
= log(1 + t2 ) + C
2
1+t
2
Z
dt
= arctan(t) + C
1 + t2
zurückführen kann. Auch für praktische Rechnungen kann es die beste Vorgehensweise sein,
die Summanden mit j = 1 in der Partialbruchentwicklung zu derartigen Integranden zusammenzufassen.
Einige andere Klassen von unbestimmten Integralen lassen sich relativ leicht auf den soeben
beschriebenen
Fall rationaler Funktionen zurückführen. Zu den einfachsten derartigen Fällen
R
t
gehört R(e ) dt mit einer rationalen FunktionR R. Substituiert man x = et , so ergibt sich
= et = x das unbestimmte Integral R(x) dx
, wobei der Integrand eine rationale
wegen dx
dt
x
Funktion ist. Zum Beispiel:
Z
Z
Z
s dt
ds
1
1 + C = t − log(et + 1) + C
=
=
−
ds = log et + 1
s(s + 1)
s s+1
s + 1
Etwas komplizierter sind Integrale von rationalen Funktionen
in den Winkelfunktionen. Die
R
allgemein anwendbare Substitution zur Berechnung von R(sin φ, cos φ) dφ ist t = tan(φ/2).
62
2
2t
1−t
dt
= 1 + t2 , sin(φ) = 1+t
Es gilt 2 dφ
2 , cos φ = 1+t2 , womit das Integral auf die Berechnung der
Stammfunktion einer rationalen Funktion zurückgeführt ist:
Z
dt
2t 1 − t2
,
)
.
2 R(
2
2
1 + t 1 + t 1 + t2
Beispielsweise ergibt sich durch Anwendung dieses Integrationsrezeptes
Z
Z
Z
dt
2t −1 dt
dφ
=2 (
)
=
= log(|t|) + C = log |tan(φ/2)| + C.
2
2
sin φ
1+t
1+t
t
Manchmal führt bei derartigen
Aufgaben auch eine andere Substitution zum Ziel.
R
R Zum Beispiel
kann für Integrale der Art cos(φ)R(sin φ) dφ die Substitution x = sin φ und für sin(φ)R(cos φ) dφ
die Substitution x = cos φ verwendet werden. Dieser Fall tritt genau dann ein, wenn R(−x, y) =
−R(x, y) bzw. R(x, −y) = −R(x, y) gilt. Im Fall R(−x, −y) = R(x, y) kann der Integrand als
R(sin φ, cos φ) = R1 (cos2 φ, tan φ) dargestellt und t = tan φ substituiert werden.
Eng mit diesem Beispiel verwandt ist die Berechnung von Integralen der Form
Z
√
R(x, ax2 + bx + c) dx
mit einer rationalen Funktion R. Wir setzen voraus, daß die Quadratwurzel rell ist. Im Fall
a =√b = 0 ist der Integrand eine rationale Funktion von t, und im Fall a = 0, b 6= 0 kann
b
t = bx + c substituiert werden. Wir setzen also a 6= 0 voraus. Ersetzung von x durch λ(x+ 2a
)
mit einem geeigneten Normierungsfaktor λ führt auf einen der folgenden Fälle:
√
√
R
2t
dx
1−t2
1 − x2 = 1+t
• R(x, 1 − x2 ) dx. Man substituiert x = 1+t
2,
2 . Da die Ableitung dt
eine rationale Funktion von t ist,√wird man auf einen rationalen Integranden geführt.
Die Substitution x = sin φ, 1 − x2 = cos φ würde auf den vorher beschriebenen
Fall einer rationalen Funktion in Winkelfunktionen führen, und die in diesem Fall andiesoeben
angegebene Vorschrift.
√
√ Substitution t = tan(φ/2) führt auf
Rwendbare
1+t2
2t
2
2
• R(x, 1 + x ) dx. Man substituiert x = 1−t2 , 1 + x = 1−t
2.
√
R
2 √
2t
1+t
• R(x, x2 − 1) dx. Man substituiert x = 1−t2 , x2 − 1 = 1−t2 .
In jedem der drei Fälle beruht die Existenz der Substition darauf, daß die Lösungsmenge der
Gleichung x2 ± y 2 = ±1 durch rationale Funktionen einer komplexen Veränderlichen parametrisiert werden kann. Für Kurven der Form x2 = P (y) mit einem Polynom P vom Grade
> 2 ist eine derartige Parametrisierung normalerweise nicht mehr möglich. Die entsprechenden Integrale sind die elliptischen oder hyperelliptischen stIntegrale, die sich nicht mehr als
algebraische Ausdrücke in elementaren Funktionen darstellen lassen.
3.5. Anwendung auf gewöhnliche Differentialgleichungen. Eine gewöhnliche Differentialgleichung erster Ordnung für eine Funktion ist eine Gleichung der Form f ′ (t) =
F (t, f (t)). Es sind also Funktionen gesucht, die eine bestimmte Beziehung zu ihrer Ableitung
erfüllen. Im vorliegenden Fall ist es explizit mögliich, die Ableitung durch die Ausgangsfunktion
auszudrücken. Hat die Differentialgleichung hingegen die Form Φ t, f (t), f ′ (t) = 0, so spricht
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
63
man von einer impliziten Differentialgleichung. Es ist auch möglich, n-Tupel f~ von Funktionen
zu betrachten, die eine Gleichung der Form
f ′ (t) = Fi t, f~(t)
i
erfüllen. Man spricht dann von einem Differentialgleichungssystem erster Ordnung, welches in
dem gegebenen Beispiel explizite Form hat.
FÜr die physikalischen Anwendungen sind Differentialgleichungen zweiter Ordnung von besonderer Wichtigkeit, da die Beschleunigung eine zweite Ableitung ist. Die Differentialgleichung
zweiter Ordnung
(1)
f ′′ (t) = F t, f (t), f ′ (t)
ist offenbar äquivalent zu dem Differentialgleichungssystem erster Ordnung
(2)
f ′ (t) = g(t)
g ′ (t) = F t, f (t), g(t)
denn (f, g) löst (2) genau dann, wenn f (1) löst und g die Ableitung von f ist.
Entsprechend können gewöhnliche Differentialgleichungssysteme beliebiger Ordnung auf
gewöhnliche Differentialgleichungssysteme erster Ordnung zurückgeführt werden.
Wir betrachten zunächst gewöhnliche Differentialgleichungen erster Ordnung für eine reellwertige Funktion. Im einfachsten Fall hängt die rechte Seite nur von t, nicht aber von f (t) ab:
f ′ (t) = F (t). In diesem Fall ist unsere Aufgabe also äquivalent zur Auffindung einer Stammfunktion von F . Insbesondere ist die Lösung mehrdeutig, denn wie wir gesehen haben, ist
die Stammfunktion nur bis auf Addition einer Konstanten eindeutig bestimmt. Die Vorgabe
eines Anfangswertes f (a) reicht aber aus, um die Lösung eindeutig zu machen. Es wird sich
herausstellen, daß dies in vielen ähnlichen Fällen, aber durchaus nicht immer, richtig bleibt.
Der nächsteinfache Fall ist der Fall einer Differentialgleichung mit trennbaren Variablen. In
diesem Fall ist die rechte Seite der Differentialgleichung das Produkt einer nur von f (t) und
einer nur von t abhängenden Funktion:
(3)
f ′ (t) = a(f (t))b(t)
Satz 1. Die Funktion a sei positiv oder negativ auf I = [α, β], und b sei auf J = [γ, δ]
definiert. Wir setzen voraus, daß 1/a eine Stammfunktion A auf I und b eine Stammfunktion
B auf J hat. Aus dem Zwischenwertsatz für stetige Funktionen folgt, daß das Bild A(I) von I
unter A ein abgeschlossenes Intervall ist. Sei fo ∈ I und to ∈ J, so daß B(t) + A(fo ) − B(to ) ∈
A(I) für alle t ∈ J gilt. Dann hat (3) mit der Anfangswertbedingung f (to ) = fo genau eine
Lösung, und diese ist durch
(4)
A f (t) = B(t) + A(fo ) − B(to ),
also
(5)
gegeben.
f (t) = A−1 B(t) + A(fo ) − B(to )
64
Beweis.
Der Beweis ist eine Anwendung der Kettenregel: Löst f (3), so erfüllt φ(t) =
A f (t) die Differentialgleichung
−1
φ′ (t) = A′ f (t) f ′ (t) = a f (t) b(t)a f (t) = b(t),
also φ(t) = B(t) + C. Wir haben φ(to ) = A(fo ), also C = A(fo ) − B(to ) und
(+)
φ(t) = B(t) + A(fo ) − B(to ),
also erfüllt f (4).
Umgekehrt wissen wir nach Satz .3.1.4, daß die Umkehrfunktion G = A−1 differnzierbar
ist und G′ (t) = a G(t) erfüllt. Sei φ durch (+) gegeben, dann ist φ differenzierbar mit Ableitung φ′ (t) = b(t). Die durch (5) gegebene Funktion f (t) = G φ(t) ist nach der Kettenregel
differenzierbar mit der Ableitung
f ′ (t) = G′ φ(t) φ′ (t) = a G(φ(t)) b(t) = a f (t) b(t),
und die Bedingung f (to ) = fo ist offenbar auch erfüllt.
Bemerkung 1. Die Vorgehensweise kann man sich durch die folgende Eselsbrücke veranwie ein gewöhnlicher Bruch behandelt wird:
schaulichten, bei der f ′ (t) = df
dt
(6)
df
= a(f )b(t)
dt
df
= b(t) dt
a(f )
Z
Z
df
= b(t) dt,
a(f )
was bis auf die Bestimmung der Integrationskonstante mit (4) übereinstimmt, aber natürlich
im Gegensatz zum Beweis des vorigen Satzes keine exakte Herleitung darstellt.
Beispiel 1. Wir betrachten das Anfangswertproblem
p
(7)
f ′ (t) = f (t)
f (0) = fo
und orientieren unsere Rechnungen an (6):
df
dt
df
√
f
Z
df
√
f
p
2 f
=
p
f
= dt
Z
=
dt
=t+C
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
65
oder
1
f (t) = (t + C)2
4
√
mit C = 2 fo . Offenbar liefert dieses Ergebnis auch im Falle fo = 0 eine Lösung der Differentialgleichung, aber Satz 1 ist nicht mehr anwendbar. In der Tat stellt sich die Eindeu2
tigkeitsaussage des Satzes als falsch heraus, denn neben f (t) = t4 löst auch f (t) = 0 die
Differentialgleichung (7) mit der Anfangswertbedingung f (0) = 0.
(8)
Beispiel 2. Für f ′ (t) = 1 + f (t)2 ergibt sich durch eine ähnliche Rechnung:
df
= 1 + f2
dt
df
= dt
1 + f2
Z
Z
df
=
dt
1 + f2
arctan(f ) = t + C
oder
(9)
f (t) = tan(t + C)
Da der Tangens nicht auf ganz R definiert ist, liegt ein Beispiel einer Differentialgleichung vor,
deren Lösungen nur endliche Lebensdauer“ haben: Jede Lösung wird durch die Dynamik des
”
Systemes in endlicher Zeit nach ∞ getragen.
Bemerkung 2. In den beiden letzten Beispielen war die rechte Seit der Differntialgleichung
eine Funktion von f (t). In diesem Fall ist die Gleichung verschiebungsinvariant, mit f (t) ist
für jede Konstante C auch f (t − C) eine Lösung, was sich auch in (8) und (9) äußert.
Als letztes Beispiel für den Fall trennbarer Variablen betrachten wir eine Differentialgleichung, bei der weder a noch b konstant sind.
Beispiel 3. Wir wollen f ′ (t) =
1+f (t)2
1+t2
lösen und gehen genauso vor wie zuvor:
1 + f2
df
=
dt
1 + t2
df
dt
=
2
1+f
1 + t2
Z
Z
dt
df
=
2
1+f
1 + t2
arctan(f (t)) = arctan(t) + C,
also
t+τ
f (t) = tan arctan(t) + C =
1 − tτ
66
mit τ = tan(C), wobei das Addition aus (.3.3.7) ausgenutzt wurde. Für τ > 0 ist die Lösung
nur für t < τ1 , im Fall τ < 0 nur für t > τ1 definiert. Im Fall τ = 0 gilt f (t) = t.
Auch lineare Differentialgleichungen erster Ordnung für eine Funktion können stets auf
Quadraturaufgaben, maW. auf die Bestimmung von Stammfunktionen, zurückgeführt werden.
Darauf wird im nächsten Abschnitt eingegangen.
Noch schwieriger wird die Situation für allgemeine Differentialgleichungssysteme und für
Differentialgleichungen höherer Ordnung. Die Darstellung der Lösung in geschlossener Form gelingt nur dann, wenn betimmte Typen von Differentialgleichungen vorliegen bzw. eine Zurückführung
auf derartige Typen erraten werden kann. Als Beispiel für eine Differentialgleichung zweiter
Ordnung, für die praktisch stets eine Zurückführung auf Quadraturaufgaben gelingt, betrachten wir die Gleichung
(10)
f ′′ (x) = a f (x) .
Sei A eine Stammfunktion von a, nach Multiplikation mit (10) mit 2f ′ (x) kommt
f ′ (x)f ′′ (x) = A′ f (x) f ′ (x)
1 d ′ 2
d
·
A f (x)
f (x) =
2 dx
dx
oder
f ′ (x)2
(11)
− A f (x) = C
2
Man wird also auf die Differentialgleichung erster Ordnung
q
(12)
f ′ (x) = ± 2C + 2A f (x) ,
wobei freilich die korrekte Wahl des Vorzeichens auf der rechten Seite von (12), das ja z. B.
auch von x abhängen kann, je nach dem konkreten Fall sorgfältige Betrachtungen erfordern
kann.
Übrigens hat (11) die Form eines Erhaltungssatzes,
zumal wenn man den Summanden
f ′ (x)2 /2 als kinetische und den Summanden −A f (x) als potielle Energie (also −A als Po”
tential“ des Kraftfeldes“ a) deutet. Dies ist kein Zufall. Nach einem für Systeme der hier be”
trachteten Art schon von Sophus Lie erkannten, in seiner allgemeinen feldtheoretischen Fassung
nach Emmy Noether benannten Sachverhalt besteht ein Zusammenhang zwischen Symmetrien
des Systemes und Erhaltungsgrößen. Der Zeitunabhängigkeit des Systemes2 entspricht dabei
gerade die Energieerhaltung. Generell spielen Erhaltungssätze dieser Art eine wichtige Rolle
bei der Vereinfachung von Differentialgleichungssystemen, die aus Problemen der Mechanik
entstehen.
2Also
der Translationsinvarianz: Mit f ist für jede Konstante K auch
f (·+K) eine Lösung. Dies ist natürlich
auch für allgemeinere Gleichungen der Form f ′′ (x) = A f ′ (x), f (x) der Fall, aber zur Anwendung des Satzes von Lie-Noether muß eine Zurückführung der Differentialgleichung auf ein sogenanntes Variationsproblem
bekannt sein, die nur in dem von uns betrachteten Spezialfall derart einfach ist.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
67
Wie schon mehrfach angedeutet, gelingt die Zurückführung einer Differentialgleichung auf
Quadraturaufgaben nur in relativ einfachen Spezialfällen. In vielen Fällen ist man auf numerische Verfahren zur Lösung von gewöhnlichen Differentialgleichungen angewiesen. Die theoretische Legitimation dafür liefert der folgende Satz von Picard-Lindelöf:
Theorem 2. Die Funktion F~ sei auf [0, ε) × U mit ε > 0 definiert, wobei U ⊆ Rn offen
und F~ Rn -wertig ist. Wir setzen voraus, daß F~ auf dem angegebenen Definitionsbereich stetig
und in seinem zweiten Argument Lipschitz-stetig ist, also eine Bedingung der Form
~
(13)
F (t, x) − F~ (t, y) ≤ L |x − y|
erfüllt, wobei wir den Betrag von Elementen des Rn als
v
u n
uX
|x| = t
x2
i
i=1
definieren.3
Sei f~o ∈ U . Dann gibt es ein δ ∈ (0, ε], so daß das Anfangswertproblem
(14)
f~′ (t) = F~ t, f~(t)
f~(0) = f~o
genau eine Lösung auf f~ [0, δ) hat. Weiterhin existiert stets ein größtmögliches δ ∈ (0, ε] mit
dieser Eigenschaft. Ist in diesem Fall η > 0 und ~g eine Lösung von (14) auf [0, η), so gilt
η ≤ δ, und ~g ist die Einschränkung von f~ auf [0, η).
Wie wir uns schon in Beispiel 2 und Beispiel 3 klargemacht haben, gibt es im Allgemeinen
Lösungen endlicher Lebensdauer, bei denen also f~(t) in endlicher Zeit den Definitionsbereich
von F~ verläßt oder gewissermaßen nach unendlich katapultiert wird. Daß die durch den Beweis
des Satzes von Picard-Lindelöf konstruierten Lösungen manchmal eine Lebensdauer δ < ε haben, muß also umwillen der allgemein gehaltenen Voraussetzungen in Kauf genommen werden.
Allerdings kann man zeigen, daß im Falle δ < ε die Lösung entweder unbeschränkt ist oder sich
dem Komplement von U beliebig nahe annähert. Die Lösung ist also wirklich definiert, solange
sie nicht nach unendlich abwandert oder den Definitionsbereich der rechten Seite verläßt.
Daß die Voraussetzung (13) nicht ohne Weiteres aufgegeben werden kann, macht man sich
durch Beispiele vom Typ Beispiel 1 klar4, in denen die Lösung des Anfangswertproblemes nicht
3Wofür
es natürlich andere Alternativen gibt, etwa das Maximum der Beträge der einzelnen Komponenten
xi . Alle vernünftigen Möglichkeiten führen aber letztlich auf dieselbe Bedingung (13) — Alle Normen auf dem
endlichdimensionalen R-Vektorraum Rn sind äquivalent.
4In dem konkreten Beispiel tritt das Problem gerade im Fall des Anfangswertes f = 0 auf, der am
o
√
unteren Rand des Definitionsbreiches der rechten Seite f der Differentialgleichung liegt. Diespist aber für ein
Gegenbeispiel dieser Art nicht notwendig, beispielsweise hat das Anfangswertproblem f ′ (t) = 3 f (t), f (0) = 0
die beiden Lösungen f (t) = 0 und f (t) = t3 , zusammen mit überabzählbar vielen anderen Lösungen, die man
durch Zusammenstückeln“ dieser beiden Lösungen erhalten kann
”
68
eindeutig ist. Ohne die Eindeutgkeitsaussage bleibt das Theorem — nach einem Ergebnis von
G. Peano — freilich
p immer noch richtig, solange f stetig ist. Übrigens liefert Satz 1 Beispiele,
wie f ′ (x) = 1+ |f (x)|, in denen die Lösung trotz verletzter Lipschitzstetigkeit noch eindeutig
ist. Diese Beispiele sind eben relativ spezieller Art.
Der Satz von Picard-Lindelöf ist nicht nur als theoretischer Hintergrund für die numerischen Verfahren zur Auflösung gewöhnlicher Differentialgleichungen interessant, sondern liefert
auch oft die Rechtfertigung anderweitig bedenklicher Umforumungen von gewöhnlichen Differentialgleichungen, die zu einer Ermittlung der allgemeinen Lösung mit Bleistift und Papier
führen sollen. Ein Beispiel dafür sind Eselsbrücken vom Typ (6) oder auch Substitutionen durch
Potenzen mit nichtganzen Zahlen als Exponenten, wie sie bei der Behandlung von (.3.6.19) auftreten können oder auch an Ansätze, die zur Auffindung einer Lösung von sehr spezieller Form
führen. Ist der Satz von Picard-Lindelöf anwendbar und kann man sich davon überzeugen,
daß ein unter Umständen fragwürdiger Ansatz tatsächlich zu einer Lösung eines gegebenen
Anfangswertproblemes geführt hat, so kann man sich sicher sein, die einzige Lösung gefunden
zu haben.
3.6. Lineare gewöhnliche Differentialgleichung.
3.6.1. Lineare Differentialgleichungen erster Ordnung für eine Funktion. Die lineare gewöhnliche Differentialgleichung erster Ordnung für eine Funktion hat die Form
f ′ (t) = a(t)f (t) + b(t).
(1)
Im Fall b(t) = 0 spricht man von einer homogenen Differentialgleichung, andernfalls vom
inhomogenen Fall. Diese Unterscheidung zwischen homogen und imhomogen ist nur für lineare
Differentialgleichungen üblich und entspricht genau der entsprechenden Unterscheidung für
lineare Gleichungssysteme.
Im homogenen Fall liegt offenbar eine Differentialgleichung mit trennbaren Variablen vor.
Unsere Eselsbrücke“ (.3.5.6) liefert uns
”
df
= a(t)f
dt
df
= a(t) dt
f
Z
Z
log f = f (t) dt = a(t) dt + C1 ,
also
f (t) = C exp A(t) ,
(2)
wobei A eine Stammfunktion von a ist. Obwohl Satz .3.5.1 im Fall des Anfangswertes 0 nicht
anwendbar ist, ist die Lösung in diesem konkreten Fall auch dann eindeutig5 und durch (2)
gegeben, und zwar auch im Fall komplexwertiger a. Es gilt also
5Was
für stetige a aus dem Satz von Picard-Lindelöf gefolgert werden kann.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
69
Satz 1. Wenn a auf einem Intervall I ⊆ R definiert sowie reell- oder komplexwertig ist
und daselbst eine Stammfunktion A hat, so haben alle Lösungen von (1) mit b = 0 auf I die
Form (2), und umgekehrt ist die rechte Seite von (2) für jede Konstante C eine Lösung von
(1) mit b = 0.
Beweis. Durch Anwendung der Kettenregel (.3.1.5) ergibt sich
f ′ (t) = CA′ (t) exp A(t) = A′ (t)f (t) = a(t)f (t).
für die Ableitung von (2). Also definiert (2) wirklich Lösungen der betrachteten Differentialgleichung. Ein förmlicher Beweis der Eindeutigkeitsaussage6 soll der Kürze halber nur im
Fall größerer Allgemeinheit geführt und daher noch bis zum Beweis von Satz 2 aufgeschoben
werden.
Wenn b in (1) nicht zu a proportional ist, liegt keine Differentialgleichung mit trennbaren
Variablen vor. In diesem Fall hilft der Trick der Variation der Konstanten“, der übrigens
”
generell auf lineare gewöhnliche Differentialgleichungen anwendbar ist, für die eine oder mehrere
Lösungen der homogenen Differentialgleichung erraten werden können. Der Paradox klingende
Name ist dadurch motiviert, daß man von (2) ausgeht, aber statt der Konstanten C eine
Funktion C(t) einsetzt:
f (t) = C(t) exp A(t) .
Wenn zunächst ohne Nachweis der Differenzierbarkeit von C die Leibniz-Regel (.3.1.3) angwendet wird, kommt (mit Anwendung der Kettenregel (.3.1.5) auf den zweiten Faktor)
(3)
f ′ (t) = C ′ (t) exp A(t) + A′ (t)C(t) exp A(t) = C ′ (t) exp A(t) + a(t)f (t).
Die Differentialgleichung (1) ist damit zu
oder
C ′ (t) exp A(t) = b(t)
C ′ (t) = b(t) exp −A(t) ,
also zu einer Quadraturaufgabe, äquivalent.
Satz 2. Die Funktionen a und b seien auf einem Intervall I ⊆ R definiert und reell- oder
komplexwertig. Wir setzen voraus, daß a auf I eine Stammfunktion
A hat. Dann hat (4) genau
dann auf ganz I definierte Lösungen, wenn b(t) exp −A(t) eine Stammfunktion C auf I hat.
Für jede Konstante K ist dann
(4)
C(t) + K) exp A(t)
eine Lösung von (1), und jede Lösung dieser Differentialgleichung auf I hat die Form (4) mit
einer Konstanten K.
6Der
sich wie gesagt in vielen Fällen aus dem Satz von Picard-Lindelöf ergibt
70
Beweis. Wenn C eine Stammfunktion von b(t) exp −A(t) ist, so ist C differenziebar,
die Umformungen nach (3) sind also legal und ergeben, daß C(t) exp A(t) eine Lösung der
Differentialgleichung
ist. Dasselbe gilt für (4), denn auch C(t) + K ist eine Stammfunktion von
b(t) exp −A(t) .
Sei umgekehrt
folgt die Differenzierbarkeit
f eine Lösung von (1). Aus der Kettenregel
von exp −A(t) , also ist auch C(t) = f (t) exp −A(t) differnzierbar. Die Umformungen nach
(3) sind also, mit
C(t) statt C(t), anwendbar und zeigen, daß C eine Stammfunktion
von
˜
b(t) exp −A(t) sein muß. Ist f eine andere Lösung von (1),
so ist C̃ = f (t) exp −A(t) eine
andere Stammfunktion derselben Funktion b(t) exp −A(t) und hat daher, nach Fakt .3.2.4,
die Form C(t) + K mit einer Konstanten K. Alle Lösungen haben also die Form (4).
3.6.2. Lineare Differentialgleichungen zweiter Ordnung mit konstanten Koeffizienten. Die
Differentialgleichung hat im homogenen Fall die Form
f ′′ (t) + pf ′ (t) + q = 0
(5)
Setzt man die Lösung als
(6)
f (t) = exp(λt)
an, so ergibt sich für λ die quadratische Gleichung
λ2 + pλ + q = 0.
(7)
In den meisten Fällen hat diese zwei verschiedene Lösungen
r
p2
p
(8)
λ± = − ±
− q,
2
4
und (6) liefert
zwei Lösungen f± (t) = exp(λ± t) von (5), für die die Vektoren f+ (t), f+′ (t) und
f− (t), f−′ (t) für jedes t linear unabhängig sind. Man kann also für jedes Anfangswertproblem
(5) kombiniert mit f ′ (to ) = a, f ′ (to ) = g eine Lösung durch Linearkombination von f+ und
f− erhalten. Der Satz von Picard-Lindelöf zeigt nun, daß tatsächlich alle Lösungen von (5) auf
einem Intervall Linearkombinationen von f+ und f− sind.
Beispiel 1. Die Differentialgleichung f ′′ = f (t) hat die Lösungen f± (t) = exp(±t). Das
Anfangswertproblem f ′′ (t) = f (t), f (0) = 1, f ′ (0) = 0 wird durch f (t) = 21 f+ (t) + f− (t) =
cosh(t) gelöst.
Dabei ist es vollkommen unerheblich, ob die Zahlen λ± reell oder komplex sind.7 Allerdings
ist es im Fall reeller Koeffizienten p und q oft wünschenswert, zwei linear unabhängige rellwertige Lösungen auch dann zu benutzen, wenn λ± komplex sind. In diesem Fall, also (8) mit
p2 < 4q, sind λ± und damit auch f± komlex konjugiert zueinander, so daß auch
(9)
f0 (t) = ℑ f+ (t) = sin(ωt) exp(αt)
7Entscheidend
ist dabei freilich, daß die Exponentialfunktion auf ganz C holomorph, also komplex differenzierbar ist, so daß (.3.1.5) auch mit einer C-wertigen inneren Funktion f (x) = λx angewendet werden
kann.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
71
f1 (t) = ℜ f+ (t) = cos(ωt) exp(αt)
q
2
mit α = − p2 , ω = q − p4 die Differentialgleichung lösen. Wegen f± = f0 ± f1 läßt sich auch
aus diesen Lösungen jede andere Lösung der Differentialgleichung auf einem Intervall linear
kombinieren. Im Fall α = 0 beschreiben die Lösungen Schwingungsvorgänge, im Fall α < 0
gedämpfte Schwingungen, im Fall α > 0 Schwingungen mit Selbsterregung.
Beispiel 2.
(10)
• Die Schwingungsgleichung
f ′′ (t) = −f (t)
hat f0 (t) = sin(t), f1 (t) = cos(t) als fundamentales System von Lösungen. Gibt man die
Anfangswertbedingungen f ′ (0) = f (0) = 1 vor, so lautet die Lösung cos(t) + sin(t) =
√
2 sin(t + π4 ).
• Die Differentialgleichung
(11)
f ′′ (t) = −2f ′ (t) − 2f (t)
hat als fundamentales System von Lösungen f0 (t) = sin(t)e−t und f1 (t) = cos(t)e−t . Sie
beschreibt gedämpfte Schwingungen.
Besonderes Augenmerk verdient noch der Fall, daß (7) eine Doppellösung λ+ = λ− = λ
hat. In diesem Fall bilden
(12)
f0 (t) = t exp(λt)
f1 (t) = exp(λt)
ein fundamentales System von Lösungen. Beispielsweise ist dies im Fall der Differentialgleichung
f ′′ (t) = 0, mit λ = 0, der Fall.
Die entsprechende inhomogene Gleichung
(13)
f ′′ (t) + pf (t) + qf (t) = b(t)
kann wie im Fall einer Gleichung ersten Grades durch die Methode der Variation der Konstanten behandelt werden, wie gleich noch ausgeführt werden wird. Allerdings sind die entstehenden
Quadraturaufgaben oft nicht mehr in geschlossener und elementarer Form zu lösen, ausgenommen in Fällen, in denen eine Lösung ohnehin erraten werden kann. Dies ist beispielsweise dann
der Fall, wenn b(t) die Form
(14)
b(t) = P (t) exp(ϑt)
mit einem Polynom P hat. In diesem Fall kann eine Lösung in der Form
(15)
f (t) = Q(t) exp(ϑt)
angesetzt werden. Für den Grad von Q gelten die folgenden Bemerkungen:
• Wenn ϑ keine Lösung von (7), also exp(ϑt) keine Lösung von (5) ist, so hat Q denselben
Grad wie P .
72
• Wenn ϑ eine Lösung von (7) ist, also exp(ϑt) die homogene Gleichung (5) löst, so
spricht man vom Vorliegen eines Resonanzfalles. Wenn dieser Fall vorliegt und (7) zwei
verschiedene Lösungen hat, so gilt deg Q = deg P + 1, der Grad des Polynomes Q ist
also um 1 höher als der Grad von P .
• Wenn (7) eine doppelte Lösung hat, so ist im Resonanzfall der Grad von Q sogar um
zwei höher als der Grad von P .
Zu beachten ist, daß mit Ausnahme des dritten Falles der Ansatz (15) nicht alle Lösungen
von (13) mit der rechten Seite (14). Die allgemeine Lösung der inhomogenen Gleichung ergibt
sich in diesem Fall als Summe aus einer speziellen Lösung der inhomogenen Gleichung und der
allgemeinen Lösung der homogenen Gleichung.
Wenn die rechte Seite von (13) eine Summe von mehreren Funktionen bi ist, die die Form
(14) haben, so kann nach diesem Rezept zunächst für jedes bi eine spezielle
P Lösung fi der
entsprechendenP
inhomogenen Gleichung gefunden werden. Die Funktion f = ni=1 fi löst dann
n
(13) mit b =
i=1 bi . Insbesondere sind auf diese Weise inhomogene Störterme der Form
b(t) = sin(βt) exp(ϑt) und b(t) = cos(βt) exp(ϑt)
zugänglich, denn die rechte Seite ist eine
Linearkombination der Funktionen exp (λ ± iβ)t . In diesem Fall kann aber die Lösung auch
direkt in der Form
Q0 (t) exp(ϑt) sin(βt) + Q1 (t) exp(ϑt)
angesetzt werden. Für den Grad der Polynome gilt dabei mit geringen Abwandlungen das
vorhin Gesagte.
Beispiel 3.
• Wir betrachten die inhomogene Schwingungsgleichung
f ′′ (t) + f (t) = sin(ϑt)
(16)
Wir setzen die Lösung als f (t) = a sin(ϑt) + b cos(ϑt) an und finden das lineare Gleichungssystem (1 − ϑ)2 a = 1, b = 0. Eine Lösung im Fall ϑ 6∈ {±1} ist also durch
f (t) =
gegeben. Im Fall ϑ = ±1 ist der Ansatz
sin(ϑt)
1 − ϑ2
f (t) = (at + b) sin(t) + (ct + d) cos(t)
zu wählen. Wir finden
f ′ (t) = (a − d − ct) sin(t) + (c + b + at) cos(t)
f ′′ (t) = −(2c + b + at) sin(t) + (2a − d − ct) cos(t)
f ′′ (t) + f (t) = −2c sin(t) + 2a cos(t),
also a = 0, c = − 21 , und die allgemeine Lösung von (16) hat die Form
f (t) = b sin(t) + d −
t
cos(t).
2
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
73
• Soll f ′′ (t) + 2f ′ (t) + 2f (t) = sin(t) gelöst werden, setzt man eine spezielle Lösung dieser
inhomogenen Gleichung als f (t) = a sin(t) + b cos(t) und findet das lineare Gleichungssystem a − 2b = 1, b + 2a = 0 und a = 1/2, b = −1/4, also
sin(t) cos(t)
−
2
4
als eine spezielle Lösung der inhomomogenen Gleichung.
• Übrigens ist der soeben betrachtete Fall gerade nicht der Resonanzfall einer zu (11)
gehörenden inhomogenen Gleichung vor. Dieser würde gerade für
f (t) =
f ′′ (t) + 2f ′ (t) + 2f (t) = sin(t) exp(−t)
(17)
vorliegen. Die allgemeine Lösung kann als f (t) = (at+b) sin(t) exp(−t)+(ct+d) cos(t) exp(−t)
angesetzt werden, man findet das lineare Gleichungssystem −2c = 1, 2a = 0, also
t
f (t) = b sin(t) + (d − ) cos(t) exp(−t)]g
2
für die allgemeine Lösung von (17).
3.6.3. Variation der Konstanten für lineare Differentialgleichungssysteme erster Ordnung.
CAVE: Zu tun.
3.6.4. Variation der Konstanten für die inhomogene Schwingungsgleichung. CAVE: Zu tun.
3.6.5. Variation der Konstanten für die homogene Gleichung. Für lineare Differentialgleichungen höherer Ordnung n mit nichtkonstanten Koeffizienten ist man im Allgemeinen darauf
angewiesen, eine spezielle Lösung f der homogenen Gleichung erraten zu können. Setzt man
die allgemeine Lösung der homogenen Gleichung als C(x)f (x) an, so ergibt sich für C eine
lineare Differentialgleichung der Form
C (n) (x) + an−1 C (n−1) (x) + · · · + a1 (x)C ′ (x) = 0,
(18)
in der also der normalerweise auch vorhandene Term nullter Ordnung a0 (x)C(x) verschwindet.
Andernfalls würden ja konstante Funktionen C die Differentialgleichung (18) nicht lösen.
Es ergibt sich also eine lineare homogene Differentialgleichung (n − 1)-ter Ordnung für C ′ ,
und die Lösung der Ausgangsgleichung ist zurückgeführt auf die Lösung einer Gleichung von
um 1 kleinerer Ordnung, gefolgt von einer weiteren Quadraturaufgabe.
3.6.6. Die Bernoullische Differentialgleichung. Wenn f die lineare inhomogene Differentialgleichung (1) erfüllt und λ 6= 0 ist, so erfüllt g = f λ die Differentialgleichung8
1
g ′ (x) = λf (x)λ−1 f ′ (x) = λf (x)λ−1 a(x)f (x) + λb(x)f (x)λ−1 = λa(x)g(x) + g(x)1− λ .
Also erfüllt g eine Bernoullische Differentialgleichung
(19)
g ′ (x) = α(x)g(x) + β(x)g(x)ϑ
mit α = λa, β = λb, ϑ = 1 − λ1 . Derartige Differentialgleichungen können also auf (1) und
damit auf Quadraturaufgaben zurückgeführt werden.
8Es
werden hier formale Rechnungen vorgestellt.
74
3.6.7. Die Ricattische Differentialgleichung. Sei f 6= 0 eine Lösung der linearen homogenen
Differentialgleichung zweiter Ordnung
(20)
f ′′ (x) + p(x)f ′ (x) + q(x)f (x) = 0.
Für die logarithmische
Ableitung C(x) = f ′ (x)/f (x) ergibt sich f ′ (x) = C(x)f (x), f ′′ (x) =
C ′ (x) + C(x)2 f (x) und man erhält
C ′ (x) + C(x)2 + p(x)C(x) + q(x) f (x) = 0
aus (20). Man wird also für g auf die Ricattische Differentialgleichung
(21)
C ′ (x) + r(x)C(x)2 + p(x)C(x) + q(x) = 0
mit r = 1 geführt. Wenn eine Lösung C(x) der Gleichung (21) bekannt ist, so kann eine Lösung
f von (20) aus f ′ (x) = f (x)/C(x) ermittelt werden. Es liegt hier eine Gleichung vom Typ (1)
im homogenen Fall vor, die Lösung führt also nach Satz 1 auf eine Quadraturaufgabe.
Im Hinblick auf die enge Beziehung der Ricattischen Differentialgleichung zur linearen homogenen Differentialgleichung zweiter Ordnung und unsere Bemerkungen über (18) ist es nicht
verwunderlich, daß die Ermittlung der allgemeinen Lösung der Ricattischen Differentialgleichung auf eine Quadraturaufgabe führt, wenn eine spezielle Lösung fo von (21) erraten werden
kann. In diesem Fall nämlich führt die Ermittlung der allgemeinen Lösung von (21) auf die
Lösung der folgenden Differentialgleichung für d(x) = f (x) − fo (x):
d′ (x) + r(x)d(x)2 + 2r(x)fo (x) + p(x) d(x) = 0,
eine Bernoullische Differentialgleichung (19) mit ϑ = 2.
3.7. Gleichmäßige Konvergenz und die Vertauschbarkeit von Limes und Integral.
Definition 1. Eine Folge fn von reell- oder komplexwertigen Funktionen auf einer Menge
X konvergiert gleichmäßig gegen die gleichartige Funktion f auf X, wenn zu jedem ε > 0 ein
m mit
(1)
|fn (x) − f (x)| < ε
für x ∈ X und n > m
existiert. Man spricht auch von gleichmäßiger Konvergenz auf X.
Bemerkung 1. Offenbar ergibt sich aus der gleichmäßigen Konvergenz von fn gegen f ,
daß limn→∞ fn (x) = f (x) für alle x ∈ X gilt. Die gleichmäßige Konvergenz ist aber eine
Verschärfung dieser punktweisen Konvergenz, denn die Zahl m in (1) darf nicht von x abhängen,
wie das bei der bloßen Gültigkeit von limn→∞ fn (x) = f (x) für jedes einzelne x ∈ X der Fall
sein könnte.
Gleichmäßige Konvergenz spielt eine wichtige Rolle bei der Vertauschung von Grenzübergängen.
Als erstes Beispiel betrachten wir die Frage der Stetigkeit der Grenzfunktion.
Satz 1. Wenn X eine Teilmenge von R oder C und x ∈ X ist und wenn fn eine Folge von
an der Stelle x auf X stetigen Funktionen fn ist, welche gleichmäßig gegen f konvergiert, so
ist f an der Stelle x stetig.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
75
Beweis. Sei ε > 0 vorgegeben. Nach Definition 1 gibt es ein m mit
ε
(+)
|fn (a) − f (a)| <
3
für n ≥ m und alle a ∈ X. Auf Grund der Stetigkeit von fm gibt es ein δ > 0 mit
ε
|fm (x) − fm (y)| <
3
für alle y ∈ X mit |x − y| < δ. Für derartige y kann die obige Ungleichung kombiniert werden
mit (+) für a = x und a = y. Man erhält
ε ε ε
|f (x) − f (y)| ≤ |f (x) − fn (x)| + |fn (x) − fn (y)| + |fn (y) − f (y)| < + +
3 3 3
für y ∈ X und |x − y| < δ. Die Stetigkeit von f an der Stelle x ist damit bewiesen.
Für den Beweis des nachfolgenden Satzes benötigen wir die oft verwendete Tatsache, daß ein
Integral durch die Länge des Integrationsweges mal das Maximum des Betrages des Integranden
abgeschätzt werden kann.
Lemma 1. Sei f eine reell- oder komplexwertige Funktion auf I = [a, b] mit |f (t)| ≤ M für
t ∈ [a, b]. Wenn das Integral auf der linken Seite konvergiert, so gilt
Z b
(2)
f (t) dt ≤ (b − a)M
a
Beweis. Der Beweis ergibt sich durch Anwendung von (.3.2.11) mit Φ(t) = M .
Satz 2. Die Funktionen fn seien auf I = [a, b] definiert, und es gelte limn→∞ fn = f
gleichmäßig auf I. Wenn die fn HK-integrierbar sind, so ist auch f HK-integrierbar, und es
gilt
Z b
Z b
(3)
lim
f (t) dt
fn (t) dt =
n→∞
a
a
Beweis. Zunächst soll die Existenz des Limes auf der linken Seite von (3) gezeigt werden.
Dazu genügt nach Satz .2.2.1 der Nachweis, daß die Folge auf der rechten Seite dieser Gleichung
ε
eine Cauchy-Folge ist. Sei dazu ε > 0, es gibt nach Definition 1 ein m mit |fn (x) − f (x)| < 2(b−a)
ε
ε
für n ≥ m. Für min(k, l) ≥ m folgt dann |fk (x) − fl (x)| < b−a
. Aus (2) mit M = b−a
folgt
dann
Z b
Z b
Z b
Z b
ε
dx = ε.
fk (x) − fl (x) dx ≤
fl (x) dx = fk (x) dx −
a b−a
a
a
a
Die Folge auf der linken Seite von (3) ist also wie behauptet eine Cauchy-Folge.
Sei nun ι der Grenzwert auf der linken Seite von (3). Wir zeigen, daß das Integral auf der
rechten Seite von (3) gegen ι konvergiert. Sei dazu ε > 0 gegeben, wir wählen m mit folgenden
Eigenschaften:
Rb
• Für k ≥ m gilt ι − a fn (t) dt < 3ε .
76
• Für k ≥ m und alle x ∈ I gilt |fk (x) − f (x)| <
ein derartiges m zu wählen.
ε
.
3(b−a)
Nach Definition 1 ist es möglich,
R
b
Auf Grund der Integrierbarkeit von fm gibt es eine Eichung δ auf I mit a fm (t) dt − σ(Z, Ξ, fm ) <
ε
für jede δ-feine Zerlegung (Z, Ξ). Für derartige (Z, Ξ) gilt dann
3
Z b
Z b
fm (t) dt + fm (t) dt − σ(Z, Ξ, fm ) + |σ(Z, Ξ, fm ) − σ(Z, Ξ, f )|
|ι − σ(Z, Ξ, f )| ≤ ι −
a
a
ε ε ε
< + + = ε,
3 3 3
wobei Fakt .3.2.1 und (.3.2.12) benutzt wurden:
|σ(Z, Ξ, fm ) − σ(Z, Ξ, f )| = |σ(Z, Ξ, f − fm )| ≤ σ Z, Ξ, |f − fm | ≤ σ Z, Ξ,
ε
ε
=
3(b − a)
3
Also konvergiert das Integral auf der rechten Seite von (3) in der Tat gegen ι.
Um an dieser Stelle schon einen Überblick über die wichtigsten Sätze zur Vertauschbarkeit
von Limes und Integral zu geben, formulieren wir die beiden folgenden Sätze ohne Beweis an
dieser Stelle
Satz 3 (Satz über die monotone Konvergenz). Sei (fn ) eine monoton wachsende Folgen
Rb
reellwertiger Funktionen, für die a fn (t) dt konvergiert. Wir setzen voraus, daß die Folge fn
punktweise gegen die Funktion f konvergiert. Dann gilt
Z b
Z b
f (t) dt = lim
fn (t) dt,
n→∞
a
a
wobei beide Seiten konvergieren oder bestimmt divergieren.
Die Behauptung wird später nochmals als Theorem 4 formuliert und bewiesen. Als Folgerung daraus werden wir als Theorem 5 den folgenden Satz über die majorisierte Konvergenz
herleiten:
Satz 4 (Satz über die majorisierte Konvergenz). Sei m eine Funktion auf [a, b] mit nichtRb
negativen Funktionswerten, für die a m(t) dt konvergiert. Sei (fi )∞
i=0 eine Folge rell- oder komplexwertiger Funktionen mit |fi (t)| ≤ m(t), so daß für alle t ∈ I f (t) = limi→∞ fi (t) existiert.
Rb
Wenn die Integrale a fi (t) dt konvergieren, so gilt
Z b
Z b
fi (t) dt =
f (t) dt,
lim
i→∞
a
a
wobei sowohl der Grenzwert auf der linken als auch das Integral auf der rechten Seite konvergieren.
Es handelt sich hierbei um Sätze, die historisch zuerst im Rahmen der Lebesgueschen
Integrationstheorie bewiesen worden sind, die aber auch für das HK-Integral gültig sind.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
77
Ra
Rb
Definition 2. Sei b < a. Wir setzen a f (t) dt = − b f (t) dt, falls das letztere Integral
wohldefiniert (konvergent oder bestimmt divergent) ist.
Bemerkung 2. Aus dem zweiten Hauptsatz
der Integral- und Differentialrechnung folgt
Rb
auch für b < a die Identität f (b)−f (a) = a f ′ (t) dt, falls die Ableitung auf [min(a, b), max(a, b)]
existiert.
Satz 5. Sei fn eine Folge von auf dem Intervall I definierten und differenzierbaren Funktionen, die daselbst punktweise gegen f konvergiert. Wenn die Folge der Ableitungen fn′ gleichmäßig gegen die Funktion g konvergiert, so ist f differenzierbar auf I mit Ableitung g.
Beweis. Aus dem zweiten Hauptsatz der Integral- und Differentialrechnung folgt
Z t
fn′ (x) dx
fn (t) − fn (s) =
s
für t, s aus I. Auf Grund von Satz 2 können beim Grenzübergang n → ∞ auf der rechten Seite
Limes und Integration vertauscht werden:
Z t
Z t
′
(+)
f (t) − f (s) = lim fn (t) − fn (s) = lim
g(x) dx.
fn (x) dx =
n→∞
n→∞
s
s
Seien t ∈ I und ε > 0 vorgegeben. Wir wählen ein n mit |fn′ (x) − g(x)| < 3ε für alle x ∈ I.
Weiterhin wählen wir δ > 0 mit |fn (t) − fn (s) − fn′ (t)(t − s)| < 3ε |t − s| für alle s ∈ I mit
|s − t| < δ, das ist wegen Fakt .3.1.2 möglich. Für derartige s gilt dann
|f (t) − f (s) − g(t)(t − s)| ≤ |f (t) − f (s) − fn (t)(t − s)| + |g(t) − fn (t)| |t − s|
Z s
= g(x) dx − fn (t)(t − s) + |g(t) − fn (t)| |t − s|
Zt s
Z
ε
s ′
′
<
g(x) − fn (X) dx + fn (x) dx − fn (t)(t − s) + |t − s|
3
t
t
ε
ε
≤ |t − s| + |fn (t) − fn (s) − fn′ (t)(t − s)| + |t − s|
3
3
ε
ε
ε
≤ |t − s| + |t − s| + |t − s| = ε |t − s| ,
3
3
3
′
und auf Grund von Fakt .3.1.2 gilt f (t) = g(t).
Bemerkung 3.
• Man kann ziemlich leicht zeigen, daß unter den angegebenen Voraussetzungen auch die Folge fn gleichmäßig konvergiert.
• Die Behauptung gilt mit einem anderen Beweis sogar für die komplexe Ableitung. In
diesem Fall gilt sogar mehr: Wenn Ω ⊆ C offen ist, die Funktionen fn holomorph auf Ω
sind und gleichmäßigt daselbst gegen f konvergieren, so ist g holomorph, und die Folge
der komplexen Ableitungen fn′ konvergiert gleichmäßig gegen g ′ auf jeder beschränkten
abgeschlossenen Teilmenge von C, die in Ω enthalten ist. Es ist dies ein weiteres Beispiel
dafür, daß in der Theorie holomorpher Funktionen oft schärfere Aussagen gelten als in
der reellen Infinitesimalrechnung.
78
3.8. Der (erste) Hauptsatz der Integral- und Differentialrechnung.
Theorem 3. Jede stetige Funktion f auf einem Intervall
R t I = [a, b] hat eine Stammfunktion
F auf I. Genauer gesagt konvergiert das Integral F (t) = a f (τ ) dτ für alle t ∈ I, und F ist
eine Stammfunktion von f .
Bemerkung 1.
• Es gibt durchaus auch viele unstetige Funktionen, für die das in
Theorem 3 untersuchte Integral konvergiert. Allerdings ist es für unstetige Funktionen
meist9 nicht richtig, daß die Ableitung von F gleich f ist.
• Wir werden in drei Schritten vorgehen. Zunächst zeigen wir, daß sich bei gleichmäßiger
Konvergenz die Behauptung des Theoremes von den Gliedern fn einer Funktionenfolge
auf deren Grenzwert f vererbt. Sodann geben wir eine einfache Klasse von Funktionen
(nämlich die Polygonzüge) an, für die man eine Stammfunktion explizit konstruieren
kann, und zeigen, daß jede stetige Funktion als Limes einer gleichmäßig konvergenten
Folge von Polygonzügen geschrieben werden kann.
Fakt 1.
• Für eine Funktion f auf einem Intervall I = [a, b] sind folgende Bedingungen äquivalent:
a. Es gibt eine Stammfunktion
F von f auf I.
Rt
b. Das Integral a f (τ ) dτ konvergiert für alle t ∈ I, und F ist eine Stammfunktion
von f .
• Wenn f der Limes einer auf I gleichmäßig konvergenten Folge von Funktionen ist, für
die diese Bedingungen richtig sind, so sind sie auch für f erfüllt.
Beweis. Die erste Aussage folgt aus dem
R t zweiten Hauptsatz der Integral- und Differentialrechnung. Nach diesem Satz gilt nämlich a f (τ ) dτ = F (t) − F (a) unter den Voraussetzungen
von a. Diese Funktion ist differnzierbar mit Ableitung F ′ = f , also gilt b. Daß umgekehrt a.
aus b. folgt, ist trivial.
Zum zweiten Punkt bemerkt man, daß sich die Bedingung b. aus dem ersten auf Grund
von Satz .3.7.2 und Satz .3.7.5 auf Limites gleichmäßig konvergenter Funktionenfolgen vererbt,
deren Glieder diese Bedingung erfüllen.
Definition 1. Ein Polygonzug ist eine Funktion f auf I, für die eine Zerlegung Z von I
in Teilintervalle Ik = [ak−1 , ak ], a = a0 < a1 · · · < an existiert, so daß f auf [ak−1 , ak ] die Form
f (t) = λk t + µk hat.
Satz 1. Für jeden Polygonzug auf einem Intervall I gibt es eine Stammfunktion. Jeder
Polygonzug erfüllt daher die äquivalenten Bedingungen aus Fakt 1
Beweis. Wir führen den Beweis durch Induktion nach n. Im Fall n = 1 ist f (t) = λ1 t + µ1
ein Polynom erster Ordnung, und eine Stammfunktion ist durch F (t) = λ21 t2 + µ1 t gegeben.
Sei n > 1 und die Behauptung bewiesen für Polygonzüge, die aus weniger als n Strecken
9Aber
nicht immer: Notwendig und hinreichend für F ′ = f auf ganz I ist, daß jedes Element von I ein
soganannter Lebesgue-Punkt von f ist. Diese Bedingung wird von den meisten Standardbeispielen für unstetige
Funktionen verletzt, ist aber schwächer als die Stetigkeit
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
79
zusammengesetzt sind. In den Bezeichungen der Definition sei I1 = [a, an−1 ], I2 = [an−1 , b],
fk = f |Ik . Auf Grund der Induktionsannahme hat f1 eine Stammfunktion F1 . Sei
(
F1 (t)
t ∈ I1
F (t) =
µn
2
F1 (an−1 ) + λn (t − an−1 ) + 2 (t − an−1 ) t ∈ I2 ,
wobei im Fall t = an−1 beide Alternativen genommen werden können und zu demselben Ergebnis führen. Der untere Zweig der Fallunterscheidung definiert offenbar eine Stammfunktion
F2 für f2 . Nach Fakt .3.1.1 ist F differenzierbar auf I mit Ableitung f .
Satz 2. Jede stetige Funktion f auf einem abgeschlossenen Intervall I ist Limes einer
gleichmäßig konvergenten Folge von Polygonzügen.
Beweis. Es genügt, zu jedem ε > 0 einen Polygonzug fε mit |f (x) − fε (x)| < ε auf ganz
I zu finden, denn dann konvergiert die Folge der Polygonzüge f2−n gleichmäßig gegen f .
Zur Konstruktion von fε wählen wir für jedes x ∈ I eine Zahl δ(x) > 0 mit |f (x) − f (t)| < 2ε
für alle t ∈ I mit |t − x| < δ(x). Dann ist δ eine Integraleichung, und nach Fakt .3.2.2 existiert
eine δ-feine Zerlegung a = a0 ≤ ξ1 ≤ a1 ≤ ξ2 ≤ a2 ≤ . . . ≤ ξn ≤ an = b von I. Wir definieren
fε durch
(x − ak−1 )f (ak ) + (ak − x)f (ak−1 )
fε (x) =
ak − ak−1
für x ∈ [ak−1 , ak ]. Für x = al mit 0 < l ≤ n liefern offenbar k = l und k = l − 1 denselben
Funktinswert, fε ist also wohldefiniert. Für x ∈ [ak−1 , ak ] gilt
ε
|fε (x) − f (x)| ≤ |fε (x) − f (ξk )| + |f (x) − f (ξk )| < |fε (x) − f (ξk )| +
2
(x − ak−1 ) f (ak ) − f (ξk ) + (ak − x) f (ak−1 ) − f (ξk )
ε
+
=
ak − ak−1
2
ak − x
ε
x − ak−1
|f (ak ) − f (ξk )| +
|f (ak−1 − f (ξk )| +
≤
ak − ak−1
ak − ak−1
2
ak − x
ε ε
x − ak−1 ε
· +
· + = ε,
≤
ak − ak−1 2 ak − ak−1 2 2
also leistet fε in der Tat das Gewünschte.
Wie bereits erklärt (Bemerkung 1), ergibt sich das Theorem aus den beiden Sätzen und
Fakt 1.
Bemerkung 2. Auch hier seien einige Bemerkungen über die analoge Aussage für komplexe Ableitungen und Stammfunktionen gestattet, obwohl dies kein zentraler Punkt der Vorlesung ist.
Wie schon erwähnt (Bemerkung .3.1.1), gilt in der komplexen Differentialrechnung der
Satz, daß die Ableitung einer holomorphen Funktion wieder holomorph ist. Man hat also nur
für holomorphe Funktionen f auf einer offenen Teilmenge Ω ⊆ C überhaupt eine Chace, eine
komplexe Stammfunktion F zu finden, also eine holomorphe Funktion F auf Ω mit F ′ = f .
80
Hinzu kommt noch ein weiteres Problem, wenn das Gebiet Ω Löcher“ hat. Ein Beispiel dafür
”
ist Ω = C \ {0}. Auf Ω ist f (z) = z1 holomorph. Man kann aber zeigen, daß keine auf ganz Ω
holomorphe Funktion F mit komplexer Ableitung f existiert. Die Nichtexistenz derartiger F
ist eng verwandt mit den Schwierigkeiten bei der Definition des komplexen Logarithmus, der
ja auch nicht auf ganz C \ {0} stetig ist, sondern erst nach Aufschlitzen“ von C entlang einer
”
Halbachse durch {0}. Auf einer derart aufgeschlitzten Ebene ist der komplexe Logarithmus
dann eine komplexe Stammfunktion von f (z) = z1 .
Für die Existenz einer komplexen Stammfunktion ist also die Bedingung der Stetigkeit von
f zur Bedingung der Holomorphie von f zu verschärfen. Dazu kommen noch Bedingungen an
das Gebiet Ω, die zum Beispiel für konvexe Teilmengen von C stets erfüllt sind, nicht aber für
Gebiete mit Löchern“.
”
3.9. Potenzreihen und die Taylorsche Formel.
Satz 1 (Taylorsche Formel mit dem Restglied in Integralform). Sei k ≥ 0. Wenn die
Funktion f (k + 1)-mal differenzierbahr auf einem Intervall ist, das die reellen Zahlen x und
x + h enthält, so gilt
Z
k
X
hj (j)
1 h (k+1)
(1)
f (x + h) =
f (x) +
f
(x + η)(h − η)k dη.
j!
k! 0
j=0
Beweis. Im Fall k = 0 handelt sich bei der Behauptung letzlich um den zweiten Hauptsatz
der Integral- und Differentialrechnung Theorem 1. Wir können also durch Induktion nach k
vorgehen, mit dem Fall k = 0 als Induktionsanfang. Der Induktionscschluß ergbit sich durch
die partielle Integration (Satz .3.4.1)
Z h
Z h
(k+1)
k
(k+1)
k+1
f (k+2) (x + η)(h − η)k+1 dη.
f
(x + η)(h − η) dη = f
(0)h
+
(k + 1)
0
0
Satz 2 (Mittelwertsatz der Integralrechnung). Die Funktion g auf I = [a, b] sei reellwertig
und stetig. Sei weiterhin
w eine Funktion auf I mit nichtnegativen reellen Funktionswerten,
Rb
für die das Integral a w(t) dt konvergiert. Dann gibt es ein ξ ∈ I mit
Z b
Z b
w(t) dt.
g(t)w(t) dt = g(ξ)
(2)
a
a
Beweis. Wir setzen Rhier stillschweigend voraus, daß das Integral auf der linken Seite von
b
(2) konvergiert und µ = a w(t) dt nicht verschwindet.10
10Bei
den in diesem Kapitel vorgestellten Anwendungen ist w meist ebenfalls stetig, so daß die Konvergenz
der linken Seite von (2) aus dem ersten Hauptsatz der Integral- und Differentialrechnung folgt. Auch wird in diesen Fällen klar sein, daß µ 6= 0 gilt. Wir werden diese Lücken im Beweis des Satzes später in Bemerkung .3.14.3
schließen
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
81
Nach Satz .2.4.6 existieren M = max g(x) x ∈ I und m = min g(x) x ∈ I . Nach
Rb
(.3.2.9) gilt µ > 0 und µm ≤ a g(x)w(x) dx ≤ µM .11 Wir erhalten
Z
1 b
g(x)w(x) dx ≤ M.
m≤
µ a
Nach dem Zwischenwertsatz für stetige Funktionen (Satz .2.4.3) gibt es ein ξ ∈ I mit
Z
1 b
g(x)w(x) dx = g(ξ).
µ a
Bemerkung 1. Für komplexwertige
g ist die Behauptung falsch. Beispielsweise gilt für
Rb
g(t) = exp(it), a = 0, b = 2π a g(t) dt = 0, während kein ξ mit g(ξ) = 0 existiert, im
Widerspruch zu Satz 2 mit w(x) = 1.
Durch Anwendung des Mittelwertsatzes der Integralrechnung auf das Restglied in (1), mit
g(η) = f (k+1) (η), w(η) = (h − η)k , ergibt sich
Folgerung 1 (Taylorsche Formel mit dem Restglied von Lagrange). Sei k ≥ 0. Wenn die
Funktion f reellwertig und (k + 1)-mal stetig differenzierbahr auf einem Intervall ist, das die
reellen Zahlen x und x + h enthält, so gilt
(3)
f (x + h) =
k
X
hj
j=0
j!
f (j) (x) +
hk+1 (k+1)
f
(η)
(k + 1)!
mit einer Zahl η, die zwischen x und x + h liegt (also η ∈ [min(x, x + h), max(x, x + h)]).
Aus ähnlichen Gründen wie früher (Bemerkung 1) ist man auch im Fall des Restgliedes
von Lagrange gezwungen, sich auf den Fall rellwertiger Funktionen zu beschränken. Dasselbe
gilt für den Mittelwertsatz der Differentialrechnung, der (abgesehen von den bei uns etwas
schärferen Voraussetzungen) der Spezialfall k = 0 von (1) ist.
Folgerung 2 (Spezialfall des Mittelwertsatzes der Differentialrechnung). Die Funktion f
sei reellwertig und stetig differenzierbar auf I = [a, b] mit a < b, dann existiert ein ξ ∈ I mit
f (b) − f (a)
= f ′ (ξ).
b−a
(4)
Der Beweis ergibt sich durch Anwendung von (3) mit k = 0 und Auflösung der enstehenden
Gleichung nach f ′ (xi).
Bemerkung 2.
• Der Mittelwertsatz der Differentialrechnung bleibt richtig unter der
schwächeren Voraussetzung, daß f stetig auf [a, b] und differenzierbar auf (a, b) ist, wobei
unter diesen Voraussetzungen die Existenz eines ξ ∈ (a, b) mit (4) gezeigt werden kann.
11Beispielsweise
g(x)w(x) ≤ M w(x)
ergibt sich
Rb
a
g(x)w(x) dx ≤ µM durch Anwendung von (.3.2.9) auf die Ungleichung
82
• In den gängigen Lehrbüchern der Infinitesimalrechnung pflegt man Sätze wie Folgerung .3.2.1 oder den Satz über die Eindeutigkeit der Stammfunktion bis auf eine Integrationskonstente aus dem Mittelwertsatz der Differentialrechnung herzuleiten. Da
wir in unserem Text auf der HK-Integration aufbauen, steht der zweite Hauptsatz der
Integral- und Differentialrechnung in großer Allgemeinheit zur Verfügung, so daß wir
die Behandlung des Mittelwertsatzes der Differentialrechung aufschieben konnten und
uns auch nicht gezwungen sehen, diesen Satz in der größtmöglichen Allgemeinheit zu
beweisen.
• Ähnlich wie beim ersten Punkt gilt auch (3) unter der schwächeren Voraussetzung, daß
f k-mal differenzierbar auf dem Intervall von x bis x + h, f (k) stetig daselbst ist und
die Ableitung f (k+1) auf dem offenen Intervall von x bis x + h existiert.
Bemerkung 3. Neben dem soeben beschriebenen Restglied von Lagrange gibt es noch
andere Restglieder in der Taylorschen Formel für reellwertige f . Durch Anwendung des Mittelwertsatzes der Integralrechnung auf das Restglied in (1) mit g(η) = f (k+1) (η)(h − η)k−p ,
w(η) = (h − η)p mit −1 < p ≤ k, h > 0 erhält man des Restglied von Schlömilch, die Spezialfälle p = k − 1 bzw. p = k sind das Restglied von Cauchy bzw. das vorhin beschriebene
Restglied von Lagrange. Wir gehen nicht auf die Details ein.
Die Taylorsche Formel wirft die Frage auf, ob für k → ∞ das Restglied gegen 0 konvergiert,
also
∞
X
f (k) (xo )
(5)
f (x) =
(x − xo )k
(x − xo )k
k!
k=0
wenigstens für solche x gilt, die genügend nahe bei xo liegen. Offenbar handelt es sich bei (5)
um eine Reihe, deren Summanden die Form ak (x − xo )k haben. Derartige Reihen nennt man
Potenzreihe, und wir wollen zunächst die Frage des Konvergenzverhaltens derartiger Reihen
untersuchen.
Satz 3. Sei
∞
X
(6)
k=0
ak (x − xo )k
eine Potenzreihe. Dann gibt es ein R ∈ [0, ∞] so daß diese Reihe für |x − xo | < R konvergiert
und für |x − xo | > R divergiert. Es gilt
1
p
(7)
R=
,
lim supn→∞ n |an |
diese Zahl wird der Konvergenzradius der Potenzreihe genannt.
Für ρ ∈ [0, R) konvergiert (6) gleichmäßig für |x − xo | ≤ ρ. Weiterhin hat die gliedweise
differenzierte Potenzreihe
∞
X
(8)
(k + 1)ak+1 (x − xo )k
k=0
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
83
denselben Konvergenzkreis und konvergiert in dessen Inneren gegen die Ableitung von (6).
Beweis. Sei A ∈ [0, ∞] der lim sup in (7), und sei 0 < ρ < R. Wir wollen zeigen, daß (6)
in der Region |x − xo | ≤ ρ gleichmäßig konvergiert.pDazu wählen wir ein ρ̃ ∈ (ρ, R) und setzen
à = ρ̃1 . Dann gilt à > A, nach Fakt .2.2.4 gilt also n |an | ≤ à oder |an | ≤ Ãn für alle genügend
großen n. Für |x − xo | ≤ ρ gilt dann
ρ n
n
n n
.
|an (x − xo ) | ≤ ρ Ã =
ρ̃
Für derartige x hat also (6) die zu q = ρρ̃ ∈ (0, 1) gehörende konvergente geometrische Reihe
als Majorante und konvergiert daher. Wegen
∞
∞
l
∞
X
X
X
X
q l+1
k
k
k
k
→0
a
(x
−
x
)
−
a
(x
−
x
)
=
a
(x
−
x
)
≤
q
=
k
o
k
o k
o 1
−
q
k=0
k=0
k=l+1
k=l+1
für k → ∞ erfolgt die Konvergenz von (6) sogar gleichmäßig auf {x| |x − xo | ≤ ρ}. Da dies für
alle ρ < R gilt, konvergiert (6) für |x − xo | < R.
p
1
n
|an | ≥ Ã
.
Dann
gilt
Ã
>
A.
Nach
Fakt
.2.2.4
gilt
also
Sei |x − xo | > R und à = |x−x
o|
oder |an | ≥ Ãn für unendlich viele n. Für derartige n gilt dann |(x − xo )n an | ≥ 1. Die Folge
der Summanden in (6) kann also nicht gegen 0 konvergieren, folglich (Satz .2.1.7) divergiert
(6).
Es verbleibt der Nachweis, daß (6) und die formal differenzierte Reihe
∞
X
(+)
(k + 1)ak+1 (x − xo )k
k=0
denselben Konvergenradius haben. Durch Multiplikation von (+) mit x − xo entsteht
∞
X
(%)
kak (x − xo )k .
k=0
Diese Reihe und (+) haben also dasselbe Konvergenzverhalten, denn für x 6= xo ändert Multiplikation mit x − xo nichts an Konvergenz
oder Divergenz p
und für x = xo konvergieren
beide
p
√
Reihen ohnehin. Wegen limk→∞ k k = 112 gilt lim supk→∞ k |ak | = lim supk→∞ k |kak |, nach
(7) haben also (%) und (6), und damit auch (+) und (6), wie behauptet denselben Konvergenzradius.
Bemerkung 4. Zusammen mit den von uns bewiesenen bzw. (im komplexen Fall) ohne
Beweis formulierten Fakten über die Vertauschbarkeit von Limes und Ableitung bei gleichmäßiger Konvergenz folgt, daß eine Potenzreihe (6) mit Konvergenzradius R für |x − xo | < R eine
beliebig oft differenzierbare (bzw. holomorphe) Funktion definiert und gliedweise differenziert
werden kann.
p
p
√
√
k
k
k =1
Beispiel gilt
k − 1 ≤ √1k auf Grund der Bernoullischen Ungleichung, also limk→∞
p
√
√ 2
k
k
und damit limk→∞ k = limk→∞
k = 1.
12Zum
84
In der reellen Differentialrechung kann man keine allgemein gültigen Konvergenzaussagen
für (5) formulieren und auch nicht beweisen, daß die Taylorreihe (5) im Fall ihrer Konvergenz
wirklich gegen f (x) konvergiert.
Bemerkung 5.
• Nach einem Satz von E. Borel kann man jede Potenzreihe (6) mit
rellem xo als Taylorreihe (5) einer auf ganz R beliebig oft differenzierbaren Funktion
darstellen. Insbesondere
P∞ k k gilt das auch für Potenzreihen mit Konvergenzradius 0, wie
zum Beispiel
k=0 k x . Reelle Differenzierbarkeitseigenschaften alleine reichen also
nicht aus, um nichttriviale (x 6= xo ) Konvergenzaussagen für (5) zu zeigen.
• Sei
(
e−1/t t > 0
f (t) =
0
t≤0
Man kann zeigen, daß f auf ganz R beliebig oft differenzierbar ist und daß alle Ableitungen f (k) (t) für t ≤ 0 verschwinden. Die Taylorreihe von f an der Stelle x = xo
hat also verschwindende Koeffizienten. Sie konvergiert daher überall, aber es gibt keine
Umgebung von 0, auf der sie überall gegen den richtigen“ Wert f (x) konvergiert, da f
”
auf keiner Umgebung von 0 identisch verschwindet.
Um mit Mitteln der rellen Differentialrechnung Konvergenzaussagen für (5) zu zeigen, reicht
es also nicht, die Existenz aller höheren Ableitungen von f zu fordern. Man muß zusätzlich
Wachstumseigenschaften dieser Ableitungen in Abhängigkeit von k kennen, um für irgendeine
Form des Restgliedes zu zeigen, daß dieses für k → ∞ gegen 0 strebt. Bequemer ist es meist,
den folgenden Satz der komplexen Analysis zu zitieren:
Bemerkung 6. Sei Ω ⊆ C offen und f holomorph auf Ω. Sei xo ∈ Ω, so daß der Kreis K =
x |x − xo | < R in Ω enthalten ist. Dann gibt es eine Potenzreihe (6), die für |x − xo | < R
gegen f (x) konvergiert. Diese Reihe stimmt mit der Taylorreihe (5) für f überein.
3.10. Einige Eigenschaften des Henstock-Kurzweil-Integrales. Uneigentliche Integrale. Wir wollen einige über den ersten Hauptsatz der Integral- und Differentialrechnung
hinausgehende Sätze über die Konvergenz von HK-Integralen zeigen, auf den Begriff uneigent”
liches Integral“ eingehen und den Beweis der Sätze über die monotone und die majorisierte
Konvergenz vorbereiten.
Wir beginnen mit dem folgenden Satz, der als eine Version für Integrale des Satzes über
die Konvergenz von Cauchyfolgen aufgefaßt werden kann:
Rb
Satz 1. Für eine Funktion auf I = [a, b] konvergiert a f (t) dt genau dann, wenn für jedes
ε > 0 eine Eichung δ mit
(1)
σ(Z, Ξ, f ) − σ(Z̃, Ξ̃, f ) ≤ ε
für zwei δ-feine Zerlegungen (Z, Ξ) und (Z̃, Ξ̃) von I existiert.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
85
Beweis. Sei für k ∈ N δ k eine Integraleichung, so daß (1) mit ε = 2−k (und δ k -feine
Zerlegungen) gilt. Wir dürfen δ k+1 ≤ δ k annehmen, denn
sonst ersetzt man einfach die Folge
der δ k durch die Folge der δ̃ k (x) = min δ 0 (x), . . . , δ k (x) .
Sei (Zk , Ξk ) eine δ k -feine Zerlegung von I und ik = σ(Zk , Ξk , f ). Dann gilt
|ik − il | ≤ 2− min(k,l)
(+)
auf Grund von (1), denn (Zk , Ξk ) und (Zl , Ξl ) sind beide δ min(k,l) -fein. Wegen (+) ist ik eine
Rb
Cauchyfolge. Sei i = limk→∞ ik . Dann konvergiert a f (t) dt gegen i. In der Tat, sei ε > 0
gegeben. Wir wählen ein k ∈ N mit 2−k < 2ε . Ist (Z, Ξ) δ k -fein, so gilt
|σ(Z, Ξ, f ) − ik | ≤ 2−k
auf Grund von (1). Aus (+) folgt aber i − ik ≤ 2−k , also
|σ(Z, Ξ, f ) − i| ≤ 21−k < ε,
Rb
und die Konvergenz von a f (t) dt gegen i ist gezeigt.
Zum Beweis der Notwendigkeit wählt man für jedes ε > 0 eine Eichung δ mit
Z b
ε
<
f
(t)
dt
−
σ(Z,
Ξ,
f
)
2
a
für jede δ-feine Zerlegung. Diese Eichung erfüllt offenbar (1).
Als Folgerung erhalten wir:
Satz 2. Sei f eine Funktion auf I = [a, b]. Wenn J = [c, d] in I enthalten ist und f auf I
integrierbar ist, so ist f auch auf J integrierbar.
Beweis. Sei ε > 0 und δ eine Eichung auf I mit (1). Seien (Z′ , Ξ′ ) und (Z′′ , Ξ′′ ) δ-feine
Zerlegungen von [a, c] und [d, b]. Wenn (Zk , Ξk ), k ∈ {1; 2}, zwei δ-feine Zerlegungen von [c, d]
sind, so sind
(Z̃k , Ξ̃k ) = (Z′ , Ξ′ ) ◦ (Zk , Ξk ) ◦ (Z′′ , Ξ′′ )
zwei δ-feine Zerlegungen von I. Auf Grund der Bedingung (1) an δ gilt also
σ(
Z̃
,
Ξ̃
,
f
)
−
σ(
Z̃
,
Ξ̃
,
f
)
< ε.
1
1
2
2
Nach (.3.2.6) gilt aber
σ(Z̃k , Ξ̃k , f ) = σ(Z′ , Ξ′ , f ) + σ(Zk , Ξk , f ) + σ(Z′′ , Ξ′′ , f ),
und es folgt σ(Z̃1 , Ξ̃1 , f ) − σ(Z̃2 , Ξ̃2 , f ) = |σ(Z1 , Ξ1 , f ) − σ(Z2 , Ξ2 , f )| < ε. Folglich ist (1)
auch für δ |J erfüllt, und der vorige Satz ergibt die Konvergenz des Integrales über J.
Bemerkung 1. Für bestimmt divergente Integrale ist der Satz falsch, wie man ziemlich
leicht einsieht: Aus der bestimmten Divergenz des Integrales von a nach b kann über das
Integral über das kleinere Teilstück nur gefolgert werden, daß es nicht in die entgegengesetzte
Richtung bestimmt divergiert.
86
Ähnlich wichtig ist der Satz, daß umgekehrt die Integrierbarkeit von Funktionen auf den
Teilstücken einer endlichen Zerlegung des Intervalles in Teilintervalle überprüft werden kann:
Satz 3. Sei a < b < c. Dann gilt
Z c
Z b
Z c
f (t) dt =
f (t) dt +
f (t) dt,
a
a
b
wobei das Integral auf der linken Seite genau dann konvergiert, wenn beide Summanden auf
der rechten Seite konvergieren.
Zur Vorbereitung des Beweises benötigen wir eine Definition:
Definition 1. Wir nennen eine Integraleichung ε-fein für f auf I, wenn
Z b
≤ε
(2)
f
(t)
dt
−
σ(Z,
Ξ,
f
)
a
für jede δ-feine Zerlegung (Z, Ξ) von I = [a, b] gilt. Wenn (Z, Ξ) eine δ-feine Zerlegung ist,
nennt man die Differenz
Z b
f (t) dt − σ(Z, Ξ, f )
(3)
a
eine δ-Diskrepanz von f auf I.
Bemerkung 2. Offenbar ist δ genau dann ε-fein für f auf I, wenn |d| ≤ ε für jde δDiskrepanz d von f auf I gilt.
Offenbar hat die Integrierbarkeit einer Funktion auf einem Intervall zur Folge, daß für jedes
ε > 0 eine ε-feine Eichung existiert. Wir können nun den Beweis des Satzes führen.
Rb
Rc
Beweis. Sei I = [a, b], I1 = [a, c], I2 = [b, c], ι1 = a f (t) dt, ι2 = c f (t) dt. Sei ε > 0. Für
k ∈ {1; 2} sei δ k eine εk -feine Integraleichung für f auf Ik , wobei ε1 und ε2 positive Zahlen mit
ε = ε1 + ε2 sind, zum Beispiel ε1 = ε2 = 2ε . Wir definieren eine Integraleichung δ auf I durch


min δ 1 (t), c − t a ≤ t < c
(4)
δ(t) = min δ 1 (t), δ 2 (t) t = c

min δ (t), t − c c < t ≤ d
2
Sei (Z, Ξ), gegeben durch a0 ≤ ξ1 ≤ a1 ≤ . . . ≤ ξn ≤ an , eine δ-feine Zerlegung von I. Nach
dem nachfolgenden Fakt 1 kommt c unter den Stützstellen ξ1 , . . . , ξn vor, es gibt also ein k mit
0 ≤ k ≤ n und ξk = c. Wir haben Zerlegungen (Zk , Ξk ) von Ik , die durch a0 ≤ ξ1 ≤ a1 ≤
. . . ≤ ξk ≤ cP
für k = 1 sowie c ≤ ξk ≤ a1 ≤ . . . ≤ ξn ≤ an für k = 2 gegeben sind. Es gilt
σ(Z, Ξ, f ) = 2k=1 σ(Zk , Ξk , f ),13 also
|ι1 + ι2 − σ(S, Ξ, f )| ≤
2
X
k=1
|ιk − σ(S, Ξk , f )| ≤ ε1 + ε2 = ε,
13Mit einem ähnlichen Beweis wie (.3.2.6), wobei aber zu beachten ist, daß nicht (Z, Ξ) = (Z , Ξ ) ◦ (Z , Ξ )
1
1
2
2
gilt, da das k-te Teilintervall von Z unter Z1 und Z2 aufgeteilt wird.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
und es ergibt sich die Konvergenz von
Rb
a
f (t) dt gegen ι1 + ι2 .
87
Die folgende Folgerung aus dem Beweis von Satz 3 wird im Folgenden noch nützlich sein:
Folgerung 1. Sei I = [a, b], a < c < b, und sei I˜ eines der Intervalle I1 = [a, c] oder
I2 = [b, c]. Unter den Voraussetzungen von Satz 3 an f existiert für beliebige positive Zahlen
˜
˜
ε̃ < ε und jede ε̃-feine Integraleichung
δ̃ auf I mit δ̃(t) < |t − c| für alle t ∈ I \ {c} eine ε
.
= δ̃ I\{c}
feine Integraleichung δ auf I mit δ I\{c}
˜
˜
Beweis. Wir betrachten zum Beispiel den Fall I˜ = I1 . Wir setzen ε1 = ε̃, ε2 = ε − ε̃,
δ 1 = δ̃. Sei δ 2 eine beliebige ε2 -feine Integraleichung auf I2 . Sei δ Eichung (4). Dann ist δ
ε-fein,
wie beim
Beweis von Satz 3 gezeigt wurde, und aus unserer Voraussetzung an δ̃ folgt
.
= δ̃ I\{c}
δ I\{c}
˜
˜
Bemerkung 3. Eine zu Satz 3 analoge Aussage gilt auch für bestimmt divergente Integrale.
Die linke Seite ist wohldefiniert (konvergent oder bestimmt divergent) genau dann, wenn die
Summanden auf der rechten Seite beide konvergieren oder bestimmt divergieren und nicht in
unterschiedliche Richtungen bestimmt divergieren.
Fakt 1. Sei c ∈ I = [a, b] und δ eine Integraleichung auf I mit δ(t) < |c − t| für t ∈ I \ {c}.
Ist die durch a = a0 ≤ ξ1 ≤ a1 ≤ . . . ≤ ξn = an gegebene Zerlegung (Z, Ξ) von I δ-fein, so gibt
es ein k mit 1 ≤ k ≤ n und ξk = c.
Wir stellen nun einige Fakten über Diskrepanzen und die Feinheit von Integraleichungen
auf Teilintervallen bereit.
Satz 4.
• Sei I = [a, b], a ≤ c ≤ b, I1 = [a, c], I2 = [c, d]. Wenn dk eine δ-Diskrepanz
für f auf Ik ist, so ist d1 + d2 eine δ-Diskrepanz für f aufRI.
b
• Wenn f eine auf I = [a, b] definierte Funktion ist, für die a f (t) dt konvergiert, so gibt
es für jedes ε > 0 und jede Integraleichung δ auf I eine δ-Diskrepanz d für f auf I mit
|d| < ε.
• Wenn δ eine Integraleichung auf I und J ein abgeschlossenes Teilintervall von I ist, so
gibt es zu jeder
δ |J -Diskrepanz d von f und jedem δ > 0 eine δ-Diskrepanz d˜ von f auf
I, so daß d − d˜ < δ gilt. Wenn δ eine ε-feine Eichung für f auf I ist, so ist δ |J eine
ε-feine Eichung für f auf J.
Beweis. Zum Beweis des ersten Punktes betrachten wir δ |Ik -feine Zerlegungen (Zk , Ξk )
Rb
von Ik mit dk = akk f (t) dt − σ Zk , Ξk , f |Ik , wobei wir a1 = a, a2 = b1 = c, b2 = b gesetzt
haben. Dann ist (Z, Ξ) = (Z1 , Ξ1 ) ◦ (Z2 , Ξ2 ) eine δ-feine Zerlegung von I, und nach Satz 3 und
(.3.2.6) gilt
Z b2
Z b1
f (t) dt − σ Z2 , Ξ2 , f |I2
f (t) dt − σ Z1 , Ξ1 , f |I1 +
d1 + d2 =
a1
a2
88
=
Z
a
b
f (t) dt − σ(Z, Ξ, f ),
also ist d1 + d2 eine δ-Diskrepanz für f auf I wie im ersten Punkt behauptet.
Zum Beweis des zweiten sei ε > 0 vorgegeben, dann wählt man eine ε-feine Eichung δ̃
für f . Eine min(δ, δ̃)-feine Zerlegung des Intervalles ist dann auch δ-fein und liefert dann eine
Diskrepanz für f vom Betrag ≤ ε.
Zum Beweis des dritten Punktes sei J = [c, d], K1 = [a, c], K2 = [d, b]. Dann ist I die
Vereinigung der Intervalle K1 , J und K2 , die sich nur in ihren Randpunkten schneiden. Nach
δ
˜
dem zweiten
Punkt
gibt es δ |Kl -Diskrepanzen dl für f auf Kl mit |dl | < 2 . Sei d = d1 + d + d2 .
Dann gilt d − d˜ = |d1 + d2 | < δ, und durch zweimalige Anwendung des ersten Punktes sieht
man, daß d˜ eine δ-Diskrepanz für f auf I ist. Der letzte Teil des letzten Punktes folgt nun aus
Bemerkung 2.
Satz 5. Wenn f integrierbar auf I = [a, b] ist, so ist
Z t
F (t) =
f (τ ) dτ
a
stetig auf I.
Beweis. Sei ε > 0 und sei δ eine 2ε -feine Integraleichung für f auf I. Sei t ∈ I und
ε .
(+)
|s − t| < min δ(t),
2 |f (t)|
Dann gilt
(*)
|F (s) − F (t)| < ε.
Im Fall s > t ist nämlich durch a0 = t = ξ1 < a1 = s eine δ-feine Zerlegung (Z, Ξ) von [t, s]
mit σ(Z, Ξ, f ) = (s − t)f (t) gegeben. Auf Grund von (+) gilt |σ(Z, Ξ, f )| < 2ε . Nach Satz 4 ist
δ 2ε -fein für f auf diesem Intervall, also gilt
Z s
ε ε
|F (s) − F (t)| = f (τ ) dτ − σ(Z, Ξ, f ) + |σ(Z, Ξ, f )| < + = ε.
2 2
t
Im Fall s < t betrachten wir analog dazu die Zerlegung (Z, Ξ) von [s, t] mit einem Teilstück
und t als Stützstelle. Diese ist wegen (+) δ-fein, und wie zuvor folgt |σ(Z, Ξ, f )| < 2ε aus (+).
Man erhält
Z t
ε ε
|F (s) − F (t)| = f (τ ) dτ − σ(Z, Ξ, f ) + |σ(Z, Ξ, f )| < + = ε.
2 2
s
In beiden Fällen ist also (*) bewiesen, und der Fall s = t ist trivial.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
89
Satz 6 (Satz von Hake). Die Funktion f sei auf I = [a, b] definiert. Wenn
alle α ∈ (a, b) konvergiert, so gilt
Z b
Z b
(5)
f (t) dt = lim
f (t) dt,
α↓a
a
Rb
α
f (t) dt für
α
wobei der Limes auf der rechten Seite genau dann konvergiert, wenn das Integral auf der linken
Seite konvergiert.
Ählich gilt
Z β
Z b
f (t) dt.
f (t) dt = lim
(6)
β↑b
a
a
Beweis. Wir beweisen nur die erste Aussage, der Beweis der zweiten geht analog dazu.
Sei dabei ι der Grenzwert auf der rechten Seite von (5).
Sei ε > 0 vorgegeben. Wir wählen eine Zahl δ > 0 mit
Z b
ε
f (t) dt <
(*)
ι −
3
α
für a < α < min(b, a + δ). Wir dürfen zusätzlich δ als so klein annehmen, daß
(%)
3δ |f (a)| < ε
gilt. Nach dem nachfolgenden Lemma 1 existiert
eine Funktion δ auf (a, b] mit positiven Funk
ε
tionswerten, so daß für jedes α ∈ (a, b] δ [α,b] 3 -fein ist. Wir dürfen noch annehmen, daß
(+)
δ(t) < t − a
für t ∈ (a, b]
gilt, andernfalls ersetz man δ(t) durch min( t−a
, δ(t)). Wir dehnen δ zu einer Integraleichung
2
auf [a, b] aus, indem wir δ(a) = δ setzen.
Sei (Z, Ξ), gegeben durch a = a0 ≤ ξ1 ≤ a1 ≤ ξ2 . . . ≤ ξn ≤ an = b, eine δ-feine Zerlegung
von I. Wir wollen
(@)
|ι − σ(Z, Ξ, f )| ≤ ε
zeigen, woraus dann unsere Behauptung folgt. Wir dürfen dabei a1 > a annehmen, denn sonst
kann man ohne Änderung der Riemannschen Summe die Anfangsstücke streichen. Weiter gilt
ξ0 = a0 , denn sonst wäre δ(ξ0 ) < ξ0 − a auf Grund von (+). Sei (Z′ , Ξ′ ) die durch a1 ≤ ξ2 . . . ≤
ξn ≤ an definierte Zerlegung von I ′ = [a1 , b], dann gilt σ(Z, Ξ, f ) = (a1 − a)f (a) + σ(Z′ , Ξ′ , f ′ ).
Es gilt also
Z b
Z b
′
′
′
f (t) dt − ι
f (t) dt + |σ(Z, Ξ , f ) − ι| ≤ |(a1 − a)f (a)| + σ(Z , Ξ , f ) −
a1
a1
ε ε ε
≤ + + = ε,
3 3 3
und (@) folgt. Wir haben auf der unteren Zeile nacheinander (%), die 3ε -Feinheit von δ [a1 ,b]
sowie (*) benutzt.
90
Lemma 1.
• Sei a eine reelle Zahl
R b oder −∞, und sei b > a eine reelle Zahl. Sei f
eine Funktion auf (a, b], so daß α f (t) dt für jedes α ∈ (a, b) konvergiert. Sei ε > 0.
Dann existiert
eine Funktion δ auf (a, b] mit positiven
Funktionswerten, so daß für jedes
α ∈ (a, b] δ [α,b] eine ε-feine Integraleichung für f [α,b] ist.
• Sei a eine reelle
R β Zahl, und sei b > a eine reelle Zahl oder ∞. Sei f eine Funktion auf
[a, b), so daß a f (t) dt für jedes β ∈ (a, b) konvergiert. Sei ε > 0. Dann existiert eine
Funktion δ auf [a, b) mit positiven Funktionswerten, so daß für jedes β ∈ [a, b) δ [a,β]
eine ε-feine Integraleichung für f [α,b] ist.
• Sei a eine reelle Zahl oder −∞,
R β und sei b > a eine reelle Zahl oder ∞. Sei f eine
Funktion auf (a, b), so daß α f (t) dt für alle α, β ∈ (a, b) konvergiert. Sei ε > 0.
Dann existiert eine Funktion
so daß für alle
δ auf (a, b) mit positiven Funktionswerten,
α, β ∈ (a, b) mit α < β δ [α,β] eine ε-feine Integraleichung für f [α,β] ist.
Beweis. Wir betrachten z. B. den ersten Punkt, die beiden anderen gehen analog dazu.
Sei ak = a + 2−k (b − a). Wir konstruieren durch Induktion nach k > 0 eine εk = ε(1 − 2−k )feine Integraleichung δ k auf [ak , bk ] mit
δ k (t) < t − ak für t > ak
und δ k (ak−1 ,b] = δ k−1 (ak−1 ,b] und δ k (ak−1 ) ≤ δ k−1 (ak−1 ) für k > 2. Im Fall k = 1 kann einfach
irgendeine ε1 -feine Eichung auf [a1 , b] mit (+) genommen werden. Ist δ k−1 schon konstruiert,
so findet man wegen εk−1 < εk δ k durch Anwendung von Folgerung 1. Für t ∈ (a, b] wählen
wir irgendein
k mit t ∈ (ak , b] und setzen δ(t) = δ k (t), wobei dieser Wert nicht von k abhängt.
Dann ist δ [ak ,b] εk < ε-fein. Für α > a kann ein k mit ak ≤ α gefunden werden, und aus dem
dritten Punkt Satz 4 folgt, daß δ [α,b] ε-fein ist. Also leistet δ das Gewünschte.
(+)
Folgerung 2. Das Ändern endlich vieler Funktionswerte von f ändert nichts an der
Integrierbarkeit oder dem Wert des Integrales von f .
Beweis. Wir betrachten zunächst konvergente Integrale. Nach dem Satz von Hake und
Satz 5 gilt die Behauptung für den Fall der Änderung des Funktionswertes an einem Intervallanfangs- oder Endpunkt. Der allgemeine Fall konvergenter Integrale kann wegen Satz 2 und
Satz 3 auf diesen Fall zurückgeführt werden.
Im Fall bestimmt divergenter Integrale nutzt man aus, daß das Ändern des Funktionswertes
an einem Punkt um betragsmäßig ≤ d jede Riemannsche Summe um betragsmäßig höchstens
d(b − a) verändert.
Bemerkung 4. Die Folgerung gestattet es uns, auch Integranden zu betrachten, die an
endlich vielen Stellen nicht wohldefiniert sind, so wie etwa f (t) = √1t auf [0, 1]. Der Integrand
ist an der Stelle t = 0 nicht wohldefiniert. Nach der Folgerung aus dem Satz von Hake kann
man für den fehlenden“ Funktionswert an dieser Stelle einen beliebigen Wert einsetzen und
”
erhält stets Funktionen mit denselben Integrierbarkeitseigenschaften bzw. demselben Wert des
Integrales.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
91
√
Bemerkung 5. Im Fall des Integranden f (t) = √1t aus dem vorigen Beispiel ist F (t) = 2 t
eine Stammfunktion des Integranden auf [ε, 1] für jedes ε > 0. Es gilt also
Z 1
√
dt
√ = 2 − 2 ε.
t
ε
Da diese Werte für ε ↓ 0 gegen 2 konvergieren, gilt
Z 1
Z 1
dt
dt
√ = lim
√
(7)
ε↓0 ε
t
t
0
√
= lim 2(1 − ε) = 2.
ε↓0
In der klassischen Riemannschen Theorie war die obere Zeile von (7) nicht die Folge eines
Satzes (wie bei uns des Satzes von Hake), sondern mußte zur Definition des Integrales auf
der linken Seite als uneigentliches Integral herangezogen werden. Da wir mit der technisch
stärkeren Henstock-Kurzweilschen Integraldefinition arbeiten, haben wir diese Vorgehensweise
nur bei Integralen von −∞ bis ∞ oder über unendliche Halbachsen nötig.
Definition 2.
• Sei a ∈ R. Für eine auf [a, ∞) (bzw. auf (−∞, a]) mit
R ∞der möglichen
Ausnahme endlich vieler Stellen definierte Funktion f sagen wir, daß a f (t) dt (bzw.
Ra
Rb
Ra
f (t) dt für
f
(t)
dt
für
jede
reelle
Zahl
b
>
a
(bzw.
f
(t)
dt)
konvergiert,
wenn
b
a
−∞
jede reelle Zahl b < a) konvergiert und der Grenzwert
Z b
Z ∞
f (t) dt
f (t) dt := lim
b→∞
a
bzw.
Z
a
f (t) dt := lim
b→−∞
−∞
a
Z
a
f (t) dt
b
konvergiert.
• Sei
R ∞ sagen, daß
R ∞ f auf R mit möglicher Ausnahme endlich vieler Stellen definiert. Wir
f (t) dt und
f
(t)
dt
konvergiert,
wenn
für
ein
(bzw.
jedes)
a
∈
R
die
Integrale
a
R−∞
a
f (t) dt konvergieren. In diesem Fall setzen wir
−∞
Z ∞
Z a
Z ∞
f (t) dt,
f (t) dt +
f (t) dt :=
(8)
−∞
dieser Wert ist unabhängig von a.
−∞
a
Daß die Frage der Konvergenz des Integrales von −∞ bis ∞ sowie der Wert von (8) in der
Tat von a unabhängig sind, folgt leicht aus Satz 3.
Im Prinzip könnte die Verwendung uneigentlicher Integrale ganz vermieden werden, indem
man eine direkte Definition der in Definition 2 betrachteten Integrale gibt, ähnlich der folgenden
Definition von bestimmte Divergenz“ in diesem Fall, die wir hier ohne weitere Erläuterung
”
(und ohne detailierten Nachweis der Äquivalenz zur vorherigen Definition in Fällen, in denen
diese anwendbar ist) mitteilen.
92
Rb
Definition 3. Wir sagen, daß a f (t) dt bestimmt gegen ∞ divergiert, wenn für jede reelle
Zahl R Zahlen ã > a und b̃ < b existieren, so daß für α ∈ (a, ã) und β ∈ (b̃, b) eine Funktion
δ→ (0, ∞) existiert, so daß
(α, β) −−
(9)
σ(Z, Ξ, f ) > R
für jede δ-feine Zerlegung (Z, Ξ) von [α, β] gilt.
Rb
Rb
Bemerkung 6. Wenn die Integrale α f (t) dt konvergieren, der Limes limα↓a α f (t) dt daRb
gegen bestimmt divergiert, so ist a f (t) dt im Sinne der vorigen Definition bestimmt divergent.
Wir nehmen dazu zum Beispiel an, daßR der Limes gegen ∞ bestimmt divergiert. Dann gibt
β
es für alle R > 0 ein ã, b̃ ∈ (a, b) mit α f (t) dt > R + 1 für alle α ∈ (a, ã) und β ∈ (b̃, b).
δ→ (0, ∞), so daß für alle derartigen α
Weiterhin
gibt es nach Lemma 1 eine Funktion (a, b] −−
δ (α,b] eine 1-feine Integraleichung ist. Es folgt (9) für jede δ-feine Zerlegung von (α, β).
Satz 7. Sei f eine auf [0, ∞) definierte Funktion mit nichtnegativen Funktionswerten, so
daß
Z T
f (t) dt
(10)
0
jedes T > 0 konvergiert. Wenn die Menge der Zahlen (10) beschränkt ist, so konvergiert
Rfür
∞
f
(t) dt. Andernfalls divergiert dieses Integral bestimmt gegen ∞.
0
Rn
Beweis. Sei In = 0 f (t) dt. Ist die Menge der Zahlen (10) beschränkt, so bilden die IN
eine monontone beschränkte Folge reeller Zahlen, und es konvergiert I = limn→∞ In . Sei ε > 0
vorgegeben. Wir wählen ein n mit In > I − ε. Sei T > n, dann gilt
Z ⌈T ⌉
Z T
f (t) dt = I⌈T ⌉ ≤ I,
f (t) dt ≤
I − ε < In ≤
0
0
RT
woraus I − 0 f (t) dt < ε folgt. Also ist I der Limes der Integrale (10).
Wenn hingegen die Menge der Werte der Integrale (10) unbeschränkt ist, so gibt es für
Rβ
R1
RT
> R + 0 f (t) dt. Dann gilt α f (t) dt > R für α ∈ (0, 1) und
jedes R > 0 ein T mit 0 f (t) dt
R∞
β ∈ (T, ∞). Folglich divergiert 0 f (t) dt im Sinne von Definition 3 gegen ∞.
Satz 8 (Majorantenkonvergenzkriterium für uneigentliche Integrale). Sei f eine auf [0, ∞)
definierte Funktion mit reellen oder komplexen Funktionswerten, so daß (10) für jedes T ∈
(0, ∞) konvergiert
R ∞ und eine Funktion m auf [0, ∞) mit nichtnegativen Funktionswerten exisim(t) dt konvergiert und |f (t)| ≤ m(t) für alle t ∈ [0, ∞) gilt. Dann konvergiert
tiert,
für
die
0
R∞
f (t) dt.
0
Rn
Rn
Beweis. Sei Ik = 0 f (t) dt und Jk = 0 m(t) dt. Nach Voraussetzung konvergiert die
Folge Jk , insbesondere ist diese Folge eine Cauchy-Folge. Wegen
Z l
Z k
|Il − Ik | = f (t) dt ≤
m(t) dt = Jl − Jk
k
l
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
93
bildet auch die Folge der Il eine Cauchy-Folge. Daher existiert I = liml→∞ Il . Wir zeigen, daß I
der Limes für R → ∞ der Integrale (10) ist, womit der Nachweis der Konvergenz dann erbracht
ist. Sei dazu ε > 0, wir wählen n mit |I − In | < 2ε und mit |Jl − Jn | < 2ε für l > n. Sei R > n,
dann gilt
Z
Z R
Z R
ε R
I −
≤ |I − In | + In −
≤
< +
f
(t)
dt
f
(t)
dt
f
(t)
dt
2 0
n
0
Z R
Z ⌈R⌉
ε
ε
ε ε
ε
m(t) dt ≤ +
m(t) dt = + J⌈R⌉ − Jn < + = ε,
≤ +
2
2
2
2 2
n
n
womit I in der Tat der Limes der Integrale (10) ist.
Die soeben bewiesenen Sätze sind offenbar Analoga von Satz .2.3.1 sowie des ersten Teiles
von Satz .2.3.4. Dieser Zusammenhang sowie die Tatsache, daß die Berechnung von Stammfunktionen oft einfacher ist als das Auffinden von Summenformeln, legen es nahe, ein Kriterium
anzugeben, daß die Frage der Konvergenz oder Divergenz gewisser unendlicher Summen auf die
analoge Frage für gewisse Integrale zurückführt. Das folgende Integralkriterium von Cauchy
leistet dies in der Tat.
Satz 9 (Integralkriterium). Sei f eineR monoton fallende Funktion auf [0, ∞) mit
Pnichtnega∞
tiven Funktionswerten. Dann konvergiert 0 f (t) dt genau dann, wenn die Summe ∞
n=0 f (t) dt
konvergiert.
Beweis. Wir führen den Beweis nur unter der Zusatzannahme, daß (10) für jedes endliche
R ⌈R⌉
RR
R konvergiert.14 Nach Satz 7 und wegen 0 f (t) dt ≤ 0 f (t) dt
R nist die Frage der Konvergenz
des Integrales äquivalent zur Beschränktheit der Folge der In = 0 f (t) dt für natürliche Zahlen
n. Wir haben
n Z k
X
In =
f (t) dt,
k=1
k−1
und auf Grund der Monotonie von f ist der Integrand im k-ten Summanden ≥ f (k) und
≤ f (k − 1). Es folgt
n
n−1
X
X
f (k) ≤ In ≤
f (k),
k=1
k=0
die Beschränktheit der Folge
P∞der In ist daher äquivalent zur Beschränktheit der Folge der
endlichen Teilsummen von n=0 f (n). Die Behauptung folgt nun aus Satz .2.3.1.
Beispiel 1. Der Satz kann zur Untersuchung der Konvergenz von
∞
X
(11)
n−λ
n=1
14Die
Konvergenz dieses Integrales folgt aus der Monotonieforderung an f , was an dieser Stelle aber nicht
gezeigt werden soll. Siehe dazu Satz .3.14.2 und Aufgabe .3.14.1.
94
1−λ
mit λ > 0 herangezogen werden. Die Stammfunktion des Integranden auf [1, ∞) ist t1−λ für
λ 6= 1 bzw. log(t) für λ = 1. Sie hat genau im Fall λ > 0 für t → ∞ einen Grenzwert, also
konvergiert (11) genau in diesem Fall, wie wir früher schon gesehen hatten.
3.11. Anwendung der Integralrechnung auf die Bogenlänge von Kurven.
~x
V eine Funktion, welche
Regel 1. Sei V ein Euklidischer Vektorraum und I = [a, b] −→
stetig differenzierbar ist.15 Dann ist die Bogenlänge der durch f parametrisierten Kurve durch
Z b
˙ dt
~x(t)
(1)
ℓ=
a
gegeben. Insbesondere gilt
(2)
Z bp
ẋ1 (t)2 + · · · + xn (t)2 dt
ℓ=
a
n
im Falle V = R und ~x(t) = x1 (t), . . . , xn (t) . Im Spezialfall n = 2 erhält man
Z bp
(3)
ℓ=
1 + f ′ (t)2 dt
a
für die Länge des Graphen der Funktion f , welche stückweise C 1 auf [a, b] ist.
Bemerkung 1. Um diese Formel zu begründen, bezeichnen wir ihre rechte Seite mit ℓ und
betrachten nur den Fall, daß ~x auf [a, b] stetig differenzierbar ist. Sei durch a = a0 < · · · < an = b
eine Riemannsche Zerlegung von I = [a, b] gegben. Bei genügend kleiner Schrittlänge kann man
sich den von den ~xi = ~x(ai ) für 0 ≤ i ≤ n (in dieser Reihenfolge) gebildeten Polygonzug als eine
Approximation an die durch ~x parametrisierte Kurve vorstellen. Die Länge dieses Polygonzuges
ist
Z
n
n
X
X
ai
˙
ℓ̃ =
k~xi − ~xi−1 k =
~x(λ)
dλ.
i=1
i=1
ai−1
Aus unseren Voraussetzungen und Satz .2.4.716 folgt, daß die Funktion ~x˙ gleichmäßig stetig auf
I ist. Sei ε > 0 gegeben, es gibt ein δ > 0 mit
ε
˙ <
˙
~x(s)
für s, t ∈ I und |s − t| < δ.
(4)
− ~x(t)
2(b − a)
15Mit
anderen Worten sollen die einzelnen Komponenten xi (t) von x(t) für 1 ≤ i ≤ n stetig differenzierbar
sein. Wir setzen dann x′ (t) = x′1 (t), . . . , x′n (t) .
16Wobei Satz .2.4.7 von uns nur für skalarwertige Funktionen formuliert und bewiesen wurde, also strenggenommen nicht direkt anwendbar ist. Die nachfolgenden Überlegungen werden aber legitimiert durch die
ε √
Anwendung des Satzes auf die stetige Funktion x′i , wonach es ein δi > 0 mit |x′i (s) − x′i (t)| < 2(b−a)
für
n
s, t ∈ I und |s − t| < δi gibt. Mit δ = min(δ1 , . . . , δn ) gilt dann (4). Analog dazu kann die Anwendung von im
skalarwertigen Fall bewiesenen Regeln der Integral- und Differentialrechnung auf den Fall Rn -wertiger Funktionen in einigen der folgenden Überlegungen durch separate Behandlung der einzelnen Vektorkomponenten
legitimiert werden, was hier aber nicht genauer ausgeführt werden soll.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
95
Wenn die Schrittweite der Zerlegung < δ ist, kann ℓ − ℓ̃ wie folgt abgeschätzt werden:
Z ai
n Z ai
X
˙~x(λ) dλ −
ℓ − ℓ̃ = ˙~x(λ) dλ ai−1
i=1
n Z
X
=
≤
≤
≤
≤
i=1
n X
i=1
n
X
i=1
n
X
i=1
n
X
i=1
ai
ai−1
Z
˙~x(λ) dλ − ai−1
ai
ai
Z
˙~x(λ) dλ − ai−1
ai
ai
Z
ai
(ai − ai−1 )
ai
ai−1
Z
˙~x(ai−1 ) dλ + ˙~x(ai−1 ) dλ −
ai−1
Z
ai
ai−1
Z
ai
ai−1
Z
ai
ai−1
˙ i−1 ) dλ + ~x(a
˙
˙ i−1 ) dλ + ~x(λ)
−~x(a
ai−1
Z
ai−1
˙
~x(λ)
dλ −
ai−1
Z
˙ i−1 ) dλ +
~x(a
ai−1
Z
Z
ai
˙~x(ai−1 ) dλ −
ai
ai−1
Z
˙~x(λ) dλ ai
ai−1
˙~x(ai−1 ) − ˙~x(λ) dλ
˙~x(λ) dλ
˙~x(ai−1 ) − ˙~x(λ) dλ
ε
ε
+ (ai − ai−1 )
= ε.
2(b − a)
2(b − a)
Der Übergang von der ersten Zeile
ist dadurch gerechtfertigt, daß die neu hinzuge zur zweiten
˙
kommenen Terme ±(ai − ai−1 ) ~x(ai−1 ) sind und sich gegenseitig wegheben. Beim Übergang
zur letzten Zeile wurden die Integrale gemäß (.3.7.2) durch Länge des Integrationsweges mal
Schranke für die Norm (bzw. den Betrag) des Integranden abgeschätzt. Ansonsten wurden nur
Standard-Umformungen von Integralen gemäß Satz .3.2.1 benutzt.
Die Differenz aus der Länge des Polygonzuges und ℓ wird also für genügend feine Polygonzüge beliebig klein. Das rechtfertigt es, ℓ als Länge der Kurve zu betrachten.
Ohne nähere Begründung teilen wir noch die folgende Regel zur Berechnung der von den
Fahrstrahlen, die den Koordinatenursprung mit den Punkten einer Kurve im R2 verbinden,
überstrichen wird. Es handelt sich um eine orientierte Fläche, bei der gegen den Uhrzeigersinn
(alos in mathematisch positiver Richtung) überstrichene Flächenanteile positiv und die übrigen
negativ zählen.
x(·), y(·)
Regel 2 (Leibnizsche Sektorformel). Sei I = [a, b] −−−−−−−−−→ R2 stetig
differenzier
bar, dann ist die orientierte Fläche, die der Fahrstrahl von 0 bis x(t), y(t) für a ≤ t ≤ b
überstreicht, durch
Z
1 b
′
′
x(t)y (t) − x (t)y(t) dt
(5)
2 a
gegeben.
3.12. Der Satz über die monotone Konvergenz. Wir beginnen mit dem Beweis des
folgenden Satzes:
96
Satz 1 (Saks-Henstock-Lemma). Seien a < b reelle Zahlen. Die Eichung δ sei ε-fein für f
N
Rb
auf I = [a, b], wobei wir a f (t) dt als konvergent voraussetzen. Sei (ak , bk ) k=1 , N ∈ N ∪ {∞},
eine endliche Folge von paarweise disjunkten offenen Teilintervallen von I. Für jede natürliche
Zahl k zwischen 1 und N sei eine Zahl ξk ∈ [ak , bk ] mit
bk − ak < δ(ξk )
(1)
gegeben. Dann gilt
X
Z
N (2)
bk
ak
k=1
f (t) dt − (bk − ak )f (ξk ) ≤ ε
für jede Teilmenge K von {1; . . . ; n}. Allgemeiner gilt ohne die Voraussetzung der ε-Feinheit
von δ, aber unter Beibehaltung der Fordurungen (1) und ξk ∈ [ak , bk ] sowie der paarweisen
Disjunktheit der Intervalle (ak , bk ), daß für jedes δ > 0 eine δ-Diskrepanz d von f mit
X
Z
N bk
(3)
f (t) dt − (bk − ak )f (ξk ) − d < δ
ak
k=1
existiert.
Beweis. Es genügt, unsere Behauptung über (3) zu beweisen. Danach kann nämlich in der
Situation von (2) für jedes ε̃ > ε (3) mit δ = ε̃ − ε angewendet werden. Da die Integraleichung
δ ε-fein ist, gilt |d| ≤ ε für jede δ-Diskrepanz d von f auf [a, b]. Aus (3) ergibt sich also
X
Z
N bk
f (t) dt − (bk − ak )f (ξk ) ≤ ε + δ = ε̃,
k=1
ak
und durch Grenzübergang ε̃ ↓ ε folgt (2).
Auf Grund unserer Disjunktheitsannahme über die betrachteten Teilintervalle dürfen annehmen, daß diese so geordnet sind, daß a1 ≤ b1 ≤ a2 ≤ b2 ≤ . . . ≤ aN ≤ bN gilt.
Zum Beweis von (3) gehen wir durch Induktion nach N vor. Im Fall N = 0 ist die Summe in
(3) leer und hat daher den Wert 0, und man muß nur zeigen, daß es δ-Diskrepanzen von beliebig
kleinem Betrag gibt, was in Satz .3.10.4 schon getan wurde. Sei N ≥ 1 und die Behauptung
für den Fall von N − 1 Teilintervallen schon gezeigt. Wir beweisen sie für den Fall von N
Teilintervallen zunächst unter der Voraussetzung bN = b. Nach der Induktionsannahme gibt es
eine δ-Diskrepanz d1 für f auf [a, aN ] mit
N
−1Z bk
X
f (t) dt − (bk − ak )f (ξk ) − d1 < δ.
k=1
ak
Rb
Wegen bN − aN < δ(ξN ) ist außerdem d2 = aNN f (t) dt − (bN − aN )f (ξN ) eine δ-Diskrepanz
für f auf [aN , bN = [aN , b]. Nach dem ersten Punkt von Satz .3.10.4 ist d = d1 + d2 eine δ-
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Diskrepanz für f auf I, und für diese gilt
X
N
Z
−1Z
N bk
X
f (t) dt − (bk − ak )f (ξk ) − d = k=1
ak
bk
ak
k=1
97
f (t) dt − (bk − ak )f (ξk ) − d1 < δ.
Wir betrachten nun den Fall bN < b. Durch Anwendung der Behauptung über (3) im schon
erledigten Fall bN = b auf [a, bN ] erhält man die Existenz einer δ-Diskrepanz d1 für f auf [a, bN ]
mit
X
Z
N bk
δ
< ,
f
(t)
dt
−
(b
−
a
)f
(ξ
)
−
d
k
k
k
1
2
a
k
k=1
und auf Grund von Satz .3.10.4 gibt es eine δ-Diskrepanz d2 für f auf [bN , b] mit |d2 | < 2δ . Nach
Satz .3.10.4 ist d = d1 + d2 eine δ-Diskrepanz für f auf I, und für diese gilt offenbar (3). Theorem 4 (Satz über die monotone Konvergenz). Sei (fn ) eine monoton wachsende
Rb
oder fallende Folge reellwertiger Funktionen, für die die Integrale a fn (t) dt konvergieren. Wir
setzen voraus, daß die Folge fn punktweise gegen die Funktion f konvergiert. Dann gilt
Z b
Z b
(4)
f (t) dt = lim
fn (t) dt,
a
n→∞
a
wobei beide Seiten konvergieren oder bestimmt divergieren.
Beweis. Wir dürfen uns auf den Fall monoton wachsender Folgen beschränken, sonst ersetzen wir fk durch −fk . Weiterhin dürfen wir fk ≥ 0 voraussetzen, sonst ersetzen wir fk durch
fk − f0 . Wir setzen zunächst a und b als endlich voraus.
Rb
Wenn die rechte Seite bestimmt divergiert, so kann für jedes K ∈ R ein n mit a fn (t) dt >
K + 1 gefunden werden. Ist δ 1-fein für fn auf [a, b], so gilt
σ(Z, Ξ, f ) ≥ σ(Z, Ξ, fn ) > K + 1 − 1 = K
Rb
für jede δ-feine Zerlegung. Also divergiert a f (t) dt bestimmt gegen ∞, wie für diesen Fall
behauptet.
Wir setzen also voraus, daß der Limes auf der rechten Seite eine reelle Zahl ι ist. Wir wollen
zeigen, daß das Integral auf der linken Seite gegen ι konvergiert. Sei dazu ε > 0. Wir wählen
ko > 0 so groß, daß
Z b
ε
fko (t) dt > ι −
(%)
3
a
für k ≥ ko gilt. Für derartige k wählen wir eine Integraleichung δ k auf I = [a, b], welche 2−k 3ε fein für fk ist.
Für x ∈ I wählen wir ein k = κ(x) ≥ ko mit
ε
(+)
fk (x) > f (x) −
3(b − a)
und setzen δ(x) = δ k (x).
98
Sei (Z, ξ) eine δ-feine Zerlegung von I in N Teile, dann gilt offenbar
σ(Z, Ξ, f ) =
∞
X
X
k=ko k=κ(ξn )
f (ξn )(an − an − 1).
Nach (+) folgt
∞
X
X
ε
σ(Z, Ξ, f ) −
fk (ξn )(an − an−1 ) < .
3
k=k
(@)
o
κ(ξn )=k
Durch Anwendung des Saks-Henstock-Lemmas auf die Menge der Intervalle (an−1 , an ) mit
κ(ξn ) = k folgt
X Z an
ε
fk (ξn )(an − an−1 ) −
fk (t) dt ≤ 2−k .
3
an−1
κ(ξn )=k
Summation üer k liefert
X
Z
∞ X fk (ξn )(an − an−1 ) −
an
ε
fk (t) dt ≤ 2−k ,
3
an−1
k=ko κ(ξn )=k
und zusammen mit (@) ergibt sich
∞
X Z
X
(&)
σ(Z, Ξ, f ) −
k=ko κ(ξn )=k
an
2ε
fk (t) dt < .
3
an−1
Sei k− = min κ(ξ1 ), . . . , κ(ξn ) und k+ = max κ(ξ1 ), . . . , κ(ξn ) , dann gilt ko ≤ k− ≤ k+ , und
Z
a
b
fk− (t) dt =
N Z
X
n=1
≤
≤
an
an−1
fk− (t) dt =
k=ko κ(ξn )=k
∞
X Z
X
k=ko κ(ξn )=k
an
an
an−1
fk− (t) dt
fk (t) dt
an−1
∞
X Z
X
k=ko κ(ξn )=k
∞
X Z
X
an
fk+ (t) dt =
an−1
N Z
X
n=1
an
fk+ (t) dt =
an−1
Z
b
fk+ (t) dt.
a
Auf Grund von (%) folgt
X
Z
∞ X
k=ko κ(ξn )=k
an
ε
fk (t) dt − ι < ,
3
an−1
und zusammen mit (&) folgt |σ(S, Ξ, f ) − ι| < ε für jede δ-feine Zerlegung. Damit ist gezeigt,
Rb
daß a f (t) dt wie behauptet gegen ι konvergiert.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
99
Wir betrachten nun auch unendliche a und b und setzen zunächst voraus, daß der Limes ι
auf der linken Seite von (4) endlich ist. Dann gilt
Z β
Z β
Z b
f (t) dt = lim
fn (t) dt ≤ lim
fn (t) dt = ι
α
n→∞
n→∞
α
a
für a < α < β < b, durch Anwendung des bisher bewiesenen Spezialfalles auf das
R b beschränkte
Intervall [α, β]. Durch Anwendung von Satz .3.10.7 folgt die Konvergenz von a f (t) dt, sowie
Rb
Rb
Rb
f (t) dt ≤ ι. Andererseits gilt a fn (t) dt ≤ a f (t) dt wegen fn < f , und durch Grenzübera
Rb
gang n → ∞ folgt ι ≤ a f (t) dt. Damit ist (4) im dem Fall vollständig bewiesen, daß die linke
Seite endlich ist.
3.13. Nullmengen und die Differenzierbarkeit fast überall. Für ein Intervall I =
[a, b] nennen wir |I| = b − a die Länge von I.
Definition 1. Eine Teilmenge X von R ist eine Nullmenge, wenn für jedes ε > 0 eine
Folge (Ik )K
k=1 , K ∈ N ∪ {∞}, von Intervallen mit
X⊆
(1)
existiert, so daß
∞
X
(2)
k=0
gilt.
K
[
Ik
k=1
|Ik | < ε
Bemerkung 1. Anschaulich gesehen ist also eine Nullmenge eine Teilmenge von R, die
durch Intervalle beliebig kleiner Gesamtlänge überdeckt werden kann, wobei die Überdeckungen
endlich oder abzählbar unendlich sein können.
Bemerkung 2. Genauer gesagt handelt es sich bei den hier betrachteten Nullmengen um
die Nullmengen bzgl. des Lebesgueschem Maßes auf R, im Sinne der Lebesgueschen Maßtheorie,
worauf an dieser Stelle nicht näher eingegangen werden soll.
Fakt 1.
• Jede Teilmenge einer Nullmenge ist eine Nullmenge.
• Ist (Xk )N
(abzählbar) unendliche Folge von Nullk=1 , N ∈ N ∪ {∞}, eine endliche oder
SN
mengen Xk , so ist auch deren Vereinigung k=1 Xk eine Nullmenge.
• Jede endliche oder abzählbar unendliche Teilmenge von R ist eine Nullmenge.
Beweis. Die erste Behauptung ist eine triviale Folgerung der
S∞Definitionen. Zum Beweis
der
zweiten
wählt
man
für
jedes
ε
>
0
eine
Überdeckung
X
⊆
k
l=0 Ik,l durch Intervalle mit
P∞
−k
l=0 |Il | < 2 ε. Dann ist
∞
n
N X
[
[
Ik,l
Xk ⊆
k=1
k=1 l=0
100
eine abzählbare Überdeckung17 mit
∞
N X
[
k=1 l=0
|Ik,l | <
N
X
k=1
ε2−k ≤ ε
∞
X
2−k = ε,
k=1
und die zweite Behauptung folgt.
Eine einelementige Menge {x} ⊆ R ist ein abgeschlossenes Intervall der Länge 0 und daher
eine Nullmenge. Endliche oder abzählbare Teilmengen von R sind folglich als endliche oder
abzählbare Vereinigungen von Nullmengen ebenfalls Nullmengen, und alle Behauptungen sind
bewiesen.
Unser Ziel in diesem Abschnitt ist der Beweis des Satzes, wonach eine Menge genau dann
eine Nullmenge ist, wenn das Henstock-Kurzweil-Integral ihrer charakteristischen Funktion
verschwindet. Wir benötigen zwei Sätze bzw. Lemmata als Vorbereitung.
Lemma 1. Sei f eine Funktion auf R mit nichtnegativen reellen Funktionswerten.
Wenn
R∞
für jedes ε > 0 eine Funktion fε mit f (t) ≤ fε (t) für alle t ∈ R existiert, so daß −∞ fε (t) dt < ε
R∞
gilt, so gilt −∞ f (t) dt = 0.
Beweis. Sei δ eine ε/2-feine Integraleichung für fε/2 . Für jede δ-feine Zerlegung gilt dann
Z ∞
ε
0 ≤ σ(Z, Ξ, f ) ≤ σ(Z, Ξ, fε/2 ) ≤
fε/2 (t) dt + < ε.
2
−∞
R∞
Folglich konvergiert das HK-Integral −∞ f (t) dt gegen 0.
Unsere zweite Vorbereitung ist der Überdeckungssatz von Vitali.
Satz 1 (Überdeckungssatz von Vitali). Sei M ein metrischer Raum, für den zu jedem ε > 0
eine endliche Zahl Nε existiert, so daß in M nich mehr als Nε paarweise disjunkte Kugeln vom
Radius ≥ ε existieren. Sei X ⊆ M eine Teilmenge. Für jedes x ∈ X sei eine reelle Zahl Rx > 0
gegeben. Wir setzen voraus, daß {Rx |x ∈ X} beschränkt ist. Dann existiert eine endliche oder
N
abzählbar unendliche Folge (Ki )N
i=1 = K ri (xi ) i=1 , N ∈ N ∪ ∞, von abgeschlossenen Kugeln
in M mit Mittelpunkt xi ∈ X und Radius ri = Rxi , so daß folgende Eigenschaften erfüllt sind:
• Die Kugeln Ki sind paarweise disjunkt.
• Die Kugeln K 5ri (xi ) mit demselben Mittelpunkt und dem fünffachen Radius wie Ki
S
S
überdecken x∈X K Rx (x), also insbesondere X ⊆ N
i=1 K 5ri (xi ).
Bemerkung 3. Die Zahl 5 aus dem letzten Punkt ist etwas willkürlich gewählt, kann aber
nicht beliebig klein gemacht werden. Jede Zahl > 3 kann statt 5 genommen werden.
Beweis. Wenn l ≥ 1 ist und die Kugeln K1 , . . . , Kl−1 schon definiert sind, so sei Xl die
Menge aller x ∈ X, für die K Rx (x) disjunkt zu den bisher ausgewählten Kugeln K1 , . . . , Kl−1
17Die
Glieder der Doppelfolge Ik,l können nach dem ersten Cantorschen Diagonalprinzip so durchnumeriert
werden, daß eine Einfachfolge entsteht
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
101
ist (also insbesonere X1 = X). Wenn Xl leer ist, bricht die Auswahl der Kugeln mit N = l ab.
Andernfalls wählen wir xl so, daß
1
(+)
Rx ≥ sup Rξ ξ ∈ Xl
2
gilt. Dies ist auf Grund von Definition .2.5.1 möglich.
Die erste der obigen beiden Behauptungen über die Kugeln Kxi (ri ) ist auf Grund unserer
Auswahl der xi erfüllt. Zum Nachweis der zweiten bemerken wir zunächst, daß entweder l
endlich ist oder
(%)
lim ri = 0
i→∞
gilt. Sei nun x ∈ X, wir wollen
(*)
K Rx (x) ⊆
N
[
K ri (xi )
i=1
zeigen. Wenn x unter den xi vorkommt, ist das klar. Wir setzen also voraus, daß x nicht unter
den xi vorkommt.
Wenn eine ganze Zahl i mit 1 ≤ i ≤ N ri < Rx /2 existiert, so sei j das kleinste derartige i.
Dann gilt x 6∈ Xj , denn sonst stünde die Wahl von xj im j-ten Schritt im Widerspruch zu (+).
Wegen x 6∈ Xj muß es ein i mit 1 ≤ i < j geben, so daß K Rx (x) zu K ri (xi ) nicht disjunkt ist.
Dann gilt d(x, xi ) ≤ Rx + ri . Auf Gund der Minimalität von j gilt Rx ≤ 2ri , also d(x, xi ) ≤ 3ri
und K Rx (x) ⊆ K 5ri (xi ). Damit ist (*) in diesem Fall bewiesen.
Wir nehmen nun an, daß kein i mit ri < Rx /2 existiert. Wegen (%) bricht die Auswahl
der xi an einer Stelle ab, N ist also endlich und XN leer, und für alle natürlichen Zahlen i mit
0 < i < N gilt ri ≥ Rx /2. Damit greift dasselbe Argument wie zuvor: Es muß ein derartiges
i mit K ri (xi ) ∩ K Rx (x) 6= ∅ geben, denn sonst wäre x ∈ XN und XN wäre nicht leer. Dann
gilt d(x, xi ) ≤ ri + Rx ≤ 3ri nach der Dreiecksungleichung und wegen ri ≥ Rx /2, und es folgt
K Rx (x) ⊆ K ri (xi ).
Dieser Satz von Vitali ist das entscheidende technische Hilfsmittel für diesen Unterabschnitt.
Wir wollen uns davon überzeugen, daß er für jedes endliche R auf den metrischen Raum
I = [−R, R] anwendbar ist.
Lemma 2. Seien a < b reelle Zahlen und ε > 0, dann hat jede Menge X von paarweise disjunkten abgeschlossenen Kugeln vom Radius ≥ ε in dem metrischen Raum I = [a, b] höchstens
b−a
+ 2 Elemente.
2ε
Beweis. Sei x ∈ I, r > 0 und K = K r (x). Dann tritt wenigstens einer der folgenden Fälle
ein:
• a ∈ K.
• b ∈ K.
• K = [x − r, x + r].
102
Eine Kugel mit Mittelpunkt x und Radius r in dem betreffenden metrischen Raum ist also ein
Intevall der Länge 2r, wenn sie nicht an den Intervallrändern abgeschnitten“ wird. Letzterer
”
Fall kann nur eintreten, wenn die Kugel einen der Randpunkte des Intervalles enthält. Da es
nur zwei solche Randpunkte gibt und die Elemente von X paarweise disjunkte Kugeln vom
Radius ≥ ε sind, gibt es höchstens zwei Elemente von X, die nicht abgeschlossene Intervalle
der Länge ≥ 2ε sind.
Seien K1 , . . . , Kl Elemente von X, die Intervalle der Länge ≥ R2ε sind. Dann gilt 0 ≤
Pl
b
i=1 1Ki ≤ 1I (auf Grund der paarweisen Disjunktheit der Ki ) und a 1Ki ≥ 2ε. Es folgt
Z b
Z b X
l
dt = b − a,
2εl ≤
1Ki (t) dt ≤
a
i=1
a
. Also hat X höchstens b−a
Elemente, die abgeschlossene Intervalle der Länge ≥ 2ε
also l ≤ b−a
2ε
2ε
sind. Nach dem zuerst Gesagten hat X höchstens Rε + 2 Elemente.
Satz 2. Für eine Teilmenge X ⊆ R sind die folgenden Eigenschaften äquivalent:
• X ist eine Nullmenge.
R∞
• Das Integral −∞ 1X (t) dt der charakteristischen Funktion von X konvergiert gegen 0.
Beweis. Sei X eine Nullmenge. Für jedes ε > 0 wählen wir eine Überdeckung (1) mit (2).
S
P
Sei Xl = lk=1 Ik , dann kann ist 1Xl für jedes endliche l integrierbar und 1Xl ≤ lk=1 1Il , also
R∞
P
1 (t) dt ≤ lk=1 |Ik |. Nach (2) gilt also
−∞ Xl
Z ∞
(+)
1Xl (t) dt ≤ ε.
−∞
Nach dem Satz über die monotone Konvergenz bleibt dies auch für l = ∞ (im Fall K = ∞)
richtig. In jedem Fall kann also l = K in (+) gesetzt
R ∞ werden. Damit ist für jedes ε > 0 eine
Funktion fε (nämlich 1XK ) mit 0 ≤ 1X ≤ fε und −∞ fε (t) dt ≤ ε gefunden. Nach Lemma 1
verschwindet das Integral von 1X .
Zum Beweis der entgegengesetzten Implikation betrachten wir zunächst den Fall, daß X ⊆
(−R, R) für eine reelle Zahl R > 0 gilt. Dann ist
Z R
Z ∞
1X (t) dt
1X (t) dt =
0=
−∞
−R
Wir wählen eine Integraleichung δ auf [−R, R], welche 5ε -fein für 1X ist.
Der metrische Raum M = [−R, R] erfüllt nach Lemma 2 die Voraussetzung des Überdeckungssatzes von Vitali. Für x ∈ X sei
min δ(x), |R| − |x|
.
(@)
Rx =
2
Die Folge (Ki )N
i=1 von Kugeln habe die in Satz 1 beschriebenen Eigenschaften. Wie in der
Formulierung dieser Eigenschaften sei ri der Radius und xi ∈ X der Mittelpunkt von Ki . Sei
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Ñ ≤ N eine natürliche Zahl, wir wollen
(*)
Ñ
X
ri ≤
N
X
ri ≤
i=1
103
ε
10
zeigen. Da dies für alle endlichen Ñ ≤ N gilt, folgt
i=1
ε
.
10
Die Überdeckung von X durch die Kugeln K 5ri (xi ) ist eine Überdeckung von X durch Intervalle, und
N
N
X
X
K 5r (xi ) =
10ri ≤ ε.
i
i=1
i=1
Da eine solche Überdeckung von X für jedes ε > 0 gefunden werden kann, ist X eine Nullmenge.
Beim Beweis von (*) können wir nach Umnumerieren der Ki erreichen, daß x1 < x2 < · · · <
xÑ gilt. Sei ai = xi − ri und bi = xi + ri . Auf Grund der Disjunktheit der Ki gilt ai > bi−1 für
i > 1. Sei weiterhin b0 = −R, aÑ +1 = R. Auf Grund von (@) gilt auch −R = b0 < a1 sowie
bñ < aÑ +1 = R. Wir wählen eine δ-feine Zerlegung (Yi , Λi ) von [bi−1 , ai ], bezeichen die durch
ai < xi < bi gegebene Zerlegung von [ai , bi ] in ein Teilstück mit xi als Stützstelle mit (Zi , Ξ).
Die Zerlegung
(Z, Ξ) = (Y1 , Λ1 ) ◦ (Z1 , Ξ1 ) ◦ (Y2 , Λ2 ) ◦ · · · ◦ (ZÑ , ΞÑ ) ◦ (YÑ +1 , ΛÑ +1 )
von [−R, R] ist δ-fein, sie sei durch −R = c0 ≤ ξ1 ≤ c1 ≤ . . . ≤ cL−1 ≤ ξL ≤ cL = R gegeben.
RR
Sie ist δ-fein, wegen −R 1X (t) dt = 0 gilt also σ(Z, Ξ, 1X ) < 5ε . Für jedes k mit 1 ≤ k ≤ Ñ
existiert ein i mit 1 ≤ i ≤ L und ak = ci−1 , bk = ci und xk = ξi . Der Term (bi − ai )1X (xi ) = 2ri
kommt also unter den Summanden (ck − ck−1 )1X (ξi ) der Riemannschen Summe σ(Z, Ξ, 1X )
vor, die alle nichtnegativ sind. Also gilt
2
Ñ
X
i=1
ε
ri ≤ σ(Z, Ξ, 1X ) < ,
5
und (*) folgt.
Wir haben gesehen, daß beschränkte Mengen Nullmengen sind, wenn das Integral ihrer
charakteristischen Funktion verschwindet. Sei X ⊆ R eine beliebige Menge, für die das Integral
der charakteristischen Funktion gegen 0 konvergiert. Für jede ganze Zahl R > 0 verschwindet
das Integral der charakteristischen Funktion von X ∩ (−R, R) nach Lemma 1 ebenfalls, denn
es gilt 0 ≤ 1X∩(−R,R) ≤ 1X . Nach dem bereits Bewiesenen ist
also X ∩ (−R, R) eine Nullmenge,
S
X
∩
(−R,
R)
.
und dasselbe gilt nach Fakt 1 für X = ∞
R=1
Definition 2. Wir sagen, daß eine Aussage A(x) über reelle Zahlen x (bzw. Elemente
einer Teilmenge I ⊆ R) fast überall bzw. für fast alle x richtig ist, wenn die Menge aller x ∈ R
(bzw. aller x ∈ I), für die die Aussage falsch ist, eine Nullmenge ist.
104
Beispiel 1. Die Funktionenfolge fn konvergiert fast überall gegen die Funktion f , wenn
x Es gilt nicht lim fn (x) = f (x)
n→∞
eine Nullmenge ist. Eine Funktion f ist fast überall differenzierbar, wenn
x f ist nicht differenzierbar an der Stelle x
eine Nullmenge ist.
Eines der Ergebnisse des folgenden Satzes besagt, daß zwei fast überall gleiche Funktionen
für Fragen der Integralrechnung äquivalent sind:
Satz 3. Seien a < b reelle Zahlen oder ±∞, und sei I = [a, b] ∩ R.
Rb
• Sei g eine Funktion mit nichtnegativen Funktionswerten auf I. Dann konvergiert a g(t) dt
genau dann gegen 0, wenn g fast überall verschwindet.
• Seien f1Rund f2 zwei Funktionen auf I, die fast überall überinstimmen. Dann ist das
b
Integral a f1 (t) dt genau dann konvergent (bzw. bestimmt divergent), wenn dasselbe für
Rb
Rb
Rb
f (t) dt gilt, und in diesem Fall gilt a f1 (t) dt = a f2 (t) dt.
a 2
Beweis. Wir betrachten zunächst
R bden ersten Punkt und bezeichnen die Menge aller t mit
g(t) 6= 0 mit X. Zunächst setzen wir a g(t) dt = 0 voraus. Sei Xn die Menge aller t ∈ I = [a, b]
mit g(t) > 1/n. Sei f = 1Xn die charakeristische Funktion von Xn . Für jedes ε > 0 kann
Rb
fε = 2n g in Lemma 1 gesetzt werden. EsSfolgt a 1Xn (t) dt = 0. Nach Satz 2 ist Xn eine
Nullmenge, und nach Fakt 1 ist auch X = ∞
Nullmenge.
n=0 Xn eine
Rb
Wenn umgekehrt X eine Nullmenge ist, so gilt a gn (t) dt = 0 mit gn (t) = min g(t), n ,
denn auf f = gn kann Satz 2 mit fε = n1X angewendet werden. Es gilt g(t) = limn→∞ gn (t)
Rb
für alle t ∈ I, und nach dem Satz über die monotone Konvergenz folgt a g(t) dt = 0.
Beim Beweis des zweiten Punktes dürfen wir nach Trennung von Real- und Imaginärteil die
betrachteten Funktionen als reellwertig voraussetzen.
Im Fall f1 ≤ f2 kann der erste Punkt auf
Rb
g = f2 −f1 angewendet werden und zeigt a f2 (t)−f1 (t) dt = 0, und die Behauptung folgt aus
den Rechenregeln für das Integral. Im allgemeinen Fall wendet man den zunächst betrachteten
Spezialfall zunächst auf min(f1 , f2 ) und f1 und dann auf min(f1 , f2 ) und f2 an.
Das zweite Hauptresultat dieses Unterabschnittes ist der folgende Satz, der gewissermaßen
den ersten Hauptsatz der Integral- und Differentialrechung auf alle integrierbaren Funktionen
ausdehnt, dabei aber nur noch eine für fast alle x“-Aussage treffen kann.
”
Satz 4. Seien a < b Elemente von R ∪ {±∞}, und sei f eine reell- oder komplexwertige
Rb
Funktion auf I = [a, b] ∩ R, für die a f (t) dt konvergiert. Für t ∈ I definieren wir F (t) =
Rt
f (τ ) dτ . Dann gilt für fast alle t ∈ I die Aussage: F ist differenzierbar an der Stelle t, und
a
F ′ (t) = f (t).
Bemerkung 4. Mit anderen Worten ist
(3)
X = x ∈ I F ′ (x) existiert nicht, oder F ′ (x) 6= f (x)
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
105
eine Nullmenge.
Beweis. Es genügt, den Beweis für endliche a und b zu führen. Wenn dann zum Beispiel
die unendliche Halbachse (−∞, b] betrachtet werden soll, so können wir wegen
Z f
Z b−n
Z t
(τ ) dτ
f (τ ) dτ +
f (τ ) dτ =
b−n
−∞
−∞
′
für t ∈ [b − n, b] zeigen, daß die Menge Xn aller t ∈ [b − n, b], für die nicht FS
(t) = f (t) gilt, eine
Nullmenge ist. Eine Nullmenge ist dann auch die abzählbare Vereinigung ∞
n=1 Xn , die Menge
′
aller t ∈ (−∞, a], für die nicht F (t) = f (t) gilt. Die Fälle [a, ∞) und (−∞, ∞) behandelt man
analog dazu.
Sei nun, unter der Voraussetzung der Endlichkeit von a und b,
X = x ∈ I Es gibt ein ε > 0, so daß kein δ > 0 existiert, für das
|F (y) − F (x) − (y − x)f (x)| < ε(y − x) für alle y ∈ I mit x < y < x + δ gilt.}
Y = x ∈ I Es gibt ein ε > 0, so daß kein δ > 0 existiert, für das
|F (y) − F (x) − (y − x)f (x)| < ε(x − y) für alle y ∈ I mit x − δ < y < x + δ gilt.}
Offenbar ist X ∪ Y die für den Beweis zu betrachtende Ausnahmemenge (3) aller x ∈ I, für
die F ′ (x) nicht existiert oder von f (x) verschieden ist.
Wir haben
∞
[
X=
(Xn,+ ∪ Xn,− )
Y =
n=0
∞
[
n=0
mit
(Yn,+ ∪ Yn,− )
Es gibt kein δ > 0, für das ± F (y) − F (x) − (y − x)f (x) < ε(y − x)
o
für alle y ∈ I mit x < y < x + δ gilt.
n
= x ∈ I Es gibt kein δ > 0, für das ± F (x) − F (y) − (x − y)f (x) < ε(x − y)
o
für alle y ∈ I mit x − δ < y < x gilt. ,
n
Xn,± = x ∈ I
Yn,±
wobei auf Grund von Satz .3.10.3 diese Ausnahmemengen auch durch
Z y
n
(+) Xn,± = x ∈ I Es gibt kein δ > 0, für das ±
f (t) dt − (y − x)f (x) < ε(y − x)
x
o
für alle y ∈ I mit x < y < x + δ gilt.
Z x
n
Yn,± = x ∈ I Es gibt kein δ > 0, für das ±
f (t) dt − (x − y)f (x) < ε(x − y)
y
106
o
für alle y ∈ I mit x − δ < y < x gilt. .
beschrieben werden können. Auf Grund von Fakt 1 genügt der Nachweis, daß jede der Mengen
Xn,± und Yn,± eine Nullmenge ist. Wir führen diesen Nachweis für Xn,+ , die drei übrigen Fälle
gehen analog dazu bzw. können durch Betrachtung von ±f (±t) auf diesen Fall zurückgeführt
werden.
−n
Sei ε > 0 gegeben, wir wählen
eine 2 10 ε -feine Integraleichung δ auf I. Für x ∈ Xn,+ wählen
wir eine Zahl Rx ∈ 0, δ(x) mit x + Rx ∈ I und
Z x+Rx
(%)
f (t) dt ≥ (f (x) + ε)Rx .
x
Dies ist auf Grund von (+) möglich. Sei die endliche oder abzählbar unendliche Folge (Ki )N
i=1
der Kugeln Ki = Kri (xi ), ri = Rxi , wie in Satz 1 (mit X = Xn,+ ) gewählt. Sei bi = ai + ri .
Wegen [ai , bi ] ⊆ Ki sind die Intervalle [ai , bi ] paarweise disjunkt. Nach dem Saks-HenstockLemma gilt
Ñ Z bi
2−n ε
X
f (t) dt − (bi − ai )f (ai ) <
10
ai
i=1
für jede natürliche Zahl Ñ ≤ N . Im Fall N < ∞ kann Ñ = N gesetzt werden, anderfalls folgt
N Z bi
2−n ε
X
f (t) dt − (bi − ai )f (ai ) <
10
ai
i=1
P
durch Grenzübergang Ñ → ∞. Wegen (%) ist die linke Seite dieser Ungleichung ≥ 2−n N
i=1 ri .
Es folgt
N
X
ε
ri ≤ .
10
i=1
Die Kugeln K 5ri (xi ) überdecken Xn,+ , es handelt sich dabei um Intervalle der Länge ≤ 10ri ,
und die Gesamtlänge dieser Intervalle ist nach der letzten Ungleichung ≤ ε. Da eine solche
Überdeckung von Xn,+ durch Intervalle für jedes ε > 0 gefunden werden kann, ist Xn,+ wie
behauptet eine Nullmenge.
3.14. Meßbare Funktionen und der Satz über die majorisierte Konvergenz.
Definition 1. Unter einer Stufenfunktion auf R verstehen wir (für die Zwecke dieser VorP
lesung) eine Funktion, die außerhalb einer Nullmenge mit einer Funktion der Form Ll=1 wl 1Il
übereinstimmt, wobei wl ∈ C gilt, die Il Intervalle sind und L eine natürliche Zahl ist.
Bemerkung 1.
• Da die charakteristischen Funktionen von [a, b] und (a, b) fast überall (nämlich mit Ausnahme von a und b) übereinstimmen, ist es einerlei, ob man in der
Definition mit offenen, abgeschlossenen oder halboffenen Intervallen arbeitet.
• Wenn f und g fast überall übereinstimmen, so ist offenbar f genau dann eine Stufenfunktion, wenn g eine Stufenfunktion ist.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
107
Fakt 1. Eine Funktion f auf R ist genau dann eine Stufenfunktion, wenn man Zahlen
c0 < c1 · · · < cN , N ∈ N, sowie v1 , . . . , vN finden kann, so daß f (t) = vi für fast alle t ∈ [ci−1 , ci ]
sowie f (t) = 0 für fast alle t 6∈ [c0 , cN ] gilt.
Beweis. Unter den obigen Annahmen gilt
f (t) =
N
X
vi 1[ci−1 ,ci ]
i=1
für fast alle t, also ist f eine Stufenfunktion. Wenn umgekehrt f die in Definition 1 beschriebene
Form hat, so sei Il das Intervall von al bis bl (wobei Il dieselbe Bedeutung
wie inDefinition
1
hat), c0 < c1 < · · · < cN eine wiederholungsfreie Auflistung von al 1 ≤ l ≤ L ∪ bl 1 ≤
l ≤ L , und vi die Summe von wl über alle l mit (ci− , ci ) ⊆ Il .
Fakt 2. Seien f und g Stufenfunktionen, und sei λ eine komplexe Zahl. Dann sind die
folgenden Funktionen Stufenfunktionen:
• f + g und λf (mit anderen Worten, die Stufenfunktionen bilden einen Unterraum im
Vektorraum aller komplexwertigen Funktionen auf R),
• |f |,
• max(f, g) (für rellwertige f und g).
• φ(f ), wobei eine beliebige Funktion auf dem Wertebereich von f ist.
• f · g.
Beweis. Der erste Punkt folgt direkt aus Definition 1. Für den vierten Punkt nehmen wir
an, daß f die in Fakt 1 beschriebene Form hat. Dann gilt |f (t)| = |vi | für fast alle t ∈ (ci−1 , ci )
und |f (t)| = 0 für fast alle t außerhalb [c0 , cN ]. Also hat auch |f | die in Fakt 1 beschriebene
Form und ist damit eine Stufenfunktion. Als Spezialfall φ(t) = |t| des vierten Punktes ergibt
sich der zweite. Der dritte Punkt folgt wegen
f + g + |f − g|
2
f + g − |f − g|
min(f, g) =
,
2
(f +g)2 −f 2 −g 2 folgt der fünfte Punkt aus dem ersten und dem vierten. max(f, g) =
und wegen f g =
1
2
Definition 2. Sei I ein abgeschlossenes Intervall, eine abgeschlossene Halbachse von a bis
∞ bzw. von −∞ bis a, oder I = R. Sei f eine R- oder C-wertige Funktion auf I. Wir nennen f
meßbar, wenn eine Folge fn (t) von Stufenfunktionen auf R existiert, so daß limn→∞ fn (t) = f (t)
für fast alle t ∈ I gilt.
Fakt 3.
• Wenn f meßbar ist, so gibt es eine Folge von Stufenfunktionen fn mit
limn→∞ fn (t) = f (t) für alle t ∈ I.
• Wenn zwei Funktionen f und g fast überall übereinstimmen, so ist f genau dann meßbar,
wenn g meßbar ist.
108
Beweis. Wenn die Folge fn wie in der beschaffen und X die Menge aller t ∈ I ist, für die
nicht limn→∞ fn (t) = f (t) gilt, so setzt man
(
f (t) t ∈ X
f˜n (t) =
fn (t) t 6∈ X.
Dann ist X eine Nullmenge, nach Bemerkung 1 ist auch f˜n eine Stufenfunktion, und es gilt
limn→∞ f˜n (t) = f (t) für alle t ∈ I.
In der Situation des zweiten punktes konvergiert jede fast überall gegen f konvergente Folge
von Stufenfunktionen auch gegen g fast überall, und umgekehrt.
Satz 1.
• Jede stetige Funktion ist meßbar.
• Wenn die fn stetige Funktionen auf I sind und daselbst fast überall gegen f konvergieren,
so ist f meßbar.
• Wenn g1 , . . . , gn (n ∈ N) meßbare reellwertige Funktionen sind, so sind max(g1 , . . . , gn )
und min(g1 , . . . , gn ) meßbar.
• Wenn F eine stetige Funktion auf I und fast überall daselbst differenzierbar ist, so ist
die durch
(
F ′ (t) falls F an der Stelle x differenzierbar ist
f (t) =
0
sonst
definierte Funktion meßbar.
• Wenn f und g meßbare Funktionen sind, so sind f ± g, f · g und λf für jede Konstante
λ meßbar.
φ→ C eine stetige Funktion ist, so ist φ(f )
• Wenn f K-wertig und meßbar und K −−
meßbar.
Beweis. Zum Beweis des ersten Punktes bemerken wir, daß nach dem nachfolgenden Lemma 1 eine Stufenfunktion fn mit |fn (t) − f (t)| < 2−n für t ∈ I ∩ [−n, n] existiert. Die Folge
fn (t) konvergiert für alle t ∈ I gegen f (t), und f ist meßbar.
Der zweite Punkt geht ähnlich: Nach Lemma 1 gibt es eine Stufenfunktion gn mit |fn (t) − gn (t)| <
−n
2 für alle t ∈ I ∩ [−n, n]. Für alle t ∈ I gilt dann limn→∞ fn (t) − gn (t) = 0, und es folgt
limn→∞ gn (t) = f (t) für fast alle t ∈ I.
Zum Beweis des dritten Punktes genügt es, den Fall n = 2 zu betrachten, denn der Fall n =
1 ist trivial und der Fall n > 2 ergibt sich wegen min(g1 , . . . , gn ) = min min(g1 , . . . , gn−1 ), gn
und der analogen Identität für max aus dem Fall n = 2 durch Induktion nach n. Seien fi,n ,
i ∈ {1, 2}, Stufenfunktionen mit limn→∞ fi,n (i) = gi (t). Dann sind fn,− = min(f1,n, f2,n )
und fn,+ max(f1,n , f2,n ) Stufenfunktionen,
und es gilt limn→∞ fn,− (t) = min g1 (t), g2 (t) und
limn→∞ fn,+ (t) = max g1 (t), g2 (t) für fast alle t ∈ I. Also sind min(g1 , g2 ) und max(g1 , g2 )
meßbar.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
109
Zum Beweis des vierten Punktes sei die Funktion fn auf I durch
(
2n F (t + 2−n ) − F (t) t + 2−n ∈ I
fn (t) =
2n F (b) − F (t)
t > b − 2−n
definiert. Mit der möglichen Ausnahme von t = b konvergiert die Folge der fn (t) für alle t ∈ I,
für die F ′ (t) existiert, gegen F ′ (t). Auf Grund unserer Voraussetzung konvergiert die Folge fn
also fast überall auf I gegen f . Man überzeugt sich relativ leicht davon, daß die Funktionen fn
stetig auf I sind. Nach dem zweiten Punkt ist fn meßbar.
Wenn f und g die Limites der Folgen fn und gn von Stufenfunktionen sind, so sind f ± g,
f · g, λf und (unter den Voraussetzungen des letzten Punktes) φ(f ) die Limites von fn ± gn ,
fn · gn , λfn und φ(fn ), welche Funktionen nach Fakt 2 meßbar sind. Also sind die in den beiden
letzten Punkten aufgelisteten Funktionen meßbar.
Lemma 1. Sei f eine stetige Funktion auf I. Zu jedem ε > 0 und jeder reellen Zahl R > 0
existiert eine Stufenfunktion g mit |f (t) − g(t)| < ε für t ∈ I ∩ [−R, R].
Beweis. Sei J = I ∩ [−R, R]. Für jedes t ∈ J gibt es ein δ(t) > 0 mit |f (x) − f (t)| < ε
für |x − t| < δ(t). Sei J = [α, β], und sei α0 ≤ ξ0 ≤ α1 ≤ . . . ≤ αn = β eine δ-feine Zerlegung
von J. Für t ∈ [α, β) gibt es ein eindeutig bestimmtes i mit t ∈ [αi−1 , αi ), für t = β sei
i = n. Wir setzen dann g(t) = f (ξi ). Für t 6∈ J setzen wir g(t) = 0. Dann erfüllt t alle unsere
Bedingungen.
Aufgabe 1. Sei I wie zuvor ein beschränktes abgeschlossenes Intervall, eine abgeschlossene
Halbachse oder R. Man zeige: Jede monotone Funktion auf I ist meßbar.
Wir wollen nun die Zusammenhänge zwischen Meßbarkeit und Integrierbarkeit untersuchen.
Satz 2. Sei weiterhin I ein abgeschlossenes Intervall, eine abgeschlossene Halbachse oder
R, a der Anfangspunkt von I bzw. a = −∞, falls I von unten unbeschränkt ist, und b der
Endpunkt von I bzw. b = ∞, falls I von oben unbeschränkt ist.
Rb
• Wenn a f (t) dt konvergiert, so ist f meßbar.
• Wenn
R b die Funktionswerte von f nichtnegative reelle Zahlen sind und f meßbar ist, so
ist a f (t) dt konvergent oder gegen ∞ bestimmt divergent.
Rb
Rb
• Wenn f meßbar ist und a |f (t)| dt < ∞ gilt, so konvergiert a f (t) dt.
Bemerkung 2. Für die Formulierung des dritten Punktes ist es natürlich wichtig, daß
das darin auftretende Integral über |f | nach dem zweiten Punkt konvergent oder gegen ∞
bestimmt divergent ist.
Beweis. Die erste Behauptung folgt aus dem dritten Punkt von Satz 1, Satz .3.13.4, und
Fakt 3.
Um Aussagen über die Integrierbarkeit aus Meßbarkeitsvoraussetzungen herzuleiten, müssen
wir uns zunächst davon überzeugen, daß Stufenfunktionen integrierbar sind. Nach Beispiel .3.2.1
konvergiert das Integral einer konstanten Funktion über ein beschränktes Intervall, und nach
110
Satz .3.13.3 gilt dasselbe auch für Funktionen, die fast überall konstant sind. Für eine Stufenfunktion f kann man den Integrationsweg nach Fakt 1 in endlich viele Stücke zerlegen, auf denen f fast überall konstant ist, wobei f auf eventuell auftretenden unbeschränkten Teilstücken
verschwindet. Aus der Zerlegbarkeit von Integralen (Satz .3.10.3) folgt so die Konvergenz des
Integrales von f .
Sei nun f eine meßbare Funktion auf I mit nichtnegativen Funktionswerten. Wir zeigen
zunächst die Konvergenz des Integrales von
(
min f (t) t ∈ [−n, n]
φn (t) =
0
t 6∈ [−n, n]
Sei dazu (fk )∞
k=0 eine gegen f konvergierende Folge von Stufenfunktionen. Dann ist auch
(
min fk (t), n t ∈ [−n, n]
fk,n (t) =
0
t 6∈ [−n, n]
eine Stufenfunktion18, und es gilt limn→∞ fk,n = φn . Sei
Mk,l (t) = max fj,n (t) k ≤ j ≤ l ,
der Einfachheit halber unterdrücken wir die n-Abhängigkeit in den Bezeichnungen auf der
rechten Seite, da wir zur Zeit ein festes n betrachten. Durch induktive Anwendung des dritten
Punktes von Fakt 2 sieht man, daß Mk,l eine Stufenfunktion ist. Für festes k bilden die Mk,l
Rb
eine monoton wachsende Folge, und es gilt a Mk,l (t) dt ≤ 2n2 , denn Mk,l (t) ≤ n und Mk,l
verschwindet außerhalb [−n, n]. Es gilt
Mk (t) = lim Mk,l (t) = sup fj,n (t) j ≥ k ,
l→∞
Rb
nach dem Satz über die monotone Konvergenz konvergiert a Mk (t) dt. Diese Integrale bilden
eine monoton fallende Folge nichtnegativer Zahlen, denn die Funktionen Mk sind in Abhängigkeit von k monoton fallend und nichtnegativ. Es gilt limk→∞ Mk (t) = φn (t). Nach dem Satz
Rb
über die monotone Konvergenz konvergiert a φn (t) dt, wie behauptet.
Nun ist die Folge der φRn monoton wachsend, und limn→∞ φn = f . Nach dem Satz über die
b
monotone Konvergenz ist a f (t) dt konvergent oder bestimmt divergent.
Rb
Nach dem letzten Punkt
Sei f eine meßbare Funktion, für
die a |f (t)| dt konvergiert.
von Satz 1 sind auch max ±ℜ(f ), 0 und min ±ℜ(f ), 0 meßbar. Nach dem soeben gezeigten
zweiten Punkt sind die Integrale dieser Funktionen konvergent oder bestimmt divergent, und
da jede dieser Funktionen durch den Betrag von f beschränkt ist, kann letzterer Fall nicht
eintreten. Also konvergiert auch das Integral von
f = max(ℜf, 0) − max(−ℜf, 0) + i max(ℑf, 0) − i max(−ℑf, 0).
18z.
B. ist min(fk (t), n) nach dem vierten Punkt von Fakt 2 eine Stufenfunktion, dasselbe gilt auf Grund
von Definition 1 für die charakteristische Funktion von [−n, n], und fk,n ist das Produkt dieser Funktionen.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
111
Bemerkung 3. Wir können nun die im allgemeinen Fall noch verbleibenden Lücken beim
Beweis von Satz .3.9.2 schließen. Zunächst ist die Integrierbarkeit von g(t)w(t) zu zeigen. Nach
Satz 1 ist diese Funktion meßbar. Da wir g als stetig voraussetzen, existiert eine obere Schranke
G für den Betrag der Funktionswerte von g. Dann gilt
Z b
Z b
w(t) dt < ∞.
|g(t)w(t)| dt ≤ G
a
a
Rb
Nach Satz 2 konvergiert a g(t)w(t) dt.
Rb
Ferner hatten wir a w(t) dt 6= 0 voraussgesetzt. Ist dies nicht der Fall, so verschwindet
Rb
w(t) nach Satz .3.13.3 fast überall. Dann verschwindet auch der Integrand in a w(t)g(t) dt
fast überall, und nach dem eben zitierten Satz verschwindet das Integral. Damit verschwinden
beide Seiten von (.3.9.2), ganz gleich wie ξ ∈ [a, b] gewählt wird. Der Satz ist also auch im Fall
Rb
w(t) dt = 0 richtig.
a
Wir sind nun in der Lage, den Satz über die majorisierte Konvergenz zu beweisen:
Theorem 5 (Satz über die majorisierte Konvergenz). Sei I ein abgeschlossenes Intervall,
eine abgeschlossene Halbachse oder R. Wir beichnen mit a den Anfangspunkt von I (bzw. −∞)
und mit b den Endpunkt von I (bzw. ∞). Seien fn und m auf I definierte Funktionen, für die
die Integrale von a nach b konvergieren. Wir setzen voraus, daß für fast alle t ∈ I m(t) reell
ist, |fn (t)| ≤ m(t) für alle n ∈ N gilt und f (t) = limn→∞ fn (t)19 existiert. Dann gilt
Z b
Z b
(1)
lim
fn (t) dt =
f (t) dt,
n→∞
a
a
wobei sowohl der Limes auf der linken als auch das Integral auf der rechten Seite konvergieren.
Beweis. Durch Trennung von Real- und Imaginärteil dürfen wir annehmen, daß die fi
reell sind. Außerdem dürfen wir annehmen, daß unsere Voraussetungen |fi (t)| ≤ m(t) und
f (t) = limn→∞ für alle t erfüllt sind. Andernfalls setzt man einfach f (t) = fn (t) = 0 für
alle t, welche diese Voraussetzungen nicht erfüllen, und ändert nach Satz .3.13.3 nichts an der
untersuchten Fragestellung.
Nach Satz 2 sind die Funktionen fi meßbar. Sei
φk,l (t) = min(fk , . . . , fl )
Φk,l (t) = max(fk , . . . , fl )
φk (t) = inf fm (t) m ≥ k = lim φk,l (t)
l→∞
Φk (t) = sup fm (t) m ≥ k = lim Φk,l (t).
l→∞
Die Limites auf den beiden unteren Zeilen existieren für alle t, denn die zugrundeliegende
Folge ist monoton und betragsmäßig beschränkt durch m(t). Aus demselben Grund bleiben die
19Wobei
für alle anderen t irgendein beliebiger Wert für f (t) genommen werden kann, was nach dem zweiten
Punkt von Satz .3.13.3 nichts an der untersuchten Fragestellung ändert
112
Rb
Rb
Folgen der Integrale a φk,l (t) dt und a Φk,l (t) dt beschränkt. Nach dem Satz über die monotone
Rb
Rb
Konvergenz konvergieren a φk (t) dt und a ΦK (t) dt. Die Folge φk ist monoton wachsend und
die Folge Φk monoton fallend, und es gilt f (t) = limk→∞ φk (t) = limk→∞ Φk (t). Nach dem Satz
Rb
über die monotone Konvergenz konvergiert a f (t) dt, und es gilt
(+)
Z
b
f (t) dt = lim
k→∞
a
Z
b
φk (t) dt = lim
k→∞
a
Z
b
Φk (t) dt.
a
Da φk (t) ≤ f (t) ≤ Φk (t) für alle t ∈ I, und damit
Z b
Z b
Z b
Φk (t) dt
f (t) dt ≤ lim
φk (t) dt ≤
lim
k→∞
gilt, folgt (1) aus (+).
a
a
k→∞
a
Bemerkung 4. Offensichtlich haben wir unsere Überlegungen über Meßbarkeit nur benutzt, um zu zeigen, daß die φk,l und Φk,l integrierbar sind. Die Überlegungen des vorigen
Abschnittes wurden dabei gebraucht, um die Integrierbarkeit der Funktionen φk,l und Φk,l zu
zeigen. Diese wurde mittels des vorigen Satzes aus der Meßbarkeit dieser Funktionen hergeleitet, wobei die Überlegungen über die Differenzierbarkeit aus dem vorigen Abschnitt benutzt
wurden, um umgekehrt zu zeigen, daß Funktionen mit konvergenten Integralen meßbar sind.
Ohne diese technische Hürde, deren Überwindung so viele, lange und nichttriviale Überlegungen gekostet hat, hätten wir den Satz über die majorisierte Konvergenz sofort aus dem Satz
über die monotone Konvergenz herleiten können.
Wir wollen noch (in Verallgemeinerung des zweiten Punktes von Satz 1) zeigen, daß die
Grenzwerte von fast überall konvergenten Folgen meßbarer Funktionen meßbar sind.
Satz 3. Sei (fk )∞
k=1 eine Folge meßbarer Funktionen auf I, die daselbst fast überall gegen
die Funktion f konvergiert. Dann ist auch f meßbar.
Beweis. Wir dürfen uns durch Tennung von Real- und Imaginärteil auf reelle Funktionen
beschänken und betrachten zunächst
den Fall beschränkter Intervalle. Nach Satz 1 sind die
Funktionen gn (t) = arctan fn (t) meßbar. Ihr Betrag ist durch π2 beschränkt. Da wir das Intervall im Augenblick als beschränkt voraussetzen, konvergiert das Integral dieser Majorante. Nach
dem Satz über die majorisierte Konvergenz konvergiert das Integral von g(t) = arctan f (t) .
Nach Satz 2 ist g meßbar. Es gibt also eine Folge von Stufenfunktionen
γn , die gegen g konvergiert. Indem wir γn durch γ̃n (t) = max 2−n − π2 , min(γ(t), π2 − 2−n ) ersetzen, können wir
noch annehmen, daß die Funktionswerte von γn in (− π2 , π2 ) liegen.
Da dasselbe für g gilt und
tan auf diesem Intervall stetig ist, gilt f (t) = limn→∞ tan γn (t) . Nach Fakt 2 ist tan γn (t)
eine Stufenfunktion, und als Limes dieser Stufenfunktionen ist f meßbar.
Wir betrachten nun unbeschränkte Intervalle und setzen In = I ∩ [n − 1, n]. Durch Anwendung der soeben bewiesenen Teilaussage erhält man die Meßbarkeit von f |In . Es gibt also
4. INTEGRATION UND DIFFERENTIATION IM Rn .
113
Folge von Stufenfunktionen gk,n mit limk→∞ gk,n (x) = f (x) für alle x ∈ In . Sei
(+)
γk =
n−1
X
gk,n 1[k,k+1)
n=−k
alsoγk (t) =
(
gk,⌊x⌋
0
−n ≤ ⌊x⌋ < n
sonst,
dann gilt limk→∞ γk (t) = f (t) für alle t ∈ I. Als charakteristische Funktion eines Intervalles ist
1[k,k+1) eine Stufenfunktion, nach Fakt 2 sind also die Summanden in (+) und damit auch (+)
selbst Stufenfunktionen. Also ist f meßbar.
4. Integration und Differentiation im Rn .
4.1. Metrische Räume. Bevor wir uns eingehender mit dem Stetigkeitsbegriff beschäftigen, wollen wir den wichtigen Begriff metrischer Raum“ einführen, der es uns ermöglicht,
”
Begriffe wie Konvergenz“ und Stetigkeit“ in einem allgemeinen Rahmen zu betrachten.
”
”
Definition 1. Ein Metrischer Raum ist eine Menge M , versehen mit einer Funktion M ×
d→ R mit folgenden Eigenschaften:
M −−
• Aus x, y ∈ M und x 6= y folgt d(x, y) > 0.
• Für alle x ∈ M gilt d(x, x) = 0.
• Aus x, y, z ∈ M folgt d(x, z) ≤ d(x, y) + d(y, z).
• Es gilt d(x, y) = d(y, x).
Wir nennen diese Abstandsfunktion die Metrik von M . Falls mehrere metrische Räume im
Spiel sind, schreiben wir oft dM , wenn die Metrik von M gemeint ist.
Offenbar ist also d eine Abstandsfunktion, die ähnliche Eigenschaften erfüllt wie der normale
Abstand für reelle Zahlen, Punkte im n-dimensionalen Euklidischen Raum etc. Die zuletzt
erwähnte Ungleichung ist die Dreiecksungleichung.
Beispiel 1.
• Die Mengen R und C, versehen mit der Abstandsfunktion d(x, y) =
|x − y|, sind metrische Räume.
• Sei (M, d) ein metrischer Raum und N ⊆ M eine Teilmenge, dann ist N , versehen mit
der Einschränkung von d auf N × N , ein metrischer Raum.
Beweis. Wir beweisen zum Beispiel die erste Aussage, die zweite ist noch einfacher.
Sei K = R oder C sowie x, y ∈ K. Im Fall x = y gilt x − y = 0 und d(x, y) = |x − y| = 0,
im Fall x 6= y x − y 6= 0 und |x − y| > 0. Damit sind die beiden ersten Punkte von Definition 1
nachgewiesen. Für den letzten bemerken wir
d(x, y) = |x − y| = |−1| · |x − y| = |−1 · (x − y)| = |y − x| = d(y, x).
Es verbleibt der Nachweis des dritten Punktes von Definition 1, also der Dreiecksungleichung für die Metrik. Diese folgt unmittelbar aus der Dreiecksungleichung für den Betrag reeller
114
bzw. komplexer Zahlen:
d(x, z) = |x − z| = |(x − y) + (y − z)| ≤ |x − y| + |y − z| = d(x, y) + d(y, z).
Der bereits früher eingeführte Konvergenzbegriff überträgt sich mühelos auf Folgen von
Elementen metrischer Räume.
Definition 2. Sei (xn )∞
n=0 eine Folge von Elementen eines metrischen Raumes (M, d). Wir
sagen, daß diese Folge gegen x ∈ M konvergiert, und schreiben limn→∞ xn = x, falls zu jeder
positiven reellen Zahl ε eine Zahl δ > 0 existiert, so daß d(x, xn ) < ε für n > no gilt. Die Folge
ist eine Cauchy-Folge, falls zu jedem positiven ε eine Zahl no existiert, so daß d(xm , xn ) < ε
für no ≤ m ≤ n gilt. Ein metrischer Raum ist vollständig, falls jede Cauchy-Folge einen Limes
hat.
Bemerkung 1. Man überzeugt sich leicht davon, daß man im Fall M = R oder M =
C, wobei in diesen Fällen die Metrik aus Beispiel 1 verwendet wird, den Konvergenzbegriff
Definition .2.1.1 erhält.
Fakt 1.
• Der Grenzwert einer konvergenten Folge von Elementen eines metrischen
Raumes ist eindeutig bestimmt.
• Für jedes Element m eines metrischen Raumes M konvergiert die konstante Folge mit
Folgenglied m gegen m.
• Jede konvergente Folge ist eine Cauchy-Folge.
• Jede Teilfolge einer konvergenten Folge konvergiert gegen denselben Grenzwert.
Beweis. Wir beweisen als Beispiel den ersten Punkt. Angenommen, die Folge (mk )∞
k=ko
konvergiert in M sowohl gegen m als auch gegen m̃, und es gilt m 6= m̃. Dann ist ε = d(m, m̃)
positiv. Nach Definition 2 gibt es eine Zahl k ≥ ko mit d(mj , m) < 2ε für j > k und eine Zahl
l ≥ ko mit d(mj , m̃) < 2ε für j > l. Für j > max(k, l) (zum Beispiel j = max(k, l) + 1) folgt
ε = d(m, m̃) ≤ d(m, mj ) + d(mj , m̃) = d(mj , m) + d(mj , m̃) <
ein Widerspruch.
Die (einfachen) Beweise der übrigen Punkte werden weggelassen.
ε ε
+ = ε,
2 2
Beispiel 2.
• Die metrischen Räume R und C sind vollständig.
• Der metrische Unterraum Q ⊂ R ist nicht vollständig, denn es gibt Cauchy-Folgen
rationaler Zahlen, die nicht gegen eine rationale Zahl konvergieren (Beispiel: die Folge
der Teilsummen der Dezimalbruchentwicklung einer irrationalen Zahl).
Definition 3. Sei K = R oder K = C. Ein normierter K-Vektorraum ist ein K-Vektorraum
k·k
V , zusammen mit einer Abbildung V −−−→ [0, ∞), welche die folgenden Eigenschaften hat:
• kλvk = |λ| kvk für λ ∈ K und v ∈ V .
4. INTEGRATION UND DIFFERENTIATION IM Rn .
115
• Es gilt die Dreiecksungleichung
ku + vk ≤ kuk + kvk
(1)
für u, v ∈ V .
• Aus kvk = 0 folgt v = 0.
Beispiel 3.
• Offenbar ist K, versehen mit den üblichen Betrag, ein K-Vektorraum.
• Wenn (V, k·k) ein normierter C-Vektorraum und Ṽ V als R-Vektorraum bezeichnet (die
Abbildung der Multiplikation Skalar mit Vektor C×V → V wird also auf R× Ṽ = R×V
eingeschränkt), so ist (Ṽ , k·k) ein normierter R-Vektorraum. Insbesondere ist (C, |·|) ein
normierter R-Vektorraum.
Fakt 2. Sei V ein normierter K-Vektorraum. Dann wird V mit der Abstandsfunktion
d(x, y) = kx − yk zu einem metrischen Raum.
Beweis. Der Beweis ist vollkommen analog zu dem in Beispiel 1 behandelten Fall der
Räume R und C. Sei x, y ∈ V . Im Fall x = y gilt x − y = 0 und d(x, y) = kx − yk = 0, im
Fall x 6= y x − y 6= 0 und kx − yk > 0. Damit sind die beiden ersten Punkte von Definition 1
nachgewiesen. Für den letzten bemerken wir
d(x, y) = kx − yk = |−1| · kx − yk = k−1 · (x − y)k = ky − xk = d(y, x).
Es verbleibt der Nachweis des dritten Punktes von Definition 1, also der Dreiecksungleichung für die Metrik. Diese folgt unmittelbar aus der Dreiecksungleichung für die Norm:
d(x, z) = kx − zk = k(x − y) + (y − z)k ≤ kx − yk + ky − zk = d(x, y) + d(y, z).
Definition 4. Ein Banachraum ist ein normierter Raum, der mit der obigen Metrik versehen zu einem vollständigen metrischen Raum wird.
Satz 1. Der K-Vektorraum V sei mit einem Skalarprodukt hv, wi ∈ K (v, w ∈ V ) versehen,
das die folgenden Eigenschaften hat:
• hu + v, wi = hu, wi + hv, wi.
• hλu, vi = λ hu, vi.
• hv, wi = hw, vi.
• Aus v 6= 0 folgt hv, vi > 0.
p
Sei kuk = hu, ui. Dann wird V mit dieser Norm zu einem normierten K-Vektorraum, und
es gilt die Cauchy-Schwarzsche Ungleichung
(2)
|hu, vi| ≤ kuk kvk .
Beweis. Wir bringen nur den Beweis der schwierigeren Teilaussagen, nämlich den Beweis
der Cauchy-Schwarzschen Ungleichung und die Herleitung der Dreiecksungleichung für die
Norm aus dieser Ungleichung.
116
Wir beweisen zunächst die folgende Hilfsaussage für v, w ∈ V :
1
kvk2 + kwk2
(+)
ℜ(hv, wi) ≤
2
In der Tat, es gilt
0 ≤ hv − w, v − wi = hv, vi + hw, wi − hv, wi − hw, vi
und (+) folgt.
Wir verschärfen nun (+) zu
= kvk2 + kwk2 − hv, wi − hv, wi
= kvk2 + kwk2 − 2ℜ hv, wi ,
|hv, wi| ≤
(@)
1
kvk2 + kwk2
2
Nach dem nachfolgenden Lemma gibt es eine komplexe (bzw. reelle, falls R-Vektorräume betrachtet werden) Zahl ϑ mit |ϑ| = 1, so daß ϑ · hv, wi reell und nichtnegativ ist. Dann gilt nach
(+) und den Eigenschaften des Skalarproduktes
|hv, wi| = |ϑ hv, wi| = ϑ hv, wi = ℜ(ϑ hv, wi) = ℜ(hϑv, wi)
1
1
2
2
2
2
kϑvk + kwk =
kvk + kwk
≤
2
2
und (@) ist bewiesen.
Wir können nun die Cauchy-Schwarzsche Ungleichung beweisen. Im Fall u = 0 oder v = 0
verschwinden beide Seiten von (2). Wir dürfen uns also auf den Fall beschränken, daß u und
v beide nicht verschwinden. In diesem Fall verschwinden auch kuk und kvk nicht, und die
u
v
Vektoren ũ = kuk
und ṽ = kvk
haben beide die Norm 1: kũk = kṽk = 1. Aus (@) folgt in
diesem Fall |hũ, ṽi| ≤ 1. Wegen hu, vi = kuk kvk hũ, ṽi ergibt sich (2).
Wir können nun die Dreiecksungleichung ku + vk ≤ kuk+kvk aus der Cauchy-Schwarzschen
Ungleichung herleiten. Es gilt
hu + v, u + vi = hu, ui + hv, vi + hu, vi + hv, ui = hu, ui + hv, vi + hu, vi + hv, ui
2
= kuk2 + kvk2 + 2ℜ hu, vi ≤ kuk2 + kvk2 + 2 kuk kvk = kuk + kvk .
Auf diese Ungleichung kann die auf [0, ∞) monoton wachsende Quadratwurzelfunktion angewendet werden, und es ergibt sich
p
ku + vk = hu + v, u + vi ≤ kuk + kvk
wie behauptet.
Lemma 1. Sei z ∈ C, dann gibt es eine komplexe Zahl ϑ mit |ϑ| = 1, so daß ϑz reell und
nichtnegativ ist. Falls z reell ist, kann auch ϑ reell gewählt werden.
4. INTEGRATION UND DIFFERENTIATION IM Rn .
117
Beweis. In der Tat, für z = 0 kann ϑ = 1 genommen werden. Andernfalls nehmen wir
z
. Für reelle z läuft dies auf ϑ = 1 für z ≥ 0 und ϑ = −1 für negative z hinaus, so daß ϑ
ϑ = |z|
in diesem Fall in der Tat reell ist.
Bemerkung 2. Aus der Beziehung hv, wi = hw, vi und den übrigen Eigenschaften des
Skalarproduktes folgt hu, v + wi = hu, vi + hu, wi sowie hu, λvi = λ hu, vi.
Definition 5. Ein Hilbertraum ist ein Banachraum, dessen Norm man auf diese Weise aus
einem Skalarprodukt erhalten kann.
Auch der Stetigkeitsbegriff kann auf den Fall metrischer Räume verallgemeinert werden:
f→ N heißt stetig
Definition 6. Seien M und N metrische Räume. Eine Abbildung M −−
in x ∈ M , falls zu jeder positiven reellen Zahl ε eine positive reelle Zahl δ mit
dN f (x), F (Y ) < ε
für dM (x, y) < δ gilt. Sie ist stetig, falls sie in jedem Punkt von M stetig ist.
Beispiel 4. Für reellwertige Funktionen auf einer Teilmenge von R ergibt sich offenbar
der früher bereits für diesen Fall eingeführte Stetigkeitsbegriff als Spezialfall.
Inhalt des folgenden Satzes ist die Tatsache, daß eine Funktion genau dann stetig ist, wenn
sie mit der Bildung des Grenzwertes von Folgen vertauschbar ist.
f→ N zwischen metrischen Räumen sind folgende AussaSatz 2. Für eine Abbildung M −−
gen äquivalent:
• f ist stetig im Punkte m ∈ N .
• Wenn (mi )∞
i=0 eine gegen
∞ m konvergierende Folge von Elementen von M ist, so konvergiert die Folge f (mi ) i=0 in N gegen f (m).
Beweis. Die Abbildung sei stetig in m, und es gelte limi→∞ mi = m in M .Wir müssen
limi→∞ f (mi ) = f (m) in N zeigen. Sei dazu eine positive reelle Zahl ε vorgegeben. Auf Grund
der Stetigkeit von f gibt es ein δ > 0 mit
(+)
dN f (m), f (x) < ε
für dM (x, m) < δ. Wegen limi→∞ mi = m in M gibt es ein io mit dM (mi , m)
< δ für i > io .
Für derartige i ist (+) auf x = mi anwendbar, und es folgt dN f (m), f (mi ) < ε wie für den
Beweis von limi→∞ f (mi ) = f (m) benötigt.
Damit ist die zweite Aussage aus der ersten hergeleitet. Zum Beweis der entgegengesetzten
Implikation nehmen wir an, daß f im Punkte m unstetig ist, und zeigen die Existenz einer
gegen m konvergenten Folge von Elementen von M , so daß f (mi ) in N nicht gegen f (m)
konvergiert. Auf Grund der Unstetigkeit von f in M gibt es eine
positive reelle Zahl ε, so
daß für kein positives reelles δ aus dM (m, x) < δ dN f (m), f (x) < ε folgt. Insbesondere
gibt
−k
es für jedes k ∈ N ein mk ∈ M mit dM (mk , m) < 2 und dN f (m), f (mk ) ≥ ε. Es folgt
limk→∞ mk = m in M , während in N nicht limi→∞ f (mi ) = f (m) gilt.
Herunterladen