1. Elementare Grundlagen 1.1. Vollständige Induktion und der

1. Elementare Grundlagen
1.1. Vollständige Induktion und der binomische Lehrsatz. Wir folgen weitgehend
den Überlegungen in Forster, Kapitel 1. Die ohne Beweis aufgeführten Sätze sind mit den
Sätzen identisch, die bei Forster dieselbe Nummer tragen. Auch der in der Vorlesung gebrachte
Beweis wird sich an dem Beweis bei Forster orientieren.
Definition 1. Sei N = {0; 1; . . . } die Menge aller natürlichen Zahlen (alsoaller nichtnegativen ganzen Zahlen). Die Menge aller ganzen Zahlen bezeichnen wir mit Z = 0; ±1; ±2; . . . }.
Die Menge aller rationalen Zahlen bezeichnen wir mit Q und die Menge aller reellen Zahlen
mit R.
Fakt 1 (Vollständige Induktion). Sei no eine ganze Zahl, und sei An eine Behauptung über
ganze Zahlen n ≥ no . Die folgenden Aussagen seien bekannt:
Induktionsanfang: Es gilt Ano .
Induktionsschluß: Sei n > no , dann folgt An aus An−1 .
Dann gilt An für alle ganzen Zahlen n ≥ no .
Ein analoges Prinzip gibt es für die induktive Konstruktion einer Folge mathematischer
Objekte.
Die vollständige Induktion als Beweisprinzip ist intuitiv klar, denn im Fall no = 0 ergibt sich
A0 aus dem Induktionsanfang, sodann A1 aus A0 , A2 aus A1 , A3 aus A2 , und mit sehr viel Geduld erhält man durch analoge Überlegungen zum Beispiel auch A2003 . Allerdings würden uns
hartnäckige Skeptiker vielleicht trotzdem nicht glauben, daß auch A102003 richtig ist, denn ohne
das Induktionsprinzip zu benutzen läßt sich der Beweis von A102003 aus praktischen Gründen
nicht mehr in Worte fassen. Alternativ dazu kann man das Prinzip auch aus der intuitiv klaren Aussage herleiten, wonach jede nichtleere Menge natürlicher Zahlen ein kleinstes Element
enthält. Diese Herleitung sieht dann folgendermaßen aus:
Beweis. Wenn die Behauptung nicht richtig ist, gibt es irgendeine ganze Zahl n ≥ no , so
daß An falsch ist. Dieses n hat die Form no + k mit einer natürlichen Zahl k. Die Menge
M = k ∈ N Ano +k ist falsch
ist daher nicht leer. Wie vorhin bemerkt, hat M ein kleinstes Element k. Sei n = no + k. Es gilt
n > no , also k > 0, denn sonst wäre die Induktionsannahme Ano falsch. Es gilt k − 1 6∈ M auf
Grund der Minimalität von k. Wegen k − 1 6∈ M ist An−1 richtig. Nach dem Induktionsschluß
sollte also auch An richtig sein, was aber nicht der Fall war. Dieser Widerspruch beweist die
Behauptung.
Wir haben vorhin klargemacht, daß wir damit nur ein intuitiv klares Prinzip (das Induktionsprinzip) aus einem anderen intuitiv klaren Prinzip (jede nichtleere Menge natürlicher Zahlen
enthält ein kleinstes Element) hergeleitet haben. Ohne derartige intuitiv klare Prinzipien vorauszusetzen, kann man keine Mathematik treiben, so wie man sich nicht an seinem eigenen
Schopf aus dem Sumpf ziehen kann. Die als intuitiv klar vorausgesetzten Prinzipien nennt man
Axiome. Die heutige Mathematik beruht auf der Mengenlehre, die von Cantor eingeführt und
1
2
für die Zermelo und Fraenkel sowie von Neumann, Bernays und Gödel zwei zueinander äquivalente Axiomatisierungen gegeben haben. Im Prinzip kann man bei diesem Aufbau der Mathematik die natürlichen Zahlen aus der leeren Menge und den Operationen zur Mengenbildung,
die Bereiche der ganzen und rationalen Zahlen aus dem Bereich der natürlichen Zahlen und
die reellen Zahlen aus den rationalen Zahlen aufbauen, so daß im Prinzip das ganze imposante
Gebäude der modernen Mathematik aus der leeren Menge und den Mengenbildungsoperationen aufgebaut wird. Die Axiome sind dabei intuitiv klare Prinzipien zur Konstruktion und zum
Vergleich von Mengen, wobei aber eine gewisse Portion Vorsicht erforderlich ist, um Paradoxa
vom Typ der Antinomie des Lügners zu vermeiden.
Für uns wäre diese radikale Vorgehensweise zu ehrgeizig. Daher tragen für uns bestimmte
Aussagen über natürliche und reelle Zahlen axiomatischen Charakter, beispielsweise das vorhin benutzte Prinzip, wonach jede nichtleere Menge natürlicher Zahlen ein kleinstes Element
enthält. Wir setzen die Kenntnis des Rechnens mit reellen Zahlen (Addition, Multiplikation
und Division) voraus und betrachten die aus der Schule bekannten Gesetze der Kommutativität, Assoziativität und Distributivität für diese Rechenoperationen ebenfalls als Axiome.
Außerdem arbeiten wir manchmal mit bestimmten intuitiv klaren Eigenschaften des Abzählens
endlicher Mengen, ohne diese expressis verbis als Axiome zu formulieren. Ein Beispiel wäre das
Prinzip, wonach Zahl der Elemente einer disjunkten Vereinigung die Summe der Elementezahlen der Operanden ist. Ein anderes Beispiel sind unsere Überlegungen zum Beweis von Satz 3
weiter unten.
Definition 2. Wir definieren mehrfache Summen und Produkte reeller Zahlen durch
b
X
xi = xa + . . . + x b
i=a
b
Y
i=a
xi = xa · . . . ·xb
für a ≤ b und vereinbaren, daß eine leere Summe gleich 0 und ein leeres Produkt gleich 1 ist:
b
X
(1)
xi = 0
für b < a
xi = 1
für b < a
i=a
b
Y
(2)
i=a
Diese Konvention kann zusammen mit den Regeln
(3)
b
X
xi =
i=a
(4)
b
Y
i=a
b−1
X
i=a
xi =
b−1
Y
i=a
xi + xb
xi · xb
für a ≤ b
für a ≤ b
1. ELEMENTARE GRUNDLAGEN
3
zu einer induktiven Definition der mehrfachen Summen bzw. Produkte benutzt werden.
Wie schon gesagt, setzen wir die Gesetze der Kommutativität, Assoziativität und Distributivität für Summen und Produkte reeller Zahlen als bekannt voraus. Der Beweis des folgenden
Faktes gilt auch für jeden anderen Zahlbereich, in dem diese Gesetze gelten, etwa für die
rationalen Zahlen oder die später einzuführenden komplexen Zahlen.
Fakt 2. Für ganze Zahlen a − 1 ≤ b ≤ c und reelle Zahlen xi gilt
c
X
(5)
xi =
i=a
c
Y
b
X
xi +
i=a
xi =
i=a
b
Y
i=a
c
X
xi
i=b+1
xi ·
c
Y
xi
i=b+1
Für beliebige ganze Zahlen a, b, reelle xi , yi und λ gilt das Distributivitätsgesetz
b
X
(6)
i=a
b
X
(7)
(λxi ) = λ ·
(xi + yi ) =
i=a
b
X
b
X
i=a
b
Y
(xi yi ) =
b
Y
i=a
i=a
xi
i=a
b
X
xi +
yi
i=a
b
Y
xi ·
i=a
yi
τ→ a′ ; . . . , b′ eine bijektive Abbildung, dann gilt
Sei a; . . . ; b −−
(8)
b
X
(9)
′
xi =
b
X
i=a
j=a′
b
Y
b
Y
xτ (j)
′
xi =
i=a
xτ (j) .
j=a′
Die Behauptungen sind intuitiv klar, können aber auch mittels (3) und (4) aus (1) und (2)
durch Induktion hergeleitet werden.
Beweis. Zum induktiven Beweis der ersten beiden Behauptungen fixieren wir a und b
und verwenden Induktion nach c. Wir beweisen nur die erste Behauptung, da der induktive
Beweis der zweiten vollkommen analog verläuft. Für c = b (das kleinste c, für welches wir die
Behauptung aufstellen), gilt
c
X
i=a
xi =
b
X
i=a
xi =
b
X
i=a
xi + 0 =
b
X
i=a
xi +
c
X
i=b+1
xi ,
4
wobei wir nacheinander die Gleichung b = c, die für alle reellen Zahlen s gültige Gleichung
s + 0 = s sowie (1) benutzt haben. Sei c > b, und sei die Behauptung für das Tripel (a, b, c − 1)
bewiesen. Aus unseren Voraussetzungen folgt c ≥ b + 1 und c ≥ a, deswegen kann (3) sowohl
auf die Summe von a bis c als auch auf die Summe von b + 1 bis c angewendet werden. Es
kommt
c
c−1
b
c−1
b
c
X
X
X
X
X
X
xi =
xi + xc =
xi +
xi + xc =
xi +
xi ,
i=a
i=a
i=a
i=a
i=b+1
i=b+1
wobei das mittlere Gleichheitszeichen durch die Induktionsannahme gerechtfertigt ist, während
das rechte und linke Gleichheitszeichen Anwendungen von (3) sind. Die Induktionsbeweise von
(6) und (7) sind ähnlich einfach, wobei (6) das Distributivitätsgesetz a(b + c) = ab + ac und
(7) die Kommutativität der jeweils betrachteten Rechenoperation benutzt. Der Induktionsbeweis von (8) kann am einfachsten durch Benutzung von (5) sowie der Kommutativität der
betrachteten Rechenoperation geführt werden. Wir wollen nicht in Details eingehen, weil die
Behauptung intuitiv einleuchtend ist.
Satz 1. Für n ∈ N gilt die Summenformel
n
X
(10)
n(n + 1)
2
i=
i=1
Etwas allgemeiner ist
Satz 2 (Summenformel für arithmetische Reihen). Für beliebige reelle Zahlen a, b und
natürliche Zahlen n gilt
n
X
n(n + 1)
(a + bi) = an + b
.
2
i=1
(11)
Insbesondere gilt
n
X
(2i − 1) = n2 .
(12)
i=1
Beweis. Wir benutzen
n
X
1 = n,
i=1
was intuitiv klar ist (es handelt sich um n mal den Summanden 1), aber auch durch Induktion
nach der natürlichen Zahl n unter Benutzung von (3) gezeigt werden könnte. Durch Anwendung
von (7), (6) und (10) ergibt sich die erste Behauptung:
n
X
i=1
(a + bi) =
n
X
i=1
a+
n
X
i=1
bi = a
n
X
i=1
1+b
n
X
i=1
i = an + b
n(n + 1)
.
2
1. ELEMENTARE GRUNDLAGEN
Die zweite Behauptung ergibt sich als Spezialfall a = −1, b = 2 der ersten:
n
X
n(n + 1)
(2i − 1) = −n + 2
= −n + n(n + 1) = −n + n2 + n = n2 .
2
i=1
5
Definition 3. Sei X eine Menge. Eine k-gliedrige Folge von Elementen von X ist eine
x→ X, wobei wir in diesem Kontext meist xi statt x(i) schreiben. Die
Abbildung {1; . . . ; k} −−
Folge ist wiederholungsfrei, falls aus 0 < i < j ≤ k xi 6= xj folgt.
Bemerkung 1. Im Falle k = 0 ist diese Definition so zu interpretieren, daß es genau
eine Folge von 0 Elementen gibt. Es handelt sich um die leere Folge, definiert durch die leere
Abbildung. Sie ist wiederholungsfrei.
Bemerkung 2. Später werden wir auch die Möglichkeit zulassen, daß die Numerierung
der Folgenglieder nicht bei 1 startet.
Definition 4. Für natürliche Zahlen n definieren wir n! (sprich: n Fakultät) durch
n
Y
(13)
n! =
i.
i=1
Bemerkung 3. Als Konsequenz auf (2) und (4) haben wir 0! = 1 und (n + 1)! = (n + 1)n!
für alle natürlichen Zahlen n. Alternativ zur obigen Definition könnten diese Tatsachen auch
benutzt werden, um die Funktion n! induktiv zu definieren.
Definition 5. Seien n und k natürliche Zahlen, wir definieren den Binomialkoeffizienten
durch
Y
k
n+1−i
n· . . . ·(n + 1 − k)
n
=
=
.
(14)
k
i
k!
i=1
n
k
Bemerkung 4. Für k ≤ n berechnet sich durch Umordnen ((8)) und Anwendung von (5)
das Produkt im Nenner des letzten Ausdruckes auf der rechten Seite von (14) zu
Qn
k
n
Y
Y
i
n!
= ,
(n + 1 − i) =
i = Qi=1
k
k!
i=1 i
i=1
i=n+1−k
und es kommt
(15)
n!
n
=
.
k
k!(n − k)!
Der Beweis von Teil 3 und Teil 4 des folgenden Satzes wird bei Forster als Satz 3 und
Satz 4 durch Induktion bewiesen. Wir gehen ebenfalls durch Induktion vor, formulieren unsere
Überlegungen aber teilweise etwas laxer als Forster.
Satz 3. Sei X eine Menge mit n Elementen.
6
• Es gibt genau Q
nk verschiedene Folgen von k Elementen aus X.
• Es gibt genau ki=1 (n + 1 − i) = n · (n − 1)· . . . ·(n − k) verschiedene wiederholungsfreie
Folgen von k Elementen von X.
• Es gibt genau n! Möglichkeiten, die Elemente von X zu einer wiederholungsfreien Folge
anzuordnen.
• Es gibt genau nk verschiedene k-elementige Untermengen von X.
Beweis. Die ersten beiden Behauptungen beweisen wir durch Induktion nach k. Für k = 0
ergeben sich beide Behauptungen aus Bemerkung 1. Sei k > 0, und sei die erste Behauptung
für (k − 1)-gliedrige Folgen bewiesen. Jede der n(k−1) (k − 1)-gliedrigen Folgen von Elementen
von X kann durch Ergänzung mit einem beliebigen Element von X zu einer k-gliedrigen Folge
ergänzt werden. Für die Wahl dieses Elementes gibt es genau n Möglichkeiten. Also gibt es
genau n · nk−1 = nk verschiedene k-gliedrige Folgen.
Für wiederholungsfreie Folgen ist beim Induktionsschluß zwischen dem Fall k ≤ n und dem
Fall k > n zu unterscheiden. Im letzteren Fall gibt es offenbar keine wiederholungsfreien Folgen
der Länge k, wenn nur n Elemente
Qk für die Auswahl der Folgenglieder zur Verfügung stehen.
Für k ≤ n gibt es für jede der i=1 (n + 1 − i) wiederholungsfreien (k − 1)-gliedrigen Folgen
genau n − (k − 1) = n + 1 − k Möglichkeiten, das k-te Element so zu wählen, daß es von jedem
Qk−1
(n + 1 − i) k-gliedrige
der ersten (k − 1) Elemente verschieden ist. Also gibt es genau i=1
Folgen.
Qn
Die dritte Behauptung ist der Spezialfall
k
=
n
der
zweiten,
denn
das
Produkt
n!
=
i=1 i
Qn
ist eine Umordnung des Produktes i=1 (n + 1 − i). Die Abbildung τ (i) = n + 1 − i bildet
nämlich die Indexmenge {1; . . . ; n} bijektiv auf sich selbst ab.
Wir leiten die vierte Behauptung aus der zweiten und dritten her. Sei Cn,k die Zahl der kelementigen Untermengen Y von X. Für jedes derartige Y liefert jede der k! Möglichkeiten, Y
zu einer wiederholungsfreien Folge anzuordnen, eine k-gliedrige wiederholungsfreie Folge von
Elemeten von X, wobei offenbar jede dieser k!Cn,k Möglichkeiten eine andere Folge liefert und
Q
jede der ki=1 (n + 1 − i) k-gliedrigen wiederholungsfreien Folgen erhalten wird. Wir erhalten
Q
k!Cn,k = ki=1 (n + 1 − i). Durch Umformen nach Cn,k folgt die Behauptung.
Satz 4. Für 1 ≤ k ≤ n gilt
n
n−1
n−1
=
+
.
k
k−1
k
Der Satz wird bei Forster als Hilfssatz formuliert, wir bringen als Beweis dieselbe einfache
Rechnung wie Forster.
Bemerkung 5. Pascalsches Dreieck, siehe Forster für eine Abbildung des Pascalschen
Dreieckes.
Die Bedeutung der Binomialkoeffizienten für das Rechnen mit Potenzen ergibt sich aus
1. ELEMENTARE GRUNDLAGEN
7
Satz 5 (Binomischer Satz). Für jede natürliche Zahl n und beliebige reelle Zahlen x, y gilt
n X
n k n−k
n
x y .
(16)
(x + y) =
k
k=0
Der Beweis beruht auf einem Induktionsargument unter Benutzung von Satz 4, siehe Forster. Durch Ersetzen von y durch −y kommt
n X
n
n
(−1)n−k xk y n−k .
(17)
(x − y) =
k
k=0
Für kleine Werte von n ergeben sich die Spezialfälle (x + y)2 = x2 + 2xy + y 2 , (x − y)2 =
x2 − 2xy + y 2 , (x + y)3 = x3 + 3x2 y + 3xy 2 + y 3 und (x + y)4 = x4 + 4x3 y + 6x2 y 2 + 4xy 3 + y 4 .
Ebenfalls durch Induktion kann man die Summenformel für die geometrische Reihe beweisen:
Satz 6. Sei q eine von 1 verschiedene reelle und k eine natürliche Zahl, dann gilt
(18)
k
X
i=0
qi =
q k+1 − 1
.
q−1
Wir folgen dem Beweis bei Fischer. Ebenfalls durch Induktion, oder durch Anwendung von
(18) auf q = a/b und Multiplikation mit bk , ergibt sich die Gleichung
(19)
ak − bk = (a − b)
k
X
ai−1 bk−i .
i=1
Der Spezialfall k = 2 ist der aus der Schule bekannte dritte binomische Satz x2 − y 2 = (x −
y)(x + y).
1.2. Die Körperaxiome. Für die Rechenoperationen in R gelten die Körperaxiome. Wir
beginnen bei der Beschreibung dieser Axiome mit den Axiomen der Addition. Im Folgenden
sind x, y, a, b, c, d immer reelle Zahlen.
Fakt 1 (Axiome der Addition).
• x + y = y + x (Kommutativität)
• x + (y + z) = (x + y) + z (Assoziatitivtät)
• Es gibt eine Zahl 0 mit x + 0 = 0 für alle x ∈ R. (Existenz der 0).
• Zu jeder Zahl x ∈ R gibt es eine Zahl −x mit x + (−x) = 0. (Existenz des Negativen)
Fakt 2. Aus den Axiomen der Addition ergeben sich als Folgerungen:
• Die Eindeutigkeit der 0.
• Die Eindeutigkeit von −x.
• −0 = 0.
• Die Gleichung a + x = b mit reellen a, b hat die eindeutige Lösung x = b − a = b + (−a).
• −(−x) = x.
• −(x + y) = (−x) + (−y).
8
Fakt 3 (Axiome der Multiplikation).
• (xy)z = x(yz). (Assoziativität)
• xy = yx. (Kommutativität)
• Es gibt eine Zahl 1 mit x · 1 = x für alle reellen x. (Existenz der 1).
• Zu jedem x ∈ R − {0} gibt es ein x−1 ∈ R mit x · x−1 = 1.
Fakt 4 (Distributivität). x(y + z) = xy + xz.
Unter einem Körper versteht man einen Zahlbereich, der die obigen Axiome der Multiplikation, der Addition und das Gesetz der Distributivität erfüllt. Nähere Einzelheiten dazu
werden auch in der Vorlesung zur linearen Algebra behandelt werden. Aus den Körperaxiomen
ergeben sich folgende Konsequenzen:
Fakt 5.
• Die 1 und das Inverse einer von 0 verschiedenen reellen Zahl sind durch
die obigen Eigenschaften eindeutig bestimmt.
• Für a, b ∈ R mit a 6= 0 hat ax = b die einzige Lösung x = b · a−1 = b/a.
• (x + y)z = xz + yz.
• x0̇ = 0.
• Es gilt x · y = 0 genau dann, wenn x = 0 oder y = 0
• (−x)y = −(xy).
• (−1)x = −x.
• (−x)(−y) = xy.
• Falls x und y nicht verschwinden, gilt (x−1 )−1 = x und (xy)−1 = x−1 y −1 .
• Für ganze Zahlen a, b, c, d gilt
b X
d
d X
b
X
X
xij =
xij
i=a
j=c
d
b Y
Y
i=a
j=c
j=c
xij =
i=a
b
d Y
Y
j=c
xij
i=a
In derartigen Fällen können also die soeben noch geschriebenen Klammern weggelassen
werden.
• Unter denselben Voraussetzungen an a, b, c, d:
b
d
b X
d
X
X
X
xi ·
yj =
xi yj .
i=a
j=c
i=a j=c
Definition 1. Die Potenzen xn mit n ∈ N werden rekursiv durch x0 = 0 und xn+1 = x · xn
definiert. Für negative n ∈ Z und x ∈ R − {0} setzen wir xn = (x−1 )n .
Aus den Körperaxiomen ergeben sich die folgenden Rechenregeln für Potenzen:
Fakt 6. Falls beide Seiten der folgenden Gleichungen wohldefiniert sind (also x 6= 0 falls
einer der beteiligten Exponenten n oder m negativ ist, und im Falle von Punkt 3 auch y 6= 0
für n < 0), gilt:
1. ELEMENTARE GRUNDLAGEN
9
• xn+m = xn xm .
• xnm = (xn )m .
• (xy)n = xn y n .
1.3. Die Anordnungsaxiome.
Fakt 1. Es gelten die folgenden Anordnungsaxiome:
• Für jede reelle Zahl x tritt genau einer der drei Fälle x > 0, x = 0 und −x > 0 ein.
• Aus x > 0 und y > 0 folgen die Beziehungen x + y > 0 und xy > 0.
Wir schreiben x > y für die Bedingung x − y > 0 und x < y für die Bedingung y > x. Wir
schreiben x ≥ y für die Bedingung x > y oder x = y“ und x ≤ y für x < y oder x = y“. Die
”
”
Beweise der nachfolgenden Fakten können bei Forster, 3.1-3.12, nachgeschlagen werden:
Fakt 2. Im Folgenden sind x, y, a und b reele Zahlen.
• Die Aussagen x > 0 und −x < 0 sind äquivalent.
• Aus x > y und y > z folgt x > z (Transitivität der >-Relation).
• Aus x > y und a > b folgt x + a > y + b.
• Aus x > y und a > 0 folgt ax > ay.
• Aus 0 ≤ x < y und 0 ≤ a < b folgt ax < by.
• Aus x > y und a < 0 folgt ax < ay.
• Aus x 6= 0 folgt x2 > 0.
• Aus x > 0 (bzw. x < 0) folgt x−1 > 0 (bzw. x−1 < 0).
• Aus x > y > 0 oder 0 > x > y folgt y −1 > x−1 .
• 1 > 0.
• n > 0 für jede natürliche Zahl n.
Definition 1. Wir definieren |x| = x für x ≥ 0 und |x| = −x für x < 0.
Fakt 3. Sei x, y ∈ R.
• Es gilt |x| ≥ 0 mit Gleichheit genau für x = 0.
• Es gilt x ≤ |x|.
• |−x| = |x|.
• |xy| = |x| |y|.
• |xn | = |x|n
• |x/y| = |x| / |y|.
Satz 1 (Dreiecksungleichung). Für reelle x und y gilt |x + y| ≤ |x| + |y|.
Folgerung 1. Unter derselben Voraussetzung an x, y gilt |x + y| ≥ |x| − |y|.
Satz 2 (Bernoullische Ungleichung). Sei x ≥ −1. Dann gilt (1 + x)n ≥ 1 + nx für alle
n ∈ N.
Fakt 4 (Das Archimedische Axiom). Wenn x und y positive reelle Zahlen sind (maW
x, y ∈ R sowie x > 0 und y > 0), so gibt es eine natürliche Zahl n mit nx > y.
10
Fakt 5. Zu jeder positiven reellen Zahl ε gibt es ein n ∈ N mit 1/m < ε für alle Zahlen
m ≥ n.
Beweis. Man kann das Archimedisch Axiom auf 1 und 1/ε anwenden, denn es gilt 1/ε > 0
nach Fakt 2. Man erhält die Existenz einer natürlichen Zahl n mit n > 1/ε. Aus der in Fakt 2
bewiesenen fallenden Monotonie der Funktion 1/t ergibt sich 1/m ≤ 1/n < 1/(1/ε) = ε für
beliebige reelle Zahlen m ≥ x.
Zum Beweis des folgenden Satzes benötigen wir
Fakt 6. Sei b ≥ 1 reell, dann gilt bn ≥ 1 für alle n ∈ N, wobei die Gleichheit nur für b = 1
oder n = 0 eintritt.
Den Beweis führt man leicht durch Induktion.
Satz 3. Sei b > 1. Dann gibt es zu jeder rellen Zahl K ein n ∈ N mit bm > K für alle
natürlichen Zahlen m ≥ n.
Beweis. Aus der Bernoullischen Ungleichung und dem Archimedischen Axiom ergibt sich
die Existenz eines n ∈ N mit bn > K. Wegen b > 1 gilt bm = bn bm−n ≥ bn > K für m ≥ n,
denn wir haben vorhin bm−n ≥ 1 gezeigt.
Folgerung 2. Sei b eine relle Zahl mit |b| < 1. Dann gibt es zu jedem positiven rellen ε
eine Zahl n ∈ N mit |bn | < ε.
Beweis. Der Fall b > 0 wird wie bei Forster durch Anwendung des Satzes auf b−1 erledigt,
der Fall b < 0 ergibt sich wegen |b|n = |b|n und der Fall b = 0 ist trivial.
Der folgende Fakt kann als eine Variante des Archimedischen Axiomes angesehen werden:
Satz 4. Zu jeder rellen Zahl x gibt es eine eindeutig bestimmte ganze Zahl n mit n ≤ x <
n + 1.
Beweis. Die Menge M aller ganzen Zahlen l mit l > x ist nach nichtleer. Für x ≤ 0
gilt nämlich 1 ∈ M , und für x > 0 kann das Archimedische Axiom auf die Zahlen 1 und x
angewendet werden und ergibt die Existenz einer natürlichen Zahl m mit m · 1 > x.
Da die Menge M von unten beschränkt ist (nämlich durch die reelle Zahl x), hat sie nach
dem nachfolgenden Satz ein kleinstes Element l. Sei n = l − 1, dann gilt n ≤ x (sonst wäre
n > x im Widerspruch zur Minimalität von l) und n + 1 = l > x wegen l ∈ M .
Wir haben den Satz benutzt, wonach jede von unten beschränkte Menge natürlicher Zahlen
ein kleinstes Element enthält:
Satz 5. Sei M ⊆ R eine Untermenge, dann sind die folgenden Aussagen äquivalent:
• Es gibt eine ganze Zahl m mit l ≥ m für alle l ∈ M .
• Es gibt eine reelle Zahl m mit derselben Eigenschaft.
Eine derartige Menge nennt man von unten beschränkt. Jede von unten beschränkte nichtleere
Menge ganzer Zahlen enthält ein kleinstes Element.
1. ELEMENTARE GRUNDLAGEN
11
Beweis. Sei µ eine reelle Zahl mit l ≥ µ für alle l ∈ M , wir müssen die Existenz einer
ganzen Zahl n mit derselben Eigenschaft zeigen. Falls µ ≥ 0 gilt, kann n = 0 genommen werden.
Andernfalls ergibt sich aus der Anwendung des Archimedischen Axiomes auf die Zahlen 1 und
−µ die Existenz einer natürlichen Zahl k mit −k < µ, und man nimmt n = −k. Damit ist die
Äquivalenz der beiden Bedingungen gezeigt, denn die entgegengesetzte Implikation ist trivial.
Sei M eine von unten beschränkte nichtleere Menge ganzer Zahlen, es gibt eine ganze Zahl
l mit n ≥ l für n ∈ M . Dann ist
M̃ = m ∈ N l + m ∈ M
eine nichtleere Teilmenge von N. M̃ hat ein kleinstes Element m, und man zeigt leicht, daß
n = l + m ein kleinstes Element von N ist.
1.4. Der Körper der komplexen Zahlen. Die Menge aller Paare (a, b) reller Zahlen
bildet mit den Rechenoperationen
(a, b) + (x, y) = (a + x, b + y)
(a, b) · (x, y) = (ax − by, ay + bx)
einen Körper. Man schreibt a + bi statt (a, b), wobei sich die Rechenregeln aus i2 = −1 und
den Körperaxiomen ergeben. Die Zahlen a und b nennt man den Real- und Imaginärteil der
komplexen Zahl a + ib, a = ℜ(a + ib), b = ℑ(a + ib).
Die Kommutativität und Assoziativität beider Rechenoperationen rechnet man leicht nach,
ebenso die Distributivität. Das Negative zu a + bi ist (−a) + (−b)i. Das Inverse zu a + bi ist
a−bi
. Es gilt also
a2 +b2
x + iy
(x + iy)(a − ib)
xa + yb ay − bx
=
= 2
+ 2
i.
2
2
a + ib
a +b
a + b2
a + b2
√ Wir benutzen vorerst ohne Beweis, daß aus jeder reellen Zahl r ≥ 0 eine Quadratwurzel
r ≥ 0 existiert.
Wir definieren den Absolutbetrag einer komplexen Zahl durch
p
|x + iy| = x2 + y 2 ,
nach dem Lehrsatz des Pythagoras handelt es sich um den Abstand des Punktes (x, y) vom
Koordinatenursprung. Das konjugiert-komplexe zu a + ib ist a + ib = a − ib.
Satz 1.
• Das Tripel (C, +, ·) ist ein Körper.
• Für relle Zahlen stimmt der soeben definierte Absolutbetrag mit dem früher eingeführten
überein.
• Es gilt x + y = x + y, xy = x · y sowie |x| = |x| und x = x.
• Es gilt |z|2 = zz.
• Es gilt
(1)
|ab| = |a| |b|
12
(2)
• Es gilt
|z n | = |z|n
zn = zn
für alle z ∈ C, n ∈ Z unter der zusätzlichen Voraussetzung z 6= 0 im Falle n < 0.
• Es gilt
√
(3)
max(|ℜz| , |ℑz|) ≤ |z| ≤ 2 max(|ℜz| , |ℑz|)
(4)
• Eine komplexe Zahl verschwindet genau dann, wenn ihr Betrag verschwindet.
• Es gilt die Dreiecksungleichung
|x + y| ≤ |x| + |y| .
Beweis. Die meisten Behauptungen sind trivial, siehe auch Forster, Satz 13.1. Die Dreiecksungleichung ergibt sich aus
|x + y|2 = ℜ |x + y|2 = ℜ((x + y)(x + y)) = ℜ(xx) + ℜ(yy)
+ ℜ(xy) + ℜ(xy) ≤ |x|2 + |y|2 + |xy| |xy| = x2 + y 2 + 2 |x| |y| .
2. Grenzwerte
2.1. Grenzwerte von Folgen. Unter einer unendlichen Folge reeller Zahlen versteht man
a→ R, wobei man das Bild von n mit an bezeichnet. Man kann auch
eine Abbildung n −−
Folgen betrachten, deren Numerierung mit einer ganzen Zahl m beginnt, in diesem Fall ist
der Definitionsbereich der Abbildung a die Menge aller l ∈ Z mit l ≥ m. Auch beidseitig
unendliche Folgen sind erlaubt, in diesem Fall ist a auf ganz Z definiert.
Beispiel 1. Durch Ausdrücke wie an = 1/n (n ≥ 1) oder an = 2−n sind Folgen reeler
Zahlen definiert, ebenso durch die rekursive Vorschrift F0 = 1, F1 = 1 und Fn+2 = Fn + Fn+1
(Folge der Fibonacci-Zahlen).
In den folgenden Betrachtungen sei K = R oder K = C.
Definition 1. Die Zahl a ∈ K ist der Grenzwert für n → ∞ der Folge (an )∞
n=no , an ∈ K,
falls zu jedem ε > 0 eine ganze Zahl m mit |a − an | < ε für alle ganzen Zahlen n ≥ m, die
zum Definitionsbereich der Folge gehören. Wir schreiben a = limn→∞ an . Eine Folge nennt man
konvergent, falls sie einen Grenzwert hat, andernfalls nennt man sie divergent.
Die folgenden Hinweise auf Beweise in dem Buch von Forster beziehen sich auf den Fall
von Folgen reeller Zahlen. Soweit die Aussage auch im Fall komplexer Zahlen behauptet wird,
finden sich Beweise im Abschnitt 13 desselben Buches.
Satz 1. Jede Folge hat höchstens einen Grenzwert.
Der Satz entspricht Satz 2 im selben Kapitel bei Forster und wird auch genauso bewiesen.
Auch die folgenden Beispiele finden sich ähnlich bei Forster.
2. GRENZWERTE
13
Beispiel 2.
• Die konstante Folge an = a hat a als Grenzwert.
• limn→∞ 1/n = 0.
• Die Folge an = (−1)n hat keinen Grenzwert.
• Es gilt limn→∞ n/(n + 1) = 1.
• Der Grenzwert limn→∞ bn mit b ∈ R existiert genau für −1 < b ≤ 1, und er ist 0 für
−1 < b < 1 und 1 für b = 1.
Der Beweis der letzten Aussage hängt teilweise von Satz 3 ab und findet sich bei Forster,
§4.7.
Definition 2. Eine Folge reeller Zahlen ist von oben beschränkt, (bzw. von unten beschränkt, falls eine Zahl K mit xn ≤ K (bzw. mit xn ≥ K) für alle n im Definitionsbereich
der Folge existiert. Eine Folge (an ) reeller oder komplexer Zahlen ist beschränkt, falls eine Zahl
K ≥ 0 mit |an | ≤ K für alle Folgenglieder existiert.
Im den folgenden Betrachtungen wollen wir der Einfachheit halber voraussetzen, daß N
der Definitionsbereich der Folge ist. Die folgenden Sätze übertragen sich alle auf den einseitig
unendlichen Fall, aber ein Teil von ihnen ist für zweiseitig unendliche Folgen falsch.
Fakt 1.
• Eine Folge reeller Zahlen ist genau dann beschränkt, wenn sie von oben
und von unten beschränkt ist.
• Eine Folge (an ) ist genau dann beschränkt, wenn eine Zahl K und ein no ∈ N mit
|an | ≤ K für n ≥ no existieren.
Beweis. Zum ersten Punkt bemerkt man, daß eine betragsmäßig durch K beschränkte
Folge reeller Zahlen auf Grund der Regeln für Absolutbeträge an von unten durch −K und
von oben durch K beschränkt ist. Andererseits ist eine von oben durch A und von unten durch
B beschränkte reelle Folge dem Betrage nach durch max(A, −B) beschränkt.
Unter der im zweiten Punkt formulierten Bedingung sei K̃ das Maximum der endlich vielen
Zahlen K und |an | mit 0 ≤ n ≤ no , dann gilt |an | ≤ K̃ für n ∈ N. In die umgekehrte Richtung
ist der zweite Punkt trivial.
Zwischen der Konvergenz reeller und komplexer Zahlenfolgen besteht ein enger Zusammenhang.
Satz 2. Eine Folge komplexer Zahlen (zn )∞
n=no konvergiert genau dann gegen eine komplexe
Zahl z, wenn limn→∞ ℜ(zn ) = ℜ(z) und limn→∞ ℑ(zn ) = ℑ(z) gilt.
Folgerung 1. Eine Folge reeller Zahlen konvergiert genau dann in R (also im Sinne von
Definition 1 mit K = R), wenn sie in C (also im Sinne von Definition 1 mit K = C) existiert.
In diesem Fall stimmen ihre Limites in R und C überein.
Soweit keine anderen Voraussetzungen angegeben sind, sind die folgenden Sätze sowohl für
Folgen reeller als auch für Folgen komplexer Zahlen richtig. Der folgende Satz entspricht Satz 1
bei Forster.
Satz 3. Jede konvergente Zahlenfolge ist beschränkt.
14
Der folgende Satz faßt hauptsächlich die Sätze 3 und 4 sowie die Korollarien 1 und 2 bei
Forster zusammen:
Satz 4.
• Summe, Differenz und Produkt zweier konvergenter Folgen an und bn sind
konvergent, und es gilt
lim an + bn = lim an + lim bn
n→∞
n→∞
n→∞
lim an − bn = lim an − lim bn
n→∞
n→∞
n→∞
lim an · bn = lim an lim bn
n→∞
n→∞
n→∞
• Das Produkt einer konvergenten Folge mit einer Zahl λ ist konvergent, und es gilt
lim λan = λ lim an .
n→∞
n→∞
• Wenn die Folge an konvergiert, so konvergieren auch die Folgen |an | und an , und es gilt
lim |an | = lim an n→∞
n→∞
lim an = lim an
n→∞
n→∞
• Wenn die Folge an beschränkt ist und die Folge bn gegen 0 konvergiert, so konvergiert
auch die Folge an bn gegen 0.
Beispiel 3.
• Es gilt limn→∞
• Es gilt limn→∞ n2−n = 0.
2n −1
2n
= 1.
Der folgende Satz enspricht Satz 5 bei Forster:
Satz 5. Seien an und bn zwei konvergente Folgen reeller oder komplexer Zahlen, wobei der
Limes der Folge bn nicht verschwindet. Dann gibt es ein no mit bn 6= 0 für n ≥ no , die Folge
der Quotienten an /bn ist konvergent, und
limn→∞ an
an
=
.
lim
n→∞ bn
limn→∞ bn
Beispiel 4. Es gilt limn→∞
1+2n
1−2n
= 1.
Satz 6 bei Forster besagt:
Satz 6. Wenn an und bn zwei konvergente Folgen reeller Zahlen sind und wenn an ≤ bn
für genügend große n gilt (maW, falls ein no ∈ N mit an ≤ bn für n ≥ no existiert), so gilt
lim an ≤ lim bn .
n→∞
n→∞
Als Folgerung für den Spezialfall, in dem eine der betrachteten Folgen konstant ist, haben
wir
Folgerung 2. Wenn für eine konvergente Folge reeller Zahlen an ≤ A (bzw. an ≥ B) für
genügend große n gilt, so gilt limn→∞ an ≤ A (bzw. limn→∞ an ≥ B).
2. GRENZWERTE
15
Wir formulieren noch den folgenden
Fakt 2. Wenn an konvergent ist, so ist für jedes k ∈ Z auch die Folge an+k konvergent mit
demselben Limes.
P∞
Definition 3. Eine
unendliche
Reihe
n=a an konvergiert gegen s, falls die Folge der
Pm
Partialsummen sm = n=a an gegen s konvergiert. Eine nicht konvergente unendliche Reihe
nennt man divergent.
P
Satz 7.
• Wenn eine unendliche Reihe ∞
n=a an konvergiert, so konvergiert die Folge
der an gegen 0. Insbesondere ist diese
Folge
beschränkt.
P∞
P
• Sei b ≥ a, eine unendliche Reihe n=a an konvergiert genau dann, wenn ∞
n=b an konvergiert, und es gilt in diesem Fall
∞
X
an =
n=a
b−1
X
an +
n=a
∞
X
an .
n=b
Beweis. Im ersten Punkt möge die Reihe gegen s konvergieren, dann gilt
lim an = lim sn − lim sn−1 = s − s = 0.
n→∞
n→∞
Pm
P
Für die zweite Aussage seien sm = n=a an und s′m = m
n=b an die Teilsummen der betrachPb−1
′
teten Folgen, dann gilt sm = sm + n=a an für m ≥ b, und man kann die obigen Regeln für
Limites von Folgen anwenden.
n→∞
Die folgenden Sätze haben dieselbe Nummer und denselben Beweis wie bei Forster.
Satz 8. Sei q eine komplexe Zahl.
• Für |q| < 1 gilt limn→∞ q n = 0 und im Fall q = 1 gilt limn→∞ q n = 1. In allen anderen
Fällen hat die Folge q n für n → ∞ P
keinen Grenzwert in C.
n
• Die unendliche geometrische Reihe ∞
n=0 q konvergiert genau dann, wenn |q| < 1 gilt.
In diesem Fall gilt
∞
X
1
.
(1)
qn =
1
−
q
n=0
Beweis. Im ersten Punkte folgt die Konvergenz q n → 0 für |q| < 1 aus Folgerung .1.3.2,
und im Fall q = 1 liegt eine konstante Folge vor. Angenommen, es gilt |q| ≥ 1 und q 6= 1, und
die komplexe Zahl g ist Grenzwert von q n für n → ∞. Es gilt
|g| = lim |q n | = lim |q|n ≥ 1
n→∞
n→∞
nach Folgerung 2 und Satz 4. Es gilt also g 6= 0. Andererseits gilt
qg = lim q · q n = lim q n+1 = lim q n = g
n→∞
n→∞
n→∞
nach Satz 4 und Fakt 2. Es gilt also (q − 1)g = 0, und wegen q 6= 0 folgt g = 0 im Widerspruch
zum vorher Gezeigten. Also war unsere Annahme der Existenz des Grenzwertes g falsch.
16
Nach Satz 7 ist limn→∞ q n = 0 eine notwendige Bedingung für die Konvergenz der linken
Seite von (1). Nach dem ersten Punkt ist dies genau für |q| < 1 der Fall. Es verbleibt also,
(1) im Fall |q| < 1 zu zeigen. Der Beweis der Summenformel für endliche geometrische Reihen
benutzt nur die Körperaxiome und überträgt sich also auf den Fall komplexer Zahlen. Es gilt
also
k
X
q k+1 − 1
n
q =
,
q−1
n=0
wobei der Nenner wegen |q| < 1 nicht 0 ist. Die Behauptung folgt aus dem ersten Punkt,
wonach limk→∞ q k+1 = 0 aus |q| < 1 folgt.
Im folgenden setzen wir der Einfachheit halber voraus, daß die Summation der Reihen bei
0 beginnt. Der Satz gilt auch, wenn die Summation bei einem anderen Startindex beginnt.
Dieser muß aber bei beiden Reihen an und bn derselbe sein.
P
P∞
Satz 9. Seien ∞
unendlichePReihen, und sei λ ∈ R.
n=0 an und
n=0 bn zwei konvergente
P
Dann konvergieren auch die unendlichen Reihen ∞
(a
+
bn ) und ∞
n=0 n
n=0 λan , und
∞
X
(an + bn ) =
n=0
∞
X
n=0
∞
X
an +
n=0
∞
X
λan = λ
∞
X
bn
n=0
an .
n=0
P
P∞
Wenn an ≤ bn für alle n ∈ N gilt, so gilt ∞
a
≤
n
n=0
n=0 bn . Insbesondere ist die Summe
einer Reihe mit nichtnegativen Summanden nichtnegativ.
Der Satz ergibt sich sofort aus den entsprechenden Eigenschaften für endliche Summen und
für Grenzwerte.
Definition 4. Eine Folge an reeller Zahlen ist bestimmt divergent gegen +∞ (bzw. gegen
−∞), falls zu jeder reellen Zahl K ein m ∈ N mit an ≥ K (bzw. an ≤ K) für n ≥ m existiert.
Man drückt diesen Sachverhalt oft durch limn→∞ an = ∞ (bzw. limn→∞ an = −∞) aus.
Wenn man R = R ∪ {±∞} durch −∞ < t < ∞ für alle t ∈ R ordnet, so können die
Definitionen von Konvergenz und bestimmter Divergenz für Folgen wie folgt vereinheitlicht
werden:
Fakt 3. Sei (an ) eine Folge reeller Zahlen und A ∈ R. Genau dann gilt limn→∞ an = A,
wenn die folgenden Bedingungen beide richtig sind:
• Ist Ã ∈ R und gilt Ã < A, so gilt an > Ã für alle genügende großen n.
• Ist Ã ∈ R und gilt Ã > A, so gilt an < Ã für alle genügende großen n.
Beispiel 5. Die Folgen an = n bzw. an = 2n sind bestimmt divergent gegen ∞. Die Folge
an = (−1)n ist divergent, aber nicht bestimmt divergent.
2. GRENZWERTE
17
Beispiel 6. Sei q ∈ R. Es gilt limn→∞ q n = ∞ genau dann, wenn q > 1 gilt. Für kein
q ∈ R divergiert q n für n → ∞ bestimmt gegen −∞.
Der folgende Satz ist eine Zusammenfassung und leichte Verallgemeinerung der Sätze 9 und
10 bei Forster. Soweit die Behauptungen allgemeiner sind als bei Forster, ist der in der Vorlesung
gegebene Beweis eine offensichtliche Verallgemeinerung. Es ist ausreichend, die Beweise bei
Forster zu verstehen.
Satz 10. Wenn die Folge an bestimmt divergent gegen ∞ oder −∞ ist, so existiert 1/an
für genügend große n, und es gilt
lim 1/an = 0.
n→∞
Dasselbe gilt unter der schwächeren Voraussetzung, daß die Folge |an | gegen ∞ bestimmt divergiert und es gilt auch die Umkehrung dieser Aussage: Wenn die Folge 1/an für genügend
große n definiert ist und gegen 0 konvergiert, so divergiert die Folge der |an | bestimmt gegen
∞.
Folgerung 3. Eine Folge positiver bzw. negativer Zahlen konvergiert genau dann gegen
0, wenn die Folge ihrer Kehrwerte bestimmt gegen ∞ (bzw. −∞) divergiert.
Ohne den (einfachen) Beweis teilen wir noch mit:
Fakt 4. Das Produkt zweier bestimmt divergenter Folgen ist bestimmt divergent. Dasselbe
gilt auch für deren Summe, wenn sie beide in dieselbe Richtung bestimmt divergent sind, und
für deren Differenz, wenn sie in unterschiedliche Richtungen bestimmt divergieren. Die Regeln
aus Satz 4 gelten auch in dieser Situation, wobei man
und
∞ + ∞ = ∞ · ∞ = ∞ − (−∞) = (−∞) · (−∞) = ∞ · ∞ = ∞
(−∞) + (−∞) = (−∞) − ∞ = (−∞) · ∞ = ∞ · (−∞) = ∞
setzt. Die Summe aus einer beschränkten und einer bestimmt divergenten Folge divergiert
bestimmt in dieselbe Richtung, dasselbe gilt für da Produkt aus einer bestimmt divergenten
Folge und einer positiven reellen Zahl oder aus einer bestimmt divergenten Folge und einer von
unten durch eine positive Zahl beschränkten Folge.
2.2. Das Vollständigkeitsaxiom. Die bisher aufgestellten Axiome für den Bereich der
reellen Zahlen sind für unsere Zwecke nicht ausreichend. Es gibt nämlich viele für die Anwendungen wichtige Folgen, deren Konvergenz man nur mit Hilfe eines weiteren Axioms, des
Vollständigkeitsaxiomes, zeigen kann.
Definition 1. Monotone bzw. streng monotone Folge.
Fakt 1 (Vollständigkeitsaxiom). Es gelten die beiden folgenden Aussagen, die bereits auf
Grund der bisherigen Axiome äquivalent sind:
• Jede monoton wachsende und von oben beschränkte Folge reeller Zahlen konvergiert.
• Jede monoton fallende und von unten beschränkte Folge reeller Zahlen konvergiert.
18
Beweis. Nur die Äquivalenz der beiden Aussagen auf Grund der bisherigen Axiome muß
bewiesen werden, da ihre Gültigkeit ein neues Axiom ist. Wenn an die Voraussetzungen eines
Punktes erfüllt, so erfüllt −an die Voraussetzungen des anderen. Wenn −an konvergiert, so
konvergiert die Folge an = −1 · (−an ) auf Grund der letzten Aussage von Satz .2.1.4 (mit
λ = −1). Die Äquivalenz der beiden Behauptungen folgt.
Fakt 2. Jede monoton wachsende Folge reeller Zahlen ist konvergent oder gegen ∞ bestimmt divergent. Jede monoton fallende Folge reeller Zahlen ist konvergent oder gegen −∞
bestimmt divergent.
Aus dieser Fassung des Vollständigkeitsaxiomes ergibt sich die Existenz der Limites in der
folgenden Definition:
Definition 2. Sei (an ) eine Folge reeller Zahlen. Wir setzen
sup{an |n ≥ no } = lim max(ano , . . . , ak )
k→∞
inf{an |n ≥ no } = lim min(ano , . . . , ak )
k→∞
lim sup an = lim sup{ak |k ≥ n}
n→∞
n→∞
lim inf an = lim inf{ak |k ≥ n}
n→∞
n→∞
Für die beiden letzten Definitionen vereinbaren wir dabei, daß der Limes einer konstanten
Folge ±∞ gleich dem allgemeinen Folgenglied ±∞ ist.
Fakt 3. Es gilt
sup{an |n ≥ no } = − inf{−an |n ≥ no }
inf{an |n ≥ no } = − sup{−an |n ≥ no }
lim inf an = − lim sup −an
n→∞
n→∞
lim inf an = − lim sup −an .
n→∞
n→∞
sowie
sup{λan |n ≥ no } = λ inf{an |n ≥ no }
inf{λan |n ≥ no } = λ sup{an |n ≥ no }
lim inf λan = λ lim sup an
n→∞
n→∞
lim inf λan = λ lim sup an
n→∞
n→∞
für alle reellen Zahlen λ ≥ 0, wobei wir in diesem Fall ausnahmsweise 0 · ∞ = 0 · −∞ = 0
setzen dürfen.
Fakt 4. Sei (an ) eine Folge reeller Zahlen.
• Sei A = sup{ak |k ≥ n} ∈ R. Für alle k ≥ n gilt dann ak ≤ A, und A ist das kleinste
Element von R mit dieser Eigenschaft.
2. GRENZWERTE
19
• Sei A = inf{ak |k ≥ n} ∈ R. Für alle k ≥ n gilt dann ak ≥ A, und A ist das größte
Element von R mit dieser Eigenschaft.
• Sei A = lim supn→∞ an ∈ R. Dann gilt für jedes Ã ∈ R mit Ã > A die Ungleichung
an < Ã für alle genügend großen n, und A ist das größte Element von R mit dieser
Eigenschaft.
• Sei A = lim inf n→∞ an ∈ R. Dann gilt für jedes Ã ∈ R mit Ã < A die Ungleichung
an > Ã für alle genügend großen n, und A ist das kleinste Element von R mit dieser
Eigenschaft.
Fakt 5. Sei (an ) eine Folge reeller Zahlen und A ∈ R. Dann gilt limn→∞ an = A genau
dann, wenn lim inf n→∞ an = lim supn→∞ an = A gilt.
Für eine einfache und geschlossene Formulierung des Beweises nutzen wir Fakt .2.1.3.
Bemerkung 1. Im Unterschied zum Grenzwert sind die oberen und unteren Häufungsgrenzen lim sup und lim inf für Folgen reeller Zahlen stets definiert (sie können freilich ±∞
sein). Nach dem Fakt ist die Folge genau dann konvergent oder bestimmt divergent, wenn beide
Häufungsgrenzen übereinstimmen. Sind sie dabei endlich, so liegt Konvergenz vor, andernfalls
bestimmte Divergenz.
Definition 3. Eine Folge ist eine Fundamentalfolge (bzw. eine Cauchy-Folge bzw. in sich
konvergent, falls es zu jeder positiven reellen Zahl ε ein n ∈ N gibt, so daß |ak − al | < ε für
min(k, l) ≥ n gilt.
Fakt 6. Eine Folge komplexer Zahlen an ist genau dann eine Cauchyfolge, wenn die Folgen
ℜan und ℑan Cauchyfolgen sind.
Satz 1. Eine Zahlenfolge ist genau dann eine Cauchyfolge, wenn sie konvergiert.
Bemerkung 2. Ohne das Vollständigkeitsaxiom könnte immer noch bewiesen werden, daß
konvergente Folgen Cachy-Folgen sein müssen. Die umgekehrte Aussage ist eine äquivalente
Umformulierung des Vollständigkeitsaxiomes, ohne welches nicht die Existenz des Limes von
Cauchy-Folgen gezeigt werden kann, sondern nur deren Beschränktheit.
∞
Definition 4. Eine Teilfolge einer Folge (an )∞
n=no ist eine Folge der Form (aik )k=ko , wobei
∞
(ik )k=ko eine streng monoton wachsende Folge ganzzahliger Indizes ist, die alle ≥ no sind.
Fakt 7. Eine Teilfolge einer konvergenten Folge ist konvergent.
Satz 2. Sei (an )∞
n=no eine Folge reeller Zahlen, dann gibt des Teilfolgen dieser Folge, deren
Limites lim inf n→∞ an und lim supn→∞ an sind.
Beweis. Wir betrachten nur lim sup, der Fall lim inf geht analog dazu. Sei l = lim supn→∞ an .
(−)
(+)
Im Fall l < ∞ sei ln± = l ± 2−n , andernfalls ln = n und ln = ∞. In jedem Fall gilt, nach
(+)
Fakt 4, an < ln für alle genügend großen n. Nach der in Fakt 4 formulierten Minimalitätsei(−)
genschaft von lim sup gibt es beliebig große n mit an > ln .
20
(+)
Sei nun i−1 = no . Wenn k ≥ 0 und ik−1 schon gewählt ist, sei b > ik−1 so daß an < lk für
(−)
(−)
n ≥ b gilt. Nach der vorhin formulierten Eigenschaft von lk gibt es ein ik ≥ b mit aik > lk .
(−)
(+)
Die Folge der Indizes (ik )∞
< aik < lk für alle k, woraus
k=0 ist streng monoton, und lk
limk→∞ aik = l folgt.
Folgerung 1 (Bolzano-Weierstraß). Aus jeder beschränkten Folge reeller oder komplexer
Zahlen kann man eine konvergente Teilfolge auswählen.
Beweis. Für beschränkte Folgen reeller Zahlen gilt lim supn→∞ an < ∞, und die Behauptung folgt aus dem Satz. Für beschränkte Folgen komplexer Zahlen sind die Folgen der Realund Imaginärteile beschränkt. Man kann also nach dem soeben betrachteten Fall reeller Zahlen
erst eine streng monotone Indexfolge ik finden, so daß die Folge ℜaik konvergiert, und dann
eine weitere Indexfolge (kl )∞
l=0 , so daß die Folge ℑaikl konvergiert. Dann konvergiert die Folge
∞
(aikl )l=0 nach Satz .2.1.2.
2.3. Konvergenzkriterien für Reihen. Ohne Kapitelnummer aufgeführte Sätze aus
Forster stammen aus Forster, §8.
P
Satz 1. Ein Reihe ∞
nichtnegativer reeller Zahlen konvergiert geau dann, wenn die
k=0 akP
Folge der Partialsummen sn = nk=0 ak von oben beschränkt ist. Ist die Folge der Partialsummen unbeschränkt, so divergiert die Reihe gegen ∞ bestimmt.
Beweis. Die Aussage entspricht Satz 2 bei Forster und folgt leicht aus Fakt .2.2.1.
Bemerkung 1. Die Aussage gilt mutatis mutandis auch für Reihen mit nichtpositiven ak .
Satz 2 (Leibniz). Sei (an )∞
n=0 eine monoton fallende Folge nichtnegativer Zahlen.
P∞
k
• Die Reihe k=0 (−1) ak konvergiert genau dann, wenn limn→∞ an = 0 gilt.
P
Pl
k
k
• In diesem Fall sei s = ∞
k=0 (−1) ak und sl =
k=0 (−1) ak , dann gilt sl ≥ s für gerade
und sl ≤ s für ungerade l.
Die Notwendigkeit folgt aus Satz .2.1.7 und die Hinlänglichkeit ist Satz 4 bei Forster mit
demselben Beweis.
P∞
Definition
P∞ 1. Eine Reihe n=0 an reeller oder komplexer Zahlen konvergiert absolut, wenn
die Reihe n=0 an absolut konvergiert.
Fakt 1. Eine Reihe komplexer Zahlen konvergiert genau dann absolut, wenn sowohl die
Reihe der Realteile als auch die Reihe der Imaginärteile absolut konvergieren.
P
Satz 3. Eine absolut konvergente Reihe ∞
n=0 an reeller oder komplexer Zahlen konvergiert
auch im gewöhnlichen Sinne, und es gilt
∞
∞
X X
(1)
an ≤
|an | .
n=0 n=0
2. GRENZWERTE
21
P
P
Beweis. Sei sn = nk=0 ak , s′n = nk=0 |ak |. In beiden Fällen sei auch der Fall n = −1
zugelassen, welcher der leeren Summe entspricht. Dann folgt aus der Dreiecksungleichung für
endliche Summen
n
n
X
X
|sn − sm | = ak ≤
|ak | = s′n − s′m
k=m+1
k=m+1
P∞
für −1 ≤ m ≤ n < ∞. Da k=0 |ak | konvergiert, bilden die s′n eine Cauchyfolge. Unmittelbar
aus den Definitionen und der letzten Ungleichung folgt, daß auch die sn eine Cauchyfolge bilden.
Damit ergibt sich die Behauptung über die Konvergenz der Ausgangsreihe aus Satz .2.2.1. Als
Spezialfall m = −1 der vorhin gezeigten Ungleichung ergibt sich |sn | ≤ |s′n |, also gilt
lim sn = lim |sn | ≤ lim |s′n | ,
n→∞
n→∞
n→∞
und (1) folgt.
P∞
Satz 4. Die konvergente Reihe
P∞ n=0 an nichtnegativer reeller Zahlen sei eine absolut konvergente Majorante
der
Reihe
es gelte also |bn | ≤ an .
n=0 bn reeller oder komplexer Zahlen,P
P∞
Wenn die Reihe n=0 an konvergiert, so konvergiert auch die Reihe ∞
n=0 bn . Wenn für jede
P∞ (i)
P∞
natürliche Zahl i ein Reihe
n=0 an gegeben ist und
n=0 an eine gemeinsame Majorante
dieser Reihen ist, so gilt
∞
∞
X
X
lim a(i)
=
lim
a(i)
n
n
n=0
i→∞
i→∞
n=0
Beweis. Der erste Teil ist Satz 6 bei Forster und wird wie folgt bewiesen: Wir haben
n
X
k=0
|bk | ≤
n
X
ak ,
k=0
wobei die rechte Seite auf Grund von Satz 1 beschränkt ist. Also ist auch die linke Seite dieser
Ungleichung beschränkt, und die absolute Konvergenz der untersuchten Reihe folgt aus Satz 1.
Zum Beweis der zweiten Behauptung sei ε > 0 vorgegeben, wir wählen ein no mit
∞
X
n=no
ε
ak < ,
3
(m) was auf Grund der Konvergenz von n=0 an möglich ist, und ein mo mit bn − bn ≤
0 ≤ n < no und m > mo . Für m > mo gilt
∞
n −1
∞
nX
∞
∞
o
o −1
X
X
X
X
X
(m)
(m)
(m) bn −
bn = bn −
bn +
bn −
bn n=0
n=0
n=0
n=0
no
no
nX
∞
∞
o −1
X
X
(m) bn − b(m)
≤
+
b
+
b
n
n
n n=0
n=n
n=n
P∞
o
o
ε
3no
für
22
<
nX
o −1
n=0
ε ε
ε
+ + =ε
3no 3 3
wie für die zweite Aussage benötigt, wobei auf der letzten Zeile
∞
∞
∞
X X
X
ε
bn ≤
|bn | ≤
an <
n=n n=n
3
n=n
o
o
sowie eine analoge Ungleichung für die
(m)
bn
o
benutzt wurden.
(n)
Folgerung 1 (Satz über die monotone Konvergenz). Wenn (ak )∞
n,k=0 eine in n monoton
wachsende Doppelfolge nichtnegativer reeller Zahlen ist, so gilt
∞
∞
X
X
(n)
(n)
lim
ak =
lim ak .
n→∞
k=0
k=0
n→∞
P
Satz 5 (Quotientenkriterium). Es konvergiert jede Reihe ∞
n=0 an reeller oder komplexer
Zahlen, für die eine positive reelle Zahl Θ < 1 mit |an+1 | ≤ Θ |an | für genügend große n
existiert.
Der Satz entspricht Satz 7 bei Forster.
Satz 6. Die Exponentialreihe exp(x) =
absolut, und es gilt
P∞
xn
n=0 n!
konvergiert für beliebige komplexe Zahlen
exp(x) = lim (1 + x/i)i .
(2)
i→∞
Aus limm→∞ xm = x folgt limm→∞ exp(xm ) = exp(x). Wenn (xm )∞
m=0 eine gegen 0 konvergente
Folge von 0 verschiedner komplexer Zahlen ist, so gilt
exp(xm ) − exp(x)
= 1.
(3)
lim
m→∞
xm
Beweis. Die absolute Konvergenz der Exponentialreihe ergibt sich leicht aus dem Quotientenkriterium, siehe Satz 8.1 bei Forster. Zum Beweis von (2) berechnen wir die Folgenglieder
auf der linken Seite mit dem binomischen Lehrsatz:
m ∞
X
x m X m xn
(1 + ) =
=
b(m)
n
n
m
m
n
n=0
n=0
xn
(m)
. Aus
mit bn = m
n mn
b(m)
=
n
n
n−1
n−1
n−1
Y m−i
xn Y m − i
xn Y
(m
−
i)
=
=
b
n
n!mn i=0
n! i=0 m
m
i=0
(m)
x
mit bn = n! ergibt sich einmal limn→∞ bn = bn für jede natürliche Zahl n und zum zweiten
(m) bn ≤ |bn |. Man kann also Satz 4 mit der absolut konvergenten Exponentialreihe an = |bn | =
2. GRENZWERTE
|x|n /n! als Majorante anwenden und erhält
lim (1 + x/m)m = lim
m→∞
m→∞
∞
X
b(m)
=
n
n=0
23
∞
X
bn = exp(x).
n=0
Es gelte limm→∞ xm = x, dann existiert eine obere Schranke R für die xm , und mit bn =
n
(m)
(m)
x /n!, bn = xnm /n! gilt limm→∞ bn = bn , wobei Satz 4 mit an = Rn! als Majorante genommen
werden kann. Es gelte nun zusätzlich x = 0, und die x, seien alle von 0 verschieden. Da der
erste Summand der Exponentialreihe 1 ist, gilt
∞
∞
∞
k−1
X
X
X
xnm
xnm
xm
exp(xm ) − 1
= lim
=
= 1,
= lim
lim
lim
m→∞
m→∞
m→∞
xm
k!
(n + 1)! n=0 m→∞ (n + 1)!
n=0
k=1
n
wobei die Vertauschung von Limes und unendlicher Summation durch Anwendung von Satz 4
(m)
mit bn = xnm /(n + 1)!, bn = 0 und an = Rn /n! gerechtfertigt werden kann.
Die Betrachtung der Exponentialreihe zeigt, daß das Quotientenkriterium nützlich ist. Es
ist aber nicht der Weisheit letzter Schluß. Beispielsweise erfordert der Beweis des folgenden
Satzes eine andere Idee.
Satz 7. Die Zeta-Reihe
ζ(n) =
∞
X
i−n
i=1
konvergiert für ganze n > 1 und divergiert für alle anderen ganzen Zahlen n.
Beweis. Offenbar reicht es, den Fall n ≥ 0 zu betrachten.
2(k−1)(n−1) ≤
k −1
2X
i=2k−1
i−n ≤ 2k(n−1)−1 ,
und die Behauptung folgt leicht aus Aussagen über die Konvergenz der geometrischen Reihe.
Aus dem Satz über die majorisierte Konvergenz leiten wir den folgenden Doppelreihensatz
her:
Satz 8. Sei (an,m )∞
n,m=0 eine Doppelfolge reeller oder komplexer Zahlen.
• Wenn die Zahlen an,m reell und nichtnegativ sind, so gilt
∞ X
∞
X
(4)
n=0 m=0
an,m =
d
∞ X
X
d=0 m=0
am,d−m =
∞ X
∞
X
an,m
m=0 n=0
wobei (4) als Gleichung zwischen Elementen von R ∪ {∞} aufzufassen ist.1
1Wobei
P∞ P∞
P∞
der äußeren Summe n=0 m=0 an,m der Wert ∞ zugewiesen wird, wenn m=0 an,m für ein n
gilt. Ähnlich wird mit der Doppelsumme am rechten Ende von (4) verfahren.
24
• Gilt
P∞ P∞
m=0
n=0
|an,m | < ∞, so gilt (4) ebenfalls.
Beweis. Wir zeigen zunächst die erste Behauptung. Ist diese gezeigt, so ist schon erwiesen,
daß die Voraussetzung des zweiten Punktes symmetrisch in m und n ist. Es genügt daher
in beiden Fällen, die linke Gleichung in (4) zu zeigen. Die rechte ergibt sich sodann durch
Vertauschung der Rollen der Indizes n und m.
Wir haben
d
∞ D−n
∞
D X
X
X
X
X
am,d−m =
am,n =
(+)
sn(D) ,
d=0 m=0
n=0 m=0
n=0
(N )
es liegt hier eine Umordnung einer endlichen Summe vor, die Zahlen sn
)
s(N
=
n
D−n
X
sind durch
am,n
m=0
(N )
P∞
definiert. Es gilt limD→∞ s
=
m=0 an,m , wobei Konvergenz unter den Voraussetzungen
des ersten
P Punktes monoton und unter den Voraussetzungen des zweiten Punktes majorisiert
durch ∞
m=0 |an,m | erfolgt. Es gilt also
lim
D→∞
∞
X
sn(D)
n=0
=
∞ X
∞
X
an,m ,
n=0 m=0
nach dem Satz über die monotone bzw. die majorisierte Konvergenz. Auf der rechten Seite
dieser Gleichung steht gerade die linke Seite von (+). Auf der anderen Seite ist, auf Grund
der Definition der Summe unendlicher Reihen, der mittlere Term in (4) gerade der Limes für
D → ∞ der linken Seite von (+), und die Behauptung ist bewiesen.
Bemerkung 2. Ohne irgendwelche Voraussetzungen an die Doppelreihe ist (4) falsch. Als
Gegenbeispiel kann die folgende Doppelreihe genommen werden:


n=m
1
an,m = −1 n = m + 1

0
andernfalls.
Dann gilt
∞ X
∞
X
n=0 m=0
∞ X
∞
X
an,m = 0
an,m = 1,
m=0 n=0
während
P∞ Pd
d=0
m=0
am,d−m =
P∞
d
d=0 (−1)
unbestimmt divergent ist.
Eng verwandt mit der soeben betrachteten Frage der Vertauschbarkeit von Limes und
Summation unendlicher Reihen ist die Frage der Umordnung unendlicher Reihen.
2. GRENZWERTE
25
P
Satz 9 (Kleiner Umordnungssatz). Die Reihe ∞
n=0 an konvergiere absolut, und die FunkP
f→ N sei bijektiv. Dann konvergiert auch ∞ a absolut, und zwar gegen denselben
tion N −−
n=0 n
Wert wie die Ausgangsreihe.
Der Satz entspricht Satz 8 bei Forster mit demselben Beweis. Alternativ dazu kann Satz 8
auf die Doppelreihe
(
an m = f (n)
bn,m =
0 sonst
angewendet werden, denn es gilt
∞
X
n=0
∞
X
bn,m = an
bn,m = af (n) .
m=0
P∞
P∞
SatzP
10 (Produktsatz). Seien
a
und
n
n=0 bn zwei absolut konvergente Reihen, und
P n=0
sei cn = nk=0 ak bn−k . Dann ist ∞
c
absolut
konvergent,
und es gilt
n=0 n
∞
X
n=0
cn =
∞
X
n=0
an
∞
X
n=0
bn .
Beweis. Der Beweis
P∞sich durch Anwendung von Satz 8 auf die Doppelreihe (CAVE:
P ergibt
Genauer ausführen?) ∞
m=0 an bm .
n=0
Folgerung 2. Für komplexe Zahlen x, y gilt exp(x + y) = exp(x) exp(y).
Beweis. Sei an = xn /n! und bb = y n /n!. Wir haben schon gesehen, daß beide Reihen absolut konvergieren. Der Satz ist daher anwendbar, wobei man für die Glieder der Produktreihe
n
n
n
n
X
X
1 X k n−k
1 X k n−k n
(x + y)n
n!
xk y n−k
=
=
=
x y
x y
cn =
ak bn−k =
k!(n − k)!
n! k=0
k!(n − k)!
n! k=0
k
n!
k=0
k=0
erhält.
2.4. Einführung in den Stetigkeitsbegriff. Sei K = R oder K = C und M ⊆ K eine
Teilmenge.
f→ K und m ∈ M sind folgende Bedingungen äquivalent:
Satz 1. Für eine Funktion M −−
• Zu jedem ε > 0 existiert ein δ > 0 mit |f (x) − f (m)| < ε für x ∈ M und |x − m| < δ.
• Wenn xn eine gegen m konvergierende Folge von Elementen von M ist, so konvergiert
die Folge f (xn ) gegen f (m).
Definition 1. Eine derartige Funktion nennt man stetig an der Stelle m. Man nennt f
stetig, wenn f stetig an allen Stellen m ∈ M ist.
26
Satz 2.
• Die konstante Funktion f (x) = c und die identische Funktion f (x) = x
sind stetig.
• Summe und Produkt zweier an einer Stelle xo stetiger Funktion sind stetig daselbst.
Dasselbe gilt für den Kehrwert einer an der Stelle xo stetigen Funktion f mit f (xo ) 6= 0.
• Die Einschränkung einer an der Stelle xo stetigen Funktion f mit Definitionsbereich M
auf einen kleineren Definitionsbereich M̃ ⊆ M mit xo ∈ M̃ ist weiterhin stetig an der
Stelle xo . Insbesondere ist f |M̃ stetig auf ganz M̃ , wenn f stetig auf ganz M ist.
• Die Exponentialfunktion ist stetig auf ganz C.
Beispiel 1. Die Funktion f (x) = x2 = x · x ist nach den beiden ersten Punkten des Satzes
stetig.
Im Zusammenhang mit dem folgenden, sehr wichtigen Satz ergibt sich daraus die früher
behauptete Existenz von Quadratwurzeln nichtnegativer reeller Zahlen.
Definition 2. Definition der abgeschlossenen, halbabgeschlossenen und offenen Intervalle.
Satz 3 (Zwischenwertsatz für stetige Funktionen). Sei I = [a, b] ein abgeschlossenes Inf→ R stetig auf ganz I. Sei y eine reelle Zahl mit f (a) ≤ y ≤ f (b) oder
tervall und I −−
f (b) ≤ y ≤ f (a), dann existiert ein x ∈ I mit f (x) = y.
Wir beschreiben als Beweis ein Einschachtelungsverfahren von enormer praktischer Relevanz.
f→ [c, d] = I ′ streng monoton wachsend und stetig ist und
Satz 4. Wenn I = [a, b] −−
g→ I ist stetig
f (a) = c sowie f (b) = d gilt, so ist f bijektiv und die Umkehrfunktion I ′ −−
und streng monoton wachsend. Dasselbe gilt für streng monoton fallende f mit f (a) = d und
f (b) = c, in diesem Fall ist auch g streng monoton wachsend.
Beweis. Wir betrachten nur den Fall streng monoton wachsender f . Der Fall eines streng
monoton fallenden f geht analog oder kann durch Betrachtung von −f auf diesen zurückgeführt
werden. Für den Rest des Beweises sei also f als streng monoton wachsend vorausgesetzt.
Die Surjektivität von f ergibt sich aus Satz 3, und die Injektivität von f folgt aus der
g→ I. Wäre g nicht streng
strengen Monotonie von f . Daher hat f eine Umkehrfunktion I ′ −−
monoton wachsend, so gäbe es x < y, x, y ∈ I mit g(x) >= g(y). Auf Grund der Monotonie
von f folgt x = f (g(x)) ≥ f (g(y)) = y, ein Widerspruch zu unserer Annahme x < y. Also ist
g streng monoton wachsend.
Es verbleibt noch der Beweis der Stetigkeit von g. Wir benutzen das nachfolgende Lemma,
wonach zum Beweis der Stetigkeit von g an der Stelle x ∈ I ′ der Nachweis von limn→∞ g(xn ) =
g(x) für monoton wachsende oder fallende und gegen x konvergierende Folgen xn mit xn ∈ I ′
ausreicht. Auf Grund der Monotonie von g ist die Folge g(xn ) ebenfalls monoton, und wegen
g(xn ) ∈ I ist sie beschränkt. Nach Satz .2.3.1 existiert y = limn→∞ g(xn ), und auf Grund der
Stetigkeit von f gilt
f (y) = lim f (g(xn )) = lim xn = x.
n→∞
n→∞
2. GRENZWERTE
27
Da f und g zueinander inverse Funktionen sind, folgt g(x) = y. Die Stetigkeit von g ist damit
bewiesen.
Lemma 1. Sei M ⊆ R, f eine reell- oder komplexwertige Funktion auf M und m ∈ M .
Genau dann ist f stetig auf M an der Stelle m, wenn für jede monotone Folge (mk ) von
Elementen von M mit limk→∞ mk = m der Grenzwert der Folge f (mk ) existiert und mit f (m)
übereinstimmt.
Das Lemma wird am zweckmäßigsten im Zusammenhang mit allgemeinen Betrachtungen
über Limites von Funktionswerten gezeigt, so daß der Beweis noch etwas aufgeschoben werden
soll.
2
x−→
Satz
• Die Funktion [0, ∞) −−
−−x
−→ [0, ∞) ist bijektiv, und ihre Umkehrfunktion
√ 5.
x ist stetig.
exp
• Die Funktion R −−
−→ (0, ∞) ist bijektiv, und ihre Umkehrfunktion log ist stetig.
Definition 3. Wenn a eine positive reelle und b eine komplexe Zahl ist, so setzen wir
ab = exp(b log a).
Aus Folgerung .2.3.2 folgt
Fakt 1. Seien a, a′ positive reelle und b, b′ komplexe Zahlen, dann gilt:
• (aa′ )b = ab a′b .
′
′
• ab+b = ab ab
′
′
• Ist b reell, so gilt abb = (ab )b .
Bemerkung 1. Aus der Definition folgt a0 = 1 und a1 = a. Außerdem folgt aus Fakt 1
durch Induktion nach n, daß an für natürliche Exponenten mit den in Definition .1.2.1 eingeführten Potenzen übereinstimmt. Weil für beide Konstruktionen x−n ·xn = 1 gilt, stimmen sie
auch für ganzzahlige Exponenten überein.√Aus dem dritten Punkt von Fakt 1 folgt schließlich
√
x = x1/2 , denn (x1/2 )2 = x. Analog gilt n x = x1/n für ganze Zahlen n 6= 0.
Ähnlich wichtig ist der folgende Satz über die Extremwerte stetiger Funktionen.
Satz 6. Sei I = [a, b], −∞ < a < b < ∞, ein beschränktes abgeschlossenes Intervall. Wenn
f
I −−→ R stetig ist, so gibt es m, M ∈ I mit f (m) ≤ f (x) ≤ f (M ) für alle x ∈ I.
Beweis. Es genügt, die Existenz von m zu zeigen, denn dann ergibt sich durch Anwendung
dieser Existenzaussage auf −f die Existenz von M .
Wir konstruieren induktiv eine Folge In = [an , bn ] mit folgenden Eigenschaften:
• I0 = I und In+1 ⊆ In .
• bn − an = 2−n (b − a).
• Zu jedem n ∈ N und jedem x ∈ I gibt es ein y ∈ In mit f (y) ≤ f (x).
Aus dem ersten Punkt folgt, daß die Folge der an monoton wachsend ist. Da alle an zu I
gehören, ist die Folge beschränkt. Es konvergiert also m = limn→∞ an . Wir zeigen, daß m die
gewünschte Eigenschaft hat. Sei x ∈ I, dann gibt es yn ∈ In mit
(+)
f (yn ) ≤ f (x).
28
Wegen an ≤ yn ≤ bn folgt
b−a
.
2n
Daraus folgt limn→∞ (yn − an ) = 0, also limn→∞ yn = m. Aus (+) und der Stetigkeit von f folgt
so f (x) ≥ limn→∞ f (yn ) = f (m), und m hat in der Tat die gewünschte Minimalitätseigenschaft.
Es verbleibt die Konstruktion der Intervalle In mit den angegebenen Eigenschaften. Sei
a0 = a und b0 = b. Wenn an und bn schon konstruiert sind so daß die Folge der Intervalle
n
Ik mit 0 ≤ k ≤ n die geforderten Eigenschaften haben, so sei cn = an +b
, In′ = [an , cn ],
2
′′
′
′′
In = [cn , bn ]. Falls für alle x ∈ In ein y ∈ In mit f (y) < f (x) existiert, so sei In+1 = In′′ .
Andernfalls gibt es ein x ∈ In′ mit f (y) ≥ f (x) für alle y ∈ In′′ . In diesem Fall setzen wir
In+1 = In′ . In jedem Fall gibt es zu jedem υ in In ein ξ ∈ In+1 mit f (ξ) ≤ f (υ). Ist nun x ∈ I,
so kann dies auf ein υ ∈ In mit f (y) ≤ f (x) angewendet werden und zeigt die Existenz eines
ξ ∈ In+1 mit f (ξ) ≤ f (x). Die anderen Eigenschaften der Intervallfolge zeigt man wie beim
Beweis des Zwischenwertsatzes.
0 ≤ y n − an ≤ b n − an =
Zunächst ohne Beweis sei hier der folgende Satz formuliert:
Satz 7. Sei I = [a, b] und f eine stetige Funktion auf I. Dann ist f gleichmäßig stetig: zu
jedem ε > 0 existiert ein δ > 0 mit |f (x) − f (y)| < ε für x, y ∈ I und |x − y| < δ.
Fakt 2. Sei M ⊆ K mit K = R oder K = C. Für m ∈ K sind folgende Bedingungen
äquivalent:
• Es gibt eine Folge von Elementen von M \ {m}, welche gegen m konvergiert.
• Für jedes ε > 0 gibt es Elemente x von M \ {m} mit |x − m| < ε.
Definition 4. In diesem Fall nennt man m einen Häufungspunkt von M .
Fakt 3. Sei m ein Häufungspunkt von M und f eine auf M mit der möglichen Ausnahme
von M definierte Funktion. Dann sind folgende Bedingungen an φ ∈ L äquivalent:
• Zu jedem ε > 0 gibt es δ > 0 mit |f (x) − φ| < ε für m ∈ M \ {m} und |x − m| < ε.
• Für jede gegen m konvergierende Folge (mk ) von Elementen von M \{m} gilt limk→∞ f (mk ) =
φ.
Die Zahl φ ist durch diese Bedingungen eindeutig bestimmt.
Definition 5. Wir schreiben φ = limx→y f (x), falls diese Bedingungen erfüllt sind. Im
Fall K = R schreiben wir φ = limx↓y f (x), falls die Bedingungen für f |M ∩ [x, ∞) erfüllt sind,
und φ = limx↑y f (x), falls sie für f |M ∩ (−∞, x] erfüllt sind.
Fakt 4. Die folgenden Bedingungen sind äquivalent:
• φ = limx↓y f (x)
• Zu jedem ε > 0 existiert ein δ > 0 mit |f (x) − φ| < ε für y < x < y + δ.
• Für jede monoton fallende gegen x konvergente Folge (xk ) von Elementen von M gilt
limk→∞ f (xk ) = φ.
Eine analoge Charakterisierung gilt für φ = limx↑y f (x).
2. GRENZWERTE
29
Fakt 5. Im Fall K = R gilt limx→y f (x) = φ genau dann, wenn φ = limx↑y f (x) und
φ = limx↓y f (x) gilt.
Aus den beiden letzten Fakten folgt sofort Lemma 1.
Sei nun wieder K = R oder K = C.
Fakt 6. Für eine Teilmenge M ⊆ K sind die folgenden Bedingungen äquivalent:
• Jeder Häufungspunkt von M gehört zu M .
• Wenn eine Folge von Elementen von M konvergiert, so gehört ihr Limes zu M .
Definition 6. Eine Teilmenge von K ist abgeschlossen, wenn sie diese äquivalenten Bedingungen erfüllt.
Definition 7. Für ε > 0 definieren wir die ε-Umgebung Kε (x) = y ∈ K |x − y| < ε}.
Eine Teilmenge U von K ist eine Umgebung von x, falls es ein ε > 0 gibt, so daß U die
ε-Umgebung Kε (x) enthält.
Fakt 7. Für eine Teilmenge M ⊆ K sind die folgenden Bedingungen äquivalent:
• Für jedes m ∈ M gibt es ein ε > 0 mit Kε (m) ⊆ M .
• Die Menge M ist Umgebung jedes ihrer Elemente.
• Das Komplement K \ M ist abgeschlossen in K
Definition 8. Eine derartige Menge nennt man offen in K.
Fakt 8.
• Die leere Menge und K selbst sind sowohl offen als auch abgeschlossen in
K.
• Endliche Vereinigungen und beliebige Durchschnitte abgeschlossener Teilmengen sind
abgeschlossen.
• Endliche Durchschnitte und beliebige Vereinigungen offener Teilmengen sind offen.
• Eine Teilmenge von R ist genau dann abgeschlossen in R, wenn sie abgeschlossen in C
ist.
Fakt 9.
• R ist nicht offen in C.
• Für reelle Zahlen a < b ist [a, b] das einzige abgeschlossene und (a, b) das einzige (in R)
offene Intervall mit Intervallgrenzen a und b.
• Für reelle Zahlen a sind (−∞, a] und [a, ∞) abgeschlossen, aber nicht offen in R. Dagegen sind (a, ∞) aund (−∞, a) offen in R, aber nicht abgeschlossen.
2.5. Supremum und Infimum von Mengen. Wir haben schon in Definition .2.2.2 Supremum und Infimum von Folgen eingeführt. In den folgenden Ausführungen sollen Supremum
und Infimum von Mengen betrachtet werden.
Definition 1. Sei M ⊆ R eine Teilmenge.
Eine reelle Zahl m ist eine obere Schranke von M , falls für alle µ ∈ M µ ≤ m (bzw. µ ≥ m)
gilt.
Eine Zahl m ist ein Supremum (bzw. Infimum) von M , falls folgende Eigenschaften gelten:
• Die Zahl m ist eine obere (bzw. untere) Schranke für M .
30
• Sei m̃ eine beliebige obere (bzw. untere) Schranke von M , dann gilt m ≤ m̃ (bzw.
m ≥ m̃).
Das Supremum (bzw. Infimum) einer Menge reeller Zahlen bezeichnet man mit sup M bzw.
inf M .
Fakt 1.
• Wenn K eine obere (bzw. untere) Schranke von M ⊂ R ist, so ist auch
jede reelle Zahl L mit L ≥ K (bzw. L ≤ K) eine obere (bzw. untere) Schranke von M .
• Seien M und X Untermengen von R. Wenn jedes Element von X eine untere Schranke
von M ist und wenn das Supremum von X existiert, so ist sup X ebenfalls eine untere
Schranke von M . Eine analoge Behauptung gilt für das Infimum jeder Menge, deren
Elemente obere Schranken von X sind.
• Eine obere (bzw. untere) Schranke für M ist auch eine obere (bzw. untere) Schranke
für jede Teilmenge von M . Insbesondere ist jede Teilmenge einer beschränkten Menge
beschränkt.
• Wenn eine Teilmenge von R von oben (bzw. unten) beschränkt ist, so gibt es auch eine
ganze Zahl, welche obere (bzw. untere) Schranke dieser Teilmenge ist.
• Der Limes einer Folge von oberen (bzw. unteren) Schranken von M ist eine obere (bzw.
untere) Schranke von M .
Beweis. Die erste Behauptung ist eine triviale Konsquenz der Definitionen. Angenommen,
alle Elemente von X sind untere Schranken von M , und s = sup X existiert. Sei m ∈ M . Weil
X aus unteren Schranken von M besteht, gilt x ≤ m für jedes x ∈ X. Also ist m eine obere
Schranke von X, und aus der Definition des Begriffes Supremum folgt m ≥ s. Also ist auch
s eine untere Schranke von M . Diese Betrachtung überträgt sich mutatis mutandis auf obere
Schranken und Infima.
Zum Beweis des vorletzten Punktes sei etwa s eine untere Schranke von M , dann ist ⌊s⌋
ganzzahlig und (wegen ⌊s⌋ ≤ s) ebenfalls eine untere Schranke von M .
Für den letzten Punkt sei s = limk→∞ sk , wobei jede Zahl sk eine obere Schranke von M
ist. Für jedes m ∈ M und alle k gilt dann m ≤ sk . Nach Folgerung .2.1.2 folgt m ≤ s. Da dies
für alle m ∈ M gilt, ist s eine obere Schranke von M .
Fakt 2.
• Jede Menge reeller Zahlen hat höchstens ein Supremum und höchstens ein
Infimum. Es macht also Sinn, von dem Supremum bzw. Infimum zu sprechen.
• Wenn m das größte (bzw. kleinste) Element der Menge M ist, so ist m auch das Supremum (bzw. Infimum) von M .
• Eine Zahl m ist genau dann eine untere Schranke bzw. das Infimum
derMenge M
, wenn
−m eine obere Schranke bzw. das Supremum der Menge −M = −µ µ ∈ M ist.
• Sei N eine Teilmenge von M , es gilt
sup(N ) ≤ sup(M )
inf(N ) ≤ inf(M ),
sofern beide Seiten dieser Ungleichungen existieren.
2. GRENZWERTE
31
Beweis. Angenommen, m und m̃ sind zwei Infima von M . Aus der Definition folgt m ≥ m̃
und (mit vertauschten Rollen) m̃ ≥ m, woraus sich m = m̃ ergibt. Die zweite und die dritte
Behauptung ist offensichtliche Konsequenzen der Definition.
Offenbar muß nicht jede von unten beschränkte Menge reeller Zahlen ein kleinstes Element
enthalten. Sei dazu etwa M die Menge aller positiven reellen Zahlen. Für jedes m ∈ M gilt
m/2 ∈ M und m/2 < m, weswegen m nicht das kleinste Element von M sein kann.
Das Infimum ist, falls es existiert, die größte reelle Zahl, welche kleiner oder gleich jedem
Element von M ist. Beispielsweise ist 0 das Infimum der Menge aller positiven reellen Zahlen.
Wenn das Infimum einer Menge M existiert zu dieser gehört, so ist es deren kleinstes Element.
Andernfalls, also wenn das Infimum von M nicht existiert oder nicht zu M gehört, enthält M
kein kleinstes Element. Daß dem so ist, folgt unmittelbar aus den Definitionen bzw. aus dem
obigen Fakt.
Wir hatten am Anfang der Vorlesung im Zusammenhang mit der Methode der vollständigen Induktion das Prinzip aufgestellt, wonach jede nichtleere Menge natürlicher Zahlen (oder
jede von unten beschränkte nichtleere Menge ganzer Zahlen) ein kleinstes Element enthält. Ein
analoger Sachverhalt für nichtleere von unten beschränkte Mengen reeller Zahlen wäre, wie wir
gesehen haben, auf jeden Fall falsch, aber eine äquivalente Umformulierung des Vollständigkeitsaxiomes ist
Satz 1. Es gelten die beiden folgenden Behauptungen:
• Jede nichtleere von unten beschränkte Teilmenge von R hat ein Infimum.
• Jede nichtleere von oben beschränkte Teilmenge von R hat ein Supremum.
Bemerkung 1. Man kann zeigen, daß die beiden Behauptungen bereits auf Grund der
übrigen Axiome äquivalent zueinander und zum Vollständigkeitsaxiom sind. Die Äquivalenz
der beiden Behauptungen ist eine Folge von Fakt 2. Es genügt also, die Existenz des Supremums
nichtleerer von oben beschränkter Teilmengen von R zu zeigen.
Für den Beweis des Satzes brauchen wir den folgenden Fakt:
Fakt 3.
• Jede von oben beschränkte, nichtleere Teilmenge von Z enhält ein größtes
Element.
• Jede von unten beschränkte, nichtleere Teilmenge von Z enhält ein kleinstes Element.
Beweis. Es genügt der Nachweis des ersten Punktes, denn der zweite geht analog dazu.
Nach
Fakt
1 gibt
es eine Zahl b ∈ Z, welche obere Schranke von M ist. Dann ist b − M =
b − m m ∈ M eine nichtleere Teilmenge von N und hat daher, wie am Beginn des Skriptes
im Zusammenhang mit dem Prinzip der vollständigen Induktion erklärt, ein kleinstes Element
d. Dann ist b − d das größte Element von M .
Sei M ⊆ R von oben beschränkt und nichtleer. Für jedes k ∈ N ist dann Sk =
Beweis.
⌈2k m⌉ m ∈ M eine nichtleere Teilmenge von Z und hat daher ein größtes Element sk . Sei
sk+1 = ⌈2k+1 xk ⌉, dann gilt ⌈2k xk ⌉ ≥ sk+1 /2, also gilt sk+1 ≤ 2sk . Die Zahlen 2−k sk bilden also
eine monoton fallende Folge.
32
Sei x ∈ X, aus den Definitionen folgt sk ≥ 2k x, also
(+)
x ≤ 2−k sk .
Folglich ist x eine untere Schranke der Folge 2−k sk , nach dem Vollständigkeitsaxiom (Fakt .2.2.1)
existiert also s = limk→∞ sk .
Da (+) für alle x ∈ X gilt, ist s eine obere Schranke von M . Sei s̃ eine andere obere Schranke
von M . Aus den Definitionen folgt sk ≤ ⌈2k s̃⌉, wegen 2k s̃ > ⌈2k s̃⌉ − 1 gilt also s̃ > 2−k sk − 2−k .
Durch Übergang zum Limes k → ∞ folgt s̃ ≥ s. Also ist s Supremum von M .
2.6. Abzählbarkeit und Überabzählbarkeit.
Definition 1. Zwei Mengen werden gleichmächtig genannt, wenn zwischen ihnen eine
bijektive Abbildung existiert. Wir schreiben #(M ) = #(N ). Wir schreiben #(M ) ≤ #(N ),
falls eine injektive Abbildung von M nach N existiert. Eine Menge ist abzählbar unendlich,
falls sie zur Menge der natürlichen Zahlen gleichmächtig ist. Sie ist überabzählbar, falls sie
unendlich und nicht abzählbar ist. Wir schreiben #(M ) < #(N ), falls #(M ) ≤ #(N ) gilt und
die beiden Mengen M und N nicht gleichmächtig sind.
Der soeben eingeführte Gleichmäßigkeitsbegriff verblüfft anfänglich durch einige unerwartete Eigenschaften. Beispielsweise kann eine unendliche Menge zu einer ihrer echten Teilmengen
gleichmächtig sein (man kann ‘unendlich’ sogar so definieren – Unendlichkeit im Sinne von
Dedekind).
Beispiel 1. Die Mengen N der natürlichen und Z der ganzen Zahlen sind gleichmächtig.
f→ Z ist gegeben durch f (n) = n/2 für gerade
Beweis. Eine bijektive Abbildung N −−
Zahlen n und f (n) = −(n + 1)/2 für ungerade Zahlen n. Die Umkehrabbildung zu f ist durch
g(m) = 2m für m ≥ 0 und g(m) = (1 − m)/2 für m < 0 gegeben.
Wir bemerken noch:
Fakt 1.
• Wenn M zu M ′ und N zu N ′ gleichmächtig ist, so ist auch M × N zu
′
′
M × N gleichmächtig.
• Aus #M ≤ #M ′ und #N ≤ #N ′ folgt #(M × N ) ≤ #(M ′ × N ′ ).
• Aus N 6= ∅ folgt #(M ) ≤ #(M × N ).
µ→ M ′ und N −−
ν→ N ′ bijektive Abbildungen sind, so ist
Beweis. In der Tat, wenn M −−
µ−×
M × N −−
−−ν→ M ′ × N ′ bijektiv, wobei (µ × ν)(m, n) = (µ(m), ν(n)) gesetzt wird. Die inverse
Abbildung zu dieser Abbildung ist µ−1 × ν −1 . Damit ist der erste Punkt bewiesen. Der zweite
Punkt kann genauso gezeigt werden, denn aus der Injektivität von µ und ν folgt die Injektivität
von µ × ν. Zum Beweis der dritten Aussage sei n ∈ N , wir haben eine injekitve Abbildung
M → M × N , m → (m, n).
Es ist nicht ganz selbstverständlich, daß zwei Mengen mit |M | ≤ |N | und |N | ≤ |M |
gleichmächtig sein müssen.
2. GRENZWERTE
33
Satz 1 (Schröder-Bernstein). Aus |M | ≤ |N | und |N | ≤ |M | folgt die Gleichmächtigkeit
von M und N .
f→ N
Beweis. Auf Grund unserer Voraussetzung existieren injektive Abbildungen M −−
g→ M , dann haben wir disjunkte Vereinigungen
und N −−
M = M∞ ∪
N = N∞ ∪
mit M∞ =
T∞
k=0 (gf )
k
M , N∞ =
S∞
k=0 (f g)
k
∞
[
k=0
∞
[
k=0
N,
Mk′ ∪
Nk′ ∪
∞
[
Mk′′
k=0
∞
[
Nk′′
k=0
Mk′ = (gf )k M − g(f g)k N = (gf )k M − (gf )k gN,
Nk′ = (f g)k N − f (gf )k M = (f g)k N − (gf )k gN,
Mk′′ = g(f g)k N − (gf )(k+1) M = (gf )k gN − (gf )(k+1) M
sowie
Nk′′ = f (gf )k M − (f g)k+1 N = (f g)k N − (gf )k gN − (f g)k+1 N.
Dann bildet f Mk′ bijektiv auf Nk′′ ab, während g Nk′ bijektiv auf Mk′′ abbildet. Außerdem
f→ N bijektiv. Es gibt also genau eine Bijektion M −−
h→ N mit h(x) = f (x) für
ist M∞ −−
S∞ ∞ ′
S∞
′′
x ∈ M∞ ∪ k=0 Mk sowie mit g(h(x)) = x für x ∈ k=0 Mk .
Man könnte versucht sein, auch die folgende Aussage beweisen zu wollen:
Fakt 2 (Version des Auswahlaxiomes). Für je zwei Mengen M , N gilt eine der beiden
Ungleichungen #M ≤ #N oder #N ≤ #M .
Es wurde aber durch Gödel in eine Richtung und durch Frenkel und Cohen in die andere
gezeigt, daß das Auswahlaxiom den übrigen Axiomen der Mengenlehre (auf die wir hier nicht
eingegangen sind) weder widerspricht (falls deren Widerspruchslosigkeit vorausgesetzt wird)
noch aus ihnen herleitbar ist.
Wir bemerken noch:
f→ N
Fakt 3 (Folgerung aus dem Auswahlaxiom). Wenn eine surjektive Abbildung M −−
existiert, so gilt #N ≤ #N .
g→ M , indem für g(n) irgendein
Beweis. Wir definieren eine injektive Abbildung N −−
m ∈ M mit n = f (m) genommen wird. Wegen der Surjektivität von f existiert ein solches m,
aber die simultane Auswahl der jeweiligen m für unendlich viele n erfordert die Anwendung
des Auswahlaxiomes. Offenbar ist g injektiv, und die Behauptung ist bewiesen.
Fakt 4. Jede Teilmenge M von N ist endlich oder abzählbar unendlich.
34
f→ N, indem wir f (k) für k ∈ M
Beweis. Wir definieren eine injektive Abbildung M −−
gleich der Zahl der Elemente l ∈ M mit l < k setzen. Man kann sich davon überzeugen, daß
f M entweder bijektiv auf ganz N abbildet oder auf ein Anfangsstück davon (in welchem Fall
M endlich ist).
Zusammen mit Fakt 3 folgt
Fakt 5. Für jede unendliche Menge M gilt #(M ) ≥ #(N), jede unendliche Menge ist also
mindestens abzählbar.
Einige unserer Sätze über unendliche Summen können bequem auf abzählbarePIndexmengen
verallgemeinert werden. Für endliche Indexmengen I ist offenbar die Summe i∈I f (i) aller
f→ C wohldefiniert. Wir betrachten derartige
Funktionswerte von f auf I für jede Funktion I −−
Summen als trivialerweise absolut konvergent.
f→ C eine Funktion. Dann sind folgende
Satz 2. Sei I eine abzählbare Indexmenge und I −−
Bedingungen äquivalent:
ι M , so daß P∞ f (ι(k)) absolut konvergiert.
• Es gibt eine Bijektion N −→
k=0
ι M konvergiert P∞ f (ι(k)) absolut.
• Für jede Bijektion N −→
k=0
P
P∞
ι M ab.
→
In diesem Fall hängt i∈I f (i) = k=0 f (ι(k)) nicht von der Wahl der Bijektion N −P
Wir nennen derartige Summen über alle Elemente von I absolut konvergent. Wenn i∈I f (i)
S
absolut konvergiert und wenn I = lk=0 Ik mit l ∈ N∪{∞} eine höchstens abzählbare Zerlegung
von I in disjunkte Teilmengen ist, so gilt der große Umordnungssatz
X
i∈I
f (i) =
l X
X
f (i),
k=0 i∈Ik
wobei sowohl die inneren Summen als auch die äußere Summe auf der rechten Seite absolut
konvergieren.
Der Beweis ist nicht schwierig, soll aber ausgelassen werden. Statt dessen bringen wir die
beiden Cantorschen Diagonalargumente:
Satz 3 (Erstes Cantorsches Diagonalprinzip). Die Menge N × N ist abzählbar unendlich.
f→ N ist durch f (m, n) = (m+n)(m+n+1)/2+n
Beweis. Eine bijektive Abbildung N×N −−
gegeben. Offenbar ist f (m, n) die Nummer des Paares (m, n) bei der Durchnumerierung von
N × N in einem quadratischen Schema, das beim Beweis von Satz 9.1 (und im Tafelbild der
Vorlesung) angegeben ist.
Folgerung 1. Die folgenden Mengen sind abzählbar: Z × Z, Q, Q × Z, Q × Q, Q × Q × Q.
Beweis. Die Behauptung über die Abzählbarkeit von Z×Z ergibt sich durch Kombination
von Fakt 1 mit Beispiel 1. Zum Beweis der Abzählbarkeit von Q bemerken wir, daß jede
rationale Zahl x auf eindeutige Weise als x = a/b mit teilerfremden ganzen Zahlen a und b > 0
2. GRENZWERTE
35
dargestellt werden kann. Sei also M ⊂ Z × Z die Menge aller Paare (a, b) mit b > 0 und
f→ Q, f (a, b) = a/b, nach dem Gesagten bijektiv. Also ist Q zu der
ggT(a, b) = 1, dann ist M −−
Untermenge M der abzählbaren Menge Z × Z gleichmächtig und daher höchstens abzählbar,
#(Q) ≤ #(N). Wegen N ⊂ Q gilt auch #(N) ≤ #(Q). Aus dem Satz von Schröder-Bernstein
ergibt sich nun die Gleichmächtigkeit von N und Q.
Alle weiteren Behauptungen können nun ähnlich bewiesen werden wie die Abzählbarkeit
von Z × Z, wobei im Falle von Q × Q × Q zuerst die Abzählbarkeit von Q × Q bewiesen und
dann die Bijektion (Q × Q) × Q ∼
= Q × Q × Q benutzt wird.
Folgerung
2. Sei M eine unendliche Menge, wenn eine höchstens abzählbare Überdeckung
Sl
M = k=0 Ml , l ∈ N ∪ {∞}, von M durch höchstens abzählbare Mengen Ml existiert, so ist M
abzählbar unendlich.
Definition 2. Definition der abgeschlossenen und offenen Intervalle.
Satz 4 (Zweites Cantorsches Diagonalprinzip). Die Menge R aller reellen Zahlen ist überabzählbar.
Beweis. Es genügt offenbar der Beweis der Überabzählbarkeit von I = [0, 1]. Angenomf→ I. Sei φ die l-te Dezimalstelle von f (k). Wir setzen
men, es gäbe eine Bijektion N −−
k,l
ζk = φk,k + 1 im Falle 0 ≤ φk,l ≤ 7 und ζk = 0 im Falle 8 ≤ φk,k ≤ 9. Man bemerkt leicht,
daß ζk eine gültige Dezimalziffer ist, welche nicht mit der k-ten Dezimalstelle
f (k)
P∞ φk,k von
−1
übereinstimmt. Sei z die reelle Zahl mit dieser Dezimaldarstellung, z =
k=1 ζk 10 . Man
bemerkt, daß nur die Ziffern 0 bis 8 in dieser Dezimaldarstellung vorkommen und daher keine Neunerperiode vorliegt. Angenommen, es gäbe eine Zahl k mit z = f (k). Dann wäre die
k-te Nachkommastelle von z gleich φk,k 6= ζk , was ein Widerspruch ist. Also war f doch nicht
surjektiv.
Bemerkung 1. Da Q abzählbar und R überabzählbar ist, ergibt sich ein neuer Beweis für
die Existenz irrationaler Zahlen: es gibt in mengentheoretischem Sinne viel mehr reelle Zahlen
als rationale Zahlen.
Definition 3. Eine Menge hat die Mächtigkeit des Kontinuums, falls sie zu R gleichmächtig
ist.
Satz 5. Jedes Intervall I = [a, b], I = (a, b), I = [a, b) oder I = (a, b] mit a < b hat die
Mächtigkeit des Kontinuums und ist zu I × I gleichmächtig.
Beweis. Sein zunächst I = [0, 1). Man erhält eine surjektive Abbildung I → I × I, indem man x ∈ I das Paar (y, z) zuordnet, wobei die Dezimalbruchentwicklung (eventuell mit
Neunerperiode) von y mit den geraden und die von z mit den ungeraden Nachkommastellen
von x gebildet wird. Also gilt #(I × I) ≤ #(I). Die umgekehrte Ungleichung folgt aus Fakt 1,
und nach dem Satz von Schröder-Bernstein sind I und I × I gleichmächtig. Wir haben eine
bijektive Abbildung Z × I → R, welche (k, x) auf k + x abbildet (siehe Satz .1.3.4). Folglich
ist R zu Z × I und damit auch zu N × I gleichmächtig. Da I ein bijektives Bild von N enthält
36
(z. B. {1/(n + 1)|n ∈ N}), folgt #(R) = #(N × I) ≤ #(I × I) = #I. Wegen I ⊂ R gilt auch
#I ≤ #R. Folglich hat I die Mächtigkeit des Kontinuums.
Jedes halboffene Intervall [a, b) ist ein bijektives Bild von I (z. B. durch die Abbildung t →
a + (b − a)t) und hat daher ebenfalls die Mächtigkeit des Kontinuums. Sei nun I˜ ein beliebiges
(offenes, abgeschlossenes oder halboffenes) Intervall mit Anfangspunkt a und Endpunt b, wobei
a < b gelte. Wegen I˜ ⊂ R hat I˜ höchstens die Mächtigkeit des Kontinuums. Andererseits enthält
I˜ das halboffene Intervall [(2a+b)/3, (a+2b)/3), das nach dem Gezeigten zu R gleichmächtig ist.
Also hat I˜ auch mindestens die Mächtigkeit des Kontinuums, und aus dem Satz von SchröderBernstein folgt #I˜ = #R.
Folgerung 3. Die Mengen R, R × R, R × N, R × R × R haben die Mächtigkeit des
Kontinuums.
3. Differential- und Integralrechnung
3.1. Die Ableitung einer Funktion.
Definition 1. Eine R- oder C-wertige Funktion, die auf einer Umgebung von x ∈ R (bzw.
von x ∈ C) definiert ist, ist an der Stelle x differenzierbar (bzw. komplex differenzierbar), falls
f (x + h) − f (x)
h→0
h
f ′ (x) = lim
existiert, wobei im Fall komplexer Differenzierbarkeit alle genügend kleinen komplexen Zahlen
h 6= 0 zugelassen sind, während sonst nur relle h betrachtet werden. Wir nennen f ′ (x) die
df
Ableitung von f an der Stelle x, man schreibt auch f ′ = dx
. Eine Funktion auf einer offenen
Untermenge von R ist differenzierbar, falls sie an jedem Punkt dieser Menge differenzierbar
ist, und stetig differenzierbar, wenn zudem die Ableitung stetig ist. Eine Funktion auf einer
offenen Untermenge von C ist holomorph, falls sie an jedem Punkt dieser Menge komplex
differenzierbar ist.
Wenn f (x1 , . . . , xn ) eine Funktion mehrerer Veränderlicher ist, so daß für 1 ≤ j ≤ n mit
festem xj für j 6= i die Funktion g(z) = f (x1 , . . . , xj−1 , z, xj+1 , . . . , xn ) als Funktion von z an
der Stelle z = xj im soben beschriebenen Sinne differenzierbar ist, so schreiben wir
(1)
∂f
(x1 , . . . , xn ) = g ′ (xj )
∂xj
und nennen (1) die partielle Ableitung von f nach xj an der Stelle (x1 , . . . , xn ).
Bemerkung 1. Man kann zeigen, daß holomorphe Funktionen stetig sind und daß die
Ableitung einer holomorphen Funktion wieder holomorph ist. Daher gibt es kein sinnvolles
komplexes Gegenstück zur stetigen Differenzierbarkeit: Die Holomorphiebedingung kann nicht
auf diese Weise weiter verschärft werden.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
37
Bemerkung 2. Für auf Untermengen von R definierte Funktionen kann man auch die
einseitigen Ableitungen betrachten:
f (x + h) − f (x)
h↓0
h
f (x + h) − f (x)
f−′ (x) = lim
,
h↑0
h
f+′ (x) = lim
wobei für die Definition der rechtsseitigen Ableitung f+′ (x) nur vorausgesetzt werden muß, daß
eine Zahl ε > 0 existiert, so daß [x, +ε) im Definitionsbereich von f enthalten ist.
Fakt 1. Wenn f links- und rechtsseitig in x differenzierbar ist und beide einseitigen Ableitungen übereinstimmen, so ist f in x differenzierbar, und f ′ (x) stimmt mit dem Wert der
links- bzw. rechtsseitigen Ableitung überein.
Beispiel 1. Die folgenden Funktionen sind auf ganz R differenzierbar:
• Die konstante Funktion f (t) = a, ihre Ableitung verschwindet.
• Die identische Funktion f (x) = x, ihre Ableitung ist die konstante Funktion 1.
• Die Exponentialfunktion f (x) = exp(x), ihre Ableitung ist f ′ (x) = exp(x).
Die Funktion f (x) = |x| ist nur außerhalb 0 differenzierbar, dort gilt f ′ (t) = 1 für t > 0 und
f ′ (t) = −1 für t < 0. An der Stelle 0 gilt f+′ (0) = 1, f−′ (0) = −1.
Beweis. Für die beiden ersten Beispiele findet man
f (x + h) − f (x)
a−a
= lim
= lim 0 = 0
h→0
h→0
h→0
h
h
f ′ (t) = lim
bzw.
f (x + h) − f (x)
(x + h) − x
= lim
= lim 1 = 1.
h→0
h→0
h→0
h
h
Durch ähnlich einfache Rechnungen zeigt man auch unsere Behauptungen über f (x) = |x|.
Im Fall der Exponentialfunktion ergibt sich durch Anwendung von (.2.3.3) und (.2.3.3)
sowie der Rechenregeln für Grenzwerte:
f ′ (t) = lim
exp(h) − 1
exp(x + h) − exp(x)
f (x + h) − f (x)
= lim
= lim exp(x)
= exp(x).
h→0
h→0
h→0
h
h
h
f ′ (x) = lim
Das Beispiel überträgt sich wortwörtlich auf den komplexen Fall:
Beispiel 2. Die folgenden Funktionen sind auf ganz C holomorph:
• Die konstante Funktion f (t) = a, ihre Ableitung verschwindet.
• Die identische Funktion f (x) = x, ihre Ableitung ist die konstante Funktion 1.
• Die Exponentialfunktion f (x) = exp(x), ihre Ableitung ist f ′ (x) = exp(x).
Dagegen ist die Funktion f (z) = z nirgendwo komplex differenzierbar.
38
Beweis. Der vorige Beweis überträgt sich mit Ausnahme des letzten Punktes wortwörtlich,
beispielsweise ergibt sich im Fall der Exponentialfunktion durch Anwendung von (.2.3.3) und
(.2.3.3) sowie der Rechenregeln für Grenzwerte:
exp(h) − 1
exp(x + h) − exp(x)
f (x + h) − f (x)
= lim
= lim exp(x)
= exp(x),
h→0
h→0
h→0
h
h
h
wobei der einzige Unterschied zu vorhin darin besteht, daß nun auch komplexe h 6= 0 zugelassen
sind, was auch in (.2.3.3) gestattet ist.
Für den letzten Punkt betrachtet man
z+h−z
h
(+)
= ,
h
h
und für reelle h 6= 0 hat dieser Quotient den Wert 1, während er für h auf der imaginären
Achse den Wert −1 hat. Es gibt also bliebig kleine h 6= 0, für die (+) den Wert 1 hat, und
auch beliebig kleine h 6= 0, für die (+) den Wert −1 hat. Die Funktion f (z) = z ist daher nicht
komplex differenzierbar.
f ′ (x) = lim
Die folgende Aussage gilt sowohl für reelle (K = R als auch komplex (K = C) Ableitungen
einer Funktion, die in einer Umgebung von x ∈ K definiert ist:
Fakt 2. Die Funktion f ist genau dann differenzierbar an der Stelle x mit Ableitung φ,
wenn zu jedem ε > 0 ein δ > 0 mit
|f (x + h) − f (x) − φ · h| < ε |h|
für alle h ∈ K mit |h| < ε. Im Fall einseitiger reeller Ableitungen gilt eine analoge Charakterisierung, wobei die Bedingung |h| < δ durch 0 < h < δ für rechtsseitige bzw. −δ < h < 0 für
linksseitige Ableitungen zu ersetzen ist.
Satz 1. Jede in x differenzierbare Funktion ist stetig in x, und es existieren sogar positive
relle Zahlen L und ε mit
|f (t) − f (x)| ≤ L |t − x|
für |t − x| < ε. Im Fall von Funktionen auf Untermengen von R genügt es, die Existenz der
beiden einseitigen Ableitungen vorauszusetzen.
Wir benötigen folgende Rechenregeln für Ableitungen, wobei reellwertige oder komplexwertige Funktionen auf offenen Untermengen von R zugelassen sind. Wenn man sich an den
Randpunkten auf einseitige Ableitungen beschränkt, kann man auch abgeschlossene oder halboffene Intervalle zulassen.
Satz 2. Wenn f und g rell- oder komplexwertige Funktionen auf einer Umgebung von x ∈ R
sind, die beide in x differenzierbar sind, so sind auch f ± g und f g im Punkte x differenzierbar,
und es gilt
(2)
(3)
(f ± g)′ (x) = f ′ (x) ± g ′ (x)
(f g)′ (x) = f (x)g ′ (x) + f ′ (x)g(x).
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
39
Falls überdies g(x) 6= 0 sein sollte, so ist auch f /g an der Stelle x differenzierbar, und es gilt
f ′ (x)g(x) − f (x)g ′ (x)
.
(f /g) (x) =
g(x)2
′
(4)
Dieselben Regeln gelten für die links- bzw. rechtsseitigen Ableitungen, falls f und g in einer
Umgebung von x in (−∞, x] bzw. [x, ∞) definiert und an der Stelle x einseitig differenzierbar
sind. Falls f und g in einer Umgebung von x ∈ C definiert sind, gelten analoge Regeln auch
für die komplexen Ableitungen.
Beweis. Der Beweis ergibt sich unmittelbar aus den Rechenregeln für Grenzwerte sowie
aus der Stetigkeit von f und g an der Stelle x, z. B.
f (x + h)g(x + h) − f (x)g(x)
h→0
h
f (x + h)g(x + h) − f (x)g(x + h) + f (x)g(x + h) − f (x)g(x)
= lim
h→0
h
f (x + h) − f (x)
g(x + h) − g(x)
= lim g(x + h)
+ lim f (x)
h→0
h→0
h
h
g(x + h) − g(x)
f (x + h) − f (x)
+ f (x) lim
= g(x)f ′ (x) + f (x)g ′ (x)
= g(x) lim
h→0
h→0
h
h
(f g)′ (x) = lim
oder, im Fall von f /g und nach Übergang zum gemeinsamen Nenner g(x)g(x + h) im Differenzenquotienten:
f (x + h)g(x) − f (x)g(x + h)
h→0
g(x)g(x + h)h
1
f (x + h)g(x) − f (x)g(x) + f (x)g(x) − f (x)g(x + h)
=
lim
g(x)2 h→0
h
g(x + h) − g(x) f (x + h) − f (x)
1
lim g(x)
− f (x)
=
g(x)2 h→0
h
h
1
′
′
g(x)f
(x)
−
f
(x)g
(x)
.
=
g(x)2
(f /g)′ (x) = lim
In beiden Fällen wurde der vorherige Satz angewendet.
Beispiel 3.
• Durch Induktion nach n mittels (3) zeigt man f ′ (x) = nxn−1 für f (x) =
xn . Durch Anwendung von (4) ergibt sich, daß dies im Fall x 6= 0 auch für negative ganze
Zahlen n richtig bleibt. In beiden Fällen ist die Aussage auch im Sinne der komplexen
Differentialrechnung richtig.
• Die Ableitung der Funktion x3 + x2 + x + 1 ist 3x2 + 2x + 1.
Satz 3. Sei f eine rellwertige (bzw. C-wertige) Funktion, die auf einer Umgebung von
x ∈ R definiert ist, und sei g auf einer Umgebung von f (x) in R (bzw. von f (x) in C) definiert
40
und an der Stelle f (x) differenzierbar (bzw. komplex differenzierbar). Dann ist h(t) = g(f (t))
auf einer Umgebung von x wohldefiniert und an der Stelle x differenzierbar, und es gilt
(5)
h′ (x) = g ′ (f (x))f ′ (x).
Wenn nur die links- bezw. rechtsseitige Ableitung von h betrachtet werden soll, genügt es, die
Existenz der entsprechenden einseitigen Ableitung von f vorauszusetzen.
Für die Ableitung der Umkehrfunktion kann folgender Satz bewiesen werden:
Satz 4.
• Die Funktion f sei auf [a, b] definiert, streng monoton wachsend und stetig.
Dann bildet f das Intervall [a, b] bijektiv auf [f (a), f (b)] ab, und die Umkehrfunktion
g = f −1 ist stetig. Wenn f an der Stelle x ∈ (a, b) differenzierbar ist und f ′ (x) 6= 0 gilt,
so ist g an der Stelle f ′ (x) differenzierbar, und g ′ (f (x)) = 1/f ′ (x).
• Die holomorphe Funktion f bilde die offene Teilmenge U ⊆ C bijektiv auf die offene
g→ U holomorph, es gilt f ′ (z) 6=
Teilmenge V ⊆ C ab. Dann ist die
Umkehrfunktion
V −−
0 für alle z ∈ U , und g ′ (x) = 1 f ′ g(x) für alle x ∈ V .
√
Beispiel 4.
• Die Funktion f (x) = x ist auf der Menge der positiven rellen Zahlen
differenzierbar, und f ′ (x) = 2√1 x .
• Die Exponentialfunktion bildet R bijektiv auf die Menge aller positiven rellen Zahlen
ab. Die Umkehrfunktion f (x) = log(x) ist auf der Menge der positiven rellen Zahlen
differenzierbar, und f ′ (x) = 1/x.
• Es gilt
∂ax
(6)
= x · ax−1
∂a
∂ax
= log(a)ax
∂x
für reelle a > 0 und komplexe x, wobei die partielle Ableitung nach x auch als komplexe
Ableitung existiert.
Beweis. Die Voraussetzungen des Satzes sind im ersten Beispiel leicht direkt nachzuweisen
und folgen im zweiten Beispiel aus den Eigenschaften der Exponentialfunktion. Die benötigte
Monotonie der Exponentialfunktion ergibt sich für t ≥ 0 durch direkte Betrachtung der Exponentialreihe, für t < 0 daraus und aus exp(t) exp(−t) = 1, und auf ganz R durch Kombination
dieser beiden Monotonieaussagen. Durch ähnliche Argumente zeigt man die Positivität von
exp(t) für relle t sowie die Tatsache, daß exp(t) für t → ∞ bestimmt gegen ∞ divergiert und
für t → −∞ gegen 0 konvergiert. Die Behauptung folgt nun direkt durch Anwendung des
Satzes.
Die letzte Behauptung folgt aus der zweiten durch Anwendung der Kettenregel:
exp x log(a)
∂ax
=
∂a
∂a
d log(a)
exp x log(a)
=x
da
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
=
41
x x
a = xax−1
a
sowie
exp x log(a)
∂ax
=
∂x
∂x
= log(a) exp x log(a) = log(a)ax .
Die beiden zuletzt genannten Sätze finden sich als Satz 15.3 und 15.4 bei Forster, wenigstens
im Fall reller Funktionen. Der Beweis überträgt sich unmittelbar auf den komplexen Fall.
Manchmal brauchen wir eine Rechenregel für die Ableitung einer aus zwei Stücken zusammengesetzten Funktion.
Satz 5. Seien a < b < c reelle Zahlen. Die Funktionen f und g seien auf [a, b] bzw. [b, c]
definiert. Durch
(
f (x) a ≤ x ≤ b
h(x) =
g(x) b < x ≤ c
ist eine Funktion auf [a, c] definiert. Wenn f (b) = g(c) gilt, und f und g stetig sind, so ist
′
diese stetig. Wenn überdies f−′ (b) und g+
(b) existieren und übereinstimmen, so existiert h′ (b)
′
und stimmt mit f−′ (b) = g+
(b) überein. Wenn insbesondere f und g differenzierbar auf [a, b]
bzw. [b, c] sind und ihre Funktionswerte und Ableitungen an der Stelle b übereinstimmen, so ist
h differenzierbar auf [a, c], und h′ stimmt auf [a, b] mit f ′ und auf [b, c] mit g ′ überein.
Im Zusammenhang mit partiellen Ableitungen weisen wir noch auf die folgenden Rechenregeln hin, die wir zunächst ohne Beweis formulieren. Wir bemerken dabei, daß Stetigkeit von
Funktionen auf Teilmengen des Rn als Folgenstetigkeit definiert werden kann, wobei Folgenkonvergenz für Folgen von Punkten des Rn koordinatenweise definiert werden kann.
Satz 6.
• Die Funktion F sei auf einer offenen Teilmenge U ⊆ Rn nach allen n
∂F
stetig auf ganz U seien.
Koordinaten partiell differenzierbar, wobei die Ableitungen ∂x
i
Wenn I ⊆ R ein Intervall und ~a = (a1 , . . . , an ) ein n-Tupel von auf I differenzierbaren
Funktionen mit ~a(I) ⊆ U ist, so ist die Funktion
g(t) = F (~a(t)) = F a1 (t), . . . , an (t)
auf I differnzierbar, und es gilt die Kettenregel
′
(7)
g (t) =
n
X
i=1
daselbst.
a′i (t)
∂F
~a(t)
∂xi
42
f→ C eine stetige Funktion ist, für die die partiellen
• Wenn U ⊆ R2 offen und U −−
∂ ∂f
Ableitungen ∂f
, ∂f und ∂y
auf U existieren und stetig sind, so gilt auf ganz U
∂x ∂y
∂x
∂ ∂f
∂ ∂f
=
,
∂x ∂y
∂y ∂x
wobei auch die linke Seite der Gleichung auf ganz U existiert.
(8)
Ohne Stetigkeitsforderungen der angegebenen Art, die man freilich teilweise schwächer
formulieren könnte, sind beide Aussagen falsch. Die zweite Aussage hat die Vertauschbarkeit
partieller Ableitungen unter bestimmten technischen Voraussetzungen zum Inhalt, die in den
meisten Anwendungen erfüllt sind.
Die erste Aussage ist eine Art Verallgemeinerung der Kettenregel auf den Fall einer äußeren
Funktion, die von mehr als einer Variablen abhängt. Als Beispiel betrachten wir ~a(t) = xo + t~v
mit ~v ∈ Rn . In diesem Fall ergibt sich als Formel für die Richtungsableitung
n
X
dF ~a(t)
∂F
∂F
F (xo + h~v )
(9)
(xo ) = lim
=
|t=0 =
(xo ),
vi
h→0
∂v
h
dt
∂x
i
i=1
unter denselben Voraussetzungen an F wie im ersten Punkt von Satz 6.
3.2. Riemannsche Summen und Henstock-Kurzweil-Integration.
Definition 1. Sei I = [a, b] mit rellen Zahlen a ≤ b. Eine Riemannsche Zerlegung mit
Zwischenstellen für I ist eine Folge
˙ n−1 ≤ ξn ≤ an = a.
(1)
a = a0 ≤ ξ1 ≤ a1 ≤ ≤a
Die Riemannsche Summe einer auf [a, b] definierten Funktion f für eine Zerlegung mit Zwischenwertstellen definieren wir als
n
X
σ(Z, Ξ, f ) =
(ai − ai−1 )f (ξi ).
i=1
Fakt 1. Es gilt
(2)
σ(Z, Ξ, f + g) = σ(Z, Ξ, f ) + σ(Z, Ξ, g)
σ(Z, Ξ, λf ) = λσ(Z, Ξ, f )
sowie
(3)
|σ(Z, Ξ, f )| ≤ σ(Z, Ξ, |f |)
Wenn f und g reellwertig sind und f (x) ≤ g(x) auf I gilt, so gilt
(4)
σ(Z, Ξ, f ) ≤ σ(Z, Ξ, g).
Das Riemannsche Integral einer Funktion ist, wenn es existiert, der Grenzwert dieser Riemannschen Summen, wobei das Maximum der Schrittweiten ai − ai−1 gegen 0 strebt. Das
Henstock-Kurzweil-Integral erhält man durch Einführung einer flexiblen Schrittweitenbedingung.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
43
δ→ (0, ∞). Ein Paar
Definition 2.
• Eine Integraleichung auf I ist eine Funktion I −−
(Z, Ξ) wie in Definition 1 ist δ-fein, wenn ai − ai−1 < δ(ξi ) für 1 ≤ i ≤ n gilt.
• Wir sagen, daß eine Zahl ι das Henstock-Kurzweil-Integral der Funktion f auf I ist,
und schreiben
Z b
f (t) dt,
ι=
a
wenn zu jedem ε > 0 eine Eichung δ existiert, so daß
(5)
|ι − σ(Z, Ξ, f )| < ε
für jede δ-feine Zerlegung (Z, Ξ) gilt. Wir nennen f Henstock-Kurzweil-integrierbar oder
HK-integrierbar, wenn eine solche Zahl ι (die sich als eindeutig herausstellen wird) existiert. Wir sagen, daß f im Sinne von Riemann integrierbar ist, wenn dieselbe Bedingung
bereits mit konstanten Funktionen δ als Eichung erfüllbar ist.
• Falls f R-wertig ist sagen wir, daß das HK-Integral von f bestimmt gegen ∞ divergiert,
falls zu jedem A ∈ R eine Integraleichung δ existiert mit
σ(Z, Ξ, f ) > A
Rb
für jedes δ-feine (Z, Ξ). Wir sagen, daß es bestimmt gegen −∞ divergiert, wenn a −f (t) dt
bestimmt gegen ∞ divergiert.
Rb
Bemerkung 1. Die Idee hinter dieser Definition ist, daß a f (t) dt den Flächeninhalt der
Fläche unter dem Graphen von f bestimmt. Dies kann wie folgt motiviert werden. Zu jeder
Zerlegung Z, die durch (1) gegeben sei, und jedem Zwischenwertsystem Ξ kann man eine soganannte Treppenfunktion fZ,Ξ durch fZ,Ξ (t) = f (ξi ) für ai−1 ≤ t < ai definieren, wobei auch
t = b = am im Falle i = m zugelassen wird. Offenbar ist σ(Z, Ξ, f ) der Inhalt der Fläche unter
dem Graphen dieser Funktion, wobei der Inhalt vorzeichenbehaftet bestimmt wird, also negative Funktionswerte negative Flächeninhalte liefern. Für genügend feine Zerlegungen sollten
diese Flächeninhalte immer bessere Approximationen an den Inhalt der Fläche unter dem Graphen von f darstellen, jedenfalls für gutartige“ Funktionen f . Dies motiviert
R b die Definition
”
des (vorzeichenbehafteten) Inhalts der Fläche unter dem Graphen von f als a f (t) dt.
Definition 3. Seien a < c < b reelle Zahlen, I = [a, b], I ′ = [a, c] und I ′′ = [c, b]. Seien
(Z′ , Ξ′ ) : a = a′0 ≤ ξ1′ ≤ a′1 ≤ . . . ≤ ξn′ ′ ≤ a′n′ = c
(Z′′ , Ξ′′ ) : c = a′′0 ≤ ξ1′′ ≤ a′′1 ≤ . . . ≤ ξn′′′′ ≤ a′′n′′ = b
zwei Riemannsche Zerlegungen von I ′ und I ′′ . Wir definieren (Z′ , Ξ′ ) ◦ (Z′′ , Ξ′′ ) durch die Folgen
′
′′
n′ +n′′
(ai )i=0
und (ξi )ni=1+n mit

′

0 ≤ i < n′
a i
ai = a′n′ = a′′0 i = n′

a′′
n′ < i ≤ n′ + n′′
i−n′
44
(
ξi′
ξi =
′′
ξi−n
′
1 ≤ i ≤ n′
n′ < i ≤ n′ + n′′ .
Bemerkung 2.
• Mit anderen Worten handelt es sich bei (Z′ , Ξ′ ) ◦ (Z′′ , Ξ′′ ) darum,
(Z′′ , Ξ′′ ) von rechts an (Z′ , Ξ′ ) anzuhängen“.
”
• Wenn δ eine Integraleichung auf I und I ′ ⊆ I ein abgeschlossenes Teilintervall ist, so
ist δ |I ′ eine Integraleichung auf I ′ . Wir nennen eine Zerlegung von I ′ δ-fein, wenn sie
δ |I ′ -fein ist.
Fakt 2.
• In der Situation von Definition 3 ist (Z′ , Ξ′ ) ◦ (Z′′ , Ξ′′ ) genau dann δ-fein,
wenn (Z′ , Ξ′ ) und (Z′′ , Ξ′′ ) beide δ-fein sind.
• In der Situation von Definition 3 gilt
(6)
σ (Z′ , Ξ′ ) ◦ (Z, Ξ), f ) = σ(Z′ , Ξ′ , f ) + σ(Z′′ , Ξ′′ , f )
für jede Funktion f auf I.
• Wenn δ eine Integraleichung auf I ist, so existiert eine δ-feine Zerlegung (Z, Ξ) von I.
• Wenn δ 1 , . . . , δ n endlich viele Integraleichungen für I sind, so ist auch δ = min(δ 1 , . . . , δ n ),
definiert als
δ(x) = min δ 1 (x), . . . , δ n (x) ,
eine Integraleichung für I. Wenn (Z, Ξ) δ-fein ist, so ist (Z, Ξ) auch δ i -fein, für 1 ≤ i ≤ n.
• Das Henstock-Kurzweil-Integral einer Funktion ist, falls es existieren sollte, eindeutig
bestimmt.
Beweis. Der erste, zweite und vierte Punkt sind ziemlich einfach. Für den dritten Punkt
verwenden wir ein Halbierungsargument ähnlich dem Beweis von Satz .2.4.3 oder Satz .2.4.6.
Dazu nehmen wir an, daß keine δ-feine Zerlegung von I existiert und konstruieren induktiv
eine Folge von Intervallen In = [an , bn ] mit folgenden Eigenschaften:
• a = a0 ⊆ a1 ⊆ a2 . . . ⊆ b2 ⊆ b1 ⊆ b0 = b.
• bn − an = 2−n (b − a).
• Es gibt keine δ-feine Zerlegung von In .
Ähnlich wie beim Beweis der zitierten Sätze findet man, daß die Limites limn→∞ an und
limn→∞ bn existieren und übereinstimmen. Wir bezeichnen beide Limites mit ξ. Für genügend
große n gilt dann an > ξ − δ(ξ)/2 und bn < ξ + δ(ξ)/2. Dann aber ist an ≤ ξ ≤ bn eine δ-feine
Zerlegung von In , im Widerspruch zum dritten Punkt.
Zur Konstruktion der Intervallfolge geht man induktiv vor. Sind die Ik mit k ≤ n schon
konstruiert, so daß alle drei Punkte für die bereits konstruierten Intervalle gültig sind, so setzt
n
, In′ = [an , cn ] und In′′ = [cn , bn ]. Nach der ersten Aussage des Faktes muß es für
man cn = an +b
2
mindestens eines dieser Intervalle keine δ-feine Zerlegung geben, denn sonst erhielte man durch
Aneinanderhängung dieser Zerlegungen eine δ-feine Zerlegung für I. Man setzt also In+1 = In′ ,
falls für In′ keine δ-feine Zerlegung existiert. Andernfalls setzt man In+1 = In′′ . Man macht sich
leicht klar, daß alle drei Bedingungen an die Intervalle auch für I0 , . . . , In+1 gelten.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
45
Rb
Die dritte Aussage ist damit bewiesen. Zum Beweis der letzten nimmt man an, daß a f (t) dt
sowohl gegen ι1 als auch gegen ι2 konvergiert und ι1 6= ι2 gilt. Dann ist ε = |ι1 − ι2 | /2 positiv,
und es gibt Eichungen δ i mit
|ιi − σ(Z, Ξ, f )| < ε
(+)
für alle δ i -feinen Zerlegungen. Sei δ = min(δ 1 , δ 2 ), nach dem dritten Punkt gibt es eine δ-feine
Zerlegung. Diese ist auch δ i -fein für i ∈ {1; 2} und erfüllt daher (+) für i = 1 und i = 2. Man
erhält den Widerspruch
2ε = |ι1 − ι2 | ≤ |ι1 − σ(Z, Ξ, f )| + |ι2 − σ(Z, Ξ, f )| < ε + ε = 2ε.
Rb
Ähnlich führt man die Annahmen ad absurdum, daß a f (t) dt sowohl gegen ι konvergiert als
auch bestimmt diviergiert, oder in beide Richtungen bestimmt divergiert.
Man überzeugt sich leicht von der folgenden Tatsache:
Fakt 3. Eine komplexwertige Funktion ist genau dann HK-integrierbar, wenn ihr Realund Imaginärteil HK-integrierbar sind.
Satz 1.
• Die Summe zweier HK-integrierbarer Funktionen sowie das Produkt einer
HK-integrierbaren Funktion mit einer komplexen Zahl λ sind HK-integrierbar, und es
gilt
Z b
Z b
Z b
(7)
g(t) dt
f (t) dt +
(f + g)(t) dt =
a
a
a
Z b
Z b
(8)
(λf )(t) dt = λ
f (t) dt
a
a
• Wenn für zwei reellwertige HK-integrierbare Funktionen f und g auf [a, b] und alle t
aus diesem Intervall f (t) ≤ g(t) gilt, so gilt
Z b
Z b
g(t) dt.
f (t) dt ≤
(9)
a
a
• Für jede komplexwertige HK-integrierbare Funktion f gilt
Z b
Z b
≤
(10)
|f (t)| dt,
f
(t)
dt
a
(11)
a
falls das Integral auf der rechten Seite existiert. Allgemeiner gilt
Z b
Z b
≤
f
(t)
dt
Φ(t) dt,
a
a
falls die Integrale existieren und |f (t)| ≤ Φ(t) auf I gilt.
46
• Es sei f auf I = [a, b] HK-integrierbar, τ eine relle Zahl, ã = a + τ , b̃ = b + τ und
f˜(x) = f (x − τ ). Dann ist f˜ HK-integrierbar, und es gilt
Z b
Z b̃
˜
f (t) dt.
f (t) dt =
a
ã
Beweis von Satz 1. Zum Beweis von (7) wählt man für ε > 0 Eichungen δ̂ und δ̃ mit
Z b
ε
<
σ(Z, Ξ, f ) −
f
(t)
dt
(+)
2
a
für δ̂-feine und
Z b
ε
σ(Z, Ξ, g) −
g(t) dt <
(@)
2
a
Rb
Rb
für δ̃-feine Zerlegungen. Sei ι = a f (t) dt + a g(t) dt, dann gilt, auf Grund von (+), (@) und
(2),
|σ(Z, Ξ, f + g) − ι| < ε
für δ = min(δ̂, δ̃)-feine Zerlegungen. Da ein solches δ für alle ε > 0 gefunden werden kann,
Rb
konvergiert a f (t) + g(t) dt gegen ι, wie behauptet. Mit ähnlichen Argumenten kann auch (8)
gezeigt werden.
Rb
Rb
Zum Beweis von (9) soll die gegenteilige Annahme a f (t) dt > a g(t) dt ad absurdum
Rb
Rb
geführt werden. In diesem Fall ist ε = a f (t) dt − a g(t) dt positiv, man kann δ̂ und δ̃ mit
(+) und (@) wählen, und für eine min(δ̂, δ̃)-feine Zerlegung hat man unter Benutzung von (4)
den Widerspruch
Z b
Z b
Z b
ε
ε
f (t) dt < σ(Z, Ξ, f ) + ≤ σ(Z, Ξ, g) + <
f (t) dt.
g(t) dt + ε =
2
2
a
a
a
Ähnliche Argumente unter Benutzung von (3) zeigen (10) und (11).
Der letzte Punkt bringt die Verschiebungsinvarianz des HK-Integrales zum Ausdruck und
ergibt sich letztlich daraus, daß alle bei der Einführung dieses Integralbegriffes verwendeten
Begriffe und Konstruktionen verschiebungsinvariant sind.
Ein einfaches Beispiel für HK-integrierbare (und auch R-integrierbare) betrachten wir die
konstante Funktion:
Rb
Beispiel 1. Wenn f die konstante Funktion f (x) = φ ist, so gilt a f (t) dt = φ(b − a). In
der Tat gilt
(12)
σ(Z, Ξ, f ) = φ(b − a)
für jede Zerlegung (Z, Ξ) von I = [a, b].
Für andere Funktionen ist es nicht so leicht, die allgemeinen Riemannschen Summen direkt
auszurechnen. Deswegen ist der folgende Satz überaus hilfreich:
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
47
Theorem 1 (2. Hauptsatz der Integral- und Differentialrechnung). Die Funktion f sei
differenzierbar auf I = [a, b], dann gilt
Z b
(13)
f (b) − f (a) =
f ′ (t) dt
a
Bei Zugrundelegung des Riemannschen Integralbegriffes müßte zusätzlich die Existenz der
rechten Seite von (13) als R-Integral geforder werden, was sich nicht allein aus den Voraussetzungen des Theoremes ergibt.
Rb
Beweis. Sei ι = f (b)−f (a), wir zeigen, daß das HK-Integral a f ′ (t) dt gegen ι konvergiert.
Sei dazu ε > 0 vorgegeben. Nach Fakt .3.1.2 gibt es für jedes x ∈ I ein δ(x) > 0 mit
ε
(+)
|f (x) − f (y) − f ′ (x)(x − y)| ≤
· |x − y|
b−a
für y ∈ I und |x − y| ≤ δ(x). Die Zerlegung (Z, Ξ) sei durch a = a0 ≤ ξ0 ≤ a1 ≤ . . . ≤ an−1 ≤
ξn ≤ an = b gegeben und δ-fein, dann ergibt sich
ε
(ai − ai−1 )
(@)
|f (ai ) − f (ai−1 ) − f ′ (ξ)(ai − ai−1 )| ≤
b−a
durch Anwendung von (+) auf x = ξi , y = ai−1 sowie auf x = ξi , y = ai und Addition der
beiden entstehenden Ungleichungen. Summation von (@) über 1 ≤ i ≤ n ergibt
n
n
X ε X
ε
′
f (ai ) − f (ai−1 ) − f (ξ)(ai − ai−1 ) ≤
(b − a) = ε.
(ai − ai−1 ) =
b−a
b−a
i=1
i=1
Auf Grund von
n
X
f (ai ) − f (ai−1 ) = f (b) − f (a) = ι
i=1
n
X
i=1
f ′ (ξ)(ai − ai−1 ) = σ(Z, Ξ, f ′ )
erhält die vorige Ungleichung die Form |ι − σ(Z, Ξ, f ′ )| ≤ ε, was für alle δ-feinen Zerlegungen
gilt. Ein solches δ kann also für alle ε > 0 gefunden werden, so daß das HK-Integral auf der
rechten Seite von (13) in der Tat wie behauptet gegen ι konvergiert.
Damit können schon ziemlich viele Funktionen integriert werden, einfach auf Grund unserer
Kenntnis der Ableitung bestimmter Funktionen.
Definition 4. Die Funktion F ist Stammfunktion von f auf dem Intervall I ⊆ R, wenn F
daselbst differenzierbar mit Ableitung f ist.
Aus dem zweiten Hauptsatz der Integral- und Differentialrechnung folgt unter dieser Voraussetzung
Z d
f (t) dt = F (d) − F (c),
(14)
c
48
falls c, d ∈ I und c < d Rgilt.
Man schreibt auch f (t) dt, und nennt diesen Ausdruck ein unbestimtes Integral, um eine
Stammfunktion von f zu bezeichnen. Das Attribut unbstimmt“ ist dadurch motiviert, daß
”
Stammfunktionen offenbar nicht eindeutig sind. Mit F ist für jede Konstante C auch F + C
eine Stammfunktion von f . Umgekehrt folgt aus (14), daß jede Funktion auf einem Intervall I
mit daselbst verschwindender Ableitung (also jede Stammfunktion von 0) konstant auf I sein
muß. Es ergibt sich also
Fakt 4. Wenn F eine Stammfunktion von f auf I ist, so hat jede andere Stammfunktion
von f auf I die Form F + C, wobei C konstant ist.
Beispiel 2.
R,
(15)
• Für natürliche Zahlen n ist
Z
tn dt =
tn+1
n+1
eine Stammfunktion von tn auf ganz
tn+1
+C
n+1
n+1
• Für ganze Zahlen n 6= −1 ist tn+1 eine Stammfunktion von tn auf jedem in R \ {0}
enthaltenen Intervall. In diesem Sinne gilt (15) auch für negative n 6= −1.
• Die Funktion log |t| ist Stammfunktion von 1t auf jedem in R \ {0} enthaltenen Intervall:
Z
dt
(16)
= log |t| + C
t
a+1
• Für jede komplexe Zahl a 6= −1 ist ta+1 Stammfunktion von ta auf (0, ∞). In diesem
Sinne gilt also (15) auch für komplexe Exponenten n 6= −1.
• Die Exponentialfunktion ist Stammfunktion der Exponentialfunktion auf ganz R:
Z
(17)
exp(t) dt = exp(t) + C
Aus Theorem 1 ergibt sich ziemlich leicht:
Folgerung 1. Die Funktion f sei auf I = [a, b] differenzierbar.
• f ist genau dann monoton wachsend auf I, wenn f ′ (t) ≥ 0 auf I gilt. Falls die Ableitung
von f sogar positiv auf I ist, so ist f streng monoton wachsend. Generell ist f genau
dann streng monoton wachsend, wenn die Ableitung von f auf I nichtnegativ ist und
auf keinem Teilintervall von I, welches positive Länge hat, identisch verschwindet.
• f ist genau dann monoton fallend auf I, wenn f ′ (t) ≥ 0 auf I gilt. Falls die Ableitung
von f sogar negativ auf I ist, so ist f streng monoton wachsend. Generell ist f genau
dann streng monoton fallend, wenn die Ableitung von f auf I nichtpositiv ist und auf
keinem Teilintervall von I, welches positive Länge hat, identisch verschwindet.
Beweis. Offenbar genügt der Nachweis des ersten Punktes. Der zweite geht genauso oder
kann durch Betrachtung von −f auf den ersten zurückgeführt werden.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
49
(y)
Wenn f monoton wachsend auf I ist, so ist der Ausdruck f (x)−f
für y 6= x, x, y ∈ I
x−y
′
nichtnegativ. Da f (x) Grenzwert dieser Differenzenquotienten ist, ist auch f ′ (x) ≥ 0. Gilt
umgekehrt f ′ (t) ≥ 0 für alle t ∈ I, so gilt
Z d
Z d
′
0 dt = f (c)
f (t) dt ≥ f (c) +
f (d) = f (c) +
c
c
auf Grund von (14) und (9), so daß f monoton wachsend auf I ist.
Wenn die Ableitung von f auf einem Teilintervall I ′ ⊆ I positiver Länge verschwindet, so
ist f wegen Fakt 4 konstant auf I ′ und kann daher nicht streng monoton sein. Wenn umgekehrt
f monoton wachsend, aber nicht streng monoton wachsend ist, so gibt es Zahlen c < d aus I
mit f (c) = f (d). Für t ∈ I ′ = [c, d] gilt dann f (c) ≤ f (t) ≤ f (d) = f (c), also ist f konstant
auf I ′ , und die Ableitung von f verschwindet auf I ′ .
Eine andere Anwendung des zweiten Hauptsatzes betrifft lokale Extremstellen.
Definition 5. Die reellwertige Funktion f sei auf einer Umgebung von x ∈ R definiert.
• Wir sagen, daß bei x ein lokales Minimum von f vorliegt, wenn eine Umgebung U
von x mit f (y) ≥ f (x) für alle y ∈ U existiert. Gilt statt dessen f (y) ≤ f (x) unter
derselben Voraussetzung an U und y, so sprechen wir von einem lokalen Maximum. In
beiden Fällen nennen wir x eine lokale Extremstelle von f . Gilt im Fall y 6= x die echte
Ungleichtung f (y) > f (x) bzw. f (y) < f (x) auf einer Umgebung von x, so sprechen
wir von einem strengen lokalen Extremum.
• Wir sagen, daß f bei x das Vorzeichen von nichtnegativen zu nichtpositiven Werten
wechselt, wenn ein ε > 0 existiert, so daß f (y) ≥ 0 für x − ε < y < x und f (y) ≤ 0
für x < y < x + ε gilt. Wird diese Bedingung von −f erfüllt, so sprechen wir für f von
einem Vorzeichenwechsel von nichtnegativen zu nichtpositiven Werten. Gilt sogar die
strenge Ungleichung, sprechen wir von einem strengen Vorzeichenwechsel.
Satz 2. Die reellwertige Funktion f sei auf einer Umgebung von x ∈ R definiert.
• Wenn x eine lokale Extremstelle von f ist und f ′ (x) existiert, so gilt f ′ (x) = 0.
• Wenn f ′ (x) existiert und von 0 verschieden ist, so wechselt die Funktion f (t) − f (x) an
der Stelle x das Vorzeichen streng, und zwar erfolgt im Fall f ′ (x) > 0 der Vorzeichenwechsel von negativen zu positiven und im Fall f ′ (x) < 0 der Vorzeichenwechsel von
positiven zu negativen Werten.
• Es gelte f ′ (x) = 0. Wenn f ′ auf einer Umgebung von x existiert und bei x das Vorzeichen
von nichpositiv zu nichtnegativ wechselt, so hat f bei x ein lokales Minimum. Wechselt
statt dessen das Vorzeichen von f ′ bei x von nichtnegativ zu nichtpositiv, so hat f bei
x ein lokales Maximum. Im Fall eines strengen Vorzeichenwechsels liegt eine strenge
lokale Extremstelle vor.
Beweis. In beiden Fällen genügt es, den Fall lokaler Minima bzw. der Bedingungen dafür
zu betrachten.
Gilt f ′ (x) = ε > 0, so gibt es ein δ > 0 mit |f (t) − f (x) − ε(t − x)| < 2ε |t − x| für
|t − x| < δ. Für derartige t hat dann f (x) − f (x) dasselbe Vorzeichen wie t − x. Ähnlich
50
erledigt man den Fall f ′ (x) < 0, der überdies auch durch Betrachtung von −f auf den vorigen
zurückgeführt werden kann. Der zweite Punkt ist damit bewiesen. Offenbar kann bei x kein
lokales Extremum von f vorliegen, wenn f (t) − f (x) das Vorzeichen wechselt. Der erste Punkt
folgt also auch.
Wenn f ′ bei x das Vorzeichen von nichtpositiv zu nichtnegativ wechselt, so gibt es ein ε > 0
mit f ′ (t) ≤ 0 für x − ε ≤ t ≤ x und f ′ (t) ≥ 0 für x ≤ t ≤ x + ε, und wegen Folgerung 1
ist f monoton fallend auf [x − ε, x] und monoton wachsend auf [x, x + ε]. Für x − ε ≤ t ≤ x
gilt daher f (t) ≥ f (x), und dasselbe gilt auch für x ≤ t ≤ x + ε auf Grund der jeweiligen
Monotonieaussage. Also hat f bei x ein lokales Minimum.
Wir betrachten von nun an auch höhere Ableitungen und benötigen daher die folgende
Definition:
Definition 6. Die Funktion f ist auf einer offenen Untermenge von R einmal differenzierbar, wenn sie daselbst differenzierbar ist. In diesem Fall bezeichnen wir die erste Ableitung mit
f (1) = f ′ . Sei k > 1, und sei (k − 1)-fache Differenzierbarkeit sowie die k − 1-te Ableitung f (k−1)
schon definiert. Wir sagen, daß f k-fach (oder k-mal) differenzierbar ist, wenn f (k − 1)-fach
differenzierbar ist und zusätzlich die k-te Ableitung f (k) = (f (k−1) )′ existiert. Falls f (k) zusätzlich stetig ist, spricht man von k-facher stetiger Differnzierbarkeit (die Stetigkeit von f (j) mit
0 < j < k folgt automatisch aus Satz .3.1.1.
Bemerkung 3. Eine analoge Definition für komplexe Differenzierbarkeit ist nicht erforderlich. Es gilt nämlich der auf den ersten Blick überraschende Satz, daß die Ableitung einer
holomorphen Funktion wieder holomorph ist. Da der Beweis schwierig ist, kann in dieser Vorlesung nicht darauf eingegangen werden.
Satz 3. Die reellwertige Funktion f sei auf einer Umgebung von x ∈ R definiert und
daselbst k-mal differenzierbar, mit k ≥ 0. Es gelte f (l) (x) = 0 für 1 ≤ l ≤ k. Ferner sei f (k+1)
wohldefiniert und von 0 verschieden.
• Im Fall ungerader k liegt eine lokale Extremstelle von f bei x vor, und zwar ein lokales
Minimum im Fall f (k+1) (x) > 0 und ein lokales Maximum im Fall f (k+1) (x) < 0.
• Im Fall gerader k wechselt die Differenz f (t) − f (x) bei t = x das Vorzeichen, und zwar
von negativen zu positiven Werten im Fall f (k+1) (x) > 0 und von positiven zu negativen
Werten im Fall f (k+1) (x) < 0.
Beweis. Wir gehen durch Induktion vor. Der Fall k = 0 ist gerade der zweite Punkt von
Satz 2. Sei k > 0 und die Behauptung für k − 1 statt k bewiesen. Dann ist die Induktionsannahme auf f ′ anwendbar und ergibt im Fall ungerader k einen Vorzeichenwechsel von f ′
bei x. Nach dem dritten Punkt von Satz 2 ist also x eine lokale Extremstelle von f . Im Fall
gerader k ist hingegen f ′ (x) = 0 ein strenger lokaler Extremwert von f ′ , und nach Folgerung 1
ist f in einer Umgebung von x streng monoton, so daß f (t) − f (x) bei t = x einen strengen
Vorzeichenwechsel hat. Man überzeugt sich leicht davon, daß dieses Argument Aussagen über
Vorzeichenwechsel und Extremstellen gerade in die behauptete Richtung liefert.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
51
Als eine letzte Anwendung des Zusammenhanges zwischen Monotonieverhalten und Vorzeichen der Ableitung betrachten die Konvexität von Funktionen:
Satz 4. Sei f auf I = [a, b] reellwertig und differenzierbar, wobei die Ableitung f ′ auf I
monoton wächst. Dann ist f konvex, es gilt also
(18)
f (1 − λ)x + λy ≤ (1 − λ)f (x) + λf (y)
für x, y ∈ I und 0 ≤ λ ≤ 1.
Ist umgekehrt f ′ monoton fallend auf I, so gilt die zu (18) entgegengesetzte Ungleichung
(19)
f (1 − λ)x + λy ≥ (1 − λ)f (x) + λf (y).
Bemerkung 4. Ähnlich wie für Folgerung 1 lassen sich (18) und (19) für streng monotone
Ableitungen f ′ zu strengen Ungleichungen verschärfen, wenn noch x 6= y und 0 < λ < 1 gilt.
Auch kann die Aussage ähnlich wie Folgerung 1 umgekehrt werden. Wir gehen nicht auf die
Details ein.
Vor dem Beweis von Satz 4 halten wir noch die Abschätzung eines Integrales durch das
Produkt aus Länge des Integrationsweges und Maximum bzw. Minimum des Integranden fest:
Fakt 5. Gilt für eine reellwertige Funktion f (x) ≥ m (bzw. f (x) ≤ M ) auf I = [a, b], so
Rb
Rb
gilt a f (t) dt ≥ m(b − a) bzw. a f (t) dt ≤ M (b − a).
Beweis von Satz 4. Es genügt der Beweis der Aussage über Konvexität, denn die zweite
Aussage kann mit analogen Mitteln bewiesen oder durch Betrachtung von −f auf diesen Fall
zurückgeführt werden.
Wir dürfen beim Nachweis von (18) ohne Beschränkung der Allgemeinheit x < y annehmen,
denn im Fall x = y ist die Behauptung trivial und generell ändert sich keine der beiden Seiten
von (18) bei Vertauschung von x und y und gleichzeitiger Ersetzung von λ durch 1 − λ.
Sei also x < y und z = (1 − λ)x + λy, dann gilt
Z z
f ′ (ξ) dξ ≤ λ(z − x)f ′ (z) = λ(1 − λ)(y − x)f ′ (z)
(+) λ f (z) − f (x) = λ
x
Z y
′
f ′ (ξ) dξ = (1 − λ) f (y) − f (z) .
= (1 − λ)(y − z)f (z) ≤ (1 − λ)
z
Durch Addition von λf (x) + (1 − λ)f (z) zu beiden Seiten ergibt sich (19).
3.3. Das Verhalten der Exponentialfunktion im Komplexen. Wir beginnen mit
Fakt 1. Es gilt exp(z) = exp(z) für beliebige komplexe Zahlen z.
Beweis. In der Tat, aus den Rechenregeln für komplexe Gernzwerte folgt
exp(z) =
∞
X
zn
n=0
n!
=
∞
X
zn
n=0
n!
=
∞
X
zn
n=0
n!
= exp(z).
52
Satz 1. Für komplexe Zahlen z gilt |exp(z)| = exp(ℜz).
Beweis. In der Tat, es gilt
2
|exp(z)| = exp(z)exp(z) = exp(z) exp(z) = exp(z + z) = exp(2ℜ(z)) = exp ℜ(z)
Folgerung 1. Für jede reelle Zahl t hat die komplexe Zahl exp(it) den Betrag 1.
Wir wollen den Real- und den Imaginärteil von exp(it) genauer untersuchen. Es gilt:
und
exp(it) + exp(−it)
exp(it) + exp(−it)
=
= cos(t)
ℜ exp(it) =
2
2
exp(it) − exp(−it)
exp(it) − exp(−it)
ℑ exp(it) =
=
= sin(t),
2i
2i
wenn der Kosinus und der Sinus einer komplexen Zahl z durch
exp(iz) + exp(−iz)
(1)
cos(z) =
2
exp(iz) − exp(−iz)
sin(z) =
(2)
2i
definiert sind. Durch eine einfache Rechnung leitet man die Additionstheoreme für die Winkelfunktionen her, ebenso wie
sin′ = cos
(3)
cos′ = sin
und
(4)
sin(−z) = − sin(z)
cos(−z) = cos(z)
und die Potenzreihenentwicklung
(5)
cos(x) =
∞
X
(−1)k
x2 k
(2k)!
(−1)k
x2k+1
.
(2k + 1)!
k=0
(6)
sin(x) =
∞
X
k=0
Satz 2.
• Für 0 ≤ x ≤ 2 gilt sin(x) > 0.
• Es gibt genau eine Zahl π mit 0 ≤ π ≤ 4 und cos(π/2) = 0. Für diese Zahl gilt
sin(π) = 0, cos(π) = −1.
|x2 |
Beweis. Im Fall 0 ≤ x ≤ 2 ist wegen (2k)(2k+1) ≤ 1 für k ≥ 1 die Folge der Beträge der
Summanden der alternierenden Reihe (6) monoton fallend. Es gilt also nach dem zweiten Teil
von Satz .2.3.2
x2 x
x3
≥ >0
≥x 1−
sin(x) ≥ x −
6
6
3
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
53
für 0 < x ≤ 2. Wegen (3) und nach Folgerung .3.2.1 ist also cos auf [0, 2] streng fallend und
hat dort höchstens eine Nullstelle.
Um die Existenz einer Nullstelle zu zeigen, genügt der Nachweis von cos(2) < 0. Wegen
x2
< 1 für reelle x und |x| ≤ 2 und k ≥ 1 gilt, nach Anwendung des zweiten Teiles
(2k+1)(2k+2)
P
k x2 k
von Satz .2.3.2 auf die Reihe ∞
k=1 (−1) (2k)! , die Ungleichung
cos(x) ≤ 1 −
x2 x4
+
2
24
= − 31 < 0.
für derartige x, also cos 2 ≤ 1 − 2 + 16
24
Die übrigen Aussagen folgen aus den Additionstheoremen.
Satz 3.
• Die Funktion sin bildet das Intervall [−π/2, π/2] bijektiv auf [−1, 1] ab. Die
Umkehrfunktion arcsin ist stetig, ihre Ableitung ist auf (−1, 1) durch
1
arcsin′ (x) = √
1 − x2
gegeben.
• Die Funktion cos bildet das Intervall [0, π] bijektiv auf [−1, 1] ab. Die Umkehrfunktion
arccos ist stetig, ihre Ableitung ist auf (−1, 1) durch
1
arccos′ (x) = − √
1 − x2
gegeben.
Offenbar gilt arccos(x) + arcsin(x) = π/2.
Bemerkung 1. Natürlich ist die Wahl der beiden Intervalle willkürlich, etwa kann [−π/2, π/2]
im ersten Teil der Behauptung kann [−π/2, π/2 durch [k − π/2, k + π/2] ersetzt werden. Die
entsprechenden Umkehrfunktionen sind dann arcsink (x) = arcsin(x) + kπ für gerade und
arcsink (x) = (k + 1)π − arcsin(x) für ungerade k. Entsprechende Aussagen gelten auch für
den Cosinus.
Definition 1. Für eine komplexe Zahl z = x + iy mit x > 0 im Falle y = 0 sei log(z) die
eindeutig bestimmte komplexe Zahl mit exp(log(z)) = z und −π/2 < ℑ(log(z)) < π/2.
Satz 4. Diese Definition ist korrekt, es gibt also unter den angegebenen Voraussetzungen
and z genau eine komplexe Zahl log(z) mit den beschriebenen Eigenschaften. Der so definierte
Logarithmus ist stetig auf C − R≤0 .
Bemerkung 2. Der soeben definierte Logarithmus ist stetig (sogar holomorph) auf der
entlang der negativen rellen Achse aufgeschlitzten koplexen Ebene. Auf dieses Aufschlitzen
kann nicht verzichtet werden, es gibt also keine Möglichkeit, einen stetigen Logarithmus für von
0 verschiedene komplexe Zahlen zu definieren. Der Zusammenhang zwischen dem komplexen
Logarithmus und dem Arkussinus kann auch als
√
arcsin(x) = log ix + 1 − x2
54
formuliert werden.
√
arccos(x) = log x + i 1 − x2
Wir wollen nun die Funktionen
sin(s)
cos(s)
cos(s)
cot(s) =
sin(s)
tan(s) =
untersuchen, die durch tan(s) cot(s) = 1 verknüpft sind und die Periode π haben. Eine einfache
Rechnung ergibt
1
tan′ (s) =
(7)
= 1 + tan2 (s)
cos2 (s)
1
(8)
= −1 − cot2 (s)
cot′ (s) = − 2
sin (s)
tan(x) + tan(y)
tan(x + y) =
(9)
1 − tan(x) tan(y)
cot(x) cot(y) − 1
(10)
cot(x + y) =
cot(x) + cot(y)
Satz 5. Die Funktion tan bildet (−π/2, π/2) bijektiv auf R ab. Die Umkehrfunktion arctan
ist stetig, ihre Ableitung ist durch
1
arctan′ (x) =
1 + x2
gegeben. Es gilt
1 + ix 1
arctan(x) = log
.
2i
1 − ix
Zuweilen trifft man auch die Hyperbelfunktionen
exp(x) − exp(−x)
2
exp(x) + exp(−x)
cosh(x) =
2
sinh(x)
exp(x) − exp(−x)
tanh(x) =
=
cosh(x)
exp(x) + exp(−x)
sinh(x) =
an. Es gilt
cosh2 (z) − sinh2 (z) = 1
sinh(x + y) = sinh(x) cosh(y) + cosh(x) sinh(y)
cosh(x + y) = cosh(x) cosh(y) + sinh(x) sinh(y)
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
55
tanh(x) + tanh(y)
1 + tanh(x) tanh(y)
1 + coth(x) coth(y)
coth(x + y) =
coth(x) + coth(y)
′
sinh (x) = cosh(x)
tanh(x + y) =
cosh′ (x) = sinh(x)
1
= 1 − tanh2 (x)
tanh′ (x) =
2
cosh (x)
1
coth′ (x) = −
= 1 − coth2 (x).
2
sinh (x)
Die Umkehrfunktionen sind
√
x2 − 1
für x ≥ 1
√
arsinh(x) = log x + x2 + 1
1+x
1
für |x| < 1
artanh(x) = log
2
1−x
x−1
1
für |x| > 1
arcoth(x) = log
2
x+1
arcosh(x) = log x +
mit den Ableitungen
arcosh′ (x) = √
1
x2
−1
1
1 + x2
1
artanh′ (x) =
1 − x2
1
arcoth′ (x) =
.
1 − x2
arsinh′ (x) = √
3.4. Methoden der Berechnung von Stammfunktionen. Eine Stammfunktion
F von
R
f bezeichnet man als ein unbestimmtes Integral von f und schreibt F = f (t) dt. Daß die
Stammfunktion nur bis auf Addition einer Konstanten eindeutig ist, drückt man in der folgenden Tabelle durch die Addition einer frei wählbaren Integrationskonstanten C aus:
Beispiel 1 (Tabelle der Grundintegrale). Für s 6= −1 sowie unter der Bedingung x > 0
für nicht ganzzahlige s sowie x 6= 0 für negative ganzzahlige s gilt:
Z
xs+1
s
+ C.
(1)
x dx =
s+1
Die Bedingung x 6= 0 ist so zu verstehen, daß das Integrationsintervall die Zahl 0 nicht enthalten
darf, aber die rechte Seite von (1) eine Stammfunktion für xs mit negtivem ganzen s auf jedem
56
Teilintervall von (−∞, 0) oder (0, ∞) liefert. Unter genau derselben Bedingung gilt
Z
dx
(2)
= log(|x|) + C.
x
Außerdem hat man die Stammfunktionen
Z
(3)
exp(x) dx = exp(x) + C
Z
sin(x) dx = − cos(x) + C
Z
cos(x) dx = sin(x) + C
Z
dx
(4)
= arctan(x) + C
1 + x2
auf ganz R sowie
(5)
Z
√
dx
= arcsin(x) + C
1 − x2
auf [−1, 1].
Zum Beweis dieser Behauptungen genügt die Bemerkung, daß in jedem der Beispiele die
Ableitung der rechten Seite in den letzten Abschnitten bestimmt wurde und mit der linken
Seite übereinstimmt.
Für die praktische Beherrschung der Integralrechnung ist es notwendig, sich diese Tabelle
von Grundintegralen einzuprägen. Aus den Formeln für die Ableitung der Hyperbelfunktionen
und ihrer Umkehrung könnten weitere Grundintegrale hergeleitet werden. Das erübrigt sich
aber an dieser Stelle, da die betreffenden Stammfunktionen auch durch eine Anwendung der
weiter unten angegebenen Integrationsrezepte für bestimmte Klassen von speziellen Integranden berechnet werden können.
Leider ist es nicht immer möglich, einen in elementarer Form gegebenen Integranden in
einer genauso elementaren Form darzustellen. Beispiele dafür sind
Z
exp(−x2 ) dx
oder der Integrallogarithmus
dx
.
log x
Die Stammfunktionen des zuerst genannten Integranden besitzten große Bedeutung in der
Wahrscheinlichkeitsrechnung und werden bis auf einen Normierungsfaktor in den gängigen
Bibliotheken zur Programmiersprache C durch die Funktionen erf und erfc implementiert. In
vielen anderen Fällen ist man auf numerische Integrationsverfahren angewiesen, die hier nicht
näher erklärt werden können.
Z
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
57
Trotzdem ergeben sich aus dem Hauptsatz der Integral- und Differentialrechnung und aus
den Grundregeln für die Berechnung von Ableitungen verschiedene Grundregeln für die Umformung von Integralen, durch deren Anwedung Integrationsaufgaben oft vereinfacht werden
können. Allerdings erfordert dies meist mehr Kreativität als die Anwendung der Grundregeln
für das Differenzieren. Diesen Sachverhalt drückt das Mathematikersprichwort aus: Differenzieren ist ein Handwerk, aber Integrieren ist eine Kunst.
Als triviale Konsequenz aus (.3.1.2) sowie (.3.1.3) mit einem konstanten Faktor g ergibt
sich
Fakt 1. Wenn F und G Stammfunktionen der stetigen Funktionen f und g sind, so ist
F ± G eine Stammfunktion für f ± g, und für jede relle oder komplexe Konstante λ ist λF eine
Stammfunktion für λf .
Leider gibt es keine allgemein anwendbare Regel, die die Integration eines Produktes zweiter
nichtkonstanter Funktionen ermöglicht, deren Stammfunktionen bekannt sind. Aus der Regel
für das Differenzieren eines Produktes ergibt sich statt dessen die folgende Integrationsmethode,
deren Anwendung wesentlich mehr Fingerspitzengefühl erfordert:
Satz 1 (Partielle Integration). Seien f und g rell- oder komplexwertige differenzierbare
Funktionen auf I = [a, b]. Dann gilt
Z
Z
′
(6)
f (t)g (t) dt = f (t)g(t) − f ′ (t)g(t) dt.
Diese Formel ist so aufzufassen, daß für jede Wahl der Stammfunkion auf der rechten Seite
diese eine Stammfunktion des Integranden auf der linken Seite ist und daß für jede Wahl der
Stammfunktion auf der linken Seite die Stammfunktion auf der rechten Seite so gewählt werden
kann, daß die Gleichung gilt. Insbesondere existiert das unbestimmte Integral auf der rechten
Seite genau dann, wenn das unbestimmte Integral auf der rechten Seite existiert. Für bestimmte
Integrale ergibt sich die Regel
Z b
Z b
′
(7)
f (t)g (t) dt = f (b)g(b) − f (a)g(a) −
f ′ (t)g(t) dt
a
a
wobei das Integral auf der rechten Seite genau dann existiert, wenn das Integral auf der linken
Seite existiert.
Beweis. Nach der Produktregel der Differntialrechnung (.3.1.3) ist f g auf I differenzierbar
mit Ableitung f ′ g + f g ′ . Ist a eine Stammfunktion von f ′ g, so gilt (f g − a)′ = f g ′ , also ist
f g − a eine Stammfunktion von f g ′ . Analog ist f g − b eine Stammfunktion von f ′ g, wenn b
eine Stammfunktion von f g ′ ist. Unsere Behauptung über (6) ist damit gezeigt.
Wegen (f g)′ = f ′ g + f g ′ gilt
Z b
f (t)g ′ (t) + f ′ (t)g(t) dt = f (b)g(b) − f (a)g(a).
a
Unsere Behauptung (7) ergibt sich nun aus (.3.2.7) und (.3.2.8)
58
Beispiel 2. Durch partielle Integration (mit f (x) = log(x), g(x) = x) kann der Logarithmus integriert werden:
Z
Z
Z
′
(8)
log(t) dt = t log(t) − t log (t) dt = t log(t) −
dt = t log(t) − 1 = t(log(t) − 1).
k+1
Für k ≥ 1 ergibt sich entsprechend mit f (t) = log(t), g(t) = tk+1 :
Z
Z
tk+1
1
1
tk+1
k
(9)
t log(t) dt =
log(t) −
(log(x) −
),
tk dt =
k+1
k+1
k+1
k+1
Ähnlich gilt
(10)
Z
k
k
t exp(t) dt = t exp(t) − k
Z
tk−1 exp(t) dt,
was eine Behandlung derartiger Integranden durch Induktion nach k ermöglicht. Eine analoge
Vorgehensweise ist auch dann möglich, wenn die Funktion exp durch eine der Funktionen sin
oder cos eretzt wird.
Satz 2 (Substitution). Die differenzierbare Funktion φ bilde [a, b] nach einem Intervall
I ⊆ R ab, auf dem eine reell- oder komplexwertige Funktion f mit der Stammfunktion F
gegeben sei. Dann ist F (φ(x) eine Stammfunktion von f (φ(x))φ′ (x), es gilt also
Z b
Z φ(b)
′
f (φ(x))φ (x) dx =
F (t) dt
a
φ(a)
Der Beweis ergibt sich aus Theorem 1 und der Tatsache, daß nach der Kettenregel der
Differentialrechnung die Ableitung von F (φ(x)) durch f (φ(x))φ′ (x) gegeben ist.
Bemerkung 1. Die Anwendung der Substitionsregel prägt man sich gut durch formale
Rechnungen ein, bei denen sich Zähler und Nenner des Differentialquotienten verselbständigen,
wie
Z
Z
dφ
f (φ) dx = f (φ) dφ.
dx
Es kann hier nicht darauf eingegangen werden, wie man Ausdrücken wie df und dφ einen
eigenständigen Sinn verleiht.
Beispiel 3.
• Seien a 6= 0 und b relle Zahlen, wenn F eine Stammfunktion für f ist,
so ist a1 F (ax + b) eine Stammfunktion für f (ax + b). Auf diese Weise können Integranden durch Verschiebung und Skalierung oft auf eines der Grundintegrale zurückgeführt
werden, zum Beispiel
Z
(2003 + 2004)2006
.
(2003t + 2004)2005 dt =
2003 · 2006
• Oft kann die Substitutionregel mit f (x) = log(|x|), φ(x) = a(x) angewendet werden.
Sie ergibt dann
Z ′
a
(t) dt = log(|a(t)|) + C.
a
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
59
′
(11)
Den Ausdruck aa (t) nennt man logarithmische Ableitung von a. Hinter manchen Integranden verbirgt sich eine solche logarithmische Ableitund, zum Beispiel
Z
tan(t) dt = − log(|cos(t)|)
Z
cot(t) dt = log(|sin(t)|),
wovon man sich leicht durch Ausrechnen der logarithmischen Ableitungen des Sinus oder
Cosinus überzeugt. Das Integrationsintervall darf keine Punkte enthalten, an denen die
Winkelfunktion auf der rechten Seite verschwindet, also keine halb- bzw. ganzzahligen
Vielfachen von π.
• Die Stammfunktion von x exp(x2 ) kann durch die Substitution t = x2 , dt = 2x dx,
x dx = dt2 als
Z
1
exp(t)
1
= exp(x2 ).
exp(t), dt =
2
2
2
Das Rezept ist allgemein auf Integranden der Form tf (t2 ) anwendbar, wenn die Stammfunktion von f bekannt ist. Im Gegensatz dazu sind die Stammfunktionen von exp(±t2
nicht in geschlossener Form durch elementare Funktionen darstellbar, wie schon bemerkt
wurde.
Im Folgenden sollen Regeln zur Berechnung der wichtigsten unbestimmten Integrale gegeben werden, die sich auf die Integration rationaler Funktionen zurückführen lassen. Wir
beginnen mit der Integration rationaler Funktionen durch Partialbruchzerlegung.
P
k
Ein Polynom in einer Variablen ist eine Funktion der Form P (t) = ∞
k=0 pk T , wobei nur
endlich viele der Koeffizienten pk von 0 verschieden sein dürfen. Das größte k mit pk 6= 0
nennt man den Grad und pk den führenden Koeffizienten von P , wobei man vereinbart, daß
der Grad des Nullpolynomes −∞ ist. Falls die pk ihrerseits Polynome in einer Variablen S sind,
spricht man von einem Polynom in den zwei Variablen S und T . Entsprechend definiert man
induktiv, was man einem Polynom in mehr als zwei Variablen versteht. Wir werden aber nur
den Fall von ein oder zwei Variablen benötigen. Unter einer rationalen Funktion versteht man
einen Quotienten zweier Polynome, wobei der Nenner nicht das Nullpolynom sein darf. Ein
derartiger Quotient definiert eine beliebig oft differenzierbare Funktion auf dem Komplement
der Nullstelenmenge des Nenners.
Die Integration von rationalen Funktionen einer Variablen beginnt damit, daß man den
Bruch durch Polynomdivision mit Rest vereinfacht. Die Polynomdivision mit Rest ermöglicht
es, zu zwei Polynomen A, B 6= 0 Polynome Q und R mit P = QB + R zu finden, wobei
der Grad von R kleiner als der Grad von P ist. Die Vorgehensweise besteht darin, daß man
durch absteigende Induktion sukzessive die Koeffizienten von Q so festlegt, daß der führende
Koeffizient von P anulliert wird, bis nur noch ein Polynom von kleinerem Grad als B verbleibt.
Beispielsweise für A(t) = T 4 , B(t) = t2 + 1:
A(T ) = T 2 B(T ) − T 2 = (T 2 − 1)B(T ) + 1,
60
also Q(T ) = T 2 − 1, R(T ) = 1. Man kann sich die Prozedur durch ein ähnliches Schema wie
bei der Division ganzer Zahlen mit Rest veranschaulichen.
Die Polynomdivision mit Rest erlaubt es, jede rationale Funktion einer Variablen als
A(T )
R(T ) =
+ P (T )
B(T )
P
pk
k+1
,
zu schreiben, wobei A einen kleineren Grad als B hat. Die Stammfunktion von P ist ∞
k=0 k+1 T
wobei pk der k-te Koeffizient von P ist. Es verbleibt die Integration des ersten Summanden
auf der rechten Seite. Man kann zeigen, daß B(T ) in Linearfaktoren zerfällt, also
m
Y
(12)
B(T ) =
(T − βi )ki
i=1
mit natürlichen Zahlen ki > 0 und paarweise verschiedenen komplexen Zahlen βi . Diese Tatsache ist als Fundamentalsatz der Algebra bekannt. Wenn B in der obigen Weise dargestellt wird
und A einen kleineren Grad als B hat, kann die Partialbruchzerlegung des Quotienten A/B als
m
(13)
k
i
XX
A
αi,j
(T ) =
B
(T − βi )j
i=1 j=1
angesetzt werden.
Beispielsweise ist die Partialbruchzerlegung von
1
x3 −x
als
A
B
C
1
= +
+
−x
x x−1 x+1
3
anzusetzen. Nach Multiplikation mit x − x = x(x − 1)(x + 1) kommt
x3
(14)
1 = A(x − 1)(x + 1) + Bx(x + 1) + Cx(x − 1)
zunächst auf R − {0; ±1}, was aus Stetigkeitsgründen auch auf ganz R gilt. Setzt man x = 0,
so kommt A = −1. Durch Einsetzen von x = 1 erhält man B = 21 und mit x = −1 kommt
C = 12 , wobei jeweils nur einer der Summanden auf der linken Seite von 0 verschieden ist. Wir
erhalten
Z
Z
(x − 1)(x + 1) dx
1
1
1
1
2
.
dx = log =
+
−
x3 − x
2
x−1 x+1 x
2
x2
Eine analoge Vorgehensweise ist auch bei ähnlichgearteten Aufgaben möglich: Multiplikation
mit dem Nennerpolynom und Auswerten der entstehenden, zu (14) analogen Polynomgleichung
an den Nullstellen des Nennerpolynomes. Hat des Nennerpolynom Nullstellen höherer Ordnung
(also ki > 1 in (12)), so sind auch die ersten und höheren Ableitung des Analogons zu (14) an
diesen Stellen auszuwerten, und zwar alle Ableitungen bis zum Grade ki −1 an der Stelle βi . Die
Prozedur entpricht der Polynominterpolation, die in Bulirsch/Stoer, Numerische Mathematik,
Band 1 beschrieben wird. In den Aufgaben werden nur sehr einfache Spezialfälle auftreten, die
mit den obigen Hinweisen leicht gelöst werden können.
Leider kann auch für rellwertige Integranden nicht ausgeschlossen werden, daß unter den βi
in (12) komplexe Zahlen auftauchen. In diesem Fall möchte man natürlich einen Ausdruck für
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
61
die Stammfunktion erhalten, der ebenfalls nur relle Funktionen enthält. Die Stammfunktion
der Summanden mit j > 1 in (13) ist auch für nicht relle βi durch
Z
dT
1
αi,j
αi,j
·
=
j
(T − βi )
j + 1 (T − βi )j+1
gegeben, wie man durch Differenzieren der rechten Seite leicht einsieht. Die Summe dieser
Ausdrücke über alle (i, j) mit j > 1 ergibt eine rationalen Funktion mit reellen Koeffizienten.
Eine Stammfunktion der Summanden mit j = 1 ist durch den komplexen Logarithmus gegeben,
etwa
Z
dT
= αi,1 log(T − βi ),
αi,1
T − βi
was für nicht relle βi eine Stammfunktion auf ganz R liefert. Man kann zeigen, daß sich die
Summe dieser Ausdrücke durch relle Logarithmen und Arkusfunktionen ausdrücken läßt. Zu
jeder echt komplexen Nullstelle βi gibt es nämlich ein k mit βk = βi , es gilt αi,j = αk,j , und
die Linearkombination der komplexen Logarithmen kann als
αi,1 log(T − βi ) + αi,1 log(T − βi )
T − ℜ(βi,1 ) +C
= ℜ(αi,1 ) log (T − ℜ(βi ))2 + ℑ(βi )2 − 2ℑ(αi,1 ) arctan
ℑ(βi,1 )
dargestellt werden, wobei C = ±πℑ(αi,1 ) (wobei das Vorzeichen vom Vorzeichen von ℜ(βi,1 )
abhängt) in die frei wählbare Integrationskonstante C der Stammfunktion assimiliert werden
kann. In den Aufgaben werden aber nur einfche Fälle auftauchen, die man durch Verschiebung
oder Translation auf eines der Integrale
Z
t dt
1
= log(1 + t2 ) + C
2
1+t
2
Z
dt
= arctan(t) + C
1 + t2
zurückführen kann. Auch für praktische Rechnungen kann es die beste Vorgehensweise sein,
die Summanden mit j = 1 in der Partialbruchentwicklung zu derartigen Integranden zusammenzufassen.
Einige andere Klassen von unbestimmten Integralen lassen sich relativ leicht auf den soeben
beschriebenen
Fall rationaler Funktionen zurückführen. Zu den einfachsten derartigen Fällen
R
t
gehört R(e ) dt mit einer rationalen FunktionR R. Substituiert man x = et , so ergibt sich
= et = x das unbestimmte Integral R(x) dx
, wobei der Integrand eine rationale
wegen dx
dt
x
Funktion ist. Zum Beispiel:
Z
Z
Z
s dt
ds
1
1 + C = t − log(et + 1) + C
=
=
−
ds = log et + 1
s(s + 1)
s s+1
s + 1
Etwas komplizierter sind Integrale von rationalen Funktionen
in den Winkelfunktionen. Die
R
allgemein anwendbare Substitution zur Berechnung von R(sin φ, cos φ) dφ ist t = tan(φ/2).
62
2
2t
1−t
dt
= 1 + t2 , sin(φ) = 1+t
Es gilt 2 dφ
2 , cos φ = 1+t2 , womit das Integral auf die Berechnung der
Stammfunktion einer rationalen Funktion zurückgeführt ist:
Z
dt
2t 1 − t2
,
)
.
2 R(
2
2
1 + t 1 + t 1 + t2
Beispielsweise ergibt sich durch Anwendung dieses Integrationsrezeptes
Z
Z
Z
dt
2t −1 dt
dφ
=2 (
)
=
= log(|t|) + C = log |tan(φ/2)| + C.
2
2
sin φ
1+t
1+t
t
Manchmal führt bei derartigen
Aufgaben auch eine andere Substitution zum Ziel.
R
R Zum Beispiel
kann für Integrale der Art cos(φ)R(sin φ) dφ die Substitution x = sin φ und für sin(φ)R(cos φ) dφ
die Substitution x = cos φ verwendet werden. Dieser Fall tritt genau dann ein, wenn R(−x, y) =
−R(x, y) bzw. R(x, −y) = −R(x, y) gilt. Im Fall R(−x, −y) = R(x, y) kann der Integrand als
R(sin φ, cos φ) = R1 (cos2 φ, tan φ) dargestellt und t = tan φ substituiert werden.
Eng mit diesem Beispiel verwandt ist die Berechnung von Integralen der Form
Z
√
R(x, ax2 + bx + c) dx
mit einer rationalen Funktion R. Wir setzen voraus, daß die Quadratwurzel rell ist. Im Fall
a =√b = 0 ist der Integrand eine rationale Funktion von t, und im Fall a = 0, b 6= 0 kann
b
t = bx + c substituiert werden. Wir setzen also a 6= 0 voraus. Ersetzung von x durch λ(x+ 2a
)
mit einem geeigneten Normierungsfaktor λ führt auf einen der folgenden Fälle:
√
√
R
2t
dx
1−t2
1 − x2 = 1+t
• R(x, 1 − x2 ) dx. Man substituiert x = 1+t
2,
2 . Da die Ableitung dt
eine rationale Funktion von t ist,√wird man auf einen rationalen Integranden geführt.
Die Substitution x = sin φ, 1 − x2 = cos φ würde auf den vorher beschriebenen
Fall einer rationalen Funktion in Winkelfunktionen führen, und die in diesem Fall andiesoeben
angegebene Vorschrift.
√
√ Substitution t = tan(φ/2) führt auf
Rwendbare
1+t2
2t
2
2
• R(x, 1 + x ) dx. Man substituiert x = 1−t2 , 1 + x = 1−t
2.
√
R
2 √
2t
1+t
• R(x, x2 − 1) dx. Man substituiert x = 1−t2 , x2 − 1 = 1−t2 .
In jedem der drei Fälle beruht die Existenz der Substition darauf, daß die Lösungsmenge der
Gleichung x2 ± y 2 = ±1 durch rationale Funktionen einer komplexen Veränderlichen parametrisiert werden kann. Für Kurven der Form x2 = P (y) mit einem Polynom P vom Grade
> 2 ist eine derartige Parametrisierung normalerweise nicht mehr möglich. Die entsprechenden Integrale sind die elliptischen oder hyperelliptischen stIntegrale, die sich nicht mehr als
algebraische Ausdrücke in elementaren Funktionen darstellen lassen.
3.5. Anwendung auf gewöhnliche Differentialgleichungen. Eine gewöhnliche Differentialgleichung erster Ordnung für eine Funktion ist eine Gleichung der Form f ′ (t) =
F (t, f (t)). Es sind also Funktionen gesucht, die eine bestimmte Beziehung zu ihrer Ableitung
erfüllen. Im vorliegenden Fall ist es explizit mögliich, die Ableitung durch die Ausgangsfunktion
auszudrücken. Hat die Differentialgleichung hingegen die Form Φ t, f (t), f ′ (t) = 0, so spricht
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
63
man von einer impliziten Differentialgleichung. Es ist auch möglich, n-Tupel f~ von Funktionen
zu betrachten, die eine Gleichung der Form
f ′ (t) = Fi t, f~(t)
i
erfüllen. Man spricht dann von einem Differentialgleichungssystem erster Ordnung, welches in
dem gegebenen Beispiel explizite Form hat.
FÜr die physikalischen Anwendungen sind Differentialgleichungen zweiter Ordnung von besonderer Wichtigkeit, da die Beschleunigung eine zweite Ableitung ist. Die Differentialgleichung
zweiter Ordnung
(1)
f ′′ (t) = F t, f (t), f ′ (t)
ist offenbar äquivalent zu dem Differentialgleichungssystem erster Ordnung
(2)
f ′ (t) = g(t)
g ′ (t) = F t, f (t), g(t)
denn (f, g) löst (2) genau dann, wenn f (1) löst und g die Ableitung von f ist.
Entsprechend können gewöhnliche Differentialgleichungssysteme beliebiger Ordnung auf
gewöhnliche Differentialgleichungssysteme erster Ordnung zurückgeführt werden.
Wir betrachten zunächst gewöhnliche Differentialgleichungen erster Ordnung für eine reellwertige Funktion. Im einfachsten Fall hängt die rechte Seite nur von t, nicht aber von f (t) ab:
f ′ (t) = F (t). In diesem Fall ist unsere Aufgabe also äquivalent zur Auffindung einer Stammfunktion von F . Insbesondere ist die Lösung mehrdeutig, denn wie wir gesehen haben, ist
die Stammfunktion nur bis auf Addition einer Konstanten eindeutig bestimmt. Die Vorgabe
eines Anfangswertes f (a) reicht aber aus, um die Lösung eindeutig zu machen. Es wird sich
herausstellen, daß dies in vielen ähnlichen Fällen, aber durchaus nicht immer, richtig bleibt.
Der nächsteinfache Fall ist der Fall einer Differentialgleichung mit trennbaren Variablen. In
diesem Fall ist die rechte Seite der Differentialgleichung das Produkt einer nur von f (t) und
einer nur von t abhängenden Funktion:
(3)
f ′ (t) = a(f (t))b(t)
Satz 1. Die Funktion a sei positiv oder negativ auf I = [α, β], und b sei auf J = [γ, δ]
definiert. Wir setzen voraus, daß 1/a eine Stammfunktion A auf I und b eine Stammfunktion
B auf J hat. Aus dem Zwischenwertsatz für stetige Funktionen folgt, daß das Bild A(I) von I
unter A ein abgeschlossenes Intervall ist. Sei fo ∈ I und to ∈ J, so daß B(t) + A(fo ) − B(to ) ∈
A(I) für alle t ∈ J gilt. Dann hat (3) mit der Anfangswertbedingung f (to ) = fo genau eine
Lösung, und diese ist durch
(4)
A f (t) = B(t) + A(fo ) − B(to ),
also
(5)
gegeben.
f (t) = A−1 B(t) + A(fo ) − B(to )
64
Beweis.
Der Beweis ist eine Anwendung der Kettenregel: Löst f (3), so erfüllt φ(t) =
A f (t) die Differentialgleichung
−1
φ′ (t) = A′ f (t) f ′ (t) = a f (t) b(t)a f (t) = b(t),
also φ(t) = B(t) + C. Wir haben φ(to ) = A(fo ), also C = A(fo ) − B(to ) und
(+)
φ(t) = B(t) + A(fo ) − B(to ),
also erfüllt f (4).
Umgekehrt wissen wir nach Satz .3.1.4, daß die Umkehrfunktion G = A−1 differnzierbar
ist und G′ (t) = a G(t) erfüllt. Sei φ durch (+) gegeben, dann ist φ differenzierbar mit Ableitung φ′ (t) = b(t). Die durch (5) gegebene Funktion f (t) = G φ(t) ist nach der Kettenregel
differenzierbar mit der Ableitung
f ′ (t) = G′ φ(t) φ′ (t) = a G(φ(t)) b(t) = a f (t) b(t),
und die Bedingung f (to ) = fo ist offenbar auch erfüllt.
Bemerkung 1. Die Vorgehensweise kann man sich durch die folgende Eselsbrücke veranwie ein gewöhnlicher Bruch behandelt wird:
schaulichten, bei der f ′ (t) = df
dt
(6)
df
= a(f )b(t)
dt
df
= b(t) dt
a(f )
Z
Z
df
= b(t) dt,
a(f )
was bis auf die Bestimmung der Integrationskonstante mit (4) übereinstimmt, aber natürlich
im Gegensatz zum Beweis des vorigen Satzes keine exakte Herleitung darstellt.
Beispiel 1. Wir betrachten das Anfangswertproblem
p
(7)
f ′ (t) = f (t)
f (0) = fo
und orientieren unsere Rechnungen an (6):
df
dt
df
√
f
Z
df
√
f
p
2 f
=
p
f
= dt
Z
=
dt
=t+C
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
65
oder
1
f (t) = (t + C)2
4
√
mit C = 2 fo . Offenbar liefert dieses Ergebnis auch im Falle fo = 0 eine Lösung der Differentialgleichung, aber Satz 1 ist nicht mehr anwendbar. In der Tat stellt sich die Eindeu2
tigkeitsaussage des Satzes als falsch heraus, denn neben f (t) = t4 löst auch f (t) = 0 die
Differentialgleichung (7) mit der Anfangswertbedingung f (0) = 0.
(8)
Beispiel 2. Für f ′ (t) = 1 + f (t)2 ergibt sich durch eine ähnliche Rechnung:
df
= 1 + f2
dt
df
= dt
1 + f2
Z
Z
df
=
dt
1 + f2
arctan(f ) = t + C
oder
(9)
f (t) = tan(t + C)
Da der Tangens nicht auf ganz R definiert ist, liegt ein Beispiel einer Differentialgleichung vor,
deren Lösungen nur endliche Lebensdauer“ haben: Jede Lösung wird durch die Dynamik des
”
Systemes in endlicher Zeit nach ∞ getragen.
Bemerkung 2. In den beiden letzten Beispielen war die rechte Seit der Differntialgleichung
eine Funktion von f (t). In diesem Fall ist die Gleichung verschiebungsinvariant, mit f (t) ist
für jede Konstante C auch f (t − C) eine Lösung, was sich auch in (8) und (9) äußert.
Als letztes Beispiel für den Fall trennbarer Variablen betrachten wir eine Differentialgleichung, bei der weder a noch b konstant sind.
Beispiel 3. Wir wollen f ′ (t) =
1+f (t)2
1+t2
lösen und gehen genauso vor wie zuvor:
1 + f2
df
=
dt
1 + t2
df
dt
=
2
1+f
1 + t2
Z
Z
dt
df
=
2
1+f
1 + t2
arctan(f (t)) = arctan(t) + C,
also
t+τ
f (t) = tan arctan(t) + C =
1 − tτ
66
mit τ = tan(C), wobei das Addition aus (.3.3.7) ausgenutzt wurde. Für τ > 0 ist die Lösung
nur für t < τ1 , im Fall τ < 0 nur für t > τ1 definiert. Im Fall τ = 0 gilt f (t) = t.
Auch lineare Differentialgleichungen erster Ordnung für eine Funktion können stets auf
Quadraturaufgaben, maW. auf die Bestimmung von Stammfunktionen, zurückgeführt werden.
Darauf wird im nächsten Abschnitt eingegangen.
Noch schwieriger wird die Situation für allgemeine Differentialgleichungssysteme und für
Differentialgleichungen höherer Ordnung. Die Darstellung der Lösung in geschlossener Form gelingt nur dann, wenn betimmte Typen von Differentialgleichungen vorliegen bzw. eine Zurückführung
auf derartige Typen erraten werden kann. Als Beispiel für eine Differentialgleichung zweiter
Ordnung, für die praktisch stets eine Zurückführung auf Quadraturaufgaben gelingt, betrachten wir die Gleichung
(10)
f ′′ (x) = a f (x) .
Sei A eine Stammfunktion von a, nach Multiplikation mit (10) mit 2f ′ (x) kommt
f ′ (x)f ′′ (x) = A′ f (x) f ′ (x)
1 d ′ 2
d
·
A f (x)
f (x) =
2 dx
dx
oder
f ′ (x)2
(11)
− A f (x) = C
2
Man wird also auf die Differentialgleichung erster Ordnung
q
(12)
f ′ (x) = ± 2C + 2A f (x) ,
wobei freilich die korrekte Wahl des Vorzeichens auf der rechten Seite von (12), das ja z. B.
auch von x abhängen kann, je nach dem konkreten Fall sorgfältige Betrachtungen erfordern
kann.
Übrigens hat (11) die Form eines Erhaltungssatzes,
zumal wenn man den Summanden
f ′ (x)2 /2 als kinetische und den Summanden −A f (x) als potielle Energie (also −A als Po”
tential“ des Kraftfeldes“ a) deutet. Dies ist kein Zufall. Nach einem für Systeme der hier be”
trachteten Art schon von Sophus Lie erkannten, in seiner allgemeinen feldtheoretischen Fassung
nach Emmy Noether benannten Sachverhalt besteht ein Zusammenhang zwischen Symmetrien
des Systemes und Erhaltungsgrößen. Der Zeitunabhängigkeit des Systemes2 entspricht dabei
gerade die Energieerhaltung. Generell spielen Erhaltungssätze dieser Art eine wichtige Rolle
bei der Vereinfachung von Differentialgleichungssystemen, die aus Problemen der Mechanik
entstehen.
2Also
der Translationsinvarianz: Mit f ist für jede Konstante K auch
f (·+K) eine Lösung. Dies ist natürlich
auch für allgemeinere Gleichungen der Form f ′′ (x) = A f ′ (x), f (x) der Fall, aber zur Anwendung des Satzes von Lie-Noether muß eine Zurückführung der Differentialgleichung auf ein sogenanntes Variationsproblem
bekannt sein, die nur in dem von uns betrachteten Spezialfall derart einfach ist.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
67
Wie schon mehrfach angedeutet, gelingt die Zurückführung einer Differentialgleichung auf
Quadraturaufgaben nur in relativ einfachen Spezialfällen. In vielen Fällen ist man auf numerische Verfahren zur Lösung von gewöhnlichen Differentialgleichungen angewiesen. Die theoretische Legitimation dafür liefert der folgende Satz von Picard-Lindelöf:
Theorem 2. Die Funktion F~ sei auf [0, ε) × U mit ε > 0 definiert, wobei U ⊆ Rn offen
und F~ Rn -wertig ist. Wir setzen voraus, daß F~ auf dem angegebenen Definitionsbereich stetig
und in seinem zweiten Argument Lipschitz-stetig ist, also eine Bedingung der Form
~
(13)
F (t, x) − F~ (t, y) ≤ L |x − y|
erfüllt, wobei wir den Betrag von Elementen des Rn als
v
u n
uX
|x| = t
x2
i
i=1
definieren.3
Sei f~o ∈ U . Dann gibt es ein δ ∈ (0, ε], so daß das Anfangswertproblem
(14)
f~′ (t) = F~ t, f~(t)
f~(0) = f~o
genau eine Lösung auf f~ [0, δ) hat. Weiterhin existiert stets ein größtmögliches δ ∈ (0, ε] mit
dieser Eigenschaft. Ist in diesem Fall η > 0 und ~g eine Lösung von (14) auf [0, η), so gilt
η ≤ δ, und ~g ist die Einschränkung von f~ auf [0, η).
Wie wir uns schon in Beispiel 2 und Beispiel 3 klargemacht haben, gibt es im Allgemeinen
Lösungen endlicher Lebensdauer, bei denen also f~(t) in endlicher Zeit den Definitionsbereich
von F~ verläßt oder gewissermaßen nach unendlich katapultiert wird. Daß die durch den Beweis
des Satzes von Picard-Lindelöf konstruierten Lösungen manchmal eine Lebensdauer δ < ε haben, muß also umwillen der allgemein gehaltenen Voraussetzungen in Kauf genommen werden.
Allerdings kann man zeigen, daß im Falle δ < ε die Lösung entweder unbeschränkt ist oder sich
dem Komplement von U beliebig nahe annähert. Die Lösung ist also wirklich definiert, solange
sie nicht nach unendlich abwandert oder den Definitionsbereich der rechten Seite verläßt.
Daß die Voraussetzung (13) nicht ohne Weiteres aufgegeben werden kann, macht man sich
durch Beispiele vom Typ Beispiel 1 klar4, in denen die Lösung des Anfangswertproblemes nicht
3Wofür
es natürlich andere Alternativen gibt, etwa das Maximum der Beträge der einzelnen Komponenten
xi . Alle vernünftigen Möglichkeiten führen aber letztlich auf dieselbe Bedingung (13) — Alle Normen auf dem
endlichdimensionalen R-Vektorraum Rn sind äquivalent.
4In dem konkreten Beispiel tritt das Problem gerade im Fall des Anfangswertes f = 0 auf, der am
o
√
unteren Rand des Definitionsbreiches der rechten Seite f der Differentialgleichung liegt. Diespist aber für ein
Gegenbeispiel dieser Art nicht notwendig, beispielsweise hat das Anfangswertproblem f ′ (t) = 3 f (t), f (0) = 0
die beiden Lösungen f (t) = 0 und f (t) = t3 , zusammen mit überabzählbar vielen anderen Lösungen, die man
durch Zusammenstückeln“ dieser beiden Lösungen erhalten kann
”
68
eindeutig ist. Ohne die Eindeutgkeitsaussage bleibt das Theorem — nach einem Ergebnis von
G. Peano — freilich
p immer noch richtig, solange f stetig ist. Übrigens liefert Satz 1 Beispiele,
wie f ′ (x) = 1+ |f (x)|, in denen die Lösung trotz verletzter Lipschitzstetigkeit noch eindeutig
ist. Diese Beispiele sind eben relativ spezieller Art.
Der Satz von Picard-Lindelöf ist nicht nur als theoretischer Hintergrund für die numerischen Verfahren zur Auflösung gewöhnlicher Differentialgleichungen interessant, sondern liefert
auch oft die Rechtfertigung anderweitig bedenklicher Umforumungen von gewöhnlichen Differentialgleichungen, die zu einer Ermittlung der allgemeinen Lösung mit Bleistift und Papier
führen sollen. Ein Beispiel dafür sind Eselsbrücken vom Typ (6) oder auch Substitutionen durch
Potenzen mit nichtganzen Zahlen als Exponenten, wie sie bei der Behandlung von (.3.6.19) auftreten können oder auch an Ansätze, die zur Auffindung einer Lösung von sehr spezieller Form
führen. Ist der Satz von Picard-Lindelöf anwendbar und kann man sich davon überzeugen,
daß ein unter Umständen fragwürdiger Ansatz tatsächlich zu einer Lösung eines gegebenen
Anfangswertproblemes geführt hat, so kann man sich sicher sein, die einzige Lösung gefunden
zu haben.
3.6. Lineare gewöhnliche Differentialgleichung.
3.6.1. Lineare Differentialgleichungen erster Ordnung für eine Funktion. Die lineare gewöhnliche Differentialgleichung erster Ordnung für eine Funktion hat die Form
f ′ (t) = a(t)f (t) + b(t).
(1)
Im Fall b(t) = 0 spricht man von einer homogenen Differentialgleichung, andernfalls vom
inhomogenen Fall. Diese Unterscheidung zwischen homogen und imhomogen ist nur für lineare
Differentialgleichungen üblich und entspricht genau der entsprechenden Unterscheidung für
lineare Gleichungssysteme.
Im homogenen Fall liegt offenbar eine Differentialgleichung mit trennbaren Variablen vor.
Unsere Eselsbrücke“ (.3.5.6) liefert uns
”
df
= a(t)f
dt
df
= a(t) dt
f
Z
Z
log f = f (t) dt = a(t) dt + C1 ,
also
f (t) = C exp A(t) ,
(2)
wobei A eine Stammfunktion von a ist. Obwohl Satz .3.5.1 im Fall des Anfangswertes 0 nicht
anwendbar ist, ist die Lösung in diesem konkreten Fall auch dann eindeutig5 und durch (2)
gegeben, und zwar auch im Fall komplexwertiger a. Es gilt also
5Was
für stetige a aus dem Satz von Picard-Lindelöf gefolgert werden kann.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
69
Satz 1. Wenn a auf einem Intervall I ⊆ R definiert sowie reell- oder komplexwertig ist
und daselbst eine Stammfunktion A hat, so haben alle Lösungen von (1) mit b = 0 auf I die
Form (2), und umgekehrt ist die rechte Seite von (2) für jede Konstante C eine Lösung von
(1) mit b = 0.
Beweis. Durch Anwendung der Kettenregel (.3.1.5) ergibt sich
f ′ (t) = CA′ (t) exp A(t) = A′ (t)f (t) = a(t)f (t).
für die Ableitung von (2). Also definiert (2) wirklich Lösungen der betrachteten Differentialgleichung. Ein förmlicher Beweis der Eindeutigkeitsaussage6 soll der Kürze halber nur im
Fall größerer Allgemeinheit geführt und daher noch bis zum Beweis von Satz 2 aufgeschoben
werden.
Wenn b in (1) nicht zu a proportional ist, liegt keine Differentialgleichung mit trennbaren
Variablen vor. In diesem Fall hilft der Trick der Variation der Konstanten“, der übrigens
”
generell auf lineare gewöhnliche Differentialgleichungen anwendbar ist, für die eine oder mehrere
Lösungen der homogenen Differentialgleichung erraten werden können. Der Paradox klingende
Name ist dadurch motiviert, daß man von (2) ausgeht, aber statt der Konstanten C eine
Funktion C(t) einsetzt:
f (t) = C(t) exp A(t) .
Wenn zunächst ohne Nachweis der Differenzierbarkeit von C die Leibniz-Regel (.3.1.3) angwendet wird, kommt (mit Anwendung der Kettenregel (.3.1.5) auf den zweiten Faktor)
(3)
f ′ (t) = C ′ (t) exp A(t) + A′ (t)C(t) exp A(t) = C ′ (t) exp A(t) + a(t)f (t).
Die Differentialgleichung (1) ist damit zu
oder
C ′ (t) exp A(t) = b(t)
C ′ (t) = b(t) exp −A(t) ,
also zu einer Quadraturaufgabe, äquivalent.
Satz 2. Die Funktionen a und b seien auf einem Intervall I ⊆ R definiert und reell- oder
komplexwertig. Wir setzen voraus, daß a auf I eine Stammfunktion
A hat. Dann hat (4) genau
dann auf ganz I definierte Lösungen, wenn b(t) exp −A(t) eine Stammfunktion C auf I hat.
Für jede Konstante K ist dann
(4)
C(t) + K) exp A(t)
eine Lösung von (1), und jede Lösung dieser Differentialgleichung auf I hat die Form (4) mit
einer Konstanten K.
6Der
sich wie gesagt in vielen Fällen aus dem Satz von Picard-Lindelöf ergibt
70
Beweis. Wenn C eine Stammfunktion von b(t) exp −A(t) ist, so ist C differenziebar,
die Umformungen nach (3) sind also legal und ergeben, daß C(t) exp A(t) eine Lösung der
Differentialgleichung
ist. Dasselbe gilt für (4), denn auch C(t) + K ist eine Stammfunktion von
b(t) exp −A(t) .
Sei umgekehrt
folgt die Differenzierbarkeit
f eine Lösung von (1). Aus der Kettenregel
von exp −A(t) , also ist auch C(t) = f (t) exp −A(t) differnzierbar. Die Umformungen nach
(3) sind also, mit
C(t) statt C(t), anwendbar und zeigen, daß C eine Stammfunktion
von
˜
b(t) exp −A(t) sein muß. Ist f eine andere Lösung von (1),
so ist C̃ = f (t) exp −A(t) eine
andere Stammfunktion derselben Funktion b(t) exp −A(t) und hat daher, nach Fakt .3.2.4,
die Form C(t) + K mit einer Konstanten K. Alle Lösungen haben also die Form (4).
3.6.2. Lineare Differentialgleichungen zweiter Ordnung mit konstanten Koeffizienten. Die
Differentialgleichung hat im homogenen Fall die Form
f ′′ (t) + pf ′ (t) + q = 0
(5)
Setzt man die Lösung als
(6)
f (t) = exp(λt)
an, so ergibt sich für λ die quadratische Gleichung
λ2 + pλ + q = 0.
(7)
In den meisten Fällen hat diese zwei verschiedene Lösungen
r
p2
p
(8)
λ± = − ±
− q,
2
4
und (6) liefert
zwei Lösungen f± (t) = exp(λ± t) von (5), für die die Vektoren f+ (t), f+′ (t) und
f− (t), f−′ (t) für jedes t linear unabhängig sind. Man kann also für jedes Anfangswertproblem
(5) kombiniert mit f ′ (to ) = a, f ′ (to ) = g eine Lösung durch Linearkombination von f+ und
f− erhalten. Der Satz von Picard-Lindelöf zeigt nun, daß tatsächlich alle Lösungen von (5) auf
einem Intervall Linearkombinationen von f+ und f− sind.
Beispiel 1. Die Differentialgleichung f ′′ = f (t) hat die Lösungen f± (t) = exp(±t). Das
Anfangswertproblem f ′′ (t) = f (t), f (0) = 1, f ′ (0) = 0 wird durch f (t) = 21 f+ (t) + f− (t) =
cosh(t) gelöst.
Dabei ist es vollkommen unerheblich, ob die Zahlen λ± reell oder komplex sind.7 Allerdings
ist es im Fall reeller Koeffizienten p und q oft wünschenswert, zwei linear unabhängige rellwertige Lösungen auch dann zu benutzen, wenn λ± komplex sind. In diesem Fall, also (8) mit
p2 < 4q, sind λ± und damit auch f± komlex konjugiert zueinander, so daß auch
(9)
f0 (t) = ℑ f+ (t) = sin(ωt) exp(αt)
7Entscheidend
ist dabei freilich, daß die Exponentialfunktion auf ganz C holomorph, also komplex differenzierbar ist, so daß (.3.1.5) auch mit einer C-wertigen inneren Funktion f (x) = λx angewendet werden
kann.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
71
f1 (t) = ℜ f+ (t) = cos(ωt) exp(αt)
q
2
mit α = − p2 , ω = q − p4 die Differentialgleichung lösen. Wegen f± = f0 ± f1 läßt sich auch
aus diesen Lösungen jede andere Lösung der Differentialgleichung auf einem Intervall linear
kombinieren. Im Fall α = 0 beschreiben die Lösungen Schwingungsvorgänge, im Fall α < 0
gedämpfte Schwingungen, im Fall α > 0 Schwingungen mit Selbsterregung.
Beispiel 2.
(10)
• Die Schwingungsgleichung
f ′′ (t) = −f (t)
hat f0 (t) = sin(t), f1 (t) = cos(t) als fundamentales System von Lösungen. Gibt man die
Anfangswertbedingungen f ′ (0) = f (0) = 1 vor, so lautet die Lösung cos(t) + sin(t) =
√
2 sin(t + π4 ).
• Die Differentialgleichung
(11)
f ′′ (t) = −2f ′ (t) − 2f (t)
hat als fundamentales System von Lösungen f0 (t) = sin(t)e−t und f1 (t) = cos(t)e−t . Sie
beschreibt gedämpfte Schwingungen.
Besonderes Augenmerk verdient noch der Fall, daß (7) eine Doppellösung λ+ = λ− = λ
hat. In diesem Fall bilden
(12)
f0 (t) = t exp(λt)
f1 (t) = exp(λt)
ein fundamentales System von Lösungen. Beispielsweise ist dies im Fall der Differentialgleichung
f ′′ (t) = 0, mit λ = 0, der Fall.
Die entsprechende inhomogene Gleichung
(13)
f ′′ (t) + pf (t) + qf (t) = b(t)
kann wie im Fall einer Gleichung ersten Grades durch die Methode der Variation der Konstanten behandelt werden, wie gleich noch ausgeführt werden wird. Allerdings sind die entstehenden
Quadraturaufgaben oft nicht mehr in geschlossener und elementarer Form zu lösen, ausgenommen in Fällen, in denen eine Lösung ohnehin erraten werden kann. Dies ist beispielsweise dann
der Fall, wenn b(t) die Form
(14)
b(t) = P (t) exp(ϑt)
mit einem Polynom P hat. In diesem Fall kann eine Lösung in der Form
(15)
f (t) = Q(t) exp(ϑt)
angesetzt werden. Für den Grad von Q gelten die folgenden Bemerkungen:
• Wenn ϑ keine Lösung von (7), also exp(ϑt) keine Lösung von (5) ist, so hat Q denselben
Grad wie P .
72
• Wenn ϑ eine Lösung von (7) ist, also exp(ϑt) die homogene Gleichung (5) löst, so
spricht man vom Vorliegen eines Resonanzfalles. Wenn dieser Fall vorliegt und (7) zwei
verschiedene Lösungen hat, so gilt deg Q = deg P + 1, der Grad des Polynomes Q ist
also um 1 höher als der Grad von P .
• Wenn (7) eine doppelte Lösung hat, so ist im Resonanzfall der Grad von Q sogar um
zwei höher als der Grad von P .
Zu beachten ist, daß mit Ausnahme des dritten Falles der Ansatz (15) nicht alle Lösungen
von (13) mit der rechten Seite (14). Die allgemeine Lösung der inhomogenen Gleichung ergibt
sich in diesem Fall als Summe aus einer speziellen Lösung der inhomogenen Gleichung und der
allgemeinen Lösung der homogenen Gleichung.
Wenn die rechte Seite von (13) eine Summe von mehreren Funktionen bi ist, die die Form
(14) haben, so kann nach diesem Rezept zunächst für jedes bi eine spezielle
P Lösung fi der
entsprechendenP
inhomogenen Gleichung gefunden werden. Die Funktion f = ni=1 fi löst dann
n
(13) mit b =
i=1 bi . Insbesondere sind auf diese Weise inhomogene Störterme der Form
b(t) = sin(βt) exp(ϑt) und b(t) = cos(βt) exp(ϑt)
zugänglich, denn die rechte Seite ist eine
Linearkombination der Funktionen exp (λ ± iβ)t . In diesem Fall kann aber die Lösung auch
direkt in der Form
Q0 (t) exp(ϑt) sin(βt) + Q1 (t) exp(ϑt)
angesetzt werden. Für den Grad der Polynome gilt dabei mit geringen Abwandlungen das
vorhin Gesagte.
Beispiel 3.
• Wir betrachten die inhomogene Schwingungsgleichung
f ′′ (t) + f (t) = sin(ϑt)
(16)
Wir setzen die Lösung als f (t) = a sin(ϑt) + b cos(ϑt) an und finden das lineare Gleichungssystem (1 − ϑ)2 a = 1, b = 0. Eine Lösung im Fall ϑ 6∈ {±1} ist also durch
f (t) =
gegeben. Im Fall ϑ = ±1 ist der Ansatz
sin(ϑt)
1 − ϑ2
f (t) = (at + b) sin(t) + (ct + d) cos(t)
zu wählen. Wir finden
f ′ (t) = (a − d − ct) sin(t) + (c + b + at) cos(t)
f ′′ (t) = −(2c + b + at) sin(t) + (2a − d − ct) cos(t)
f ′′ (t) + f (t) = −2c sin(t) + 2a cos(t),
also a = 0, c = − 21 , und die allgemeine Lösung von (16) hat die Form
f (t) = b sin(t) + d −
t
cos(t).
2
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
73
• Soll f ′′ (t) + 2f ′ (t) + 2f (t) = sin(t) gelöst werden, setzt man eine spezielle Lösung dieser
inhomogenen Gleichung als f (t) = a sin(t) + b cos(t) und findet das lineare Gleichungssystem a − 2b = 1, b + 2a = 0 und a = 1/2, b = −1/4, also
sin(t) cos(t)
−
2
4
als eine spezielle Lösung der inhomomogenen Gleichung.
• Übrigens ist der soeben betrachtete Fall gerade nicht der Resonanzfall einer zu (11)
gehörenden inhomogenen Gleichung vor. Dieser würde gerade für
f (t) =
f ′′ (t) + 2f ′ (t) + 2f (t) = sin(t) exp(−t)
(17)
vorliegen. Die allgemeine Lösung kann als f (t) = (at+b) sin(t) exp(−t)+(ct+d) cos(t) exp(−t)
angesetzt werden, man findet das lineare Gleichungssystem −2c = 1, 2a = 0, also
t
f (t) = b sin(t) + (d − ) cos(t) exp(−t)]g
2
für die allgemeine Lösung von (17).
3.6.3. Variation der Konstanten für lineare Differentialgleichungssysteme erster Ordnung.
CAVE: Zu tun.
3.6.4. Variation der Konstanten für die inhomogene Schwingungsgleichung. CAVE: Zu tun.
3.6.5. Variation der Konstanten für die homogene Gleichung. Für lineare Differentialgleichungen höherer Ordnung n mit nichtkonstanten Koeffizienten ist man im Allgemeinen darauf
angewiesen, eine spezielle Lösung f der homogenen Gleichung erraten zu können. Setzt man
die allgemeine Lösung der homogenen Gleichung als C(x)f (x) an, so ergibt sich für C eine
lineare Differentialgleichung der Form
C (n) (x) + an−1 C (n−1) (x) + · · · + a1 (x)C ′ (x) = 0,
(18)
in der also der normalerweise auch vorhandene Term nullter Ordnung a0 (x)C(x) verschwindet.
Andernfalls würden ja konstante Funktionen C die Differentialgleichung (18) nicht lösen.
Es ergibt sich also eine lineare homogene Differentialgleichung (n − 1)-ter Ordnung für C ′ ,
und die Lösung der Ausgangsgleichung ist zurückgeführt auf die Lösung einer Gleichung von
um 1 kleinerer Ordnung, gefolgt von einer weiteren Quadraturaufgabe.
3.6.6. Die Bernoullische Differentialgleichung. Wenn f die lineare inhomogene Differentialgleichung (1) erfüllt und λ 6= 0 ist, so erfüllt g = f λ die Differentialgleichung8
1
g ′ (x) = λf (x)λ−1 f ′ (x) = λf (x)λ−1 a(x)f (x) + λb(x)f (x)λ−1 = λa(x)g(x) + g(x)1− λ .
Also erfüllt g eine Bernoullische Differentialgleichung
(19)
g ′ (x) = α(x)g(x) + β(x)g(x)ϑ
mit α = λa, β = λb, ϑ = 1 − λ1 . Derartige Differentialgleichungen können also auf (1) und
damit auf Quadraturaufgaben zurückgeführt werden.
8Es
werden hier formale Rechnungen vorgestellt.
74
3.6.7. Die Ricattische Differentialgleichung. Sei f 6= 0 eine Lösung der linearen homogenen
Differentialgleichung zweiter Ordnung
(20)
f ′′ (x) + p(x)f ′ (x) + q(x)f (x) = 0.
Für die logarithmische
Ableitung C(x) = f ′ (x)/f (x) ergibt sich f ′ (x) = C(x)f (x), f ′′ (x) =
C ′ (x) + C(x)2 f (x) und man erhält
C ′ (x) + C(x)2 + p(x)C(x) + q(x) f (x) = 0
aus (20). Man wird also für g auf die Ricattische Differentialgleichung
(21)
C ′ (x) + r(x)C(x)2 + p(x)C(x) + q(x) = 0
mit r = 1 geführt. Wenn eine Lösung C(x) der Gleichung (21) bekannt ist, so kann eine Lösung
f von (20) aus f ′ (x) = f (x)/C(x) ermittelt werden. Es liegt hier eine Gleichung vom Typ (1)
im homogenen Fall vor, die Lösung führt also nach Satz 1 auf eine Quadraturaufgabe.
Im Hinblick auf die enge Beziehung der Ricattischen Differentialgleichung zur linearen homogenen Differentialgleichung zweiter Ordnung und unsere Bemerkungen über (18) ist es nicht
verwunderlich, daß die Ermittlung der allgemeinen Lösung der Ricattischen Differentialgleichung auf eine Quadraturaufgabe führt, wenn eine spezielle Lösung fo von (21) erraten werden
kann. In diesem Fall nämlich führt die Ermittlung der allgemeinen Lösung von (21) auf die
Lösung der folgenden Differentialgleichung für d(x) = f (x) − fo (x):
d′ (x) + r(x)d(x)2 + 2r(x)fo (x) + p(x) d(x) = 0,
eine Bernoullische Differentialgleichung (19) mit ϑ = 2.
3.7. Gleichmäßige Konvergenz und die Vertauschbarkeit von Limes und Integral.
Definition 1. Eine Folge fn von reell- oder komplexwertigen Funktionen auf einer Menge
X konvergiert gleichmäßig gegen die gleichartige Funktion f auf X, wenn zu jedem ε > 0 ein
m mit
(1)
|fn (x) − f (x)| < ε
für x ∈ X und n > m
existiert. Man spricht auch von gleichmäßiger Konvergenz auf X.
Bemerkung 1. Offenbar ergibt sich aus der gleichmäßigen Konvergenz von fn gegen f ,
daß limn→∞ fn (x) = f (x) für alle x ∈ X gilt. Die gleichmäßige Konvergenz ist aber eine
Verschärfung dieser punktweisen Konvergenz, denn die Zahl m in (1) darf nicht von x abhängen,
wie das bei der bloßen Gültigkeit von limn→∞ fn (x) = f (x) für jedes einzelne x ∈ X der Fall
sein könnte.
Gleichmäßige Konvergenz spielt eine wichtige Rolle bei der Vertauschung von Grenzübergängen.
Als erstes Beispiel betrachten wir die Frage der Stetigkeit der Grenzfunktion.
Satz 1. Wenn X eine Teilmenge von R oder C und x ∈ X ist und wenn fn eine Folge von
an der Stelle x auf X stetigen Funktionen fn ist, welche gleichmäßig gegen f konvergiert, so
ist f an der Stelle x stetig.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
75
Beweis. Sei ε > 0 vorgegeben. Nach Definition 1 gibt es ein m mit
ε
(+)
|fn (a) − f (a)| <
3
für n ≥ m und alle a ∈ X. Auf Grund der Stetigkeit von fm gibt es ein δ > 0 mit
ε
|fm (x) − fm (y)| <
3
für alle y ∈ X mit |x − y| < δ. Für derartige y kann die obige Ungleichung kombiniert werden
mit (+) für a = x und a = y. Man erhält
ε ε ε
|f (x) − f (y)| ≤ |f (x) − fn (x)| + |fn (x) − fn (y)| + |fn (y) − f (y)| < + +
3 3 3
für y ∈ X und |x − y| < δ. Die Stetigkeit von f an der Stelle x ist damit bewiesen.
Für den Beweis des nachfolgenden Satzes benötigen wir die oft verwendete Tatsache, daß ein
Integral durch die Länge des Integrationsweges mal das Maximum des Betrages des Integranden
abgeschätzt werden kann.
Lemma 1. Sei f eine reell- oder komplexwertige Funktion auf I = [a, b] mit |f (t)| ≤ M für
t ∈ [a, b]. Wenn das Integral auf der linken Seite konvergiert, so gilt
Z b
(2)
f (t) dt ≤ (b − a)M
a
Beweis. Der Beweis ergibt sich durch Anwendung von (.3.2.11) mit Φ(t) = M .
Satz 2. Die Funktionen fn seien auf I = [a, b] definiert, und es gelte limn→∞ fn = f
gleichmäßig auf I. Wenn die fn HK-integrierbar sind, so ist auch f HK-integrierbar, und es
gilt
Z b
Z b
(3)
lim
f (t) dt
fn (t) dt =
n→∞
a
a
Beweis. Zunächst soll die Existenz des Limes auf der linken Seite von (3) gezeigt werden.
Dazu genügt nach Satz .2.2.1 der Nachweis, daß die Folge auf der rechten Seite dieser Gleichung
ε
eine Cauchy-Folge ist. Sei dazu ε > 0, es gibt nach Definition 1 ein m mit |fn (x) − f (x)| < 2(b−a)
ε
ε
für n ≥ m. Für min(k, l) ≥ m folgt dann |fk (x) − fl (x)| < b−a
. Aus (2) mit M = b−a
folgt
dann
Z b
Z b
Z b
Z b
ε
dx = ε.
fk (x) − fl (x) dx ≤
fl (x) dx = fk (x) dx −
a b−a
a
a
a
Die Folge auf der linken Seite von (3) ist also wie behauptet eine Cauchy-Folge.
Sei nun ι der Grenzwert auf der linken Seite von (3). Wir zeigen, daß das Integral auf der
rechten Seite von (3) gegen ι konvergiert. Sei dazu ε > 0 gegeben, wir wählen m mit folgenden
Eigenschaften:
Rb
• Für k ≥ m gilt ι − a fn (t) dt < 3ε .
76
• Für k ≥ m und alle x ∈ I gilt |fk (x) − f (x)| <
ein derartiges m zu wählen.
ε
.
3(b−a)
Nach Definition 1 ist es möglich,
R
b
Auf Grund der Integrierbarkeit von fm gibt es eine Eichung δ auf I mit a fm (t) dt − σ(Z, Ξ, fm ) <
ε
für jede δ-feine Zerlegung (Z, Ξ). Für derartige (Z, Ξ) gilt dann
3
Z b
Z b
fm (t) dt + fm (t) dt − σ(Z, Ξ, fm ) + |σ(Z, Ξ, fm ) − σ(Z, Ξ, f )|
|ι − σ(Z, Ξ, f )| ≤ ι −
a
a
ε ε ε
< + + = ε,
3 3 3
wobei Fakt .3.2.1 und (.3.2.12) benutzt wurden:
|σ(Z, Ξ, fm ) − σ(Z, Ξ, f )| = |σ(Z, Ξ, f − fm )| ≤ σ Z, Ξ, |f − fm | ≤ σ Z, Ξ,
ε
ε
=
3(b − a)
3
Also konvergiert das Integral auf der rechten Seite von (3) in der Tat gegen ι.
Um an dieser Stelle schon einen Überblick über die wichtigsten Sätze zur Vertauschbarkeit
von Limes und Integral zu geben, formulieren wir die beiden folgenden Sätze ohne Beweis an
dieser Stelle
Satz 3 (Satz über die monotone Konvergenz). Sei (fn ) eine monoton wachsende Folgen
Rb
reellwertiger Funktionen, für die a fn (t) dt konvergiert. Wir setzen voraus, daß die Folge fn
punktweise gegen die Funktion f konvergiert. Dann gilt
Z b
Z b
f (t) dt = lim
fn (t) dt,
n→∞
a
a
wobei beide Seiten konvergieren oder bestimmt divergieren.
Die Behauptung wird später nochmals als Theorem 4 formuliert und bewiesen. Als Folgerung daraus werden wir als Theorem 5 den folgenden Satz über die majorisierte Konvergenz
herleiten:
Satz 4 (Satz über die majorisierte Konvergenz). Sei m eine Funktion auf [a, b] mit nichtRb
negativen Funktionswerten, für die a m(t) dt konvergiert. Sei (fi )∞
i=0 eine Folge rell- oder komplexwertiger Funktionen mit |fi (t)| ≤ m(t), so daß für alle t ∈ I f (t) = limi→∞ fi (t) existiert.
Rb
Wenn die Integrale a fi (t) dt konvergieren, so gilt
Z b
Z b
fi (t) dt =
f (t) dt,
lim
i→∞
a
a
wobei sowohl der Grenzwert auf der linken als auch das Integral auf der rechten Seite konvergieren.
Es handelt sich hierbei um Sätze, die historisch zuerst im Rahmen der Lebesgueschen
Integrationstheorie bewiesen worden sind, die aber auch für das HK-Integral gültig sind.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
77
Ra
Rb
Definition 2. Sei b < a. Wir setzen a f (t) dt = − b f (t) dt, falls das letztere Integral
wohldefiniert (konvergent oder bestimmt divergent) ist.
Bemerkung 2. Aus dem zweiten Hauptsatz
der Integral- und Differentialrechnung folgt
Rb
auch für b < a die Identität f (b)−f (a) = a f ′ (t) dt, falls die Ableitung auf [min(a, b), max(a, b)]
existiert.
Satz 5. Sei fn eine Folge von auf dem Intervall I definierten und differenzierbaren Funktionen, die daselbst punktweise gegen f konvergiert. Wenn die Folge der Ableitungen fn′ gleichmäßig gegen die Funktion g konvergiert, so ist f differenzierbar auf I mit Ableitung g.
Beweis. Aus dem zweiten Hauptsatz der Integral- und Differentialrechnung folgt
Z t
fn′ (x) dx
fn (t) − fn (s) =
s
für t, s aus I. Auf Grund von Satz 2 können beim Grenzübergang n → ∞ auf der rechten Seite
Limes und Integration vertauscht werden:
Z t
Z t
′
(+)
f (t) − f (s) = lim fn (t) − fn (s) = lim
g(x) dx.
fn (x) dx =
n→∞
n→∞
s
s
Seien t ∈ I und ε > 0 vorgegeben. Wir wählen ein n mit |fn′ (x) − g(x)| < 3ε für alle x ∈ I.
Weiterhin wählen wir δ > 0 mit |fn (t) − fn (s) − fn′ (t)(t − s)| < 3ε |t − s| für alle s ∈ I mit
|s − t| < δ, das ist wegen Fakt .3.1.2 möglich. Für derartige s gilt dann
|f (t) − f (s) − g(t)(t − s)| ≤ |f (t) − f (s) − fn (t)(t − s)| + |g(t) − fn (t)| |t − s|
Z s
= g(x) dx − fn (t)(t − s) + |g(t) − fn (t)| |t − s|
Zt s
Z
ε
s ′
′
<
g(x) − fn (X) dx + fn (x) dx − fn (t)(t − s) + |t − s|
3
t
t
ε
ε
≤ |t − s| + |fn (t) − fn (s) − fn′ (t)(t − s)| + |t − s|
3
3
ε
ε
ε
≤ |t − s| + |t − s| + |t − s| = ε |t − s| ,
3
3
3
′
und auf Grund von Fakt .3.1.2 gilt f (t) = g(t).
Bemerkung 3.
• Man kann ziemlich leicht zeigen, daß unter den angegebenen Voraussetzungen auch die Folge fn gleichmäßig konvergiert.
• Die Behauptung gilt mit einem anderen Beweis sogar für die komplexe Ableitung. In
diesem Fall gilt sogar mehr: Wenn Ω ⊆ C offen ist, die Funktionen fn holomorph auf Ω
sind und gleichmäßigt daselbst gegen f konvergieren, so ist g holomorph, und die Folge
der komplexen Ableitungen fn′ konvergiert gleichmäßig gegen g ′ auf jeder beschränkten
abgeschlossenen Teilmenge von C, die in Ω enthalten ist. Es ist dies ein weiteres Beispiel
dafür, daß in der Theorie holomorpher Funktionen oft schärfere Aussagen gelten als in
der reellen Infinitesimalrechnung.
78
3.8. Der (erste) Hauptsatz der Integral- und Differentialrechnung.
Theorem 3. Jede stetige Funktion f auf einem Intervall
R t I = [a, b] hat eine Stammfunktion
F auf I. Genauer gesagt konvergiert das Integral F (t) = a f (τ ) dτ für alle t ∈ I, und F ist
eine Stammfunktion von f .
Bemerkung 1.
• Es gibt durchaus auch viele unstetige Funktionen, für die das in
Theorem 3 untersuchte Integral konvergiert. Allerdings ist es für unstetige Funktionen
meist9 nicht richtig, daß die Ableitung von F gleich f ist.
• Wir werden in drei Schritten vorgehen. Zunächst zeigen wir, daß sich bei gleichmäßiger
Konvergenz die Behauptung des Theoremes von den Gliedern fn einer Funktionenfolge
auf deren Grenzwert f vererbt. Sodann geben wir eine einfache Klasse von Funktionen
(nämlich die Polygonzüge) an, für die man eine Stammfunktion explizit konstruieren
kann, und zeigen, daß jede stetige Funktion als Limes einer gleichmäßig konvergenten
Folge von Polygonzügen geschrieben werden kann.
Fakt 1.
• Für eine Funktion f auf einem Intervall I = [a, b] sind folgende Bedingungen äquivalent:
a. Es gibt eine Stammfunktion
F von f auf I.
Rt
b. Das Integral a f (τ ) dτ konvergiert für alle t ∈ I, und F ist eine Stammfunktion
von f .
• Wenn f der Limes einer auf I gleichmäßig konvergenten Folge von Funktionen ist, für
die diese Bedingungen richtig sind, so sind sie auch für f erfüllt.
Beweis. Die erste Aussage folgt aus dem
R t zweiten Hauptsatz der Integral- und Differentialrechnung. Nach diesem Satz gilt nämlich a f (τ ) dτ = F (t) − F (a) unter den Voraussetzungen
von a. Diese Funktion ist differnzierbar mit Ableitung F ′ = f , also gilt b. Daß umgekehrt a.
aus b. folgt, ist trivial.
Zum zweiten Punkt bemerkt man, daß sich die Bedingung b. aus dem ersten auf Grund
von Satz .3.7.2 und Satz .3.7.5 auf Limites gleichmäßig konvergenter Funktionenfolgen vererbt,
deren Glieder diese Bedingung erfüllen.
Definition 1. Ein Polygonzug ist eine Funktion f auf I, für die eine Zerlegung Z von I
in Teilintervalle Ik = [ak−1 , ak ], a = a0 < a1 · · · < an existiert, so daß f auf [ak−1 , ak ] die Form
f (t) = λk t + µk hat.
Satz 1. Für jeden Polygonzug auf einem Intervall I gibt es eine Stammfunktion. Jeder
Polygonzug erfüllt daher die äquivalenten Bedingungen aus Fakt 1
Beweis. Wir führen den Beweis durch Induktion nach n. Im Fall n = 1 ist f (t) = λ1 t + µ1
ein Polynom erster Ordnung, und eine Stammfunktion ist durch F (t) = λ21 t2 + µ1 t gegeben.
Sei n > 1 und die Behauptung bewiesen für Polygonzüge, die aus weniger als n Strecken
9Aber
nicht immer: Notwendig und hinreichend für F ′ = f auf ganz I ist, daß jedes Element von I ein
soganannter Lebesgue-Punkt von f ist. Diese Bedingung wird von den meisten Standardbeispielen für unstetige
Funktionen verletzt, ist aber schwächer als die Stetigkeit
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
79
zusammengesetzt sind. In den Bezeichungen der Definition sei I1 = [a, an−1 ], I2 = [an−1 , b],
fk = f |Ik . Auf Grund der Induktionsannahme hat f1 eine Stammfunktion F1 . Sei
(
F1 (t)
t ∈ I1
F (t) =
µn
2
F1 (an−1 ) + λn (t − an−1 ) + 2 (t − an−1 ) t ∈ I2 ,
wobei im Fall t = an−1 beide Alternativen genommen werden können und zu demselben Ergebnis führen. Der untere Zweig der Fallunterscheidung definiert offenbar eine Stammfunktion
F2 für f2 . Nach Fakt .3.1.1 ist F differenzierbar auf I mit Ableitung f .
Satz 2. Jede stetige Funktion f auf einem abgeschlossenen Intervall I ist Limes einer
gleichmäßig konvergenten Folge von Polygonzügen.
Beweis. Es genügt, zu jedem ε > 0 einen Polygonzug fε mit |f (x) − fε (x)| < ε auf ganz
I zu finden, denn dann konvergiert die Folge der Polygonzüge f2−n gleichmäßig gegen f .
Zur Konstruktion von fε wählen wir für jedes x ∈ I eine Zahl δ(x) > 0 mit |f (x) − f (t)| < 2ε
für alle t ∈ I mit |t − x| < δ(x). Dann ist δ eine Integraleichung, und nach Fakt .3.2.2 existiert
eine δ-feine Zerlegung a = a0 ≤ ξ1 ≤ a1 ≤ ξ2 ≤ a2 ≤ . . . ≤ ξn ≤ an = b von I. Wir definieren
fε durch
(x − ak−1 )f (ak ) + (ak − x)f (ak−1 )
fε (x) =
ak − ak−1
für x ∈ [ak−1 , ak ]. Für x = al mit 0 < l ≤ n liefern offenbar k = l und k = l − 1 denselben
Funktinswert, fε ist also wohldefiniert. Für x ∈ [ak−1 , ak ] gilt
ε
|fε (x) − f (x)| ≤ |fε (x) − f (ξk )| + |f (x) − f (ξk )| < |fε (x) − f (ξk )| +
2
(x − ak−1 ) f (ak ) − f (ξk ) + (ak − x) f (ak−1 ) − f (ξk )
ε
+
=
ak − ak−1
2
ak − x
ε
x − ak−1
|f (ak ) − f (ξk )| +
|f (ak−1 − f (ξk )| +
≤
ak − ak−1
ak − ak−1
2
ak − x
ε ε
x − ak−1 ε
· +
· + = ε,
≤
ak − ak−1 2 ak − ak−1 2 2
also leistet fε in der Tat das Gewünschte.
Wie bereits erklärt (Bemerkung 1), ergibt sich das Theorem aus den beiden Sätzen und
Fakt 1.
Bemerkung 2. Auch hier seien einige Bemerkungen über die analoge Aussage für komplexe Ableitungen und Stammfunktionen gestattet, obwohl dies kein zentraler Punkt der Vorlesung ist.
Wie schon erwähnt (Bemerkung .3.1.1), gilt in der komplexen Differentialrechnung der
Satz, daß die Ableitung einer holomorphen Funktion wieder holomorph ist. Man hat also nur
für holomorphe Funktionen f auf einer offenen Teilmenge Ω ⊆ C überhaupt eine Chace, eine
komplexe Stammfunktion F zu finden, also eine holomorphe Funktion F auf Ω mit F ′ = f .
80
Hinzu kommt noch ein weiteres Problem, wenn das Gebiet Ω Löcher“ hat. Ein Beispiel dafür
”
ist Ω = C \ {0}. Auf Ω ist f (z) = z1 holomorph. Man kann aber zeigen, daß keine auf ganz Ω
holomorphe Funktion F mit komplexer Ableitung f existiert. Die Nichtexistenz derartiger F
ist eng verwandt mit den Schwierigkeiten bei der Definition des komplexen Logarithmus, der
ja auch nicht auf ganz C \ {0} stetig ist, sondern erst nach Aufschlitzen“ von C entlang einer
”
Halbachse durch {0}. Auf einer derart aufgeschlitzten Ebene ist der komplexe Logarithmus
dann eine komplexe Stammfunktion von f (z) = z1 .
Für die Existenz einer komplexen Stammfunktion ist also die Bedingung der Stetigkeit von
f zur Bedingung der Holomorphie von f zu verschärfen. Dazu kommen noch Bedingungen an
das Gebiet Ω, die zum Beispiel für konvexe Teilmengen von C stets erfüllt sind, nicht aber für
Gebiete mit Löchern“.
”
3.9. Potenzreihen und die Taylorsche Formel.
Satz 1 (Taylorsche Formel mit dem Restglied in Integralform). Sei k ≥ 0. Wenn die
Funktion f (k + 1)-mal differenzierbahr auf einem Intervall ist, das die reellen Zahlen x und
x + h enthält, so gilt
Z
k
X
hj (j)
1 h (k+1)
(1)
f (x + h) =
f (x) +
f
(x + η)(h − η)k dη.
j!
k! 0
j=0
Beweis. Im Fall k = 0 handelt sich bei der Behauptung letzlich um den zweiten Hauptsatz
der Integral- und Differentialrechnung Theorem 1. Wir können also durch Induktion nach k
vorgehen, mit dem Fall k = 0 als Induktionsanfang. Der Induktionscschluß ergbit sich durch
die partielle Integration (Satz .3.4.1)
Z h
Z h
(k+1)
k
(k+1)
k+1
f (k+2) (x + η)(h − η)k+1 dη.
f
(x + η)(h − η) dη = f
(0)h
+
(k + 1)
0
0
Satz 2 (Mittelwertsatz der Integralrechnung). Die Funktion g auf I = [a, b] sei reellwertig
und stetig. Sei weiterhin
w eine Funktion auf I mit nichtnegativen reellen Funktionswerten,
Rb
für die das Integral a w(t) dt konvergiert. Dann gibt es ein ξ ∈ I mit
Z b
Z b
w(t) dt.
g(t)w(t) dt = g(ξ)
(2)
a
a
Beweis. Wir setzen Rhier stillschweigend voraus, daß das Integral auf der linken Seite von
b
(2) konvergiert und µ = a w(t) dt nicht verschwindet.10
10Bei
den in diesem Kapitel vorgestellten Anwendungen ist w meist ebenfalls stetig, so daß die Konvergenz
der linken Seite von (2) aus dem ersten Hauptsatz der Integral- und Differentialrechnung folgt. Auch wird in diesen Fällen klar sein, daß µ 6= 0 gilt. Wir werden diese Lücken im Beweis des Satzes später in Bemerkung .3.14.3
schließen
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
81
Nach Satz .2.4.6 existieren M = max g(x) x ∈ I und m = min g(x) x ∈ I . Nach
Rb
(.3.2.9) gilt µ > 0 und µm ≤ a g(x)w(x) dx ≤ µM .11 Wir erhalten
Z
1 b
g(x)w(x) dx ≤ M.
m≤
µ a
Nach dem Zwischenwertsatz für stetige Funktionen (Satz .2.4.3) gibt es ein ξ ∈ I mit
Z
1 b
g(x)w(x) dx = g(ξ).
µ a
Bemerkung 1. Für komplexwertige
g ist die Behauptung falsch. Beispielsweise gilt für
Rb
g(t) = exp(it), a = 0, b = 2π a g(t) dt = 0, während kein ξ mit g(ξ) = 0 existiert, im
Widerspruch zu Satz 2 mit w(x) = 1.
Durch Anwendung des Mittelwertsatzes der Integralrechnung auf das Restglied in (1), mit
g(η) = f (k+1) (η), w(η) = (h − η)k , ergibt sich
Folgerung 1 (Taylorsche Formel mit dem Restglied von Lagrange). Sei k ≥ 0. Wenn die
Funktion f reellwertig und (k + 1)-mal stetig differenzierbahr auf einem Intervall ist, das die
reellen Zahlen x und x + h enthält, so gilt
(3)
f (x + h) =
k
X
hj
j=0
j!
f (j) (x) +
hk+1 (k+1)
f
(η)
(k + 1)!
mit einer Zahl η, die zwischen x und x + h liegt (also η ∈ [min(x, x + h), max(x, x + h)]).
Aus ähnlichen Gründen wie früher (Bemerkung 1) ist man auch im Fall des Restgliedes
von Lagrange gezwungen, sich auf den Fall rellwertiger Funktionen zu beschränken. Dasselbe
gilt für den Mittelwertsatz der Differentialrechnung, der (abgesehen von den bei uns etwas
schärferen Voraussetzungen) der Spezialfall k = 0 von (1) ist.
Folgerung 2 (Spezialfall des Mittelwertsatzes der Differentialrechnung). Die Funktion f
sei reellwertig und stetig differenzierbar auf I = [a, b] mit a < b, dann existiert ein ξ ∈ I mit
f (b) − f (a)
= f ′ (ξ).
b−a
(4)
Der Beweis ergibt sich durch Anwendung von (3) mit k = 0 und Auflösung der enstehenden
Gleichung nach f ′ (xi).
Bemerkung 2.
• Der Mittelwertsatz der Differentialrechnung bleibt richtig unter der
schwächeren Voraussetzung, daß f stetig auf [a, b] und differenzierbar auf (a, b) ist, wobei
unter diesen Voraussetzungen die Existenz eines ξ ∈ (a, b) mit (4) gezeigt werden kann.
11Beispielsweise
g(x)w(x) ≤ M w(x)
ergibt sich
Rb
a
g(x)w(x) dx ≤ µM durch Anwendung von (.3.2.9) auf die Ungleichung
82
• In den gängigen Lehrbüchern der Infinitesimalrechnung pflegt man Sätze wie Folgerung .3.2.1 oder den Satz über die Eindeutigkeit der Stammfunktion bis auf eine Integrationskonstente aus dem Mittelwertsatz der Differentialrechnung herzuleiten. Da
wir in unserem Text auf der HK-Integration aufbauen, steht der zweite Hauptsatz der
Integral- und Differentialrechnung in großer Allgemeinheit zur Verfügung, so daß wir
die Behandlung des Mittelwertsatzes der Differentialrechung aufschieben konnten und
uns auch nicht gezwungen sehen, diesen Satz in der größtmöglichen Allgemeinheit zu
beweisen.
• Ähnlich wie beim ersten Punkt gilt auch (3) unter der schwächeren Voraussetzung, daß
f k-mal differenzierbar auf dem Intervall von x bis x + h, f (k) stetig daselbst ist und
die Ableitung f (k+1) auf dem offenen Intervall von x bis x + h existiert.
Bemerkung 3. Neben dem soeben beschriebenen Restglied von Lagrange gibt es noch
andere Restglieder in der Taylorschen Formel für reellwertige f . Durch Anwendung des Mittelwertsatzes der Integralrechnung auf das Restglied in (1) mit g(η) = f (k+1) (η)(h − η)k−p ,
w(η) = (h − η)p mit −1 < p ≤ k, h > 0 erhält man des Restglied von Schlömilch, die Spezialfälle p = k − 1 bzw. p = k sind das Restglied von Cauchy bzw. das vorhin beschriebene
Restglied von Lagrange. Wir gehen nicht auf die Details ein.
Die Taylorsche Formel wirft die Frage auf, ob für k → ∞ das Restglied gegen 0 konvergiert,
also
∞
X
f (k) (xo )
(5)
f (x) =
(x − xo )k
(x − xo )k
k!
k=0
wenigstens für solche x gilt, die genügend nahe bei xo liegen. Offenbar handelt es sich bei (5)
um eine Reihe, deren Summanden die Form ak (x − xo )k haben. Derartige Reihen nennt man
Potenzreihe, und wir wollen zunächst die Frage des Konvergenzverhaltens derartiger Reihen
untersuchen.
Satz 3. Sei
∞
X
(6)
k=0
ak (x − xo )k
eine Potenzreihe. Dann gibt es ein R ∈ [0, ∞] so daß diese Reihe für |x − xo | < R konvergiert
und für |x − xo | > R divergiert. Es gilt
1
p
(7)
R=
,
lim supn→∞ n |an |
diese Zahl wird der Konvergenzradius der Potenzreihe genannt.
Für ρ ∈ [0, R) konvergiert (6) gleichmäßig für |x − xo | ≤ ρ. Weiterhin hat die gliedweise
differenzierte Potenzreihe
∞
X
(8)
(k + 1)ak+1 (x − xo )k
k=0
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
83
denselben Konvergenzkreis und konvergiert in dessen Inneren gegen die Ableitung von (6).
Beweis. Sei A ∈ [0, ∞] der lim sup in (7), und sei 0 < ρ < R. Wir wollen zeigen, daß (6)
in der Region |x − xo | ≤ ρ gleichmäßig konvergiert.pDazu wählen wir ein ρ̃ ∈ (ρ, R) und setzen
Ã = ρ̃1 . Dann gilt Ã > A, nach Fakt .2.2.4 gilt also n |an | ≤ Ã oder |an | ≤ Ãn für alle genügend
großen n. Für |x − xo | ≤ ρ gilt dann
ρ n
n
n n
.
|an (x − xo ) | ≤ ρ Ã =
ρ̃
Für derartige x hat also (6) die zu q = ρρ̃ ∈ (0, 1) gehörende konvergente geometrische Reihe
als Majorante und konvergiert daher. Wegen
∞
∞
l
∞
X
X
X
X
q l+1
k
k
k
k
→0
a
(x
−
x
)
−
a
(x
−
x
)
=
a
(x
−
x
)
≤
q
=
k
o
k
o k
o 1
−
q
k=0
k=0
k=l+1
k=l+1
für k → ∞ erfolgt die Konvergenz von (6) sogar gleichmäßig auf {x| |x − xo | ≤ ρ}. Da dies für
alle ρ < R gilt, konvergiert (6) für |x − xo | < R.
p
1
n
|an | ≥ Ã
.
Dann
gilt
Ã
>
A.
Nach
Fakt
.2.2.4
gilt
also
Sei |x − xo | > R und Ã = |x−x
o|
oder |an | ≥ Ãn für unendlich viele n. Für derartige n gilt dann |(x − xo )n an | ≥ 1. Die Folge
der Summanden in (6) kann also nicht gegen 0 konvergieren, folglich (Satz .2.1.7) divergiert
(6).
Es verbleibt der Nachweis, daß (6) und die formal differenzierte Reihe
∞
X
(+)
(k + 1)ak+1 (x − xo )k
k=0
denselben Konvergenradius haben. Durch Multiplikation von (+) mit x − xo entsteht
∞
X
(%)
kak (x − xo )k .
k=0
Diese Reihe und (+) haben also dasselbe Konvergenzverhalten, denn für x 6= xo ändert Multiplikation mit x − xo nichts an Konvergenz
oder Divergenz p
und für x = xo konvergieren
beide
p
√
Reihen ohnehin. Wegen limk→∞ k k = 112 gilt lim supk→∞ k |ak | = lim supk→∞ k |kak |, nach
(7) haben also (%) und (6), und damit auch (+) und (6), wie behauptet denselben Konvergenzradius.
Bemerkung 4. Zusammen mit den von uns bewiesenen bzw. (im komplexen Fall) ohne
Beweis formulierten Fakten über die Vertauschbarkeit von Limes und Ableitung bei gleichmäßiger Konvergenz folgt, daß eine Potenzreihe (6) mit Konvergenzradius R für |x − xo | < R eine
beliebig oft differenzierbare (bzw. holomorphe) Funktion definiert und gliedweise differenziert
werden kann.
p
p
√
√
k
k
k =1
Beispiel gilt
k − 1 ≤ √1k auf Grund der Bernoullischen Ungleichung, also limk→∞
p
√
√ 2
k
k
und damit limk→∞ k = limk→∞
k = 1.
12Zum
84
In der reellen Differentialrechung kann man keine allgemein gültigen Konvergenzaussagen
für (5) formulieren und auch nicht beweisen, daß die Taylorreihe (5) im Fall ihrer Konvergenz
wirklich gegen f (x) konvergiert.
Bemerkung 5.
• Nach einem Satz von E. Borel kann man jede Potenzreihe (6) mit
rellem xo als Taylorreihe (5) einer auf ganz R beliebig oft differenzierbaren Funktion
darstellen. Insbesondere
P∞ k k gilt das auch für Potenzreihen mit Konvergenzradius 0, wie
zum Beispiel
k=0 k x . Reelle Differenzierbarkeitseigenschaften alleine reichen also
nicht aus, um nichttriviale (x 6= xo ) Konvergenzaussagen für (5) zu zeigen.
• Sei
(
e−1/t t > 0
f (t) =
0
t≤0
Man kann zeigen, daß f auf ganz R beliebig oft differenzierbar ist und daß alle Ableitungen f (k) (t) für t ≤ 0 verschwinden. Die Taylorreihe von f an der Stelle x = xo
hat also verschwindende Koeffizienten. Sie konvergiert daher überall, aber es gibt keine
Umgebung von 0, auf der sie überall gegen den richtigen“ Wert f (x) konvergiert, da f
”
auf keiner Umgebung von 0 identisch verschwindet.
Um mit Mitteln der rellen Differentialrechnung Konvergenzaussagen für (5) zu zeigen, reicht
es also nicht, die Existenz aller höheren Ableitungen von f zu fordern. Man muß zusätzlich
Wachstumseigenschaften dieser Ableitungen in Abhängigkeit von k kennen, um für irgendeine
Form des Restgliedes zu zeigen, daß dieses für k → ∞ gegen 0 strebt. Bequemer ist es meist,
den folgenden Satz der komplexen Analysis zu zitieren:
Bemerkung 6. Sei Ω ⊆ C offen und f holomorph auf Ω. Sei xo ∈ Ω, so daß der Kreis K =
x |x − xo | < R in Ω enthalten ist. Dann gibt es eine Potenzreihe (6), die für |x − xo | < R
gegen f (x) konvergiert. Diese Reihe stimmt mit der Taylorreihe (5) für f überein.
3.10. Einige Eigenschaften des Henstock-Kurzweil-Integrales. Uneigentliche Integrale. Wir wollen einige über den ersten Hauptsatz der Integral- und Differentialrechnung
hinausgehende Sätze über die Konvergenz von HK-Integralen zeigen, auf den Begriff uneigent”
liches Integral“ eingehen und den Beweis der Sätze über die monotone und die majorisierte
Konvergenz vorbereiten.
Wir beginnen mit dem folgenden Satz, der als eine Version für Integrale des Satzes über
die Konvergenz von Cauchyfolgen aufgefaßt werden kann:
Rb
Satz 1. Für eine Funktion auf I = [a, b] konvergiert a f (t) dt genau dann, wenn für jedes
ε > 0 eine Eichung δ mit
(1)
σ(Z, Ξ, f ) − σ(Z̃, Ξ̃, f ) ≤ ε
für zwei δ-feine Zerlegungen (Z, Ξ) und (Z̃, Ξ̃) von I existiert.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
85
Beweis. Sei für k ∈ N δ k eine Integraleichung, so daß (1) mit ε = 2−k (und δ k -feine
Zerlegungen) gilt. Wir dürfen δ k+1 ≤ δ k annehmen, denn
sonst ersetzt man einfach die Folge
der δ k durch die Folge der δ̃ k (x) = min δ 0 (x), . . . , δ k (x) .
Sei (Zk , Ξk ) eine δ k -feine Zerlegung von I und ik = σ(Zk , Ξk , f ). Dann gilt
|ik − il | ≤ 2− min(k,l)
(+)
auf Grund von (1), denn (Zk , Ξk ) und (Zl , Ξl ) sind beide δ min(k,l) -fein. Wegen (+) ist ik eine
Rb
Cauchyfolge. Sei i = limk→∞ ik . Dann konvergiert a f (t) dt gegen i. In der Tat, sei ε > 0
gegeben. Wir wählen ein k ∈ N mit 2−k < 2ε . Ist (Z, Ξ) δ k -fein, so gilt
|σ(Z, Ξ, f ) − ik | ≤ 2−k
auf Grund von (1). Aus (+) folgt aber i − ik ≤ 2−k , also
|σ(Z, Ξ, f ) − i| ≤ 21−k < ε,
Rb
und die Konvergenz von a f (t) dt gegen i ist gezeigt.
Zum Beweis der Notwendigkeit wählt man für jedes ε > 0 eine Eichung δ mit
Z b
ε
<
f
(t)
dt
−
σ(Z,
Ξ,
f
)
2
a
für jede δ-feine Zerlegung. Diese Eichung erfüllt offenbar (1).
Als Folgerung erhalten wir:
Satz 2. Sei f eine Funktion auf I = [a, b]. Wenn J = [c, d] in I enthalten ist und f auf I
integrierbar ist, so ist f auch auf J integrierbar.
Beweis. Sei ε > 0 und δ eine Eichung auf I mit (1). Seien (Z′ , Ξ′ ) und (Z′′ , Ξ′′ ) δ-feine
Zerlegungen von [a, c] und [d, b]. Wenn (Zk , Ξk ), k ∈ {1; 2}, zwei δ-feine Zerlegungen von [c, d]
sind, so sind
(Z̃k , Ξ̃k ) = (Z′ , Ξ′ ) ◦ (Zk , Ξk ) ◦ (Z′′ , Ξ′′ )
zwei δ-feine Zerlegungen von I. Auf Grund der Bedingung (1) an δ gilt also
σ(
Z̃
,
Ξ̃
,
f
)
−
σ(
Z̃
,
Ξ̃
,
f
)
< ε.
1
1
2
2
Nach (.3.2.6) gilt aber
σ(Z̃k , Ξ̃k , f ) = σ(Z′ , Ξ′ , f ) + σ(Zk , Ξk , f ) + σ(Z′′ , Ξ′′ , f ),
und es folgt σ(Z̃1 , Ξ̃1 , f ) − σ(Z̃2 , Ξ̃2 , f ) = |σ(Z1 , Ξ1 , f ) − σ(Z2 , Ξ2 , f )| < ε. Folglich ist (1)
auch für δ |J erfüllt, und der vorige Satz ergibt die Konvergenz des Integrales über J.
Bemerkung 1. Für bestimmt divergente Integrale ist der Satz falsch, wie man ziemlich
leicht einsieht: Aus der bestimmten Divergenz des Integrales von a nach b kann über das
Integral über das kleinere Teilstück nur gefolgert werden, daß es nicht in die entgegengesetzte
Richtung bestimmt divergiert.
86
Ähnlich wichtig ist der Satz, daß umgekehrt die Integrierbarkeit von Funktionen auf den
Teilstücken einer endlichen Zerlegung des Intervalles in Teilintervalle überprüft werden kann:
Satz 3. Sei a < b < c. Dann gilt
Z c
Z b
Z c
f (t) dt =
f (t) dt +
f (t) dt,
a
a
b
wobei das Integral auf der linken Seite genau dann konvergiert, wenn beide Summanden auf
der rechten Seite konvergieren.
Zur Vorbereitung des Beweises benötigen wir eine Definition:
Definition 1. Wir nennen eine Integraleichung ε-fein für f auf I, wenn
Z b
≤ε
(2)
f
(t)
dt
−
σ(Z,
Ξ,
f
)
a
für jede δ-feine Zerlegung (Z, Ξ) von I = [a, b] gilt. Wenn (Z, Ξ) eine δ-feine Zerlegung ist,
nennt man die Differenz
Z b
f (t) dt − σ(Z, Ξ, f )
(3)
a
eine δ-Diskrepanz von f auf I.
Bemerkung 2. Offenbar ist δ genau dann ε-fein für f auf I, wenn |d| ≤ ε für jde δDiskrepanz d von f auf I gilt.
Offenbar hat die Integrierbarkeit einer Funktion auf einem Intervall zur Folge, daß für jedes
ε > 0 eine ε-feine Eichung existiert. Wir können nun den Beweis des Satzes führen.
Rb
Rc
Beweis. Sei I = [a, b], I1 = [a, c], I2 = [b, c], ι1 = a f (t) dt, ι2 = c f (t) dt. Sei ε > 0. Für
k ∈ {1; 2} sei δ k eine εk -feine Integraleichung für f auf Ik , wobei ε1 und ε2 positive Zahlen mit
ε = ε1 + ε2 sind, zum Beispiel ε1 = ε2 = 2ε . Wir definieren eine Integraleichung δ auf I durch


min δ 1 (t), c − t a ≤ t < c
(4)
δ(t) = min δ 1 (t), δ 2 (t) t = c

min δ (t), t − c c < t ≤ d
2
Sei (Z, Ξ), gegeben durch a0 ≤ ξ1 ≤ a1 ≤ . . . ≤ ξn ≤ an , eine δ-feine Zerlegung von I. Nach
dem nachfolgenden Fakt 1 kommt c unter den Stützstellen ξ1 , . . . , ξn vor, es gibt also ein k mit
0 ≤ k ≤ n und ξk = c. Wir haben Zerlegungen (Zk , Ξk ) von Ik , die durch a0 ≤ ξ1 ≤ a1 ≤
. . . ≤ ξk ≤ cP
für k = 1 sowie c ≤ ξk ≤ a1 ≤ . . . ≤ ξn ≤ an für k = 2 gegeben sind. Es gilt
σ(Z, Ξ, f ) = 2k=1 σ(Zk , Ξk , f ),13 also
|ι1 + ι2 − σ(S, Ξ, f )| ≤
2
X
k=1
|ιk − σ(S, Ξk , f )| ≤ ε1 + ε2 = ε,
13Mit einem ähnlichen Beweis wie (.3.2.6), wobei aber zu beachten ist, daß nicht (Z, Ξ) = (Z , Ξ ) ◦ (Z , Ξ )
1
1
2
2
gilt, da das k-te Teilintervall von Z unter Z1 und Z2 aufgeteilt wird.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
und es ergibt sich die Konvergenz von
Rb
a
f (t) dt gegen ι1 + ι2 .
87
Die folgende Folgerung aus dem Beweis von Satz 3 wird im Folgenden noch nützlich sein:
Folgerung 1. Sei I = [a, b], a < c < b, und sei I˜ eines der Intervalle I1 = [a, c] oder
I2 = [b, c]. Unter den Voraussetzungen von Satz 3 an f existiert für beliebige positive Zahlen
˜
˜
ε̃ < ε und jede ε̃-feine Integraleichung
δ̃ auf I mit δ̃(t) < |t − c| für alle t ∈ I \ {c} eine ε
.
= δ̃ I\{c}
feine Integraleichung δ auf I mit δ I\{c}
˜
˜
Beweis. Wir betrachten zum Beispiel den Fall I˜ = I1 . Wir setzen ε1 = ε̃, ε2 = ε − ε̃,
δ 1 = δ̃. Sei δ 2 eine beliebige ε2 -feine Integraleichung auf I2 . Sei δ Eichung (4). Dann ist δ
ε-fein,
wie beim
Beweis von Satz 3 gezeigt wurde, und aus unserer Voraussetzung an δ̃ folgt
.
= δ̃ I\{c}
δ I\{c}
˜
˜
Bemerkung 3. Eine zu Satz 3 analoge Aussage gilt auch für bestimmt divergente Integrale.
Die linke Seite ist wohldefiniert (konvergent oder bestimmt divergent) genau dann, wenn die
Summanden auf der rechten Seite beide konvergieren oder bestimmt divergieren und nicht in
unterschiedliche Richtungen bestimmt divergieren.
Fakt 1. Sei c ∈ I = [a, b] und δ eine Integraleichung auf I mit δ(t) < |c − t| für t ∈ I \ {c}.
Ist die durch a = a0 ≤ ξ1 ≤ a1 ≤ . . . ≤ ξn = an gegebene Zerlegung (Z, Ξ) von I δ-fein, so gibt
es ein k mit 1 ≤ k ≤ n und ξk = c.
Wir stellen nun einige Fakten über Diskrepanzen und die Feinheit von Integraleichungen
auf Teilintervallen bereit.
Satz 4.
• Sei I = [a, b], a ≤ c ≤ b, I1 = [a, c], I2 = [c, d]. Wenn dk eine δ-Diskrepanz
für f auf Ik ist, so ist d1 + d2 eine δ-Diskrepanz für f aufRI.
b
• Wenn f eine auf I = [a, b] definierte Funktion ist, für die a f (t) dt konvergiert, so gibt
es für jedes ε > 0 und jede Integraleichung δ auf I eine δ-Diskrepanz d für f auf I mit
|d| < ε.
• Wenn δ eine Integraleichung auf I und J ein abgeschlossenes Teilintervall von I ist, so
gibt es zu jeder
δ |J -Diskrepanz d von f und jedem δ > 0 eine δ-Diskrepanz d˜ von f auf
I, so daß d − d˜ < δ gilt. Wenn δ eine ε-feine Eichung für f auf I ist, so ist δ |J eine
ε-feine Eichung für f auf J.
Beweis. Zum Beweis des ersten Punktes betrachten wir δ |Ik -feine Zerlegungen (Zk , Ξk )
Rb
von Ik mit dk = akk f (t) dt − σ Zk , Ξk , f |Ik , wobei wir a1 = a, a2 = b1 = c, b2 = b gesetzt
haben. Dann ist (Z, Ξ) = (Z1 , Ξ1 ) ◦ (Z2 , Ξ2 ) eine δ-feine Zerlegung von I, und nach Satz 3 und
(.3.2.6) gilt
Z b2
Z b1
f (t) dt − σ Z2 , Ξ2 , f |I2
f (t) dt − σ Z1 , Ξ1 , f |I1 +
d1 + d2 =
a1
a2
88
=
Z
a
b
f (t) dt − σ(Z, Ξ, f ),
also ist d1 + d2 eine δ-Diskrepanz für f auf I wie im ersten Punkt behauptet.
Zum Beweis des zweiten sei ε > 0 vorgegeben, dann wählt man eine ε-feine Eichung δ̃
für f . Eine min(δ, δ̃)-feine Zerlegung des Intervalles ist dann auch δ-fein und liefert dann eine
Diskrepanz für f vom Betrag ≤ ε.
Zum Beweis des dritten Punktes sei J = [c, d], K1 = [a, c], K2 = [d, b]. Dann ist I die
Vereinigung der Intervalle K1 , J und K2 , die sich nur in ihren Randpunkten schneiden. Nach
δ
˜
dem zweiten
Punkt
gibt es δ |Kl -Diskrepanzen dl für f auf Kl mit |dl | < 2 . Sei d = d1 + d + d2 .
Dann gilt d − d˜ = |d1 + d2 | < δ, und durch zweimalige Anwendung des ersten Punktes sieht
man, daß d˜ eine δ-Diskrepanz für f auf I ist. Der letzte Teil des letzten Punktes folgt nun aus
Bemerkung 2.
Satz 5. Wenn f integrierbar auf I = [a, b] ist, so ist
Z t
F (t) =
f (τ ) dτ
a
stetig auf I.
Beweis. Sei ε > 0 und sei δ eine 2ε -feine Integraleichung für f auf I. Sei t ∈ I und
ε .
(+)
|s − t| < min δ(t),
2 |f (t)|
Dann gilt
(*)
|F (s) − F (t)| < ε.
Im Fall s > t ist nämlich durch a0 = t = ξ1 < a1 = s eine δ-feine Zerlegung (Z, Ξ) von [t, s]
mit σ(Z, Ξ, f ) = (s − t)f (t) gegeben. Auf Grund von (+) gilt |σ(Z, Ξ, f )| < 2ε . Nach Satz 4 ist
δ 2ε -fein für f auf diesem Intervall, also gilt
Z s
ε ε
|F (s) − F (t)| = f (τ ) dτ − σ(Z, Ξ, f ) + |σ(Z, Ξ, f )| < + = ε.
2 2
t
Im Fall s < t betrachten wir analog dazu die Zerlegung (Z, Ξ) von [s, t] mit einem Teilstück
und t als Stützstelle. Diese ist wegen (+) δ-fein, und wie zuvor folgt |σ(Z, Ξ, f )| < 2ε aus (+).
Man erhält
Z t
ε ε
|F (s) − F (t)| = f (τ ) dτ − σ(Z, Ξ, f ) + |σ(Z, Ξ, f )| < + = ε.
2 2
s
In beiden Fällen ist also (*) bewiesen, und der Fall s = t ist trivial.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
89
Satz 6 (Satz von Hake). Die Funktion f sei auf I = [a, b] definiert. Wenn
alle α ∈ (a, b) konvergiert, so gilt
Z b
Z b
(5)
f (t) dt = lim
f (t) dt,
α↓a
a
Rb
α
f (t) dt für
α
wobei der Limes auf der rechten Seite genau dann konvergiert, wenn das Integral auf der linken
Seite konvergiert.
Ählich gilt
Z β
Z b
f (t) dt.
f (t) dt = lim
(6)
β↑b
a
a
Beweis. Wir beweisen nur die erste Aussage, der Beweis der zweiten geht analog dazu.
Sei dabei ι der Grenzwert auf der rechten Seite von (5).
Sei ε > 0 vorgegeben. Wir wählen eine Zahl δ > 0 mit
Z b
ε
f (t) dt <
(*)
ι −
3
α
für a < α < min(b, a + δ). Wir dürfen zusätzlich δ als so klein annehmen, daß
(%)
3δ |f (a)| < ε
gilt. Nach dem nachfolgenden Lemma 1 existiert
eine Funktion δ auf (a, b] mit positiven Funk
ε
tionswerten, so daß für jedes α ∈ (a, b] δ [α,b] 3 -fein ist. Wir dürfen noch annehmen, daß
(+)
δ(t) < t − a
für t ∈ (a, b]
gilt, andernfalls ersetz man δ(t) durch min( t−a
, δ(t)). Wir dehnen δ zu einer Integraleichung
2
auf [a, b] aus, indem wir δ(a) = δ setzen.
Sei (Z, Ξ), gegeben durch a = a0 ≤ ξ1 ≤ a1 ≤ ξ2 . . . ≤ ξn ≤ an = b, eine δ-feine Zerlegung
von I. Wir wollen
(@)
|ι − σ(Z, Ξ, f )| ≤ ε
zeigen, woraus dann unsere Behauptung folgt. Wir dürfen dabei a1 > a annehmen, denn sonst
kann man ohne Änderung der Riemannschen Summe die Anfangsstücke streichen. Weiter gilt
ξ0 = a0 , denn sonst wäre δ(ξ0 ) < ξ0 − a auf Grund von (+). Sei (Z′ , Ξ′ ) die durch a1 ≤ ξ2 . . . ≤
ξn ≤ an definierte Zerlegung von I ′ = [a1 , b], dann gilt σ(Z, Ξ, f ) = (a1 − a)f (a) + σ(Z′ , Ξ′ , f ′ ).
Es gilt also
Z b
Z b
′
′
′
f (t) dt − ι
f (t) dt + |σ(Z, Ξ , f ) − ι| ≤ |(a1 − a)f (a)| + σ(Z , Ξ , f ) −
a1
a1
ε ε ε
≤ + + = ε,
3 3 3
und (@) folgt. Wir haben auf der unteren Zeile nacheinander (%), die 3ε -Feinheit von δ [a1 ,b]
sowie (*) benutzt.
90
Lemma 1.
• Sei a eine reelle Zahl
R b oder −∞, und sei b > a eine reelle Zahl. Sei f
eine Funktion auf (a, b], so daß α f (t) dt für jedes α ∈ (a, b) konvergiert. Sei ε > 0.
Dann existiert
eine Funktion δ auf (a, b] mit positiven
Funktionswerten, so daß für jedes
α ∈ (a, b] δ [α,b] eine ε-feine Integraleichung für f [α,b] ist.
• Sei a eine reelle
R β Zahl, und sei b > a eine reelle Zahl oder ∞. Sei f eine Funktion auf
[a, b), so daß a f (t) dt für jedes β ∈ (a, b) konvergiert. Sei ε > 0. Dann existiert eine
Funktion δ auf [a, b) mit positiven Funktionswerten, so daß für jedes β ∈ [a, b) δ [a,β]
eine ε-feine Integraleichung für f [α,b] ist.
• Sei a eine reelle Zahl oder −∞,
R β und sei b > a eine reelle Zahl oder ∞. Sei f eine
Funktion auf (a, b), so daß α f (t) dt für alle α, β ∈ (a, b) konvergiert. Sei ε > 0.
Dann existiert eine Funktion
so daß für alle
δ auf (a, b) mit positiven Funktionswerten,
α, β ∈ (a, b) mit α < β δ [α,β] eine ε-feine Integraleichung für f [α,β] ist.
Beweis. Wir betrachten z. B. den ersten Punkt, die beiden anderen gehen analog dazu.
Sei ak = a + 2−k (b − a). Wir konstruieren durch Induktion nach k > 0 eine εk = ε(1 − 2−k )feine Integraleichung δ k auf [ak , bk ] mit
δ k (t) < t − ak für t > ak
und δ k (ak−1 ,b] = δ k−1 (ak−1 ,b] und δ k (ak−1 ) ≤ δ k−1 (ak−1 ) für k > 2. Im Fall k = 1 kann einfach
irgendeine ε1 -feine Eichung auf [a1 , b] mit (+) genommen werden. Ist δ k−1 schon konstruiert,
so findet man wegen εk−1 < εk δ k durch Anwendung von Folgerung 1. Für t ∈ (a, b] wählen
wir irgendein
k mit t ∈ (ak , b] und setzen δ(t) = δ k (t), wobei dieser Wert nicht von k abhängt.
Dann ist δ [ak ,b] εk < ε-fein. Für α > a kann ein k mit ak ≤ α gefunden werden, und aus dem
dritten Punkt Satz 4 folgt, daß δ [α,b] ε-fein ist. Also leistet δ das Gewünschte.
(+)
Folgerung 2. Das Ändern endlich vieler Funktionswerte von f ändert nichts an der
Integrierbarkeit oder dem Wert des Integrales von f .
Beweis. Wir betrachten zunächst konvergente Integrale. Nach dem Satz von Hake und
Satz 5 gilt die Behauptung für den Fall der Änderung des Funktionswertes an einem Intervallanfangs- oder Endpunkt. Der allgemeine Fall konvergenter Integrale kann wegen Satz 2 und
Satz 3 auf diesen Fall zurückgeführt werden.
Im Fall bestimmt divergenter Integrale nutzt man aus, daß das Ändern des Funktionswertes
an einem Punkt um betragsmäßig ≤ d jede Riemannsche Summe um betragsmäßig höchstens
d(b − a) verändert.
Bemerkung 4. Die Folgerung gestattet es uns, auch Integranden zu betrachten, die an
endlich vielen Stellen nicht wohldefiniert sind, so wie etwa f (t) = √1t auf [0, 1]. Der Integrand
ist an der Stelle t = 0 nicht wohldefiniert. Nach der Folgerung aus dem Satz von Hake kann
man für den fehlenden“ Funktionswert an dieser Stelle einen beliebigen Wert einsetzen und
”
erhält stets Funktionen mit denselben Integrierbarkeitseigenschaften bzw. demselben Wert des
Integrales.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
91
√
Bemerkung 5. Im Fall des Integranden f (t) = √1t aus dem vorigen Beispiel ist F (t) = 2 t
eine Stammfunktion des Integranden auf [ε, 1] für jedes ε > 0. Es gilt also
Z 1
√
dt
√ = 2 − 2 ε.
t
ε
Da diese Werte für ε ↓ 0 gegen 2 konvergieren, gilt
Z 1
Z 1
dt
dt
√ = lim
√
(7)
ε↓0 ε
t
t
0
√
= lim 2(1 − ε) = 2.
ε↓0
In der klassischen Riemannschen Theorie war die obere Zeile von (7) nicht die Folge eines
Satzes (wie bei uns des Satzes von Hake), sondern mußte zur Definition des Integrales auf
der linken Seite als uneigentliches Integral herangezogen werden. Da wir mit der technisch
stärkeren Henstock-Kurzweilschen Integraldefinition arbeiten, haben wir diese Vorgehensweise
nur bei Integralen von −∞ bis ∞ oder über unendliche Halbachsen nötig.
Definition 2.
• Sei a ∈ R. Für eine auf [a, ∞) (bzw. auf (−∞, a]) mit
R ∞der möglichen
Ausnahme endlich vieler Stellen definierte Funktion f sagen wir, daß a f (t) dt (bzw.
Ra
Rb
Ra
f (t) dt für
f
(t)
dt
für
jede
reelle
Zahl
b
>
a
(bzw.
f
(t)
dt)
konvergiert,
wenn
b
a
−∞
jede reelle Zahl b < a) konvergiert und der Grenzwert
Z b
Z ∞
f (t) dt
f (t) dt := lim
b→∞
a
bzw.
Z
a
f (t) dt := lim
b→−∞
−∞
a
Z
a
f (t) dt
b
konvergiert.
• Sei
R ∞ sagen, daß
R ∞ f auf R mit möglicher Ausnahme endlich vieler Stellen definiert. Wir
f (t) dt und
f
(t)
dt
konvergiert,
wenn
für
ein
(bzw.
jedes)
a
∈
R
die
Integrale
a
R−∞
a
f (t) dt konvergieren. In diesem Fall setzen wir
−∞
Z ∞
Z a
Z ∞
f (t) dt,
f (t) dt +
f (t) dt :=
(8)
−∞
dieser Wert ist unabhängig von a.
−∞
a
Daß die Frage der Konvergenz des Integrales von −∞ bis ∞ sowie der Wert von (8) in der
Tat von a unabhängig sind, folgt leicht aus Satz 3.
Im Prinzip könnte die Verwendung uneigentlicher Integrale ganz vermieden werden, indem
man eine direkte Definition der in Definition 2 betrachteten Integrale gibt, ähnlich der folgenden
Definition von bestimmte Divergenz“ in diesem Fall, die wir hier ohne weitere Erläuterung
”
(und ohne detailierten Nachweis der Äquivalenz zur vorherigen Definition in Fällen, in denen
diese anwendbar ist) mitteilen.
92
Rb
Definition 3. Wir sagen, daß a f (t) dt bestimmt gegen ∞ divergiert, wenn für jede reelle
Zahl R Zahlen ã > a und b̃ < b existieren, so daß für α ∈ (a, ã) und β ∈ (b̃, b) eine Funktion
δ→ (0, ∞) existiert, so daß
(α, β) −−
(9)
σ(Z, Ξ, f ) > R
für jede δ-feine Zerlegung (Z, Ξ) von [α, β] gilt.
Rb
Rb
Bemerkung 6. Wenn die Integrale α f (t) dt konvergieren, der Limes limα↓a α f (t) dt daRb
gegen bestimmt divergiert, so ist a f (t) dt im Sinne der vorigen Definition bestimmt divergent.
Wir nehmen dazu zum Beispiel an, daßR der Limes gegen ∞ bestimmt divergiert. Dann gibt
β
es für alle R > 0 ein ã, b̃ ∈ (a, b) mit α f (t) dt > R + 1 für alle α ∈ (a, ã) und β ∈ (b̃, b).
δ→ (0, ∞), so daß für alle derartigen α
Weiterhin
gibt es nach Lemma 1 eine Funktion (a, b] −−
δ (α,b] eine 1-feine Integraleichung ist. Es folgt (9) für jede δ-feine Zerlegung von (α, β).
Satz 7. Sei f eine auf [0, ∞) definierte Funktion mit nichtnegativen Funktionswerten, so
daß
Z T
f (t) dt
(10)
0
jedes T > 0 konvergiert. Wenn die Menge der Zahlen (10) beschränkt ist, so konvergiert
Rfür
∞
f
(t) dt. Andernfalls divergiert dieses Integral bestimmt gegen ∞.
0
Rn
Beweis. Sei In = 0 f (t) dt. Ist die Menge der Zahlen (10) beschränkt, so bilden die IN
eine monontone beschränkte Folge reeller Zahlen, und es konvergiert I = limn→∞ In . Sei ε > 0
vorgegeben. Wir wählen ein n mit In > I − ε. Sei T > n, dann gilt
Z ⌈T ⌉
Z T
f (t) dt = I⌈T ⌉ ≤ I,
f (t) dt ≤
I − ε < In ≤
0
0
RT
woraus I − 0 f (t) dt < ε folgt. Also ist I der Limes der Integrale (10).
Wenn hingegen die Menge der Werte der Integrale (10) unbeschränkt ist, so gibt es für
Rβ
R1
RT
> R + 0 f (t) dt. Dann gilt α f (t) dt > R für α ∈ (0, 1) und
jedes R > 0 ein T mit 0 f (t) dt
R∞
β ∈ (T, ∞). Folglich divergiert 0 f (t) dt im Sinne von Definition 3 gegen ∞.
Satz 8 (Majorantenkonvergenzkriterium für uneigentliche Integrale). Sei f eine auf [0, ∞)
definierte Funktion mit reellen oder komplexen Funktionswerten, so daß (10) für jedes T ∈
(0, ∞) konvergiert
R ∞ und eine Funktion m auf [0, ∞) mit nichtnegativen Funktionswerten exisim(t) dt konvergiert und |f (t)| ≤ m(t) für alle t ∈ [0, ∞) gilt. Dann konvergiert
tiert,
für
die
0
R∞
f (t) dt.
0
Rn
Rn
Beweis. Sei Ik = 0 f (t) dt und Jk = 0 m(t) dt. Nach Voraussetzung konvergiert die
Folge Jk , insbesondere ist diese Folge eine Cauchy-Folge. Wegen
Z l
Z k
|Il − Ik | = f (t) dt ≤
m(t) dt = Jl − Jk
k
l
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
93
bildet auch die Folge der Il eine Cauchy-Folge. Daher existiert I = liml→∞ Il . Wir zeigen, daß I
der Limes für R → ∞ der Integrale (10) ist, womit der Nachweis der Konvergenz dann erbracht
ist. Sei dazu ε > 0, wir wählen n mit |I − In | < 2ε und mit |Jl − Jn | < 2ε für l > n. Sei R > n,
dann gilt
Z
Z R
Z R
ε R
I −
≤ |I − In | + In −
≤
< +
f
(t)
dt
f
(t)
dt
f
(t)
dt
2 0
n
0
Z R
Z ⌈R⌉
ε
ε
ε ε
ε
m(t) dt ≤ +
m(t) dt = + J⌈R⌉ − Jn < + = ε,
≤ +
2
2
2
2 2
n
n
womit I in der Tat der Limes der Integrale (10) ist.
Die soeben bewiesenen Sätze sind offenbar Analoga von Satz .2.3.1 sowie des ersten Teiles
von Satz .2.3.4. Dieser Zusammenhang sowie die Tatsache, daß die Berechnung von Stammfunktionen oft einfacher ist als das Auffinden von Summenformeln, legen es nahe, ein Kriterium
anzugeben, daß die Frage der Konvergenz oder Divergenz gewisser unendlicher Summen auf die
analoge Frage für gewisse Integrale zurückführt. Das folgende Integralkriterium von Cauchy
leistet dies in der Tat.
Satz 9 (Integralkriterium). Sei f eineR monoton fallende Funktion auf [0, ∞) mit
Pnichtnega∞
tiven Funktionswerten. Dann konvergiert 0 f (t) dt genau dann, wenn die Summe ∞
n=0 f (t) dt
konvergiert.
Beweis. Wir führen den Beweis nur unter der Zusatzannahme, daß (10) für jedes endliche
R ⌈R⌉
RR
R konvergiert.14 Nach Satz 7 und wegen 0 f (t) dt ≤ 0 f (t) dt
R nist die Frage der Konvergenz
des Integrales äquivalent zur Beschränktheit der Folge der In = 0 f (t) dt für natürliche Zahlen
n. Wir haben
n Z k
X
In =
f (t) dt,
k=1
k−1
und auf Grund der Monotonie von f ist der Integrand im k-ten Summanden ≥ f (k) und
≤ f (k − 1). Es folgt
n
n−1
X
X
f (k) ≤ In ≤
f (k),
k=1
k=0
die Beschränktheit der Folge
P∞der In ist daher äquivalent zur Beschränktheit der Folge der
endlichen Teilsummen von n=0 f (n). Die Behauptung folgt nun aus Satz .2.3.1.
Beispiel 1. Der Satz kann zur Untersuchung der Konvergenz von
∞
X
(11)
n−λ
n=1
14Die
Konvergenz dieses Integrales folgt aus der Monotonieforderung an f , was an dieser Stelle aber nicht
gezeigt werden soll. Siehe dazu Satz .3.14.2 und Aufgabe .3.14.1.
94
1−λ
mit λ > 0 herangezogen werden. Die Stammfunktion des Integranden auf [1, ∞) ist t1−λ für
λ 6= 1 bzw. log(t) für λ = 1. Sie hat genau im Fall λ > 0 für t → ∞ einen Grenzwert, also
konvergiert (11) genau in diesem Fall, wie wir früher schon gesehen hatten.
3.11. Anwendung der Integralrechnung auf die Bogenlänge von Kurven.
~x
V eine Funktion, welche
Regel 1. Sei V ein Euklidischer Vektorraum und I = [a, b] −→
stetig differenzierbar ist.15 Dann ist die Bogenlänge der durch f parametrisierten Kurve durch
Z b
˙ dt
~x(t)
(1)
ℓ=
a
gegeben. Insbesondere gilt
(2)
Z bp
ẋ1 (t)2 + · · · + xn (t)2 dt
ℓ=
a
n
im Falle V = R und ~x(t) = x1 (t), . . . , xn (t) . Im Spezialfall n = 2 erhält man
Z bp
(3)
ℓ=
1 + f ′ (t)2 dt
a
für die Länge des Graphen der Funktion f , welche stückweise C 1 auf [a, b] ist.
Bemerkung 1. Um diese Formel zu begründen, bezeichnen wir ihre rechte Seite mit ℓ und
betrachten nur den Fall, daß ~x auf [a, b] stetig differenzierbar ist. Sei durch a = a0 < · · · < an = b
eine Riemannsche Zerlegung von I = [a, b] gegben. Bei genügend kleiner Schrittlänge kann man
sich den von den ~xi = ~x(ai ) für 0 ≤ i ≤ n (in dieser Reihenfolge) gebildeten Polygonzug als eine
Approximation an die durch ~x parametrisierte Kurve vorstellen. Die Länge dieses Polygonzuges
ist
Z
n
n
X
X
ai
˙
ℓ̃ =
k~xi − ~xi−1 k =
~x(λ)
dλ.
i=1
i=1
ai−1
Aus unseren Voraussetzungen und Satz .2.4.716 folgt, daß die Funktion ~x˙ gleichmäßig stetig auf
I ist. Sei ε > 0 gegeben, es gibt ein δ > 0 mit
ε
˙ <
˙
~x(s)
für s, t ∈ I und |s − t| < δ.
(4)
− ~x(t)
2(b − a)
15Mit
anderen Worten sollen die einzelnen Komponenten xi (t) von x(t) für 1 ≤ i ≤ n stetig differenzierbar
sein. Wir setzen dann x′ (t) = x′1 (t), . . . , x′n (t) .
16Wobei Satz .2.4.7 von uns nur für skalarwertige Funktionen formuliert und bewiesen wurde, also strenggenommen nicht direkt anwendbar ist. Die nachfolgenden Überlegungen werden aber legitimiert durch die
ε √
Anwendung des Satzes auf die stetige Funktion x′i , wonach es ein δi > 0 mit |x′i (s) − x′i (t)| < 2(b−a)
für
n
s, t ∈ I und |s − t| < δi gibt. Mit δ = min(δ1 , . . . , δn ) gilt dann (4). Analog dazu kann die Anwendung von im
skalarwertigen Fall bewiesenen Regeln der Integral- und Differentialrechnung auf den Fall Rn -wertiger Funktionen in einigen der folgenden Überlegungen durch separate Behandlung der einzelnen Vektorkomponenten
legitimiert werden, was hier aber nicht genauer ausgeführt werden soll.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
95
Wenn die Schrittweite der Zerlegung < δ ist, kann ℓ − ℓ̃ wie folgt abgeschätzt werden:
Z ai
n Z ai
X
˙~x(λ) dλ −
ℓ − ℓ̃ = ˙~x(λ) dλ ai−1
i=1
n Z
X
=
≤
≤
≤
≤
i=1
n X
i=1
n
X
i=1
n
X
i=1
n
X
i=1
ai
ai−1
Z
˙~x(λ) dλ − ai−1
ai
ai
Z
˙~x(λ) dλ − ai−1
ai
ai
Z
ai
(ai − ai−1 )
ai
ai−1
Z
˙~x(ai−1 ) dλ + ˙~x(ai−1 ) dλ −
ai−1
Z
ai
ai−1
Z
ai
ai−1
Z
ai
ai−1
˙ i−1 ) dλ + ~x(a
˙
˙ i−1 ) dλ + ~x(λ)
−~x(a
ai−1
Z
ai−1
˙
~x(λ)
dλ −
ai−1
Z
˙ i−1 ) dλ +
~x(a
ai−1
Z
Z
ai
˙~x(ai−1 ) dλ −
ai
ai−1
Z
˙~x(λ) dλ ai
ai−1
˙~x(ai−1 ) − ˙~x(λ) dλ
˙~x(λ) dλ
˙~x(ai−1 ) − ˙~x(λ) dλ
ε
ε
+ (ai − ai−1 )
= ε.
2(b − a)
2(b − a)
Der Übergang von der ersten Zeile
ist dadurch gerechtfertigt, daß die neu hinzuge zur zweiten
˙
kommenen Terme ±(ai − ai−1 ) ~x(ai−1 ) sind und sich gegenseitig wegheben. Beim Übergang
zur letzten Zeile wurden die Integrale gemäß (.3.7.2) durch Länge des Integrationsweges mal
Schranke für die Norm (bzw. den Betrag) des Integranden abgeschätzt. Ansonsten wurden nur
Standard-Umformungen von Integralen gemäß Satz .3.2.1 benutzt.
Die Differenz aus der Länge des Polygonzuges und ℓ wird also für genügend feine Polygonzüge beliebig klein. Das rechtfertigt es, ℓ als Länge der Kurve zu betrachten.
Ohne nähere Begründung teilen wir noch die folgende Regel zur Berechnung der von den
Fahrstrahlen, die den Koordinatenursprung mit den Punkten einer Kurve im R2 verbinden,
überstrichen wird. Es handelt sich um eine orientierte Fläche, bei der gegen den Uhrzeigersinn
(alos in mathematisch positiver Richtung) überstrichene Flächenanteile positiv und die übrigen
negativ zählen.
x(·), y(·)
Regel 2 (Leibnizsche Sektorformel). Sei I = [a, b] −−−−−−−−−→ R2 stetig
differenzier
bar, dann ist die orientierte Fläche, die der Fahrstrahl von 0 bis x(t), y(t) für a ≤ t ≤ b
überstreicht, durch
Z
1 b
′
′
x(t)y (t) − x (t)y(t) dt
(5)
2 a
gegeben.
3.12. Der Satz über die monotone Konvergenz. Wir beginnen mit dem Beweis des
folgenden Satzes:
96
Satz 1 (Saks-Henstock-Lemma). Seien a < b reelle Zahlen. Die Eichung δ sei ε-fein für f
N
Rb
auf I = [a, b], wobei wir a f (t) dt als konvergent voraussetzen. Sei (ak , bk ) k=1 , N ∈ N ∪ {∞},
eine endliche Folge von paarweise disjunkten offenen Teilintervallen von I. Für jede natürliche
Zahl k zwischen 1 und N sei eine Zahl ξk ∈ [ak , bk ] mit
bk − ak < δ(ξk )
(1)
gegeben. Dann gilt
X
Z
N (2)
bk
ak
k=1
f (t) dt − (bk − ak )f (ξk ) ≤ ε
für jede Teilmenge K von {1; . . . ; n}. Allgemeiner gilt ohne die Voraussetzung der ε-Feinheit
von δ, aber unter Beibehaltung der Fordurungen (1) und ξk ∈ [ak , bk ] sowie der paarweisen
Disjunktheit der Intervalle (ak , bk ), daß für jedes δ > 0 eine δ-Diskrepanz d von f mit
X
Z
N bk
(3)
f (t) dt − (bk − ak )f (ξk ) − d < δ
ak
k=1
existiert.
Beweis. Es genügt, unsere Behauptung über (3) zu beweisen. Danach kann nämlich in der
Situation von (2) für jedes ε̃ > ε (3) mit δ = ε̃ − ε angewendet werden. Da die Integraleichung
δ ε-fein ist, gilt |d| ≤ ε für jede δ-Diskrepanz d von f auf [a, b]. Aus (3) ergibt sich also
X
Z
N bk
f (t) dt − (bk − ak )f (ξk ) ≤ ε + δ = ε̃,
k=1
ak
und durch Grenzübergang ε̃ ↓ ε folgt (2).
Auf Grund unserer Disjunktheitsannahme über die betrachteten Teilintervalle dürfen annehmen, daß diese so geordnet sind, daß a1 ≤ b1 ≤ a2 ≤ b2 ≤ . . . ≤ aN ≤ bN gilt.
Zum Beweis von (3) gehen wir durch Induktion nach N vor. Im Fall N = 0 ist die Summe in
(3) leer und hat daher den Wert 0, und man muß nur zeigen, daß es δ-Diskrepanzen von beliebig
kleinem Betrag gibt, was in Satz .3.10.4 schon getan wurde. Sei N ≥ 1 und die Behauptung
für den Fall von N − 1 Teilintervallen schon gezeigt. Wir beweisen sie für den Fall von N
Teilintervallen zunächst unter der Voraussetzung bN = b. Nach der Induktionsannahme gibt es
eine δ-Diskrepanz d1 für f auf [a, aN ] mit
N
−1Z bk
X
f (t) dt − (bk − ak )f (ξk ) − d1 < δ.
k=1
ak
Rb
Wegen bN − aN < δ(ξN ) ist außerdem d2 = aNN f (t) dt − (bN − aN )f (ξN ) eine δ-Diskrepanz
für f auf [aN , bN = [aN , b]. Nach dem ersten Punkt von Satz .3.10.4 ist d = d1 + d2 eine δ-
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Diskrepanz für f auf I, und für diese gilt
X
N
Z
−1Z
N bk
X
f (t) dt − (bk − ak )f (ξk ) − d = k=1
ak
bk
ak
k=1
97
f (t) dt − (bk − ak )f (ξk ) − d1 < δ.
Wir betrachten nun den Fall bN < b. Durch Anwendung der Behauptung über (3) im schon
erledigten Fall bN = b auf [a, bN ] erhält man die Existenz einer δ-Diskrepanz d1 für f auf [a, bN ]
mit
X
Z
N bk
δ
< ,
f
(t)
dt
−
(b
−
a
)f
(ξ
)
−
d
k
k
k
1
2
a
k
k=1
und auf Grund von Satz .3.10.4 gibt es eine δ-Diskrepanz d2 für f auf [bN , b] mit |d2 | < 2δ . Nach
Satz .3.10.4 ist d = d1 + d2 eine δ-Diskrepanz für f auf I, und für diese gilt offenbar (3). Theorem 4 (Satz über die monotone Konvergenz). Sei (fn ) eine monoton wachsende
Rb
oder fallende Folge reellwertiger Funktionen, für die die Integrale a fn (t) dt konvergieren. Wir
setzen voraus, daß die Folge fn punktweise gegen die Funktion f konvergiert. Dann gilt
Z b
Z b
(4)
f (t) dt = lim
fn (t) dt,
a
n→∞
a
wobei beide Seiten konvergieren oder bestimmt divergieren.
Beweis. Wir dürfen uns auf den Fall monoton wachsender Folgen beschränken, sonst ersetzen wir fk durch −fk . Weiterhin dürfen wir fk ≥ 0 voraussetzen, sonst ersetzen wir fk durch
fk − f0 . Wir setzen zunächst a und b als endlich voraus.
Rb
Wenn die rechte Seite bestimmt divergiert, so kann für jedes K ∈ R ein n mit a fn (t) dt >
K + 1 gefunden werden. Ist δ 1-fein für fn auf [a, b], so gilt
σ(Z, Ξ, f ) ≥ σ(Z, Ξ, fn ) > K + 1 − 1 = K
Rb
für jede δ-feine Zerlegung. Also divergiert a f (t) dt bestimmt gegen ∞, wie für diesen Fall
behauptet.
Wir setzen also voraus, daß der Limes auf der rechten Seite eine reelle Zahl ι ist. Wir wollen
zeigen, daß das Integral auf der linken Seite gegen ι konvergiert. Sei dazu ε > 0. Wir wählen
ko > 0 so groß, daß
Z b
ε
fko (t) dt > ι −
(%)
3
a
für k ≥ ko gilt. Für derartige k wählen wir eine Integraleichung δ k auf I = [a, b], welche 2−k 3ε fein für fk ist.
Für x ∈ I wählen wir ein k = κ(x) ≥ ko mit
ε
(+)
fk (x) > f (x) −
3(b − a)
und setzen δ(x) = δ k (x).
98
Sei (Z, ξ) eine δ-feine Zerlegung von I in N Teile, dann gilt offenbar
σ(Z, Ξ, f ) =
∞
X
X
k=ko k=κ(ξn )
f (ξn )(an − an − 1).
Nach (+) folgt
∞
X
X
ε
σ(Z, Ξ, f ) −
fk (ξn )(an − an−1 ) < .
3
k=k
(@)
o
κ(ξn )=k
Durch Anwendung des Saks-Henstock-Lemmas auf die Menge der Intervalle (an−1 , an ) mit
κ(ξn ) = k folgt
X Z an
ε
fk (ξn )(an − an−1 ) −
fk (t) dt ≤ 2−k .
3
an−1
κ(ξn )=k
Summation üer k liefert
X
Z
∞ X fk (ξn )(an − an−1 ) −
an
ε
fk (t) dt ≤ 2−k ,
3
an−1
k=ko κ(ξn )=k
und zusammen mit (@) ergibt sich
∞
X Z
X
(&)
σ(Z, Ξ, f ) −
k=ko κ(ξn )=k
an
2ε
fk (t) dt < .
3
an−1
Sei k− = min κ(ξ1 ), . . . , κ(ξn ) und k+ = max κ(ξ1 ), . . . , κ(ξn ) , dann gilt ko ≤ k− ≤ k+ , und
Z
a
b
fk− (t) dt =
N Z
X
n=1
≤
≤
an
an−1
fk− (t) dt =
k=ko κ(ξn )=k
∞
X Z
X
k=ko κ(ξn )=k
an
an
an−1
fk− (t) dt
fk (t) dt
an−1
∞
X Z
X
k=ko κ(ξn )=k
∞
X Z
X
an
fk+ (t) dt =
an−1
N Z
X
n=1
an
fk+ (t) dt =
an−1
Z
b
fk+ (t) dt.
a
Auf Grund von (%) folgt
X
Z
∞ X
k=ko κ(ξn )=k
an
ε
fk (t) dt − ι < ,
3
an−1
und zusammen mit (&) folgt |σ(S, Ξ, f ) − ι| < ε für jede δ-feine Zerlegung. Damit ist gezeigt,
Rb
daß a f (t) dt wie behauptet gegen ι konvergiert.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
99
Wir betrachten nun auch unendliche a und b und setzen zunächst voraus, daß der Limes ι
auf der linken Seite von (4) endlich ist. Dann gilt
Z β
Z β
Z b
f (t) dt = lim
fn (t) dt ≤ lim
fn (t) dt = ι
α
n→∞
n→∞
α
a
für a < α < β < b, durch Anwendung des bisher bewiesenen Spezialfalles auf das
R b beschränkte
Intervall [α, β]. Durch Anwendung von Satz .3.10.7 folgt die Konvergenz von a f (t) dt, sowie
Rb
Rb
Rb
f (t) dt ≤ ι. Andererseits gilt a fn (t) dt ≤ a f (t) dt wegen fn < f , und durch Grenzübera
Rb
gang n → ∞ folgt ι ≤ a f (t) dt. Damit ist (4) im dem Fall vollständig bewiesen, daß die linke
Seite endlich ist.
3.13. Nullmengen und die Differenzierbarkeit fast überall. Für ein Intervall I =
[a, b] nennen wir |I| = b − a die Länge von I.
Definition 1. Eine Teilmenge X von R ist eine Nullmenge, wenn für jedes ε > 0 eine
Folge (Ik )K
k=1 , K ∈ N ∪ {∞}, von Intervallen mit
X⊆
(1)
existiert, so daß
∞
X
(2)
k=0
gilt.
K
[
Ik
k=1
|Ik | < ε
Bemerkung 1. Anschaulich gesehen ist also eine Nullmenge eine Teilmenge von R, die
durch Intervalle beliebig kleiner Gesamtlänge überdeckt werden kann, wobei die Überdeckungen
endlich oder abzählbar unendlich sein können.
Bemerkung 2. Genauer gesagt handelt es sich bei den hier betrachteten Nullmengen um
die Nullmengen bzgl. des Lebesgueschem Maßes auf R, im Sinne der Lebesgueschen Maßtheorie,
worauf an dieser Stelle nicht näher eingegangen werden soll.
Fakt 1.
• Jede Teilmenge einer Nullmenge ist eine Nullmenge.
• Ist (Xk )N
(abzählbar) unendliche Folge von Nullk=1 , N ∈ N ∪ {∞}, eine endliche oder
SN
mengen Xk , so ist auch deren Vereinigung k=1 Xk eine Nullmenge.
• Jede endliche oder abzählbar unendliche Teilmenge von R ist eine Nullmenge.
Beweis. Die erste Behauptung ist eine triviale Folgerung der
S∞Definitionen. Zum Beweis
der
zweiten
wählt
man
für
jedes
ε
>
0
eine
Überdeckung
X
⊆
k
l=0 Ik,l durch Intervalle mit
P∞
−k
l=0 |Il | < 2 ε. Dann ist
∞
n
N X
[
[
Ik,l
Xk ⊆
k=1
k=1 l=0
100
eine abzählbare Überdeckung17 mit
∞
N X
[
k=1 l=0
|Ik,l | <
N
X
k=1
ε2−k ≤ ε
∞
X
2−k = ε,
k=1
und die zweite Behauptung folgt.
Eine einelementige Menge {x} ⊆ R ist ein abgeschlossenes Intervall der Länge 0 und daher
eine Nullmenge. Endliche oder abzählbare Teilmengen von R sind folglich als endliche oder
abzählbare Vereinigungen von Nullmengen ebenfalls Nullmengen, und alle Behauptungen sind
bewiesen.
Unser Ziel in diesem Abschnitt ist der Beweis des Satzes, wonach eine Menge genau dann
eine Nullmenge ist, wenn das Henstock-Kurzweil-Integral ihrer charakteristischen Funktion
verschwindet. Wir benötigen zwei Sätze bzw. Lemmata als Vorbereitung.
Lemma 1. Sei f eine Funktion auf R mit nichtnegativen reellen Funktionswerten.
Wenn
R∞
für jedes ε > 0 eine Funktion fε mit f (t) ≤ fε (t) für alle t ∈ R existiert, so daß −∞ fε (t) dt < ε
R∞
gilt, so gilt −∞ f (t) dt = 0.
Beweis. Sei δ eine ε/2-feine Integraleichung für fε/2 . Für jede δ-feine Zerlegung gilt dann
Z ∞
ε
0 ≤ σ(Z, Ξ, f ) ≤ σ(Z, Ξ, fε/2 ) ≤
fε/2 (t) dt + < ε.
2
−∞
R∞
Folglich konvergiert das HK-Integral −∞ f (t) dt gegen 0.
Unsere zweite Vorbereitung ist der Überdeckungssatz von Vitali.
Satz 1 (Überdeckungssatz von Vitali). Sei M ein metrischer Raum, für den zu jedem ε > 0
eine endliche Zahl Nε existiert, so daß in M nich mehr als Nε paarweise disjunkte Kugeln vom
Radius ≥ ε existieren. Sei X ⊆ M eine Teilmenge. Für jedes x ∈ X sei eine reelle Zahl Rx > 0
gegeben. Wir setzen voraus, daß {Rx |x ∈ X} beschränkt ist. Dann existiert eine endliche oder
N
abzählbar unendliche Folge (Ki )N
i=1 = K ri (xi ) i=1 , N ∈ N ∪ ∞, von abgeschlossenen Kugeln
in M mit Mittelpunkt xi ∈ X und Radius ri = Rxi , so daß folgende Eigenschaften erfüllt sind:
• Die Kugeln Ki sind paarweise disjunkt.
• Die Kugeln K 5ri (xi ) mit demselben Mittelpunkt und dem fünffachen Radius wie Ki
S
S
überdecken x∈X K Rx (x), also insbesondere X ⊆ N
i=1 K 5ri (xi ).
Bemerkung 3. Die Zahl 5 aus dem letzten Punkt ist etwas willkürlich gewählt, kann aber
nicht beliebig klein gemacht werden. Jede Zahl > 3 kann statt 5 genommen werden.
Beweis. Wenn l ≥ 1 ist und die Kugeln K1 , . . . , Kl−1 schon definiert sind, so sei Xl die
Menge aller x ∈ X, für die K Rx (x) disjunkt zu den bisher ausgewählten Kugeln K1 , . . . , Kl−1
17Die
Glieder der Doppelfolge Ik,l können nach dem ersten Cantorschen Diagonalprinzip so durchnumeriert
werden, daß eine Einfachfolge entsteht
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
101
ist (also insbesonere X1 = X). Wenn Xl leer ist, bricht die Auswahl der Kugeln mit N = l ab.
Andernfalls wählen wir xl so, daß
1
(+)
Rx ≥ sup Rξ ξ ∈ Xl
2
gilt. Dies ist auf Grund von Definition .2.5.1 möglich.
Die erste der obigen beiden Behauptungen über die Kugeln Kxi (ri ) ist auf Grund unserer
Auswahl der xi erfüllt. Zum Nachweis der zweiten bemerken wir zunächst, daß entweder l
endlich ist oder
(%)
lim ri = 0
i→∞
gilt. Sei nun x ∈ X, wir wollen
(*)
K Rx (x) ⊆
N
[
K ri (xi )
i=1
zeigen. Wenn x unter den xi vorkommt, ist das klar. Wir setzen also voraus, daß x nicht unter
den xi vorkommt.
Wenn eine ganze Zahl i mit 1 ≤ i ≤ N ri < Rx /2 existiert, so sei j das kleinste derartige i.
Dann gilt x 6∈ Xj , denn sonst stünde die Wahl von xj im j-ten Schritt im Widerspruch zu (+).
Wegen x 6∈ Xj muß es ein i mit 1 ≤ i < j geben, so daß K Rx (x) zu K ri (xi ) nicht disjunkt ist.
Dann gilt d(x, xi ) ≤ Rx + ri . Auf Gund der Minimalität von j gilt Rx ≤ 2ri , also d(x, xi ) ≤ 3ri
und K Rx (x) ⊆ K 5ri (xi ). Damit ist (*) in diesem Fall bewiesen.
Wir nehmen nun an, daß kein i mit ri < Rx /2 existiert. Wegen (%) bricht die Auswahl
der xi an einer Stelle ab, N ist also endlich und XN leer, und für alle natürlichen Zahlen i mit
0 < i < N gilt ri ≥ Rx /2. Damit greift dasselbe Argument wie zuvor: Es muß ein derartiges
i mit K ri (xi ) ∩ K Rx (x) 6= ∅ geben, denn sonst wäre x ∈ XN und XN wäre nicht leer. Dann
gilt d(x, xi ) ≤ ri + Rx ≤ 3ri nach der Dreiecksungleichung und wegen ri ≥ Rx /2, und es folgt
K Rx (x) ⊆ K ri (xi ).
Dieser Satz von Vitali ist das entscheidende technische Hilfsmittel für diesen Unterabschnitt.
Wir wollen uns davon überzeugen, daß er für jedes endliche R auf den metrischen Raum
I = [−R, R] anwendbar ist.
Lemma 2. Seien a < b reelle Zahlen und ε > 0, dann hat jede Menge X von paarweise disjunkten abgeschlossenen Kugeln vom Radius ≥ ε in dem metrischen Raum I = [a, b] höchstens
b−a
+ 2 Elemente.
2ε
Beweis. Sei x ∈ I, r > 0 und K = K r (x). Dann tritt wenigstens einer der folgenden Fälle
ein:
• a ∈ K.
• b ∈ K.
• K = [x − r, x + r].
102
Eine Kugel mit Mittelpunkt x und Radius r in dem betreffenden metrischen Raum ist also ein
Intevall der Länge 2r, wenn sie nicht an den Intervallrändern abgeschnitten“ wird. Letzterer
”
Fall kann nur eintreten, wenn die Kugel einen der Randpunkte des Intervalles enthält. Da es
nur zwei solche Randpunkte gibt und die Elemente von X paarweise disjunkte Kugeln vom
Radius ≥ ε sind, gibt es höchstens zwei Elemente von X, die nicht abgeschlossene Intervalle
der Länge ≥ 2ε sind.
Seien K1 , . . . , Kl Elemente von X, die Intervalle der Länge ≥ R2ε sind. Dann gilt 0 ≤
Pl
b
i=1 1Ki ≤ 1I (auf Grund der paarweisen Disjunktheit der Ki ) und a 1Ki ≥ 2ε. Es folgt
Z b
Z b X
l
dt = b − a,
2εl ≤
1Ki (t) dt ≤
a
i=1
a
. Also hat X höchstens b−a
Elemente, die abgeschlossene Intervalle der Länge ≥ 2ε
also l ≤ b−a
2ε
2ε
sind. Nach dem zuerst Gesagten hat X höchstens Rε + 2 Elemente.
Satz 2. Für eine Teilmenge X ⊆ R sind die folgenden Eigenschaften äquivalent:
• X ist eine Nullmenge.
R∞
• Das Integral −∞ 1X (t) dt der charakteristischen Funktion von X konvergiert gegen 0.
Beweis. Sei X eine Nullmenge. Für jedes ε > 0 wählen wir eine Überdeckung (1) mit (2).
S
P
Sei Xl = lk=1 Ik , dann kann ist 1Xl für jedes endliche l integrierbar und 1Xl ≤ lk=1 1Il , also
R∞
P
1 (t) dt ≤ lk=1 |Ik |. Nach (2) gilt also
−∞ Xl
Z ∞
(+)
1Xl (t) dt ≤ ε.
−∞
Nach dem Satz über die monotone Konvergenz bleibt dies auch für l = ∞ (im Fall K = ∞)
richtig. In jedem Fall kann also l = K in (+) gesetzt
R ∞ werden. Damit ist für jedes ε > 0 eine
Funktion fε (nämlich 1XK ) mit 0 ≤ 1X ≤ fε und −∞ fε (t) dt ≤ ε gefunden. Nach Lemma 1
verschwindet das Integral von 1X .
Zum Beweis der entgegengesetzten Implikation betrachten wir zunächst den Fall, daß X ⊆
(−R, R) für eine reelle Zahl R > 0 gilt. Dann ist
Z R
Z ∞
1X (t) dt
1X (t) dt =
0=
−∞
−R
Wir wählen eine Integraleichung δ auf [−R, R], welche 5ε -fein für 1X ist.
Der metrische Raum M = [−R, R] erfüllt nach Lemma 2 die Voraussetzung des Überdeckungssatzes von Vitali. Für x ∈ X sei
min δ(x), |R| − |x|
.
(@)
Rx =
2
Die Folge (Ki )N
i=1 von Kugeln habe die in Satz 1 beschriebenen Eigenschaften. Wie in der
Formulierung dieser Eigenschaften sei ri der Radius und xi ∈ X der Mittelpunkt von Ki . Sei
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
Ñ ≤ N eine natürliche Zahl, wir wollen
(*)
Ñ
X
ri ≤
N
X
ri ≤
i=1
103
ε
10
zeigen. Da dies für alle endlichen Ñ ≤ N gilt, folgt
i=1
ε
.
10
Die Überdeckung von X durch die Kugeln K 5ri (xi ) ist eine Überdeckung von X durch Intervalle, und
N
N
X
X
K 5r (xi ) =
10ri ≤ ε.
i
i=1
i=1
Da eine solche Überdeckung von X für jedes ε > 0 gefunden werden kann, ist X eine Nullmenge.
Beim Beweis von (*) können wir nach Umnumerieren der Ki erreichen, daß x1 < x2 < · · · <
xÑ gilt. Sei ai = xi − ri und bi = xi + ri . Auf Grund der Disjunktheit der Ki gilt ai > bi−1 für
i > 1. Sei weiterhin b0 = −R, aÑ +1 = R. Auf Grund von (@) gilt auch −R = b0 < a1 sowie
bñ < aÑ +1 = R. Wir wählen eine δ-feine Zerlegung (Yi , Λi ) von [bi−1 , ai ], bezeichen die durch
ai < xi < bi gegebene Zerlegung von [ai , bi ] in ein Teilstück mit xi als Stützstelle mit (Zi , Ξ).
Die Zerlegung
(Z, Ξ) = (Y1 , Λ1 ) ◦ (Z1 , Ξ1 ) ◦ (Y2 , Λ2 ) ◦ · · · ◦ (ZÑ , ΞÑ ) ◦ (YÑ +1 , ΛÑ +1 )
von [−R, R] ist δ-fein, sie sei durch −R = c0 ≤ ξ1 ≤ c1 ≤ . . . ≤ cL−1 ≤ ξL ≤ cL = R gegeben.
RR
Sie ist δ-fein, wegen −R 1X (t) dt = 0 gilt also σ(Z, Ξ, 1X ) < 5ε . Für jedes k mit 1 ≤ k ≤ Ñ
existiert ein i mit 1 ≤ i ≤ L und ak = ci−1 , bk = ci und xk = ξi . Der Term (bi − ai )1X (xi ) = 2ri
kommt also unter den Summanden (ck − ck−1 )1X (ξi ) der Riemannschen Summe σ(Z, Ξ, 1X )
vor, die alle nichtnegativ sind. Also gilt
2
Ñ
X
i=1
ε
ri ≤ σ(Z, Ξ, 1X ) < ,
5
und (*) folgt.
Wir haben gesehen, daß beschränkte Mengen Nullmengen sind, wenn das Integral ihrer
charakteristischen Funktion verschwindet. Sei X ⊆ R eine beliebige Menge, für die das Integral
der charakteristischen Funktion gegen 0 konvergiert. Für jede ganze Zahl R > 0 verschwindet
das Integral der charakteristischen Funktion von X ∩ (−R, R) nach Lemma 1 ebenfalls, denn
es gilt 0 ≤ 1X∩(−R,R) ≤ 1X . Nach dem bereits Bewiesenen ist
also X ∩ (−R, R) eine Nullmenge,
S
X
∩
(−R,
R)
.
und dasselbe gilt nach Fakt 1 für X = ∞
R=1
Definition 2. Wir sagen, daß eine Aussage A(x) über reelle Zahlen x (bzw. Elemente
einer Teilmenge I ⊆ R) fast überall bzw. für fast alle x richtig ist, wenn die Menge aller x ∈ R
(bzw. aller x ∈ I), für die die Aussage falsch ist, eine Nullmenge ist.
104
Beispiel 1. Die Funktionenfolge fn konvergiert fast überall gegen die Funktion f , wenn
x Es gilt nicht lim fn (x) = f (x)
n→∞
eine Nullmenge ist. Eine Funktion f ist fast überall differenzierbar, wenn
x f ist nicht differenzierbar an der Stelle x
eine Nullmenge ist.
Eines der Ergebnisse des folgenden Satzes besagt, daß zwei fast überall gleiche Funktionen
für Fragen der Integralrechnung äquivalent sind:
Satz 3. Seien a < b reelle Zahlen oder ±∞, und sei I = [a, b] ∩ R.
Rb
• Sei g eine Funktion mit nichtnegativen Funktionswerten auf I. Dann konvergiert a g(t) dt
genau dann gegen 0, wenn g fast überall verschwindet.
• Seien f1Rund f2 zwei Funktionen auf I, die fast überall überinstimmen. Dann ist das
b
Integral a f1 (t) dt genau dann konvergent (bzw. bestimmt divergent), wenn dasselbe für
Rb
Rb
Rb
f (t) dt gilt, und in diesem Fall gilt a f1 (t) dt = a f2 (t) dt.
a 2
Beweis. Wir betrachten zunächst
R bden ersten Punkt und bezeichnen die Menge aller t mit
g(t) 6= 0 mit X. Zunächst setzen wir a g(t) dt = 0 voraus. Sei Xn die Menge aller t ∈ I = [a, b]
mit g(t) > 1/n. Sei f = 1Xn die charakeristische Funktion von Xn . Für jedes ε > 0 kann
Rb
fε = 2n g in Lemma 1 gesetzt werden. EsSfolgt a 1Xn (t) dt = 0. Nach Satz 2 ist Xn eine
Nullmenge, und nach Fakt 1 ist auch X = ∞
Nullmenge.
n=0 Xn eine
Rb
Wenn umgekehrt X eine Nullmenge ist, so gilt a gn (t) dt = 0 mit gn (t) = min g(t), n ,
denn auf f = gn kann Satz 2 mit fε = n1X angewendet werden. Es gilt g(t) = limn→∞ gn (t)
Rb
für alle t ∈ I, und nach dem Satz über die monotone Konvergenz folgt a g(t) dt = 0.
Beim Beweis des zweiten Punktes dürfen wir nach Trennung von Real- und Imaginärteil die
betrachteten Funktionen als reellwertig voraussetzen.
Im Fall f1 ≤ f2 kann der erste Punkt auf
Rb
g = f2 −f1 angewendet werden und zeigt a f2 (t)−f1 (t) dt = 0, und die Behauptung folgt aus
den Rechenregeln für das Integral. Im allgemeinen Fall wendet man den zunächst betrachteten
Spezialfall zunächst auf min(f1 , f2 ) und f1 und dann auf min(f1 , f2 ) und f2 an.
Das zweite Hauptresultat dieses Unterabschnittes ist der folgende Satz, der gewissermaßen
den ersten Hauptsatz der Integral- und Differentialrechung auf alle integrierbaren Funktionen
ausdehnt, dabei aber nur noch eine für fast alle x“-Aussage treffen kann.
”
Satz 4. Seien a < b Elemente von R ∪ {±∞}, und sei f eine reell- oder komplexwertige
Rb
Funktion auf I = [a, b] ∩ R, für die a f (t) dt konvergiert. Für t ∈ I definieren wir F (t) =
Rt
f (τ ) dτ . Dann gilt für fast alle t ∈ I die Aussage: F ist differenzierbar an der Stelle t, und
a
F ′ (t) = f (t).
Bemerkung 4. Mit anderen Worten ist
(3)
X = x ∈ I F ′ (x) existiert nicht, oder F ′ (x) 6= f (x)
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
105
eine Nullmenge.
Beweis. Es genügt, den Beweis für endliche a und b zu führen. Wenn dann zum Beispiel
die unendliche Halbachse (−∞, b] betrachtet werden soll, so können wir wegen
Z f
Z b−n
Z t
(τ ) dτ
f (τ ) dτ +
f (τ ) dτ =
b−n
−∞
−∞
′
für t ∈ [b − n, b] zeigen, daß die Menge Xn aller t ∈ [b − n, b], für die nicht FS
(t) = f (t) gilt, eine
Nullmenge ist. Eine Nullmenge ist dann auch die abzählbare Vereinigung ∞
n=1 Xn , die Menge
′
aller t ∈ (−∞, a], für die nicht F (t) = f (t) gilt. Die Fälle [a, ∞) und (−∞, ∞) behandelt man
analog dazu.
Sei nun, unter der Voraussetzung der Endlichkeit von a und b,
X = x ∈ I Es gibt ein ε > 0, so daß kein δ > 0 existiert, für das
|F (y) − F (x) − (y − x)f (x)| < ε(y − x) für alle y ∈ I mit x < y < x + δ gilt.}
Y = x ∈ I Es gibt ein ε > 0, so daß kein δ > 0 existiert, für das
|F (y) − F (x) − (y − x)f (x)| < ε(x − y) für alle y ∈ I mit x − δ < y < x + δ gilt.}
Offenbar ist X ∪ Y die für den Beweis zu betrachtende Ausnahmemenge (3) aller x ∈ I, für
die F ′ (x) nicht existiert oder von f (x) verschieden ist.
Wir haben
∞
[
X=
(Xn,+ ∪ Xn,− )
Y =
n=0
∞
[
n=0
mit
(Yn,+ ∪ Yn,− )
Es gibt kein δ > 0, für das ± F (y) − F (x) − (y − x)f (x) < ε(y − x)
o
für alle y ∈ I mit x < y < x + δ gilt.
n
= x ∈ I Es gibt kein δ > 0, für das ± F (x) − F (y) − (x − y)f (x) < ε(x − y)
o
für alle y ∈ I mit x − δ < y < x gilt. ,
n
Xn,± = x ∈ I
Yn,±
wobei auf Grund von Satz .3.10.3 diese Ausnahmemengen auch durch
Z y
n
(+) Xn,± = x ∈ I Es gibt kein δ > 0, für das ±
f (t) dt − (y − x)f (x) < ε(y − x)
x
o
für alle y ∈ I mit x < y < x + δ gilt.
Z x
n
Yn,± = x ∈ I Es gibt kein δ > 0, für das ±
f (t) dt − (x − y)f (x) < ε(x − y)
y
106
o
für alle y ∈ I mit x − δ < y < x gilt. .
beschrieben werden können. Auf Grund von Fakt 1 genügt der Nachweis, daß jede der Mengen
Xn,± und Yn,± eine Nullmenge ist. Wir führen diesen Nachweis für Xn,+ , die drei übrigen Fälle
gehen analog dazu bzw. können durch Betrachtung von ±f (±t) auf diesen Fall zurückgeführt
werden.
−n
Sei ε > 0 gegeben, wir wählen
eine 2 10 ε -feine Integraleichung δ auf I. Für x ∈ Xn,+ wählen
wir eine Zahl Rx ∈ 0, δ(x) mit x + Rx ∈ I und
Z x+Rx
(%)
f (t) dt ≥ (f (x) + ε)Rx .
x
Dies ist auf Grund von (+) möglich. Sei die endliche oder abzählbar unendliche Folge (Ki )N
i=1
der Kugeln Ki = Kri (xi ), ri = Rxi , wie in Satz 1 (mit X = Xn,+ ) gewählt. Sei bi = ai + ri .
Wegen [ai , bi ] ⊆ Ki sind die Intervalle [ai , bi ] paarweise disjunkt. Nach dem Saks-HenstockLemma gilt
Ñ Z bi
2−n ε
X
f (t) dt − (bi − ai )f (ai ) <
10
ai
i=1
für jede natürliche Zahl Ñ ≤ N . Im Fall N < ∞ kann Ñ = N gesetzt werden, anderfalls folgt
N Z bi
2−n ε
X
f (t) dt − (bi − ai )f (ai ) <
10
ai
i=1
P
durch Grenzübergang Ñ → ∞. Wegen (%) ist die linke Seite dieser Ungleichung ≥ 2−n N
i=1 ri .
Es folgt
N
X
ε
ri ≤ .
10
i=1
Die Kugeln K 5ri (xi ) überdecken Xn,+ , es handelt sich dabei um Intervalle der Länge ≤ 10ri ,
und die Gesamtlänge dieser Intervalle ist nach der letzten Ungleichung ≤ ε. Da eine solche
Überdeckung von Xn,+ durch Intervalle für jedes ε > 0 gefunden werden kann, ist Xn,+ wie
behauptet eine Nullmenge.
3.14. Meßbare Funktionen und der Satz über die majorisierte Konvergenz.
Definition 1. Unter einer Stufenfunktion auf R verstehen wir (für die Zwecke dieser VorP
lesung) eine Funktion, die außerhalb einer Nullmenge mit einer Funktion der Form Ll=1 wl 1Il
übereinstimmt, wobei wl ∈ C gilt, die Il Intervalle sind und L eine natürliche Zahl ist.
Bemerkung 1.
• Da die charakteristischen Funktionen von [a, b] und (a, b) fast überall (nämlich mit Ausnahme von a und b) übereinstimmen, ist es einerlei, ob man in der
Definition mit offenen, abgeschlossenen oder halboffenen Intervallen arbeitet.
• Wenn f und g fast überall übereinstimmen, so ist offenbar f genau dann eine Stufenfunktion, wenn g eine Stufenfunktion ist.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
107
Fakt 1. Eine Funktion f auf R ist genau dann eine Stufenfunktion, wenn man Zahlen
c0 < c1 · · · < cN , N ∈ N, sowie v1 , . . . , vN finden kann, so daß f (t) = vi für fast alle t ∈ [ci−1 , ci ]
sowie f (t) = 0 für fast alle t 6∈ [c0 , cN ] gilt.
Beweis. Unter den obigen Annahmen gilt
f (t) =
N
X
vi 1[ci−1 ,ci ]
i=1
für fast alle t, also ist f eine Stufenfunktion. Wenn umgekehrt f die in Definition 1 beschriebene
Form hat, so sei Il das Intervall von al bis bl (wobei Il dieselbe Bedeutung
wie inDefinition
1
hat), c0 < c1 < · · · < cN eine wiederholungsfreie Auflistung von al 1 ≤ l ≤ L ∪ bl 1 ≤
l ≤ L , und vi die Summe von wl über alle l mit (ci− , ci ) ⊆ Il .
Fakt 2. Seien f und g Stufenfunktionen, und sei λ eine komplexe Zahl. Dann sind die
folgenden Funktionen Stufenfunktionen:
• f + g und λf (mit anderen Worten, die Stufenfunktionen bilden einen Unterraum im
Vektorraum aller komplexwertigen Funktionen auf R),
• |f |,
• max(f, g) (für rellwertige f und g).
• φ(f ), wobei eine beliebige Funktion auf dem Wertebereich von f ist.
• f · g.
Beweis. Der erste Punkt folgt direkt aus Definition 1. Für den vierten Punkt nehmen wir
an, daß f die in Fakt 1 beschriebene Form hat. Dann gilt |f (t)| = |vi | für fast alle t ∈ (ci−1 , ci )
und |f (t)| = 0 für fast alle t außerhalb [c0 , cN ]. Also hat auch |f | die in Fakt 1 beschriebene
Form und ist damit eine Stufenfunktion. Als Spezialfall φ(t) = |t| des vierten Punktes ergibt
sich der zweite. Der dritte Punkt folgt wegen
f + g + |f − g|
2
f + g − |f − g|
min(f, g) =
,
2
(f +g)2 −f 2 −g 2 folgt der fünfte Punkt aus dem ersten und dem vierten. max(f, g) =
und wegen f g =
1
2
Definition 2. Sei I ein abgeschlossenes Intervall, eine abgeschlossene Halbachse von a bis
∞ bzw. von −∞ bis a, oder I = R. Sei f eine R- oder C-wertige Funktion auf I. Wir nennen f
meßbar, wenn eine Folge fn (t) von Stufenfunktionen auf R existiert, so daß limn→∞ fn (t) = f (t)
für fast alle t ∈ I gilt.
Fakt 3.
• Wenn f meßbar ist, so gibt es eine Folge von Stufenfunktionen fn mit
limn→∞ fn (t) = f (t) für alle t ∈ I.
• Wenn zwei Funktionen f und g fast überall übereinstimmen, so ist f genau dann meßbar,
wenn g meßbar ist.
108
Beweis. Wenn die Folge fn wie in der beschaffen und X die Menge aller t ∈ I ist, für die
nicht limn→∞ fn (t) = f (t) gilt, so setzt man
(
f (t) t ∈ X
f˜n (t) =
fn (t) t 6∈ X.
Dann ist X eine Nullmenge, nach Bemerkung 1 ist auch f˜n eine Stufenfunktion, und es gilt
limn→∞ f˜n (t) = f (t) für alle t ∈ I.
In der Situation des zweiten punktes konvergiert jede fast überall gegen f konvergente Folge
von Stufenfunktionen auch gegen g fast überall, und umgekehrt.
Satz 1.
• Jede stetige Funktion ist meßbar.
• Wenn die fn stetige Funktionen auf I sind und daselbst fast überall gegen f konvergieren,
so ist f meßbar.
• Wenn g1 , . . . , gn (n ∈ N) meßbare reellwertige Funktionen sind, so sind max(g1 , . . . , gn )
und min(g1 , . . . , gn ) meßbar.
• Wenn F eine stetige Funktion auf I und fast überall daselbst differenzierbar ist, so ist
die durch
(
F ′ (t) falls F an der Stelle x differenzierbar ist
f (t) =
0
sonst
definierte Funktion meßbar.
• Wenn f und g meßbare Funktionen sind, so sind f ± g, f · g und λf für jede Konstante
λ meßbar.
φ→ C eine stetige Funktion ist, so ist φ(f )
• Wenn f K-wertig und meßbar und K −−
meßbar.
Beweis. Zum Beweis des ersten Punktes bemerken wir, daß nach dem nachfolgenden Lemma 1 eine Stufenfunktion fn mit |fn (t) − f (t)| < 2−n für t ∈ I ∩ [−n, n] existiert. Die Folge
fn (t) konvergiert für alle t ∈ I gegen f (t), und f ist meßbar.
Der zweite Punkt geht ähnlich: Nach Lemma 1 gibt es eine Stufenfunktion gn mit |fn (t) − gn (t)| <
−n
2 für alle t ∈ I ∩ [−n, n]. Für alle t ∈ I gilt dann limn→∞ fn (t) − gn (t) = 0, und es folgt
limn→∞ gn (t) = f (t) für fast alle t ∈ I.
Zum Beweis des dritten Punktes genügt es, den Fall n = 2 zu betrachten, denn der Fall n =
1 ist trivial und der Fall n > 2 ergibt sich wegen min(g1 , . . . , gn ) = min min(g1 , . . . , gn−1 ), gn
und der analogen Identität für max aus dem Fall n = 2 durch Induktion nach n. Seien fi,n ,
i ∈ {1, 2}, Stufenfunktionen mit limn→∞ fi,n (i) = gi (t). Dann sind fn,− = min(f1,n, f2,n )
und fn,+ max(f1,n , f2,n ) Stufenfunktionen,
und es gilt limn→∞ fn,− (t) = min g1 (t), g2 (t) und
limn→∞ fn,+ (t) = max g1 (t), g2 (t) für fast alle t ∈ I. Also sind min(g1 , g2 ) und max(g1 , g2 )
meßbar.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
109
Zum Beweis des vierten Punktes sei die Funktion fn auf I durch
(
2n F (t + 2−n ) − F (t) t + 2−n ∈ I
fn (t) =
2n F (b) − F (t)
t > b − 2−n
definiert. Mit der möglichen Ausnahme von t = b konvergiert die Folge der fn (t) für alle t ∈ I,
für die F ′ (t) existiert, gegen F ′ (t). Auf Grund unserer Voraussetzung konvergiert die Folge fn
also fast überall auf I gegen f . Man überzeugt sich relativ leicht davon, daß die Funktionen fn
stetig auf I sind. Nach dem zweiten Punkt ist fn meßbar.
Wenn f und g die Limites der Folgen fn und gn von Stufenfunktionen sind, so sind f ± g,
f · g, λf und (unter den Voraussetzungen des letzten Punktes) φ(f ) die Limites von fn ± gn ,
fn · gn , λfn und φ(fn ), welche Funktionen nach Fakt 2 meßbar sind. Also sind die in den beiden
letzten Punkten aufgelisteten Funktionen meßbar.
Lemma 1. Sei f eine stetige Funktion auf I. Zu jedem ε > 0 und jeder reellen Zahl R > 0
existiert eine Stufenfunktion g mit |f (t) − g(t)| < ε für t ∈ I ∩ [−R, R].
Beweis. Sei J = I ∩ [−R, R]. Für jedes t ∈ J gibt es ein δ(t) > 0 mit |f (x) − f (t)| < ε
für |x − t| < δ(t). Sei J = [α, β], und sei α0 ≤ ξ0 ≤ α1 ≤ . . . ≤ αn = β eine δ-feine Zerlegung
von J. Für t ∈ [α, β) gibt es ein eindeutig bestimmtes i mit t ∈ [αi−1 , αi ), für t = β sei
i = n. Wir setzen dann g(t) = f (ξi ). Für t 6∈ J setzen wir g(t) = 0. Dann erfüllt t alle unsere
Bedingungen.
Aufgabe 1. Sei I wie zuvor ein beschränktes abgeschlossenes Intervall, eine abgeschlossene
Halbachse oder R. Man zeige: Jede monotone Funktion auf I ist meßbar.
Wir wollen nun die Zusammenhänge zwischen Meßbarkeit und Integrierbarkeit untersuchen.
Satz 2. Sei weiterhin I ein abgeschlossenes Intervall, eine abgeschlossene Halbachse oder
R, a der Anfangspunkt von I bzw. a = −∞, falls I von unten unbeschränkt ist, und b der
Endpunkt von I bzw. b = ∞, falls I von oben unbeschränkt ist.
Rb
• Wenn a f (t) dt konvergiert, so ist f meßbar.
• Wenn
R b die Funktionswerte von f nichtnegative reelle Zahlen sind und f meßbar ist, so
ist a f (t) dt konvergent oder gegen ∞ bestimmt divergent.
Rb
Rb
• Wenn f meßbar ist und a |f (t)| dt < ∞ gilt, so konvergiert a f (t) dt.
Bemerkung 2. Für die Formulierung des dritten Punktes ist es natürlich wichtig, daß
das darin auftretende Integral über |f | nach dem zweiten Punkt konvergent oder gegen ∞
bestimmt divergent ist.
Beweis. Die erste Behauptung folgt aus dem dritten Punkt von Satz 1, Satz .3.13.4, und
Fakt 3.
Um Aussagen über die Integrierbarkeit aus Meßbarkeitsvoraussetzungen herzuleiten, müssen
wir uns zunächst davon überzeugen, daß Stufenfunktionen integrierbar sind. Nach Beispiel .3.2.1
konvergiert das Integral einer konstanten Funktion über ein beschränktes Intervall, und nach
110
Satz .3.13.3 gilt dasselbe auch für Funktionen, die fast überall konstant sind. Für eine Stufenfunktion f kann man den Integrationsweg nach Fakt 1 in endlich viele Stücke zerlegen, auf denen f fast überall konstant ist, wobei f auf eventuell auftretenden unbeschränkten Teilstücken
verschwindet. Aus der Zerlegbarkeit von Integralen (Satz .3.10.3) folgt so die Konvergenz des
Integrales von f .
Sei nun f eine meßbare Funktion auf I mit nichtnegativen Funktionswerten. Wir zeigen
zunächst die Konvergenz des Integrales von
(
min f (t) t ∈ [−n, n]
φn (t) =
0
t 6∈ [−n, n]
Sei dazu (fk )∞
k=0 eine gegen f konvergierende Folge von Stufenfunktionen. Dann ist auch
(
min fk (t), n t ∈ [−n, n]
fk,n (t) =
0
t 6∈ [−n, n]
eine Stufenfunktion18, und es gilt limn→∞ fk,n = φn . Sei
Mk,l (t) = max fj,n (t) k ≤ j ≤ l ,
der Einfachheit halber unterdrücken wir die n-Abhängigkeit in den Bezeichnungen auf der
rechten Seite, da wir zur Zeit ein festes n betrachten. Durch induktive Anwendung des dritten
Punktes von Fakt 2 sieht man, daß Mk,l eine Stufenfunktion ist. Für festes k bilden die Mk,l
Rb
eine monoton wachsende Folge, und es gilt a Mk,l (t) dt ≤ 2n2 , denn Mk,l (t) ≤ n und Mk,l
verschwindet außerhalb [−n, n]. Es gilt
Mk (t) = lim Mk,l (t) = sup fj,n (t) j ≥ k ,
l→∞
Rb
nach dem Satz über die monotone Konvergenz konvergiert a Mk (t) dt. Diese Integrale bilden
eine monoton fallende Folge nichtnegativer Zahlen, denn die Funktionen Mk sind in Abhängigkeit von k monoton fallend und nichtnegativ. Es gilt limk→∞ Mk (t) = φn (t). Nach dem Satz
Rb
über die monotone Konvergenz konvergiert a φn (t) dt, wie behauptet.
Nun ist die Folge der φRn monoton wachsend, und limn→∞ φn = f . Nach dem Satz über die
b
monotone Konvergenz ist a f (t) dt konvergent oder bestimmt divergent.
Rb
Nach dem letzten Punkt
Sei f eine meßbare Funktion, für
die a |f (t)| dt konvergiert.
von Satz 1 sind auch max ±ℜ(f ), 0 und min ±ℜ(f ), 0 meßbar. Nach dem soeben gezeigten
zweiten Punkt sind die Integrale dieser Funktionen konvergent oder bestimmt divergent, und
da jede dieser Funktionen durch den Betrag von f beschränkt ist, kann letzterer Fall nicht
eintreten. Also konvergiert auch das Integral von
f = max(ℜf, 0) − max(−ℜf, 0) + i max(ℑf, 0) − i max(−ℑf, 0).
18z.
B. ist min(fk (t), n) nach dem vierten Punkt von Fakt 2 eine Stufenfunktion, dasselbe gilt auf Grund
von Definition 1 für die charakteristische Funktion von [−n, n], und fk,n ist das Produkt dieser Funktionen.
3. DIFFERENTIAL- UND INTEGRALRECHNUNG
111
Bemerkung 3. Wir können nun die im allgemeinen Fall noch verbleibenden Lücken beim
Beweis von Satz .3.9.2 schließen. Zunächst ist die Integrierbarkeit von g(t)w(t) zu zeigen. Nach
Satz 1 ist diese Funktion meßbar. Da wir g als stetig voraussetzen, existiert eine obere Schranke
G für den Betrag der Funktionswerte von g. Dann gilt
Z b
Z b
w(t) dt < ∞.
|g(t)w(t)| dt ≤ G
a
a
Rb
Nach Satz 2 konvergiert a g(t)w(t) dt.
Rb
Ferner hatten wir a w(t) dt 6= 0 voraussgesetzt. Ist dies nicht der Fall, so verschwindet
Rb
w(t) nach Satz .3.13.3 fast überall. Dann verschwindet auch der Integrand in a w(t)g(t) dt
fast überall, und nach dem eben zitierten Satz verschwindet das Integral. Damit verschwinden
beide Seiten von (.3.9.2), ganz gleich wie ξ ∈ [a, b] gewählt wird. Der Satz ist also auch im Fall
Rb
w(t) dt = 0 richtig.
a
Wir sind nun in der Lage, den Satz über die majorisierte Konvergenz zu beweisen:
Theorem 5 (Satz über die majorisierte Konvergenz). Sei I ein abgeschlossenes Intervall,
eine abgeschlossene Halbachse oder R. Wir beichnen mit a den Anfangspunkt von I (bzw. −∞)
und mit b den Endpunkt von I (bzw. ∞). Seien fn und m auf I definierte Funktionen, für die
die Integrale von a nach b konvergieren. Wir setzen voraus, daß für fast alle t ∈ I m(t) reell
ist, |fn (t)| ≤ m(t) für alle n ∈ N gilt und f (t) = limn→∞ fn (t)19 existiert. Dann gilt
Z b
Z b
(1)
lim
fn (t) dt =
f (t) dt,
n→∞
a
a
wobei sowohl der Limes auf der linken als auch das Integral auf der rechten Seite konvergieren.
Beweis. Durch Trennung von Real- und Imaginärteil dürfen wir annehmen, daß die fi
reell sind. Außerdem dürfen wir annehmen, daß unsere Voraussetungen |fi (t)| ≤ m(t) und
f (t) = limn→∞ für alle t erfüllt sind. Andernfalls setzt man einfach f (t) = fn (t) = 0 für
alle t, welche diese Voraussetzungen nicht erfüllen, und ändert nach Satz .3.13.3 nichts an der
untersuchten Fragestellung.
Nach Satz 2 sind die Funktionen fi meßbar. Sei
φk,l (t) = min(fk , . . . , fl )
Φk,l (t) = max(fk , . . . , fl )
φk (t) = inf fm (t) m ≥ k = lim φk,l (t)
l→∞
Φk (t) = sup fm (t) m ≥ k = lim Φk,l (t).
l→∞
Die Limites auf den beiden unteren Zeilen existieren für alle t, denn die zugrundeliegende
Folge ist monoton und betragsmäßig beschränkt durch m(t). Aus demselben Grund bleiben die
19Wobei
für alle anderen t irgendein beliebiger Wert für f (t) genommen werden kann, was nach dem zweiten
Punkt von Satz .3.13.3 nichts an der untersuchten Fragestellung ändert
112
Rb
Rb
Folgen der Integrale a φk,l (t) dt und a Φk,l (t) dt beschränkt. Nach dem Satz über die monotone
Rb
Rb
Konvergenz konvergieren a φk (t) dt und a ΦK (t) dt. Die Folge φk ist monoton wachsend und
die Folge Φk monoton fallend, und es gilt f (t) = limk→∞ φk (t) = limk→∞ Φk (t). Nach dem Satz
Rb
über die monotone Konvergenz konvergiert a f (t) dt, und es gilt
(+)
Z
b
f (t) dt = lim
k→∞
a
Z
b
φk (t) dt = lim
k→∞
a
Z
b
Φk (t) dt.
a
Da φk (t) ≤ f (t) ≤ Φk (t) für alle t ∈ I, und damit
Z b
Z b
Z b
Φk (t) dt
f (t) dt ≤ lim
φk (t) dt ≤
lim
k→∞
gilt, folgt (1) aus (+).
a
a
k→∞
a
Bemerkung 4. Offensichtlich haben wir unsere Überlegungen über Meßbarkeit nur benutzt, um zu zeigen, daß die φk,l und Φk,l integrierbar sind. Die Überlegungen des vorigen
Abschnittes wurden dabei gebraucht, um die Integrierbarkeit der Funktionen φk,l und Φk,l zu
zeigen. Diese wurde mittels des vorigen Satzes aus der Meßbarkeit dieser Funktionen hergeleitet, wobei die Überlegungen über die Differenzierbarkeit aus dem vorigen Abschnitt benutzt
wurden, um umgekehrt zu zeigen, daß Funktionen mit konvergenten Integralen meßbar sind.
Ohne diese technische Hürde, deren Überwindung so viele, lange und nichttriviale Überlegungen gekostet hat, hätten wir den Satz über die majorisierte Konvergenz sofort aus dem Satz
über die monotone Konvergenz herleiten können.
Wir wollen noch (in Verallgemeinerung des zweiten Punktes von Satz 1) zeigen, daß die
Grenzwerte von fast überall konvergenten Folgen meßbarer Funktionen meßbar sind.
Satz 3. Sei (fk )∞
k=1 eine Folge meßbarer Funktionen auf I, die daselbst fast überall gegen
die Funktion f konvergiert. Dann ist auch f meßbar.
Beweis. Wir dürfen uns durch Tennung von Real- und Imaginärteil auf reelle Funktionen
beschänken und betrachten zunächst
den Fall beschränkter Intervalle. Nach Satz 1 sind die
Funktionen gn (t) = arctan fn (t) meßbar. Ihr Betrag ist durch π2 beschränkt. Da wir das Intervall im Augenblick als beschränkt voraussetzen, konvergiert das Integral dieser Majorante. Nach
dem Satz über die majorisierte Konvergenz konvergiert das Integral von g(t) = arctan f (t) .
Nach Satz 2 ist g meßbar. Es gibt also eine Folge von Stufenfunktionen
γn , die gegen g konvergiert. Indem wir γn durch γ̃n (t) = max 2−n − π2 , min(γ(t), π2 − 2−n ) ersetzen, können wir
noch annehmen, daß die Funktionswerte von γn in (− π2 , π2 ) liegen.
Da dasselbe für g gilt und
tan auf diesem Intervall stetig ist, gilt f (t) = limn→∞ tan γn (t) . Nach Fakt 2 ist tan γn (t)
eine Stufenfunktion, und als Limes dieser Stufenfunktionen ist f meßbar.
Wir betrachten nun unbeschränkte Intervalle und setzen In = I ∩ [n − 1, n]. Durch Anwendung der soeben bewiesenen Teilaussage erhält man die Meßbarkeit von f |In . Es gibt also
4. INTEGRATION UND DIFFERENTIATION IM Rn .
113
Folge von Stufenfunktionen gk,n mit limk→∞ gk,n (x) = f (x) für alle x ∈ In . Sei
(+)
γk =
n−1
X
gk,n 1[k,k+1)
n=−k
alsoγk (t) =
(
gk,⌊x⌋
0
−n ≤ ⌊x⌋ < n
sonst,
dann gilt limk→∞ γk (t) = f (t) für alle t ∈ I. Als charakteristische Funktion eines Intervalles ist
1[k,k+1) eine Stufenfunktion, nach Fakt 2 sind also die Summanden in (+) und damit auch (+)
selbst Stufenfunktionen. Also ist f meßbar.
4. Integration und Differentiation im Rn .
4.1. Metrische Räume. Bevor wir uns eingehender mit dem Stetigkeitsbegriff beschäftigen, wollen wir den wichtigen Begriff metrischer Raum“ einführen, der es uns ermöglicht,
”
Begriffe wie Konvergenz“ und Stetigkeit“ in einem allgemeinen Rahmen zu betrachten.
”
”
Definition 1. Ein Metrischer Raum ist eine Menge M , versehen mit einer Funktion M ×
d→ R mit folgenden Eigenschaften:
M −−
• Aus x, y ∈ M und x 6= y folgt d(x, y) > 0.
• Für alle x ∈ M gilt d(x, x) = 0.
• Aus x, y, z ∈ M folgt d(x, z) ≤ d(x, y) + d(y, z).
• Es gilt d(x, y) = d(y, x).
Wir nennen diese Abstandsfunktion die Metrik von M . Falls mehrere metrische Räume im
Spiel sind, schreiben wir oft dM , wenn die Metrik von M gemeint ist.
Offenbar ist also d eine Abstandsfunktion, die ähnliche Eigenschaften erfüllt wie der normale
Abstand für reelle Zahlen, Punkte im n-dimensionalen Euklidischen Raum etc. Die zuletzt
erwähnte Ungleichung ist die Dreiecksungleichung.
Beispiel 1.
• Die Mengen R und C, versehen mit der Abstandsfunktion d(x, y) =
|x − y|, sind metrische Räume.
• Sei (M, d) ein metrischer Raum und N ⊆ M eine Teilmenge, dann ist N , versehen mit
der Einschränkung von d auf N × N , ein metrischer Raum.
Beweis. Wir beweisen zum Beispiel die erste Aussage, die zweite ist noch einfacher.
Sei K = R oder C sowie x, y ∈ K. Im Fall x = y gilt x − y = 0 und d(x, y) = |x − y| = 0,
im Fall x 6= y x − y 6= 0 und |x − y| > 0. Damit sind die beiden ersten Punkte von Definition 1
nachgewiesen. Für den letzten bemerken wir
d(x, y) = |x − y| = |−1| · |x − y| = |−1 · (x − y)| = |y − x| = d(y, x).
Es verbleibt der Nachweis des dritten Punktes von Definition 1, also der Dreiecksungleichung für die Metrik. Diese folgt unmittelbar aus der Dreiecksungleichung für den Betrag reeller
114
bzw. komplexer Zahlen:
d(x, z) = |x − z| = |(x − y) + (y − z)| ≤ |x − y| + |y − z| = d(x, y) + d(y, z).
Der bereits früher eingeführte Konvergenzbegriff überträgt sich mühelos auf Folgen von
Elementen metrischer Räume.
Definition 2. Sei (xn )∞
n=0 eine Folge von Elementen eines metrischen Raumes (M, d). Wir
sagen, daß diese Folge gegen x ∈ M konvergiert, und schreiben limn→∞ xn = x, falls zu jeder
positiven reellen Zahl ε eine Zahl δ > 0 existiert, so daß d(x, xn ) < ε für n > no gilt. Die Folge
ist eine Cauchy-Folge, falls zu jedem positiven ε eine Zahl no existiert, so daß d(xm , xn ) < ε
für no ≤ m ≤ n gilt. Ein metrischer Raum ist vollständig, falls jede Cauchy-Folge einen Limes
hat.
Bemerkung 1. Man überzeugt sich leicht davon, daß man im Fall M = R oder M =
C, wobei in diesen Fällen die Metrik aus Beispiel 1 verwendet wird, den Konvergenzbegriff
Definition .2.1.1 erhält.
Fakt 1.
• Der Grenzwert einer konvergenten Folge von Elementen eines metrischen
Raumes ist eindeutig bestimmt.
• Für jedes Element m eines metrischen Raumes M konvergiert die konstante Folge mit
Folgenglied m gegen m.
• Jede konvergente Folge ist eine Cauchy-Folge.
• Jede Teilfolge einer konvergenten Folge konvergiert gegen denselben Grenzwert.
Beweis. Wir beweisen als Beispiel den ersten Punkt. Angenommen, die Folge (mk )∞
k=ko
konvergiert in M sowohl gegen m als auch gegen m̃, und es gilt m 6= m̃. Dann ist ε = d(m, m̃)
positiv. Nach Definition 2 gibt es eine Zahl k ≥ ko mit d(mj , m) < 2ε für j > k und eine Zahl
l ≥ ko mit d(mj , m̃) < 2ε für j > l. Für j > max(k, l) (zum Beispiel j = max(k, l) + 1) folgt
ε = d(m, m̃) ≤ d(m, mj ) + d(mj , m̃) = d(mj , m) + d(mj , m̃) <
ein Widerspruch.
Die (einfachen) Beweise der übrigen Punkte werden weggelassen.
ε ε
+ = ε,
2 2
Beispiel 2.
• Die metrischen Räume R und C sind vollständig.
• Der metrische Unterraum Q ⊂ R ist nicht vollständig, denn es gibt Cauchy-Folgen
rationaler Zahlen, die nicht gegen eine rationale Zahl konvergieren (Beispiel: die Folge
der Teilsummen der Dezimalbruchentwicklung einer irrationalen Zahl).
Definition 3. Sei K = R oder K = C. Ein normierter K-Vektorraum ist ein K-Vektorraum
k·k
V , zusammen mit einer Abbildung V −−−→ [0, ∞), welche die folgenden Eigenschaften hat:
• kλvk = |λ| kvk für λ ∈ K und v ∈ V .
4. INTEGRATION UND DIFFERENTIATION IM Rn .
115
• Es gilt die Dreiecksungleichung
ku + vk ≤ kuk + kvk
(1)
für u, v ∈ V .
• Aus kvk = 0 folgt v = 0.
Beispiel 3.
• Offenbar ist K, versehen mit den üblichen Betrag, ein K-Vektorraum.
• Wenn (V, k·k) ein normierter C-Vektorraum und Ṽ V als R-Vektorraum bezeichnet (die
Abbildung der Multiplikation Skalar mit Vektor C×V → V wird also auf R× Ṽ = R×V
eingeschränkt), so ist (Ṽ , k·k) ein normierter R-Vektorraum. Insbesondere ist (C, |·|) ein
normierter R-Vektorraum.
Fakt 2. Sei V ein normierter K-Vektorraum. Dann wird V mit der Abstandsfunktion
d(x, y) = kx − yk zu einem metrischen Raum.
Beweis. Der Beweis ist vollkommen analog zu dem in Beispiel 1 behandelten Fall der
Räume R und C. Sei x, y ∈ V . Im Fall x = y gilt x − y = 0 und d(x, y) = kx − yk = 0, im
Fall x 6= y x − y 6= 0 und kx − yk > 0. Damit sind die beiden ersten Punkte von Definition 1
nachgewiesen. Für den letzten bemerken wir
d(x, y) = kx − yk = |−1| · kx − yk = k−1 · (x − y)k = ky − xk = d(y, x).
Es verbleibt der Nachweis des dritten Punktes von Definition 1, also der Dreiecksungleichung für die Metrik. Diese folgt unmittelbar aus der Dreiecksungleichung für die Norm:
d(x, z) = kx − zk = k(x − y) + (y − z)k ≤ kx − yk + ky − zk = d(x, y) + d(y, z).
Definition 4. Ein Banachraum ist ein normierter Raum, der mit der obigen Metrik versehen zu einem vollständigen metrischen Raum wird.
Satz 1. Der K-Vektorraum V sei mit einem Skalarprodukt hv, wi ∈ K (v, w ∈ V ) versehen,
das die folgenden Eigenschaften hat:
• hu + v, wi = hu, wi + hv, wi.
• hλu, vi = λ hu, vi.
• hv, wi = hw, vi.
• Aus v 6= 0 folgt hv, vi > 0.
p
Sei kuk = hu, ui. Dann wird V mit dieser Norm zu einem normierten K-Vektorraum, und
es gilt die Cauchy-Schwarzsche Ungleichung
(2)
|hu, vi| ≤ kuk kvk .
Beweis. Wir bringen nur den Beweis der schwierigeren Teilaussagen, nämlich den Beweis
der Cauchy-Schwarzschen Ungleichung und die Herleitung der Dreiecksungleichung für die
Norm aus dieser Ungleichung.
116
Wir beweisen zunächst die folgende Hilfsaussage für v, w ∈ V :
1
kvk2 + kwk2
(+)
ℜ(hv, wi) ≤
2
In der Tat, es gilt
0 ≤ hv − w, v − wi = hv, vi + hw, wi − hv, wi − hw, vi
und (+) folgt.
Wir verschärfen nun (+) zu
= kvk2 + kwk2 − hv, wi − hv, wi
= kvk2 + kwk2 − 2ℜ hv, wi ,
|hv, wi| ≤
(@)
1
kvk2 + kwk2
2
Nach dem nachfolgenden Lemma gibt es eine komplexe (bzw. reelle, falls R-Vektorräume betrachtet werden) Zahl ϑ mit |ϑ| = 1, so daß ϑ · hv, wi reell und nichtnegativ ist. Dann gilt nach
(+) und den Eigenschaften des Skalarproduktes
|hv, wi| = |ϑ hv, wi| = ϑ hv, wi = ℜ(ϑ hv, wi) = ℜ(hϑv, wi)
1
1
2
2
2
2
kϑvk + kwk =
kvk + kwk
≤
2
2
und (@) ist bewiesen.
Wir können nun die Cauchy-Schwarzsche Ungleichung beweisen. Im Fall u = 0 oder v = 0
verschwinden beide Seiten von (2). Wir dürfen uns also auf den Fall beschränken, daß u und
v beide nicht verschwinden. In diesem Fall verschwinden auch kuk und kvk nicht, und die
u
v
Vektoren ũ = kuk
und ṽ = kvk
haben beide die Norm 1: kũk = kṽk = 1. Aus (@) folgt in
diesem Fall |hũ, ṽi| ≤ 1. Wegen hu, vi = kuk kvk hũ, ṽi ergibt sich (2).
Wir können nun die Dreiecksungleichung ku + vk ≤ kuk+kvk aus der Cauchy-Schwarzschen
Ungleichung herleiten. Es gilt
hu + v, u + vi = hu, ui + hv, vi + hu, vi + hv, ui = hu, ui + hv, vi + hu, vi + hv, ui
2
= kuk2 + kvk2 + 2ℜ hu, vi ≤ kuk2 + kvk2 + 2 kuk kvk = kuk + kvk .
Auf diese Ungleichung kann die auf [0, ∞) monoton wachsende Quadratwurzelfunktion angewendet werden, und es ergibt sich
p
ku + vk = hu + v, u + vi ≤ kuk + kvk
wie behauptet.
Lemma 1. Sei z ∈ C, dann gibt es eine komplexe Zahl ϑ mit |ϑ| = 1, so daß ϑz reell und
nichtnegativ ist. Falls z reell ist, kann auch ϑ reell gewählt werden.
4. INTEGRATION UND DIFFERENTIATION IM Rn .
117
Beweis. In der Tat, für z = 0 kann ϑ = 1 genommen werden. Andernfalls nehmen wir
z
. Für reelle z läuft dies auf ϑ = 1 für z ≥ 0 und ϑ = −1 für negative z hinaus, so daß ϑ
ϑ = |z|
in diesem Fall in der Tat reell ist.
Bemerkung 2. Aus der Beziehung hv, wi = hw, vi und den übrigen Eigenschaften des
Skalarproduktes folgt hu, v + wi = hu, vi + hu, wi sowie hu, λvi = λ hu, vi.
Definition 5. Ein Hilbertraum ist ein Banachraum, dessen Norm man auf diese Weise aus
einem Skalarprodukt erhalten kann.
Auch der Stetigkeitsbegriff kann auf den Fall metrischer Räume verallgemeinert werden:
f→ N heißt stetig
Definition 6. Seien M und N metrische Räume. Eine Abbildung M −−
in x ∈ M , falls zu jeder positiven reellen Zahl ε eine positive reelle Zahl δ mit
dN f (x), F (Y ) < ε
für dM (x, y) < δ gilt. Sie ist stetig, falls sie in jedem Punkt von M stetig ist.
Beispiel 4. Für reellwertige Funktionen auf einer Teilmenge von R ergibt sich offenbar
der früher bereits für diesen Fall eingeführte Stetigkeitsbegriff als Spezialfall.
Inhalt des folgenden Satzes ist die Tatsache, daß eine Funktion genau dann stetig ist, wenn
sie mit der Bildung des Grenzwertes von Folgen vertauschbar ist.
f→ N zwischen metrischen Räumen sind folgende AussaSatz 2. Für eine Abbildung M −−
gen äquivalent:
• f ist stetig im Punkte m ∈ N .
• Wenn (mi )∞
i=0 eine gegen
∞ m konvergierende Folge von Elementen von M ist, so konvergiert die Folge f (mi ) i=0 in N gegen f (m).
Beweis. Die Abbildung sei stetig in m, und es gelte limi→∞ mi = m in M .Wir müssen
limi→∞ f (mi ) = f (m) in N zeigen. Sei dazu eine positive reelle Zahl ε vorgegeben. Auf Grund
der Stetigkeit von f gibt es ein δ > 0 mit
(+)
dN f (m), f (x) < ε
für dM (x, m) < δ. Wegen limi→∞ mi = m in M gibt es ein io mit dM (mi , m)
< δ für i > io .
Für derartige i ist (+) auf x = mi anwendbar, und es folgt dN f (m), f (mi ) < ε wie für den
Beweis von limi→∞ f (mi ) = f (m) benötigt.
Damit ist die zweite Aussage aus der ersten hergeleitet. Zum Beweis der entgegengesetzten
Implikation nehmen wir an, daß f im Punkte m unstetig ist, und zeigen die Existenz einer
gegen m konvergenten Folge von Elementen von M , so daß f (mi ) in N nicht gegen f (m)
konvergiert. Auf Grund der Unstetigkeit von f in M gibt es eine
positive reelle Zahl ε, so
daß für kein positives reelles δ aus dM (m, x) < δ dN f (m), f (x) < ε folgt. Insbesondere
gibt
−k
es für jedes k ∈ N ein mk ∈ M mit dM (mk , m) < 2 und dN f (m), f (mk ) ≥ ε. Es folgt
limk→∞ mk = m in M , während in N nicht limi→∞ f (mi ) = f (m) gilt.