1. Elementare Grundlagen 1.1. Vollständige Induktion und der binomische Lehrsatz. Wir folgen weitgehend den Überlegungen in Forster, Kapitel 1. Die ohne Beweis aufgeführten Sätze sind mit den Sätzen identisch, die bei Forster dieselbe Nummer tragen. Auch der in der Vorlesung gebrachte Beweis wird sich an dem Beweis bei Forster orientieren. Definition 1. Sei N = {0; 1; . . . } die Menge aller natürlichen Zahlen (alsoaller nichtnegativen ganzen Zahlen). Die Menge aller ganzen Zahlen bezeichnen wir mit Z = 0; ±1; ±2; . . . }. Die Menge aller rationalen Zahlen bezeichnen wir mit Q und die Menge aller reellen Zahlen mit R. Fakt 1 (Vollständige Induktion). Sei no eine ganze Zahl, und sei An eine Behauptung über ganze Zahlen n ≥ no . Die folgenden Aussagen seien bekannt: Induktionsanfang: Es gilt Ano . Induktionsschluß: Sei n > no , dann folgt An aus An−1 . Dann gilt An für alle ganzen Zahlen n ≥ no . Ein analoges Prinzip gibt es für die induktive Konstruktion einer Folge mathematischer Objekte. Die vollständige Induktion als Beweisprinzip ist intuitiv klar, denn im Fall no = 0 ergibt sich A0 aus dem Induktionsanfang, sodann A1 aus A0 , A2 aus A1 , A3 aus A2 , und mit sehr viel Geduld erhält man durch analoge Überlegungen zum Beispiel auch A2003 . Allerdings würden uns hartnäckige Skeptiker vielleicht trotzdem nicht glauben, daß auch A102003 richtig ist, denn ohne das Induktionsprinzip zu benutzen läßt sich der Beweis von A102003 aus praktischen Gründen nicht mehr in Worte fassen. Alternativ dazu kann man das Prinzip auch aus der intuitiv klaren Aussage herleiten, wonach jede nichtleere Menge natürlicher Zahlen ein kleinstes Element enthält. Diese Herleitung sieht dann folgendermaßen aus: Beweis. Wenn die Behauptung nicht richtig ist, gibt es irgendeine ganze Zahl n ≥ no , so daß An falsch ist. Dieses n hat die Form no + k mit einer natürlichen Zahl k. Die Menge M = k ∈ N Ano +k ist falsch ist daher nicht leer. Wie vorhin bemerkt, hat M ein kleinstes Element k. Sei n = no + k. Es gilt n > no , also k > 0, denn sonst wäre die Induktionsannahme Ano falsch. Es gilt k − 1 6∈ M auf Grund der Minimalität von k. Wegen k − 1 6∈ M ist An−1 richtig. Nach dem Induktionsschluß sollte also auch An richtig sein, was aber nicht der Fall war. Dieser Widerspruch beweist die Behauptung. Wir haben vorhin klargemacht, daß wir damit nur ein intuitiv klares Prinzip (das Induktionsprinzip) aus einem anderen intuitiv klaren Prinzip (jede nichtleere Menge natürlicher Zahlen enthält ein kleinstes Element) hergeleitet haben. Ohne derartige intuitiv klare Prinzipien vorauszusetzen, kann man keine Mathematik treiben, so wie man sich nicht an seinem eigenen Schopf aus dem Sumpf ziehen kann. Die als intuitiv klar vorausgesetzten Prinzipien nennt man Axiome. Die heutige Mathematik beruht auf der Mengenlehre, die von Cantor eingeführt und 1 2 für die Zermelo und Fraenkel sowie von Neumann, Bernays und Gödel zwei zueinander äquivalente Axiomatisierungen gegeben haben. Im Prinzip kann man bei diesem Aufbau der Mathematik die natürlichen Zahlen aus der leeren Menge und den Operationen zur Mengenbildung, die Bereiche der ganzen und rationalen Zahlen aus dem Bereich der natürlichen Zahlen und die reellen Zahlen aus den rationalen Zahlen aufbauen, so daß im Prinzip das ganze imposante Gebäude der modernen Mathematik aus der leeren Menge und den Mengenbildungsoperationen aufgebaut wird. Die Axiome sind dabei intuitiv klare Prinzipien zur Konstruktion und zum Vergleich von Mengen, wobei aber eine gewisse Portion Vorsicht erforderlich ist, um Paradoxa vom Typ der Antinomie des Lügners zu vermeiden. Für uns wäre diese radikale Vorgehensweise zu ehrgeizig. Daher tragen für uns bestimmte Aussagen über natürliche und reelle Zahlen axiomatischen Charakter, beispielsweise das vorhin benutzte Prinzip, wonach jede nichtleere Menge natürlicher Zahlen ein kleinstes Element enthält. Wir setzen die Kenntnis des Rechnens mit reellen Zahlen (Addition, Multiplikation und Division) voraus und betrachten die aus der Schule bekannten Gesetze der Kommutativität, Assoziativität und Distributivität für diese Rechenoperationen ebenfalls als Axiome. Außerdem arbeiten wir manchmal mit bestimmten intuitiv klaren Eigenschaften des Abzählens endlicher Mengen, ohne diese expressis verbis als Axiome zu formulieren. Ein Beispiel wäre das Prinzip, wonach Zahl der Elemente einer disjunkten Vereinigung die Summe der Elementezahlen der Operanden ist. Ein anderes Beispiel sind unsere Überlegungen zum Beweis von Satz 3 weiter unten. Definition 2. Wir definieren mehrfache Summen und Produkte reeller Zahlen durch b X xi = xa + . . . + x b i=a b Y i=a xi = xa · . . . ·xb für a ≤ b und vereinbaren, daß eine leere Summe gleich 0 und ein leeres Produkt gleich 1 ist: b X (1) xi = 0 für b < a xi = 1 für b < a i=a b Y (2) i=a Diese Konvention kann zusammen mit den Regeln (3) b X xi = i=a (4) b Y i=a b−1 X i=a xi = b−1 Y i=a xi + xb xi · xb für a ≤ b für a ≤ b 1. ELEMENTARE GRUNDLAGEN 3 zu einer induktiven Definition der mehrfachen Summen bzw. Produkte benutzt werden. Wie schon gesagt, setzen wir die Gesetze der Kommutativität, Assoziativität und Distributivität für Summen und Produkte reeller Zahlen als bekannt voraus. Der Beweis des folgenden Faktes gilt auch für jeden anderen Zahlbereich, in dem diese Gesetze gelten, etwa für die rationalen Zahlen oder die später einzuführenden komplexen Zahlen. Fakt 2. Für ganze Zahlen a − 1 ≤ b ≤ c und reelle Zahlen xi gilt c X (5) xi = i=a c Y b X xi + i=a xi = i=a b Y i=a c X xi i=b+1 xi · c Y xi i=b+1 Für beliebige ganze Zahlen a, b, reelle xi , yi und λ gilt das Distributivitätsgesetz b X (6) i=a b X (7) (λxi ) = λ · (xi + yi ) = i=a b X b X i=a b Y (xi yi ) = b Y i=a i=a xi i=a b X xi + yi i=a b Y xi · i=a yi τ→ a′ ; . . . , b′ eine bijektive Abbildung, dann gilt Sei a; . . . ; b −− (8) b X (9) ′ xi = b X i=a j=a′ b Y b Y xτ (j) ′ xi = i=a xτ (j) . j=a′ Die Behauptungen sind intuitiv klar, können aber auch mittels (3) und (4) aus (1) und (2) durch Induktion hergeleitet werden. Beweis. Zum induktiven Beweis der ersten beiden Behauptungen fixieren wir a und b und verwenden Induktion nach c. Wir beweisen nur die erste Behauptung, da der induktive Beweis der zweiten vollkommen analog verläuft. Für c = b (das kleinste c, für welches wir die Behauptung aufstellen), gilt c X i=a xi = b X i=a xi = b X i=a xi + 0 = b X i=a xi + c X i=b+1 xi , 4 wobei wir nacheinander die Gleichung b = c, die für alle reellen Zahlen s gültige Gleichung s + 0 = s sowie (1) benutzt haben. Sei c > b, und sei die Behauptung für das Tripel (a, b, c − 1) bewiesen. Aus unseren Voraussetzungen folgt c ≥ b + 1 und c ≥ a, deswegen kann (3) sowohl auf die Summe von a bis c als auch auf die Summe von b + 1 bis c angewendet werden. Es kommt c c−1 b c−1 b c X X X X X X xi = xi + xc = xi + xi + xc = xi + xi , i=a i=a i=a i=a i=b+1 i=b+1 wobei das mittlere Gleichheitszeichen durch die Induktionsannahme gerechtfertigt ist, während das rechte und linke Gleichheitszeichen Anwendungen von (3) sind. Die Induktionsbeweise von (6) und (7) sind ähnlich einfach, wobei (6) das Distributivitätsgesetz a(b + c) = ab + ac und (7) die Kommutativität der jeweils betrachteten Rechenoperation benutzt. Der Induktionsbeweis von (8) kann am einfachsten durch Benutzung von (5) sowie der Kommutativität der betrachteten Rechenoperation geführt werden. Wir wollen nicht in Details eingehen, weil die Behauptung intuitiv einleuchtend ist. Satz 1. Für n ∈ N gilt die Summenformel n X (10) n(n + 1) 2 i= i=1 Etwas allgemeiner ist Satz 2 (Summenformel für arithmetische Reihen). Für beliebige reelle Zahlen a, b und natürliche Zahlen n gilt n X n(n + 1) (a + bi) = an + b . 2 i=1 (11) Insbesondere gilt n X (2i − 1) = n2 . (12) i=1 Beweis. Wir benutzen n X 1 = n, i=1 was intuitiv klar ist (es handelt sich um n mal den Summanden 1), aber auch durch Induktion nach der natürlichen Zahl n unter Benutzung von (3) gezeigt werden könnte. Durch Anwendung von (7), (6) und (10) ergibt sich die erste Behauptung: n X i=1 (a + bi) = n X i=1 a+ n X i=1 bi = a n X i=1 1+b n X i=1 i = an + b n(n + 1) . 2 1. ELEMENTARE GRUNDLAGEN Die zweite Behauptung ergibt sich als Spezialfall a = −1, b = 2 der ersten: n X n(n + 1) (2i − 1) = −n + 2 = −n + n(n + 1) = −n + n2 + n = n2 . 2 i=1 5 Definition 3. Sei X eine Menge. Eine k-gliedrige Folge von Elementen von X ist eine x→ X, wobei wir in diesem Kontext meist xi statt x(i) schreiben. Die Abbildung {1; . . . ; k} −− Folge ist wiederholungsfrei, falls aus 0 < i < j ≤ k xi 6= xj folgt. Bemerkung 1. Im Falle k = 0 ist diese Definition so zu interpretieren, daß es genau eine Folge von 0 Elementen gibt. Es handelt sich um die leere Folge, definiert durch die leere Abbildung. Sie ist wiederholungsfrei. Bemerkung 2. Später werden wir auch die Möglichkeit zulassen, daß die Numerierung der Folgenglieder nicht bei 1 startet. Definition 4. Für natürliche Zahlen n definieren wir n! (sprich: n Fakultät) durch n Y (13) n! = i. i=1 Bemerkung 3. Als Konsequenz auf (2) und (4) haben wir 0! = 1 und (n + 1)! = (n + 1)n! für alle natürlichen Zahlen n. Alternativ zur obigen Definition könnten diese Tatsachen auch benutzt werden, um die Funktion n! induktiv zu definieren. Definition 5. Seien n und k natürliche Zahlen, wir definieren den Binomialkoeffizienten durch Y k n+1−i n· . . . ·(n + 1 − k) n = = . (14) k i k! i=1 n k Bemerkung 4. Für k ≤ n berechnet sich durch Umordnen ((8)) und Anwendung von (5) das Produkt im Nenner des letzten Ausdruckes auf der rechten Seite von (14) zu Qn k n Y Y i n! = , (n + 1 − i) = i = Qi=1 k k! i=1 i i=1 i=n+1−k und es kommt (15) n! n = . k k!(n − k)! Der Beweis von Teil 3 und Teil 4 des folgenden Satzes wird bei Forster als Satz 3 und Satz 4 durch Induktion bewiesen. Wir gehen ebenfalls durch Induktion vor, formulieren unsere Überlegungen aber teilweise etwas laxer als Forster. Satz 3. Sei X eine Menge mit n Elementen. 6 • Es gibt genau Q nk verschiedene Folgen von k Elementen aus X. • Es gibt genau ki=1 (n + 1 − i) = n · (n − 1)· . . . ·(n − k) verschiedene wiederholungsfreie Folgen von k Elementen von X. • Es gibt genau n! Möglichkeiten, die Elemente von X zu einer wiederholungsfreien Folge anzuordnen. • Es gibt genau nk verschiedene k-elementige Untermengen von X. Beweis. Die ersten beiden Behauptungen beweisen wir durch Induktion nach k. Für k = 0 ergeben sich beide Behauptungen aus Bemerkung 1. Sei k > 0, und sei die erste Behauptung für (k − 1)-gliedrige Folgen bewiesen. Jede der n(k−1) (k − 1)-gliedrigen Folgen von Elementen von X kann durch Ergänzung mit einem beliebigen Element von X zu einer k-gliedrigen Folge ergänzt werden. Für die Wahl dieses Elementes gibt es genau n Möglichkeiten. Also gibt es genau n · nk−1 = nk verschiedene k-gliedrige Folgen. Für wiederholungsfreie Folgen ist beim Induktionsschluß zwischen dem Fall k ≤ n und dem Fall k > n zu unterscheiden. Im letzteren Fall gibt es offenbar keine wiederholungsfreien Folgen der Länge k, wenn nur n Elemente Qk für die Auswahl der Folgenglieder zur Verfügung stehen. Für k ≤ n gibt es für jede der i=1 (n + 1 − i) wiederholungsfreien (k − 1)-gliedrigen Folgen genau n − (k − 1) = n + 1 − k Möglichkeiten, das k-te Element so zu wählen, daß es von jedem Qk−1 (n + 1 − i) k-gliedrige der ersten (k − 1) Elemente verschieden ist. Also gibt es genau i=1 Folgen. Qn Die dritte Behauptung ist der Spezialfall k = n der zweiten, denn das Produkt n! = i=1 i Qn ist eine Umordnung des Produktes i=1 (n + 1 − i). Die Abbildung τ (i) = n + 1 − i bildet nämlich die Indexmenge {1; . . . ; n} bijektiv auf sich selbst ab. Wir leiten die vierte Behauptung aus der zweiten und dritten her. Sei Cn,k die Zahl der kelementigen Untermengen Y von X. Für jedes derartige Y liefert jede der k! Möglichkeiten, Y zu einer wiederholungsfreien Folge anzuordnen, eine k-gliedrige wiederholungsfreie Folge von Elemeten von X, wobei offenbar jede dieser k!Cn,k Möglichkeiten eine andere Folge liefert und Q jede der ki=1 (n + 1 − i) k-gliedrigen wiederholungsfreien Folgen erhalten wird. Wir erhalten Q k!Cn,k = ki=1 (n + 1 − i). Durch Umformen nach Cn,k folgt die Behauptung. Satz 4. Für 1 ≤ k ≤ n gilt n n−1 n−1 = + . k k−1 k Der Satz wird bei Forster als Hilfssatz formuliert, wir bringen als Beweis dieselbe einfache Rechnung wie Forster. Bemerkung 5. Pascalsches Dreieck, siehe Forster für eine Abbildung des Pascalschen Dreieckes. Die Bedeutung der Binomialkoeffizienten für das Rechnen mit Potenzen ergibt sich aus 1. ELEMENTARE GRUNDLAGEN 7 Satz 5 (Binomischer Satz). Für jede natürliche Zahl n und beliebige reelle Zahlen x, y gilt n X n k n−k n x y . (16) (x + y) = k k=0 Der Beweis beruht auf einem Induktionsargument unter Benutzung von Satz 4, siehe Forster. Durch Ersetzen von y durch −y kommt n X n n (−1)n−k xk y n−k . (17) (x − y) = k k=0 Für kleine Werte von n ergeben sich die Spezialfälle (x + y)2 = x2 + 2xy + y 2 , (x − y)2 = x2 − 2xy + y 2 , (x + y)3 = x3 + 3x2 y + 3xy 2 + y 3 und (x + y)4 = x4 + 4x3 y + 6x2 y 2 + 4xy 3 + y 4 . Ebenfalls durch Induktion kann man die Summenformel für die geometrische Reihe beweisen: Satz 6. Sei q eine von 1 verschiedene reelle und k eine natürliche Zahl, dann gilt (18) k X i=0 qi = q k+1 − 1 . q−1 Wir folgen dem Beweis bei Fischer. Ebenfalls durch Induktion, oder durch Anwendung von (18) auf q = a/b und Multiplikation mit bk , ergibt sich die Gleichung (19) ak − bk = (a − b) k X ai−1 bk−i . i=1 Der Spezialfall k = 2 ist der aus der Schule bekannte dritte binomische Satz x2 − y 2 = (x − y)(x + y). 1.2. Die Körperaxiome. Für die Rechenoperationen in R gelten die Körperaxiome. Wir beginnen bei der Beschreibung dieser Axiome mit den Axiomen der Addition. Im Folgenden sind x, y, a, b, c, d immer reelle Zahlen. Fakt 1 (Axiome der Addition). • x + y = y + x (Kommutativität) • x + (y + z) = (x + y) + z (Assoziatitivtät) • Es gibt eine Zahl 0 mit x + 0 = 0 für alle x ∈ R. (Existenz der 0). • Zu jeder Zahl x ∈ R gibt es eine Zahl −x mit x + (−x) = 0. (Existenz des Negativen) Fakt 2. Aus den Axiomen der Addition ergeben sich als Folgerungen: • Die Eindeutigkeit der 0. • Die Eindeutigkeit von −x. • −0 = 0. • Die Gleichung a + x = b mit reellen a, b hat die eindeutige Lösung x = b − a = b + (−a). • −(−x) = x. • −(x + y) = (−x) + (−y). 8 Fakt 3 (Axiome der Multiplikation). • (xy)z = x(yz). (Assoziativität) • xy = yx. (Kommutativität) • Es gibt eine Zahl 1 mit x · 1 = x für alle reellen x. (Existenz der 1). • Zu jedem x ∈ R − {0} gibt es ein x−1 ∈ R mit x · x−1 = 1. Fakt 4 (Distributivität). x(y + z) = xy + xz. Unter einem Körper versteht man einen Zahlbereich, der die obigen Axiome der Multiplikation, der Addition und das Gesetz der Distributivität erfüllt. Nähere Einzelheiten dazu werden auch in der Vorlesung zur linearen Algebra behandelt werden. Aus den Körperaxiomen ergeben sich folgende Konsequenzen: Fakt 5. • Die 1 und das Inverse einer von 0 verschiedenen reellen Zahl sind durch die obigen Eigenschaften eindeutig bestimmt. • Für a, b ∈ R mit a 6= 0 hat ax = b die einzige Lösung x = b · a−1 = b/a. • (x + y)z = xz + yz. • x0̇ = 0. • Es gilt x · y = 0 genau dann, wenn x = 0 oder y = 0 • (−x)y = −(xy). • (−1)x = −x. • (−x)(−y) = xy. • Falls x und y nicht verschwinden, gilt (x−1 )−1 = x und (xy)−1 = x−1 y −1 . • Für ganze Zahlen a, b, c, d gilt b X d d X b X X xij = xij i=a j=c d b Y Y i=a j=c j=c xij = i=a b d Y Y j=c xij i=a In derartigen Fällen können also die soeben noch geschriebenen Klammern weggelassen werden. • Unter denselben Voraussetzungen an a, b, c, d: b d b X d X X X xi · yj = xi yj . i=a j=c i=a j=c Definition 1. Die Potenzen xn mit n ∈ N werden rekursiv durch x0 = 0 und xn+1 = x · xn definiert. Für negative n ∈ Z und x ∈ R − {0} setzen wir xn = (x−1 )n . Aus den Körperaxiomen ergeben sich die folgenden Rechenregeln für Potenzen: Fakt 6. Falls beide Seiten der folgenden Gleichungen wohldefiniert sind (also x 6= 0 falls einer der beteiligten Exponenten n oder m negativ ist, und im Falle von Punkt 3 auch y 6= 0 für n < 0), gilt: 1. ELEMENTARE GRUNDLAGEN 9 • xn+m = xn xm . • xnm = (xn )m . • (xy)n = xn y n . 1.3. Die Anordnungsaxiome. Fakt 1. Es gelten die folgenden Anordnungsaxiome: • Für jede reelle Zahl x tritt genau einer der drei Fälle x > 0, x = 0 und −x > 0 ein. • Aus x > 0 und y > 0 folgen die Beziehungen x + y > 0 und xy > 0. Wir schreiben x > y für die Bedingung x − y > 0 und x < y für die Bedingung y > x. Wir schreiben x ≥ y für die Bedingung x > y oder x = y“ und x ≤ y für x < y oder x = y“. Die ” ” Beweise der nachfolgenden Fakten können bei Forster, 3.1-3.12, nachgeschlagen werden: Fakt 2. Im Folgenden sind x, y, a und b reele Zahlen. • Die Aussagen x > 0 und −x < 0 sind äquivalent. • Aus x > y und y > z folgt x > z (Transitivität der >-Relation). • Aus x > y und a > b folgt x + a > y + b. • Aus x > y und a > 0 folgt ax > ay. • Aus 0 ≤ x < y und 0 ≤ a < b folgt ax < by. • Aus x > y und a < 0 folgt ax < ay. • Aus x 6= 0 folgt x2 > 0. • Aus x > 0 (bzw. x < 0) folgt x−1 > 0 (bzw. x−1 < 0). • Aus x > y > 0 oder 0 > x > y folgt y −1 > x−1 . • 1 > 0. • n > 0 für jede natürliche Zahl n. Definition 1. Wir definieren |x| = x für x ≥ 0 und |x| = −x für x < 0. Fakt 3. Sei x, y ∈ R. • Es gilt |x| ≥ 0 mit Gleichheit genau für x = 0. • Es gilt x ≤ |x|. • |−x| = |x|. • |xy| = |x| |y|. • |xn | = |x|n • |x/y| = |x| / |y|. Satz 1 (Dreiecksungleichung). Für reelle x und y gilt |x + y| ≤ |x| + |y|. Folgerung 1. Unter derselben Voraussetzung an x, y gilt |x + y| ≥ |x| − |y|. Satz 2 (Bernoullische Ungleichung). Sei x ≥ −1. Dann gilt (1 + x)n ≥ 1 + nx für alle n ∈ N. Fakt 4 (Das Archimedische Axiom). Wenn x und y positive reelle Zahlen sind (maW x, y ∈ R sowie x > 0 und y > 0), so gibt es eine natürliche Zahl n mit nx > y. 10 Fakt 5. Zu jeder positiven reellen Zahl ε gibt es ein n ∈ N mit 1/m < ε für alle Zahlen m ≥ n. Beweis. Man kann das Archimedisch Axiom auf 1 und 1/ε anwenden, denn es gilt 1/ε > 0 nach Fakt 2. Man erhält die Existenz einer natürlichen Zahl n mit n > 1/ε. Aus der in Fakt 2 bewiesenen fallenden Monotonie der Funktion 1/t ergibt sich 1/m ≤ 1/n < 1/(1/ε) = ε für beliebige reelle Zahlen m ≥ x. Zum Beweis des folgenden Satzes benötigen wir Fakt 6. Sei b ≥ 1 reell, dann gilt bn ≥ 1 für alle n ∈ N, wobei die Gleichheit nur für b = 1 oder n = 0 eintritt. Den Beweis führt man leicht durch Induktion. Satz 3. Sei b > 1. Dann gibt es zu jeder rellen Zahl K ein n ∈ N mit bm > K für alle natürlichen Zahlen m ≥ n. Beweis. Aus der Bernoullischen Ungleichung und dem Archimedischen Axiom ergibt sich die Existenz eines n ∈ N mit bn > K. Wegen b > 1 gilt bm = bn bm−n ≥ bn > K für m ≥ n, denn wir haben vorhin bm−n ≥ 1 gezeigt. Folgerung 2. Sei b eine relle Zahl mit |b| < 1. Dann gibt es zu jedem positiven rellen ε eine Zahl n ∈ N mit |bn | < ε. Beweis. Der Fall b > 0 wird wie bei Forster durch Anwendung des Satzes auf b−1 erledigt, der Fall b < 0 ergibt sich wegen |b|n = |b|n und der Fall b = 0 ist trivial. Der folgende Fakt kann als eine Variante des Archimedischen Axiomes angesehen werden: Satz 4. Zu jeder rellen Zahl x gibt es eine eindeutig bestimmte ganze Zahl n mit n ≤ x < n + 1. Beweis. Die Menge M aller ganzen Zahlen l mit l > x ist nach nichtleer. Für x ≤ 0 gilt nämlich 1 ∈ M , und für x > 0 kann das Archimedische Axiom auf die Zahlen 1 und x angewendet werden und ergibt die Existenz einer natürlichen Zahl m mit m · 1 > x. Da die Menge M von unten beschränkt ist (nämlich durch die reelle Zahl x), hat sie nach dem nachfolgenden Satz ein kleinstes Element l. Sei n = l − 1, dann gilt n ≤ x (sonst wäre n > x im Widerspruch zur Minimalität von l) und n + 1 = l > x wegen l ∈ M . Wir haben den Satz benutzt, wonach jede von unten beschränkte Menge natürlicher Zahlen ein kleinstes Element enthält: Satz 5. Sei M ⊆ R eine Untermenge, dann sind die folgenden Aussagen äquivalent: • Es gibt eine ganze Zahl m mit l ≥ m für alle l ∈ M . • Es gibt eine reelle Zahl m mit derselben Eigenschaft. Eine derartige Menge nennt man von unten beschränkt. Jede von unten beschränkte nichtleere Menge ganzer Zahlen enthält ein kleinstes Element. 1. ELEMENTARE GRUNDLAGEN 11 Beweis. Sei µ eine reelle Zahl mit l ≥ µ für alle l ∈ M , wir müssen die Existenz einer ganzen Zahl n mit derselben Eigenschaft zeigen. Falls µ ≥ 0 gilt, kann n = 0 genommen werden. Andernfalls ergibt sich aus der Anwendung des Archimedischen Axiomes auf die Zahlen 1 und −µ die Existenz einer natürlichen Zahl k mit −k < µ, und man nimmt n = −k. Damit ist die Äquivalenz der beiden Bedingungen gezeigt, denn die entgegengesetzte Implikation ist trivial. Sei M eine von unten beschränkte nichtleere Menge ganzer Zahlen, es gibt eine ganze Zahl l mit n ≥ l für n ∈ M . Dann ist M̃ = m ∈ N l + m ∈ M eine nichtleere Teilmenge von N. M̃ hat ein kleinstes Element m, und man zeigt leicht, daß n = l + m ein kleinstes Element von N ist. 1.4. Der Körper der komplexen Zahlen. Die Menge aller Paare (a, b) reller Zahlen bildet mit den Rechenoperationen (a, b) + (x, y) = (a + x, b + y) (a, b) · (x, y) = (ax − by, ay + bx) einen Körper. Man schreibt a + bi statt (a, b), wobei sich die Rechenregeln aus i2 = −1 und den Körperaxiomen ergeben. Die Zahlen a und b nennt man den Real- und Imaginärteil der komplexen Zahl a + ib, a = ℜ(a + ib), b = ℑ(a + ib). Die Kommutativität und Assoziativität beider Rechenoperationen rechnet man leicht nach, ebenso die Distributivität. Das Negative zu a + bi ist (−a) + (−b)i. Das Inverse zu a + bi ist a−bi . Es gilt also a2 +b2 x + iy (x + iy)(a − ib) xa + yb ay − bx = = 2 + 2 i. 2 2 a + ib a +b a + b2 a + b2 √ Wir benutzen vorerst ohne Beweis, daß aus jeder reellen Zahl r ≥ 0 eine Quadratwurzel r ≥ 0 existiert. Wir definieren den Absolutbetrag einer komplexen Zahl durch p |x + iy| = x2 + y 2 , nach dem Lehrsatz des Pythagoras handelt es sich um den Abstand des Punktes (x, y) vom Koordinatenursprung. Das konjugiert-komplexe zu a + ib ist a + ib = a − ib. Satz 1. • Das Tripel (C, +, ·) ist ein Körper. • Für relle Zahlen stimmt der soeben definierte Absolutbetrag mit dem früher eingeführten überein. • Es gilt x + y = x + y, xy = x · y sowie |x| = |x| und x = x. • Es gilt |z|2 = zz. • Es gilt (1) |ab| = |a| |b| 12 (2) • Es gilt |z n | = |z|n zn = zn für alle z ∈ C, n ∈ Z unter der zusätzlichen Voraussetzung z 6= 0 im Falle n < 0. • Es gilt √ (3) max(|ℜz| , |ℑz|) ≤ |z| ≤ 2 max(|ℜz| , |ℑz|) (4) • Eine komplexe Zahl verschwindet genau dann, wenn ihr Betrag verschwindet. • Es gilt die Dreiecksungleichung |x + y| ≤ |x| + |y| . Beweis. Die meisten Behauptungen sind trivial, siehe auch Forster, Satz 13.1. Die Dreiecksungleichung ergibt sich aus |x + y|2 = ℜ |x + y|2 = ℜ((x + y)(x + y)) = ℜ(xx) + ℜ(yy) + ℜ(xy) + ℜ(xy) ≤ |x|2 + |y|2 + |xy| |xy| = x2 + y 2 + 2 |x| |y| . 2. Grenzwerte 2.1. Grenzwerte von Folgen. Unter einer unendlichen Folge reeller Zahlen versteht man a→ R, wobei man das Bild von n mit an bezeichnet. Man kann auch eine Abbildung n −− Folgen betrachten, deren Numerierung mit einer ganzen Zahl m beginnt, in diesem Fall ist der Definitionsbereich der Abbildung a die Menge aller l ∈ Z mit l ≥ m. Auch beidseitig unendliche Folgen sind erlaubt, in diesem Fall ist a auf ganz Z definiert. Beispiel 1. Durch Ausdrücke wie an = 1/n (n ≥ 1) oder an = 2−n sind Folgen reeler Zahlen definiert, ebenso durch die rekursive Vorschrift F0 = 1, F1 = 1 und Fn+2 = Fn + Fn+1 (Folge der Fibonacci-Zahlen). In den folgenden Betrachtungen sei K = R oder K = C. Definition 1. Die Zahl a ∈ K ist der Grenzwert für n → ∞ der Folge (an )∞ n=no , an ∈ K, falls zu jedem ε > 0 eine ganze Zahl m mit |a − an | < ε für alle ganzen Zahlen n ≥ m, die zum Definitionsbereich der Folge gehören. Wir schreiben a = limn→∞ an . Eine Folge nennt man konvergent, falls sie einen Grenzwert hat, andernfalls nennt man sie divergent. Die folgenden Hinweise auf Beweise in dem Buch von Forster beziehen sich auf den Fall von Folgen reeller Zahlen. Soweit die Aussage auch im Fall komplexer Zahlen behauptet wird, finden sich Beweise im Abschnitt 13 desselben Buches. Satz 1. Jede Folge hat höchstens einen Grenzwert. Der Satz entspricht Satz 2 im selben Kapitel bei Forster und wird auch genauso bewiesen. Auch die folgenden Beispiele finden sich ähnlich bei Forster. 2. GRENZWERTE 13 Beispiel 2. • Die konstante Folge an = a hat a als Grenzwert. • limn→∞ 1/n = 0. • Die Folge an = (−1)n hat keinen Grenzwert. • Es gilt limn→∞ n/(n + 1) = 1. • Der Grenzwert limn→∞ bn mit b ∈ R existiert genau für −1 < b ≤ 1, und er ist 0 für −1 < b < 1 und 1 für b = 1. Der Beweis der letzten Aussage hängt teilweise von Satz 3 ab und findet sich bei Forster, §4.7. Definition 2. Eine Folge reeller Zahlen ist von oben beschränkt, (bzw. von unten beschränkt, falls eine Zahl K mit xn ≤ K (bzw. mit xn ≥ K) für alle n im Definitionsbereich der Folge existiert. Eine Folge (an ) reeller oder komplexer Zahlen ist beschränkt, falls eine Zahl K ≥ 0 mit |an | ≤ K für alle Folgenglieder existiert. Im den folgenden Betrachtungen wollen wir der Einfachheit halber voraussetzen, daß N der Definitionsbereich der Folge ist. Die folgenden Sätze übertragen sich alle auf den einseitig unendlichen Fall, aber ein Teil von ihnen ist für zweiseitig unendliche Folgen falsch. Fakt 1. • Eine Folge reeller Zahlen ist genau dann beschränkt, wenn sie von oben und von unten beschränkt ist. • Eine Folge (an ) ist genau dann beschränkt, wenn eine Zahl K und ein no ∈ N mit |an | ≤ K für n ≥ no existieren. Beweis. Zum ersten Punkt bemerkt man, daß eine betragsmäßig durch K beschränkte Folge reeller Zahlen auf Grund der Regeln für Absolutbeträge an von unten durch −K und von oben durch K beschränkt ist. Andererseits ist eine von oben durch A und von unten durch B beschränkte reelle Folge dem Betrage nach durch max(A, −B) beschränkt. Unter der im zweiten Punkt formulierten Bedingung sei K̃ das Maximum der endlich vielen Zahlen K und |an | mit 0 ≤ n ≤ no , dann gilt |an | ≤ K̃ für n ∈ N. In die umgekehrte Richtung ist der zweite Punkt trivial. Zwischen der Konvergenz reeller und komplexer Zahlenfolgen besteht ein enger Zusammenhang. Satz 2. Eine Folge komplexer Zahlen (zn )∞ n=no konvergiert genau dann gegen eine komplexe Zahl z, wenn limn→∞ ℜ(zn ) = ℜ(z) und limn→∞ ℑ(zn ) = ℑ(z) gilt. Folgerung 1. Eine Folge reeller Zahlen konvergiert genau dann in R (also im Sinne von Definition 1 mit K = R), wenn sie in C (also im Sinne von Definition 1 mit K = C) existiert. In diesem Fall stimmen ihre Limites in R und C überein. Soweit keine anderen Voraussetzungen angegeben sind, sind die folgenden Sätze sowohl für Folgen reeller als auch für Folgen komplexer Zahlen richtig. Der folgende Satz entspricht Satz 1 bei Forster. Satz 3. Jede konvergente Zahlenfolge ist beschränkt. 14 Der folgende Satz faßt hauptsächlich die Sätze 3 und 4 sowie die Korollarien 1 und 2 bei Forster zusammen: Satz 4. • Summe, Differenz und Produkt zweier konvergenter Folgen an und bn sind konvergent, und es gilt lim an + bn = lim an + lim bn n→∞ n→∞ n→∞ lim an − bn = lim an − lim bn n→∞ n→∞ n→∞ lim an · bn = lim an lim bn n→∞ n→∞ n→∞ • Das Produkt einer konvergenten Folge mit einer Zahl λ ist konvergent, und es gilt lim λan = λ lim an . n→∞ n→∞ • Wenn die Folge an konvergiert, so konvergieren auch die Folgen |an | und an , und es gilt lim |an | = lim an n→∞ n→∞ lim an = lim an n→∞ n→∞ • Wenn die Folge an beschränkt ist und die Folge bn gegen 0 konvergiert, so konvergiert auch die Folge an bn gegen 0. Beispiel 3. • Es gilt limn→∞ • Es gilt limn→∞ n2−n = 0. 2n −1 2n = 1. Der folgende Satz enspricht Satz 5 bei Forster: Satz 5. Seien an und bn zwei konvergente Folgen reeller oder komplexer Zahlen, wobei der Limes der Folge bn nicht verschwindet. Dann gibt es ein no mit bn 6= 0 für n ≥ no , die Folge der Quotienten an /bn ist konvergent, und limn→∞ an an = . lim n→∞ bn limn→∞ bn Beispiel 4. Es gilt limn→∞ 1+2n 1−2n = 1. Satz 6 bei Forster besagt: Satz 6. Wenn an und bn zwei konvergente Folgen reeller Zahlen sind und wenn an ≤ bn für genügend große n gilt (maW, falls ein no ∈ N mit an ≤ bn für n ≥ no existiert), so gilt lim an ≤ lim bn . n→∞ n→∞ Als Folgerung für den Spezialfall, in dem eine der betrachteten Folgen konstant ist, haben wir Folgerung 2. Wenn für eine konvergente Folge reeller Zahlen an ≤ A (bzw. an ≥ B) für genügend große n gilt, so gilt limn→∞ an ≤ A (bzw. limn→∞ an ≥ B). 2. GRENZWERTE 15 Wir formulieren noch den folgenden Fakt 2. Wenn an konvergent ist, so ist für jedes k ∈ Z auch die Folge an+k konvergent mit demselben Limes. P∞ Definition 3. Eine unendliche Reihe n=a an konvergiert gegen s, falls die Folge der Pm Partialsummen sm = n=a an gegen s konvergiert. Eine nicht konvergente unendliche Reihe nennt man divergent. P Satz 7. • Wenn eine unendliche Reihe ∞ n=a an konvergiert, so konvergiert die Folge der an gegen 0. Insbesondere ist diese Folge beschränkt. P∞ P • Sei b ≥ a, eine unendliche Reihe n=a an konvergiert genau dann, wenn ∞ n=b an konvergiert, und es gilt in diesem Fall ∞ X an = n=a b−1 X an + n=a ∞ X an . n=b Beweis. Im ersten Punkt möge die Reihe gegen s konvergieren, dann gilt lim an = lim sn − lim sn−1 = s − s = 0. n→∞ n→∞ Pm P Für die zweite Aussage seien sm = n=a an und s′m = m n=b an die Teilsummen der betrachPb−1 ′ teten Folgen, dann gilt sm = sm + n=a an für m ≥ b, und man kann die obigen Regeln für Limites von Folgen anwenden. n→∞ Die folgenden Sätze haben dieselbe Nummer und denselben Beweis wie bei Forster. Satz 8. Sei q eine komplexe Zahl. • Für |q| < 1 gilt limn→∞ q n = 0 und im Fall q = 1 gilt limn→∞ q n = 1. In allen anderen Fällen hat die Folge q n für n → ∞ P keinen Grenzwert in C. n • Die unendliche geometrische Reihe ∞ n=0 q konvergiert genau dann, wenn |q| < 1 gilt. In diesem Fall gilt ∞ X 1 . (1) qn = 1 − q n=0 Beweis. Im ersten Punkte folgt die Konvergenz q n → 0 für |q| < 1 aus Folgerung .1.3.2, und im Fall q = 1 liegt eine konstante Folge vor. Angenommen, es gilt |q| ≥ 1 und q 6= 1, und die komplexe Zahl g ist Grenzwert von q n für n → ∞. Es gilt |g| = lim |q n | = lim |q|n ≥ 1 n→∞ n→∞ nach Folgerung 2 und Satz 4. Es gilt also g 6= 0. Andererseits gilt qg = lim q · q n = lim q n+1 = lim q n = g n→∞ n→∞ n→∞ nach Satz 4 und Fakt 2. Es gilt also (q − 1)g = 0, und wegen q 6= 0 folgt g = 0 im Widerspruch zum vorher Gezeigten. Also war unsere Annahme der Existenz des Grenzwertes g falsch. 16 Nach Satz 7 ist limn→∞ q n = 0 eine notwendige Bedingung für die Konvergenz der linken Seite von (1). Nach dem ersten Punkt ist dies genau für |q| < 1 der Fall. Es verbleibt also, (1) im Fall |q| < 1 zu zeigen. Der Beweis der Summenformel für endliche geometrische Reihen benutzt nur die Körperaxiome und überträgt sich also auf den Fall komplexer Zahlen. Es gilt also k X q k+1 − 1 n q = , q−1 n=0 wobei der Nenner wegen |q| < 1 nicht 0 ist. Die Behauptung folgt aus dem ersten Punkt, wonach limk→∞ q k+1 = 0 aus |q| < 1 folgt. Im folgenden setzen wir der Einfachheit halber voraus, daß die Summation der Reihen bei 0 beginnt. Der Satz gilt auch, wenn die Summation bei einem anderen Startindex beginnt. Dieser muß aber bei beiden Reihen an und bn derselbe sein. P P∞ Satz 9. Seien ∞ unendlichePReihen, und sei λ ∈ R. n=0 an und n=0 bn zwei konvergente P Dann konvergieren auch die unendlichen Reihen ∞ (a + bn ) und ∞ n=0 n n=0 λan , und ∞ X (an + bn ) = n=0 ∞ X n=0 ∞ X an + n=0 ∞ X λan = λ ∞ X bn n=0 an . n=0 P P∞ Wenn an ≤ bn für alle n ∈ N gilt, so gilt ∞ a ≤ n n=0 n=0 bn . Insbesondere ist die Summe einer Reihe mit nichtnegativen Summanden nichtnegativ. Der Satz ergibt sich sofort aus den entsprechenden Eigenschaften für endliche Summen und für Grenzwerte. Definition 4. Eine Folge an reeller Zahlen ist bestimmt divergent gegen +∞ (bzw. gegen −∞), falls zu jeder reellen Zahl K ein m ∈ N mit an ≥ K (bzw. an ≤ K) für n ≥ m existiert. Man drückt diesen Sachverhalt oft durch limn→∞ an = ∞ (bzw. limn→∞ an = −∞) aus. Wenn man R = R ∪ {±∞} durch −∞ < t < ∞ für alle t ∈ R ordnet, so können die Definitionen von Konvergenz und bestimmter Divergenz für Folgen wie folgt vereinheitlicht werden: Fakt 3. Sei (an ) eine Folge reeller Zahlen und A ∈ R. Genau dann gilt limn→∞ an = A, wenn die folgenden Bedingungen beide richtig sind: • Ist à ∈ R und gilt à < A, so gilt an > à für alle genügende großen n. • Ist à ∈ R und gilt à > A, so gilt an < à für alle genügende großen n. Beispiel 5. Die Folgen an = n bzw. an = 2n sind bestimmt divergent gegen ∞. Die Folge an = (−1)n ist divergent, aber nicht bestimmt divergent. 2. GRENZWERTE 17 Beispiel 6. Sei q ∈ R. Es gilt limn→∞ q n = ∞ genau dann, wenn q > 1 gilt. Für kein q ∈ R divergiert q n für n → ∞ bestimmt gegen −∞. Der folgende Satz ist eine Zusammenfassung und leichte Verallgemeinerung der Sätze 9 und 10 bei Forster. Soweit die Behauptungen allgemeiner sind als bei Forster, ist der in der Vorlesung gegebene Beweis eine offensichtliche Verallgemeinerung. Es ist ausreichend, die Beweise bei Forster zu verstehen. Satz 10. Wenn die Folge an bestimmt divergent gegen ∞ oder −∞ ist, so existiert 1/an für genügend große n, und es gilt lim 1/an = 0. n→∞ Dasselbe gilt unter der schwächeren Voraussetzung, daß die Folge |an | gegen ∞ bestimmt divergiert und es gilt auch die Umkehrung dieser Aussage: Wenn die Folge 1/an für genügend große n definiert ist und gegen 0 konvergiert, so divergiert die Folge der |an | bestimmt gegen ∞. Folgerung 3. Eine Folge positiver bzw. negativer Zahlen konvergiert genau dann gegen 0, wenn die Folge ihrer Kehrwerte bestimmt gegen ∞ (bzw. −∞) divergiert. Ohne den (einfachen) Beweis teilen wir noch mit: Fakt 4. Das Produkt zweier bestimmt divergenter Folgen ist bestimmt divergent. Dasselbe gilt auch für deren Summe, wenn sie beide in dieselbe Richtung bestimmt divergent sind, und für deren Differenz, wenn sie in unterschiedliche Richtungen bestimmt divergieren. Die Regeln aus Satz 4 gelten auch in dieser Situation, wobei man und ∞ + ∞ = ∞ · ∞ = ∞ − (−∞) = (−∞) · (−∞) = ∞ · ∞ = ∞ (−∞) + (−∞) = (−∞) − ∞ = (−∞) · ∞ = ∞ · (−∞) = ∞ setzt. Die Summe aus einer beschränkten und einer bestimmt divergenten Folge divergiert bestimmt in dieselbe Richtung, dasselbe gilt für da Produkt aus einer bestimmt divergenten Folge und einer positiven reellen Zahl oder aus einer bestimmt divergenten Folge und einer von unten durch eine positive Zahl beschränkten Folge. 2.2. Das Vollständigkeitsaxiom. Die bisher aufgestellten Axiome für den Bereich der reellen Zahlen sind für unsere Zwecke nicht ausreichend. Es gibt nämlich viele für die Anwendungen wichtige Folgen, deren Konvergenz man nur mit Hilfe eines weiteren Axioms, des Vollständigkeitsaxiomes, zeigen kann. Definition 1. Monotone bzw. streng monotone Folge. Fakt 1 (Vollständigkeitsaxiom). Es gelten die beiden folgenden Aussagen, die bereits auf Grund der bisherigen Axiome äquivalent sind: • Jede monoton wachsende und von oben beschränkte Folge reeller Zahlen konvergiert. • Jede monoton fallende und von unten beschränkte Folge reeller Zahlen konvergiert. 18 Beweis. Nur die Äquivalenz der beiden Aussagen auf Grund der bisherigen Axiome muß bewiesen werden, da ihre Gültigkeit ein neues Axiom ist. Wenn an die Voraussetzungen eines Punktes erfüllt, so erfüllt −an die Voraussetzungen des anderen. Wenn −an konvergiert, so konvergiert die Folge an = −1 · (−an ) auf Grund der letzten Aussage von Satz .2.1.4 (mit λ = −1). Die Äquivalenz der beiden Behauptungen folgt. Fakt 2. Jede monoton wachsende Folge reeller Zahlen ist konvergent oder gegen ∞ bestimmt divergent. Jede monoton fallende Folge reeller Zahlen ist konvergent oder gegen −∞ bestimmt divergent. Aus dieser Fassung des Vollständigkeitsaxiomes ergibt sich die Existenz der Limites in der folgenden Definition: Definition 2. Sei (an ) eine Folge reeller Zahlen. Wir setzen sup{an |n ≥ no } = lim max(ano , . . . , ak ) k→∞ inf{an |n ≥ no } = lim min(ano , . . . , ak ) k→∞ lim sup an = lim sup{ak |k ≥ n} n→∞ n→∞ lim inf an = lim inf{ak |k ≥ n} n→∞ n→∞ Für die beiden letzten Definitionen vereinbaren wir dabei, daß der Limes einer konstanten Folge ±∞ gleich dem allgemeinen Folgenglied ±∞ ist. Fakt 3. Es gilt sup{an |n ≥ no } = − inf{−an |n ≥ no } inf{an |n ≥ no } = − sup{−an |n ≥ no } lim inf an = − lim sup −an n→∞ n→∞ lim inf an = − lim sup −an . n→∞ n→∞ sowie sup{λan |n ≥ no } = λ inf{an |n ≥ no } inf{λan |n ≥ no } = λ sup{an |n ≥ no } lim inf λan = λ lim sup an n→∞ n→∞ lim inf λan = λ lim sup an n→∞ n→∞ für alle reellen Zahlen λ ≥ 0, wobei wir in diesem Fall ausnahmsweise 0 · ∞ = 0 · −∞ = 0 setzen dürfen. Fakt 4. Sei (an ) eine Folge reeller Zahlen. • Sei A = sup{ak |k ≥ n} ∈ R. Für alle k ≥ n gilt dann ak ≤ A, und A ist das kleinste Element von R mit dieser Eigenschaft. 2. GRENZWERTE 19 • Sei A = inf{ak |k ≥ n} ∈ R. Für alle k ≥ n gilt dann ak ≥ A, und A ist das größte Element von R mit dieser Eigenschaft. • Sei A = lim supn→∞ an ∈ R. Dann gilt für jedes à ∈ R mit à > A die Ungleichung an < à für alle genügend großen n, und A ist das größte Element von R mit dieser Eigenschaft. • Sei A = lim inf n→∞ an ∈ R. Dann gilt für jedes à ∈ R mit à < A die Ungleichung an > à für alle genügend großen n, und A ist das kleinste Element von R mit dieser Eigenschaft. Fakt 5. Sei (an ) eine Folge reeller Zahlen und A ∈ R. Dann gilt limn→∞ an = A genau dann, wenn lim inf n→∞ an = lim supn→∞ an = A gilt. Für eine einfache und geschlossene Formulierung des Beweises nutzen wir Fakt .2.1.3. Bemerkung 1. Im Unterschied zum Grenzwert sind die oberen und unteren Häufungsgrenzen lim sup und lim inf für Folgen reeller Zahlen stets definiert (sie können freilich ±∞ sein). Nach dem Fakt ist die Folge genau dann konvergent oder bestimmt divergent, wenn beide Häufungsgrenzen übereinstimmen. Sind sie dabei endlich, so liegt Konvergenz vor, andernfalls bestimmte Divergenz. Definition 3. Eine Folge ist eine Fundamentalfolge (bzw. eine Cauchy-Folge bzw. in sich konvergent, falls es zu jeder positiven reellen Zahl ε ein n ∈ N gibt, so daß |ak − al | < ε für min(k, l) ≥ n gilt. Fakt 6. Eine Folge komplexer Zahlen an ist genau dann eine Cauchyfolge, wenn die Folgen ℜan und ℑan Cauchyfolgen sind. Satz 1. Eine Zahlenfolge ist genau dann eine Cauchyfolge, wenn sie konvergiert. Bemerkung 2. Ohne das Vollständigkeitsaxiom könnte immer noch bewiesen werden, daß konvergente Folgen Cachy-Folgen sein müssen. Die umgekehrte Aussage ist eine äquivalente Umformulierung des Vollständigkeitsaxiomes, ohne welches nicht die Existenz des Limes von Cauchy-Folgen gezeigt werden kann, sondern nur deren Beschränktheit. ∞ Definition 4. Eine Teilfolge einer Folge (an )∞ n=no ist eine Folge der Form (aik )k=ko , wobei ∞ (ik )k=ko eine streng monoton wachsende Folge ganzzahliger Indizes ist, die alle ≥ no sind. Fakt 7. Eine Teilfolge einer konvergenten Folge ist konvergent. Satz 2. Sei (an )∞ n=no eine Folge reeller Zahlen, dann gibt des Teilfolgen dieser Folge, deren Limites lim inf n→∞ an und lim supn→∞ an sind. Beweis. Wir betrachten nur lim sup, der Fall lim inf geht analog dazu. Sei l = lim supn→∞ an . (−) (+) Im Fall l < ∞ sei ln± = l ± 2−n , andernfalls ln = n und ln = ∞. In jedem Fall gilt, nach (+) Fakt 4, an < ln für alle genügend großen n. Nach der in Fakt 4 formulierten Minimalitätsei(−) genschaft von lim sup gibt es beliebig große n mit an > ln . 20 (+) Sei nun i−1 = no . Wenn k ≥ 0 und ik−1 schon gewählt ist, sei b > ik−1 so daß an < lk für (−) (−) n ≥ b gilt. Nach der vorhin formulierten Eigenschaft von lk gibt es ein ik ≥ b mit aik > lk . (−) (+) Die Folge der Indizes (ik )∞ < aik < lk für alle k, woraus k=0 ist streng monoton, und lk limk→∞ aik = l folgt. Folgerung 1 (Bolzano-Weierstraß). Aus jeder beschränkten Folge reeller oder komplexer Zahlen kann man eine konvergente Teilfolge auswählen. Beweis. Für beschränkte Folgen reeller Zahlen gilt lim supn→∞ an < ∞, und die Behauptung folgt aus dem Satz. Für beschränkte Folgen komplexer Zahlen sind die Folgen der Realund Imaginärteile beschränkt. Man kann also nach dem soeben betrachteten Fall reeller Zahlen erst eine streng monotone Indexfolge ik finden, so daß die Folge ℜaik konvergiert, und dann eine weitere Indexfolge (kl )∞ l=0 , so daß die Folge ℑaikl konvergiert. Dann konvergiert die Folge ∞ (aikl )l=0 nach Satz .2.1.2. 2.3. Konvergenzkriterien für Reihen. Ohne Kapitelnummer aufgeführte Sätze aus Forster stammen aus Forster, §8. P Satz 1. Ein Reihe ∞ nichtnegativer reeller Zahlen konvergiert geau dann, wenn die k=0 akP Folge der Partialsummen sn = nk=0 ak von oben beschränkt ist. Ist die Folge der Partialsummen unbeschränkt, so divergiert die Reihe gegen ∞ bestimmt. Beweis. Die Aussage entspricht Satz 2 bei Forster und folgt leicht aus Fakt .2.2.1. Bemerkung 1. Die Aussage gilt mutatis mutandis auch für Reihen mit nichtpositiven ak . Satz 2 (Leibniz). Sei (an )∞ n=0 eine monoton fallende Folge nichtnegativer Zahlen. P∞ k • Die Reihe k=0 (−1) ak konvergiert genau dann, wenn limn→∞ an = 0 gilt. P Pl k k • In diesem Fall sei s = ∞ k=0 (−1) ak und sl = k=0 (−1) ak , dann gilt sl ≥ s für gerade und sl ≤ s für ungerade l. Die Notwendigkeit folgt aus Satz .2.1.7 und die Hinlänglichkeit ist Satz 4 bei Forster mit demselben Beweis. P∞ Definition P∞ 1. Eine Reihe n=0 an reeller oder komplexer Zahlen konvergiert absolut, wenn die Reihe n=0 an absolut konvergiert. Fakt 1. Eine Reihe komplexer Zahlen konvergiert genau dann absolut, wenn sowohl die Reihe der Realteile als auch die Reihe der Imaginärteile absolut konvergieren. P Satz 3. Eine absolut konvergente Reihe ∞ n=0 an reeller oder komplexer Zahlen konvergiert auch im gewöhnlichen Sinne, und es gilt ∞ ∞ X X (1) an ≤ |an | . n=0 n=0 2. GRENZWERTE 21 P P Beweis. Sei sn = nk=0 ak , s′n = nk=0 |ak |. In beiden Fällen sei auch der Fall n = −1 zugelassen, welcher der leeren Summe entspricht. Dann folgt aus der Dreiecksungleichung für endliche Summen n n X X |sn − sm | = ak ≤ |ak | = s′n − s′m k=m+1 k=m+1 P∞ für −1 ≤ m ≤ n < ∞. Da k=0 |ak | konvergiert, bilden die s′n eine Cauchyfolge. Unmittelbar aus den Definitionen und der letzten Ungleichung folgt, daß auch die sn eine Cauchyfolge bilden. Damit ergibt sich die Behauptung über die Konvergenz der Ausgangsreihe aus Satz .2.2.1. Als Spezialfall m = −1 der vorhin gezeigten Ungleichung ergibt sich |sn | ≤ |s′n |, also gilt lim sn = lim |sn | ≤ lim |s′n | , n→∞ n→∞ n→∞ und (1) folgt. P∞ Satz 4. Die konvergente Reihe P∞ n=0 an nichtnegativer reeller Zahlen sei eine absolut konvergente Majorante der Reihe es gelte also |bn | ≤ an . n=0 bn reeller oder komplexer Zahlen,P P∞ Wenn die Reihe n=0 an konvergiert, so konvergiert auch die Reihe ∞ n=0 bn . Wenn für jede P∞ (i) P∞ natürliche Zahl i ein Reihe n=0 an gegeben ist und n=0 an eine gemeinsame Majorante dieser Reihen ist, so gilt ∞ ∞ X X lim a(i) = lim a(i) n n n=0 i→∞ i→∞ n=0 Beweis. Der erste Teil ist Satz 6 bei Forster und wird wie folgt bewiesen: Wir haben n X k=0 |bk | ≤ n X ak , k=0 wobei die rechte Seite auf Grund von Satz 1 beschränkt ist. Also ist auch die linke Seite dieser Ungleichung beschränkt, und die absolute Konvergenz der untersuchten Reihe folgt aus Satz 1. Zum Beweis der zweiten Behauptung sei ε > 0 vorgegeben, wir wählen ein no mit ∞ X n=no ε ak < , 3 (m) was auf Grund der Konvergenz von n=0 an möglich ist, und ein mo mit bn − bn ≤ 0 ≤ n < no und m > mo . Für m > mo gilt ∞ n −1 ∞ nX ∞ ∞ o o −1 X X X X X (m) (m) (m) bn − bn = bn − bn + bn − bn n=0 n=0 n=0 n=0 no no nX ∞ ∞ o −1 X X (m) bn − b(m) ≤ + b + b n n n n=0 n=n n=n P∞ o o ε 3no für 22 < nX o −1 n=0 ε ε ε + + =ε 3no 3 3 wie für die zweite Aussage benötigt, wobei auf der letzten Zeile ∞ ∞ ∞ X X X ε bn ≤ |bn | ≤ an < n=n n=n 3 n=n o o sowie eine analoge Ungleichung für die (m) bn o benutzt wurden. (n) Folgerung 1 (Satz über die monotone Konvergenz). Wenn (ak )∞ n,k=0 eine in n monoton wachsende Doppelfolge nichtnegativer reeller Zahlen ist, so gilt ∞ ∞ X X (n) (n) lim ak = lim ak . n→∞ k=0 k=0 n→∞ P Satz 5 (Quotientenkriterium). Es konvergiert jede Reihe ∞ n=0 an reeller oder komplexer Zahlen, für die eine positive reelle Zahl Θ < 1 mit |an+1 | ≤ Θ |an | für genügend große n existiert. Der Satz entspricht Satz 7 bei Forster. Satz 6. Die Exponentialreihe exp(x) = absolut, und es gilt P∞ xn n=0 n! konvergiert für beliebige komplexe Zahlen exp(x) = lim (1 + x/i)i . (2) i→∞ Aus limm→∞ xm = x folgt limm→∞ exp(xm ) = exp(x). Wenn (xm )∞ m=0 eine gegen 0 konvergente Folge von 0 verschiedner komplexer Zahlen ist, so gilt exp(xm ) − exp(x) = 1. (3) lim m→∞ xm Beweis. Die absolute Konvergenz der Exponentialreihe ergibt sich leicht aus dem Quotientenkriterium, siehe Satz 8.1 bei Forster. Zum Beweis von (2) berechnen wir die Folgenglieder auf der linken Seite mit dem binomischen Lehrsatz: m ∞ X x m X m xn (1 + ) = = b(m) n n m m n n=0 n=0 xn (m) . Aus mit bn = m n mn b(m) = n n n−1 n−1 n−1 Y m−i xn Y m − i xn Y (m − i) = = b n n!mn i=0 n! i=0 m m i=0 (m) x mit bn = n! ergibt sich einmal limn→∞ bn = bn für jede natürliche Zahl n und zum zweiten (m) bn ≤ |bn |. Man kann also Satz 4 mit der absolut konvergenten Exponentialreihe an = |bn | = 2. GRENZWERTE |x|n /n! als Majorante anwenden und erhält lim (1 + x/m)m = lim m→∞ m→∞ ∞ X b(m) = n n=0 23 ∞ X bn = exp(x). n=0 Es gelte limm→∞ xm = x, dann existiert eine obere Schranke R für die xm , und mit bn = n (m) (m) x /n!, bn = xnm /n! gilt limm→∞ bn = bn , wobei Satz 4 mit an = Rn! als Majorante genommen werden kann. Es gelte nun zusätzlich x = 0, und die x, seien alle von 0 verschieden. Da der erste Summand der Exponentialreihe 1 ist, gilt ∞ ∞ ∞ k−1 X X X xnm xnm xm exp(xm ) − 1 = lim = = 1, = lim lim lim m→∞ m→∞ m→∞ xm k! (n + 1)! n=0 m→∞ (n + 1)! n=0 k=1 n wobei die Vertauschung von Limes und unendlicher Summation durch Anwendung von Satz 4 (m) mit bn = xnm /(n + 1)!, bn = 0 und an = Rn /n! gerechtfertigt werden kann. Die Betrachtung der Exponentialreihe zeigt, daß das Quotientenkriterium nützlich ist. Es ist aber nicht der Weisheit letzter Schluß. Beispielsweise erfordert der Beweis des folgenden Satzes eine andere Idee. Satz 7. Die Zeta-Reihe ζ(n) = ∞ X i−n i=1 konvergiert für ganze n > 1 und divergiert für alle anderen ganzen Zahlen n. Beweis. Offenbar reicht es, den Fall n ≥ 0 zu betrachten. 2(k−1)(n−1) ≤ k −1 2X i=2k−1 i−n ≤ 2k(n−1)−1 , und die Behauptung folgt leicht aus Aussagen über die Konvergenz der geometrischen Reihe. Aus dem Satz über die majorisierte Konvergenz leiten wir den folgenden Doppelreihensatz her: Satz 8. Sei (an,m )∞ n,m=0 eine Doppelfolge reeller oder komplexer Zahlen. • Wenn die Zahlen an,m reell und nichtnegativ sind, so gilt ∞ X ∞ X (4) n=0 m=0 an,m = d ∞ X X d=0 m=0 am,d−m = ∞ X ∞ X an,m m=0 n=0 wobei (4) als Gleichung zwischen Elementen von R ∪ {∞} aufzufassen ist.1 1Wobei P∞ P∞ P∞ der äußeren Summe n=0 m=0 an,m der Wert ∞ zugewiesen wird, wenn m=0 an,m für ein n gilt. Ähnlich wird mit der Doppelsumme am rechten Ende von (4) verfahren. 24 • Gilt P∞ P∞ m=0 n=0 |an,m | < ∞, so gilt (4) ebenfalls. Beweis. Wir zeigen zunächst die erste Behauptung. Ist diese gezeigt, so ist schon erwiesen, daß die Voraussetzung des zweiten Punktes symmetrisch in m und n ist. Es genügt daher in beiden Fällen, die linke Gleichung in (4) zu zeigen. Die rechte ergibt sich sodann durch Vertauschung der Rollen der Indizes n und m. Wir haben d ∞ D−n ∞ D X X X X X am,d−m = am,n = (+) sn(D) , d=0 m=0 n=0 m=0 n=0 (N ) es liegt hier eine Umordnung einer endlichen Summe vor, die Zahlen sn ) s(N = n D−n X sind durch am,n m=0 (N ) P∞ definiert. Es gilt limD→∞ s = m=0 an,m , wobei Konvergenz unter den Voraussetzungen des ersten P Punktes monoton und unter den Voraussetzungen des zweiten Punktes majorisiert durch ∞ m=0 |an,m | erfolgt. Es gilt also lim D→∞ ∞ X sn(D) n=0 = ∞ X ∞ X an,m , n=0 m=0 nach dem Satz über die monotone bzw. die majorisierte Konvergenz. Auf der rechten Seite dieser Gleichung steht gerade die linke Seite von (+). Auf der anderen Seite ist, auf Grund der Definition der Summe unendlicher Reihen, der mittlere Term in (4) gerade der Limes für D → ∞ der linken Seite von (+), und die Behauptung ist bewiesen. Bemerkung 2. Ohne irgendwelche Voraussetzungen an die Doppelreihe ist (4) falsch. Als Gegenbeispiel kann die folgende Doppelreihe genommen werden: n=m 1 an,m = −1 n = m + 1 0 andernfalls. Dann gilt ∞ X ∞ X n=0 m=0 ∞ X ∞ X an,m = 0 an,m = 1, m=0 n=0 während P∞ Pd d=0 m=0 am,d−m = P∞ d d=0 (−1) unbestimmt divergent ist. Eng verwandt mit der soeben betrachteten Frage der Vertauschbarkeit von Limes und Summation unendlicher Reihen ist die Frage der Umordnung unendlicher Reihen. 2. GRENZWERTE 25 P Satz 9 (Kleiner Umordnungssatz). Die Reihe ∞ n=0 an konvergiere absolut, und die FunkP f→ N sei bijektiv. Dann konvergiert auch ∞ a absolut, und zwar gegen denselben tion N −− n=0 n Wert wie die Ausgangsreihe. Der Satz entspricht Satz 8 bei Forster mit demselben Beweis. Alternativ dazu kann Satz 8 auf die Doppelreihe ( an m = f (n) bn,m = 0 sonst angewendet werden, denn es gilt ∞ X n=0 ∞ X bn,m = an bn,m = af (n) . m=0 P∞ P∞ SatzP 10 (Produktsatz). Seien a und n n=0 bn zwei absolut konvergente Reihen, und P n=0 sei cn = nk=0 ak bn−k . Dann ist ∞ c absolut konvergent, und es gilt n=0 n ∞ X n=0 cn = ∞ X n=0 an ∞ X n=0 bn . Beweis. Der Beweis P∞sich durch Anwendung von Satz 8 auf die Doppelreihe (CAVE: P ergibt Genauer ausführen?) ∞ m=0 an bm . n=0 Folgerung 2. Für komplexe Zahlen x, y gilt exp(x + y) = exp(x) exp(y). Beweis. Sei an = xn /n! und bb = y n /n!. Wir haben schon gesehen, daß beide Reihen absolut konvergieren. Der Satz ist daher anwendbar, wobei man für die Glieder der Produktreihe n n n n X X 1 X k n−k 1 X k n−k n (x + y)n n! xk y n−k = = = x y x y cn = ak bn−k = k!(n − k)! n! k=0 k!(n − k)! n! k=0 k n! k=0 k=0 erhält. 2.4. Einführung in den Stetigkeitsbegriff. Sei K = R oder K = C und M ⊆ K eine Teilmenge. f→ K und m ∈ M sind folgende Bedingungen äquivalent: Satz 1. Für eine Funktion M −− • Zu jedem ε > 0 existiert ein δ > 0 mit |f (x) − f (m)| < ε für x ∈ M und |x − m| < δ. • Wenn xn eine gegen m konvergierende Folge von Elementen von M ist, so konvergiert die Folge f (xn ) gegen f (m). Definition 1. Eine derartige Funktion nennt man stetig an der Stelle m. Man nennt f stetig, wenn f stetig an allen Stellen m ∈ M ist. 26 Satz 2. • Die konstante Funktion f (x) = c und die identische Funktion f (x) = x sind stetig. • Summe und Produkt zweier an einer Stelle xo stetiger Funktion sind stetig daselbst. Dasselbe gilt für den Kehrwert einer an der Stelle xo stetigen Funktion f mit f (xo ) 6= 0. • Die Einschränkung einer an der Stelle xo stetigen Funktion f mit Definitionsbereich M auf einen kleineren Definitionsbereich M̃ ⊆ M mit xo ∈ M̃ ist weiterhin stetig an der Stelle xo . Insbesondere ist f |M̃ stetig auf ganz M̃ , wenn f stetig auf ganz M ist. • Die Exponentialfunktion ist stetig auf ganz C. Beispiel 1. Die Funktion f (x) = x2 = x · x ist nach den beiden ersten Punkten des Satzes stetig. Im Zusammenhang mit dem folgenden, sehr wichtigen Satz ergibt sich daraus die früher behauptete Existenz von Quadratwurzeln nichtnegativer reeller Zahlen. Definition 2. Definition der abgeschlossenen, halbabgeschlossenen und offenen Intervalle. Satz 3 (Zwischenwertsatz für stetige Funktionen). Sei I = [a, b] ein abgeschlossenes Inf→ R stetig auf ganz I. Sei y eine reelle Zahl mit f (a) ≤ y ≤ f (b) oder tervall und I −− f (b) ≤ y ≤ f (a), dann existiert ein x ∈ I mit f (x) = y. Wir beschreiben als Beweis ein Einschachtelungsverfahren von enormer praktischer Relevanz. f→ [c, d] = I ′ streng monoton wachsend und stetig ist und Satz 4. Wenn I = [a, b] −− g→ I ist stetig f (a) = c sowie f (b) = d gilt, so ist f bijektiv und die Umkehrfunktion I ′ −− und streng monoton wachsend. Dasselbe gilt für streng monoton fallende f mit f (a) = d und f (b) = c, in diesem Fall ist auch g streng monoton wachsend. Beweis. Wir betrachten nur den Fall streng monoton wachsender f . Der Fall eines streng monoton fallenden f geht analog oder kann durch Betrachtung von −f auf diesen zurückgeführt werden. Für den Rest des Beweises sei also f als streng monoton wachsend vorausgesetzt. Die Surjektivität von f ergibt sich aus Satz 3, und die Injektivität von f folgt aus der g→ I. Wäre g nicht streng strengen Monotonie von f . Daher hat f eine Umkehrfunktion I ′ −− monoton wachsend, so gäbe es x < y, x, y ∈ I mit g(x) >= g(y). Auf Grund der Monotonie von f folgt x = f (g(x)) ≥ f (g(y)) = y, ein Widerspruch zu unserer Annahme x < y. Also ist g streng monoton wachsend. Es verbleibt noch der Beweis der Stetigkeit von g. Wir benutzen das nachfolgende Lemma, wonach zum Beweis der Stetigkeit von g an der Stelle x ∈ I ′ der Nachweis von limn→∞ g(xn ) = g(x) für monoton wachsende oder fallende und gegen x konvergierende Folgen xn mit xn ∈ I ′ ausreicht. Auf Grund der Monotonie von g ist die Folge g(xn ) ebenfalls monoton, und wegen g(xn ) ∈ I ist sie beschränkt. Nach Satz .2.3.1 existiert y = limn→∞ g(xn ), und auf Grund der Stetigkeit von f gilt f (y) = lim f (g(xn )) = lim xn = x. n→∞ n→∞ 2. GRENZWERTE 27 Da f und g zueinander inverse Funktionen sind, folgt g(x) = y. Die Stetigkeit von g ist damit bewiesen. Lemma 1. Sei M ⊆ R, f eine reell- oder komplexwertige Funktion auf M und m ∈ M . Genau dann ist f stetig auf M an der Stelle m, wenn für jede monotone Folge (mk ) von Elementen von M mit limk→∞ mk = m der Grenzwert der Folge f (mk ) existiert und mit f (m) übereinstimmt. Das Lemma wird am zweckmäßigsten im Zusammenhang mit allgemeinen Betrachtungen über Limites von Funktionswerten gezeigt, so daß der Beweis noch etwas aufgeschoben werden soll. 2 x−→ Satz • Die Funktion [0, ∞) −− −−x −→ [0, ∞) ist bijektiv, und ihre Umkehrfunktion √ 5. x ist stetig. exp • Die Funktion R −− −→ (0, ∞) ist bijektiv, und ihre Umkehrfunktion log ist stetig. Definition 3. Wenn a eine positive reelle und b eine komplexe Zahl ist, so setzen wir ab = exp(b log a). Aus Folgerung .2.3.2 folgt Fakt 1. Seien a, a′ positive reelle und b, b′ komplexe Zahlen, dann gilt: • (aa′ )b = ab a′b . ′ ′ • ab+b = ab ab ′ ′ • Ist b reell, so gilt abb = (ab )b . Bemerkung 1. Aus der Definition folgt a0 = 1 und a1 = a. Außerdem folgt aus Fakt 1 durch Induktion nach n, daß an für natürliche Exponenten mit den in Definition .1.2.1 eingeführten Potenzen übereinstimmt. Weil für beide Konstruktionen x−n ·xn = 1 gilt, stimmen sie auch für ganzzahlige Exponenten überein.√Aus dem dritten Punkt von Fakt 1 folgt schließlich √ x = x1/2 , denn (x1/2 )2 = x. Analog gilt n x = x1/n für ganze Zahlen n 6= 0. Ähnlich wichtig ist der folgende Satz über die Extremwerte stetiger Funktionen. Satz 6. Sei I = [a, b], −∞ < a < b < ∞, ein beschränktes abgeschlossenes Intervall. Wenn f I −−→ R stetig ist, so gibt es m, M ∈ I mit f (m) ≤ f (x) ≤ f (M ) für alle x ∈ I. Beweis. Es genügt, die Existenz von m zu zeigen, denn dann ergibt sich durch Anwendung dieser Existenzaussage auf −f die Existenz von M . Wir konstruieren induktiv eine Folge In = [an , bn ] mit folgenden Eigenschaften: • I0 = I und In+1 ⊆ In . • bn − an = 2−n (b − a). • Zu jedem n ∈ N und jedem x ∈ I gibt es ein y ∈ In mit f (y) ≤ f (x). Aus dem ersten Punkt folgt, daß die Folge der an monoton wachsend ist. Da alle an zu I gehören, ist die Folge beschränkt. Es konvergiert also m = limn→∞ an . Wir zeigen, daß m die gewünschte Eigenschaft hat. Sei x ∈ I, dann gibt es yn ∈ In mit (+) f (yn ) ≤ f (x). 28 Wegen an ≤ yn ≤ bn folgt b−a . 2n Daraus folgt limn→∞ (yn − an ) = 0, also limn→∞ yn = m. Aus (+) und der Stetigkeit von f folgt so f (x) ≥ limn→∞ f (yn ) = f (m), und m hat in der Tat die gewünschte Minimalitätseigenschaft. Es verbleibt die Konstruktion der Intervalle In mit den angegebenen Eigenschaften. Sei a0 = a und b0 = b. Wenn an und bn schon konstruiert sind so daß die Folge der Intervalle n Ik mit 0 ≤ k ≤ n die geforderten Eigenschaften haben, so sei cn = an +b , In′ = [an , cn ], 2 ′′ ′ ′′ In = [cn , bn ]. Falls für alle x ∈ In ein y ∈ In mit f (y) < f (x) existiert, so sei In+1 = In′′ . Andernfalls gibt es ein x ∈ In′ mit f (y) ≥ f (x) für alle y ∈ In′′ . In diesem Fall setzen wir In+1 = In′ . In jedem Fall gibt es zu jedem υ in In ein ξ ∈ In+1 mit f (ξ) ≤ f (υ). Ist nun x ∈ I, so kann dies auf ein υ ∈ In mit f (y) ≤ f (x) angewendet werden und zeigt die Existenz eines ξ ∈ In+1 mit f (ξ) ≤ f (x). Die anderen Eigenschaften der Intervallfolge zeigt man wie beim Beweis des Zwischenwertsatzes. 0 ≤ y n − an ≤ b n − an = Zunächst ohne Beweis sei hier der folgende Satz formuliert: Satz 7. Sei I = [a, b] und f eine stetige Funktion auf I. Dann ist f gleichmäßig stetig: zu jedem ε > 0 existiert ein δ > 0 mit |f (x) − f (y)| < ε für x, y ∈ I und |x − y| < δ. Fakt 2. Sei M ⊆ K mit K = R oder K = C. Für m ∈ K sind folgende Bedingungen äquivalent: • Es gibt eine Folge von Elementen von M \ {m}, welche gegen m konvergiert. • Für jedes ε > 0 gibt es Elemente x von M \ {m} mit |x − m| < ε. Definition 4. In diesem Fall nennt man m einen Häufungspunkt von M . Fakt 3. Sei m ein Häufungspunkt von M und f eine auf M mit der möglichen Ausnahme von M definierte Funktion. Dann sind folgende Bedingungen an φ ∈ L äquivalent: • Zu jedem ε > 0 gibt es δ > 0 mit |f (x) − φ| < ε für m ∈ M \ {m} und |x − m| < ε. • Für jede gegen m konvergierende Folge (mk ) von Elementen von M \{m} gilt limk→∞ f (mk ) = φ. Die Zahl φ ist durch diese Bedingungen eindeutig bestimmt. Definition 5. Wir schreiben φ = limx→y f (x), falls diese Bedingungen erfüllt sind. Im Fall K = R schreiben wir φ = limx↓y f (x), falls die Bedingungen für f |M ∩ [x, ∞) erfüllt sind, und φ = limx↑y f (x), falls sie für f |M ∩ (−∞, x] erfüllt sind. Fakt 4. Die folgenden Bedingungen sind äquivalent: • φ = limx↓y f (x) • Zu jedem ε > 0 existiert ein δ > 0 mit |f (x) − φ| < ε für y < x < y + δ. • Für jede monoton fallende gegen x konvergente Folge (xk ) von Elementen von M gilt limk→∞ f (xk ) = φ. Eine analoge Charakterisierung gilt für φ = limx↑y f (x). 2. GRENZWERTE 29 Fakt 5. Im Fall K = R gilt limx→y f (x) = φ genau dann, wenn φ = limx↑y f (x) und φ = limx↓y f (x) gilt. Aus den beiden letzten Fakten folgt sofort Lemma 1. Sei nun wieder K = R oder K = C. Fakt 6. Für eine Teilmenge M ⊆ K sind die folgenden Bedingungen äquivalent: • Jeder Häufungspunkt von M gehört zu M . • Wenn eine Folge von Elementen von M konvergiert, so gehört ihr Limes zu M . Definition 6. Eine Teilmenge von K ist abgeschlossen, wenn sie diese äquivalenten Bedingungen erfüllt. Definition 7. Für ε > 0 definieren wir die ε-Umgebung Kε (x) = y ∈ K |x − y| < ε}. Eine Teilmenge U von K ist eine Umgebung von x, falls es ein ε > 0 gibt, so daß U die ε-Umgebung Kε (x) enthält. Fakt 7. Für eine Teilmenge M ⊆ K sind die folgenden Bedingungen äquivalent: • Für jedes m ∈ M gibt es ein ε > 0 mit Kε (m) ⊆ M . • Die Menge M ist Umgebung jedes ihrer Elemente. • Das Komplement K \ M ist abgeschlossen in K Definition 8. Eine derartige Menge nennt man offen in K. Fakt 8. • Die leere Menge und K selbst sind sowohl offen als auch abgeschlossen in K. • Endliche Vereinigungen und beliebige Durchschnitte abgeschlossener Teilmengen sind abgeschlossen. • Endliche Durchschnitte und beliebige Vereinigungen offener Teilmengen sind offen. • Eine Teilmenge von R ist genau dann abgeschlossen in R, wenn sie abgeschlossen in C ist. Fakt 9. • R ist nicht offen in C. • Für reelle Zahlen a < b ist [a, b] das einzige abgeschlossene und (a, b) das einzige (in R) offene Intervall mit Intervallgrenzen a und b. • Für reelle Zahlen a sind (−∞, a] und [a, ∞) abgeschlossen, aber nicht offen in R. Dagegen sind (a, ∞) aund (−∞, a) offen in R, aber nicht abgeschlossen. 2.5. Supremum und Infimum von Mengen. Wir haben schon in Definition .2.2.2 Supremum und Infimum von Folgen eingeführt. In den folgenden Ausführungen sollen Supremum und Infimum von Mengen betrachtet werden. Definition 1. Sei M ⊆ R eine Teilmenge. Eine reelle Zahl m ist eine obere Schranke von M , falls für alle µ ∈ M µ ≤ m (bzw. µ ≥ m) gilt. Eine Zahl m ist ein Supremum (bzw. Infimum) von M , falls folgende Eigenschaften gelten: • Die Zahl m ist eine obere (bzw. untere) Schranke für M . 30 • Sei m̃ eine beliebige obere (bzw. untere) Schranke von M , dann gilt m ≤ m̃ (bzw. m ≥ m̃). Das Supremum (bzw. Infimum) einer Menge reeller Zahlen bezeichnet man mit sup M bzw. inf M . Fakt 1. • Wenn K eine obere (bzw. untere) Schranke von M ⊂ R ist, so ist auch jede reelle Zahl L mit L ≥ K (bzw. L ≤ K) eine obere (bzw. untere) Schranke von M . • Seien M und X Untermengen von R. Wenn jedes Element von X eine untere Schranke von M ist und wenn das Supremum von X existiert, so ist sup X ebenfalls eine untere Schranke von M . Eine analoge Behauptung gilt für das Infimum jeder Menge, deren Elemente obere Schranken von X sind. • Eine obere (bzw. untere) Schranke für M ist auch eine obere (bzw. untere) Schranke für jede Teilmenge von M . Insbesondere ist jede Teilmenge einer beschränkten Menge beschränkt. • Wenn eine Teilmenge von R von oben (bzw. unten) beschränkt ist, so gibt es auch eine ganze Zahl, welche obere (bzw. untere) Schranke dieser Teilmenge ist. • Der Limes einer Folge von oberen (bzw. unteren) Schranken von M ist eine obere (bzw. untere) Schranke von M . Beweis. Die erste Behauptung ist eine triviale Konsquenz der Definitionen. Angenommen, alle Elemente von X sind untere Schranken von M , und s = sup X existiert. Sei m ∈ M . Weil X aus unteren Schranken von M besteht, gilt x ≤ m für jedes x ∈ X. Also ist m eine obere Schranke von X, und aus der Definition des Begriffes Supremum folgt m ≥ s. Also ist auch s eine untere Schranke von M . Diese Betrachtung überträgt sich mutatis mutandis auf obere Schranken und Infima. Zum Beweis des vorletzten Punktes sei etwa s eine untere Schranke von M , dann ist ⌊s⌋ ganzzahlig und (wegen ⌊s⌋ ≤ s) ebenfalls eine untere Schranke von M . Für den letzten Punkt sei s = limk→∞ sk , wobei jede Zahl sk eine obere Schranke von M ist. Für jedes m ∈ M und alle k gilt dann m ≤ sk . Nach Folgerung .2.1.2 folgt m ≤ s. Da dies für alle m ∈ M gilt, ist s eine obere Schranke von M . Fakt 2. • Jede Menge reeller Zahlen hat höchstens ein Supremum und höchstens ein Infimum. Es macht also Sinn, von dem Supremum bzw. Infimum zu sprechen. • Wenn m das größte (bzw. kleinste) Element der Menge M ist, so ist m auch das Supremum (bzw. Infimum) von M . • Eine Zahl m ist genau dann eine untere Schranke bzw. das Infimum derMenge M , wenn −m eine obere Schranke bzw. das Supremum der Menge −M = −µ µ ∈ M ist. • Sei N eine Teilmenge von M , es gilt sup(N ) ≤ sup(M ) inf(N ) ≤ inf(M ), sofern beide Seiten dieser Ungleichungen existieren. 2. GRENZWERTE 31 Beweis. Angenommen, m und m̃ sind zwei Infima von M . Aus der Definition folgt m ≥ m̃ und (mit vertauschten Rollen) m̃ ≥ m, woraus sich m = m̃ ergibt. Die zweite und die dritte Behauptung ist offensichtliche Konsequenzen der Definition. Offenbar muß nicht jede von unten beschränkte Menge reeller Zahlen ein kleinstes Element enthalten. Sei dazu etwa M die Menge aller positiven reellen Zahlen. Für jedes m ∈ M gilt m/2 ∈ M und m/2 < m, weswegen m nicht das kleinste Element von M sein kann. Das Infimum ist, falls es existiert, die größte reelle Zahl, welche kleiner oder gleich jedem Element von M ist. Beispielsweise ist 0 das Infimum der Menge aller positiven reellen Zahlen. Wenn das Infimum einer Menge M existiert zu dieser gehört, so ist es deren kleinstes Element. Andernfalls, also wenn das Infimum von M nicht existiert oder nicht zu M gehört, enthält M kein kleinstes Element. Daß dem so ist, folgt unmittelbar aus den Definitionen bzw. aus dem obigen Fakt. Wir hatten am Anfang der Vorlesung im Zusammenhang mit der Methode der vollständigen Induktion das Prinzip aufgestellt, wonach jede nichtleere Menge natürlicher Zahlen (oder jede von unten beschränkte nichtleere Menge ganzer Zahlen) ein kleinstes Element enthält. Ein analoger Sachverhalt für nichtleere von unten beschränkte Mengen reeller Zahlen wäre, wie wir gesehen haben, auf jeden Fall falsch, aber eine äquivalente Umformulierung des Vollständigkeitsaxiomes ist Satz 1. Es gelten die beiden folgenden Behauptungen: • Jede nichtleere von unten beschränkte Teilmenge von R hat ein Infimum. • Jede nichtleere von oben beschränkte Teilmenge von R hat ein Supremum. Bemerkung 1. Man kann zeigen, daß die beiden Behauptungen bereits auf Grund der übrigen Axiome äquivalent zueinander und zum Vollständigkeitsaxiom sind. Die Äquivalenz der beiden Behauptungen ist eine Folge von Fakt 2. Es genügt also, die Existenz des Supremums nichtleerer von oben beschränkter Teilmengen von R zu zeigen. Für den Beweis des Satzes brauchen wir den folgenden Fakt: Fakt 3. • Jede von oben beschränkte, nichtleere Teilmenge von Z enhält ein größtes Element. • Jede von unten beschränkte, nichtleere Teilmenge von Z enhält ein kleinstes Element. Beweis. Es genügt der Nachweis des ersten Punktes, denn der zweite geht analog dazu. Nach Fakt 1 gibt es eine Zahl b ∈ Z, welche obere Schranke von M ist. Dann ist b − M = b − m m ∈ M eine nichtleere Teilmenge von N und hat daher, wie am Beginn des Skriptes im Zusammenhang mit dem Prinzip der vollständigen Induktion erklärt, ein kleinstes Element d. Dann ist b − d das größte Element von M . Sei M ⊆ R von oben beschränkt und nichtleer. Für jedes k ∈ N ist dann Sk = Beweis. ⌈2k m⌉ m ∈ M eine nichtleere Teilmenge von Z und hat daher ein größtes Element sk . Sei sk+1 = ⌈2k+1 xk ⌉, dann gilt ⌈2k xk ⌉ ≥ sk+1 /2, also gilt sk+1 ≤ 2sk . Die Zahlen 2−k sk bilden also eine monoton fallende Folge. 32 Sei x ∈ X, aus den Definitionen folgt sk ≥ 2k x, also (+) x ≤ 2−k sk . Folglich ist x eine untere Schranke der Folge 2−k sk , nach dem Vollständigkeitsaxiom (Fakt .2.2.1) existiert also s = limk→∞ sk . Da (+) für alle x ∈ X gilt, ist s eine obere Schranke von M . Sei s̃ eine andere obere Schranke von M . Aus den Definitionen folgt sk ≤ ⌈2k s̃⌉, wegen 2k s̃ > ⌈2k s̃⌉ − 1 gilt also s̃ > 2−k sk − 2−k . Durch Übergang zum Limes k → ∞ folgt s̃ ≥ s. Also ist s Supremum von M . 2.6. Abzählbarkeit und Überabzählbarkeit. Definition 1. Zwei Mengen werden gleichmächtig genannt, wenn zwischen ihnen eine bijektive Abbildung existiert. Wir schreiben #(M ) = #(N ). Wir schreiben #(M ) ≤ #(N ), falls eine injektive Abbildung von M nach N existiert. Eine Menge ist abzählbar unendlich, falls sie zur Menge der natürlichen Zahlen gleichmächtig ist. Sie ist überabzählbar, falls sie unendlich und nicht abzählbar ist. Wir schreiben #(M ) < #(N ), falls #(M ) ≤ #(N ) gilt und die beiden Mengen M und N nicht gleichmächtig sind. Der soeben eingeführte Gleichmäßigkeitsbegriff verblüfft anfänglich durch einige unerwartete Eigenschaften. Beispielsweise kann eine unendliche Menge zu einer ihrer echten Teilmengen gleichmächtig sein (man kann ‘unendlich’ sogar so definieren – Unendlichkeit im Sinne von Dedekind). Beispiel 1. Die Mengen N der natürlichen und Z der ganzen Zahlen sind gleichmächtig. f→ Z ist gegeben durch f (n) = n/2 für gerade Beweis. Eine bijektive Abbildung N −− Zahlen n und f (n) = −(n + 1)/2 für ungerade Zahlen n. Die Umkehrabbildung zu f ist durch g(m) = 2m für m ≥ 0 und g(m) = (1 − m)/2 für m < 0 gegeben. Wir bemerken noch: Fakt 1. • Wenn M zu M ′ und N zu N ′ gleichmächtig ist, so ist auch M × N zu ′ ′ M × N gleichmächtig. • Aus #M ≤ #M ′ und #N ≤ #N ′ folgt #(M × N ) ≤ #(M ′ × N ′ ). • Aus N 6= ∅ folgt #(M ) ≤ #(M × N ). µ→ M ′ und N −− ν→ N ′ bijektive Abbildungen sind, so ist Beweis. In der Tat, wenn M −− µ−× M × N −− −−ν→ M ′ × N ′ bijektiv, wobei (µ × ν)(m, n) = (µ(m), ν(n)) gesetzt wird. Die inverse Abbildung zu dieser Abbildung ist µ−1 × ν −1 . Damit ist der erste Punkt bewiesen. Der zweite Punkt kann genauso gezeigt werden, denn aus der Injektivität von µ und ν folgt die Injektivität von µ × ν. Zum Beweis der dritten Aussage sei n ∈ N , wir haben eine injekitve Abbildung M → M × N , m → (m, n). Es ist nicht ganz selbstverständlich, daß zwei Mengen mit |M | ≤ |N | und |N | ≤ |M | gleichmächtig sein müssen. 2. GRENZWERTE 33 Satz 1 (Schröder-Bernstein). Aus |M | ≤ |N | und |N | ≤ |M | folgt die Gleichmächtigkeit von M und N . f→ N Beweis. Auf Grund unserer Voraussetzung existieren injektive Abbildungen M −− g→ M , dann haben wir disjunkte Vereinigungen und N −− M = M∞ ∪ N = N∞ ∪ mit M∞ = T∞ k=0 (gf ) k M , N∞ = S∞ k=0 (f g) k ∞ [ k=0 ∞ [ k=0 N, Mk′ ∪ Nk′ ∪ ∞ [ Mk′′ k=0 ∞ [ Nk′′ k=0 Mk′ = (gf )k M − g(f g)k N = (gf )k M − (gf )k gN, Nk′ = (f g)k N − f (gf )k M = (f g)k N − (gf )k gN, Mk′′ = g(f g)k N − (gf )(k+1) M = (gf )k gN − (gf )(k+1) M sowie Nk′′ = f (gf )k M − (f g)k+1 N = (f g)k N − (gf )k gN − (f g)k+1 N. Dann bildet f Mk′ bijektiv auf Nk′′ ab, während g Nk′ bijektiv auf Mk′′ abbildet. Außerdem f→ N bijektiv. Es gibt also genau eine Bijektion M −− h→ N mit h(x) = f (x) für ist M∞ −− S∞ ∞ ′ S∞ ′′ x ∈ M∞ ∪ k=0 Mk sowie mit g(h(x)) = x für x ∈ k=0 Mk . Man könnte versucht sein, auch die folgende Aussage beweisen zu wollen: Fakt 2 (Version des Auswahlaxiomes). Für je zwei Mengen M , N gilt eine der beiden Ungleichungen #M ≤ #N oder #N ≤ #M . Es wurde aber durch Gödel in eine Richtung und durch Frenkel und Cohen in die andere gezeigt, daß das Auswahlaxiom den übrigen Axiomen der Mengenlehre (auf die wir hier nicht eingegangen sind) weder widerspricht (falls deren Widerspruchslosigkeit vorausgesetzt wird) noch aus ihnen herleitbar ist. Wir bemerken noch: f→ N Fakt 3 (Folgerung aus dem Auswahlaxiom). Wenn eine surjektive Abbildung M −− existiert, so gilt #N ≤ #N . g→ M , indem für g(n) irgendein Beweis. Wir definieren eine injektive Abbildung N −− m ∈ M mit n = f (m) genommen wird. Wegen der Surjektivität von f existiert ein solches m, aber die simultane Auswahl der jeweiligen m für unendlich viele n erfordert die Anwendung des Auswahlaxiomes. Offenbar ist g injektiv, und die Behauptung ist bewiesen. Fakt 4. Jede Teilmenge M von N ist endlich oder abzählbar unendlich. 34 f→ N, indem wir f (k) für k ∈ M Beweis. Wir definieren eine injektive Abbildung M −− gleich der Zahl der Elemente l ∈ M mit l < k setzen. Man kann sich davon überzeugen, daß f M entweder bijektiv auf ganz N abbildet oder auf ein Anfangsstück davon (in welchem Fall M endlich ist). Zusammen mit Fakt 3 folgt Fakt 5. Für jede unendliche Menge M gilt #(M ) ≥ #(N), jede unendliche Menge ist also mindestens abzählbar. Einige unserer Sätze über unendliche Summen können bequem auf abzählbarePIndexmengen verallgemeinert werden. Für endliche Indexmengen I ist offenbar die Summe i∈I f (i) aller f→ C wohldefiniert. Wir betrachten derartige Funktionswerte von f auf I für jede Funktion I −− Summen als trivialerweise absolut konvergent. f→ C eine Funktion. Dann sind folgende Satz 2. Sei I eine abzählbare Indexmenge und I −− Bedingungen äquivalent: ι M , so daß P∞ f (ι(k)) absolut konvergiert. • Es gibt eine Bijektion N −→ k=0 ι M konvergiert P∞ f (ι(k)) absolut. • Für jede Bijektion N −→ k=0 P P∞ ι M ab. → In diesem Fall hängt i∈I f (i) = k=0 f (ι(k)) nicht von der Wahl der Bijektion N −P Wir nennen derartige Summen über alle Elemente von I absolut konvergent. Wenn i∈I f (i) S absolut konvergiert und wenn I = lk=0 Ik mit l ∈ N∪{∞} eine höchstens abzählbare Zerlegung von I in disjunkte Teilmengen ist, so gilt der große Umordnungssatz X i∈I f (i) = l X X f (i), k=0 i∈Ik wobei sowohl die inneren Summen als auch die äußere Summe auf der rechten Seite absolut konvergieren. Der Beweis ist nicht schwierig, soll aber ausgelassen werden. Statt dessen bringen wir die beiden Cantorschen Diagonalargumente: Satz 3 (Erstes Cantorsches Diagonalprinzip). Die Menge N × N ist abzählbar unendlich. f→ N ist durch f (m, n) = (m+n)(m+n+1)/2+n Beweis. Eine bijektive Abbildung N×N −− gegeben. Offenbar ist f (m, n) die Nummer des Paares (m, n) bei der Durchnumerierung von N × N in einem quadratischen Schema, das beim Beweis von Satz 9.1 (und im Tafelbild der Vorlesung) angegeben ist. Folgerung 1. Die folgenden Mengen sind abzählbar: Z × Z, Q, Q × Z, Q × Q, Q × Q × Q. Beweis. Die Behauptung über die Abzählbarkeit von Z×Z ergibt sich durch Kombination von Fakt 1 mit Beispiel 1. Zum Beweis der Abzählbarkeit von Q bemerken wir, daß jede rationale Zahl x auf eindeutige Weise als x = a/b mit teilerfremden ganzen Zahlen a und b > 0 2. GRENZWERTE 35 dargestellt werden kann. Sei also M ⊂ Z × Z die Menge aller Paare (a, b) mit b > 0 und f→ Q, f (a, b) = a/b, nach dem Gesagten bijektiv. Also ist Q zu der ggT(a, b) = 1, dann ist M −− Untermenge M der abzählbaren Menge Z × Z gleichmächtig und daher höchstens abzählbar, #(Q) ≤ #(N). Wegen N ⊂ Q gilt auch #(N) ≤ #(Q). Aus dem Satz von Schröder-Bernstein ergibt sich nun die Gleichmächtigkeit von N und Q. Alle weiteren Behauptungen können nun ähnlich bewiesen werden wie die Abzählbarkeit von Z × Z, wobei im Falle von Q × Q × Q zuerst die Abzählbarkeit von Q × Q bewiesen und dann die Bijektion (Q × Q) × Q ∼ = Q × Q × Q benutzt wird. Folgerung 2. Sei M eine unendliche Menge, wenn eine höchstens abzählbare Überdeckung Sl M = k=0 Ml , l ∈ N ∪ {∞}, von M durch höchstens abzählbare Mengen Ml existiert, so ist M abzählbar unendlich. Definition 2. Definition der abgeschlossenen und offenen Intervalle. Satz 4 (Zweites Cantorsches Diagonalprinzip). Die Menge R aller reellen Zahlen ist überabzählbar. Beweis. Es genügt offenbar der Beweis der Überabzählbarkeit von I = [0, 1]. Angenomf→ I. Sei φ die l-te Dezimalstelle von f (k). Wir setzen men, es gäbe eine Bijektion N −− k,l ζk = φk,k + 1 im Falle 0 ≤ φk,l ≤ 7 und ζk = 0 im Falle 8 ≤ φk,k ≤ 9. Man bemerkt leicht, daß ζk eine gültige Dezimalziffer ist, welche nicht mit der k-ten Dezimalstelle f (k) P∞ φk,k von −1 übereinstimmt. Sei z die reelle Zahl mit dieser Dezimaldarstellung, z = k=1 ζk 10 . Man bemerkt, daß nur die Ziffern 0 bis 8 in dieser Dezimaldarstellung vorkommen und daher keine Neunerperiode vorliegt. Angenommen, es gäbe eine Zahl k mit z = f (k). Dann wäre die k-te Nachkommastelle von z gleich φk,k 6= ζk , was ein Widerspruch ist. Also war f doch nicht surjektiv. Bemerkung 1. Da Q abzählbar und R überabzählbar ist, ergibt sich ein neuer Beweis für die Existenz irrationaler Zahlen: es gibt in mengentheoretischem Sinne viel mehr reelle Zahlen als rationale Zahlen. Definition 3. Eine Menge hat die Mächtigkeit des Kontinuums, falls sie zu R gleichmächtig ist. Satz 5. Jedes Intervall I = [a, b], I = (a, b), I = [a, b) oder I = (a, b] mit a < b hat die Mächtigkeit des Kontinuums und ist zu I × I gleichmächtig. Beweis. Sein zunächst I = [0, 1). Man erhält eine surjektive Abbildung I → I × I, indem man x ∈ I das Paar (y, z) zuordnet, wobei die Dezimalbruchentwicklung (eventuell mit Neunerperiode) von y mit den geraden und die von z mit den ungeraden Nachkommastellen von x gebildet wird. Also gilt #(I × I) ≤ #(I). Die umgekehrte Ungleichung folgt aus Fakt 1, und nach dem Satz von Schröder-Bernstein sind I und I × I gleichmächtig. Wir haben eine bijektive Abbildung Z × I → R, welche (k, x) auf k + x abbildet (siehe Satz .1.3.4). Folglich ist R zu Z × I und damit auch zu N × I gleichmächtig. Da I ein bijektives Bild von N enthält 36 (z. B. {1/(n + 1)|n ∈ N}), folgt #(R) = #(N × I) ≤ #(I × I) = #I. Wegen I ⊂ R gilt auch #I ≤ #R. Folglich hat I die Mächtigkeit des Kontinuums. Jedes halboffene Intervall [a, b) ist ein bijektives Bild von I (z. B. durch die Abbildung t → a + (b − a)t) und hat daher ebenfalls die Mächtigkeit des Kontinuums. Sei nun I˜ ein beliebiges (offenes, abgeschlossenes oder halboffenes) Intervall mit Anfangspunkt a und Endpunt b, wobei a < b gelte. Wegen I˜ ⊂ R hat I˜ höchstens die Mächtigkeit des Kontinuums. Andererseits enthält I˜ das halboffene Intervall [(2a+b)/3, (a+2b)/3), das nach dem Gezeigten zu R gleichmächtig ist. Also hat I˜ auch mindestens die Mächtigkeit des Kontinuums, und aus dem Satz von SchröderBernstein folgt #I˜ = #R. Folgerung 3. Die Mengen R, R × R, R × N, R × R × R haben die Mächtigkeit des Kontinuums. 3. Differential- und Integralrechnung 3.1. Die Ableitung einer Funktion. Definition 1. Eine R- oder C-wertige Funktion, die auf einer Umgebung von x ∈ R (bzw. von x ∈ C) definiert ist, ist an der Stelle x differenzierbar (bzw. komplex differenzierbar), falls f (x + h) − f (x) h→0 h f ′ (x) = lim existiert, wobei im Fall komplexer Differenzierbarkeit alle genügend kleinen komplexen Zahlen h 6= 0 zugelassen sind, während sonst nur relle h betrachtet werden. Wir nennen f ′ (x) die df Ableitung von f an der Stelle x, man schreibt auch f ′ = dx . Eine Funktion auf einer offenen Untermenge von R ist differenzierbar, falls sie an jedem Punkt dieser Menge differenzierbar ist, und stetig differenzierbar, wenn zudem die Ableitung stetig ist. Eine Funktion auf einer offenen Untermenge von C ist holomorph, falls sie an jedem Punkt dieser Menge komplex differenzierbar ist. Wenn f (x1 , . . . , xn ) eine Funktion mehrerer Veränderlicher ist, so daß für 1 ≤ j ≤ n mit festem xj für j 6= i die Funktion g(z) = f (x1 , . . . , xj−1 , z, xj+1 , . . . , xn ) als Funktion von z an der Stelle z = xj im soben beschriebenen Sinne differenzierbar ist, so schreiben wir (1) ∂f (x1 , . . . , xn ) = g ′ (xj ) ∂xj und nennen (1) die partielle Ableitung von f nach xj an der Stelle (x1 , . . . , xn ). Bemerkung 1. Man kann zeigen, daß holomorphe Funktionen stetig sind und daß die Ableitung einer holomorphen Funktion wieder holomorph ist. Daher gibt es kein sinnvolles komplexes Gegenstück zur stetigen Differenzierbarkeit: Die Holomorphiebedingung kann nicht auf diese Weise weiter verschärft werden. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 37 Bemerkung 2. Für auf Untermengen von R definierte Funktionen kann man auch die einseitigen Ableitungen betrachten: f (x + h) − f (x) h↓0 h f (x + h) − f (x) f−′ (x) = lim , h↑0 h f+′ (x) = lim wobei für die Definition der rechtsseitigen Ableitung f+′ (x) nur vorausgesetzt werden muß, daß eine Zahl ε > 0 existiert, so daß [x, +ε) im Definitionsbereich von f enthalten ist. Fakt 1. Wenn f links- und rechtsseitig in x differenzierbar ist und beide einseitigen Ableitungen übereinstimmen, so ist f in x differenzierbar, und f ′ (x) stimmt mit dem Wert der links- bzw. rechtsseitigen Ableitung überein. Beispiel 1. Die folgenden Funktionen sind auf ganz R differenzierbar: • Die konstante Funktion f (t) = a, ihre Ableitung verschwindet. • Die identische Funktion f (x) = x, ihre Ableitung ist die konstante Funktion 1. • Die Exponentialfunktion f (x) = exp(x), ihre Ableitung ist f ′ (x) = exp(x). Die Funktion f (x) = |x| ist nur außerhalb 0 differenzierbar, dort gilt f ′ (t) = 1 für t > 0 und f ′ (t) = −1 für t < 0. An der Stelle 0 gilt f+′ (0) = 1, f−′ (0) = −1. Beweis. Für die beiden ersten Beispiele findet man f (x + h) − f (x) a−a = lim = lim 0 = 0 h→0 h→0 h→0 h h f ′ (t) = lim bzw. f (x + h) − f (x) (x + h) − x = lim = lim 1 = 1. h→0 h→0 h→0 h h Durch ähnlich einfache Rechnungen zeigt man auch unsere Behauptungen über f (x) = |x|. Im Fall der Exponentialfunktion ergibt sich durch Anwendung von (.2.3.3) und (.2.3.3) sowie der Rechenregeln für Grenzwerte: f ′ (t) = lim exp(h) − 1 exp(x + h) − exp(x) f (x + h) − f (x) = lim = lim exp(x) = exp(x). h→0 h→0 h→0 h h h f ′ (x) = lim Das Beispiel überträgt sich wortwörtlich auf den komplexen Fall: Beispiel 2. Die folgenden Funktionen sind auf ganz C holomorph: • Die konstante Funktion f (t) = a, ihre Ableitung verschwindet. • Die identische Funktion f (x) = x, ihre Ableitung ist die konstante Funktion 1. • Die Exponentialfunktion f (x) = exp(x), ihre Ableitung ist f ′ (x) = exp(x). Dagegen ist die Funktion f (z) = z nirgendwo komplex differenzierbar. 38 Beweis. Der vorige Beweis überträgt sich mit Ausnahme des letzten Punktes wortwörtlich, beispielsweise ergibt sich im Fall der Exponentialfunktion durch Anwendung von (.2.3.3) und (.2.3.3) sowie der Rechenregeln für Grenzwerte: exp(h) − 1 exp(x + h) − exp(x) f (x + h) − f (x) = lim = lim exp(x) = exp(x), h→0 h→0 h→0 h h h wobei der einzige Unterschied zu vorhin darin besteht, daß nun auch komplexe h 6= 0 zugelassen sind, was auch in (.2.3.3) gestattet ist. Für den letzten Punkt betrachtet man z+h−z h (+) = , h h und für reelle h 6= 0 hat dieser Quotient den Wert 1, während er für h auf der imaginären Achse den Wert −1 hat. Es gibt also bliebig kleine h 6= 0, für die (+) den Wert 1 hat, und auch beliebig kleine h 6= 0, für die (+) den Wert −1 hat. Die Funktion f (z) = z ist daher nicht komplex differenzierbar. f ′ (x) = lim Die folgende Aussage gilt sowohl für reelle (K = R als auch komplex (K = C) Ableitungen einer Funktion, die in einer Umgebung von x ∈ K definiert ist: Fakt 2. Die Funktion f ist genau dann differenzierbar an der Stelle x mit Ableitung φ, wenn zu jedem ε > 0 ein δ > 0 mit |f (x + h) − f (x) − φ · h| < ε |h| für alle h ∈ K mit |h| < ε. Im Fall einseitiger reeller Ableitungen gilt eine analoge Charakterisierung, wobei die Bedingung |h| < δ durch 0 < h < δ für rechtsseitige bzw. −δ < h < 0 für linksseitige Ableitungen zu ersetzen ist. Satz 1. Jede in x differenzierbare Funktion ist stetig in x, und es existieren sogar positive relle Zahlen L und ε mit |f (t) − f (x)| ≤ L |t − x| für |t − x| < ε. Im Fall von Funktionen auf Untermengen von R genügt es, die Existenz der beiden einseitigen Ableitungen vorauszusetzen. Wir benötigen folgende Rechenregeln für Ableitungen, wobei reellwertige oder komplexwertige Funktionen auf offenen Untermengen von R zugelassen sind. Wenn man sich an den Randpunkten auf einseitige Ableitungen beschränkt, kann man auch abgeschlossene oder halboffene Intervalle zulassen. Satz 2. Wenn f und g rell- oder komplexwertige Funktionen auf einer Umgebung von x ∈ R sind, die beide in x differenzierbar sind, so sind auch f ± g und f g im Punkte x differenzierbar, und es gilt (2) (3) (f ± g)′ (x) = f ′ (x) ± g ′ (x) (f g)′ (x) = f (x)g ′ (x) + f ′ (x)g(x). 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 39 Falls überdies g(x) 6= 0 sein sollte, so ist auch f /g an der Stelle x differenzierbar, und es gilt f ′ (x)g(x) − f (x)g ′ (x) . (f /g) (x) = g(x)2 ′ (4) Dieselben Regeln gelten für die links- bzw. rechtsseitigen Ableitungen, falls f und g in einer Umgebung von x in (−∞, x] bzw. [x, ∞) definiert und an der Stelle x einseitig differenzierbar sind. Falls f und g in einer Umgebung von x ∈ C definiert sind, gelten analoge Regeln auch für die komplexen Ableitungen. Beweis. Der Beweis ergibt sich unmittelbar aus den Rechenregeln für Grenzwerte sowie aus der Stetigkeit von f und g an der Stelle x, z. B. f (x + h)g(x + h) − f (x)g(x) h→0 h f (x + h)g(x + h) − f (x)g(x + h) + f (x)g(x + h) − f (x)g(x) = lim h→0 h f (x + h) − f (x) g(x + h) − g(x) = lim g(x + h) + lim f (x) h→0 h→0 h h g(x + h) − g(x) f (x + h) − f (x) + f (x) lim = g(x)f ′ (x) + f (x)g ′ (x) = g(x) lim h→0 h→0 h h (f g)′ (x) = lim oder, im Fall von f /g und nach Übergang zum gemeinsamen Nenner g(x)g(x + h) im Differenzenquotienten: f (x + h)g(x) − f (x)g(x + h) h→0 g(x)g(x + h)h 1 f (x + h)g(x) − f (x)g(x) + f (x)g(x) − f (x)g(x + h) = lim g(x)2 h→0 h g(x + h) − g(x) f (x + h) − f (x) 1 lim g(x) − f (x) = g(x)2 h→0 h h 1 ′ ′ g(x)f (x) − f (x)g (x) . = g(x)2 (f /g)′ (x) = lim In beiden Fällen wurde der vorherige Satz angewendet. Beispiel 3. • Durch Induktion nach n mittels (3) zeigt man f ′ (x) = nxn−1 für f (x) = xn . Durch Anwendung von (4) ergibt sich, daß dies im Fall x 6= 0 auch für negative ganze Zahlen n richtig bleibt. In beiden Fällen ist die Aussage auch im Sinne der komplexen Differentialrechnung richtig. • Die Ableitung der Funktion x3 + x2 + x + 1 ist 3x2 + 2x + 1. Satz 3. Sei f eine rellwertige (bzw. C-wertige) Funktion, die auf einer Umgebung von x ∈ R definiert ist, und sei g auf einer Umgebung von f (x) in R (bzw. von f (x) in C) definiert 40 und an der Stelle f (x) differenzierbar (bzw. komplex differenzierbar). Dann ist h(t) = g(f (t)) auf einer Umgebung von x wohldefiniert und an der Stelle x differenzierbar, und es gilt (5) h′ (x) = g ′ (f (x))f ′ (x). Wenn nur die links- bezw. rechtsseitige Ableitung von h betrachtet werden soll, genügt es, die Existenz der entsprechenden einseitigen Ableitung von f vorauszusetzen. Für die Ableitung der Umkehrfunktion kann folgender Satz bewiesen werden: Satz 4. • Die Funktion f sei auf [a, b] definiert, streng monoton wachsend und stetig. Dann bildet f das Intervall [a, b] bijektiv auf [f (a), f (b)] ab, und die Umkehrfunktion g = f −1 ist stetig. Wenn f an der Stelle x ∈ (a, b) differenzierbar ist und f ′ (x) 6= 0 gilt, so ist g an der Stelle f ′ (x) differenzierbar, und g ′ (f (x)) = 1/f ′ (x). • Die holomorphe Funktion f bilde die offene Teilmenge U ⊆ C bijektiv auf die offene g→ U holomorph, es gilt f ′ (z) 6= Teilmenge V ⊆ C ab. Dann ist die Umkehrfunktion V −− 0 für alle z ∈ U , und g ′ (x) = 1 f ′ g(x) für alle x ∈ V . √ Beispiel 4. • Die Funktion f (x) = x ist auf der Menge der positiven rellen Zahlen differenzierbar, und f ′ (x) = 2√1 x . • Die Exponentialfunktion bildet R bijektiv auf die Menge aller positiven rellen Zahlen ab. Die Umkehrfunktion f (x) = log(x) ist auf der Menge der positiven rellen Zahlen differenzierbar, und f ′ (x) = 1/x. • Es gilt ∂ax (6) = x · ax−1 ∂a ∂ax = log(a)ax ∂x für reelle a > 0 und komplexe x, wobei die partielle Ableitung nach x auch als komplexe Ableitung existiert. Beweis. Die Voraussetzungen des Satzes sind im ersten Beispiel leicht direkt nachzuweisen und folgen im zweiten Beispiel aus den Eigenschaften der Exponentialfunktion. Die benötigte Monotonie der Exponentialfunktion ergibt sich für t ≥ 0 durch direkte Betrachtung der Exponentialreihe, für t < 0 daraus und aus exp(t) exp(−t) = 1, und auf ganz R durch Kombination dieser beiden Monotonieaussagen. Durch ähnliche Argumente zeigt man die Positivität von exp(t) für relle t sowie die Tatsache, daß exp(t) für t → ∞ bestimmt gegen ∞ divergiert und für t → −∞ gegen 0 konvergiert. Die Behauptung folgt nun direkt durch Anwendung des Satzes. Die letzte Behauptung folgt aus der zweiten durch Anwendung der Kettenregel: exp x log(a) ∂ax = ∂a ∂a d log(a) exp x log(a) =x da 3. DIFFERENTIAL- UND INTEGRALRECHNUNG = 41 x x a = xax−1 a sowie exp x log(a) ∂ax = ∂x ∂x = log(a) exp x log(a) = log(a)ax . Die beiden zuletzt genannten Sätze finden sich als Satz 15.3 und 15.4 bei Forster, wenigstens im Fall reller Funktionen. Der Beweis überträgt sich unmittelbar auf den komplexen Fall. Manchmal brauchen wir eine Rechenregel für die Ableitung einer aus zwei Stücken zusammengesetzten Funktion. Satz 5. Seien a < b < c reelle Zahlen. Die Funktionen f und g seien auf [a, b] bzw. [b, c] definiert. Durch ( f (x) a ≤ x ≤ b h(x) = g(x) b < x ≤ c ist eine Funktion auf [a, c] definiert. Wenn f (b) = g(c) gilt, und f und g stetig sind, so ist ′ diese stetig. Wenn überdies f−′ (b) und g+ (b) existieren und übereinstimmen, so existiert h′ (b) ′ und stimmt mit f−′ (b) = g+ (b) überein. Wenn insbesondere f und g differenzierbar auf [a, b] bzw. [b, c] sind und ihre Funktionswerte und Ableitungen an der Stelle b übereinstimmen, so ist h differenzierbar auf [a, c], und h′ stimmt auf [a, b] mit f ′ und auf [b, c] mit g ′ überein. Im Zusammenhang mit partiellen Ableitungen weisen wir noch auf die folgenden Rechenregeln hin, die wir zunächst ohne Beweis formulieren. Wir bemerken dabei, daß Stetigkeit von Funktionen auf Teilmengen des Rn als Folgenstetigkeit definiert werden kann, wobei Folgenkonvergenz für Folgen von Punkten des Rn koordinatenweise definiert werden kann. Satz 6. • Die Funktion F sei auf einer offenen Teilmenge U ⊆ Rn nach allen n ∂F stetig auf ganz U seien. Koordinaten partiell differenzierbar, wobei die Ableitungen ∂x i Wenn I ⊆ R ein Intervall und ~a = (a1 , . . . , an ) ein n-Tupel von auf I differenzierbaren Funktionen mit ~a(I) ⊆ U ist, so ist die Funktion g(t) = F (~a(t)) = F a1 (t), . . . , an (t) auf I differnzierbar, und es gilt die Kettenregel ′ (7) g (t) = n X i=1 daselbst. a′i (t) ∂F ~a(t) ∂xi 42 f→ C eine stetige Funktion ist, für die die partiellen • Wenn U ⊆ R2 offen und U −− ∂ ∂f Ableitungen ∂f , ∂f und ∂y auf U existieren und stetig sind, so gilt auf ganz U ∂x ∂y ∂x ∂ ∂f ∂ ∂f = , ∂x ∂y ∂y ∂x wobei auch die linke Seite der Gleichung auf ganz U existiert. (8) Ohne Stetigkeitsforderungen der angegebenen Art, die man freilich teilweise schwächer formulieren könnte, sind beide Aussagen falsch. Die zweite Aussage hat die Vertauschbarkeit partieller Ableitungen unter bestimmten technischen Voraussetzungen zum Inhalt, die in den meisten Anwendungen erfüllt sind. Die erste Aussage ist eine Art Verallgemeinerung der Kettenregel auf den Fall einer äußeren Funktion, die von mehr als einer Variablen abhängt. Als Beispiel betrachten wir ~a(t) = xo + t~v mit ~v ∈ Rn . In diesem Fall ergibt sich als Formel für die Richtungsableitung n X dF ~a(t) ∂F ∂F F (xo + h~v ) (9) (xo ) = lim = |t=0 = (xo ), vi h→0 ∂v h dt ∂x i i=1 unter denselben Voraussetzungen an F wie im ersten Punkt von Satz 6. 3.2. Riemannsche Summen und Henstock-Kurzweil-Integration. Definition 1. Sei I = [a, b] mit rellen Zahlen a ≤ b. Eine Riemannsche Zerlegung mit Zwischenstellen für I ist eine Folge ˙ n−1 ≤ ξn ≤ an = a. (1) a = a0 ≤ ξ1 ≤ a1 ≤ ≤a Die Riemannsche Summe einer auf [a, b] definierten Funktion f für eine Zerlegung mit Zwischenwertstellen definieren wir als n X σ(Z, Ξ, f ) = (ai − ai−1 )f (ξi ). i=1 Fakt 1. Es gilt (2) σ(Z, Ξ, f + g) = σ(Z, Ξ, f ) + σ(Z, Ξ, g) σ(Z, Ξ, λf ) = λσ(Z, Ξ, f ) sowie (3) |σ(Z, Ξ, f )| ≤ σ(Z, Ξ, |f |) Wenn f und g reellwertig sind und f (x) ≤ g(x) auf I gilt, so gilt (4) σ(Z, Ξ, f ) ≤ σ(Z, Ξ, g). Das Riemannsche Integral einer Funktion ist, wenn es existiert, der Grenzwert dieser Riemannschen Summen, wobei das Maximum der Schrittweiten ai − ai−1 gegen 0 strebt. Das Henstock-Kurzweil-Integral erhält man durch Einführung einer flexiblen Schrittweitenbedingung. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 43 δ→ (0, ∞). Ein Paar Definition 2. • Eine Integraleichung auf I ist eine Funktion I −− (Z, Ξ) wie in Definition 1 ist δ-fein, wenn ai − ai−1 < δ(ξi ) für 1 ≤ i ≤ n gilt. • Wir sagen, daß eine Zahl ι das Henstock-Kurzweil-Integral der Funktion f auf I ist, und schreiben Z b f (t) dt, ι= a wenn zu jedem ε > 0 eine Eichung δ existiert, so daß (5) |ι − σ(Z, Ξ, f )| < ε für jede δ-feine Zerlegung (Z, Ξ) gilt. Wir nennen f Henstock-Kurzweil-integrierbar oder HK-integrierbar, wenn eine solche Zahl ι (die sich als eindeutig herausstellen wird) existiert. Wir sagen, daß f im Sinne von Riemann integrierbar ist, wenn dieselbe Bedingung bereits mit konstanten Funktionen δ als Eichung erfüllbar ist. • Falls f R-wertig ist sagen wir, daß das HK-Integral von f bestimmt gegen ∞ divergiert, falls zu jedem A ∈ R eine Integraleichung δ existiert mit σ(Z, Ξ, f ) > A Rb für jedes δ-feine (Z, Ξ). Wir sagen, daß es bestimmt gegen −∞ divergiert, wenn a −f (t) dt bestimmt gegen ∞ divergiert. Rb Bemerkung 1. Die Idee hinter dieser Definition ist, daß a f (t) dt den Flächeninhalt der Fläche unter dem Graphen von f bestimmt. Dies kann wie folgt motiviert werden. Zu jeder Zerlegung Z, die durch (1) gegeben sei, und jedem Zwischenwertsystem Ξ kann man eine soganannte Treppenfunktion fZ,Ξ durch fZ,Ξ (t) = f (ξi ) für ai−1 ≤ t < ai definieren, wobei auch t = b = am im Falle i = m zugelassen wird. Offenbar ist σ(Z, Ξ, f ) der Inhalt der Fläche unter dem Graphen dieser Funktion, wobei der Inhalt vorzeichenbehaftet bestimmt wird, also negative Funktionswerte negative Flächeninhalte liefern. Für genügend feine Zerlegungen sollten diese Flächeninhalte immer bessere Approximationen an den Inhalt der Fläche unter dem Graphen von f darstellen, jedenfalls für gutartige“ Funktionen f . Dies motiviert R b die Definition ” des (vorzeichenbehafteten) Inhalts der Fläche unter dem Graphen von f als a f (t) dt. Definition 3. Seien a < c < b reelle Zahlen, I = [a, b], I ′ = [a, c] und I ′′ = [c, b]. Seien (Z′ , Ξ′ ) : a = a′0 ≤ ξ1′ ≤ a′1 ≤ . . . ≤ ξn′ ′ ≤ a′n′ = c (Z′′ , Ξ′′ ) : c = a′′0 ≤ ξ1′′ ≤ a′′1 ≤ . . . ≤ ξn′′′′ ≤ a′′n′′ = b zwei Riemannsche Zerlegungen von I ′ und I ′′ . Wir definieren (Z′ , Ξ′ ) ◦ (Z′′ , Ξ′′ ) durch die Folgen ′ ′′ n′ +n′′ (ai )i=0 und (ξi )ni=1+n mit ′ 0 ≤ i < n′ a i ai = a′n′ = a′′0 i = n′ a′′ n′ < i ≤ n′ + n′′ i−n′ 44 ( ξi′ ξi = ′′ ξi−n ′ 1 ≤ i ≤ n′ n′ < i ≤ n′ + n′′ . Bemerkung 2. • Mit anderen Worten handelt es sich bei (Z′ , Ξ′ ) ◦ (Z′′ , Ξ′′ ) darum, (Z′′ , Ξ′′ ) von rechts an (Z′ , Ξ′ ) anzuhängen“. ” • Wenn δ eine Integraleichung auf I und I ′ ⊆ I ein abgeschlossenes Teilintervall ist, so ist δ |I ′ eine Integraleichung auf I ′ . Wir nennen eine Zerlegung von I ′ δ-fein, wenn sie δ |I ′ -fein ist. Fakt 2. • In der Situation von Definition 3 ist (Z′ , Ξ′ ) ◦ (Z′′ , Ξ′′ ) genau dann δ-fein, wenn (Z′ , Ξ′ ) und (Z′′ , Ξ′′ ) beide δ-fein sind. • In der Situation von Definition 3 gilt (6) σ (Z′ , Ξ′ ) ◦ (Z, Ξ), f ) = σ(Z′ , Ξ′ , f ) + σ(Z′′ , Ξ′′ , f ) für jede Funktion f auf I. • Wenn δ eine Integraleichung auf I ist, so existiert eine δ-feine Zerlegung (Z, Ξ) von I. • Wenn δ 1 , . . . , δ n endlich viele Integraleichungen für I sind, so ist auch δ = min(δ 1 , . . . , δ n ), definiert als δ(x) = min δ 1 (x), . . . , δ n (x) , eine Integraleichung für I. Wenn (Z, Ξ) δ-fein ist, so ist (Z, Ξ) auch δ i -fein, für 1 ≤ i ≤ n. • Das Henstock-Kurzweil-Integral einer Funktion ist, falls es existieren sollte, eindeutig bestimmt. Beweis. Der erste, zweite und vierte Punkt sind ziemlich einfach. Für den dritten Punkt verwenden wir ein Halbierungsargument ähnlich dem Beweis von Satz .2.4.3 oder Satz .2.4.6. Dazu nehmen wir an, daß keine δ-feine Zerlegung von I existiert und konstruieren induktiv eine Folge von Intervallen In = [an , bn ] mit folgenden Eigenschaften: • a = a0 ⊆ a1 ⊆ a2 . . . ⊆ b2 ⊆ b1 ⊆ b0 = b. • bn − an = 2−n (b − a). • Es gibt keine δ-feine Zerlegung von In . Ähnlich wie beim Beweis der zitierten Sätze findet man, daß die Limites limn→∞ an und limn→∞ bn existieren und übereinstimmen. Wir bezeichnen beide Limites mit ξ. Für genügend große n gilt dann an > ξ − δ(ξ)/2 und bn < ξ + δ(ξ)/2. Dann aber ist an ≤ ξ ≤ bn eine δ-feine Zerlegung von In , im Widerspruch zum dritten Punkt. Zur Konstruktion der Intervallfolge geht man induktiv vor. Sind die Ik mit k ≤ n schon konstruiert, so daß alle drei Punkte für die bereits konstruierten Intervalle gültig sind, so setzt n , In′ = [an , cn ] und In′′ = [cn , bn ]. Nach der ersten Aussage des Faktes muß es für man cn = an +b 2 mindestens eines dieser Intervalle keine δ-feine Zerlegung geben, denn sonst erhielte man durch Aneinanderhängung dieser Zerlegungen eine δ-feine Zerlegung für I. Man setzt also In+1 = In′ , falls für In′ keine δ-feine Zerlegung existiert. Andernfalls setzt man In+1 = In′′ . Man macht sich leicht klar, daß alle drei Bedingungen an die Intervalle auch für I0 , . . . , In+1 gelten. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 45 Rb Die dritte Aussage ist damit bewiesen. Zum Beweis der letzten nimmt man an, daß a f (t) dt sowohl gegen ι1 als auch gegen ι2 konvergiert und ι1 6= ι2 gilt. Dann ist ε = |ι1 − ι2 | /2 positiv, und es gibt Eichungen δ i mit |ιi − σ(Z, Ξ, f )| < ε (+) für alle δ i -feinen Zerlegungen. Sei δ = min(δ 1 , δ 2 ), nach dem dritten Punkt gibt es eine δ-feine Zerlegung. Diese ist auch δ i -fein für i ∈ {1; 2} und erfüllt daher (+) für i = 1 und i = 2. Man erhält den Widerspruch 2ε = |ι1 − ι2 | ≤ |ι1 − σ(Z, Ξ, f )| + |ι2 − σ(Z, Ξ, f )| < ε + ε = 2ε. Rb Ähnlich führt man die Annahmen ad absurdum, daß a f (t) dt sowohl gegen ι konvergiert als auch bestimmt diviergiert, oder in beide Richtungen bestimmt divergiert. Man überzeugt sich leicht von der folgenden Tatsache: Fakt 3. Eine komplexwertige Funktion ist genau dann HK-integrierbar, wenn ihr Realund Imaginärteil HK-integrierbar sind. Satz 1. • Die Summe zweier HK-integrierbarer Funktionen sowie das Produkt einer HK-integrierbaren Funktion mit einer komplexen Zahl λ sind HK-integrierbar, und es gilt Z b Z b Z b (7) g(t) dt f (t) dt + (f + g)(t) dt = a a a Z b Z b (8) (λf )(t) dt = λ f (t) dt a a • Wenn für zwei reellwertige HK-integrierbare Funktionen f und g auf [a, b] und alle t aus diesem Intervall f (t) ≤ g(t) gilt, so gilt Z b Z b g(t) dt. f (t) dt ≤ (9) a a • Für jede komplexwertige HK-integrierbare Funktion f gilt Z b Z b ≤ (10) |f (t)| dt, f (t) dt a (11) a falls das Integral auf der rechten Seite existiert. Allgemeiner gilt Z b Z b ≤ f (t) dt Φ(t) dt, a a falls die Integrale existieren und |f (t)| ≤ Φ(t) auf I gilt. 46 • Es sei f auf I = [a, b] HK-integrierbar, τ eine relle Zahl, ã = a + τ , b̃ = b + τ und f˜(x) = f (x − τ ). Dann ist f˜ HK-integrierbar, und es gilt Z b Z b̃ ˜ f (t) dt. f (t) dt = a ã Beweis von Satz 1. Zum Beweis von (7) wählt man für ε > 0 Eichungen δ̂ und δ̃ mit Z b ε < σ(Z, Ξ, f ) − f (t) dt (+) 2 a für δ̂-feine und Z b ε σ(Z, Ξ, g) − g(t) dt < (@) 2 a Rb Rb für δ̃-feine Zerlegungen. Sei ι = a f (t) dt + a g(t) dt, dann gilt, auf Grund von (+), (@) und (2), |σ(Z, Ξ, f + g) − ι| < ε für δ = min(δ̂, δ̃)-feine Zerlegungen. Da ein solches δ für alle ε > 0 gefunden werden kann, Rb konvergiert a f (t) + g(t) dt gegen ι, wie behauptet. Mit ähnlichen Argumenten kann auch (8) gezeigt werden. Rb Rb Zum Beweis von (9) soll die gegenteilige Annahme a f (t) dt > a g(t) dt ad absurdum Rb Rb geführt werden. In diesem Fall ist ε = a f (t) dt − a g(t) dt positiv, man kann δ̂ und δ̃ mit (+) und (@) wählen, und für eine min(δ̂, δ̃)-feine Zerlegung hat man unter Benutzung von (4) den Widerspruch Z b Z b Z b ε ε f (t) dt < σ(Z, Ξ, f ) + ≤ σ(Z, Ξ, g) + < f (t) dt. g(t) dt + ε = 2 2 a a a Ähnliche Argumente unter Benutzung von (3) zeigen (10) und (11). Der letzte Punkt bringt die Verschiebungsinvarianz des HK-Integrales zum Ausdruck und ergibt sich letztlich daraus, daß alle bei der Einführung dieses Integralbegriffes verwendeten Begriffe und Konstruktionen verschiebungsinvariant sind. Ein einfaches Beispiel für HK-integrierbare (und auch R-integrierbare) betrachten wir die konstante Funktion: Rb Beispiel 1. Wenn f die konstante Funktion f (x) = φ ist, so gilt a f (t) dt = φ(b − a). In der Tat gilt (12) σ(Z, Ξ, f ) = φ(b − a) für jede Zerlegung (Z, Ξ) von I = [a, b]. Für andere Funktionen ist es nicht so leicht, die allgemeinen Riemannschen Summen direkt auszurechnen. Deswegen ist der folgende Satz überaus hilfreich: 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 47 Theorem 1 (2. Hauptsatz der Integral- und Differentialrechnung). Die Funktion f sei differenzierbar auf I = [a, b], dann gilt Z b (13) f (b) − f (a) = f ′ (t) dt a Bei Zugrundelegung des Riemannschen Integralbegriffes müßte zusätzlich die Existenz der rechten Seite von (13) als R-Integral geforder werden, was sich nicht allein aus den Voraussetzungen des Theoremes ergibt. Rb Beweis. Sei ι = f (b)−f (a), wir zeigen, daß das HK-Integral a f ′ (t) dt gegen ι konvergiert. Sei dazu ε > 0 vorgegeben. Nach Fakt .3.1.2 gibt es für jedes x ∈ I ein δ(x) > 0 mit ε (+) |f (x) − f (y) − f ′ (x)(x − y)| ≤ · |x − y| b−a für y ∈ I und |x − y| ≤ δ(x). Die Zerlegung (Z, Ξ) sei durch a = a0 ≤ ξ0 ≤ a1 ≤ . . . ≤ an−1 ≤ ξn ≤ an = b gegeben und δ-fein, dann ergibt sich ε (ai − ai−1 ) (@) |f (ai ) − f (ai−1 ) − f ′ (ξ)(ai − ai−1 )| ≤ b−a durch Anwendung von (+) auf x = ξi , y = ai−1 sowie auf x = ξi , y = ai und Addition der beiden entstehenden Ungleichungen. Summation von (@) über 1 ≤ i ≤ n ergibt n n X ε X ε ′ f (ai ) − f (ai−1 ) − f (ξ)(ai − ai−1 ) ≤ (b − a) = ε. (ai − ai−1 ) = b−a b−a i=1 i=1 Auf Grund von n X f (ai ) − f (ai−1 ) = f (b) − f (a) = ι i=1 n X i=1 f ′ (ξ)(ai − ai−1 ) = σ(Z, Ξ, f ′ ) erhält die vorige Ungleichung die Form |ι − σ(Z, Ξ, f ′ )| ≤ ε, was für alle δ-feinen Zerlegungen gilt. Ein solches δ kann also für alle ε > 0 gefunden werden, so daß das HK-Integral auf der rechten Seite von (13) in der Tat wie behauptet gegen ι konvergiert. Damit können schon ziemlich viele Funktionen integriert werden, einfach auf Grund unserer Kenntnis der Ableitung bestimmter Funktionen. Definition 4. Die Funktion F ist Stammfunktion von f auf dem Intervall I ⊆ R, wenn F daselbst differenzierbar mit Ableitung f ist. Aus dem zweiten Hauptsatz der Integral- und Differentialrechnung folgt unter dieser Voraussetzung Z d f (t) dt = F (d) − F (c), (14) c 48 falls c, d ∈ I und c < d Rgilt. Man schreibt auch f (t) dt, und nennt diesen Ausdruck ein unbestimtes Integral, um eine Stammfunktion von f zu bezeichnen. Das Attribut unbstimmt“ ist dadurch motiviert, daß ” Stammfunktionen offenbar nicht eindeutig sind. Mit F ist für jede Konstante C auch F + C eine Stammfunktion von f . Umgekehrt folgt aus (14), daß jede Funktion auf einem Intervall I mit daselbst verschwindender Ableitung (also jede Stammfunktion von 0) konstant auf I sein muß. Es ergibt sich also Fakt 4. Wenn F eine Stammfunktion von f auf I ist, so hat jede andere Stammfunktion von f auf I die Form F + C, wobei C konstant ist. Beispiel 2. R, (15) • Für natürliche Zahlen n ist Z tn dt = tn+1 n+1 eine Stammfunktion von tn auf ganz tn+1 +C n+1 n+1 • Für ganze Zahlen n 6= −1 ist tn+1 eine Stammfunktion von tn auf jedem in R \ {0} enthaltenen Intervall. In diesem Sinne gilt (15) auch für negative n 6= −1. • Die Funktion log |t| ist Stammfunktion von 1t auf jedem in R \ {0} enthaltenen Intervall: Z dt (16) = log |t| + C t a+1 • Für jede komplexe Zahl a 6= −1 ist ta+1 Stammfunktion von ta auf (0, ∞). In diesem Sinne gilt also (15) auch für komplexe Exponenten n 6= −1. • Die Exponentialfunktion ist Stammfunktion der Exponentialfunktion auf ganz R: Z (17) exp(t) dt = exp(t) + C Aus Theorem 1 ergibt sich ziemlich leicht: Folgerung 1. Die Funktion f sei auf I = [a, b] differenzierbar. • f ist genau dann monoton wachsend auf I, wenn f ′ (t) ≥ 0 auf I gilt. Falls die Ableitung von f sogar positiv auf I ist, so ist f streng monoton wachsend. Generell ist f genau dann streng monoton wachsend, wenn die Ableitung von f auf I nichtnegativ ist und auf keinem Teilintervall von I, welches positive Länge hat, identisch verschwindet. • f ist genau dann monoton fallend auf I, wenn f ′ (t) ≥ 0 auf I gilt. Falls die Ableitung von f sogar negativ auf I ist, so ist f streng monoton wachsend. Generell ist f genau dann streng monoton fallend, wenn die Ableitung von f auf I nichtpositiv ist und auf keinem Teilintervall von I, welches positive Länge hat, identisch verschwindet. Beweis. Offenbar genügt der Nachweis des ersten Punktes. Der zweite geht genauso oder kann durch Betrachtung von −f auf den ersten zurückgeführt werden. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 49 (y) Wenn f monoton wachsend auf I ist, so ist der Ausdruck f (x)−f für y 6= x, x, y ∈ I x−y ′ nichtnegativ. Da f (x) Grenzwert dieser Differenzenquotienten ist, ist auch f ′ (x) ≥ 0. Gilt umgekehrt f ′ (t) ≥ 0 für alle t ∈ I, so gilt Z d Z d ′ 0 dt = f (c) f (t) dt ≥ f (c) + f (d) = f (c) + c c auf Grund von (14) und (9), so daß f monoton wachsend auf I ist. Wenn die Ableitung von f auf einem Teilintervall I ′ ⊆ I positiver Länge verschwindet, so ist f wegen Fakt 4 konstant auf I ′ und kann daher nicht streng monoton sein. Wenn umgekehrt f monoton wachsend, aber nicht streng monoton wachsend ist, so gibt es Zahlen c < d aus I mit f (c) = f (d). Für t ∈ I ′ = [c, d] gilt dann f (c) ≤ f (t) ≤ f (d) = f (c), also ist f konstant auf I ′ , und die Ableitung von f verschwindet auf I ′ . Eine andere Anwendung des zweiten Hauptsatzes betrifft lokale Extremstellen. Definition 5. Die reellwertige Funktion f sei auf einer Umgebung von x ∈ R definiert. • Wir sagen, daß bei x ein lokales Minimum von f vorliegt, wenn eine Umgebung U von x mit f (y) ≥ f (x) für alle y ∈ U existiert. Gilt statt dessen f (y) ≤ f (x) unter derselben Voraussetzung an U und y, so sprechen wir von einem lokalen Maximum. In beiden Fällen nennen wir x eine lokale Extremstelle von f . Gilt im Fall y 6= x die echte Ungleichtung f (y) > f (x) bzw. f (y) < f (x) auf einer Umgebung von x, so sprechen wir von einem strengen lokalen Extremum. • Wir sagen, daß f bei x das Vorzeichen von nichtnegativen zu nichtpositiven Werten wechselt, wenn ein ε > 0 existiert, so daß f (y) ≥ 0 für x − ε < y < x und f (y) ≤ 0 für x < y < x + ε gilt. Wird diese Bedingung von −f erfüllt, so sprechen wir für f von einem Vorzeichenwechsel von nichtnegativen zu nichtpositiven Werten. Gilt sogar die strenge Ungleichung, sprechen wir von einem strengen Vorzeichenwechsel. Satz 2. Die reellwertige Funktion f sei auf einer Umgebung von x ∈ R definiert. • Wenn x eine lokale Extremstelle von f ist und f ′ (x) existiert, so gilt f ′ (x) = 0. • Wenn f ′ (x) existiert und von 0 verschieden ist, so wechselt die Funktion f (t) − f (x) an der Stelle x das Vorzeichen streng, und zwar erfolgt im Fall f ′ (x) > 0 der Vorzeichenwechsel von negativen zu positiven und im Fall f ′ (x) < 0 der Vorzeichenwechsel von positiven zu negativen Werten. • Es gelte f ′ (x) = 0. Wenn f ′ auf einer Umgebung von x existiert und bei x das Vorzeichen von nichpositiv zu nichtnegativ wechselt, so hat f bei x ein lokales Minimum. Wechselt statt dessen das Vorzeichen von f ′ bei x von nichtnegativ zu nichtpositiv, so hat f bei x ein lokales Maximum. Im Fall eines strengen Vorzeichenwechsels liegt eine strenge lokale Extremstelle vor. Beweis. In beiden Fällen genügt es, den Fall lokaler Minima bzw. der Bedingungen dafür zu betrachten. Gilt f ′ (x) = ε > 0, so gibt es ein δ > 0 mit |f (t) − f (x) − ε(t − x)| < 2ε |t − x| für |t − x| < δ. Für derartige t hat dann f (x) − f (x) dasselbe Vorzeichen wie t − x. Ähnlich 50 erledigt man den Fall f ′ (x) < 0, der überdies auch durch Betrachtung von −f auf den vorigen zurückgeführt werden kann. Der zweite Punkt ist damit bewiesen. Offenbar kann bei x kein lokales Extremum von f vorliegen, wenn f (t) − f (x) das Vorzeichen wechselt. Der erste Punkt folgt also auch. Wenn f ′ bei x das Vorzeichen von nichtpositiv zu nichtnegativ wechselt, so gibt es ein ε > 0 mit f ′ (t) ≤ 0 für x − ε ≤ t ≤ x und f ′ (t) ≥ 0 für x ≤ t ≤ x + ε, und wegen Folgerung 1 ist f monoton fallend auf [x − ε, x] und monoton wachsend auf [x, x + ε]. Für x − ε ≤ t ≤ x gilt daher f (t) ≥ f (x), und dasselbe gilt auch für x ≤ t ≤ x + ε auf Grund der jeweiligen Monotonieaussage. Also hat f bei x ein lokales Minimum. Wir betrachten von nun an auch höhere Ableitungen und benötigen daher die folgende Definition: Definition 6. Die Funktion f ist auf einer offenen Untermenge von R einmal differenzierbar, wenn sie daselbst differenzierbar ist. In diesem Fall bezeichnen wir die erste Ableitung mit f (1) = f ′ . Sei k > 1, und sei (k − 1)-fache Differenzierbarkeit sowie die k − 1-te Ableitung f (k−1) schon definiert. Wir sagen, daß f k-fach (oder k-mal) differenzierbar ist, wenn f (k − 1)-fach differenzierbar ist und zusätzlich die k-te Ableitung f (k) = (f (k−1) )′ existiert. Falls f (k) zusätzlich stetig ist, spricht man von k-facher stetiger Differnzierbarkeit (die Stetigkeit von f (j) mit 0 < j < k folgt automatisch aus Satz .3.1.1. Bemerkung 3. Eine analoge Definition für komplexe Differenzierbarkeit ist nicht erforderlich. Es gilt nämlich der auf den ersten Blick überraschende Satz, daß die Ableitung einer holomorphen Funktion wieder holomorph ist. Da der Beweis schwierig ist, kann in dieser Vorlesung nicht darauf eingegangen werden. Satz 3. Die reellwertige Funktion f sei auf einer Umgebung von x ∈ R definiert und daselbst k-mal differenzierbar, mit k ≥ 0. Es gelte f (l) (x) = 0 für 1 ≤ l ≤ k. Ferner sei f (k+1) wohldefiniert und von 0 verschieden. • Im Fall ungerader k liegt eine lokale Extremstelle von f bei x vor, und zwar ein lokales Minimum im Fall f (k+1) (x) > 0 und ein lokales Maximum im Fall f (k+1) (x) < 0. • Im Fall gerader k wechselt die Differenz f (t) − f (x) bei t = x das Vorzeichen, und zwar von negativen zu positiven Werten im Fall f (k+1) (x) > 0 und von positiven zu negativen Werten im Fall f (k+1) (x) < 0. Beweis. Wir gehen durch Induktion vor. Der Fall k = 0 ist gerade der zweite Punkt von Satz 2. Sei k > 0 und die Behauptung für k − 1 statt k bewiesen. Dann ist die Induktionsannahme auf f ′ anwendbar und ergibt im Fall ungerader k einen Vorzeichenwechsel von f ′ bei x. Nach dem dritten Punkt von Satz 2 ist also x eine lokale Extremstelle von f . Im Fall gerader k ist hingegen f ′ (x) = 0 ein strenger lokaler Extremwert von f ′ , und nach Folgerung 1 ist f in einer Umgebung von x streng monoton, so daß f (t) − f (x) bei t = x einen strengen Vorzeichenwechsel hat. Man überzeugt sich leicht davon, daß dieses Argument Aussagen über Vorzeichenwechsel und Extremstellen gerade in die behauptete Richtung liefert. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 51 Als eine letzte Anwendung des Zusammenhanges zwischen Monotonieverhalten und Vorzeichen der Ableitung betrachten die Konvexität von Funktionen: Satz 4. Sei f auf I = [a, b] reellwertig und differenzierbar, wobei die Ableitung f ′ auf I monoton wächst. Dann ist f konvex, es gilt also (18) f (1 − λ)x + λy ≤ (1 − λ)f (x) + λf (y) für x, y ∈ I und 0 ≤ λ ≤ 1. Ist umgekehrt f ′ monoton fallend auf I, so gilt die zu (18) entgegengesetzte Ungleichung (19) f (1 − λ)x + λy ≥ (1 − λ)f (x) + λf (y). Bemerkung 4. Ähnlich wie für Folgerung 1 lassen sich (18) und (19) für streng monotone Ableitungen f ′ zu strengen Ungleichungen verschärfen, wenn noch x 6= y und 0 < λ < 1 gilt. Auch kann die Aussage ähnlich wie Folgerung 1 umgekehrt werden. Wir gehen nicht auf die Details ein. Vor dem Beweis von Satz 4 halten wir noch die Abschätzung eines Integrales durch das Produkt aus Länge des Integrationsweges und Maximum bzw. Minimum des Integranden fest: Fakt 5. Gilt für eine reellwertige Funktion f (x) ≥ m (bzw. f (x) ≤ M ) auf I = [a, b], so Rb Rb gilt a f (t) dt ≥ m(b − a) bzw. a f (t) dt ≤ M (b − a). Beweis von Satz 4. Es genügt der Beweis der Aussage über Konvexität, denn die zweite Aussage kann mit analogen Mitteln bewiesen oder durch Betrachtung von −f auf diesen Fall zurückgeführt werden. Wir dürfen beim Nachweis von (18) ohne Beschränkung der Allgemeinheit x < y annehmen, denn im Fall x = y ist die Behauptung trivial und generell ändert sich keine der beiden Seiten von (18) bei Vertauschung von x und y und gleichzeitiger Ersetzung von λ durch 1 − λ. Sei also x < y und z = (1 − λ)x + λy, dann gilt Z z f ′ (ξ) dξ ≤ λ(z − x)f ′ (z) = λ(1 − λ)(y − x)f ′ (z) (+) λ f (z) − f (x) = λ x Z y ′ f ′ (ξ) dξ = (1 − λ) f (y) − f (z) . = (1 − λ)(y − z)f (z) ≤ (1 − λ) z Durch Addition von λf (x) + (1 − λ)f (z) zu beiden Seiten ergibt sich (19). 3.3. Das Verhalten der Exponentialfunktion im Komplexen. Wir beginnen mit Fakt 1. Es gilt exp(z) = exp(z) für beliebige komplexe Zahlen z. Beweis. In der Tat, aus den Rechenregeln für komplexe Gernzwerte folgt exp(z) = ∞ X zn n=0 n! = ∞ X zn n=0 n! = ∞ X zn n=0 n! = exp(z). 52 Satz 1. Für komplexe Zahlen z gilt |exp(z)| = exp(ℜz). Beweis. In der Tat, es gilt 2 |exp(z)| = exp(z)exp(z) = exp(z) exp(z) = exp(z + z) = exp(2ℜ(z)) = exp ℜ(z) Folgerung 1. Für jede reelle Zahl t hat die komplexe Zahl exp(it) den Betrag 1. Wir wollen den Real- und den Imaginärteil von exp(it) genauer untersuchen. Es gilt: und exp(it) + exp(−it) exp(it) + exp(−it) = = cos(t) ℜ exp(it) = 2 2 exp(it) − exp(−it) exp(it) − exp(−it) ℑ exp(it) = = = sin(t), 2i 2i wenn der Kosinus und der Sinus einer komplexen Zahl z durch exp(iz) + exp(−iz) (1) cos(z) = 2 exp(iz) − exp(−iz) sin(z) = (2) 2i definiert sind. Durch eine einfache Rechnung leitet man die Additionstheoreme für die Winkelfunktionen her, ebenso wie sin′ = cos (3) cos′ = sin und (4) sin(−z) = − sin(z) cos(−z) = cos(z) und die Potenzreihenentwicklung (5) cos(x) = ∞ X (−1)k x2 k (2k)! (−1)k x2k+1 . (2k + 1)! k=0 (6) sin(x) = ∞ X k=0 Satz 2. • Für 0 ≤ x ≤ 2 gilt sin(x) > 0. • Es gibt genau eine Zahl π mit 0 ≤ π ≤ 4 und cos(π/2) = 0. Für diese Zahl gilt sin(π) = 0, cos(π) = −1. |x2 | Beweis. Im Fall 0 ≤ x ≤ 2 ist wegen (2k)(2k+1) ≤ 1 für k ≥ 1 die Folge der Beträge der Summanden der alternierenden Reihe (6) monoton fallend. Es gilt also nach dem zweiten Teil von Satz .2.3.2 x2 x x3 ≥ >0 ≥x 1− sin(x) ≥ x − 6 6 3 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 53 für 0 < x ≤ 2. Wegen (3) und nach Folgerung .3.2.1 ist also cos auf [0, 2] streng fallend und hat dort höchstens eine Nullstelle. Um die Existenz einer Nullstelle zu zeigen, genügt der Nachweis von cos(2) < 0. Wegen x2 < 1 für reelle x und |x| ≤ 2 und k ≥ 1 gilt, nach Anwendung des zweiten Teiles (2k+1)(2k+2) P k x2 k von Satz .2.3.2 auf die Reihe ∞ k=1 (−1) (2k)! , die Ungleichung cos(x) ≤ 1 − x2 x4 + 2 24 = − 31 < 0. für derartige x, also cos 2 ≤ 1 − 2 + 16 24 Die übrigen Aussagen folgen aus den Additionstheoremen. Satz 3. • Die Funktion sin bildet das Intervall [−π/2, π/2] bijektiv auf [−1, 1] ab. Die Umkehrfunktion arcsin ist stetig, ihre Ableitung ist auf (−1, 1) durch 1 arcsin′ (x) = √ 1 − x2 gegeben. • Die Funktion cos bildet das Intervall [0, π] bijektiv auf [−1, 1] ab. Die Umkehrfunktion arccos ist stetig, ihre Ableitung ist auf (−1, 1) durch 1 arccos′ (x) = − √ 1 − x2 gegeben. Offenbar gilt arccos(x) + arcsin(x) = π/2. Bemerkung 1. Natürlich ist die Wahl der beiden Intervalle willkürlich, etwa kann [−π/2, π/2] im ersten Teil der Behauptung kann [−π/2, π/2 durch [k − π/2, k + π/2] ersetzt werden. Die entsprechenden Umkehrfunktionen sind dann arcsink (x) = arcsin(x) + kπ für gerade und arcsink (x) = (k + 1)π − arcsin(x) für ungerade k. Entsprechende Aussagen gelten auch für den Cosinus. Definition 1. Für eine komplexe Zahl z = x + iy mit x > 0 im Falle y = 0 sei log(z) die eindeutig bestimmte komplexe Zahl mit exp(log(z)) = z und −π/2 < ℑ(log(z)) < π/2. Satz 4. Diese Definition ist korrekt, es gibt also unter den angegebenen Voraussetzungen and z genau eine komplexe Zahl log(z) mit den beschriebenen Eigenschaften. Der so definierte Logarithmus ist stetig auf C − R≤0 . Bemerkung 2. Der soeben definierte Logarithmus ist stetig (sogar holomorph) auf der entlang der negativen rellen Achse aufgeschlitzten koplexen Ebene. Auf dieses Aufschlitzen kann nicht verzichtet werden, es gibt also keine Möglichkeit, einen stetigen Logarithmus für von 0 verschiedene komplexe Zahlen zu definieren. Der Zusammenhang zwischen dem komplexen Logarithmus und dem Arkussinus kann auch als √ arcsin(x) = log ix + 1 − x2 54 formuliert werden. √ arccos(x) = log x + i 1 − x2 Wir wollen nun die Funktionen sin(s) cos(s) cos(s) cot(s) = sin(s) tan(s) = untersuchen, die durch tan(s) cot(s) = 1 verknüpft sind und die Periode π haben. Eine einfache Rechnung ergibt 1 tan′ (s) = (7) = 1 + tan2 (s) cos2 (s) 1 (8) = −1 − cot2 (s) cot′ (s) = − 2 sin (s) tan(x) + tan(y) tan(x + y) = (9) 1 − tan(x) tan(y) cot(x) cot(y) − 1 (10) cot(x + y) = cot(x) + cot(y) Satz 5. Die Funktion tan bildet (−π/2, π/2) bijektiv auf R ab. Die Umkehrfunktion arctan ist stetig, ihre Ableitung ist durch 1 arctan′ (x) = 1 + x2 gegeben. Es gilt 1 + ix 1 arctan(x) = log . 2i 1 − ix Zuweilen trifft man auch die Hyperbelfunktionen exp(x) − exp(−x) 2 exp(x) + exp(−x) cosh(x) = 2 sinh(x) exp(x) − exp(−x) tanh(x) = = cosh(x) exp(x) + exp(−x) sinh(x) = an. Es gilt cosh2 (z) − sinh2 (z) = 1 sinh(x + y) = sinh(x) cosh(y) + cosh(x) sinh(y) cosh(x + y) = cosh(x) cosh(y) + sinh(x) sinh(y) 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 55 tanh(x) + tanh(y) 1 + tanh(x) tanh(y) 1 + coth(x) coth(y) coth(x + y) = coth(x) + coth(y) ′ sinh (x) = cosh(x) tanh(x + y) = cosh′ (x) = sinh(x) 1 = 1 − tanh2 (x) tanh′ (x) = 2 cosh (x) 1 coth′ (x) = − = 1 − coth2 (x). 2 sinh (x) Die Umkehrfunktionen sind √ x2 − 1 für x ≥ 1 √ arsinh(x) = log x + x2 + 1 1+x 1 für |x| < 1 artanh(x) = log 2 1−x x−1 1 für |x| > 1 arcoth(x) = log 2 x+1 arcosh(x) = log x + mit den Ableitungen arcosh′ (x) = √ 1 x2 −1 1 1 + x2 1 artanh′ (x) = 1 − x2 1 arcoth′ (x) = . 1 − x2 arsinh′ (x) = √ 3.4. Methoden der Berechnung von Stammfunktionen. Eine Stammfunktion F von R f bezeichnet man als ein unbestimmtes Integral von f und schreibt F = f (t) dt. Daß die Stammfunktion nur bis auf Addition einer Konstanten eindeutig ist, drückt man in der folgenden Tabelle durch die Addition einer frei wählbaren Integrationskonstanten C aus: Beispiel 1 (Tabelle der Grundintegrale). Für s 6= −1 sowie unter der Bedingung x > 0 für nicht ganzzahlige s sowie x 6= 0 für negative ganzzahlige s gilt: Z xs+1 s + C. (1) x dx = s+1 Die Bedingung x 6= 0 ist so zu verstehen, daß das Integrationsintervall die Zahl 0 nicht enthalten darf, aber die rechte Seite von (1) eine Stammfunktion für xs mit negtivem ganzen s auf jedem 56 Teilintervall von (−∞, 0) oder (0, ∞) liefert. Unter genau derselben Bedingung gilt Z dx (2) = log(|x|) + C. x Außerdem hat man die Stammfunktionen Z (3) exp(x) dx = exp(x) + C Z sin(x) dx = − cos(x) + C Z cos(x) dx = sin(x) + C Z dx (4) = arctan(x) + C 1 + x2 auf ganz R sowie (5) Z √ dx = arcsin(x) + C 1 − x2 auf [−1, 1]. Zum Beweis dieser Behauptungen genügt die Bemerkung, daß in jedem der Beispiele die Ableitung der rechten Seite in den letzten Abschnitten bestimmt wurde und mit der linken Seite übereinstimmt. Für die praktische Beherrschung der Integralrechnung ist es notwendig, sich diese Tabelle von Grundintegralen einzuprägen. Aus den Formeln für die Ableitung der Hyperbelfunktionen und ihrer Umkehrung könnten weitere Grundintegrale hergeleitet werden. Das erübrigt sich aber an dieser Stelle, da die betreffenden Stammfunktionen auch durch eine Anwendung der weiter unten angegebenen Integrationsrezepte für bestimmte Klassen von speziellen Integranden berechnet werden können. Leider ist es nicht immer möglich, einen in elementarer Form gegebenen Integranden in einer genauso elementaren Form darzustellen. Beispiele dafür sind Z exp(−x2 ) dx oder der Integrallogarithmus dx . log x Die Stammfunktionen des zuerst genannten Integranden besitzten große Bedeutung in der Wahrscheinlichkeitsrechnung und werden bis auf einen Normierungsfaktor in den gängigen Bibliotheken zur Programmiersprache C durch die Funktionen erf und erfc implementiert. In vielen anderen Fällen ist man auf numerische Integrationsverfahren angewiesen, die hier nicht näher erklärt werden können. Z 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 57 Trotzdem ergeben sich aus dem Hauptsatz der Integral- und Differentialrechnung und aus den Grundregeln für die Berechnung von Ableitungen verschiedene Grundregeln für die Umformung von Integralen, durch deren Anwedung Integrationsaufgaben oft vereinfacht werden können. Allerdings erfordert dies meist mehr Kreativität als die Anwendung der Grundregeln für das Differenzieren. Diesen Sachverhalt drückt das Mathematikersprichwort aus: Differenzieren ist ein Handwerk, aber Integrieren ist eine Kunst. Als triviale Konsequenz aus (.3.1.2) sowie (.3.1.3) mit einem konstanten Faktor g ergibt sich Fakt 1. Wenn F und G Stammfunktionen der stetigen Funktionen f und g sind, so ist F ± G eine Stammfunktion für f ± g, und für jede relle oder komplexe Konstante λ ist λF eine Stammfunktion für λf . Leider gibt es keine allgemein anwendbare Regel, die die Integration eines Produktes zweiter nichtkonstanter Funktionen ermöglicht, deren Stammfunktionen bekannt sind. Aus der Regel für das Differenzieren eines Produktes ergibt sich statt dessen die folgende Integrationsmethode, deren Anwendung wesentlich mehr Fingerspitzengefühl erfordert: Satz 1 (Partielle Integration). Seien f und g rell- oder komplexwertige differenzierbare Funktionen auf I = [a, b]. Dann gilt Z Z ′ (6) f (t)g (t) dt = f (t)g(t) − f ′ (t)g(t) dt. Diese Formel ist so aufzufassen, daß für jede Wahl der Stammfunkion auf der rechten Seite diese eine Stammfunktion des Integranden auf der linken Seite ist und daß für jede Wahl der Stammfunktion auf der linken Seite die Stammfunktion auf der rechten Seite so gewählt werden kann, daß die Gleichung gilt. Insbesondere existiert das unbestimmte Integral auf der rechten Seite genau dann, wenn das unbestimmte Integral auf der rechten Seite existiert. Für bestimmte Integrale ergibt sich die Regel Z b Z b ′ (7) f (t)g (t) dt = f (b)g(b) − f (a)g(a) − f ′ (t)g(t) dt a a wobei das Integral auf der rechten Seite genau dann existiert, wenn das Integral auf der linken Seite existiert. Beweis. Nach der Produktregel der Differntialrechnung (.3.1.3) ist f g auf I differenzierbar mit Ableitung f ′ g + f g ′ . Ist a eine Stammfunktion von f ′ g, so gilt (f g − a)′ = f g ′ , also ist f g − a eine Stammfunktion von f g ′ . Analog ist f g − b eine Stammfunktion von f ′ g, wenn b eine Stammfunktion von f g ′ ist. Unsere Behauptung über (6) ist damit gezeigt. Wegen (f g)′ = f ′ g + f g ′ gilt Z b f (t)g ′ (t) + f ′ (t)g(t) dt = f (b)g(b) − f (a)g(a). a Unsere Behauptung (7) ergibt sich nun aus (.3.2.7) und (.3.2.8) 58 Beispiel 2. Durch partielle Integration (mit f (x) = log(x), g(x) = x) kann der Logarithmus integriert werden: Z Z Z ′ (8) log(t) dt = t log(t) − t log (t) dt = t log(t) − dt = t log(t) − 1 = t(log(t) − 1). k+1 Für k ≥ 1 ergibt sich entsprechend mit f (t) = log(t), g(t) = tk+1 : Z Z tk+1 1 1 tk+1 k (9) t log(t) dt = log(t) − (log(x) − ), tk dt = k+1 k+1 k+1 k+1 Ähnlich gilt (10) Z k k t exp(t) dt = t exp(t) − k Z tk−1 exp(t) dt, was eine Behandlung derartiger Integranden durch Induktion nach k ermöglicht. Eine analoge Vorgehensweise ist auch dann möglich, wenn die Funktion exp durch eine der Funktionen sin oder cos eretzt wird. Satz 2 (Substitution). Die differenzierbare Funktion φ bilde [a, b] nach einem Intervall I ⊆ R ab, auf dem eine reell- oder komplexwertige Funktion f mit der Stammfunktion F gegeben sei. Dann ist F (φ(x) eine Stammfunktion von f (φ(x))φ′ (x), es gilt also Z b Z φ(b) ′ f (φ(x))φ (x) dx = F (t) dt a φ(a) Der Beweis ergibt sich aus Theorem 1 und der Tatsache, daß nach der Kettenregel der Differentialrechnung die Ableitung von F (φ(x)) durch f (φ(x))φ′ (x) gegeben ist. Bemerkung 1. Die Anwendung der Substitionsregel prägt man sich gut durch formale Rechnungen ein, bei denen sich Zähler und Nenner des Differentialquotienten verselbständigen, wie Z Z dφ f (φ) dx = f (φ) dφ. dx Es kann hier nicht darauf eingegangen werden, wie man Ausdrücken wie df und dφ einen eigenständigen Sinn verleiht. Beispiel 3. • Seien a 6= 0 und b relle Zahlen, wenn F eine Stammfunktion für f ist, so ist a1 F (ax + b) eine Stammfunktion für f (ax + b). Auf diese Weise können Integranden durch Verschiebung und Skalierung oft auf eines der Grundintegrale zurückgeführt werden, zum Beispiel Z (2003 + 2004)2006 . (2003t + 2004)2005 dt = 2003 · 2006 • Oft kann die Substitutionregel mit f (x) = log(|x|), φ(x) = a(x) angewendet werden. Sie ergibt dann Z ′ a (t) dt = log(|a(t)|) + C. a 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 59 ′ (11) Den Ausdruck aa (t) nennt man logarithmische Ableitung von a. Hinter manchen Integranden verbirgt sich eine solche logarithmische Ableitund, zum Beispiel Z tan(t) dt = − log(|cos(t)|) Z cot(t) dt = log(|sin(t)|), wovon man sich leicht durch Ausrechnen der logarithmischen Ableitungen des Sinus oder Cosinus überzeugt. Das Integrationsintervall darf keine Punkte enthalten, an denen die Winkelfunktion auf der rechten Seite verschwindet, also keine halb- bzw. ganzzahligen Vielfachen von π. • Die Stammfunktion von x exp(x2 ) kann durch die Substitution t = x2 , dt = 2x dx, x dx = dt2 als Z 1 exp(t) 1 = exp(x2 ). exp(t), dt = 2 2 2 Das Rezept ist allgemein auf Integranden der Form tf (t2 ) anwendbar, wenn die Stammfunktion von f bekannt ist. Im Gegensatz dazu sind die Stammfunktionen von exp(±t2 nicht in geschlossener Form durch elementare Funktionen darstellbar, wie schon bemerkt wurde. Im Folgenden sollen Regeln zur Berechnung der wichtigsten unbestimmten Integrale gegeben werden, die sich auf die Integration rationaler Funktionen zurückführen lassen. Wir beginnen mit der Integration rationaler Funktionen durch Partialbruchzerlegung. P k Ein Polynom in einer Variablen ist eine Funktion der Form P (t) = ∞ k=0 pk T , wobei nur endlich viele der Koeffizienten pk von 0 verschieden sein dürfen. Das größte k mit pk 6= 0 nennt man den Grad und pk den führenden Koeffizienten von P , wobei man vereinbart, daß der Grad des Nullpolynomes −∞ ist. Falls die pk ihrerseits Polynome in einer Variablen S sind, spricht man von einem Polynom in den zwei Variablen S und T . Entsprechend definiert man induktiv, was man einem Polynom in mehr als zwei Variablen versteht. Wir werden aber nur den Fall von ein oder zwei Variablen benötigen. Unter einer rationalen Funktion versteht man einen Quotienten zweier Polynome, wobei der Nenner nicht das Nullpolynom sein darf. Ein derartiger Quotient definiert eine beliebig oft differenzierbare Funktion auf dem Komplement der Nullstelenmenge des Nenners. Die Integration von rationalen Funktionen einer Variablen beginnt damit, daß man den Bruch durch Polynomdivision mit Rest vereinfacht. Die Polynomdivision mit Rest ermöglicht es, zu zwei Polynomen A, B 6= 0 Polynome Q und R mit P = QB + R zu finden, wobei der Grad von R kleiner als der Grad von P ist. Die Vorgehensweise besteht darin, daß man durch absteigende Induktion sukzessive die Koeffizienten von Q so festlegt, daß der führende Koeffizient von P anulliert wird, bis nur noch ein Polynom von kleinerem Grad als B verbleibt. Beispielsweise für A(t) = T 4 , B(t) = t2 + 1: A(T ) = T 2 B(T ) − T 2 = (T 2 − 1)B(T ) + 1, 60 also Q(T ) = T 2 − 1, R(T ) = 1. Man kann sich die Prozedur durch ein ähnliches Schema wie bei der Division ganzer Zahlen mit Rest veranschaulichen. Die Polynomdivision mit Rest erlaubt es, jede rationale Funktion einer Variablen als A(T ) R(T ) = + P (T ) B(T ) P pk k+1 , zu schreiben, wobei A einen kleineren Grad als B hat. Die Stammfunktion von P ist ∞ k=0 k+1 T wobei pk der k-te Koeffizient von P ist. Es verbleibt die Integration des ersten Summanden auf der rechten Seite. Man kann zeigen, daß B(T ) in Linearfaktoren zerfällt, also m Y (12) B(T ) = (T − βi )ki i=1 mit natürlichen Zahlen ki > 0 und paarweise verschiedenen komplexen Zahlen βi . Diese Tatsache ist als Fundamentalsatz der Algebra bekannt. Wenn B in der obigen Weise dargestellt wird und A einen kleineren Grad als B hat, kann die Partialbruchzerlegung des Quotienten A/B als m (13) k i XX A αi,j (T ) = B (T − βi )j i=1 j=1 angesetzt werden. Beispielsweise ist die Partialbruchzerlegung von 1 x3 −x als A B C 1 = + + −x x x−1 x+1 3 anzusetzen. Nach Multiplikation mit x − x = x(x − 1)(x + 1) kommt x3 (14) 1 = A(x − 1)(x + 1) + Bx(x + 1) + Cx(x − 1) zunächst auf R − {0; ±1}, was aus Stetigkeitsgründen auch auf ganz R gilt. Setzt man x = 0, so kommt A = −1. Durch Einsetzen von x = 1 erhält man B = 21 und mit x = −1 kommt C = 12 , wobei jeweils nur einer der Summanden auf der linken Seite von 0 verschieden ist. Wir erhalten Z Z (x − 1)(x + 1) dx 1 1 1 1 2 . dx = log = + − x3 − x 2 x−1 x+1 x 2 x2 Eine analoge Vorgehensweise ist auch bei ähnlichgearteten Aufgaben möglich: Multiplikation mit dem Nennerpolynom und Auswerten der entstehenden, zu (14) analogen Polynomgleichung an den Nullstellen des Nennerpolynomes. Hat des Nennerpolynom Nullstellen höherer Ordnung (also ki > 1 in (12)), so sind auch die ersten und höheren Ableitung des Analogons zu (14) an diesen Stellen auszuwerten, und zwar alle Ableitungen bis zum Grade ki −1 an der Stelle βi . Die Prozedur entpricht der Polynominterpolation, die in Bulirsch/Stoer, Numerische Mathematik, Band 1 beschrieben wird. In den Aufgaben werden nur sehr einfache Spezialfälle auftreten, die mit den obigen Hinweisen leicht gelöst werden können. Leider kann auch für rellwertige Integranden nicht ausgeschlossen werden, daß unter den βi in (12) komplexe Zahlen auftauchen. In diesem Fall möchte man natürlich einen Ausdruck für 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 61 die Stammfunktion erhalten, der ebenfalls nur relle Funktionen enthält. Die Stammfunktion der Summanden mit j > 1 in (13) ist auch für nicht relle βi durch Z dT 1 αi,j αi,j · = j (T − βi ) j + 1 (T − βi )j+1 gegeben, wie man durch Differenzieren der rechten Seite leicht einsieht. Die Summe dieser Ausdrücke über alle (i, j) mit j > 1 ergibt eine rationalen Funktion mit reellen Koeffizienten. Eine Stammfunktion der Summanden mit j = 1 ist durch den komplexen Logarithmus gegeben, etwa Z dT = αi,1 log(T − βi ), αi,1 T − βi was für nicht relle βi eine Stammfunktion auf ganz R liefert. Man kann zeigen, daß sich die Summe dieser Ausdrücke durch relle Logarithmen und Arkusfunktionen ausdrücken läßt. Zu jeder echt komplexen Nullstelle βi gibt es nämlich ein k mit βk = βi , es gilt αi,j = αk,j , und die Linearkombination der komplexen Logarithmen kann als αi,1 log(T − βi ) + αi,1 log(T − βi ) T − ℜ(βi,1 ) +C = ℜ(αi,1 ) log (T − ℜ(βi ))2 + ℑ(βi )2 − 2ℑ(αi,1 ) arctan ℑ(βi,1 ) dargestellt werden, wobei C = ±πℑ(αi,1 ) (wobei das Vorzeichen vom Vorzeichen von ℜ(βi,1 ) abhängt) in die frei wählbare Integrationskonstante C der Stammfunktion assimiliert werden kann. In den Aufgaben werden aber nur einfche Fälle auftauchen, die man durch Verschiebung oder Translation auf eines der Integrale Z t dt 1 = log(1 + t2 ) + C 2 1+t 2 Z dt = arctan(t) + C 1 + t2 zurückführen kann. Auch für praktische Rechnungen kann es die beste Vorgehensweise sein, die Summanden mit j = 1 in der Partialbruchentwicklung zu derartigen Integranden zusammenzufassen. Einige andere Klassen von unbestimmten Integralen lassen sich relativ leicht auf den soeben beschriebenen Fall rationaler Funktionen zurückführen. Zu den einfachsten derartigen Fällen R t gehört R(e ) dt mit einer rationalen FunktionR R. Substituiert man x = et , so ergibt sich = et = x das unbestimmte Integral R(x) dx , wobei der Integrand eine rationale wegen dx dt x Funktion ist. Zum Beispiel: Z Z Z s dt ds 1 1 + C = t − log(et + 1) + C = = − ds = log et + 1 s(s + 1) s s+1 s + 1 Etwas komplizierter sind Integrale von rationalen Funktionen in den Winkelfunktionen. Die R allgemein anwendbare Substitution zur Berechnung von R(sin φ, cos φ) dφ ist t = tan(φ/2). 62 2 2t 1−t dt = 1 + t2 , sin(φ) = 1+t Es gilt 2 dφ 2 , cos φ = 1+t2 , womit das Integral auf die Berechnung der Stammfunktion einer rationalen Funktion zurückgeführt ist: Z dt 2t 1 − t2 , ) . 2 R( 2 2 1 + t 1 + t 1 + t2 Beispielsweise ergibt sich durch Anwendung dieses Integrationsrezeptes Z Z Z dt 2t −1 dt dφ =2 ( ) = = log(|t|) + C = log |tan(φ/2)| + C. 2 2 sin φ 1+t 1+t t Manchmal führt bei derartigen Aufgaben auch eine andere Substitution zum Ziel. R R Zum Beispiel kann für Integrale der Art cos(φ)R(sin φ) dφ die Substitution x = sin φ und für sin(φ)R(cos φ) dφ die Substitution x = cos φ verwendet werden. Dieser Fall tritt genau dann ein, wenn R(−x, y) = −R(x, y) bzw. R(x, −y) = −R(x, y) gilt. Im Fall R(−x, −y) = R(x, y) kann der Integrand als R(sin φ, cos φ) = R1 (cos2 φ, tan φ) dargestellt und t = tan φ substituiert werden. Eng mit diesem Beispiel verwandt ist die Berechnung von Integralen der Form Z √ R(x, ax2 + bx + c) dx mit einer rationalen Funktion R. Wir setzen voraus, daß die Quadratwurzel rell ist. Im Fall a =√b = 0 ist der Integrand eine rationale Funktion von t, und im Fall a = 0, b 6= 0 kann b t = bx + c substituiert werden. Wir setzen also a 6= 0 voraus. Ersetzung von x durch λ(x+ 2a ) mit einem geeigneten Normierungsfaktor λ führt auf einen der folgenden Fälle: √ √ R 2t dx 1−t2 1 − x2 = 1+t • R(x, 1 − x2 ) dx. Man substituiert x = 1+t 2, 2 . Da die Ableitung dt eine rationale Funktion von t ist,√wird man auf einen rationalen Integranden geführt. Die Substitution x = sin φ, 1 − x2 = cos φ würde auf den vorher beschriebenen Fall einer rationalen Funktion in Winkelfunktionen führen, und die in diesem Fall andiesoeben angegebene Vorschrift. √ √ Substitution t = tan(φ/2) führt auf Rwendbare 1+t2 2t 2 2 • R(x, 1 + x ) dx. Man substituiert x = 1−t2 , 1 + x = 1−t 2. √ R 2 √ 2t 1+t • R(x, x2 − 1) dx. Man substituiert x = 1−t2 , x2 − 1 = 1−t2 . In jedem der drei Fälle beruht die Existenz der Substition darauf, daß die Lösungsmenge der Gleichung x2 ± y 2 = ±1 durch rationale Funktionen einer komplexen Veränderlichen parametrisiert werden kann. Für Kurven der Form x2 = P (y) mit einem Polynom P vom Grade > 2 ist eine derartige Parametrisierung normalerweise nicht mehr möglich. Die entsprechenden Integrale sind die elliptischen oder hyperelliptischen stIntegrale, die sich nicht mehr als algebraische Ausdrücke in elementaren Funktionen darstellen lassen. 3.5. Anwendung auf gewöhnliche Differentialgleichungen. Eine gewöhnliche Differentialgleichung erster Ordnung für eine Funktion ist eine Gleichung der Form f ′ (t) = F (t, f (t)). Es sind also Funktionen gesucht, die eine bestimmte Beziehung zu ihrer Ableitung erfüllen. Im vorliegenden Fall ist es explizit mögliich, die Ableitung durch die Ausgangsfunktion auszudrücken. Hat die Differentialgleichung hingegen die Form Φ t, f (t), f ′ (t) = 0, so spricht 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 63 man von einer impliziten Differentialgleichung. Es ist auch möglich, n-Tupel f~ von Funktionen zu betrachten, die eine Gleichung der Form f ′ (t) = Fi t, f~(t) i erfüllen. Man spricht dann von einem Differentialgleichungssystem erster Ordnung, welches in dem gegebenen Beispiel explizite Form hat. FÜr die physikalischen Anwendungen sind Differentialgleichungen zweiter Ordnung von besonderer Wichtigkeit, da die Beschleunigung eine zweite Ableitung ist. Die Differentialgleichung zweiter Ordnung (1) f ′′ (t) = F t, f (t), f ′ (t) ist offenbar äquivalent zu dem Differentialgleichungssystem erster Ordnung (2) f ′ (t) = g(t) g ′ (t) = F t, f (t), g(t) denn (f, g) löst (2) genau dann, wenn f (1) löst und g die Ableitung von f ist. Entsprechend können gewöhnliche Differentialgleichungssysteme beliebiger Ordnung auf gewöhnliche Differentialgleichungssysteme erster Ordnung zurückgeführt werden. Wir betrachten zunächst gewöhnliche Differentialgleichungen erster Ordnung für eine reellwertige Funktion. Im einfachsten Fall hängt die rechte Seite nur von t, nicht aber von f (t) ab: f ′ (t) = F (t). In diesem Fall ist unsere Aufgabe also äquivalent zur Auffindung einer Stammfunktion von F . Insbesondere ist die Lösung mehrdeutig, denn wie wir gesehen haben, ist die Stammfunktion nur bis auf Addition einer Konstanten eindeutig bestimmt. Die Vorgabe eines Anfangswertes f (a) reicht aber aus, um die Lösung eindeutig zu machen. Es wird sich herausstellen, daß dies in vielen ähnlichen Fällen, aber durchaus nicht immer, richtig bleibt. Der nächsteinfache Fall ist der Fall einer Differentialgleichung mit trennbaren Variablen. In diesem Fall ist die rechte Seite der Differentialgleichung das Produkt einer nur von f (t) und einer nur von t abhängenden Funktion: (3) f ′ (t) = a(f (t))b(t) Satz 1. Die Funktion a sei positiv oder negativ auf I = [α, β], und b sei auf J = [γ, δ] definiert. Wir setzen voraus, daß 1/a eine Stammfunktion A auf I und b eine Stammfunktion B auf J hat. Aus dem Zwischenwertsatz für stetige Funktionen folgt, daß das Bild A(I) von I unter A ein abgeschlossenes Intervall ist. Sei fo ∈ I und to ∈ J, so daß B(t) + A(fo ) − B(to ) ∈ A(I) für alle t ∈ J gilt. Dann hat (3) mit der Anfangswertbedingung f (to ) = fo genau eine Lösung, und diese ist durch (4) A f (t) = B(t) + A(fo ) − B(to ), also (5) gegeben. f (t) = A−1 B(t) + A(fo ) − B(to ) 64 Beweis. Der Beweis ist eine Anwendung der Kettenregel: Löst f (3), so erfüllt φ(t) = A f (t) die Differentialgleichung −1 φ′ (t) = A′ f (t) f ′ (t) = a f (t) b(t)a f (t) = b(t), also φ(t) = B(t) + C. Wir haben φ(to ) = A(fo ), also C = A(fo ) − B(to ) und (+) φ(t) = B(t) + A(fo ) − B(to ), also erfüllt f (4). Umgekehrt wissen wir nach Satz .3.1.4, daß die Umkehrfunktion G = A−1 differnzierbar ist und G′ (t) = a G(t) erfüllt. Sei φ durch (+) gegeben, dann ist φ differenzierbar mit Ableitung φ′ (t) = b(t). Die durch (5) gegebene Funktion f (t) = G φ(t) ist nach der Kettenregel differenzierbar mit der Ableitung f ′ (t) = G′ φ(t) φ′ (t) = a G(φ(t)) b(t) = a f (t) b(t), und die Bedingung f (to ) = fo ist offenbar auch erfüllt. Bemerkung 1. Die Vorgehensweise kann man sich durch die folgende Eselsbrücke veranwie ein gewöhnlicher Bruch behandelt wird: schaulichten, bei der f ′ (t) = df dt (6) df = a(f )b(t) dt df = b(t) dt a(f ) Z Z df = b(t) dt, a(f ) was bis auf die Bestimmung der Integrationskonstante mit (4) übereinstimmt, aber natürlich im Gegensatz zum Beweis des vorigen Satzes keine exakte Herleitung darstellt. Beispiel 1. Wir betrachten das Anfangswertproblem p (7) f ′ (t) = f (t) f (0) = fo und orientieren unsere Rechnungen an (6): df dt df √ f Z df √ f p 2 f = p f = dt Z = dt =t+C 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 65 oder 1 f (t) = (t + C)2 4 √ mit C = 2 fo . Offenbar liefert dieses Ergebnis auch im Falle fo = 0 eine Lösung der Differentialgleichung, aber Satz 1 ist nicht mehr anwendbar. In der Tat stellt sich die Eindeu2 tigkeitsaussage des Satzes als falsch heraus, denn neben f (t) = t4 löst auch f (t) = 0 die Differentialgleichung (7) mit der Anfangswertbedingung f (0) = 0. (8) Beispiel 2. Für f ′ (t) = 1 + f (t)2 ergibt sich durch eine ähnliche Rechnung: df = 1 + f2 dt df = dt 1 + f2 Z Z df = dt 1 + f2 arctan(f ) = t + C oder (9) f (t) = tan(t + C) Da der Tangens nicht auf ganz R definiert ist, liegt ein Beispiel einer Differentialgleichung vor, deren Lösungen nur endliche Lebensdauer“ haben: Jede Lösung wird durch die Dynamik des ” Systemes in endlicher Zeit nach ∞ getragen. Bemerkung 2. In den beiden letzten Beispielen war die rechte Seit der Differntialgleichung eine Funktion von f (t). In diesem Fall ist die Gleichung verschiebungsinvariant, mit f (t) ist für jede Konstante C auch f (t − C) eine Lösung, was sich auch in (8) und (9) äußert. Als letztes Beispiel für den Fall trennbarer Variablen betrachten wir eine Differentialgleichung, bei der weder a noch b konstant sind. Beispiel 3. Wir wollen f ′ (t) = 1+f (t)2 1+t2 lösen und gehen genauso vor wie zuvor: 1 + f2 df = dt 1 + t2 df dt = 2 1+f 1 + t2 Z Z dt df = 2 1+f 1 + t2 arctan(f (t)) = arctan(t) + C, also t+τ f (t) = tan arctan(t) + C = 1 − tτ 66 mit τ = tan(C), wobei das Addition aus (.3.3.7) ausgenutzt wurde. Für τ > 0 ist die Lösung nur für t < τ1 , im Fall τ < 0 nur für t > τ1 definiert. Im Fall τ = 0 gilt f (t) = t. Auch lineare Differentialgleichungen erster Ordnung für eine Funktion können stets auf Quadraturaufgaben, maW. auf die Bestimmung von Stammfunktionen, zurückgeführt werden. Darauf wird im nächsten Abschnitt eingegangen. Noch schwieriger wird die Situation für allgemeine Differentialgleichungssysteme und für Differentialgleichungen höherer Ordnung. Die Darstellung der Lösung in geschlossener Form gelingt nur dann, wenn betimmte Typen von Differentialgleichungen vorliegen bzw. eine Zurückführung auf derartige Typen erraten werden kann. Als Beispiel für eine Differentialgleichung zweiter Ordnung, für die praktisch stets eine Zurückführung auf Quadraturaufgaben gelingt, betrachten wir die Gleichung (10) f ′′ (x) = a f (x) . Sei A eine Stammfunktion von a, nach Multiplikation mit (10) mit 2f ′ (x) kommt f ′ (x)f ′′ (x) = A′ f (x) f ′ (x) 1 d ′ 2 d · A f (x) f (x) = 2 dx dx oder f ′ (x)2 (11) − A f (x) = C 2 Man wird also auf die Differentialgleichung erster Ordnung q (12) f ′ (x) = ± 2C + 2A f (x) , wobei freilich die korrekte Wahl des Vorzeichens auf der rechten Seite von (12), das ja z. B. auch von x abhängen kann, je nach dem konkreten Fall sorgfältige Betrachtungen erfordern kann. Übrigens hat (11) die Form eines Erhaltungssatzes, zumal wenn man den Summanden f ′ (x)2 /2 als kinetische und den Summanden −A f (x) als potielle Energie (also −A als Po” tential“ des Kraftfeldes“ a) deutet. Dies ist kein Zufall. Nach einem für Systeme der hier be” trachteten Art schon von Sophus Lie erkannten, in seiner allgemeinen feldtheoretischen Fassung nach Emmy Noether benannten Sachverhalt besteht ein Zusammenhang zwischen Symmetrien des Systemes und Erhaltungsgrößen. Der Zeitunabhängigkeit des Systemes2 entspricht dabei gerade die Energieerhaltung. Generell spielen Erhaltungssätze dieser Art eine wichtige Rolle bei der Vereinfachung von Differentialgleichungssystemen, die aus Problemen der Mechanik entstehen. 2Also der Translationsinvarianz: Mit f ist für jede Konstante K auch f (·+K) eine Lösung. Dies ist natürlich auch für allgemeinere Gleichungen der Form f ′′ (x) = A f ′ (x), f (x) der Fall, aber zur Anwendung des Satzes von Lie-Noether muß eine Zurückführung der Differentialgleichung auf ein sogenanntes Variationsproblem bekannt sein, die nur in dem von uns betrachteten Spezialfall derart einfach ist. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 67 Wie schon mehrfach angedeutet, gelingt die Zurückführung einer Differentialgleichung auf Quadraturaufgaben nur in relativ einfachen Spezialfällen. In vielen Fällen ist man auf numerische Verfahren zur Lösung von gewöhnlichen Differentialgleichungen angewiesen. Die theoretische Legitimation dafür liefert der folgende Satz von Picard-Lindelöf: Theorem 2. Die Funktion F~ sei auf [0, ε) × U mit ε > 0 definiert, wobei U ⊆ Rn offen und F~ Rn -wertig ist. Wir setzen voraus, daß F~ auf dem angegebenen Definitionsbereich stetig und in seinem zweiten Argument Lipschitz-stetig ist, also eine Bedingung der Form ~ (13) F (t, x) − F~ (t, y) ≤ L |x − y| erfüllt, wobei wir den Betrag von Elementen des Rn als v u n uX |x| = t x2 i i=1 definieren.3 Sei f~o ∈ U . Dann gibt es ein δ ∈ (0, ε], so daß das Anfangswertproblem (14) f~′ (t) = F~ t, f~(t) f~(0) = f~o genau eine Lösung auf f~ [0, δ) hat. Weiterhin existiert stets ein größtmögliches δ ∈ (0, ε] mit dieser Eigenschaft. Ist in diesem Fall η > 0 und ~g eine Lösung von (14) auf [0, η), so gilt η ≤ δ, und ~g ist die Einschränkung von f~ auf [0, η). Wie wir uns schon in Beispiel 2 und Beispiel 3 klargemacht haben, gibt es im Allgemeinen Lösungen endlicher Lebensdauer, bei denen also f~(t) in endlicher Zeit den Definitionsbereich von F~ verläßt oder gewissermaßen nach unendlich katapultiert wird. Daß die durch den Beweis des Satzes von Picard-Lindelöf konstruierten Lösungen manchmal eine Lebensdauer δ < ε haben, muß also umwillen der allgemein gehaltenen Voraussetzungen in Kauf genommen werden. Allerdings kann man zeigen, daß im Falle δ < ε die Lösung entweder unbeschränkt ist oder sich dem Komplement von U beliebig nahe annähert. Die Lösung ist also wirklich definiert, solange sie nicht nach unendlich abwandert oder den Definitionsbereich der rechten Seite verläßt. Daß die Voraussetzung (13) nicht ohne Weiteres aufgegeben werden kann, macht man sich durch Beispiele vom Typ Beispiel 1 klar4, in denen die Lösung des Anfangswertproblemes nicht 3Wofür es natürlich andere Alternativen gibt, etwa das Maximum der Beträge der einzelnen Komponenten xi . Alle vernünftigen Möglichkeiten führen aber letztlich auf dieselbe Bedingung (13) — Alle Normen auf dem endlichdimensionalen R-Vektorraum Rn sind äquivalent. 4In dem konkreten Beispiel tritt das Problem gerade im Fall des Anfangswertes f = 0 auf, der am o √ unteren Rand des Definitionsbreiches der rechten Seite f der Differentialgleichung liegt. Diespist aber für ein Gegenbeispiel dieser Art nicht notwendig, beispielsweise hat das Anfangswertproblem f ′ (t) = 3 f (t), f (0) = 0 die beiden Lösungen f (t) = 0 und f (t) = t3 , zusammen mit überabzählbar vielen anderen Lösungen, die man durch Zusammenstückeln“ dieser beiden Lösungen erhalten kann ” 68 eindeutig ist. Ohne die Eindeutgkeitsaussage bleibt das Theorem — nach einem Ergebnis von G. Peano — freilich p immer noch richtig, solange f stetig ist. Übrigens liefert Satz 1 Beispiele, wie f ′ (x) = 1+ |f (x)|, in denen die Lösung trotz verletzter Lipschitzstetigkeit noch eindeutig ist. Diese Beispiele sind eben relativ spezieller Art. Der Satz von Picard-Lindelöf ist nicht nur als theoretischer Hintergrund für die numerischen Verfahren zur Auflösung gewöhnlicher Differentialgleichungen interessant, sondern liefert auch oft die Rechtfertigung anderweitig bedenklicher Umforumungen von gewöhnlichen Differentialgleichungen, die zu einer Ermittlung der allgemeinen Lösung mit Bleistift und Papier führen sollen. Ein Beispiel dafür sind Eselsbrücken vom Typ (6) oder auch Substitutionen durch Potenzen mit nichtganzen Zahlen als Exponenten, wie sie bei der Behandlung von (.3.6.19) auftreten können oder auch an Ansätze, die zur Auffindung einer Lösung von sehr spezieller Form führen. Ist der Satz von Picard-Lindelöf anwendbar und kann man sich davon überzeugen, daß ein unter Umständen fragwürdiger Ansatz tatsächlich zu einer Lösung eines gegebenen Anfangswertproblemes geführt hat, so kann man sich sicher sein, die einzige Lösung gefunden zu haben. 3.6. Lineare gewöhnliche Differentialgleichung. 3.6.1. Lineare Differentialgleichungen erster Ordnung für eine Funktion. Die lineare gewöhnliche Differentialgleichung erster Ordnung für eine Funktion hat die Form f ′ (t) = a(t)f (t) + b(t). (1) Im Fall b(t) = 0 spricht man von einer homogenen Differentialgleichung, andernfalls vom inhomogenen Fall. Diese Unterscheidung zwischen homogen und imhomogen ist nur für lineare Differentialgleichungen üblich und entspricht genau der entsprechenden Unterscheidung für lineare Gleichungssysteme. Im homogenen Fall liegt offenbar eine Differentialgleichung mit trennbaren Variablen vor. Unsere Eselsbrücke“ (.3.5.6) liefert uns ” df = a(t)f dt df = a(t) dt f Z Z log f = f (t) dt = a(t) dt + C1 , also f (t) = C exp A(t) , (2) wobei A eine Stammfunktion von a ist. Obwohl Satz .3.5.1 im Fall des Anfangswertes 0 nicht anwendbar ist, ist die Lösung in diesem konkreten Fall auch dann eindeutig5 und durch (2) gegeben, und zwar auch im Fall komplexwertiger a. Es gilt also 5Was für stetige a aus dem Satz von Picard-Lindelöf gefolgert werden kann. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 69 Satz 1. Wenn a auf einem Intervall I ⊆ R definiert sowie reell- oder komplexwertig ist und daselbst eine Stammfunktion A hat, so haben alle Lösungen von (1) mit b = 0 auf I die Form (2), und umgekehrt ist die rechte Seite von (2) für jede Konstante C eine Lösung von (1) mit b = 0. Beweis. Durch Anwendung der Kettenregel (.3.1.5) ergibt sich f ′ (t) = CA′ (t) exp A(t) = A′ (t)f (t) = a(t)f (t). für die Ableitung von (2). Also definiert (2) wirklich Lösungen der betrachteten Differentialgleichung. Ein förmlicher Beweis der Eindeutigkeitsaussage6 soll der Kürze halber nur im Fall größerer Allgemeinheit geführt und daher noch bis zum Beweis von Satz 2 aufgeschoben werden. Wenn b in (1) nicht zu a proportional ist, liegt keine Differentialgleichung mit trennbaren Variablen vor. In diesem Fall hilft der Trick der Variation der Konstanten“, der übrigens ” generell auf lineare gewöhnliche Differentialgleichungen anwendbar ist, für die eine oder mehrere Lösungen der homogenen Differentialgleichung erraten werden können. Der Paradox klingende Name ist dadurch motiviert, daß man von (2) ausgeht, aber statt der Konstanten C eine Funktion C(t) einsetzt: f (t) = C(t) exp A(t) . Wenn zunächst ohne Nachweis der Differenzierbarkeit von C die Leibniz-Regel (.3.1.3) angwendet wird, kommt (mit Anwendung der Kettenregel (.3.1.5) auf den zweiten Faktor) (3) f ′ (t) = C ′ (t) exp A(t) + A′ (t)C(t) exp A(t) = C ′ (t) exp A(t) + a(t)f (t). Die Differentialgleichung (1) ist damit zu oder C ′ (t) exp A(t) = b(t) C ′ (t) = b(t) exp −A(t) , also zu einer Quadraturaufgabe, äquivalent. Satz 2. Die Funktionen a und b seien auf einem Intervall I ⊆ R definiert und reell- oder komplexwertig. Wir setzen voraus, daß a auf I eine Stammfunktion A hat. Dann hat (4) genau dann auf ganz I definierte Lösungen, wenn b(t) exp −A(t) eine Stammfunktion C auf I hat. Für jede Konstante K ist dann (4) C(t) + K) exp A(t) eine Lösung von (1), und jede Lösung dieser Differentialgleichung auf I hat die Form (4) mit einer Konstanten K. 6Der sich wie gesagt in vielen Fällen aus dem Satz von Picard-Lindelöf ergibt 70 Beweis. Wenn C eine Stammfunktion von b(t) exp −A(t) ist, so ist C differenziebar, die Umformungen nach (3) sind also legal und ergeben, daß C(t) exp A(t) eine Lösung der Differentialgleichung ist. Dasselbe gilt für (4), denn auch C(t) + K ist eine Stammfunktion von b(t) exp −A(t) . Sei umgekehrt folgt die Differenzierbarkeit f eine Lösung von (1). Aus der Kettenregel von exp −A(t) , also ist auch C(t) = f (t) exp −A(t) differnzierbar. Die Umformungen nach (3) sind also, mit C(t) statt C(t), anwendbar und zeigen, daß C eine Stammfunktion von ˜ b(t) exp −A(t) sein muß. Ist f eine andere Lösung von (1), so ist C̃ = f (t) exp −A(t) eine andere Stammfunktion derselben Funktion b(t) exp −A(t) und hat daher, nach Fakt .3.2.4, die Form C(t) + K mit einer Konstanten K. Alle Lösungen haben also die Form (4). 3.6.2. Lineare Differentialgleichungen zweiter Ordnung mit konstanten Koeffizienten. Die Differentialgleichung hat im homogenen Fall die Form f ′′ (t) + pf ′ (t) + q = 0 (5) Setzt man die Lösung als (6) f (t) = exp(λt) an, so ergibt sich für λ die quadratische Gleichung λ2 + pλ + q = 0. (7) In den meisten Fällen hat diese zwei verschiedene Lösungen r p2 p (8) λ± = − ± − q, 2 4 und (6) liefert zwei Lösungen f± (t) = exp(λ± t) von (5), für die die Vektoren f+ (t), f+′ (t) und f− (t), f−′ (t) für jedes t linear unabhängig sind. Man kann also für jedes Anfangswertproblem (5) kombiniert mit f ′ (to ) = a, f ′ (to ) = g eine Lösung durch Linearkombination von f+ und f− erhalten. Der Satz von Picard-Lindelöf zeigt nun, daß tatsächlich alle Lösungen von (5) auf einem Intervall Linearkombinationen von f+ und f− sind. Beispiel 1. Die Differentialgleichung f ′′ = f (t) hat die Lösungen f± (t) = exp(±t). Das Anfangswertproblem f ′′ (t) = f (t), f (0) = 1, f ′ (0) = 0 wird durch f (t) = 21 f+ (t) + f− (t) = cosh(t) gelöst. Dabei ist es vollkommen unerheblich, ob die Zahlen λ± reell oder komplex sind.7 Allerdings ist es im Fall reeller Koeffizienten p und q oft wünschenswert, zwei linear unabhängige rellwertige Lösungen auch dann zu benutzen, wenn λ± komplex sind. In diesem Fall, also (8) mit p2 < 4q, sind λ± und damit auch f± komlex konjugiert zueinander, so daß auch (9) f0 (t) = ℑ f+ (t) = sin(ωt) exp(αt) 7Entscheidend ist dabei freilich, daß die Exponentialfunktion auf ganz C holomorph, also komplex differenzierbar ist, so daß (.3.1.5) auch mit einer C-wertigen inneren Funktion f (x) = λx angewendet werden kann. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 71 f1 (t) = ℜ f+ (t) = cos(ωt) exp(αt) q 2 mit α = − p2 , ω = q − p4 die Differentialgleichung lösen. Wegen f± = f0 ± f1 läßt sich auch aus diesen Lösungen jede andere Lösung der Differentialgleichung auf einem Intervall linear kombinieren. Im Fall α = 0 beschreiben die Lösungen Schwingungsvorgänge, im Fall α < 0 gedämpfte Schwingungen, im Fall α > 0 Schwingungen mit Selbsterregung. Beispiel 2. (10) • Die Schwingungsgleichung f ′′ (t) = −f (t) hat f0 (t) = sin(t), f1 (t) = cos(t) als fundamentales System von Lösungen. Gibt man die Anfangswertbedingungen f ′ (0) = f (0) = 1 vor, so lautet die Lösung cos(t) + sin(t) = √ 2 sin(t + π4 ). • Die Differentialgleichung (11) f ′′ (t) = −2f ′ (t) − 2f (t) hat als fundamentales System von Lösungen f0 (t) = sin(t)e−t und f1 (t) = cos(t)e−t . Sie beschreibt gedämpfte Schwingungen. Besonderes Augenmerk verdient noch der Fall, daß (7) eine Doppellösung λ+ = λ− = λ hat. In diesem Fall bilden (12) f0 (t) = t exp(λt) f1 (t) = exp(λt) ein fundamentales System von Lösungen. Beispielsweise ist dies im Fall der Differentialgleichung f ′′ (t) = 0, mit λ = 0, der Fall. Die entsprechende inhomogene Gleichung (13) f ′′ (t) + pf (t) + qf (t) = b(t) kann wie im Fall einer Gleichung ersten Grades durch die Methode der Variation der Konstanten behandelt werden, wie gleich noch ausgeführt werden wird. Allerdings sind die entstehenden Quadraturaufgaben oft nicht mehr in geschlossener und elementarer Form zu lösen, ausgenommen in Fällen, in denen eine Lösung ohnehin erraten werden kann. Dies ist beispielsweise dann der Fall, wenn b(t) die Form (14) b(t) = P (t) exp(ϑt) mit einem Polynom P hat. In diesem Fall kann eine Lösung in der Form (15) f (t) = Q(t) exp(ϑt) angesetzt werden. Für den Grad von Q gelten die folgenden Bemerkungen: • Wenn ϑ keine Lösung von (7), also exp(ϑt) keine Lösung von (5) ist, so hat Q denselben Grad wie P . 72 • Wenn ϑ eine Lösung von (7) ist, also exp(ϑt) die homogene Gleichung (5) löst, so spricht man vom Vorliegen eines Resonanzfalles. Wenn dieser Fall vorliegt und (7) zwei verschiedene Lösungen hat, so gilt deg Q = deg P + 1, der Grad des Polynomes Q ist also um 1 höher als der Grad von P . • Wenn (7) eine doppelte Lösung hat, so ist im Resonanzfall der Grad von Q sogar um zwei höher als der Grad von P . Zu beachten ist, daß mit Ausnahme des dritten Falles der Ansatz (15) nicht alle Lösungen von (13) mit der rechten Seite (14). Die allgemeine Lösung der inhomogenen Gleichung ergibt sich in diesem Fall als Summe aus einer speziellen Lösung der inhomogenen Gleichung und der allgemeinen Lösung der homogenen Gleichung. Wenn die rechte Seite von (13) eine Summe von mehreren Funktionen bi ist, die die Form (14) haben, so kann nach diesem Rezept zunächst für jedes bi eine spezielle P Lösung fi der entsprechendenP inhomogenen Gleichung gefunden werden. Die Funktion f = ni=1 fi löst dann n (13) mit b = i=1 bi . Insbesondere sind auf diese Weise inhomogene Störterme der Form b(t) = sin(βt) exp(ϑt) und b(t) = cos(βt) exp(ϑt) zugänglich, denn die rechte Seite ist eine Linearkombination der Funktionen exp (λ ± iβ)t . In diesem Fall kann aber die Lösung auch direkt in der Form Q0 (t) exp(ϑt) sin(βt) + Q1 (t) exp(ϑt) angesetzt werden. Für den Grad der Polynome gilt dabei mit geringen Abwandlungen das vorhin Gesagte. Beispiel 3. • Wir betrachten die inhomogene Schwingungsgleichung f ′′ (t) + f (t) = sin(ϑt) (16) Wir setzen die Lösung als f (t) = a sin(ϑt) + b cos(ϑt) an und finden das lineare Gleichungssystem (1 − ϑ)2 a = 1, b = 0. Eine Lösung im Fall ϑ 6∈ {±1} ist also durch f (t) = gegeben. Im Fall ϑ = ±1 ist der Ansatz sin(ϑt) 1 − ϑ2 f (t) = (at + b) sin(t) + (ct + d) cos(t) zu wählen. Wir finden f ′ (t) = (a − d − ct) sin(t) + (c + b + at) cos(t) f ′′ (t) = −(2c + b + at) sin(t) + (2a − d − ct) cos(t) f ′′ (t) + f (t) = −2c sin(t) + 2a cos(t), also a = 0, c = − 21 , und die allgemeine Lösung von (16) hat die Form f (t) = b sin(t) + d − t cos(t). 2 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 73 • Soll f ′′ (t) + 2f ′ (t) + 2f (t) = sin(t) gelöst werden, setzt man eine spezielle Lösung dieser inhomogenen Gleichung als f (t) = a sin(t) + b cos(t) und findet das lineare Gleichungssystem a − 2b = 1, b + 2a = 0 und a = 1/2, b = −1/4, also sin(t) cos(t) − 2 4 als eine spezielle Lösung der inhomomogenen Gleichung. • Übrigens ist der soeben betrachtete Fall gerade nicht der Resonanzfall einer zu (11) gehörenden inhomogenen Gleichung vor. Dieser würde gerade für f (t) = f ′′ (t) + 2f ′ (t) + 2f (t) = sin(t) exp(−t) (17) vorliegen. Die allgemeine Lösung kann als f (t) = (at+b) sin(t) exp(−t)+(ct+d) cos(t) exp(−t) angesetzt werden, man findet das lineare Gleichungssystem −2c = 1, 2a = 0, also t f (t) = b sin(t) + (d − ) cos(t) exp(−t)]g 2 für die allgemeine Lösung von (17). 3.6.3. Variation der Konstanten für lineare Differentialgleichungssysteme erster Ordnung. CAVE: Zu tun. 3.6.4. Variation der Konstanten für die inhomogene Schwingungsgleichung. CAVE: Zu tun. 3.6.5. Variation der Konstanten für die homogene Gleichung. Für lineare Differentialgleichungen höherer Ordnung n mit nichtkonstanten Koeffizienten ist man im Allgemeinen darauf angewiesen, eine spezielle Lösung f der homogenen Gleichung erraten zu können. Setzt man die allgemeine Lösung der homogenen Gleichung als C(x)f (x) an, so ergibt sich für C eine lineare Differentialgleichung der Form C (n) (x) + an−1 C (n−1) (x) + · · · + a1 (x)C ′ (x) = 0, (18) in der also der normalerweise auch vorhandene Term nullter Ordnung a0 (x)C(x) verschwindet. Andernfalls würden ja konstante Funktionen C die Differentialgleichung (18) nicht lösen. Es ergibt sich also eine lineare homogene Differentialgleichung (n − 1)-ter Ordnung für C ′ , und die Lösung der Ausgangsgleichung ist zurückgeführt auf die Lösung einer Gleichung von um 1 kleinerer Ordnung, gefolgt von einer weiteren Quadraturaufgabe. 3.6.6. Die Bernoullische Differentialgleichung. Wenn f die lineare inhomogene Differentialgleichung (1) erfüllt und λ 6= 0 ist, so erfüllt g = f λ die Differentialgleichung8 1 g ′ (x) = λf (x)λ−1 f ′ (x) = λf (x)λ−1 a(x)f (x) + λb(x)f (x)λ−1 = λa(x)g(x) + g(x)1− λ . Also erfüllt g eine Bernoullische Differentialgleichung (19) g ′ (x) = α(x)g(x) + β(x)g(x)ϑ mit α = λa, β = λb, ϑ = 1 − λ1 . Derartige Differentialgleichungen können also auf (1) und damit auf Quadraturaufgaben zurückgeführt werden. 8Es werden hier formale Rechnungen vorgestellt. 74 3.6.7. Die Ricattische Differentialgleichung. Sei f 6= 0 eine Lösung der linearen homogenen Differentialgleichung zweiter Ordnung (20) f ′′ (x) + p(x)f ′ (x) + q(x)f (x) = 0. Für die logarithmische Ableitung C(x) = f ′ (x)/f (x) ergibt sich f ′ (x) = C(x)f (x), f ′′ (x) = C ′ (x) + C(x)2 f (x) und man erhält C ′ (x) + C(x)2 + p(x)C(x) + q(x) f (x) = 0 aus (20). Man wird also für g auf die Ricattische Differentialgleichung (21) C ′ (x) + r(x)C(x)2 + p(x)C(x) + q(x) = 0 mit r = 1 geführt. Wenn eine Lösung C(x) der Gleichung (21) bekannt ist, so kann eine Lösung f von (20) aus f ′ (x) = f (x)/C(x) ermittelt werden. Es liegt hier eine Gleichung vom Typ (1) im homogenen Fall vor, die Lösung führt also nach Satz 1 auf eine Quadraturaufgabe. Im Hinblick auf die enge Beziehung der Ricattischen Differentialgleichung zur linearen homogenen Differentialgleichung zweiter Ordnung und unsere Bemerkungen über (18) ist es nicht verwunderlich, daß die Ermittlung der allgemeinen Lösung der Ricattischen Differentialgleichung auf eine Quadraturaufgabe führt, wenn eine spezielle Lösung fo von (21) erraten werden kann. In diesem Fall nämlich führt die Ermittlung der allgemeinen Lösung von (21) auf die Lösung der folgenden Differentialgleichung für d(x) = f (x) − fo (x): d′ (x) + r(x)d(x)2 + 2r(x)fo (x) + p(x) d(x) = 0, eine Bernoullische Differentialgleichung (19) mit ϑ = 2. 3.7. Gleichmäßige Konvergenz und die Vertauschbarkeit von Limes und Integral. Definition 1. Eine Folge fn von reell- oder komplexwertigen Funktionen auf einer Menge X konvergiert gleichmäßig gegen die gleichartige Funktion f auf X, wenn zu jedem ε > 0 ein m mit (1) |fn (x) − f (x)| < ε für x ∈ X und n > m existiert. Man spricht auch von gleichmäßiger Konvergenz auf X. Bemerkung 1. Offenbar ergibt sich aus der gleichmäßigen Konvergenz von fn gegen f , daß limn→∞ fn (x) = f (x) für alle x ∈ X gilt. Die gleichmäßige Konvergenz ist aber eine Verschärfung dieser punktweisen Konvergenz, denn die Zahl m in (1) darf nicht von x abhängen, wie das bei der bloßen Gültigkeit von limn→∞ fn (x) = f (x) für jedes einzelne x ∈ X der Fall sein könnte. Gleichmäßige Konvergenz spielt eine wichtige Rolle bei der Vertauschung von Grenzübergängen. Als erstes Beispiel betrachten wir die Frage der Stetigkeit der Grenzfunktion. Satz 1. Wenn X eine Teilmenge von R oder C und x ∈ X ist und wenn fn eine Folge von an der Stelle x auf X stetigen Funktionen fn ist, welche gleichmäßig gegen f konvergiert, so ist f an der Stelle x stetig. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 75 Beweis. Sei ε > 0 vorgegeben. Nach Definition 1 gibt es ein m mit ε (+) |fn (a) − f (a)| < 3 für n ≥ m und alle a ∈ X. Auf Grund der Stetigkeit von fm gibt es ein δ > 0 mit ε |fm (x) − fm (y)| < 3 für alle y ∈ X mit |x − y| < δ. Für derartige y kann die obige Ungleichung kombiniert werden mit (+) für a = x und a = y. Man erhält ε ε ε |f (x) − f (y)| ≤ |f (x) − fn (x)| + |fn (x) − fn (y)| + |fn (y) − f (y)| < + + 3 3 3 für y ∈ X und |x − y| < δ. Die Stetigkeit von f an der Stelle x ist damit bewiesen. Für den Beweis des nachfolgenden Satzes benötigen wir die oft verwendete Tatsache, daß ein Integral durch die Länge des Integrationsweges mal das Maximum des Betrages des Integranden abgeschätzt werden kann. Lemma 1. Sei f eine reell- oder komplexwertige Funktion auf I = [a, b] mit |f (t)| ≤ M für t ∈ [a, b]. Wenn das Integral auf der linken Seite konvergiert, so gilt Z b (2) f (t) dt ≤ (b − a)M a Beweis. Der Beweis ergibt sich durch Anwendung von (.3.2.11) mit Φ(t) = M . Satz 2. Die Funktionen fn seien auf I = [a, b] definiert, und es gelte limn→∞ fn = f gleichmäßig auf I. Wenn die fn HK-integrierbar sind, so ist auch f HK-integrierbar, und es gilt Z b Z b (3) lim f (t) dt fn (t) dt = n→∞ a a Beweis. Zunächst soll die Existenz des Limes auf der linken Seite von (3) gezeigt werden. Dazu genügt nach Satz .2.2.1 der Nachweis, daß die Folge auf der rechten Seite dieser Gleichung ε eine Cauchy-Folge ist. Sei dazu ε > 0, es gibt nach Definition 1 ein m mit |fn (x) − f (x)| < 2(b−a) ε ε für n ≥ m. Für min(k, l) ≥ m folgt dann |fk (x) − fl (x)| < b−a . Aus (2) mit M = b−a folgt dann Z b Z b Z b Z b ε dx = ε. fk (x) − fl (x) dx ≤ fl (x) dx = fk (x) dx − a b−a a a a Die Folge auf der linken Seite von (3) ist also wie behauptet eine Cauchy-Folge. Sei nun ι der Grenzwert auf der linken Seite von (3). Wir zeigen, daß das Integral auf der rechten Seite von (3) gegen ι konvergiert. Sei dazu ε > 0 gegeben, wir wählen m mit folgenden Eigenschaften: Rb • Für k ≥ m gilt ι − a fn (t) dt < 3ε . 76 • Für k ≥ m und alle x ∈ I gilt |fk (x) − f (x)| < ein derartiges m zu wählen. ε . 3(b−a) Nach Definition 1 ist es möglich, R b Auf Grund der Integrierbarkeit von fm gibt es eine Eichung δ auf I mit a fm (t) dt − σ(Z, Ξ, fm ) < ε für jede δ-feine Zerlegung (Z, Ξ). Für derartige (Z, Ξ) gilt dann 3 Z b Z b fm (t) dt + fm (t) dt − σ(Z, Ξ, fm ) + |σ(Z, Ξ, fm ) − σ(Z, Ξ, f )| |ι − σ(Z, Ξ, f )| ≤ ι − a a ε ε ε < + + = ε, 3 3 3 wobei Fakt .3.2.1 und (.3.2.12) benutzt wurden: |σ(Z, Ξ, fm ) − σ(Z, Ξ, f )| = |σ(Z, Ξ, f − fm )| ≤ σ Z, Ξ, |f − fm | ≤ σ Z, Ξ, ε ε = 3(b − a) 3 Also konvergiert das Integral auf der rechten Seite von (3) in der Tat gegen ι. Um an dieser Stelle schon einen Überblick über die wichtigsten Sätze zur Vertauschbarkeit von Limes und Integral zu geben, formulieren wir die beiden folgenden Sätze ohne Beweis an dieser Stelle Satz 3 (Satz über die monotone Konvergenz). Sei (fn ) eine monoton wachsende Folgen Rb reellwertiger Funktionen, für die a fn (t) dt konvergiert. Wir setzen voraus, daß die Folge fn punktweise gegen die Funktion f konvergiert. Dann gilt Z b Z b f (t) dt = lim fn (t) dt, n→∞ a a wobei beide Seiten konvergieren oder bestimmt divergieren. Die Behauptung wird später nochmals als Theorem 4 formuliert und bewiesen. Als Folgerung daraus werden wir als Theorem 5 den folgenden Satz über die majorisierte Konvergenz herleiten: Satz 4 (Satz über die majorisierte Konvergenz). Sei m eine Funktion auf [a, b] mit nichtRb negativen Funktionswerten, für die a m(t) dt konvergiert. Sei (fi )∞ i=0 eine Folge rell- oder komplexwertiger Funktionen mit |fi (t)| ≤ m(t), so daß für alle t ∈ I f (t) = limi→∞ fi (t) existiert. Rb Wenn die Integrale a fi (t) dt konvergieren, so gilt Z b Z b fi (t) dt = f (t) dt, lim i→∞ a a wobei sowohl der Grenzwert auf der linken als auch das Integral auf der rechten Seite konvergieren. Es handelt sich hierbei um Sätze, die historisch zuerst im Rahmen der Lebesgueschen Integrationstheorie bewiesen worden sind, die aber auch für das HK-Integral gültig sind. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 77 Ra Rb Definition 2. Sei b < a. Wir setzen a f (t) dt = − b f (t) dt, falls das letztere Integral wohldefiniert (konvergent oder bestimmt divergent) ist. Bemerkung 2. Aus dem zweiten Hauptsatz der Integral- und Differentialrechnung folgt Rb auch für b < a die Identität f (b)−f (a) = a f ′ (t) dt, falls die Ableitung auf [min(a, b), max(a, b)] existiert. Satz 5. Sei fn eine Folge von auf dem Intervall I definierten und differenzierbaren Funktionen, die daselbst punktweise gegen f konvergiert. Wenn die Folge der Ableitungen fn′ gleichmäßig gegen die Funktion g konvergiert, so ist f differenzierbar auf I mit Ableitung g. Beweis. Aus dem zweiten Hauptsatz der Integral- und Differentialrechnung folgt Z t fn′ (x) dx fn (t) − fn (s) = s für t, s aus I. Auf Grund von Satz 2 können beim Grenzübergang n → ∞ auf der rechten Seite Limes und Integration vertauscht werden: Z t Z t ′ (+) f (t) − f (s) = lim fn (t) − fn (s) = lim g(x) dx. fn (x) dx = n→∞ n→∞ s s Seien t ∈ I und ε > 0 vorgegeben. Wir wählen ein n mit |fn′ (x) − g(x)| < 3ε für alle x ∈ I. Weiterhin wählen wir δ > 0 mit |fn (t) − fn (s) − fn′ (t)(t − s)| < 3ε |t − s| für alle s ∈ I mit |s − t| < δ, das ist wegen Fakt .3.1.2 möglich. Für derartige s gilt dann |f (t) − f (s) − g(t)(t − s)| ≤ |f (t) − f (s) − fn (t)(t − s)| + |g(t) − fn (t)| |t − s| Z s = g(x) dx − fn (t)(t − s) + |g(t) − fn (t)| |t − s| Zt s Z ε s ′ ′ < g(x) − fn (X) dx + fn (x) dx − fn (t)(t − s) + |t − s| 3 t t ε ε ≤ |t − s| + |fn (t) − fn (s) − fn′ (t)(t − s)| + |t − s| 3 3 ε ε ε ≤ |t − s| + |t − s| + |t − s| = ε |t − s| , 3 3 3 ′ und auf Grund von Fakt .3.1.2 gilt f (t) = g(t). Bemerkung 3. • Man kann ziemlich leicht zeigen, daß unter den angegebenen Voraussetzungen auch die Folge fn gleichmäßig konvergiert. • Die Behauptung gilt mit einem anderen Beweis sogar für die komplexe Ableitung. In diesem Fall gilt sogar mehr: Wenn Ω ⊆ C offen ist, die Funktionen fn holomorph auf Ω sind und gleichmäßigt daselbst gegen f konvergieren, so ist g holomorph, und die Folge der komplexen Ableitungen fn′ konvergiert gleichmäßig gegen g ′ auf jeder beschränkten abgeschlossenen Teilmenge von C, die in Ω enthalten ist. Es ist dies ein weiteres Beispiel dafür, daß in der Theorie holomorpher Funktionen oft schärfere Aussagen gelten als in der reellen Infinitesimalrechnung. 78 3.8. Der (erste) Hauptsatz der Integral- und Differentialrechnung. Theorem 3. Jede stetige Funktion f auf einem Intervall R t I = [a, b] hat eine Stammfunktion F auf I. Genauer gesagt konvergiert das Integral F (t) = a f (τ ) dτ für alle t ∈ I, und F ist eine Stammfunktion von f . Bemerkung 1. • Es gibt durchaus auch viele unstetige Funktionen, für die das in Theorem 3 untersuchte Integral konvergiert. Allerdings ist es für unstetige Funktionen meist9 nicht richtig, daß die Ableitung von F gleich f ist. • Wir werden in drei Schritten vorgehen. Zunächst zeigen wir, daß sich bei gleichmäßiger Konvergenz die Behauptung des Theoremes von den Gliedern fn einer Funktionenfolge auf deren Grenzwert f vererbt. Sodann geben wir eine einfache Klasse von Funktionen (nämlich die Polygonzüge) an, für die man eine Stammfunktion explizit konstruieren kann, und zeigen, daß jede stetige Funktion als Limes einer gleichmäßig konvergenten Folge von Polygonzügen geschrieben werden kann. Fakt 1. • Für eine Funktion f auf einem Intervall I = [a, b] sind folgende Bedingungen äquivalent: a. Es gibt eine Stammfunktion F von f auf I. Rt b. Das Integral a f (τ ) dτ konvergiert für alle t ∈ I, und F ist eine Stammfunktion von f . • Wenn f der Limes einer auf I gleichmäßig konvergenten Folge von Funktionen ist, für die diese Bedingungen richtig sind, so sind sie auch für f erfüllt. Beweis. Die erste Aussage folgt aus dem R t zweiten Hauptsatz der Integral- und Differentialrechnung. Nach diesem Satz gilt nämlich a f (τ ) dτ = F (t) − F (a) unter den Voraussetzungen von a. Diese Funktion ist differnzierbar mit Ableitung F ′ = f , also gilt b. Daß umgekehrt a. aus b. folgt, ist trivial. Zum zweiten Punkt bemerkt man, daß sich die Bedingung b. aus dem ersten auf Grund von Satz .3.7.2 und Satz .3.7.5 auf Limites gleichmäßig konvergenter Funktionenfolgen vererbt, deren Glieder diese Bedingung erfüllen. Definition 1. Ein Polygonzug ist eine Funktion f auf I, für die eine Zerlegung Z von I in Teilintervalle Ik = [ak−1 , ak ], a = a0 < a1 · · · < an existiert, so daß f auf [ak−1 , ak ] die Form f (t) = λk t + µk hat. Satz 1. Für jeden Polygonzug auf einem Intervall I gibt es eine Stammfunktion. Jeder Polygonzug erfüllt daher die äquivalenten Bedingungen aus Fakt 1 Beweis. Wir führen den Beweis durch Induktion nach n. Im Fall n = 1 ist f (t) = λ1 t + µ1 ein Polynom erster Ordnung, und eine Stammfunktion ist durch F (t) = λ21 t2 + µ1 t gegeben. Sei n > 1 und die Behauptung bewiesen für Polygonzüge, die aus weniger als n Strecken 9Aber nicht immer: Notwendig und hinreichend für F ′ = f auf ganz I ist, daß jedes Element von I ein soganannter Lebesgue-Punkt von f ist. Diese Bedingung wird von den meisten Standardbeispielen für unstetige Funktionen verletzt, ist aber schwächer als die Stetigkeit 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 79 zusammengesetzt sind. In den Bezeichungen der Definition sei I1 = [a, an−1 ], I2 = [an−1 , b], fk = f |Ik . Auf Grund der Induktionsannahme hat f1 eine Stammfunktion F1 . Sei ( F1 (t) t ∈ I1 F (t) = µn 2 F1 (an−1 ) + λn (t − an−1 ) + 2 (t − an−1 ) t ∈ I2 , wobei im Fall t = an−1 beide Alternativen genommen werden können und zu demselben Ergebnis führen. Der untere Zweig der Fallunterscheidung definiert offenbar eine Stammfunktion F2 für f2 . Nach Fakt .3.1.1 ist F differenzierbar auf I mit Ableitung f . Satz 2. Jede stetige Funktion f auf einem abgeschlossenen Intervall I ist Limes einer gleichmäßig konvergenten Folge von Polygonzügen. Beweis. Es genügt, zu jedem ε > 0 einen Polygonzug fε mit |f (x) − fε (x)| < ε auf ganz I zu finden, denn dann konvergiert die Folge der Polygonzüge f2−n gleichmäßig gegen f . Zur Konstruktion von fε wählen wir für jedes x ∈ I eine Zahl δ(x) > 0 mit |f (x) − f (t)| < 2ε für alle t ∈ I mit |t − x| < δ(x). Dann ist δ eine Integraleichung, und nach Fakt .3.2.2 existiert eine δ-feine Zerlegung a = a0 ≤ ξ1 ≤ a1 ≤ ξ2 ≤ a2 ≤ . . . ≤ ξn ≤ an = b von I. Wir definieren fε durch (x − ak−1 )f (ak ) + (ak − x)f (ak−1 ) fε (x) = ak − ak−1 für x ∈ [ak−1 , ak ]. Für x = al mit 0 < l ≤ n liefern offenbar k = l und k = l − 1 denselben Funktinswert, fε ist also wohldefiniert. Für x ∈ [ak−1 , ak ] gilt ε |fε (x) − f (x)| ≤ |fε (x) − f (ξk )| + |f (x) − f (ξk )| < |fε (x) − f (ξk )| + 2 (x − ak−1 ) f (ak ) − f (ξk ) + (ak − x) f (ak−1 ) − f (ξk ) ε + = ak − ak−1 2 ak − x ε x − ak−1 |f (ak ) − f (ξk )| + |f (ak−1 − f (ξk )| + ≤ ak − ak−1 ak − ak−1 2 ak − x ε ε x − ak−1 ε · + · + = ε, ≤ ak − ak−1 2 ak − ak−1 2 2 also leistet fε in der Tat das Gewünschte. Wie bereits erklärt (Bemerkung 1), ergibt sich das Theorem aus den beiden Sätzen und Fakt 1. Bemerkung 2. Auch hier seien einige Bemerkungen über die analoge Aussage für komplexe Ableitungen und Stammfunktionen gestattet, obwohl dies kein zentraler Punkt der Vorlesung ist. Wie schon erwähnt (Bemerkung .3.1.1), gilt in der komplexen Differentialrechnung der Satz, daß die Ableitung einer holomorphen Funktion wieder holomorph ist. Man hat also nur für holomorphe Funktionen f auf einer offenen Teilmenge Ω ⊆ C überhaupt eine Chace, eine komplexe Stammfunktion F zu finden, also eine holomorphe Funktion F auf Ω mit F ′ = f . 80 Hinzu kommt noch ein weiteres Problem, wenn das Gebiet Ω Löcher“ hat. Ein Beispiel dafür ” ist Ω = C \ {0}. Auf Ω ist f (z) = z1 holomorph. Man kann aber zeigen, daß keine auf ganz Ω holomorphe Funktion F mit komplexer Ableitung f existiert. Die Nichtexistenz derartiger F ist eng verwandt mit den Schwierigkeiten bei der Definition des komplexen Logarithmus, der ja auch nicht auf ganz C \ {0} stetig ist, sondern erst nach Aufschlitzen“ von C entlang einer ” Halbachse durch {0}. Auf einer derart aufgeschlitzten Ebene ist der komplexe Logarithmus dann eine komplexe Stammfunktion von f (z) = z1 . Für die Existenz einer komplexen Stammfunktion ist also die Bedingung der Stetigkeit von f zur Bedingung der Holomorphie von f zu verschärfen. Dazu kommen noch Bedingungen an das Gebiet Ω, die zum Beispiel für konvexe Teilmengen von C stets erfüllt sind, nicht aber für Gebiete mit Löchern“. ” 3.9. Potenzreihen und die Taylorsche Formel. Satz 1 (Taylorsche Formel mit dem Restglied in Integralform). Sei k ≥ 0. Wenn die Funktion f (k + 1)-mal differenzierbahr auf einem Intervall ist, das die reellen Zahlen x und x + h enthält, so gilt Z k X hj (j) 1 h (k+1) (1) f (x + h) = f (x) + f (x + η)(h − η)k dη. j! k! 0 j=0 Beweis. Im Fall k = 0 handelt sich bei der Behauptung letzlich um den zweiten Hauptsatz der Integral- und Differentialrechnung Theorem 1. Wir können also durch Induktion nach k vorgehen, mit dem Fall k = 0 als Induktionsanfang. Der Induktionscschluß ergbit sich durch die partielle Integration (Satz .3.4.1) Z h Z h (k+1) k (k+1) k+1 f (k+2) (x + η)(h − η)k+1 dη. f (x + η)(h − η) dη = f (0)h + (k + 1) 0 0 Satz 2 (Mittelwertsatz der Integralrechnung). Die Funktion g auf I = [a, b] sei reellwertig und stetig. Sei weiterhin w eine Funktion auf I mit nichtnegativen reellen Funktionswerten, Rb für die das Integral a w(t) dt konvergiert. Dann gibt es ein ξ ∈ I mit Z b Z b w(t) dt. g(t)w(t) dt = g(ξ) (2) a a Beweis. Wir setzen Rhier stillschweigend voraus, daß das Integral auf der linken Seite von b (2) konvergiert und µ = a w(t) dt nicht verschwindet.10 10Bei den in diesem Kapitel vorgestellten Anwendungen ist w meist ebenfalls stetig, so daß die Konvergenz der linken Seite von (2) aus dem ersten Hauptsatz der Integral- und Differentialrechnung folgt. Auch wird in diesen Fällen klar sein, daß µ 6= 0 gilt. Wir werden diese Lücken im Beweis des Satzes später in Bemerkung .3.14.3 schließen 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 81 Nach Satz .2.4.6 existieren M = max g(x) x ∈ I und m = min g(x) x ∈ I . Nach Rb (.3.2.9) gilt µ > 0 und µm ≤ a g(x)w(x) dx ≤ µM .11 Wir erhalten Z 1 b g(x)w(x) dx ≤ M. m≤ µ a Nach dem Zwischenwertsatz für stetige Funktionen (Satz .2.4.3) gibt es ein ξ ∈ I mit Z 1 b g(x)w(x) dx = g(ξ). µ a Bemerkung 1. Für komplexwertige g ist die Behauptung falsch. Beispielsweise gilt für Rb g(t) = exp(it), a = 0, b = 2π a g(t) dt = 0, während kein ξ mit g(ξ) = 0 existiert, im Widerspruch zu Satz 2 mit w(x) = 1. Durch Anwendung des Mittelwertsatzes der Integralrechnung auf das Restglied in (1), mit g(η) = f (k+1) (η), w(η) = (h − η)k , ergibt sich Folgerung 1 (Taylorsche Formel mit dem Restglied von Lagrange). Sei k ≥ 0. Wenn die Funktion f reellwertig und (k + 1)-mal stetig differenzierbahr auf einem Intervall ist, das die reellen Zahlen x und x + h enthält, so gilt (3) f (x + h) = k X hj j=0 j! f (j) (x) + hk+1 (k+1) f (η) (k + 1)! mit einer Zahl η, die zwischen x und x + h liegt (also η ∈ [min(x, x + h), max(x, x + h)]). Aus ähnlichen Gründen wie früher (Bemerkung 1) ist man auch im Fall des Restgliedes von Lagrange gezwungen, sich auf den Fall rellwertiger Funktionen zu beschränken. Dasselbe gilt für den Mittelwertsatz der Differentialrechnung, der (abgesehen von den bei uns etwas schärferen Voraussetzungen) der Spezialfall k = 0 von (1) ist. Folgerung 2 (Spezialfall des Mittelwertsatzes der Differentialrechnung). Die Funktion f sei reellwertig und stetig differenzierbar auf I = [a, b] mit a < b, dann existiert ein ξ ∈ I mit f (b) − f (a) = f ′ (ξ). b−a (4) Der Beweis ergibt sich durch Anwendung von (3) mit k = 0 und Auflösung der enstehenden Gleichung nach f ′ (xi). Bemerkung 2. • Der Mittelwertsatz der Differentialrechnung bleibt richtig unter der schwächeren Voraussetzung, daß f stetig auf [a, b] und differenzierbar auf (a, b) ist, wobei unter diesen Voraussetzungen die Existenz eines ξ ∈ (a, b) mit (4) gezeigt werden kann. 11Beispielsweise g(x)w(x) ≤ M w(x) ergibt sich Rb a g(x)w(x) dx ≤ µM durch Anwendung von (.3.2.9) auf die Ungleichung 82 • In den gängigen Lehrbüchern der Infinitesimalrechnung pflegt man Sätze wie Folgerung .3.2.1 oder den Satz über die Eindeutigkeit der Stammfunktion bis auf eine Integrationskonstente aus dem Mittelwertsatz der Differentialrechnung herzuleiten. Da wir in unserem Text auf der HK-Integration aufbauen, steht der zweite Hauptsatz der Integral- und Differentialrechnung in großer Allgemeinheit zur Verfügung, so daß wir die Behandlung des Mittelwertsatzes der Differentialrechung aufschieben konnten und uns auch nicht gezwungen sehen, diesen Satz in der größtmöglichen Allgemeinheit zu beweisen. • Ähnlich wie beim ersten Punkt gilt auch (3) unter der schwächeren Voraussetzung, daß f k-mal differenzierbar auf dem Intervall von x bis x + h, f (k) stetig daselbst ist und die Ableitung f (k+1) auf dem offenen Intervall von x bis x + h existiert. Bemerkung 3. Neben dem soeben beschriebenen Restglied von Lagrange gibt es noch andere Restglieder in der Taylorschen Formel für reellwertige f . Durch Anwendung des Mittelwertsatzes der Integralrechnung auf das Restglied in (1) mit g(η) = f (k+1) (η)(h − η)k−p , w(η) = (h − η)p mit −1 < p ≤ k, h > 0 erhält man des Restglied von Schlömilch, die Spezialfälle p = k − 1 bzw. p = k sind das Restglied von Cauchy bzw. das vorhin beschriebene Restglied von Lagrange. Wir gehen nicht auf die Details ein. Die Taylorsche Formel wirft die Frage auf, ob für k → ∞ das Restglied gegen 0 konvergiert, also ∞ X f (k) (xo ) (5) f (x) = (x − xo )k (x − xo )k k! k=0 wenigstens für solche x gilt, die genügend nahe bei xo liegen. Offenbar handelt es sich bei (5) um eine Reihe, deren Summanden die Form ak (x − xo )k haben. Derartige Reihen nennt man Potenzreihe, und wir wollen zunächst die Frage des Konvergenzverhaltens derartiger Reihen untersuchen. Satz 3. Sei ∞ X (6) k=0 ak (x − xo )k eine Potenzreihe. Dann gibt es ein R ∈ [0, ∞] so daß diese Reihe für |x − xo | < R konvergiert und für |x − xo | > R divergiert. Es gilt 1 p (7) R= , lim supn→∞ n |an | diese Zahl wird der Konvergenzradius der Potenzreihe genannt. Für ρ ∈ [0, R) konvergiert (6) gleichmäßig für |x − xo | ≤ ρ. Weiterhin hat die gliedweise differenzierte Potenzreihe ∞ X (8) (k + 1)ak+1 (x − xo )k k=0 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 83 denselben Konvergenzkreis und konvergiert in dessen Inneren gegen die Ableitung von (6). Beweis. Sei A ∈ [0, ∞] der lim sup in (7), und sei 0 < ρ < R. Wir wollen zeigen, daß (6) in der Region |x − xo | ≤ ρ gleichmäßig konvergiert.pDazu wählen wir ein ρ̃ ∈ (ρ, R) und setzen à = ρ̃1 . Dann gilt à > A, nach Fakt .2.2.4 gilt also n |an | ≤ à oder |an | ≤ Ãn für alle genügend großen n. Für |x − xo | ≤ ρ gilt dann ρ n n n n . |an (x − xo ) | ≤ ρ à = ρ̃ Für derartige x hat also (6) die zu q = ρρ̃ ∈ (0, 1) gehörende konvergente geometrische Reihe als Majorante und konvergiert daher. Wegen ∞ ∞ l ∞ X X X X q l+1 k k k k →0 a (x − x ) − a (x − x ) = a (x − x ) ≤ q = k o k o k o 1 − q k=0 k=0 k=l+1 k=l+1 für k → ∞ erfolgt die Konvergenz von (6) sogar gleichmäßig auf {x| |x − xo | ≤ ρ}. Da dies für alle ρ < R gilt, konvergiert (6) für |x − xo | < R. p 1 n |an | ≥ à . Dann gilt à > A. Nach Fakt .2.2.4 gilt also Sei |x − xo | > R und à = |x−x o| oder |an | ≥ Ãn für unendlich viele n. Für derartige n gilt dann |(x − xo )n an | ≥ 1. Die Folge der Summanden in (6) kann also nicht gegen 0 konvergieren, folglich (Satz .2.1.7) divergiert (6). Es verbleibt der Nachweis, daß (6) und die formal differenzierte Reihe ∞ X (+) (k + 1)ak+1 (x − xo )k k=0 denselben Konvergenradius haben. Durch Multiplikation von (+) mit x − xo entsteht ∞ X (%) kak (x − xo )k . k=0 Diese Reihe und (+) haben also dasselbe Konvergenzverhalten, denn für x 6= xo ändert Multiplikation mit x − xo nichts an Konvergenz oder Divergenz p und für x = xo konvergieren beide p √ Reihen ohnehin. Wegen limk→∞ k k = 112 gilt lim supk→∞ k |ak | = lim supk→∞ k |kak |, nach (7) haben also (%) und (6), und damit auch (+) und (6), wie behauptet denselben Konvergenzradius. Bemerkung 4. Zusammen mit den von uns bewiesenen bzw. (im komplexen Fall) ohne Beweis formulierten Fakten über die Vertauschbarkeit von Limes und Ableitung bei gleichmäßiger Konvergenz folgt, daß eine Potenzreihe (6) mit Konvergenzradius R für |x − xo | < R eine beliebig oft differenzierbare (bzw. holomorphe) Funktion definiert und gliedweise differenziert werden kann. p p √ √ k k k =1 Beispiel gilt k − 1 ≤ √1k auf Grund der Bernoullischen Ungleichung, also limk→∞ p √ √ 2 k k und damit limk→∞ k = limk→∞ k = 1. 12Zum 84 In der reellen Differentialrechung kann man keine allgemein gültigen Konvergenzaussagen für (5) formulieren und auch nicht beweisen, daß die Taylorreihe (5) im Fall ihrer Konvergenz wirklich gegen f (x) konvergiert. Bemerkung 5. • Nach einem Satz von E. Borel kann man jede Potenzreihe (6) mit rellem xo als Taylorreihe (5) einer auf ganz R beliebig oft differenzierbaren Funktion darstellen. Insbesondere P∞ k k gilt das auch für Potenzreihen mit Konvergenzradius 0, wie zum Beispiel k=0 k x . Reelle Differenzierbarkeitseigenschaften alleine reichen also nicht aus, um nichttriviale (x 6= xo ) Konvergenzaussagen für (5) zu zeigen. • Sei ( e−1/t t > 0 f (t) = 0 t≤0 Man kann zeigen, daß f auf ganz R beliebig oft differenzierbar ist und daß alle Ableitungen f (k) (t) für t ≤ 0 verschwinden. Die Taylorreihe von f an der Stelle x = xo hat also verschwindende Koeffizienten. Sie konvergiert daher überall, aber es gibt keine Umgebung von 0, auf der sie überall gegen den richtigen“ Wert f (x) konvergiert, da f ” auf keiner Umgebung von 0 identisch verschwindet. Um mit Mitteln der rellen Differentialrechnung Konvergenzaussagen für (5) zu zeigen, reicht es also nicht, die Existenz aller höheren Ableitungen von f zu fordern. Man muß zusätzlich Wachstumseigenschaften dieser Ableitungen in Abhängigkeit von k kennen, um für irgendeine Form des Restgliedes zu zeigen, daß dieses für k → ∞ gegen 0 strebt. Bequemer ist es meist, den folgenden Satz der komplexen Analysis zu zitieren: Bemerkung 6. Sei Ω ⊆ C offen und f holomorph auf Ω. Sei xo ∈ Ω, so daß der Kreis K = x |x − xo | < R in Ω enthalten ist. Dann gibt es eine Potenzreihe (6), die für |x − xo | < R gegen f (x) konvergiert. Diese Reihe stimmt mit der Taylorreihe (5) für f überein. 3.10. Einige Eigenschaften des Henstock-Kurzweil-Integrales. Uneigentliche Integrale. Wir wollen einige über den ersten Hauptsatz der Integral- und Differentialrechnung hinausgehende Sätze über die Konvergenz von HK-Integralen zeigen, auf den Begriff uneigent” liches Integral“ eingehen und den Beweis der Sätze über die monotone und die majorisierte Konvergenz vorbereiten. Wir beginnen mit dem folgenden Satz, der als eine Version für Integrale des Satzes über die Konvergenz von Cauchyfolgen aufgefaßt werden kann: Rb Satz 1. Für eine Funktion auf I = [a, b] konvergiert a f (t) dt genau dann, wenn für jedes ε > 0 eine Eichung δ mit (1) σ(Z, Ξ, f ) − σ(Z̃, Ξ̃, f ) ≤ ε für zwei δ-feine Zerlegungen (Z, Ξ) und (Z̃, Ξ̃) von I existiert. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 85 Beweis. Sei für k ∈ N δ k eine Integraleichung, so daß (1) mit ε = 2−k (und δ k -feine Zerlegungen) gilt. Wir dürfen δ k+1 ≤ δ k annehmen, denn sonst ersetzt man einfach die Folge der δ k durch die Folge der δ̃ k (x) = min δ 0 (x), . . . , δ k (x) . Sei (Zk , Ξk ) eine δ k -feine Zerlegung von I und ik = σ(Zk , Ξk , f ). Dann gilt |ik − il | ≤ 2− min(k,l) (+) auf Grund von (1), denn (Zk , Ξk ) und (Zl , Ξl ) sind beide δ min(k,l) -fein. Wegen (+) ist ik eine Rb Cauchyfolge. Sei i = limk→∞ ik . Dann konvergiert a f (t) dt gegen i. In der Tat, sei ε > 0 gegeben. Wir wählen ein k ∈ N mit 2−k < 2ε . Ist (Z, Ξ) δ k -fein, so gilt |σ(Z, Ξ, f ) − ik | ≤ 2−k auf Grund von (1). Aus (+) folgt aber i − ik ≤ 2−k , also |σ(Z, Ξ, f ) − i| ≤ 21−k < ε, Rb und die Konvergenz von a f (t) dt gegen i ist gezeigt. Zum Beweis der Notwendigkeit wählt man für jedes ε > 0 eine Eichung δ mit Z b ε < f (t) dt − σ(Z, Ξ, f ) 2 a für jede δ-feine Zerlegung. Diese Eichung erfüllt offenbar (1). Als Folgerung erhalten wir: Satz 2. Sei f eine Funktion auf I = [a, b]. Wenn J = [c, d] in I enthalten ist und f auf I integrierbar ist, so ist f auch auf J integrierbar. Beweis. Sei ε > 0 und δ eine Eichung auf I mit (1). Seien (Z′ , Ξ′ ) und (Z′′ , Ξ′′ ) δ-feine Zerlegungen von [a, c] und [d, b]. Wenn (Zk , Ξk ), k ∈ {1; 2}, zwei δ-feine Zerlegungen von [c, d] sind, so sind (Z̃k , Ξ̃k ) = (Z′ , Ξ′ ) ◦ (Zk , Ξk ) ◦ (Z′′ , Ξ′′ ) zwei δ-feine Zerlegungen von I. Auf Grund der Bedingung (1) an δ gilt also σ( Z̃ , Ξ̃ , f ) − σ( Z̃ , Ξ̃ , f ) < ε. 1 1 2 2 Nach (.3.2.6) gilt aber σ(Z̃k , Ξ̃k , f ) = σ(Z′ , Ξ′ , f ) + σ(Zk , Ξk , f ) + σ(Z′′ , Ξ′′ , f ), und es folgt σ(Z̃1 , Ξ̃1 , f ) − σ(Z̃2 , Ξ̃2 , f ) = |σ(Z1 , Ξ1 , f ) − σ(Z2 , Ξ2 , f )| < ε. Folglich ist (1) auch für δ |J erfüllt, und der vorige Satz ergibt die Konvergenz des Integrales über J. Bemerkung 1. Für bestimmt divergente Integrale ist der Satz falsch, wie man ziemlich leicht einsieht: Aus der bestimmten Divergenz des Integrales von a nach b kann über das Integral über das kleinere Teilstück nur gefolgert werden, daß es nicht in die entgegengesetzte Richtung bestimmt divergiert. 86 Ähnlich wichtig ist der Satz, daß umgekehrt die Integrierbarkeit von Funktionen auf den Teilstücken einer endlichen Zerlegung des Intervalles in Teilintervalle überprüft werden kann: Satz 3. Sei a < b < c. Dann gilt Z c Z b Z c f (t) dt = f (t) dt + f (t) dt, a a b wobei das Integral auf der linken Seite genau dann konvergiert, wenn beide Summanden auf der rechten Seite konvergieren. Zur Vorbereitung des Beweises benötigen wir eine Definition: Definition 1. Wir nennen eine Integraleichung ε-fein für f auf I, wenn Z b ≤ε (2) f (t) dt − σ(Z, Ξ, f ) a für jede δ-feine Zerlegung (Z, Ξ) von I = [a, b] gilt. Wenn (Z, Ξ) eine δ-feine Zerlegung ist, nennt man die Differenz Z b f (t) dt − σ(Z, Ξ, f ) (3) a eine δ-Diskrepanz von f auf I. Bemerkung 2. Offenbar ist δ genau dann ε-fein für f auf I, wenn |d| ≤ ε für jde δDiskrepanz d von f auf I gilt. Offenbar hat die Integrierbarkeit einer Funktion auf einem Intervall zur Folge, daß für jedes ε > 0 eine ε-feine Eichung existiert. Wir können nun den Beweis des Satzes führen. Rb Rc Beweis. Sei I = [a, b], I1 = [a, c], I2 = [b, c], ι1 = a f (t) dt, ι2 = c f (t) dt. Sei ε > 0. Für k ∈ {1; 2} sei δ k eine εk -feine Integraleichung für f auf Ik , wobei ε1 und ε2 positive Zahlen mit ε = ε1 + ε2 sind, zum Beispiel ε1 = ε2 = 2ε . Wir definieren eine Integraleichung δ auf I durch min δ 1 (t), c − t a ≤ t < c (4) δ(t) = min δ 1 (t), δ 2 (t) t = c min δ (t), t − c c < t ≤ d 2 Sei (Z, Ξ), gegeben durch a0 ≤ ξ1 ≤ a1 ≤ . . . ≤ ξn ≤ an , eine δ-feine Zerlegung von I. Nach dem nachfolgenden Fakt 1 kommt c unter den Stützstellen ξ1 , . . . , ξn vor, es gibt also ein k mit 0 ≤ k ≤ n und ξk = c. Wir haben Zerlegungen (Zk , Ξk ) von Ik , die durch a0 ≤ ξ1 ≤ a1 ≤ . . . ≤ ξk ≤ cP für k = 1 sowie c ≤ ξk ≤ a1 ≤ . . . ≤ ξn ≤ an für k = 2 gegeben sind. Es gilt σ(Z, Ξ, f ) = 2k=1 σ(Zk , Ξk , f ),13 also |ι1 + ι2 − σ(S, Ξ, f )| ≤ 2 X k=1 |ιk − σ(S, Ξk , f )| ≤ ε1 + ε2 = ε, 13Mit einem ähnlichen Beweis wie (.3.2.6), wobei aber zu beachten ist, daß nicht (Z, Ξ) = (Z , Ξ ) ◦ (Z , Ξ ) 1 1 2 2 gilt, da das k-te Teilintervall von Z unter Z1 und Z2 aufgeteilt wird. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG und es ergibt sich die Konvergenz von Rb a f (t) dt gegen ι1 + ι2 . 87 Die folgende Folgerung aus dem Beweis von Satz 3 wird im Folgenden noch nützlich sein: Folgerung 1. Sei I = [a, b], a < c < b, und sei I˜ eines der Intervalle I1 = [a, c] oder I2 = [b, c]. Unter den Voraussetzungen von Satz 3 an f existiert für beliebige positive Zahlen ˜ ˜ ε̃ < ε und jede ε̃-feine Integraleichung δ̃ auf I mit δ̃(t) < |t − c| für alle t ∈ I \ {c} eine ε . = δ̃ I\{c} feine Integraleichung δ auf I mit δ I\{c} ˜ ˜ Beweis. Wir betrachten zum Beispiel den Fall I˜ = I1 . Wir setzen ε1 = ε̃, ε2 = ε − ε̃, δ 1 = δ̃. Sei δ 2 eine beliebige ε2 -feine Integraleichung auf I2 . Sei δ Eichung (4). Dann ist δ ε-fein, wie beim Beweis von Satz 3 gezeigt wurde, und aus unserer Voraussetzung an δ̃ folgt . = δ̃ I\{c} δ I\{c} ˜ ˜ Bemerkung 3. Eine zu Satz 3 analoge Aussage gilt auch für bestimmt divergente Integrale. Die linke Seite ist wohldefiniert (konvergent oder bestimmt divergent) genau dann, wenn die Summanden auf der rechten Seite beide konvergieren oder bestimmt divergieren und nicht in unterschiedliche Richtungen bestimmt divergieren. Fakt 1. Sei c ∈ I = [a, b] und δ eine Integraleichung auf I mit δ(t) < |c − t| für t ∈ I \ {c}. Ist die durch a = a0 ≤ ξ1 ≤ a1 ≤ . . . ≤ ξn = an gegebene Zerlegung (Z, Ξ) von I δ-fein, so gibt es ein k mit 1 ≤ k ≤ n und ξk = c. Wir stellen nun einige Fakten über Diskrepanzen und die Feinheit von Integraleichungen auf Teilintervallen bereit. Satz 4. • Sei I = [a, b], a ≤ c ≤ b, I1 = [a, c], I2 = [c, d]. Wenn dk eine δ-Diskrepanz für f auf Ik ist, so ist d1 + d2 eine δ-Diskrepanz für f aufRI. b • Wenn f eine auf I = [a, b] definierte Funktion ist, für die a f (t) dt konvergiert, so gibt es für jedes ε > 0 und jede Integraleichung δ auf I eine δ-Diskrepanz d für f auf I mit |d| < ε. • Wenn δ eine Integraleichung auf I und J ein abgeschlossenes Teilintervall von I ist, so gibt es zu jeder δ |J -Diskrepanz d von f und jedem δ > 0 eine δ-Diskrepanz d˜ von f auf I, so daß d − d˜ < δ gilt. Wenn δ eine ε-feine Eichung für f auf I ist, so ist δ |J eine ε-feine Eichung für f auf J. Beweis. Zum Beweis des ersten Punktes betrachten wir δ |Ik -feine Zerlegungen (Zk , Ξk ) Rb von Ik mit dk = akk f (t) dt − σ Zk , Ξk , f |Ik , wobei wir a1 = a, a2 = b1 = c, b2 = b gesetzt haben. Dann ist (Z, Ξ) = (Z1 , Ξ1 ) ◦ (Z2 , Ξ2 ) eine δ-feine Zerlegung von I, und nach Satz 3 und (.3.2.6) gilt Z b2 Z b1 f (t) dt − σ Z2 , Ξ2 , f |I2 f (t) dt − σ Z1 , Ξ1 , f |I1 + d1 + d2 = a1 a2 88 = Z a b f (t) dt − σ(Z, Ξ, f ), also ist d1 + d2 eine δ-Diskrepanz für f auf I wie im ersten Punkt behauptet. Zum Beweis des zweiten sei ε > 0 vorgegeben, dann wählt man eine ε-feine Eichung δ̃ für f . Eine min(δ, δ̃)-feine Zerlegung des Intervalles ist dann auch δ-fein und liefert dann eine Diskrepanz für f vom Betrag ≤ ε. Zum Beweis des dritten Punktes sei J = [c, d], K1 = [a, c], K2 = [d, b]. Dann ist I die Vereinigung der Intervalle K1 , J und K2 , die sich nur in ihren Randpunkten schneiden. Nach δ ˜ dem zweiten Punkt gibt es δ |Kl -Diskrepanzen dl für f auf Kl mit |dl | < 2 . Sei d = d1 + d + d2 . Dann gilt d − d˜ = |d1 + d2 | < δ, und durch zweimalige Anwendung des ersten Punktes sieht man, daß d˜ eine δ-Diskrepanz für f auf I ist. Der letzte Teil des letzten Punktes folgt nun aus Bemerkung 2. Satz 5. Wenn f integrierbar auf I = [a, b] ist, so ist Z t F (t) = f (τ ) dτ a stetig auf I. Beweis. Sei ε > 0 und sei δ eine 2ε -feine Integraleichung für f auf I. Sei t ∈ I und ε . (+) |s − t| < min δ(t), 2 |f (t)| Dann gilt (*) |F (s) − F (t)| < ε. Im Fall s > t ist nämlich durch a0 = t = ξ1 < a1 = s eine δ-feine Zerlegung (Z, Ξ) von [t, s] mit σ(Z, Ξ, f ) = (s − t)f (t) gegeben. Auf Grund von (+) gilt |σ(Z, Ξ, f )| < 2ε . Nach Satz 4 ist δ 2ε -fein für f auf diesem Intervall, also gilt Z s ε ε |F (s) − F (t)| = f (τ ) dτ − σ(Z, Ξ, f ) + |σ(Z, Ξ, f )| < + = ε. 2 2 t Im Fall s < t betrachten wir analog dazu die Zerlegung (Z, Ξ) von [s, t] mit einem Teilstück und t als Stützstelle. Diese ist wegen (+) δ-fein, und wie zuvor folgt |σ(Z, Ξ, f )| < 2ε aus (+). Man erhält Z t ε ε |F (s) − F (t)| = f (τ ) dτ − σ(Z, Ξ, f ) + |σ(Z, Ξ, f )| < + = ε. 2 2 s In beiden Fällen ist also (*) bewiesen, und der Fall s = t ist trivial. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 89 Satz 6 (Satz von Hake). Die Funktion f sei auf I = [a, b] definiert. Wenn alle α ∈ (a, b) konvergiert, so gilt Z b Z b (5) f (t) dt = lim f (t) dt, α↓a a Rb α f (t) dt für α wobei der Limes auf der rechten Seite genau dann konvergiert, wenn das Integral auf der linken Seite konvergiert. Ählich gilt Z β Z b f (t) dt. f (t) dt = lim (6) β↑b a a Beweis. Wir beweisen nur die erste Aussage, der Beweis der zweiten geht analog dazu. Sei dabei ι der Grenzwert auf der rechten Seite von (5). Sei ε > 0 vorgegeben. Wir wählen eine Zahl δ > 0 mit Z b ε f (t) dt < (*) ι − 3 α für a < α < min(b, a + δ). Wir dürfen zusätzlich δ als so klein annehmen, daß (%) 3δ |f (a)| < ε gilt. Nach dem nachfolgenden Lemma 1 existiert eine Funktion δ auf (a, b] mit positiven Funk ε tionswerten, so daß für jedes α ∈ (a, b] δ [α,b] 3 -fein ist. Wir dürfen noch annehmen, daß (+) δ(t) < t − a für t ∈ (a, b] gilt, andernfalls ersetz man δ(t) durch min( t−a , δ(t)). Wir dehnen δ zu einer Integraleichung 2 auf [a, b] aus, indem wir δ(a) = δ setzen. Sei (Z, Ξ), gegeben durch a = a0 ≤ ξ1 ≤ a1 ≤ ξ2 . . . ≤ ξn ≤ an = b, eine δ-feine Zerlegung von I. Wir wollen (@) |ι − σ(Z, Ξ, f )| ≤ ε zeigen, woraus dann unsere Behauptung folgt. Wir dürfen dabei a1 > a annehmen, denn sonst kann man ohne Änderung der Riemannschen Summe die Anfangsstücke streichen. Weiter gilt ξ0 = a0 , denn sonst wäre δ(ξ0 ) < ξ0 − a auf Grund von (+). Sei (Z′ , Ξ′ ) die durch a1 ≤ ξ2 . . . ≤ ξn ≤ an definierte Zerlegung von I ′ = [a1 , b], dann gilt σ(Z, Ξ, f ) = (a1 − a)f (a) + σ(Z′ , Ξ′ , f ′ ). Es gilt also Z b Z b ′ ′ ′ f (t) dt − ι f (t) dt + |σ(Z, Ξ , f ) − ι| ≤ |(a1 − a)f (a)| + σ(Z , Ξ , f ) − a1 a1 ε ε ε ≤ + + = ε, 3 3 3 und (@) folgt. Wir haben auf der unteren Zeile nacheinander (%), die 3ε -Feinheit von δ [a1 ,b] sowie (*) benutzt. 90 Lemma 1. • Sei a eine reelle Zahl R b oder −∞, und sei b > a eine reelle Zahl. Sei f eine Funktion auf (a, b], so daß α f (t) dt für jedes α ∈ (a, b) konvergiert. Sei ε > 0. Dann existiert eine Funktion δ auf (a, b] mit positiven Funktionswerten, so daß für jedes α ∈ (a, b] δ [α,b] eine ε-feine Integraleichung für f [α,b] ist. • Sei a eine reelle R β Zahl, und sei b > a eine reelle Zahl oder ∞. Sei f eine Funktion auf [a, b), so daß a f (t) dt für jedes β ∈ (a, b) konvergiert. Sei ε > 0. Dann existiert eine Funktion δ auf [a, b) mit positiven Funktionswerten, so daß für jedes β ∈ [a, b) δ [a,β] eine ε-feine Integraleichung für f [α,b] ist. • Sei a eine reelle Zahl oder −∞, R β und sei b > a eine reelle Zahl oder ∞. Sei f eine Funktion auf (a, b), so daß α f (t) dt für alle α, β ∈ (a, b) konvergiert. Sei ε > 0. Dann existiert eine Funktion so daß für alle δ auf (a, b) mit positiven Funktionswerten, α, β ∈ (a, b) mit α < β δ [α,β] eine ε-feine Integraleichung für f [α,β] ist. Beweis. Wir betrachten z. B. den ersten Punkt, die beiden anderen gehen analog dazu. Sei ak = a + 2−k (b − a). Wir konstruieren durch Induktion nach k > 0 eine εk = ε(1 − 2−k )feine Integraleichung δ k auf [ak , bk ] mit δ k (t) < t − ak für t > ak und δ k (ak−1 ,b] = δ k−1 (ak−1 ,b] und δ k (ak−1 ) ≤ δ k−1 (ak−1 ) für k > 2. Im Fall k = 1 kann einfach irgendeine ε1 -feine Eichung auf [a1 , b] mit (+) genommen werden. Ist δ k−1 schon konstruiert, so findet man wegen εk−1 < εk δ k durch Anwendung von Folgerung 1. Für t ∈ (a, b] wählen wir irgendein k mit t ∈ (ak , b] und setzen δ(t) = δ k (t), wobei dieser Wert nicht von k abhängt. Dann ist δ [ak ,b] εk < ε-fein. Für α > a kann ein k mit ak ≤ α gefunden werden, und aus dem dritten Punkt Satz 4 folgt, daß δ [α,b] ε-fein ist. Also leistet δ das Gewünschte. (+) Folgerung 2. Das Ändern endlich vieler Funktionswerte von f ändert nichts an der Integrierbarkeit oder dem Wert des Integrales von f . Beweis. Wir betrachten zunächst konvergente Integrale. Nach dem Satz von Hake und Satz 5 gilt die Behauptung für den Fall der Änderung des Funktionswertes an einem Intervallanfangs- oder Endpunkt. Der allgemeine Fall konvergenter Integrale kann wegen Satz 2 und Satz 3 auf diesen Fall zurückgeführt werden. Im Fall bestimmt divergenter Integrale nutzt man aus, daß das Ändern des Funktionswertes an einem Punkt um betragsmäßig ≤ d jede Riemannsche Summe um betragsmäßig höchstens d(b − a) verändert. Bemerkung 4. Die Folgerung gestattet es uns, auch Integranden zu betrachten, die an endlich vielen Stellen nicht wohldefiniert sind, so wie etwa f (t) = √1t auf [0, 1]. Der Integrand ist an der Stelle t = 0 nicht wohldefiniert. Nach der Folgerung aus dem Satz von Hake kann man für den fehlenden“ Funktionswert an dieser Stelle einen beliebigen Wert einsetzen und ” erhält stets Funktionen mit denselben Integrierbarkeitseigenschaften bzw. demselben Wert des Integrales. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 91 √ Bemerkung 5. Im Fall des Integranden f (t) = √1t aus dem vorigen Beispiel ist F (t) = 2 t eine Stammfunktion des Integranden auf [ε, 1] für jedes ε > 0. Es gilt also Z 1 √ dt √ = 2 − 2 ε. t ε Da diese Werte für ε ↓ 0 gegen 2 konvergieren, gilt Z 1 Z 1 dt dt √ = lim √ (7) ε↓0 ε t t 0 √ = lim 2(1 − ε) = 2. ε↓0 In der klassischen Riemannschen Theorie war die obere Zeile von (7) nicht die Folge eines Satzes (wie bei uns des Satzes von Hake), sondern mußte zur Definition des Integrales auf der linken Seite als uneigentliches Integral herangezogen werden. Da wir mit der technisch stärkeren Henstock-Kurzweilschen Integraldefinition arbeiten, haben wir diese Vorgehensweise nur bei Integralen von −∞ bis ∞ oder über unendliche Halbachsen nötig. Definition 2. • Sei a ∈ R. Für eine auf [a, ∞) (bzw. auf (−∞, a]) mit R ∞der möglichen Ausnahme endlich vieler Stellen definierte Funktion f sagen wir, daß a f (t) dt (bzw. Ra Rb Ra f (t) dt für f (t) dt für jede reelle Zahl b > a (bzw. f (t) dt) konvergiert, wenn b a −∞ jede reelle Zahl b < a) konvergiert und der Grenzwert Z b Z ∞ f (t) dt f (t) dt := lim b→∞ a bzw. Z a f (t) dt := lim b→−∞ −∞ a Z a f (t) dt b konvergiert. • Sei R ∞ sagen, daß R ∞ f auf R mit möglicher Ausnahme endlich vieler Stellen definiert. Wir f (t) dt und f (t) dt konvergiert, wenn für ein (bzw. jedes) a ∈ R die Integrale a R−∞ a f (t) dt konvergieren. In diesem Fall setzen wir −∞ Z ∞ Z a Z ∞ f (t) dt, f (t) dt + f (t) dt := (8) −∞ dieser Wert ist unabhängig von a. −∞ a Daß die Frage der Konvergenz des Integrales von −∞ bis ∞ sowie der Wert von (8) in der Tat von a unabhängig sind, folgt leicht aus Satz 3. Im Prinzip könnte die Verwendung uneigentlicher Integrale ganz vermieden werden, indem man eine direkte Definition der in Definition 2 betrachteten Integrale gibt, ähnlich der folgenden Definition von bestimmte Divergenz“ in diesem Fall, die wir hier ohne weitere Erläuterung ” (und ohne detailierten Nachweis der Äquivalenz zur vorherigen Definition in Fällen, in denen diese anwendbar ist) mitteilen. 92 Rb Definition 3. Wir sagen, daß a f (t) dt bestimmt gegen ∞ divergiert, wenn für jede reelle Zahl R Zahlen ã > a und b̃ < b existieren, so daß für α ∈ (a, ã) und β ∈ (b̃, b) eine Funktion δ→ (0, ∞) existiert, so daß (α, β) −− (9) σ(Z, Ξ, f ) > R für jede δ-feine Zerlegung (Z, Ξ) von [α, β] gilt. Rb Rb Bemerkung 6. Wenn die Integrale α f (t) dt konvergieren, der Limes limα↓a α f (t) dt daRb gegen bestimmt divergiert, so ist a f (t) dt im Sinne der vorigen Definition bestimmt divergent. Wir nehmen dazu zum Beispiel an, daßR der Limes gegen ∞ bestimmt divergiert. Dann gibt β es für alle R > 0 ein ã, b̃ ∈ (a, b) mit α f (t) dt > R + 1 für alle α ∈ (a, ã) und β ∈ (b̃, b). δ→ (0, ∞), so daß für alle derartigen α Weiterhin gibt es nach Lemma 1 eine Funktion (a, b] −− δ (α,b] eine 1-feine Integraleichung ist. Es folgt (9) für jede δ-feine Zerlegung von (α, β). Satz 7. Sei f eine auf [0, ∞) definierte Funktion mit nichtnegativen Funktionswerten, so daß Z T f (t) dt (10) 0 jedes T > 0 konvergiert. Wenn die Menge der Zahlen (10) beschränkt ist, so konvergiert Rfür ∞ f (t) dt. Andernfalls divergiert dieses Integral bestimmt gegen ∞. 0 Rn Beweis. Sei In = 0 f (t) dt. Ist die Menge der Zahlen (10) beschränkt, so bilden die IN eine monontone beschränkte Folge reeller Zahlen, und es konvergiert I = limn→∞ In . Sei ε > 0 vorgegeben. Wir wählen ein n mit In > I − ε. Sei T > n, dann gilt Z ⌈T ⌉ Z T f (t) dt = I⌈T ⌉ ≤ I, f (t) dt ≤ I − ε < In ≤ 0 0 RT woraus I − 0 f (t) dt < ε folgt. Also ist I der Limes der Integrale (10). Wenn hingegen die Menge der Werte der Integrale (10) unbeschränkt ist, so gibt es für Rβ R1 RT > R + 0 f (t) dt. Dann gilt α f (t) dt > R für α ∈ (0, 1) und jedes R > 0 ein T mit 0 f (t) dt R∞ β ∈ (T, ∞). Folglich divergiert 0 f (t) dt im Sinne von Definition 3 gegen ∞. Satz 8 (Majorantenkonvergenzkriterium für uneigentliche Integrale). Sei f eine auf [0, ∞) definierte Funktion mit reellen oder komplexen Funktionswerten, so daß (10) für jedes T ∈ (0, ∞) konvergiert R ∞ und eine Funktion m auf [0, ∞) mit nichtnegativen Funktionswerten exisim(t) dt konvergiert und |f (t)| ≤ m(t) für alle t ∈ [0, ∞) gilt. Dann konvergiert tiert, für die 0 R∞ f (t) dt. 0 Rn Rn Beweis. Sei Ik = 0 f (t) dt und Jk = 0 m(t) dt. Nach Voraussetzung konvergiert die Folge Jk , insbesondere ist diese Folge eine Cauchy-Folge. Wegen Z l Z k |Il − Ik | = f (t) dt ≤ m(t) dt = Jl − Jk k l 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 93 bildet auch die Folge der Il eine Cauchy-Folge. Daher existiert I = liml→∞ Il . Wir zeigen, daß I der Limes für R → ∞ der Integrale (10) ist, womit der Nachweis der Konvergenz dann erbracht ist. Sei dazu ε > 0, wir wählen n mit |I − In | < 2ε und mit |Jl − Jn | < 2ε für l > n. Sei R > n, dann gilt Z Z R Z R ε R I − ≤ |I − In | + In − ≤ < + f (t) dt f (t) dt f (t) dt 2 0 n 0 Z R Z ⌈R⌉ ε ε ε ε ε m(t) dt ≤ + m(t) dt = + J⌈R⌉ − Jn < + = ε, ≤ + 2 2 2 2 2 n n womit I in der Tat der Limes der Integrale (10) ist. Die soeben bewiesenen Sätze sind offenbar Analoga von Satz .2.3.1 sowie des ersten Teiles von Satz .2.3.4. Dieser Zusammenhang sowie die Tatsache, daß die Berechnung von Stammfunktionen oft einfacher ist als das Auffinden von Summenformeln, legen es nahe, ein Kriterium anzugeben, daß die Frage der Konvergenz oder Divergenz gewisser unendlicher Summen auf die analoge Frage für gewisse Integrale zurückführt. Das folgende Integralkriterium von Cauchy leistet dies in der Tat. Satz 9 (Integralkriterium). Sei f eineR monoton fallende Funktion auf [0, ∞) mit Pnichtnega∞ tiven Funktionswerten. Dann konvergiert 0 f (t) dt genau dann, wenn die Summe ∞ n=0 f (t) dt konvergiert. Beweis. Wir führen den Beweis nur unter der Zusatzannahme, daß (10) für jedes endliche R ⌈R⌉ RR R konvergiert.14 Nach Satz 7 und wegen 0 f (t) dt ≤ 0 f (t) dt R nist die Frage der Konvergenz des Integrales äquivalent zur Beschränktheit der Folge der In = 0 f (t) dt für natürliche Zahlen n. Wir haben n Z k X In = f (t) dt, k=1 k−1 und auf Grund der Monotonie von f ist der Integrand im k-ten Summanden ≥ f (k) und ≤ f (k − 1). Es folgt n n−1 X X f (k) ≤ In ≤ f (k), k=1 k=0 die Beschränktheit der Folge P∞der In ist daher äquivalent zur Beschränktheit der Folge der endlichen Teilsummen von n=0 f (n). Die Behauptung folgt nun aus Satz .2.3.1. Beispiel 1. Der Satz kann zur Untersuchung der Konvergenz von ∞ X (11) n−λ n=1 14Die Konvergenz dieses Integrales folgt aus der Monotonieforderung an f , was an dieser Stelle aber nicht gezeigt werden soll. Siehe dazu Satz .3.14.2 und Aufgabe .3.14.1. 94 1−λ mit λ > 0 herangezogen werden. Die Stammfunktion des Integranden auf [1, ∞) ist t1−λ für λ 6= 1 bzw. log(t) für λ = 1. Sie hat genau im Fall λ > 0 für t → ∞ einen Grenzwert, also konvergiert (11) genau in diesem Fall, wie wir früher schon gesehen hatten. 3.11. Anwendung der Integralrechnung auf die Bogenlänge von Kurven. ~x V eine Funktion, welche Regel 1. Sei V ein Euklidischer Vektorraum und I = [a, b] −→ stetig differenzierbar ist.15 Dann ist die Bogenlänge der durch f parametrisierten Kurve durch Z b ˙ dt ~x(t) (1) ℓ= a gegeben. Insbesondere gilt (2) Z bp ẋ1 (t)2 + · · · + xn (t)2 dt ℓ= a n im Falle V = R und ~x(t) = x1 (t), . . . , xn (t) . Im Spezialfall n = 2 erhält man Z bp (3) ℓ= 1 + f ′ (t)2 dt a für die Länge des Graphen der Funktion f , welche stückweise C 1 auf [a, b] ist. Bemerkung 1. Um diese Formel zu begründen, bezeichnen wir ihre rechte Seite mit ℓ und betrachten nur den Fall, daß ~x auf [a, b] stetig differenzierbar ist. Sei durch a = a0 < · · · < an = b eine Riemannsche Zerlegung von I = [a, b] gegben. Bei genügend kleiner Schrittlänge kann man sich den von den ~xi = ~x(ai ) für 0 ≤ i ≤ n (in dieser Reihenfolge) gebildeten Polygonzug als eine Approximation an die durch ~x parametrisierte Kurve vorstellen. Die Länge dieses Polygonzuges ist Z n n X X ai ˙ ℓ̃ = k~xi − ~xi−1 k = ~x(λ) dλ. i=1 i=1 ai−1 Aus unseren Voraussetzungen und Satz .2.4.716 folgt, daß die Funktion ~x˙ gleichmäßig stetig auf I ist. Sei ε > 0 gegeben, es gibt ein δ > 0 mit ε ˙ < ˙ ~x(s) für s, t ∈ I und |s − t| < δ. (4) − ~x(t) 2(b − a) 15Mit anderen Worten sollen die einzelnen Komponenten xi (t) von x(t) für 1 ≤ i ≤ n stetig differenzierbar sein. Wir setzen dann x′ (t) = x′1 (t), . . . , x′n (t) . 16Wobei Satz .2.4.7 von uns nur für skalarwertige Funktionen formuliert und bewiesen wurde, also strenggenommen nicht direkt anwendbar ist. Die nachfolgenden Überlegungen werden aber legitimiert durch die ε √ Anwendung des Satzes auf die stetige Funktion x′i , wonach es ein δi > 0 mit |x′i (s) − x′i (t)| < 2(b−a) für n s, t ∈ I und |s − t| < δi gibt. Mit δ = min(δ1 , . . . , δn ) gilt dann (4). Analog dazu kann die Anwendung von im skalarwertigen Fall bewiesenen Regeln der Integral- und Differentialrechnung auf den Fall Rn -wertiger Funktionen in einigen der folgenden Überlegungen durch separate Behandlung der einzelnen Vektorkomponenten legitimiert werden, was hier aber nicht genauer ausgeführt werden soll. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 95 Wenn die Schrittweite der Zerlegung < δ ist, kann ℓ − ℓ̃ wie folgt abgeschätzt werden: Z ai n Z ai X ˙~x(λ) dλ − ℓ − ℓ̃ = ˙~x(λ) dλ ai−1 i=1 n Z X = ≤ ≤ ≤ ≤ i=1 n X i=1 n X i=1 n X i=1 n X i=1 ai ai−1 Z ˙~x(λ) dλ − ai−1 ai ai Z ˙~x(λ) dλ − ai−1 ai ai Z ai (ai − ai−1 ) ai ai−1 Z ˙~x(ai−1 ) dλ + ˙~x(ai−1 ) dλ − ai−1 Z ai ai−1 Z ai ai−1 Z ai ai−1 ˙ i−1 ) dλ + ~x(a ˙ ˙ i−1 ) dλ + ~x(λ) −~x(a ai−1 Z ai−1 ˙ ~x(λ) dλ − ai−1 Z ˙ i−1 ) dλ + ~x(a ai−1 Z Z ai ˙~x(ai−1 ) dλ − ai ai−1 Z ˙~x(λ) dλ ai ai−1 ˙~x(ai−1 ) − ˙~x(λ) dλ ˙~x(λ) dλ ˙~x(ai−1 ) − ˙~x(λ) dλ ε ε + (ai − ai−1 ) = ε. 2(b − a) 2(b − a) Der Übergang von der ersten Zeile ist dadurch gerechtfertigt, daß die neu hinzuge zur zweiten ˙ kommenen Terme ±(ai − ai−1 ) ~x(ai−1 ) sind und sich gegenseitig wegheben. Beim Übergang zur letzten Zeile wurden die Integrale gemäß (.3.7.2) durch Länge des Integrationsweges mal Schranke für die Norm (bzw. den Betrag) des Integranden abgeschätzt. Ansonsten wurden nur Standard-Umformungen von Integralen gemäß Satz .3.2.1 benutzt. Die Differenz aus der Länge des Polygonzuges und ℓ wird also für genügend feine Polygonzüge beliebig klein. Das rechtfertigt es, ℓ als Länge der Kurve zu betrachten. Ohne nähere Begründung teilen wir noch die folgende Regel zur Berechnung der von den Fahrstrahlen, die den Koordinatenursprung mit den Punkten einer Kurve im R2 verbinden, überstrichen wird. Es handelt sich um eine orientierte Fläche, bei der gegen den Uhrzeigersinn (alos in mathematisch positiver Richtung) überstrichene Flächenanteile positiv und die übrigen negativ zählen. x(·), y(·) Regel 2 (Leibnizsche Sektorformel). Sei I = [a, b] −−−−−−−−−→ R2 stetig differenzier bar, dann ist die orientierte Fläche, die der Fahrstrahl von 0 bis x(t), y(t) für a ≤ t ≤ b überstreicht, durch Z 1 b ′ ′ x(t)y (t) − x (t)y(t) dt (5) 2 a gegeben. 3.12. Der Satz über die monotone Konvergenz. Wir beginnen mit dem Beweis des folgenden Satzes: 96 Satz 1 (Saks-Henstock-Lemma). Seien a < b reelle Zahlen. Die Eichung δ sei ε-fein für f N Rb auf I = [a, b], wobei wir a f (t) dt als konvergent voraussetzen. Sei (ak , bk ) k=1 , N ∈ N ∪ {∞}, eine endliche Folge von paarweise disjunkten offenen Teilintervallen von I. Für jede natürliche Zahl k zwischen 1 und N sei eine Zahl ξk ∈ [ak , bk ] mit bk − ak < δ(ξk ) (1) gegeben. Dann gilt X Z N (2) bk ak k=1 f (t) dt − (bk − ak )f (ξk ) ≤ ε für jede Teilmenge K von {1; . . . ; n}. Allgemeiner gilt ohne die Voraussetzung der ε-Feinheit von δ, aber unter Beibehaltung der Fordurungen (1) und ξk ∈ [ak , bk ] sowie der paarweisen Disjunktheit der Intervalle (ak , bk ), daß für jedes δ > 0 eine δ-Diskrepanz d von f mit X Z N bk (3) f (t) dt − (bk − ak )f (ξk ) − d < δ ak k=1 existiert. Beweis. Es genügt, unsere Behauptung über (3) zu beweisen. Danach kann nämlich in der Situation von (2) für jedes ε̃ > ε (3) mit δ = ε̃ − ε angewendet werden. Da die Integraleichung δ ε-fein ist, gilt |d| ≤ ε für jede δ-Diskrepanz d von f auf [a, b]. Aus (3) ergibt sich also X Z N bk f (t) dt − (bk − ak )f (ξk ) ≤ ε + δ = ε̃, k=1 ak und durch Grenzübergang ε̃ ↓ ε folgt (2). Auf Grund unserer Disjunktheitsannahme über die betrachteten Teilintervalle dürfen annehmen, daß diese so geordnet sind, daß a1 ≤ b1 ≤ a2 ≤ b2 ≤ . . . ≤ aN ≤ bN gilt. Zum Beweis von (3) gehen wir durch Induktion nach N vor. Im Fall N = 0 ist die Summe in (3) leer und hat daher den Wert 0, und man muß nur zeigen, daß es δ-Diskrepanzen von beliebig kleinem Betrag gibt, was in Satz .3.10.4 schon getan wurde. Sei N ≥ 1 und die Behauptung für den Fall von N − 1 Teilintervallen schon gezeigt. Wir beweisen sie für den Fall von N Teilintervallen zunächst unter der Voraussetzung bN = b. Nach der Induktionsannahme gibt es eine δ-Diskrepanz d1 für f auf [a, aN ] mit N −1Z bk X f (t) dt − (bk − ak )f (ξk ) − d1 < δ. k=1 ak Rb Wegen bN − aN < δ(ξN ) ist außerdem d2 = aNN f (t) dt − (bN − aN )f (ξN ) eine δ-Diskrepanz für f auf [aN , bN = [aN , b]. Nach dem ersten Punkt von Satz .3.10.4 ist d = d1 + d2 eine δ- 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Diskrepanz für f auf I, und für diese gilt X N Z −1Z N bk X f (t) dt − (bk − ak )f (ξk ) − d = k=1 ak bk ak k=1 97 f (t) dt − (bk − ak )f (ξk ) − d1 < δ. Wir betrachten nun den Fall bN < b. Durch Anwendung der Behauptung über (3) im schon erledigten Fall bN = b auf [a, bN ] erhält man die Existenz einer δ-Diskrepanz d1 für f auf [a, bN ] mit X Z N bk δ < , f (t) dt − (b − a )f (ξ ) − d k k k 1 2 a k k=1 und auf Grund von Satz .3.10.4 gibt es eine δ-Diskrepanz d2 für f auf [bN , b] mit |d2 | < 2δ . Nach Satz .3.10.4 ist d = d1 + d2 eine δ-Diskrepanz für f auf I, und für diese gilt offenbar (3). Theorem 4 (Satz über die monotone Konvergenz). Sei (fn ) eine monoton wachsende Rb oder fallende Folge reellwertiger Funktionen, für die die Integrale a fn (t) dt konvergieren. Wir setzen voraus, daß die Folge fn punktweise gegen die Funktion f konvergiert. Dann gilt Z b Z b (4) f (t) dt = lim fn (t) dt, a n→∞ a wobei beide Seiten konvergieren oder bestimmt divergieren. Beweis. Wir dürfen uns auf den Fall monoton wachsender Folgen beschränken, sonst ersetzen wir fk durch −fk . Weiterhin dürfen wir fk ≥ 0 voraussetzen, sonst ersetzen wir fk durch fk − f0 . Wir setzen zunächst a und b als endlich voraus. Rb Wenn die rechte Seite bestimmt divergiert, so kann für jedes K ∈ R ein n mit a fn (t) dt > K + 1 gefunden werden. Ist δ 1-fein für fn auf [a, b], so gilt σ(Z, Ξ, f ) ≥ σ(Z, Ξ, fn ) > K + 1 − 1 = K Rb für jede δ-feine Zerlegung. Also divergiert a f (t) dt bestimmt gegen ∞, wie für diesen Fall behauptet. Wir setzen also voraus, daß der Limes auf der rechten Seite eine reelle Zahl ι ist. Wir wollen zeigen, daß das Integral auf der linken Seite gegen ι konvergiert. Sei dazu ε > 0. Wir wählen ko > 0 so groß, daß Z b ε fko (t) dt > ι − (%) 3 a für k ≥ ko gilt. Für derartige k wählen wir eine Integraleichung δ k auf I = [a, b], welche 2−k 3ε fein für fk ist. Für x ∈ I wählen wir ein k = κ(x) ≥ ko mit ε (+) fk (x) > f (x) − 3(b − a) und setzen δ(x) = δ k (x). 98 Sei (Z, ξ) eine δ-feine Zerlegung von I in N Teile, dann gilt offenbar σ(Z, Ξ, f ) = ∞ X X k=ko k=κ(ξn ) f (ξn )(an − an − 1). Nach (+) folgt ∞ X X ε σ(Z, Ξ, f ) − fk (ξn )(an − an−1 ) < . 3 k=k (@) o κ(ξn )=k Durch Anwendung des Saks-Henstock-Lemmas auf die Menge der Intervalle (an−1 , an ) mit κ(ξn ) = k folgt X Z an ε fk (ξn )(an − an−1 ) − fk (t) dt ≤ 2−k . 3 an−1 κ(ξn )=k Summation üer k liefert X Z ∞ X fk (ξn )(an − an−1 ) − an ε fk (t) dt ≤ 2−k , 3 an−1 k=ko κ(ξn )=k und zusammen mit (@) ergibt sich ∞ X Z X (&) σ(Z, Ξ, f ) − k=ko κ(ξn )=k an 2ε fk (t) dt < . 3 an−1 Sei k− = min κ(ξ1 ), . . . , κ(ξn ) und k+ = max κ(ξ1 ), . . . , κ(ξn ) , dann gilt ko ≤ k− ≤ k+ , und Z a b fk− (t) dt = N Z X n=1 ≤ ≤ an an−1 fk− (t) dt = k=ko κ(ξn )=k ∞ X Z X k=ko κ(ξn )=k an an an−1 fk− (t) dt fk (t) dt an−1 ∞ X Z X k=ko κ(ξn )=k ∞ X Z X an fk+ (t) dt = an−1 N Z X n=1 an fk+ (t) dt = an−1 Z b fk+ (t) dt. a Auf Grund von (%) folgt X Z ∞ X k=ko κ(ξn )=k an ε fk (t) dt − ι < , 3 an−1 und zusammen mit (&) folgt |σ(S, Ξ, f ) − ι| < ε für jede δ-feine Zerlegung. Damit ist gezeigt, Rb daß a f (t) dt wie behauptet gegen ι konvergiert. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 99 Wir betrachten nun auch unendliche a und b und setzen zunächst voraus, daß der Limes ι auf der linken Seite von (4) endlich ist. Dann gilt Z β Z β Z b f (t) dt = lim fn (t) dt ≤ lim fn (t) dt = ι α n→∞ n→∞ α a für a < α < β < b, durch Anwendung des bisher bewiesenen Spezialfalles auf das R b beschränkte Intervall [α, β]. Durch Anwendung von Satz .3.10.7 folgt die Konvergenz von a f (t) dt, sowie Rb Rb Rb f (t) dt ≤ ι. Andererseits gilt a fn (t) dt ≤ a f (t) dt wegen fn < f , und durch Grenzübera Rb gang n → ∞ folgt ι ≤ a f (t) dt. Damit ist (4) im dem Fall vollständig bewiesen, daß die linke Seite endlich ist. 3.13. Nullmengen und die Differenzierbarkeit fast überall. Für ein Intervall I = [a, b] nennen wir |I| = b − a die Länge von I. Definition 1. Eine Teilmenge X von R ist eine Nullmenge, wenn für jedes ε > 0 eine Folge (Ik )K k=1 , K ∈ N ∪ {∞}, von Intervallen mit X⊆ (1) existiert, so daß ∞ X (2) k=0 gilt. K [ Ik k=1 |Ik | < ε Bemerkung 1. Anschaulich gesehen ist also eine Nullmenge eine Teilmenge von R, die durch Intervalle beliebig kleiner Gesamtlänge überdeckt werden kann, wobei die Überdeckungen endlich oder abzählbar unendlich sein können. Bemerkung 2. Genauer gesagt handelt es sich bei den hier betrachteten Nullmengen um die Nullmengen bzgl. des Lebesgueschem Maßes auf R, im Sinne der Lebesgueschen Maßtheorie, worauf an dieser Stelle nicht näher eingegangen werden soll. Fakt 1. • Jede Teilmenge einer Nullmenge ist eine Nullmenge. • Ist (Xk )N (abzählbar) unendliche Folge von Nullk=1 , N ∈ N ∪ {∞}, eine endliche oder SN mengen Xk , so ist auch deren Vereinigung k=1 Xk eine Nullmenge. • Jede endliche oder abzählbar unendliche Teilmenge von R ist eine Nullmenge. Beweis. Die erste Behauptung ist eine triviale Folgerung der S∞Definitionen. Zum Beweis der zweiten wählt man für jedes ε > 0 eine Überdeckung X ⊆ k l=0 Ik,l durch Intervalle mit P∞ −k l=0 |Il | < 2 ε. Dann ist ∞ n N X [ [ Ik,l Xk ⊆ k=1 k=1 l=0 100 eine abzählbare Überdeckung17 mit ∞ N X [ k=1 l=0 |Ik,l | < N X k=1 ε2−k ≤ ε ∞ X 2−k = ε, k=1 und die zweite Behauptung folgt. Eine einelementige Menge {x} ⊆ R ist ein abgeschlossenes Intervall der Länge 0 und daher eine Nullmenge. Endliche oder abzählbare Teilmengen von R sind folglich als endliche oder abzählbare Vereinigungen von Nullmengen ebenfalls Nullmengen, und alle Behauptungen sind bewiesen. Unser Ziel in diesem Abschnitt ist der Beweis des Satzes, wonach eine Menge genau dann eine Nullmenge ist, wenn das Henstock-Kurzweil-Integral ihrer charakteristischen Funktion verschwindet. Wir benötigen zwei Sätze bzw. Lemmata als Vorbereitung. Lemma 1. Sei f eine Funktion auf R mit nichtnegativen reellen Funktionswerten. Wenn R∞ für jedes ε > 0 eine Funktion fε mit f (t) ≤ fε (t) für alle t ∈ R existiert, so daß −∞ fε (t) dt < ε R∞ gilt, so gilt −∞ f (t) dt = 0. Beweis. Sei δ eine ε/2-feine Integraleichung für fε/2 . Für jede δ-feine Zerlegung gilt dann Z ∞ ε 0 ≤ σ(Z, Ξ, f ) ≤ σ(Z, Ξ, fε/2 ) ≤ fε/2 (t) dt + < ε. 2 −∞ R∞ Folglich konvergiert das HK-Integral −∞ f (t) dt gegen 0. Unsere zweite Vorbereitung ist der Überdeckungssatz von Vitali. Satz 1 (Überdeckungssatz von Vitali). Sei M ein metrischer Raum, für den zu jedem ε > 0 eine endliche Zahl Nε existiert, so daß in M nich mehr als Nε paarweise disjunkte Kugeln vom Radius ≥ ε existieren. Sei X ⊆ M eine Teilmenge. Für jedes x ∈ X sei eine reelle Zahl Rx > 0 gegeben. Wir setzen voraus, daß {Rx |x ∈ X} beschränkt ist. Dann existiert eine endliche oder N abzählbar unendliche Folge (Ki )N i=1 = K ri (xi ) i=1 , N ∈ N ∪ ∞, von abgeschlossenen Kugeln in M mit Mittelpunkt xi ∈ X und Radius ri = Rxi , so daß folgende Eigenschaften erfüllt sind: • Die Kugeln Ki sind paarweise disjunkt. • Die Kugeln K 5ri (xi ) mit demselben Mittelpunkt und dem fünffachen Radius wie Ki S S überdecken x∈X K Rx (x), also insbesondere X ⊆ N i=1 K 5ri (xi ). Bemerkung 3. Die Zahl 5 aus dem letzten Punkt ist etwas willkürlich gewählt, kann aber nicht beliebig klein gemacht werden. Jede Zahl > 3 kann statt 5 genommen werden. Beweis. Wenn l ≥ 1 ist und die Kugeln K1 , . . . , Kl−1 schon definiert sind, so sei Xl die Menge aller x ∈ X, für die K Rx (x) disjunkt zu den bisher ausgewählten Kugeln K1 , . . . , Kl−1 17Die Glieder der Doppelfolge Ik,l können nach dem ersten Cantorschen Diagonalprinzip so durchnumeriert werden, daß eine Einfachfolge entsteht 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 101 ist (also insbesonere X1 = X). Wenn Xl leer ist, bricht die Auswahl der Kugeln mit N = l ab. Andernfalls wählen wir xl so, daß 1 (+) Rx ≥ sup Rξ ξ ∈ Xl 2 gilt. Dies ist auf Grund von Definition .2.5.1 möglich. Die erste der obigen beiden Behauptungen über die Kugeln Kxi (ri ) ist auf Grund unserer Auswahl der xi erfüllt. Zum Nachweis der zweiten bemerken wir zunächst, daß entweder l endlich ist oder (%) lim ri = 0 i→∞ gilt. Sei nun x ∈ X, wir wollen (*) K Rx (x) ⊆ N [ K ri (xi ) i=1 zeigen. Wenn x unter den xi vorkommt, ist das klar. Wir setzen also voraus, daß x nicht unter den xi vorkommt. Wenn eine ganze Zahl i mit 1 ≤ i ≤ N ri < Rx /2 existiert, so sei j das kleinste derartige i. Dann gilt x 6∈ Xj , denn sonst stünde die Wahl von xj im j-ten Schritt im Widerspruch zu (+). Wegen x 6∈ Xj muß es ein i mit 1 ≤ i < j geben, so daß K Rx (x) zu K ri (xi ) nicht disjunkt ist. Dann gilt d(x, xi ) ≤ Rx + ri . Auf Gund der Minimalität von j gilt Rx ≤ 2ri , also d(x, xi ) ≤ 3ri und K Rx (x) ⊆ K 5ri (xi ). Damit ist (*) in diesem Fall bewiesen. Wir nehmen nun an, daß kein i mit ri < Rx /2 existiert. Wegen (%) bricht die Auswahl der xi an einer Stelle ab, N ist also endlich und XN leer, und für alle natürlichen Zahlen i mit 0 < i < N gilt ri ≥ Rx /2. Damit greift dasselbe Argument wie zuvor: Es muß ein derartiges i mit K ri (xi ) ∩ K Rx (x) 6= ∅ geben, denn sonst wäre x ∈ XN und XN wäre nicht leer. Dann gilt d(x, xi ) ≤ ri + Rx ≤ 3ri nach der Dreiecksungleichung und wegen ri ≥ Rx /2, und es folgt K Rx (x) ⊆ K ri (xi ). Dieser Satz von Vitali ist das entscheidende technische Hilfsmittel für diesen Unterabschnitt. Wir wollen uns davon überzeugen, daß er für jedes endliche R auf den metrischen Raum I = [−R, R] anwendbar ist. Lemma 2. Seien a < b reelle Zahlen und ε > 0, dann hat jede Menge X von paarweise disjunkten abgeschlossenen Kugeln vom Radius ≥ ε in dem metrischen Raum I = [a, b] höchstens b−a + 2 Elemente. 2ε Beweis. Sei x ∈ I, r > 0 und K = K r (x). Dann tritt wenigstens einer der folgenden Fälle ein: • a ∈ K. • b ∈ K. • K = [x − r, x + r]. 102 Eine Kugel mit Mittelpunkt x und Radius r in dem betreffenden metrischen Raum ist also ein Intevall der Länge 2r, wenn sie nicht an den Intervallrändern abgeschnitten“ wird. Letzterer ” Fall kann nur eintreten, wenn die Kugel einen der Randpunkte des Intervalles enthält. Da es nur zwei solche Randpunkte gibt und die Elemente von X paarweise disjunkte Kugeln vom Radius ≥ ε sind, gibt es höchstens zwei Elemente von X, die nicht abgeschlossene Intervalle der Länge ≥ 2ε sind. Seien K1 , . . . , Kl Elemente von X, die Intervalle der Länge ≥ R2ε sind. Dann gilt 0 ≤ Pl b i=1 1Ki ≤ 1I (auf Grund der paarweisen Disjunktheit der Ki ) und a 1Ki ≥ 2ε. Es folgt Z b Z b X l dt = b − a, 2εl ≤ 1Ki (t) dt ≤ a i=1 a . Also hat X höchstens b−a Elemente, die abgeschlossene Intervalle der Länge ≥ 2ε also l ≤ b−a 2ε 2ε sind. Nach dem zuerst Gesagten hat X höchstens Rε + 2 Elemente. Satz 2. Für eine Teilmenge X ⊆ R sind die folgenden Eigenschaften äquivalent: • X ist eine Nullmenge. R∞ • Das Integral −∞ 1X (t) dt der charakteristischen Funktion von X konvergiert gegen 0. Beweis. Sei X eine Nullmenge. Für jedes ε > 0 wählen wir eine Überdeckung (1) mit (2). S P Sei Xl = lk=1 Ik , dann kann ist 1Xl für jedes endliche l integrierbar und 1Xl ≤ lk=1 1Il , also R∞ P 1 (t) dt ≤ lk=1 |Ik |. Nach (2) gilt also −∞ Xl Z ∞ (+) 1Xl (t) dt ≤ ε. −∞ Nach dem Satz über die monotone Konvergenz bleibt dies auch für l = ∞ (im Fall K = ∞) richtig. In jedem Fall kann also l = K in (+) gesetzt R ∞ werden. Damit ist für jedes ε > 0 eine Funktion fε (nämlich 1XK ) mit 0 ≤ 1X ≤ fε und −∞ fε (t) dt ≤ ε gefunden. Nach Lemma 1 verschwindet das Integral von 1X . Zum Beweis der entgegengesetzten Implikation betrachten wir zunächst den Fall, daß X ⊆ (−R, R) für eine reelle Zahl R > 0 gilt. Dann ist Z R Z ∞ 1X (t) dt 1X (t) dt = 0= −∞ −R Wir wählen eine Integraleichung δ auf [−R, R], welche 5ε -fein für 1X ist. Der metrische Raum M = [−R, R] erfüllt nach Lemma 2 die Voraussetzung des Überdeckungssatzes von Vitali. Für x ∈ X sei min δ(x), |R| − |x| . (@) Rx = 2 Die Folge (Ki )N i=1 von Kugeln habe die in Satz 1 beschriebenen Eigenschaften. Wie in der Formulierung dieser Eigenschaften sei ri der Radius und xi ∈ X der Mittelpunkt von Ki . Sei 3. DIFFERENTIAL- UND INTEGRALRECHNUNG Ñ ≤ N eine natürliche Zahl, wir wollen (*) Ñ X ri ≤ N X ri ≤ i=1 103 ε 10 zeigen. Da dies für alle endlichen Ñ ≤ N gilt, folgt i=1 ε . 10 Die Überdeckung von X durch die Kugeln K 5ri (xi ) ist eine Überdeckung von X durch Intervalle, und N N X X K 5r (xi ) = 10ri ≤ ε. i i=1 i=1 Da eine solche Überdeckung von X für jedes ε > 0 gefunden werden kann, ist X eine Nullmenge. Beim Beweis von (*) können wir nach Umnumerieren der Ki erreichen, daß x1 < x2 < · · · < xÑ gilt. Sei ai = xi − ri und bi = xi + ri . Auf Grund der Disjunktheit der Ki gilt ai > bi−1 für i > 1. Sei weiterhin b0 = −R, aÑ +1 = R. Auf Grund von (@) gilt auch −R = b0 < a1 sowie bñ < aÑ +1 = R. Wir wählen eine δ-feine Zerlegung (Yi , Λi ) von [bi−1 , ai ], bezeichen die durch ai < xi < bi gegebene Zerlegung von [ai , bi ] in ein Teilstück mit xi als Stützstelle mit (Zi , Ξ). Die Zerlegung (Z, Ξ) = (Y1 , Λ1 ) ◦ (Z1 , Ξ1 ) ◦ (Y2 , Λ2 ) ◦ · · · ◦ (ZÑ , ΞÑ ) ◦ (YÑ +1 , ΛÑ +1 ) von [−R, R] ist δ-fein, sie sei durch −R = c0 ≤ ξ1 ≤ c1 ≤ . . . ≤ cL−1 ≤ ξL ≤ cL = R gegeben. RR Sie ist δ-fein, wegen −R 1X (t) dt = 0 gilt also σ(Z, Ξ, 1X ) < 5ε . Für jedes k mit 1 ≤ k ≤ Ñ existiert ein i mit 1 ≤ i ≤ L und ak = ci−1 , bk = ci und xk = ξi . Der Term (bi − ai )1X (xi ) = 2ri kommt also unter den Summanden (ck − ck−1 )1X (ξi ) der Riemannschen Summe σ(Z, Ξ, 1X ) vor, die alle nichtnegativ sind. Also gilt 2 Ñ X i=1 ε ri ≤ σ(Z, Ξ, 1X ) < , 5 und (*) folgt. Wir haben gesehen, daß beschränkte Mengen Nullmengen sind, wenn das Integral ihrer charakteristischen Funktion verschwindet. Sei X ⊆ R eine beliebige Menge, für die das Integral der charakteristischen Funktion gegen 0 konvergiert. Für jede ganze Zahl R > 0 verschwindet das Integral der charakteristischen Funktion von X ∩ (−R, R) nach Lemma 1 ebenfalls, denn es gilt 0 ≤ 1X∩(−R,R) ≤ 1X . Nach dem bereits Bewiesenen ist also X ∩ (−R, R) eine Nullmenge, S X ∩ (−R, R) . und dasselbe gilt nach Fakt 1 für X = ∞ R=1 Definition 2. Wir sagen, daß eine Aussage A(x) über reelle Zahlen x (bzw. Elemente einer Teilmenge I ⊆ R) fast überall bzw. für fast alle x richtig ist, wenn die Menge aller x ∈ R (bzw. aller x ∈ I), für die die Aussage falsch ist, eine Nullmenge ist. 104 Beispiel 1. Die Funktionenfolge fn konvergiert fast überall gegen die Funktion f , wenn x Es gilt nicht lim fn (x) = f (x) n→∞ eine Nullmenge ist. Eine Funktion f ist fast überall differenzierbar, wenn x f ist nicht differenzierbar an der Stelle x eine Nullmenge ist. Eines der Ergebnisse des folgenden Satzes besagt, daß zwei fast überall gleiche Funktionen für Fragen der Integralrechnung äquivalent sind: Satz 3. Seien a < b reelle Zahlen oder ±∞, und sei I = [a, b] ∩ R. Rb • Sei g eine Funktion mit nichtnegativen Funktionswerten auf I. Dann konvergiert a g(t) dt genau dann gegen 0, wenn g fast überall verschwindet. • Seien f1Rund f2 zwei Funktionen auf I, die fast überall überinstimmen. Dann ist das b Integral a f1 (t) dt genau dann konvergent (bzw. bestimmt divergent), wenn dasselbe für Rb Rb Rb f (t) dt gilt, und in diesem Fall gilt a f1 (t) dt = a f2 (t) dt. a 2 Beweis. Wir betrachten zunächst R bden ersten Punkt und bezeichnen die Menge aller t mit g(t) 6= 0 mit X. Zunächst setzen wir a g(t) dt = 0 voraus. Sei Xn die Menge aller t ∈ I = [a, b] mit g(t) > 1/n. Sei f = 1Xn die charakeristische Funktion von Xn . Für jedes ε > 0 kann Rb fε = 2n g in Lemma 1 gesetzt werden. EsSfolgt a 1Xn (t) dt = 0. Nach Satz 2 ist Xn eine Nullmenge, und nach Fakt 1 ist auch X = ∞ Nullmenge. n=0 Xn eine Rb Wenn umgekehrt X eine Nullmenge ist, so gilt a gn (t) dt = 0 mit gn (t) = min g(t), n , denn auf f = gn kann Satz 2 mit fε = n1X angewendet werden. Es gilt g(t) = limn→∞ gn (t) Rb für alle t ∈ I, und nach dem Satz über die monotone Konvergenz folgt a g(t) dt = 0. Beim Beweis des zweiten Punktes dürfen wir nach Trennung von Real- und Imaginärteil die betrachteten Funktionen als reellwertig voraussetzen. Im Fall f1 ≤ f2 kann der erste Punkt auf Rb g = f2 −f1 angewendet werden und zeigt a f2 (t)−f1 (t) dt = 0, und die Behauptung folgt aus den Rechenregeln für das Integral. Im allgemeinen Fall wendet man den zunächst betrachteten Spezialfall zunächst auf min(f1 , f2 ) und f1 und dann auf min(f1 , f2 ) und f2 an. Das zweite Hauptresultat dieses Unterabschnittes ist der folgende Satz, der gewissermaßen den ersten Hauptsatz der Integral- und Differentialrechung auf alle integrierbaren Funktionen ausdehnt, dabei aber nur noch eine für fast alle x“-Aussage treffen kann. ” Satz 4. Seien a < b Elemente von R ∪ {±∞}, und sei f eine reell- oder komplexwertige Rb Funktion auf I = [a, b] ∩ R, für die a f (t) dt konvergiert. Für t ∈ I definieren wir F (t) = Rt f (τ ) dτ . Dann gilt für fast alle t ∈ I die Aussage: F ist differenzierbar an der Stelle t, und a F ′ (t) = f (t). Bemerkung 4. Mit anderen Worten ist (3) X = x ∈ I F ′ (x) existiert nicht, oder F ′ (x) 6= f (x) 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 105 eine Nullmenge. Beweis. Es genügt, den Beweis für endliche a und b zu führen. Wenn dann zum Beispiel die unendliche Halbachse (−∞, b] betrachtet werden soll, so können wir wegen Z f Z b−n Z t (τ ) dτ f (τ ) dτ + f (τ ) dτ = b−n −∞ −∞ ′ für t ∈ [b − n, b] zeigen, daß die Menge Xn aller t ∈ [b − n, b], für die nicht FS (t) = f (t) gilt, eine Nullmenge ist. Eine Nullmenge ist dann auch die abzählbare Vereinigung ∞ n=1 Xn , die Menge ′ aller t ∈ (−∞, a], für die nicht F (t) = f (t) gilt. Die Fälle [a, ∞) und (−∞, ∞) behandelt man analog dazu. Sei nun, unter der Voraussetzung der Endlichkeit von a und b, X = x ∈ I Es gibt ein ε > 0, so daß kein δ > 0 existiert, für das |F (y) − F (x) − (y − x)f (x)| < ε(y − x) für alle y ∈ I mit x < y < x + δ gilt.} Y = x ∈ I Es gibt ein ε > 0, so daß kein δ > 0 existiert, für das |F (y) − F (x) − (y − x)f (x)| < ε(x − y) für alle y ∈ I mit x − δ < y < x + δ gilt.} Offenbar ist X ∪ Y die für den Beweis zu betrachtende Ausnahmemenge (3) aller x ∈ I, für die F ′ (x) nicht existiert oder von f (x) verschieden ist. Wir haben ∞ [ X= (Xn,+ ∪ Xn,− ) Y = n=0 ∞ [ n=0 mit (Yn,+ ∪ Yn,− ) Es gibt kein δ > 0, für das ± F (y) − F (x) − (y − x)f (x) < ε(y − x) o für alle y ∈ I mit x < y < x + δ gilt. n = x ∈ I Es gibt kein δ > 0, für das ± F (x) − F (y) − (x − y)f (x) < ε(x − y) o für alle y ∈ I mit x − δ < y < x gilt. , n Xn,± = x ∈ I Yn,± wobei auf Grund von Satz .3.10.3 diese Ausnahmemengen auch durch Z y n (+) Xn,± = x ∈ I Es gibt kein δ > 0, für das ± f (t) dt − (y − x)f (x) < ε(y − x) x o für alle y ∈ I mit x < y < x + δ gilt. Z x n Yn,± = x ∈ I Es gibt kein δ > 0, für das ± f (t) dt − (x − y)f (x) < ε(x − y) y 106 o für alle y ∈ I mit x − δ < y < x gilt. . beschrieben werden können. Auf Grund von Fakt 1 genügt der Nachweis, daß jede der Mengen Xn,± und Yn,± eine Nullmenge ist. Wir führen diesen Nachweis für Xn,+ , die drei übrigen Fälle gehen analog dazu bzw. können durch Betrachtung von ±f (±t) auf diesen Fall zurückgeführt werden. −n Sei ε > 0 gegeben, wir wählen eine 2 10 ε -feine Integraleichung δ auf I. Für x ∈ Xn,+ wählen wir eine Zahl Rx ∈ 0, δ(x) mit x + Rx ∈ I und Z x+Rx (%) f (t) dt ≥ (f (x) + ε)Rx . x Dies ist auf Grund von (+) möglich. Sei die endliche oder abzählbar unendliche Folge (Ki )N i=1 der Kugeln Ki = Kri (xi ), ri = Rxi , wie in Satz 1 (mit X = Xn,+ ) gewählt. Sei bi = ai + ri . Wegen [ai , bi ] ⊆ Ki sind die Intervalle [ai , bi ] paarweise disjunkt. Nach dem Saks-HenstockLemma gilt Ñ Z bi 2−n ε X f (t) dt − (bi − ai )f (ai ) < 10 ai i=1 für jede natürliche Zahl Ñ ≤ N . Im Fall N < ∞ kann Ñ = N gesetzt werden, anderfalls folgt N Z bi 2−n ε X f (t) dt − (bi − ai )f (ai ) < 10 ai i=1 P durch Grenzübergang Ñ → ∞. Wegen (%) ist die linke Seite dieser Ungleichung ≥ 2−n N i=1 ri . Es folgt N X ε ri ≤ . 10 i=1 Die Kugeln K 5ri (xi ) überdecken Xn,+ , es handelt sich dabei um Intervalle der Länge ≤ 10ri , und die Gesamtlänge dieser Intervalle ist nach der letzten Ungleichung ≤ ε. Da eine solche Überdeckung von Xn,+ durch Intervalle für jedes ε > 0 gefunden werden kann, ist Xn,+ wie behauptet eine Nullmenge. 3.14. Meßbare Funktionen und der Satz über die majorisierte Konvergenz. Definition 1. Unter einer Stufenfunktion auf R verstehen wir (für die Zwecke dieser VorP lesung) eine Funktion, die außerhalb einer Nullmenge mit einer Funktion der Form Ll=1 wl 1Il übereinstimmt, wobei wl ∈ C gilt, die Il Intervalle sind und L eine natürliche Zahl ist. Bemerkung 1. • Da die charakteristischen Funktionen von [a, b] und (a, b) fast überall (nämlich mit Ausnahme von a und b) übereinstimmen, ist es einerlei, ob man in der Definition mit offenen, abgeschlossenen oder halboffenen Intervallen arbeitet. • Wenn f und g fast überall übereinstimmen, so ist offenbar f genau dann eine Stufenfunktion, wenn g eine Stufenfunktion ist. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 107 Fakt 1. Eine Funktion f auf R ist genau dann eine Stufenfunktion, wenn man Zahlen c0 < c1 · · · < cN , N ∈ N, sowie v1 , . . . , vN finden kann, so daß f (t) = vi für fast alle t ∈ [ci−1 , ci ] sowie f (t) = 0 für fast alle t 6∈ [c0 , cN ] gilt. Beweis. Unter den obigen Annahmen gilt f (t) = N X vi 1[ci−1 ,ci ] i=1 für fast alle t, also ist f eine Stufenfunktion. Wenn umgekehrt f die in Definition 1 beschriebene Form hat, so sei Il das Intervall von al bis bl (wobei Il dieselbe Bedeutung wie inDefinition 1 hat), c0 < c1 < · · · < cN eine wiederholungsfreie Auflistung von al 1 ≤ l ≤ L ∪ bl 1 ≤ l ≤ L , und vi die Summe von wl über alle l mit (ci− , ci ) ⊆ Il . Fakt 2. Seien f und g Stufenfunktionen, und sei λ eine komplexe Zahl. Dann sind die folgenden Funktionen Stufenfunktionen: • f + g und λf (mit anderen Worten, die Stufenfunktionen bilden einen Unterraum im Vektorraum aller komplexwertigen Funktionen auf R), • |f |, • max(f, g) (für rellwertige f und g). • φ(f ), wobei eine beliebige Funktion auf dem Wertebereich von f ist. • f · g. Beweis. Der erste Punkt folgt direkt aus Definition 1. Für den vierten Punkt nehmen wir an, daß f die in Fakt 1 beschriebene Form hat. Dann gilt |f (t)| = |vi | für fast alle t ∈ (ci−1 , ci ) und |f (t)| = 0 für fast alle t außerhalb [c0 , cN ]. Also hat auch |f | die in Fakt 1 beschriebene Form und ist damit eine Stufenfunktion. Als Spezialfall φ(t) = |t| des vierten Punktes ergibt sich der zweite. Der dritte Punkt folgt wegen f + g + |f − g| 2 f + g − |f − g| min(f, g) = , 2 (f +g)2 −f 2 −g 2 folgt der fünfte Punkt aus dem ersten und dem vierten. max(f, g) = und wegen f g = 1 2 Definition 2. Sei I ein abgeschlossenes Intervall, eine abgeschlossene Halbachse von a bis ∞ bzw. von −∞ bis a, oder I = R. Sei f eine R- oder C-wertige Funktion auf I. Wir nennen f meßbar, wenn eine Folge fn (t) von Stufenfunktionen auf R existiert, so daß limn→∞ fn (t) = f (t) für fast alle t ∈ I gilt. Fakt 3. • Wenn f meßbar ist, so gibt es eine Folge von Stufenfunktionen fn mit limn→∞ fn (t) = f (t) für alle t ∈ I. • Wenn zwei Funktionen f und g fast überall übereinstimmen, so ist f genau dann meßbar, wenn g meßbar ist. 108 Beweis. Wenn die Folge fn wie in der beschaffen und X die Menge aller t ∈ I ist, für die nicht limn→∞ fn (t) = f (t) gilt, so setzt man ( f (t) t ∈ X f˜n (t) = fn (t) t 6∈ X. Dann ist X eine Nullmenge, nach Bemerkung 1 ist auch f˜n eine Stufenfunktion, und es gilt limn→∞ f˜n (t) = f (t) für alle t ∈ I. In der Situation des zweiten punktes konvergiert jede fast überall gegen f konvergente Folge von Stufenfunktionen auch gegen g fast überall, und umgekehrt. Satz 1. • Jede stetige Funktion ist meßbar. • Wenn die fn stetige Funktionen auf I sind und daselbst fast überall gegen f konvergieren, so ist f meßbar. • Wenn g1 , . . . , gn (n ∈ N) meßbare reellwertige Funktionen sind, so sind max(g1 , . . . , gn ) und min(g1 , . . . , gn ) meßbar. • Wenn F eine stetige Funktion auf I und fast überall daselbst differenzierbar ist, so ist die durch ( F ′ (t) falls F an der Stelle x differenzierbar ist f (t) = 0 sonst definierte Funktion meßbar. • Wenn f und g meßbare Funktionen sind, so sind f ± g, f · g und λf für jede Konstante λ meßbar. φ→ C eine stetige Funktion ist, so ist φ(f ) • Wenn f K-wertig und meßbar und K −− meßbar. Beweis. Zum Beweis des ersten Punktes bemerken wir, daß nach dem nachfolgenden Lemma 1 eine Stufenfunktion fn mit |fn (t) − f (t)| < 2−n für t ∈ I ∩ [−n, n] existiert. Die Folge fn (t) konvergiert für alle t ∈ I gegen f (t), und f ist meßbar. Der zweite Punkt geht ähnlich: Nach Lemma 1 gibt es eine Stufenfunktion gn mit |fn (t) − gn (t)| < −n 2 für alle t ∈ I ∩ [−n, n]. Für alle t ∈ I gilt dann limn→∞ fn (t) − gn (t) = 0, und es folgt limn→∞ gn (t) = f (t) für fast alle t ∈ I. Zum Beweis des dritten Punktes genügt es, den Fall n = 2 zu betrachten, denn der Fall n = 1 ist trivial und der Fall n > 2 ergibt sich wegen min(g1 , . . . , gn ) = min min(g1 , . . . , gn−1 ), gn und der analogen Identität für max aus dem Fall n = 2 durch Induktion nach n. Seien fi,n , i ∈ {1, 2}, Stufenfunktionen mit limn→∞ fi,n (i) = gi (t). Dann sind fn,− = min(f1,n, f2,n ) und fn,+ max(f1,n , f2,n ) Stufenfunktionen, und es gilt limn→∞ fn,− (t) = min g1 (t), g2 (t) und limn→∞ fn,+ (t) = max g1 (t), g2 (t) für fast alle t ∈ I. Also sind min(g1 , g2 ) und max(g1 , g2 ) meßbar. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 109 Zum Beweis des vierten Punktes sei die Funktion fn auf I durch ( 2n F (t + 2−n ) − F (t) t + 2−n ∈ I fn (t) = 2n F (b) − F (t) t > b − 2−n definiert. Mit der möglichen Ausnahme von t = b konvergiert die Folge der fn (t) für alle t ∈ I, für die F ′ (t) existiert, gegen F ′ (t). Auf Grund unserer Voraussetzung konvergiert die Folge fn also fast überall auf I gegen f . Man überzeugt sich relativ leicht davon, daß die Funktionen fn stetig auf I sind. Nach dem zweiten Punkt ist fn meßbar. Wenn f und g die Limites der Folgen fn und gn von Stufenfunktionen sind, so sind f ± g, f · g, λf und (unter den Voraussetzungen des letzten Punktes) φ(f ) die Limites von fn ± gn , fn · gn , λfn und φ(fn ), welche Funktionen nach Fakt 2 meßbar sind. Also sind die in den beiden letzten Punkten aufgelisteten Funktionen meßbar. Lemma 1. Sei f eine stetige Funktion auf I. Zu jedem ε > 0 und jeder reellen Zahl R > 0 existiert eine Stufenfunktion g mit |f (t) − g(t)| < ε für t ∈ I ∩ [−R, R]. Beweis. Sei J = I ∩ [−R, R]. Für jedes t ∈ J gibt es ein δ(t) > 0 mit |f (x) − f (t)| < ε für |x − t| < δ(t). Sei J = [α, β], und sei α0 ≤ ξ0 ≤ α1 ≤ . . . ≤ αn = β eine δ-feine Zerlegung von J. Für t ∈ [α, β) gibt es ein eindeutig bestimmtes i mit t ∈ [αi−1 , αi ), für t = β sei i = n. Wir setzen dann g(t) = f (ξi ). Für t 6∈ J setzen wir g(t) = 0. Dann erfüllt t alle unsere Bedingungen. Aufgabe 1. Sei I wie zuvor ein beschränktes abgeschlossenes Intervall, eine abgeschlossene Halbachse oder R. Man zeige: Jede monotone Funktion auf I ist meßbar. Wir wollen nun die Zusammenhänge zwischen Meßbarkeit und Integrierbarkeit untersuchen. Satz 2. Sei weiterhin I ein abgeschlossenes Intervall, eine abgeschlossene Halbachse oder R, a der Anfangspunkt von I bzw. a = −∞, falls I von unten unbeschränkt ist, und b der Endpunkt von I bzw. b = ∞, falls I von oben unbeschränkt ist. Rb • Wenn a f (t) dt konvergiert, so ist f meßbar. • Wenn R b die Funktionswerte von f nichtnegative reelle Zahlen sind und f meßbar ist, so ist a f (t) dt konvergent oder gegen ∞ bestimmt divergent. Rb Rb • Wenn f meßbar ist und a |f (t)| dt < ∞ gilt, so konvergiert a f (t) dt. Bemerkung 2. Für die Formulierung des dritten Punktes ist es natürlich wichtig, daß das darin auftretende Integral über |f | nach dem zweiten Punkt konvergent oder gegen ∞ bestimmt divergent ist. Beweis. Die erste Behauptung folgt aus dem dritten Punkt von Satz 1, Satz .3.13.4, und Fakt 3. Um Aussagen über die Integrierbarkeit aus Meßbarkeitsvoraussetzungen herzuleiten, müssen wir uns zunächst davon überzeugen, daß Stufenfunktionen integrierbar sind. Nach Beispiel .3.2.1 konvergiert das Integral einer konstanten Funktion über ein beschränktes Intervall, und nach 110 Satz .3.13.3 gilt dasselbe auch für Funktionen, die fast überall konstant sind. Für eine Stufenfunktion f kann man den Integrationsweg nach Fakt 1 in endlich viele Stücke zerlegen, auf denen f fast überall konstant ist, wobei f auf eventuell auftretenden unbeschränkten Teilstücken verschwindet. Aus der Zerlegbarkeit von Integralen (Satz .3.10.3) folgt so die Konvergenz des Integrales von f . Sei nun f eine meßbare Funktion auf I mit nichtnegativen Funktionswerten. Wir zeigen zunächst die Konvergenz des Integrales von ( min f (t) t ∈ [−n, n] φn (t) = 0 t 6∈ [−n, n] Sei dazu (fk )∞ k=0 eine gegen f konvergierende Folge von Stufenfunktionen. Dann ist auch ( min fk (t), n t ∈ [−n, n] fk,n (t) = 0 t 6∈ [−n, n] eine Stufenfunktion18, und es gilt limn→∞ fk,n = φn . Sei Mk,l (t) = max fj,n (t) k ≤ j ≤ l , der Einfachheit halber unterdrücken wir die n-Abhängigkeit in den Bezeichnungen auf der rechten Seite, da wir zur Zeit ein festes n betrachten. Durch induktive Anwendung des dritten Punktes von Fakt 2 sieht man, daß Mk,l eine Stufenfunktion ist. Für festes k bilden die Mk,l Rb eine monoton wachsende Folge, und es gilt a Mk,l (t) dt ≤ 2n2 , denn Mk,l (t) ≤ n und Mk,l verschwindet außerhalb [−n, n]. Es gilt Mk (t) = lim Mk,l (t) = sup fj,n (t) j ≥ k , l→∞ Rb nach dem Satz über die monotone Konvergenz konvergiert a Mk (t) dt. Diese Integrale bilden eine monoton fallende Folge nichtnegativer Zahlen, denn die Funktionen Mk sind in Abhängigkeit von k monoton fallend und nichtnegativ. Es gilt limk→∞ Mk (t) = φn (t). Nach dem Satz Rb über die monotone Konvergenz konvergiert a φn (t) dt, wie behauptet. Nun ist die Folge der φRn monoton wachsend, und limn→∞ φn = f . Nach dem Satz über die b monotone Konvergenz ist a f (t) dt konvergent oder bestimmt divergent. Rb Nach dem letzten Punkt Sei f eine meßbare Funktion, für die a |f (t)| dt konvergiert. von Satz 1 sind auch max ±ℜ(f ), 0 und min ±ℜ(f ), 0 meßbar. Nach dem soeben gezeigten zweiten Punkt sind die Integrale dieser Funktionen konvergent oder bestimmt divergent, und da jede dieser Funktionen durch den Betrag von f beschränkt ist, kann letzterer Fall nicht eintreten. Also konvergiert auch das Integral von f = max(ℜf, 0) − max(−ℜf, 0) + i max(ℑf, 0) − i max(−ℑf, 0). 18z. B. ist min(fk (t), n) nach dem vierten Punkt von Fakt 2 eine Stufenfunktion, dasselbe gilt auf Grund von Definition 1 für die charakteristische Funktion von [−n, n], und fk,n ist das Produkt dieser Funktionen. 3. DIFFERENTIAL- UND INTEGRALRECHNUNG 111 Bemerkung 3. Wir können nun die im allgemeinen Fall noch verbleibenden Lücken beim Beweis von Satz .3.9.2 schließen. Zunächst ist die Integrierbarkeit von g(t)w(t) zu zeigen. Nach Satz 1 ist diese Funktion meßbar. Da wir g als stetig voraussetzen, existiert eine obere Schranke G für den Betrag der Funktionswerte von g. Dann gilt Z b Z b w(t) dt < ∞. |g(t)w(t)| dt ≤ G a a Rb Nach Satz 2 konvergiert a g(t)w(t) dt. Rb Ferner hatten wir a w(t) dt 6= 0 voraussgesetzt. Ist dies nicht der Fall, so verschwindet Rb w(t) nach Satz .3.13.3 fast überall. Dann verschwindet auch der Integrand in a w(t)g(t) dt fast überall, und nach dem eben zitierten Satz verschwindet das Integral. Damit verschwinden beide Seiten von (.3.9.2), ganz gleich wie ξ ∈ [a, b] gewählt wird. Der Satz ist also auch im Fall Rb w(t) dt = 0 richtig. a Wir sind nun in der Lage, den Satz über die majorisierte Konvergenz zu beweisen: Theorem 5 (Satz über die majorisierte Konvergenz). Sei I ein abgeschlossenes Intervall, eine abgeschlossene Halbachse oder R. Wir beichnen mit a den Anfangspunkt von I (bzw. −∞) und mit b den Endpunkt von I (bzw. ∞). Seien fn und m auf I definierte Funktionen, für die die Integrale von a nach b konvergieren. Wir setzen voraus, daß für fast alle t ∈ I m(t) reell ist, |fn (t)| ≤ m(t) für alle n ∈ N gilt und f (t) = limn→∞ fn (t)19 existiert. Dann gilt Z b Z b (1) lim fn (t) dt = f (t) dt, n→∞ a a wobei sowohl der Limes auf der linken als auch das Integral auf der rechten Seite konvergieren. Beweis. Durch Trennung von Real- und Imaginärteil dürfen wir annehmen, daß die fi reell sind. Außerdem dürfen wir annehmen, daß unsere Voraussetungen |fi (t)| ≤ m(t) und f (t) = limn→∞ für alle t erfüllt sind. Andernfalls setzt man einfach f (t) = fn (t) = 0 für alle t, welche diese Voraussetzungen nicht erfüllen, und ändert nach Satz .3.13.3 nichts an der untersuchten Fragestellung. Nach Satz 2 sind die Funktionen fi meßbar. Sei φk,l (t) = min(fk , . . . , fl ) Φk,l (t) = max(fk , . . . , fl ) φk (t) = inf fm (t) m ≥ k = lim φk,l (t) l→∞ Φk (t) = sup fm (t) m ≥ k = lim Φk,l (t). l→∞ Die Limites auf den beiden unteren Zeilen existieren für alle t, denn die zugrundeliegende Folge ist monoton und betragsmäßig beschränkt durch m(t). Aus demselben Grund bleiben die 19Wobei für alle anderen t irgendein beliebiger Wert für f (t) genommen werden kann, was nach dem zweiten Punkt von Satz .3.13.3 nichts an der untersuchten Fragestellung ändert 112 Rb Rb Folgen der Integrale a φk,l (t) dt und a Φk,l (t) dt beschränkt. Nach dem Satz über die monotone Rb Rb Konvergenz konvergieren a φk (t) dt und a ΦK (t) dt. Die Folge φk ist monoton wachsend und die Folge Φk monoton fallend, und es gilt f (t) = limk→∞ φk (t) = limk→∞ Φk (t). Nach dem Satz Rb über die monotone Konvergenz konvergiert a f (t) dt, und es gilt (+) Z b f (t) dt = lim k→∞ a Z b φk (t) dt = lim k→∞ a Z b Φk (t) dt. a Da φk (t) ≤ f (t) ≤ Φk (t) für alle t ∈ I, und damit Z b Z b Z b Φk (t) dt f (t) dt ≤ lim φk (t) dt ≤ lim k→∞ gilt, folgt (1) aus (+). a a k→∞ a Bemerkung 4. Offensichtlich haben wir unsere Überlegungen über Meßbarkeit nur benutzt, um zu zeigen, daß die φk,l und Φk,l integrierbar sind. Die Überlegungen des vorigen Abschnittes wurden dabei gebraucht, um die Integrierbarkeit der Funktionen φk,l und Φk,l zu zeigen. Diese wurde mittels des vorigen Satzes aus der Meßbarkeit dieser Funktionen hergeleitet, wobei die Überlegungen über die Differenzierbarkeit aus dem vorigen Abschnitt benutzt wurden, um umgekehrt zu zeigen, daß Funktionen mit konvergenten Integralen meßbar sind. Ohne diese technische Hürde, deren Überwindung so viele, lange und nichttriviale Überlegungen gekostet hat, hätten wir den Satz über die majorisierte Konvergenz sofort aus dem Satz über die monotone Konvergenz herleiten können. Wir wollen noch (in Verallgemeinerung des zweiten Punktes von Satz 1) zeigen, daß die Grenzwerte von fast überall konvergenten Folgen meßbarer Funktionen meßbar sind. Satz 3. Sei (fk )∞ k=1 eine Folge meßbarer Funktionen auf I, die daselbst fast überall gegen die Funktion f konvergiert. Dann ist auch f meßbar. Beweis. Wir dürfen uns durch Tennung von Real- und Imaginärteil auf reelle Funktionen beschänken und betrachten zunächst den Fall beschränkter Intervalle. Nach Satz 1 sind die Funktionen gn (t) = arctan fn (t) meßbar. Ihr Betrag ist durch π2 beschränkt. Da wir das Intervall im Augenblick als beschränkt voraussetzen, konvergiert das Integral dieser Majorante. Nach dem Satz über die majorisierte Konvergenz konvergiert das Integral von g(t) = arctan f (t) . Nach Satz 2 ist g meßbar. Es gibt also eine Folge von Stufenfunktionen γn , die gegen g konvergiert. Indem wir γn durch γ̃n (t) = max 2−n − π2 , min(γ(t), π2 − 2−n ) ersetzen, können wir noch annehmen, daß die Funktionswerte von γn in (− π2 , π2 ) liegen. Da dasselbe für g gilt und tan auf diesem Intervall stetig ist, gilt f (t) = limn→∞ tan γn (t) . Nach Fakt 2 ist tan γn (t) eine Stufenfunktion, und als Limes dieser Stufenfunktionen ist f meßbar. Wir betrachten nun unbeschränkte Intervalle und setzen In = I ∩ [n − 1, n]. Durch Anwendung der soeben bewiesenen Teilaussage erhält man die Meßbarkeit von f |In . Es gibt also 4. INTEGRATION UND DIFFERENTIATION IM Rn . 113 Folge von Stufenfunktionen gk,n mit limk→∞ gk,n (x) = f (x) für alle x ∈ In . Sei (+) γk = n−1 X gk,n 1[k,k+1) n=−k alsoγk (t) = ( gk,⌊x⌋ 0 −n ≤ ⌊x⌋ < n sonst, dann gilt limk→∞ γk (t) = f (t) für alle t ∈ I. Als charakteristische Funktion eines Intervalles ist 1[k,k+1) eine Stufenfunktion, nach Fakt 2 sind also die Summanden in (+) und damit auch (+) selbst Stufenfunktionen. Also ist f meßbar. 4. Integration und Differentiation im Rn . 4.1. Metrische Räume. Bevor wir uns eingehender mit dem Stetigkeitsbegriff beschäftigen, wollen wir den wichtigen Begriff metrischer Raum“ einführen, der es uns ermöglicht, ” Begriffe wie Konvergenz“ und Stetigkeit“ in einem allgemeinen Rahmen zu betrachten. ” ” Definition 1. Ein Metrischer Raum ist eine Menge M , versehen mit einer Funktion M × d→ R mit folgenden Eigenschaften: M −− • Aus x, y ∈ M und x 6= y folgt d(x, y) > 0. • Für alle x ∈ M gilt d(x, x) = 0. • Aus x, y, z ∈ M folgt d(x, z) ≤ d(x, y) + d(y, z). • Es gilt d(x, y) = d(y, x). Wir nennen diese Abstandsfunktion die Metrik von M . Falls mehrere metrische Räume im Spiel sind, schreiben wir oft dM , wenn die Metrik von M gemeint ist. Offenbar ist also d eine Abstandsfunktion, die ähnliche Eigenschaften erfüllt wie der normale Abstand für reelle Zahlen, Punkte im n-dimensionalen Euklidischen Raum etc. Die zuletzt erwähnte Ungleichung ist die Dreiecksungleichung. Beispiel 1. • Die Mengen R und C, versehen mit der Abstandsfunktion d(x, y) = |x − y|, sind metrische Räume. • Sei (M, d) ein metrischer Raum und N ⊆ M eine Teilmenge, dann ist N , versehen mit der Einschränkung von d auf N × N , ein metrischer Raum. Beweis. Wir beweisen zum Beispiel die erste Aussage, die zweite ist noch einfacher. Sei K = R oder C sowie x, y ∈ K. Im Fall x = y gilt x − y = 0 und d(x, y) = |x − y| = 0, im Fall x 6= y x − y 6= 0 und |x − y| > 0. Damit sind die beiden ersten Punkte von Definition 1 nachgewiesen. Für den letzten bemerken wir d(x, y) = |x − y| = |−1| · |x − y| = |−1 · (x − y)| = |y − x| = d(y, x). Es verbleibt der Nachweis des dritten Punktes von Definition 1, also der Dreiecksungleichung für die Metrik. Diese folgt unmittelbar aus der Dreiecksungleichung für den Betrag reeller 114 bzw. komplexer Zahlen: d(x, z) = |x − z| = |(x − y) + (y − z)| ≤ |x − y| + |y − z| = d(x, y) + d(y, z). Der bereits früher eingeführte Konvergenzbegriff überträgt sich mühelos auf Folgen von Elementen metrischer Räume. Definition 2. Sei (xn )∞ n=0 eine Folge von Elementen eines metrischen Raumes (M, d). Wir sagen, daß diese Folge gegen x ∈ M konvergiert, und schreiben limn→∞ xn = x, falls zu jeder positiven reellen Zahl ε eine Zahl δ > 0 existiert, so daß d(x, xn ) < ε für n > no gilt. Die Folge ist eine Cauchy-Folge, falls zu jedem positiven ε eine Zahl no existiert, so daß d(xm , xn ) < ε für no ≤ m ≤ n gilt. Ein metrischer Raum ist vollständig, falls jede Cauchy-Folge einen Limes hat. Bemerkung 1. Man überzeugt sich leicht davon, daß man im Fall M = R oder M = C, wobei in diesen Fällen die Metrik aus Beispiel 1 verwendet wird, den Konvergenzbegriff Definition .2.1.1 erhält. Fakt 1. • Der Grenzwert einer konvergenten Folge von Elementen eines metrischen Raumes ist eindeutig bestimmt. • Für jedes Element m eines metrischen Raumes M konvergiert die konstante Folge mit Folgenglied m gegen m. • Jede konvergente Folge ist eine Cauchy-Folge. • Jede Teilfolge einer konvergenten Folge konvergiert gegen denselben Grenzwert. Beweis. Wir beweisen als Beispiel den ersten Punkt. Angenommen, die Folge (mk )∞ k=ko konvergiert in M sowohl gegen m als auch gegen m̃, und es gilt m 6= m̃. Dann ist ε = d(m, m̃) positiv. Nach Definition 2 gibt es eine Zahl k ≥ ko mit d(mj , m) < 2ε für j > k und eine Zahl l ≥ ko mit d(mj , m̃) < 2ε für j > l. Für j > max(k, l) (zum Beispiel j = max(k, l) + 1) folgt ε = d(m, m̃) ≤ d(m, mj ) + d(mj , m̃) = d(mj , m) + d(mj , m̃) < ein Widerspruch. Die (einfachen) Beweise der übrigen Punkte werden weggelassen. ε ε + = ε, 2 2 Beispiel 2. • Die metrischen Räume R und C sind vollständig. • Der metrische Unterraum Q ⊂ R ist nicht vollständig, denn es gibt Cauchy-Folgen rationaler Zahlen, die nicht gegen eine rationale Zahl konvergieren (Beispiel: die Folge der Teilsummen der Dezimalbruchentwicklung einer irrationalen Zahl). Definition 3. Sei K = R oder K = C. Ein normierter K-Vektorraum ist ein K-Vektorraum k·k V , zusammen mit einer Abbildung V −−−→ [0, ∞), welche die folgenden Eigenschaften hat: • kλvk = |λ| kvk für λ ∈ K und v ∈ V . 4. INTEGRATION UND DIFFERENTIATION IM Rn . 115 • Es gilt die Dreiecksungleichung ku + vk ≤ kuk + kvk (1) für u, v ∈ V . • Aus kvk = 0 folgt v = 0. Beispiel 3. • Offenbar ist K, versehen mit den üblichen Betrag, ein K-Vektorraum. • Wenn (V, k·k) ein normierter C-Vektorraum und Ṽ V als R-Vektorraum bezeichnet (die Abbildung der Multiplikation Skalar mit Vektor C×V → V wird also auf R× Ṽ = R×V eingeschränkt), so ist (Ṽ , k·k) ein normierter R-Vektorraum. Insbesondere ist (C, |·|) ein normierter R-Vektorraum. Fakt 2. Sei V ein normierter K-Vektorraum. Dann wird V mit der Abstandsfunktion d(x, y) = kx − yk zu einem metrischen Raum. Beweis. Der Beweis ist vollkommen analog zu dem in Beispiel 1 behandelten Fall der Räume R und C. Sei x, y ∈ V . Im Fall x = y gilt x − y = 0 und d(x, y) = kx − yk = 0, im Fall x 6= y x − y 6= 0 und kx − yk > 0. Damit sind die beiden ersten Punkte von Definition 1 nachgewiesen. Für den letzten bemerken wir d(x, y) = kx − yk = |−1| · kx − yk = k−1 · (x − y)k = ky − xk = d(y, x). Es verbleibt der Nachweis des dritten Punktes von Definition 1, also der Dreiecksungleichung für die Metrik. Diese folgt unmittelbar aus der Dreiecksungleichung für die Norm: d(x, z) = kx − zk = k(x − y) + (y − z)k ≤ kx − yk + ky − zk = d(x, y) + d(y, z). Definition 4. Ein Banachraum ist ein normierter Raum, der mit der obigen Metrik versehen zu einem vollständigen metrischen Raum wird. Satz 1. Der K-Vektorraum V sei mit einem Skalarprodukt hv, wi ∈ K (v, w ∈ V ) versehen, das die folgenden Eigenschaften hat: • hu + v, wi = hu, wi + hv, wi. • hλu, vi = λ hu, vi. • hv, wi = hw, vi. • Aus v 6= 0 folgt hv, vi > 0. p Sei kuk = hu, ui. Dann wird V mit dieser Norm zu einem normierten K-Vektorraum, und es gilt die Cauchy-Schwarzsche Ungleichung (2) |hu, vi| ≤ kuk kvk . Beweis. Wir bringen nur den Beweis der schwierigeren Teilaussagen, nämlich den Beweis der Cauchy-Schwarzschen Ungleichung und die Herleitung der Dreiecksungleichung für die Norm aus dieser Ungleichung. 116 Wir beweisen zunächst die folgende Hilfsaussage für v, w ∈ V : 1 kvk2 + kwk2 (+) ℜ(hv, wi) ≤ 2 In der Tat, es gilt 0 ≤ hv − w, v − wi = hv, vi + hw, wi − hv, wi − hw, vi und (+) folgt. Wir verschärfen nun (+) zu = kvk2 + kwk2 − hv, wi − hv, wi = kvk2 + kwk2 − 2ℜ hv, wi , |hv, wi| ≤ (@) 1 kvk2 + kwk2 2 Nach dem nachfolgenden Lemma gibt es eine komplexe (bzw. reelle, falls R-Vektorräume betrachtet werden) Zahl ϑ mit |ϑ| = 1, so daß ϑ · hv, wi reell und nichtnegativ ist. Dann gilt nach (+) und den Eigenschaften des Skalarproduktes |hv, wi| = |ϑ hv, wi| = ϑ hv, wi = ℜ(ϑ hv, wi) = ℜ(hϑv, wi) 1 1 2 2 2 2 kϑvk + kwk = kvk + kwk ≤ 2 2 und (@) ist bewiesen. Wir können nun die Cauchy-Schwarzsche Ungleichung beweisen. Im Fall u = 0 oder v = 0 verschwinden beide Seiten von (2). Wir dürfen uns also auf den Fall beschränken, daß u und v beide nicht verschwinden. In diesem Fall verschwinden auch kuk und kvk nicht, und die u v Vektoren ũ = kuk und ṽ = kvk haben beide die Norm 1: kũk = kṽk = 1. Aus (@) folgt in diesem Fall |hũ, ṽi| ≤ 1. Wegen hu, vi = kuk kvk hũ, ṽi ergibt sich (2). Wir können nun die Dreiecksungleichung ku + vk ≤ kuk+kvk aus der Cauchy-Schwarzschen Ungleichung herleiten. Es gilt hu + v, u + vi = hu, ui + hv, vi + hu, vi + hv, ui = hu, ui + hv, vi + hu, vi + hv, ui 2 = kuk2 + kvk2 + 2ℜ hu, vi ≤ kuk2 + kvk2 + 2 kuk kvk = kuk + kvk . Auf diese Ungleichung kann die auf [0, ∞) monoton wachsende Quadratwurzelfunktion angewendet werden, und es ergibt sich p ku + vk = hu + v, u + vi ≤ kuk + kvk wie behauptet. Lemma 1. Sei z ∈ C, dann gibt es eine komplexe Zahl ϑ mit |ϑ| = 1, so daß ϑz reell und nichtnegativ ist. Falls z reell ist, kann auch ϑ reell gewählt werden. 4. INTEGRATION UND DIFFERENTIATION IM Rn . 117 Beweis. In der Tat, für z = 0 kann ϑ = 1 genommen werden. Andernfalls nehmen wir z . Für reelle z läuft dies auf ϑ = 1 für z ≥ 0 und ϑ = −1 für negative z hinaus, so daß ϑ ϑ = |z| in diesem Fall in der Tat reell ist. Bemerkung 2. Aus der Beziehung hv, wi = hw, vi und den übrigen Eigenschaften des Skalarproduktes folgt hu, v + wi = hu, vi + hu, wi sowie hu, λvi = λ hu, vi. Definition 5. Ein Hilbertraum ist ein Banachraum, dessen Norm man auf diese Weise aus einem Skalarprodukt erhalten kann. Auch der Stetigkeitsbegriff kann auf den Fall metrischer Räume verallgemeinert werden: f→ N heißt stetig Definition 6. Seien M und N metrische Räume. Eine Abbildung M −− in x ∈ M , falls zu jeder positiven reellen Zahl ε eine positive reelle Zahl δ mit dN f (x), F (Y ) < ε für dM (x, y) < δ gilt. Sie ist stetig, falls sie in jedem Punkt von M stetig ist. Beispiel 4. Für reellwertige Funktionen auf einer Teilmenge von R ergibt sich offenbar der früher bereits für diesen Fall eingeführte Stetigkeitsbegriff als Spezialfall. Inhalt des folgenden Satzes ist die Tatsache, daß eine Funktion genau dann stetig ist, wenn sie mit der Bildung des Grenzwertes von Folgen vertauschbar ist. f→ N zwischen metrischen Räumen sind folgende AussaSatz 2. Für eine Abbildung M −− gen äquivalent: • f ist stetig im Punkte m ∈ N . • Wenn (mi )∞ i=0 eine gegen ∞ m konvergierende Folge von Elementen von M ist, so konvergiert die Folge f (mi ) i=0 in N gegen f (m). Beweis. Die Abbildung sei stetig in m, und es gelte limi→∞ mi = m in M .Wir müssen limi→∞ f (mi ) = f (m) in N zeigen. Sei dazu eine positive reelle Zahl ε vorgegeben. Auf Grund der Stetigkeit von f gibt es ein δ > 0 mit (+) dN f (m), f (x) < ε für dM (x, m) < δ. Wegen limi→∞ mi = m in M gibt es ein io mit dM (mi , m) < δ für i > io . Für derartige i ist (+) auf x = mi anwendbar, und es folgt dN f (m), f (mi ) < ε wie für den Beweis von limi→∞ f (mi ) = f (m) benötigt. Damit ist die zweite Aussage aus der ersten hergeleitet. Zum Beweis der entgegengesetzten Implikation nehmen wir an, daß f im Punkte m unstetig ist, und zeigen die Existenz einer gegen m konvergenten Folge von Elementen von M , so daß f (mi ) in N nicht gegen f (m) konvergiert. Auf Grund der Unstetigkeit von f in M gibt es eine positive reelle Zahl ε, so daß für kein positives reelles δ aus dM (m, x) < δ dN f (m), f (x) < ε folgt. Insbesondere gibt −k es für jedes k ∈ N ein mk ∈ M mit dM (mk , m) < 2 und dN f (m), f (mk ) ≥ ε. Es folgt limk→∞ mk = m in M , während in N nicht limi→∞ f (mi ) = f (m) gilt.