Analysis für Physiker Doz.Dr. Koksch Sommersemester 2004 1 Mengen und Abbildungen 1.1 Grundbegriffe der mathematischen Logik 1.1.1 Aussagenlogische Ausdrücke Eine Aussage A ist ein sinnvolles sprachliches Gebilde, das die Eigenschaft hat, entweder wahr oder falsch zu sein (Prinzip vom ausgeschlossenem Dritten). Man nennt „wahr“ bzw. „falsch“ den Wahrheitswert W (A) der Aussage A. Die Wahrheitswerte werden üblicherweise mit w (wahr) bzw. f (falsch) bezeichnet. Beispiel 1.1.1. 1) „5 ist eine Primzahl.“ (Aussage, wahr) 2) „3 ist Teiler von 7.“ (Aussage, falsch) 3) „Daniel ist krank.“ (keine Aussage, Daniel ist nicht festgelegt.) 4) „a2 + b2 = c2 “ (keine Aussage, was sind a, b, c?) ♦ Die letzten beiden Beispiele sind keine Aussagen, aber Aussageformen oder aussagenlogische Ausdrücke, die einen Wahrheitswert erhalten durch Belegung der Aussagevariablen Daniel, a, b, c, Sind A1 und A2 Aussagen, so lassen sich durch sprachliche Verbindung neue Aussagen gewinnen: Neue Aussage „nicht A1 “ „A1 und A2 “ „A1 oder A2 “ (im Sinne von „oder auch“) „wenn A1 so A2 “, „aus A1 folgt A2 “, „A1 ist hinreichend für A2 “, „A1 impliziert A2 “, „A2 ergibt sich aus A1 “ „A1 genau dann, wenn A2 “, „A1 gilt dann und nur dann, wenn A2 “, „A1 ist äquivalent zu A2 “ Symbol ¬A1 A1 ∧ A2 A1 ∨ A2 Name Negation Konjunktion Disjunktion A1 ⇒ A2 Implikation A1 ⇔ A2 Äquivalenz ¬, ∧, ∨, ⇒, ⇔ heißen Junktoren. Die Wahrheitswerte sind wie folgt definiert: 3 1 Mengen und Abbildungen A1 w f ¬ f w und A1 w w f f A2 w f w f ∧ w f f f ∨ w w w f ⇒ w f w w ⇔ w f f w Elementarausdrücke sind die Konstanten w und f . Durch Zusammensetzen lassen sich nach folgenden Regeln weitere aussagenlogische Ausdrücke bilden: 1. Jede Zeichenreihe, die nur aus einer Aussagevariablen oder aus einer Konstanten besteht, ist ein Ausdruck. 2. Sind A1 und A2 Ausdrücke, so sind auch ¬A1 , (A1 ∧ A2 ), (A1 ∨ A2 ), (A1 ⇒ A2 ), (A1 ⇔ A2 ) Ausdrücke. 3. Eine Zeichenreihe ist nur dann Ausdruck, wenn dies auf Grund von 1. oder 2. der Fall ist. Damit ist sind zum Beispiel ((A1 ⇒ ¬A2 ) ∧ ¬A3 ) ein Ausdruck, ((A1 ⇒ ¬A2 )∧ ⇒ A3 ) dagegen nicht. Wie bei arithmetischen Ausdrücken führt man Abkürzungen ein, indem man festlegt: Jeder Junktor trennt stärker als jeder in der Folge ⇔,⇒,∨,∧,¬. Außerdem wird für A1 ∧ A2 kurz A1 A2 und für ¬A1 auch Ā1 geschrieben. Damit können Klammern eingespart werden: ((A1 ⇒ A2 ) ∧ ¬A3 ) ist kurz (A1 ⇒ A2 )Ā3 . 1.1.2 Äquivalenz von aussagenlogischen Ausdrücken Zwei Ausdrücke A1 , A2 heißen äquivalent bzw. werteverlaufsgleich (in Zeichen A1 = A2 ), wenn für jede Belegung φ der Variablen sich jeweils die gleichen Wahrheitswerte ergeben: W (φ (A1 )) = W (φ (A2 )) . Wichtige Äquivalenzen sind: w ∧ A1 = A1 , 4 f ∧ A1 = f , w ∨ A1 = w , f ∨ A1 = A1 , 1.1 Grundbegriffe der mathematischen Logik A1 ∧ A1 = A1 , A1 ∧ A1 = f , A1 = A1 , A1 ∨ A1 = A1 , A1 ⇒ A1 = w , A1 ∨ A1 = w , A1 ⇔ A1 = w . Kommutativität: A1 ∧ A2 = A2 ∧ A1 , A1 ∨ A2 = A2 ∨ A1 . Assoziativität: (A1 ∧ A2 ) ∧ A3 = A1 ∧ (A2 ∧ A3 ) , (A1 ∨ A2 ) ∨ A3 = A1 ∨ (A2 ∨ A3 ) . Distributivität: (A1 ∧ A2 ) ∨ A3 = (A1 ∨ A3 ) ∧ (A2 ∨ A3 ) , (A1 ∨ A2 ) ∧ A3 = (A1 ∧ A3 ) ∨ (A2 ∧ A3 ) . Konjunktion und Disjunktion verhalten sich also formal so wie Multiplikation und Addition. Ersetzung der Implikation und Äquivalenz: A1 ⇒ A2 = A1 ∨ A2 , A1 ⇔ A2 = (A1 ∨ A2 ) ∧ (A2 ∨ A1 ) . de Morgansche Regeln: A1 ∧ A2 = A1 ∨ A2 , A1 ∨ A2 = A1 ∧ A2 . Satz 1.1.2. Jeder aussagenlogische Ausdruck A(p1 , . . . , pn ) ist äquivalent zu aussagenlogischen Ausdrücken K(p1 , . . . , pn ) bzw. D(p1 , . . . , pn ), die als Junktoren nur die Negation und Konjunktion bzw. Disjunktion enthalten. Als Junktoren sind daher ¬ und ∧ bzw. ∨ ausreichend. Zum Vergleich komplizierterer Ausdrücke kann man nun versuchen, die Ausdrücke auf solche Normalformen zurückzuführen. Beispiel 1.1.3. Der Ausdruck A(p1 , . . . , p4 ) soll für die Belegungen ( f , f , w, w) , ( f , w, f , w) , ( f , w, w, f ) , (w, f , f , w) , (w, f , w, f ) , (w, w, f , f ) den Wert w und sonst f besitzen. Dann A(p1 , . . . , pn ) = p1 p2 p3 p4 ∨ p1 p2 p3 p4 ∨ p1 p2 p3 p4 ∨ p1 p2 p3 p4 ∨ p1 p2 p3 p4 ∨ p1 p2 p3 p4 . ♦ Beispiel 1.1.4. Wir betrachten die Negation von A ⇒ B: A ⇒ B ist genau dann wahr, wenn A wahr und B falsch ist. Damit A ⇒ B = A∧B. ♦ 5 1 Mengen und Abbildungen 1.1.3 Prädikative Ausdrücke, Quantifikatoren Die in der Mathematik verwendeten Aussagen sind Aussagen über die Eigenschaften der betrachteten Objekte: „3 ist eine Primzahl“, „7 ist Teiler von 343“. „ist Teiler von 343“ ist ein einstufiges Prädikat, „ist Teiler von“ ein zweistufiges Prädikat. Ist P z.B. ein einstufiges Prädikat und ist x eine Variable, so ist xP ein (nullstufiger) prädikativer Ausdruck. xP wird auch als x : P geschrieben uns als „x mit P“ gesprochen. Beispiel 1.1.5. „x > 3“ oder „x ist größer als 3“: Variable x, Prädikat P = „ist größer als 3“ „7|5“ oder „7 ist Teiler von 5“: Variable (Konstante) 7, Prädikat P = „ist Teiler von 5“ ♦ Die genannten Möglichkeiten zur Bildung neuer Aussageformen aus gegebenen reichen noch nicht aus, um z.B. die Aussage „Die Gleichung x + 3 = 8 besitzt eine Lösung“ zu bilden. Man betrachtet daher noch Quantifikatoren. Hier die beiden wichtigsten: V oder ∀ („für jedes“) und W oder ∃ („es gibt ein“) , die auch Generalisator und Partikularisator genannt werden. Bilden wir nun das einstufige Prädikat P = „ist Lösung von x +3 = 8“, so können wir obiges Problem als ∃xP schreiben (zu lesen: „es existiert ein x mit der Eigenschaft P), oder in der mathematische Umgangssprache ∃x (x + 3 = 8) . Die Aussage ∀x (x2 ≥ 0) mit der Bedeutung „Für jedes x gilt x2 ≥ 0“ ist falsch (z.B. für x = i), wenn wir uns nicht auf spezielle x beschränken. Wahr wäre hingegen ∀x (x ∈ R ⇒ x2 ≥ 0) . Um solche Ausdrücke kürzer schreiben zu können, definieren wir restringierte Quantifikatoren durch ∀x ∈ M P(x) := ∀x (x ∈ M ⇒ P(x)) und ∃x ∈ M P(x) := ∃x (x ∈ M ∧ P(x)) . 6 1.1 Grundbegriffe der mathematischen Logik Häufig muß man Negationen von Quantifikatoren bilden. Es gelten folgende Äquivalenzen: ∃xP = ∀xP , ∀xP = ∃xP . Weiter gelten folgende Vertauschungssätze gelten: ∀x∀yP(x, y) ⇔ ∀y∀xP(x, y) ⇔: ∀x, yP(x, y) , ∃x∃yP(x, y) ⇔ ∃y∃xP(x, y) ⇔: ∃x, yP(x, y) . Beachte, daß im Gegensatz dazu im folgenden Fall nur die Implikation gilt: ∃x∀yP(x, y) ⇒ ∀y∃xP(x, y) . Ferner gilt ∀xP(x) ⇒ P(y) , P(y) ⇒ ∃xP(x) . Manchmal wollen wir auch die Existenz genau eines bzw. höchstens eines Individuums beschreiben. Dazu nutzen wir ∃=1 bzw. ∃≤1 . Analog ist die Bildung weiterer Quantifikatoren. Bemerke: ∃ = ∃≥1 . Eine Variable in einem Ausdruck A heißt gebunden, wenn sie nach einem Quantifikator auftritt. Sie heißt vollfrei in A, wenn sie nirgends in A gebunden ist. Eine Variable außerhalb des Wirkungsbereiches eines sie bindenden Quantifikators heißt frei. So ist in (∃x(x > y)) ∨ x > 0 die Variable x gebunden und damit nicht vollfrei, an der dritten Stelle aber frei. Die Variable y ist vollfrei. Da Variablen nur stellvertretend stehen, können sie nach folgenden Regeln umbenannt werden: 1. Gebundene Umbenennung: Eine im Ausdruck A gebunden vorkommende Variable kann unmittelbar hinter dem sie bindenden Quantifikator in eine im Ausdruck noch nicht vorkommende Variable umbenannt werden und muß dann in allen Stellen im Wirkungsbereich des Quantifikators in gleicher Weise umbenannt werden. 2. Freie Umbenennung: Eine im Ausdruck A frei vorkommende Variable kann an allen Stellen, an denen sie frei ist, in eine im Ausdruck noch nicht vorkommende Variable umbenannt werden. Bei der Bezeichnung von Variablen gibt es keine Beschränkung: ∃Stephan : Stephan + 3 = 8. 7 1 Mengen und Abbildungen 1.1.4 Mathematische Aussagen In der Mathematik haben wahre Aussagen meist eine besondere Bezeichnung: Hauptsatz bzw. Theorem, Satz, Hilfssatz bzw. Lemma, Behauptung, Folgerung, wobei die obige Reihenfolge (mit Ausnahme der Folgerung) auch eine Reihenfolge in fallender Bedeutung sind: Hauptsatz, Theorem und Satz sind wichtige mathematische (wahre) Aussagen, Hilfssätze und Lemmas sind normalerweise mathematische (wahre) Aussagen von lokaler Bedeutung (z.B. für die Herleitung oder den Beweis eines Satzes). Eine Folgerung ist eine wahre mathematische Aussage, die sich ohne größeren weiteren Aufwand aus einer vorhergehenden Aussage oder aus ihrem Beweis ergibt. Oberbegriff für alle wahren mathematischen Aussagen ist „Satz“. Das Problem besteht nun darin, solche Aussagen zu vermuten und dann unter Anwendung logischer Regeln nachzuweisen, d.h. zu beweisen, daß sie den Wahrheitswert w haben. Umgangssprachlich gibt es mehrere Beweismethoden: • Beweis durch Aufzählung einzelner Beispiele. • Beweis durch Abstimmung. • Beweis mit zunehmender Lautstärke. • Beweis durch Diffamierung. Diese sind natürlich in der Mathematik nicht zulässig. Zulässige Beweise sind: • Der direkte Beweis durch Herleitung der Aussage aus bekannten (bewiesenen, wahren) Aussagen. • Der indirekte Beweis (Widerspruchsbeweis) durch Annahme der Negation der Aussage und Ableitung eines Widerspruchs. Die Beweise basieren auf folgenden Regeln: 8 1.2 Grundbegriffe der Mengenlehre Satz vom ausgeschlossenen Dritten: Satz vom Widerspruch: Satz von der doppelten Verneinung: Kontrapositionssatz: Satz vom modus ponens: Satz vom modus tollens: Satz vom modus barbara: A ∨ ¬A ¬(A ∧ ¬A) ¬(¬A) ⇔ A (A ⇒ B) ⇔ (¬B ⇒ ¬A) ((A ⇒ B) ∧ A) ⇒ B ((A ⇒ B) ∧ ¬B) ⇒ ¬A ((A ⇒ B) ∧ (B ⇒ C)) ⇒ (A ⇒ C) In beiden Fällen müssen aber Grundaussagen vorausgesetzt werden, die als wahr angenommen werden, die aber nicht aus vorherigen Aussagen abgeleitet werden können. Solche Aussagen heißen Axiome. Die Axiome werden dann zu Axiomensystemen zusammengefaßt (z.B. dem Axiomensystem der euklidischen Geometrie aus 5 Axiomen). Man ist nun einerseits bestrebt, ein Axiomensystems klein und widerspruchsfrei zu halten, und andererseits möglichst viele Aussagen daraus abzuleiten, d.h. eine Theorie zu bilden. 1.2 Grundbegriffe der Mengenlehre 1.2.1 Menge, Elemente Mengen und die Elementbeziehung sind die wichtigste Grundlage der Mathematik. Unter einer Menge versteht man (naiv!) die Zusammenfassung gewisser, wohlunterscheidbarer Dinge zu einem neuen Ganzen; die dabei zusammengefaßten Dinge heißen die Elemente der betroffenen Menge. Ist a ein Element der Menge M so schreibt man a ∈ M; ist a nicht Element von M, so schreibt man a 6∈ M. Zwei Mengen A und B heißen gleich, wenn sie dieselben Elemente enthalten: A = B ⇔ ∀x(x ∈ A ⇔ x ∈ B) . Häufig werden Mengen beschrieben als Teil einer Grundgesamtheit indem man eine Eigenschaft (Prädikat) für die Elemente zur Charakterisierung angibt: Grundgesamtheit sei die Menge der natürlichen Zahlen. Die Menge der geraden natürlichen Zahlen kann dann durch {x ∈ N : 2 ist Teiler von x} oder {x ∈ N : ∃y ∈ N(x = 2y)} beschrieben werden. Eine besondere Menge ist die leere Menge 0, / das ist die Menge, die keine Elemente enthält: 0/ := {} = {x : x 6= x} . 9 1 Mengen und Abbildungen Bemerke, daß es genau eine leere Menge gibt. Wären nämlich 0/ 1 und 0/ 2 zwei verschiedene leere Mengen, dann hätten sie die gleichen Elemente (nämlich keine) und somit wäre 0/ 1 = 0/ 2 . Damit wäre ein Widerspruch gefunden, d.h., es gibt keine zwei verschiedenen leere Mengen. 1.2.2 Teilmengen Sind A und B Mengen und gilt ∀x (x ∈ A ⇒ x ∈ B) , d.h., ist jedes Element von A auch Element von B, dann nennt man A Teilmenge von B und schreibt A ⊆ B. Gilt neben A ⊆ B auch A 6= B, dann heißt A auch echte Teilmenge von B und man schreibt A ⊂ B. Für Mengen A, B, C gelten: 1. Reflexivität: A ⊆ A, 2. Antisymmetrie: A ⊆ B∧B ⊆ A ⇒ A = B, 3. Transitivität: A ⊆ B∧B ⊆C ⇒ A ⊆C, A ⊂ B∧B ⊂C ⇒ A ⊂C sowie A 6⊂ A , A ⊂ B ⇒ A ⊆ B, A ⊂ B ⇔ A ⊆ B ∧ A 6= B , Daraus ergibt sich ein wichtiges Beweisprinzip für die Gleichheit von Mengen: A = B ⇔ A ⊆ B∧B ⊆ A. Um A = B zu zeigen, zeigt man, daß A Teilmenge von B und gleichzeitig B Teilmenge von A ist. 10 1.2 Grundbegriffe der Mengenlehre 1.2.3 Operationen mit Mengen Seien A und B zwei Mengen. Die Vereinigung A ∪ B ist die Menge, die aus allen Elementen von A und allen Elementen von B besteht: A ∪ B := {x : x ∈ A ∨ x ∈ B} . Der Durchschnitt A ∩ B ist die Menge, die aus allen Elementen besteht, die sowohl zu A als auch zu B gehören: A ∩ B := {x : x ∈ A ∧ x ∈ B} . Die Differenz A \ B ist die Menge, die aus allen Elementen von A besteht, die nicht Element von B sind: A \ B := {x : x ∈ A ∧ x 6∈ B} . Zwei Mengen heißen disjunkt, wenn ihr Durchschnitt die leere Menge 0/ ist, d.h., A ∩ B = 0/ . Die symmetrische Differenz A 4 B ist die Menge, die aus allen Elementen von A besteht, die nicht Element von B sind und aus allen Elementen von B besteht, die nicht Element von A sind: A4B = A\B∪B\A. Sei nun Ω eine gegebene Menge und A ⊆ Ω . Die Menge Ω \ A wird als Komplement von A bezüglich Ω bezeichnet: CΩ A := Ω \ A . Wenn Ω durch den Kontext festgelegt ist, werden auch die Kurzbezeichnungen CA oder Ac verwendet. Für Mengen A, B, C gelten u.a. folgende Eigenschaften: A∩B ⊆ A ⊆ A∪B, A ∪ 0/ = A , A ∩ 0/ = 0/ , A∪A = A∩A = A. Sei ∗ ∈ {∩, ∪, 4}. Dann gelten: Kommutativität: A∗B = B∗A. Assoziativität: A ∗ (B ∗C) = (A ∗ B) ∗C . 11 1 Mengen und Abbildungen Distributivität: A ∪ (B ∩C) = (A ∪ B) ∩ (A ∪C) , A ∩ (B ∪C) = (A ∩ B) ∪ (A ∩C) . Für die Differenz gilt zum Beispiel: A \ (B ∪C) = (A \ B) ∩ (A \C) , A \ (B ∩C) = (A \ B) ∪ (A \C) . De Morgansche Regeln: CΩ (A ∩ B) = CΩ A ∪ CΩ B , CΩ (A ∪ B) = CΩ A ∩ CΩ B . Der Beweis dieser Eigenschaften erfolgt durch direktes Überprüfen der Teilmengenbeziehungen durch Umformung der Prädikate unter Verwendung der logischen Umformungsregeln, z.B.: A ∪ B = {x : (x ∈ A ∨ x ∈ B)} = {x : (x ∈ B ∨ x ∈ A)} = B ∪ A . Eine andere, anschauliche Variante ist die Verwendung von Euler-Venn-Diagrammen: Dazu repräsentiert man die Mengen durch Gebiete in der Ebene. Als Beispiel betrachten wir A ∩ (B ∪C) . B A C Man kann nun direkt ablesen: A ∩ (B ∪C) = (A ∩ B) ∪ (A ∩C) . 12 1.2 Grundbegriffe der Mengenlehre 1.2.4 Spezielle Mengenbildungsprinzipien Kartesisches Produkt (Direktes Produkt): Unter dem geordnetem Paar (a, b) zweier Elemente versteht man die Menge (a, b) := {{a}, {a, b}} . Es gilt für beliebige Elemente a, b, c, d: (a, b) = (c, d) ⇔ a = c ∧ b = d . Im allgemeinen gilt (a, b) 6= (b, a) . Statt nur zwei Elemente zu einem geordnetem Paar zusammenzufassen, kann man allgemein auch n Elemente a1 , . . . , an zu einem geordnetem n-Tupel (a1 , . . . , an ) zusammenfassen: Dies wird rekursiv erklärt durch: falls n = 1 , a1 , (a1 , a2 ) , falls n = 2 , (a1 , . . . , an ) := ((a1 , . . . , an−1 ), an ) , falls n > 2 . Es gilt wiederum (a1 , . . . , an ) = (b1 , . . . , bn ) ⇔ a1 = b1 ∧ · · · ∧ an = bn . Sind nun A1 , . . . , An Mengen, so definieren wir das kartesische Produkt ×ni=1 Ai durch ×ni=1 Ai = A1 × · · · × An := {(a1 , . . . , an ) : a1 ∈ A1 ∧ · · · ∧ an ∈ An } . Nach Konstruktion ist ×ni=1 Ai wieder eine Menge und zwar die Menge der entsprechenden n-Tupel. Im Spezialfall haben wir A × B = {(a, b) : a ∈ A ∧ b ∈ B} . Mengensysteme Unter einem Mengensystem versteht man eine Menge, deren Elemente wieder Mengen sind. Ist M ein solches Mengensystem definiert man die Vereinigung bzw. Durchschnitt durch [ M := {x : ∃A(A ∈ M ∧ x ∈ A)} , \ M := {x : ∀A(A ∈ M ⇒ x ∈ A)} . Sie sind also wieder Mengen. Im Spezialfall haben wir [ {A, B} = A ∪ B , \ {A, B} = A ∩ B , die Definition ist also konsistent mit der Definition von Vereinigung und Durchschnitt von Mengen. 13 1 Mengen und Abbildungen Potenzmengen Sei M eine Menge. Unter der Potenzmenge P(M) = 2M verstehen wir die Menge aller Teilmengen von M: 2M = {x : x ⊆ M} . Für M = {1, 2, 3} haben wir 2M = {0, / {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}} . Man bemerke, daß diese Menge genau 8 = 23 Elemente bei der 3-elementigen Menge M hat. Dies ist ein Hinweis für das etwas eigentümliche Symbol für die Potenzmenge. 1.2.5 Paradoxien Wie das folgende Paradoxon zeigt, ist der Mengenbegriff eigentlich genauer zu fassen: Alle Männer in Sevilla rasieren sich selbst oder lassen sich vom Barbier in Sevilla rasieren. Der Barbier rasiert aber nur die Männer, die sich nicht selbst rasieren. Wer rasiert den Barbier? Sei M die Menge der Männer in Sevilla, R die Menge der sich selbst rasierenden Männer, B die Menge der Männer, die sich durch den Barbier rasieren lassen. Dann gilt M = R∪B, R ∩ B = 0/ . Das Problem besteht nun darin, daß die Unterteilung in R und B durch eine Eigenschaft bezüglich eines Elementes von M (dem Barbier) getroffen wird und damit selbstbezüglich ist. Ein anderes Paradoxon ist: Sei M die Menge aller Mengen, die sich nicht selbst enthalten. Ist M Element von M? Zur Vermeidung der Parodoxien gibt es mehrere Möglichkeiten. Z.B. • Axiomatische Mengenlehre. • Einführung allgemeinerer Begriffe (Klassen), Mengen sind dann Klassen, die Element einer anderen Klasse sind. • Ausgehend von der leeren Menge werden alle für die Mathematik wichtigen Mengen konstruiert und nur diese zur Betrachtung zugelassen. 14 1.3 Relationen und Abbildungen 1.3 Relationen und Abbildungen 1.3.1 Relationen Anschaulich versteht man unter einer Relation zwischen zwei Mengen A und B eine Beziehung, die zwischen den Elementen von A und besteht. Mathematisch nennen wir eine Teilmenge R von A × B eine (2-stellige) Relation zwischen A und B. Relationen treten in der Mathematik sehr häufig auf. Relationen mit bestimmten Eigenschaften haben besondere Bezeichnungen. Da Relationen Mengen sind, können die Mengenoperationen auch auf Relationen angewendet werden. Sind R und S Relationen, so heißt R Teilrelation von S, wenn R ⊆ S. Weiter heißen R ∪ S und R ∩ S Summe bzw. (absolutes) Produkt von R und S. Die inverse Relation R−1 ist definiert durch R−1 := {(x, y) : (y, x) ∈ R} . Vorbereich VbR und Nachbereich NbR einer Relation R sind wie folgt definiert: VbR := {x : ∃y((x, y) ∈ R)} , NbR := {y : ∃x((x, y) ∈ R)} . Anstelle von (x, y) ∈ R schreibt man auch kurz xRy . Häufig untersuchte Eigenschaften von binären Relationen R in A (d.h., R ⊆ A × A) sind in der folgenden Tabelle zusammengefaßt: Eigenschaft Reflexivität Transitivität Symmetrie Antisymmetrie Charakterisierung ∀a ∈ A (aRa) ∀a, b, c ∈ A (aRb ∧ bRc ⇒ aRc) ∀a, b ∈ A (aRb ⇒ bRa) ∀a, b ∈ A (aRb ∧ bRa ⇒ a = b) 1.3.2 Ordnungsrelationen Definition 1.3.1. Eine binäre Relation R in M heißt Ordungsrelation oder Halbordnung, wenn R reflexiv, transitiv und antisymmetrisch ist. Anstelle aRb schreibt man dann auch a ≤R b . ♦ 15 1 Mengen und Abbildungen Beispiel 1.3.2. In den ganzen Zahlen definieren wir eine Ordnungsrelation ≤ durch a≤b b−a ∈ N. :⇔ ♦ Dies ist dann die übliche Ordnung. Beispiel 1.3.3. Sei N eine Menge und sei M = 2N . Die Relation R in M werde durch BRC :⇐⇒ B⊆C ♦ definiert. Dann ist R eine Halbordnung auf M. Bemerkung 1.3.4. Die Relation < definiert durch x<y :⇔ x ≤ y ∧ x 6= y ♦ (echt kleiner) ist keine Halbordnung! Definition 1.3.5. Eine Ordnungsrelation ≤ in M heißt linear (oder total oder konnex), wenn für je zwei Element x und y von M stets x ≤ y oder y ≤ x gilt. ♦ In Beispiel 1.3.2 ist R eine totale Ordung, in 1.3.3 aber nicht. Bezeichnung: Ist ≤ eine Halbordnung in M, sind N ⊆ M und a ∈ M, so setzen wir N≥a := {x ∈ N : x ≥ a} . Analog werden N≤a , N>a , N<a definiert. 1.3.3 Abbildungen Seien zwei Mengen X und Y gegeben. Eine Relation f ⊆ X ×Y heißt rechtseindeutig, wenn ∀x ∈ X, y, z ∈ Y (x f y ∧ x f z ⇒ y = z) . Eine rechtseindeutige Relation f ⊆ X ×Y heißt Abbildung aus X in Y . Ist (x, y) ∈ f , so nennt man y das Bild von x unter f und schreibt y = f (x) . f (x) wird Wert von f an der Stelle x genannt. Beachte f 6= f (x) . Man nennt f die Vorschrift, X den Urbildbereich, dom f = D( f ) := Vb f = {x ∈ X : ∃y ∈ Y (y = f (x))} 16 1.3 Relationen und Abbildungen den Definitionsbereich (Urbildmenge), Y den Bildbereich oder Wertebereich und W ( f ) := im f := Nb f = {y ∈ Y : ∃x ∈ X(y = f (x))} die Bildmenge. Als Schreibweise sind dafür (X,Y, f ) oder f : D( f ) ⊆ X → Y üblich. Für y ∈ Y heißt die Menge {x ∈ X : f (x) = y} das Urbild von y unter f und wird mit f −1 (y) bezeichnet. Für eine Menge M ⊆ X heißt f [M] := {y ∈ Y : ∃x ∈ M(y = f (x))} Bild der Menge M unter f . Analog heißt f −1 [N] := {x ∈ X : ∃y ∈ N(y = f (x))} das Urbild der Menge N unter f . Man beachte nun W ( f ) = f [X] und D( f ) = f −1 [Y ] . Die Abbildung f : D( f ) ⊆ X → Y heißt linkstotal bzw. Abbildung von, wenn D( f ) = X , sie heißt rechtstotal, surjektiv oder Abbildung auf , wenn W(f) = Y . Beispiel 1.3.6. Wir definieren die Relation f ⊆ R × R durch f := {(x, x−2 ) : x ∈ R \ {0}} . (1.3.1) Dann ist Vb f = R \ {0}, Nb f = R>0 . Seien (x, y) ∈ f und (x, z) ∈ f . Dann gelten y = x−2 und z = x−2 , also y = z. Somit ist f rechtseindeutig und damit eine Abbildung. Der Definitionsbereich ist D( f ) = R \ {0}, die Bildmenge W ( f ) = R>0 . Somit ist f eine nicht surjektive Abbildung aus R in R. Definieren wir hingegen f ∈ R \ {0} × R>0 durch (1.3.1), so ist f eine Abbildung von R \ 0 auf R>0 . ♦ 17 1 Mengen und Abbildungen Die Menge graph( f ) := {(x, f (x)) : x ∈ D( f )} heißt Graph von (X,Y, f ). Ist die Abbildung (X,Y, f ) links- und rechtstotal, so wird sie vollständig durch seinen Graphen, d.h., die Relation f beschrieben. Man nennt eine Abbildung f : D( f ) ⊆ X → Y injektiv oder eineindeutig, wenn sie auch linkseindeutig ist, d.h., wenn ∀x, y ∈ X(x 6= y ⇒ f (x) 6= f (y)) . (1.3.2) Äquivalent dazu ist (Kontrapositionssatz!) ∀x, y ∈ X( f (x) = f (y) ⇒ x = y) . (1.3.3) Eine injektive und surjektive Abbildung heißt bijektiv. Beispiel 1.3.7. 1. Die Menge aller Autos in Deutschland wird in die Menge aller zulässigen Autonummern abgebildet: injektiv aber nicht surjektiv. 2. Die Menge aller Einwohner in DD wird in die Menge aller Wohnadressen abgebildet: Keine Abbildung, da nicht rechtseindeutig. ♦ Satz 1.3.8. Sei f : D( f ) ⊆ X → Y eine Abbildung. 1. Die inverse Relation f −1 ist genau dann eine Abbildung aus Y in X, wenn f injektiv ist. 2. Sei D( f ) = X. Die inverse Relation f −1 ist genau dann eine Abbildung von Y auf X, wenn f bijektiv ist. Beweis. 1. Sei f injektiv, d.h., linkseindeutig. Dann ist f −1 rechtseindeutig und somit eine Abbildung aus Y in X. Sei nun die inverse Relation f −1 eine Abbildung aus Y in X. Dann ist f −1 rechtseindeutig, d.h., f ist linkseindeutig, d.h., injektiv. 2. Sei f bijektiv. Nach 1. ist f −1 eine Abbildung aus Y in X. Da D( f ) = X und f surjektiv, ist f links- und rechtstotal. Somit ist f −1 rechts- und linkstotal, d.h., eine Abbildung von Y auf X. Sei nun f −1 eine Abbildung von Y auf X. Dann ist f eine Abbildung auf Y , also surjektiv. Abbildungen werden auch als Funktion oder Operator bezeichnet. Im engeren Sinne ist eine Funktion eine Abbildung aus den reellen (oder komplexen) Zahlen in die reellen (oder komplexen) Zahlen. Definition 1.3.9. Seien f : D( f ) ⊆ X → Y und g : D(g) ⊆ Y → Z Abbildungen. Dann versteht man unter der Verknüpfung h = g ◦ f (lies g verknüpft mit f ) die Abbildung h : D(h) ⊆ X → Z mit D(h) = f −1 [D(g)] ⊆ D( f ) , 18 h(x) = g( f (x)) für x ∈ D(h) . ♦ 1.3 Relationen und Abbildungen Bemerkung 1.3.10. Im allgemeinen gilt f ◦ g 6= g ◦ f . Betrachte zum Beispiel f : R → R mit f (x) = sin x und g : R>0 → R mit g(x) = ln x. Dann gilt (g ◦ f )(x) = ln(sin x) für x ∈ D(g ◦ f ) = [ ]2kπ, (2k + 1)π[ k∈Z und ( f ◦ g)(x) = sin(ln x) für x ∈ D( f ◦ g) = R>0 ♦ 1.3.4 Exkurs: Die natürlichen Zahlen Axiom 1.3.11 (Peano-Axiome). Die natürlichen Zahlen bilden eine Menge N, in der ein Element 0 ausgezeichnet ist und für die es eine Abbildung ν : N → N \ {0} gibt mit folgenden Eigenschaften: 1. (Axiome zu Nachfolger und Vorgänger) ν ist bijektiv. 2. (Induktionsaxiom) Enthält eine Teilmenge N von N das Element 0 und mit n auch ν(n), so gilt N = N: (N ⊆ N) ∧ (0 ∈ N) ∧ (∀n ∈ N(ν(n) ∈ N)) ⇒ N = N. Bemerkung 1.3.12. 1. Für n ∈ N heißt ν(n) Nachfolger von n. 2. 0 ist die einzige natürliche Zahl, die nicht Nachfolger einer natürlichen Zahl ist, das heißt, ν ist surjektiv. Beweis. Sei N := {n ∈ N : ∃m ∈ N(ν(m) = n)} ∪ {0} . Für n ∈ N gilt ν(n) ∈ W (ν) ⊆ N. Wegen 0 ∈ N folgt N = N aus dem Induktionsaxiom. Da W (ν) ⊆ N \ {0}, folgt W (ν) = N \ {0}. 3. Statt 0, ν(0), ν(ν(0)), ν(ν(ν(0))), . . . schreibt man üblicherweise 0, 1, 2, 3, . . .. 4. Durch n + 1 := ν(n) kann die Addition mit den üblichen Kommutativ- und Assoziativgesetzen eingeführt werden. Anschließend kann auch die Multiplikation mit Kommutativ-, Assoziativ- und Distributivgesetz eingeführt werden. 5. Bei axiomatischer Einführung der Mengenlehre kann man auch auch Modelle für natürliche Zahlen angeben: Man nennt eine Menge M induktiv, wenn sie 0/ enthält und mit m ∈ M auch {m}. Man nimmt nun das Unendlichkeitsaxiom (Existenz von induktiven Mengen) an und setzt \ N := {M : M ist induktive Menge} . 19 1 Mengen und Abbildungen Setzt man nun 0 := 0/ und definiert ν(n) := n ∪ {n}, so kann man beweisen, daß die so konstruierten natürlichen Zahlen den Peano-Axiomen genügen. Man hat also 0 = 0/ und n + 1 = {0, . . . , n} . 6. Man kann im Rahmen einer axiomatischen Mengenlehre zeigen, daß die natürlichen Zahlen in einem gewissen Sinn eindeutig bestimmt sind und man daher von den natürlichen Zahlen sprechen kann. 7. Das Induktionsaxiom ist die Grundlage für das Beweisprinzip der vollständigen Induktion. ♦ Satz 1.3.13 (Induktionsprinzip). Es sei n0 ∈ N, und für jedes n ∈ N≥n0 sei A(n) eine Aussage. Ferner gelte: 1. (Induktionsanfang) A(n0 ) ist eine wahre Aussage. 2. (Induktionsschritt) Für jedes n ∈ N≥n0 gilt: Wenn A(n) eine wahre Aussage ist, dann ist auch A(n + 1) eine wahre Aussage. Dann gilt A(n) für alle n ∈ N≥n0 . Beweis. Wir setzen N := {n ∈ N : A(n + n0 ) ist wahr}. Aus dem Induktionsaxiom folgt sofort N = N. Ausgehend von N werden dann die ganzen Zahlen Z, die rationalen Zahlen Q, die reellen Zahlen R, die komplexen Zahlen C sowie alle für die Analysis wichtigen Mengen von Funktionen konstruiert. Teile dieser Konstruktionen sind schon durchgeführt oder werden später noch durchgeführt. Bemerkung 1.3.14. Die Menge aller Abbildungen von A in B wird auch mit BA bezeichnet. Sei nun zum Beispiel B = 2 = {0, 1}. Dann ist jede Abbildung aus BA gerade dadurch charakterisiert, welche Teilmenge von A auf 1 abgebildet wird. Somit kann {0, 1}A = 2A mit der Potenzmenge von A identifiziert werden und wir erhalten hier eine weitere Begründung für die Bezeichnung 2A für die Potenzmenge von A. ♦ 1.3.5 Spezielle Abbildungen Folgen Eine Abbildung f : N → Y oder f : Z → Y heißt Folge aus Y . Konstante Abbildung Sei c ∈ Y und f : D( f ) ⊆ X → Y mit f (x) = c für alle x ∈ D( f ). Dann heißt f konstante Abbildung. 20 1.3 Relationen und Abbildungen Charakteristische Funktion Sei 0/ 6= A ⊆ X. Die Abbildung χA : X → R werde definiert durch 1 , falls x ∈ A , χA (x) = 0 , falls x 6∈ A . Sie heißt charakteristische Funktion oder Indikator(funktion) der Menge A in X. 1.3.6 Äquivalenzrelationen Definition 1.3.15. Eine binäre Relation R in einer Menge M heißt Äquivalenzrelation, falls R reflexiv, transitiv und symmetrisch ist. ♦ Ist R eine Äquivalenzrelation in M und sind a, b ∈ M, so schreibt man statt aRb auch a ∼R b; gelesen a ist äquivalent zu b bzgl. R. Äquivalenzrelation sind Grundlage für den Abstraktionsprozess. Mathematisch beschrieben wird dies durch die Restklassenbildung: Man nennt [a]R := {b ∈ M : a ∼R b} die Äquivalenzklasse oder Restklasse von a bezüglich R. a heißt Repräsentant dieser Restklasse. Die Menge M/R := {[a]R : a ∈ M} aller Restklassen von M bezüglich R heißt Faktormenge oder auch Quotient von M bezüglich R. Für derartige Restklassen gilt: a ∈ [a]R 6= 0/ , [a]R = [b]R ⇔ a ∼R b , a 6∼R b ⇒ [a]R ∩ [b]R = 0/ , d.h., M/R ist ein Mengensystem aus paarweise disjunkten, nichtleeren Mengen mit Vereinigung M. Ein solches Mengensystem wird auch Zerlegung genannt. Ist nun eine Zerlegung Z von M gegeben, können wir eine binäre Relation S in M in folgender Weise definieren: aSb ⇔ ∃X(X ∈ Z ∧ a, b ∈ X) . S ist dann wieder eine Äquivalenzrelation. Beispiel 1.3.16. Wir betrachten die Konstruktion der ganzen Zahlen: Wir definieren eine Äquivalenzrelation G in N × N durch (n, m)G(p, q) :⇔ n + q = p + m . 21 1 Mengen und Abbildungen Die Menge Z der ganzen Zahlen wird nun identifiziert mit der Menge (N × N)/G, d.h., Z := (N × N)/G . Schreiben wir nun die Äquivalenzklasse [(n, m)]G zum Representanten (n, m) als n − m := [(n, m)]G , so können wir uns die Äquivalenzklassen als formale Differenz von Paaren natürlicher Zahlen vorstellen, bei denen „gleiche“ Differenzen identifiziert werden: 0 − 1 und 1 − 2 sind zum Beispiel die gleiche ganze Zahl. Wir definieren die Addition und Multiplikation durch (n − m) +Z (p − q) = [(n, m)]G +Z [(p, q)]G := [(n + p, m + q)]G = (n + p) − (m + q) und (n − m) ·Z (p − q) = [(n, m)]G ·Z [(p, q)]G := [(np + mq, nq + mp)]G = (np + mq) − (nq + mp) für m, n, p, q ∈ N. Offensichtlich ist [(m, n)]G = m − n das bezüglich der Addition inverse Element der ganzen Zahl [(n, m)]G = n − m. [(0, 0)]G = 0 − 0 und [(1, 0)]G = 1 − 0 sind die neutralen Elemente bezüglich Addition bzw. Multiplikation. Identifiziert man die natürliche Zahl n mit der ganzen Zahl [(n, 0)]G = n − 0, so erhält man N ⊂ Z und Addition und Multiplikation sind die Fortsetzung der entsprechenden Operationen von den natürlichen Zahlen zu den ganzen Zahlen, die nun wieder mit + und · bezeichnet werden. Weiter kann man nun −n := 0 − n = [(0, n)]G setzen, und man erhält Z = N ∪ {−n : n ∈ N} . ♦ Beispiel 1.3.17. Wir betrachten die Konstruktion der rationalen Zahlen: Wir definieren in eine Äquivalenzrelation R in Z × {Z \ {0}} durch (p, q)R(r, s) :⇔ ps = qr und setzen Q := (Z × (Z \ {0}))/R . Schreiben wir die Äquivalenzklasse [(p, q)]R zum Representanten (p, q) als p := [(p, q)]R , q 22 1.3 Relationen und Abbildungen so besagt die Äquivalenzrelation R gerade, daß z.B. 23 und 64 als die gleiche rationale Zahl betrachtet werden: p Q= : p ∈ Z, q ∈ Z \ {0} . q Wir definieren die Addition und Multiplikation durch r p ps + qr +Q = [(p, q)]R +Q [(r, s)]R := [(ps + qr, qs)]R = q s qs und pr p r ·Q = [(p, q)]R ·Q [(r, s)]R := [(pr, qs)]R = q s qs für p, r ∈ Z, q, s ∈ Z \ {0}. [(0, 1)]R = 10 und [(1, 1)]R = 11 sind die neutralen Elemente bezüglich Addition bzw. Multiplikation. Offensichtlich ist [(q, p)]R = qp das bezüglich der Multiplikation inverse Element der rationalen Zahl qp , wenn qp 6= 01 , d.h. p 6= 0. Identifiziert man p 1 mit der ganzen Zahl p, so erhält man Z ⊂ Q. ♦ 1.3.7 Exkurs: Binomische Formel Bevor wir uns im nächsten Kapitel intensiv mit reellen Zahlen beschäftigen, wollen wir hier zum Ende dieses Kapitels noch einige elementare Resultate zu Binomialkoeffizienten zusammenfassen. Definition 1.3.18. Seien n, k ∈ N. Die Zahl 1, n! := 1·2·····n, für n = 0 , für n ≥ 1 heißt Fakultät n! von n. Die Zahl n! n k Cn = := , k k!(n − k)! n ≥ k, heißt Binomialkoeffizient von n über k. ♦ Lemma 1.3.19. Die Binomialkoeffizienten haben folgende Eigenschaften: n 1. = für alle n ∈ N, k ∈ {0, 1, . . . , n}. n−k n n 2. = = 1 für alle n ∈ N. 0 n n n 3. = = n für alle n ∈ N≥1 . 1 n−1 n k 23 1 Mengen und Abbildungen 4. 5. 6. 7. 8. n−1 n n = (k + 1) für alle n ∈ N≥1 , k ∈ N≤n−1 . k k+1 n n n+1 + = für alle n ∈ N≥1 , k ∈ {1, . . . , n − 1}. k k−1 k n n Es gilt ∑ = 2n für alle n ∈ N. k k=0 n n k Es gilt ∑ (−1) = 0 für alle n ∈ N>0 . k k=0 n n+1 n+k n+k+1 Für alle k, n ∈ N gilt + +···+ = . n n n n+1 Beweis. Die ersten drei Eigenschaften ergeben sich unmittelbar aus der Definition. Die vierte Eigenschaft bestätigt man durch Ausrechnen, etwa n! (k + 1)n(n − 1)! n (k + 1) = (k + 1) = k+1 (k + 1)![n − (k + 1)]! (k + 1)k![(n − 1) − k]! (n − 1)! n−1 =n =n , k k![(n − 1) − k]! während man die fünfte folgendermaßen erhält: n! n! n n + + = k k−1 k!(n − k)! (k − 1)!(n − k − 1)! n! 1 1 (n + 1)! = + = (k − 1)!(n − k)! k n − k + 1 k!(n − k + 1)! n+1 = . k Definition 1.3.20. Für a ∈ Q und n ∈ N definieren wir die Potenzen an mit natürlichem Exponenten n iterativ durch a0 := 1 , ak+1 := a · ak für k ∈ N . ♦ Satz 1.3.21 (Binomische Lehrsatz). Für zwei beliebige Zahlen a, b ∈ Q und eine beliebige natürliche Zahl n ∈ N gilt n n n (a + b) = ∑ ak bn−k . k k=0 Beweis. Beweis kann durch vollständige Induktion geführt werden. Bemerkung 1.3.22. Satz 1.3.21 gilt natürlich auch für a, b ∈ R, wir führen R aber erst im folgenden Kapitel ein. 24 2 Die reellen Zahlen Von der Schule her sind die reellen Zahlen als Dezimalbrüche bekannt. Im folgenden stellen wir die charakterisierenden Eigenschaften der rationalen und der reellen Zahlen als Axiome des angeordneten Körpers auf. Im Unterschied zu den rationalen Zahlen fordern wir für die reellen Zahlen zusätzlich ein Vollständigkeitsaxiom. In einem späteren Exkurs deuten wir dann an, daß die reellen Zahlen tatsächlich mit den Mitteln der Mengenlehre aus den rationalen Zahlen konstruiert werden können. 2.1 Gemeinsame Eigenschaften der rationalen und der reellen Zahlen 2.1.1 Die Körperaxiome Definition 2.1.1. Ein Tripel (K, +, ·) mit einer Menge K und Abbildungen + : K × K → K und ·: K×K → K heißt Körper, wenn die folgenden 3 Gruppen von Axiomen erfüllt sind: 1. Addition Mit x + y := +(x, y) für x, y ∈ K gelten die folgenden Axiome: (A1 ) (A2 ) (A3 ) (A4 ) ∀x, y ∈ K(x + y = y + x) (Kommutativgesetz) ∀x, y, z ∈ K(x + (y + z) = (x + y) + z) (Assoziativgesetz) ∃=1 0 ∈ K∀x ∈ K(x + 0 = x) (Neutrales Element bzgl. Addition) ∀x ∈ K∃=1 − x ∈ K(x + (−x) = 0) (Inverses Element bzgl. Addition). (K, +) bildet also eine kommutative Gruppe. Die Abbildung + wird als Addition bezeichnet, x + y heißt Summe von x und y. 25 2 Die reellen Zahlen 2. Multiplikation Mit x · y := ·(x, y) für x, y ∈ K gelten die folgenden Axiome: (M1 ) (M2 ) (M3 ) (M4 ) ∀x, y ∈ K(x · y = y · x) (Kommutativgesetz) ∀x, y, z ∈ K(x · (y · z) = (x · y) · z) (Assoziativgesetz) ∃=1 1 ∈ K \ {0}∀x ∈ K(x · 1 = x) (Neutr. Element bzgl. Multiplikation) ∀x ∈ K \ {0}∃=1 x−1 ∈ K(x · x−1 = 1) (Inverses Element bzgl. Multiplikation). (K \ {0}, ·) bildet also ebenfalls eine kommutative Gruppe. Die Abbildung · wird als Multiplikation bezeichnet, x · y heißt Produkt von x und y. 3. Verknüpfung von Addition und Multiplikation Die Verknüpfung von Addition und Multiplikation unterliegt dem Axiom (AM) ∀x, y, z ∈ K (x · (y + z) = x · y + x · z) (Distributivgesetz). ♦ Aus Addition und Multiplikation kann man die Operationen Subtraktion − : K × K → K und Division ÷ : K × K6=0 → K ableiten: x − y := −(x, y) := x + (−y) für alle x, y ∈ K und x ÷ y := ÷(x, y) := x · y−1 für alle x ∈ K, y ∈ K6=0 . Die Elemente eines Körpers werden Zahlen genannt. Man kann zeigen und es sollte aus der Schule bekannt sein, daß (Q, +, ·) ein Körper ist. 2.1.2 Die Anordnungsaxiome Definition 2.1.2. Ein Quadrupel (K, +, ·, ≤) mit einer Menge K, Abbildungen + : K × K → K und ·: K×K → K und einer Ordungsrelation ≤⊂ K × K heißt total angeordneter Körper, wenn (K, +, ·) ein Körper bildet und zusätzlich die folgenden Axiome mit <⊂ K × K definiert durch x < y := x ≤ y ∧ x 6= y 26 2.2 Das Vollständigkeitsaxiom der reellen Zahlen erfüllt sind: (O1 ) ∀x, y ∈ K(x ≤ y ∨ y ≤ x) (totale Ordnung) (O2 ) (x, y ∈ K ∧ x < y) ⇒ ∃u ∈ K(x < u < y) (Dichte) (O3 ) ∀x, y, z ∈ K(x < y ⇔ x + z < y + z) (Verträglichkeit mit Addition) (O4 ) ∀x, y, z ∈ K(z > 0 ⇒ (x < y ⇔ x · z < y · z)) (Verträglichkeit mit Mult.) ♦ Die beiden letzten Eigenschaften charakterisieren die Verträglichkeit der Ordnungsrelation mit den algebraischen Operationen auf K. Ausgehend von der Ordnungsrelation ≤ und der Relation < werden die Relationen ≥, > für x, y ∈ K definiert durch x ≥ y :⇔ y ≤ x , x > y :⇔ y < x . Damit gilt die Trichotomie-Eigenschaft, daß für je zwei Zahlen x, y ∈ K genau eine der drei Beziehungen x < y, x = y, x > y gilt. Eine Zahl x ∈ K heißt positiv, nichtnegativ, nichtpositiv bzw. negativ, wenn x > 0, x ≥ 0, x ≤ 0 bzw. x < 0. Man kann zeigen, daß (Q, +, ·, ≤) ein total angeordneter Körper ist. Satz 2.1.3 (Archimedes, rational). Für alle x, y ∈ Q mit x > 0 existiert ein n ∈ N mit nx > y. Beweis. Seien x, y ∈ Q mit x > 0. Gilt y ≤ 0, so folgt x > y und wir können n = 1 wählen. Seien nun x und y positiv. Dann existieren p, q, r, s ∈ N>0 mit x = qp , y = rs . Sei n := rq + 1. Wegen rq n = rq + 1 > = y/x sp gilt nx > y. 2.2 Das Vollständigkeitsaxiom der reellen Zahlen 2.2.1 Schranken und Extrema Sei (K, +, ·, ≤) ein total angeordneter Körper. Definition 2.2.1. Sei M ⊆ K. Eine Zahl S ∈ K mit der Eigenschaft x ≤ S für ∀x ∈ M heißt obere Schranke der Menge M in K. Eine Zahl s ∈ K mit der Eigenschaft s ≤ x für ∀x ∈ M heißt untere Schranke der Menge M in K. Eine Menge M ⊆ K heißt von oben beschränkt, wenn eine obere Schranke für M existiert. Eine Menge M ⊆ K heißt von unten beschränkt, wenn eine untere Schranke für M existiert. Schließlich heißt eine Menge M ⊆ K beschränkt, wenn sie sowohl von oben als auch von unten beschränkt ist. ♦ 27 2 Die reellen Zahlen Eine Menge M ⊆ K ist folglich beschränkt, wenn es zwei Zahlen s, S ∈ K mit der Eigenschaft ∀x ∈ M(s ≤ x ≤ S) gibt. Besitzt eine Menge M eine obere Schranke, etwa S, dann ist jede Zahl S0 ≥ S ebenfalls eine obere Schranke von M. Analog ist jede Zahl s0 ≤ s eine untere Schranke von M, falls s eine solche ist. Eine beschränkte Menge besitzt also unendlich viele untere und obere Schranken. Beispiel 2.2.2. Die Menge aller rationalen Zahlen zwischen 0 und 1 ist beschränkt. Untere Schranken sind beispielsweise alle negativen rationalen Zahlen und 0. ♦ Beispiel 2.2.3. Die Menge der natürlichen Zahlen N ist von unten beschränkt aber, nach ♦ Satz 2.1.3, nicht von oben beschränkt in Q. Beispiel 2.2.4. Die Menge Z ist unbeschränkt in Q. ♦ Sei M eine nichtleere Menge aus K. Unter allen oberen Schranken von M ist die kleinste i.a. die wichtigste. Definition 2.2.5. Eine Zahl m ∈ K heißt Maximum von M in K, wenn m obere Schranke von M ist und m ∈ M. Eine Zahl S ∈ K heißt kleinste obere Schranke oder obere Grenze oder Supremum von M, wenn S eine obere Schranke von M ist und wenn keine obere Schranke S0 < S in K von M existiert. Das Maximum bzw. Supremum von M wird mit max M bzw. sup M bezeichnet. Analog definiert man das Minimum min M und die größte untere Schranke oder untere Grenze oder das Infimum inf M einer Menge M. ♦ Zur Rechtfertigung der Definition betrachten wir folgenden Satz: Satz 2.2.6. Wenn ein Supremum von M in K existiert, dann ist es eindeutig bestimmt. Beweis. Angenommen, S1 6= S2 sind zwei Suprema der Menge M in K. O.B.d.A. sei S1 < S2 . Dann ist S1 eine kleinere obere Schranke von M als S2 im Widerspruch zur Definition des Supremums. Satz 2.2.7. Wenn ein Maximum von M in K existiert, dann ist es gleich dem Supremum von M in K und daher auch eindeutig bestimmt. Beweis. Sei m ein Maximum von M in K. Damit ist m eine obere Schranke von M in K. Angenommen, m 6= sup M. Dann existiert eine obere Schranke S ∈ K von M mit S < m. Da m ∈ M folgt der Widerspruch m ≤ S. Satz 2.2.8. Die folgenden Aussagen sind äquivalent: 28 2.2 Das Vollständigkeitsaxiom der reellen Zahlen 1. S = sup M. 2. S ist obere Schranke von M und für alle S0 ∈ K mit S0 < S existiert ein x ∈ M mit S0 < x. 3. S ist obere Schranke von M und für alle ε ∈ K mit ε > 0 existiert ein x ∈ M mit S − ε < x. Beweis. 1. ⇒ 2.: Sei S = sup M und sei S0 < S. Nach Definition des Supremums ist S0 keine obere Schranke von M, das heißt es existiert ein x ∈ M mit x > S0 . 2. ⇒ 1. S ist obere Schranke und sei S0 ∈ K mit S0 < S beliebig. Dann existiert ein x ∈ M mit x > S0 . S0 ist also keine obere Schranke von M. Nach Definition ist S = sup M. 2. ⇔ 3.: Setze S0 = S − ε bzw. ε = S − S0 . Analoge Aussagen gelten für Minimum min M und Infimum inf M von M. Die Frage ist nun, ob max M und sup M überhaupt existieren und, wenn ja, für welche Mengen. 2.2.2 Existenz des Supremums und Definition der reellen Zahlen Beispiel 2.2.9. Sei K = Q und sei M = {x ∈ Q : x ≥ 0 ∧ x2 ≤ 2}. Dann ist 2 eine obere Schranke von M: Angenommen, 2 ist keine oberere Schranke von M. Dann gibt es ein x ∈ M mit x > 2. Dann gilt aber x · x > 2 · x > 2 · 2 = 4. Offensichtlich ist 0 untere Schranke von M. Daher gilt min M = inf M = 0. Angenommen, S ∈ Q ist Supremum von M. Dann gilt S ≤ 2. Da 1 ∈ M gilt S > 1. Angenommen, es gilt S2 > 2. Sei ε ∈ Q beliebig mit 0 < ε < alle x > S − ε gilt S2 −2 1+2S . Dann gilt ε < 1. Für x2 ≥(S − ε)2 = S2 − 2Sε + ε 2 > S2 − ε(2S + 1) >S2 − S2 + 2 = 2 . Damit gibt es kein x ∈ M mit x > S − ε. Nach Satz 2.2.8 kann S nicht das Supremum gewesen sein. Sei nun S2 < 2. Sei ε ∈ Q beliebig mit 0 < ε < 2−S2 1+2S . Dann gilt ε < 1 und (S + ε)2 = S2 + 2Sε + ε 2 < S2 + ε(2S + 1) < 2 , das heißt S + ε ∈ M im Widerspruch dazu, daß S = sup M und damit auch S + ε ≤ S gelten muß. Wenn M also ein Supremum S besitzt, muß S2 = 2 gelten. Dies erfüllt aber keine rationale Zahl. Somit besitzt M kein Supremum in Q. ♦ 29 2 Die reellen Zahlen Nach obigen Beispiel existieren also beschränkte Teilmengen von Q, die kein Supremum besitzen. Definition 2.2.10. Ein total angeordneter Körper (K, +, ·, ≤) heißt vollständiger, total angeordneter Körper, wenn er folgendem Vollständigkeits-Axiom genügt: (V) Jede nichtleere, von oben beschränkte Teilmenge von K besitzt ein Supremum in K. ♦ (Q, +, ·, ≤) ist also kein vollständiger, total angeordneter Körper. Definition 2.2.11. Unter einem Körper der reellen Zahlen (R, +, ·, ≤) verstehen wir einen vollständigen, total angeordneten Körper. ♦ Im Sinne der Axiomatik nehmen wir nun die Existenz eines solchen Körpers an. Später werden wir in einem Exkurs andeuten, wie man Modelle für reelle Zahlen tatsächlich konstruieren kann. Ein in der Schule verwendetes Modell der Darstellung reeller Zahlen ist die Verwendung von Dezimalbrüchen. Zu klärende Fragen wären aber: • Was für ein mathematisches Objekt ist eigentlich ein Dezimalbruch? • Sind sie eindeutig definiert? • Wie definiert man Addition, Multiplikation und Ordnungsrelation? Die Menge M in Beispiel 2.2.9 ist nichtleer und von oben beschränkt. Nach Axiom (V) besitzt sie also ein Supremum S ∈ R. Wie oben gezeigt, gilt S2 = 2. 2.2.3 Exkurs: R enthält Q In diesem Abschnitt wollen wir klären, ob R überhaupt die natürlichen Zahlen (und damit wegen den Körperaxiomen auch die ganzen und die rationalen Zahlen) enthält und in welchem Sinne R eindeutig bestimmt ist. Sei (R, +, ·, ≤) ein vollständiger, angeordneter Körper. Eine Menge M heißt induktiv, wenn 0 ∈ M und wenn mit x ∈ M auch x + 1 ∈ M ist. Offensichtlich ist R induktiv. Sei nun N := \ {M ⊆ R : M ist induktiv} . Dann ist N die kleinste induktive Teilmenge von R: Offensichtlich gilt 0 ∈ N. Wenn x ∈ N, dann ist x Element aller induktiven Teilmengen von R und somit auch x + 1. Also folgt aus x ∈ N auch x + 1 ∈ N. Damit ist N eine induktive Menge. Aufgrund der Durchschnittsbildung gibt es keine echte Teilmenge von N, die auch eine induktive Menge ist. 30 2.3 Folgerungen aus den Axiomen Da N die kleinste induktive Teilmenge von R ist, erfüllt N die Peano-Axiome mit ν(x) = x + 1. Zu zeigen bleibt dazu nur das Induktionsaxiom: Sei K eine Teilmenge von N mit 0 ∈ N und x + 1 ∈ N wenn x ∈ N. Dann ist K nach Definition eine induktive Teilmenge von R und damit gleich N. N ist damit eine Teilmenge von R, die als Menge der natürlichen Zahlen bezeichnet werden kann. Wegen N ⊂ R, folgt Q ⊂ R. Man kann zeigen, daß die reellen Zahlen als vollständiger, total angeordneter Körper in gewissen Sinne eindeutig definiert sind: Seien (R, +, ·, ≤) und (R0 , +0 , ·0 , ≤0 ) zwei solche Körper. Dann kann man zeigen, daß es eine Bijektion I (Isomorphismus genannt) von R auf R0 gibt, die mit der algebraischen Struktur und der Ordnungsstruktur der beiden Körper verträglich ist: Es gelten I(0) = 00 , I(1) = 10 und ∀x, y ∈ R : I(x + y) = I(x) +0 I(y) , I(xy) = I(x) ·0 I(y) , x ≤ y ⇒ I(x) ≤0 I(y) sowie die entspechenden Beziehungen für I −1 . In diesem Sinne können wir von den reellen (natürlichen, ganzen, rationalen) Zahlen sprechen. 2.3 Folgerungen aus den Axiomen 2.3.1 Beträge, Intervalle und spezielle Ungleichungen Ungleichungen Als Folgerung aus dem Vollständigkeitsaxiom (V) erhalten wir: Satz 2.3.1 (Archimedes). Zu r > 0 existiert eine natürliche Zahl mit n > r, das heißt, N ist nicht von oben beschränkt in R. Beweis. Angenommen, es existiert eine positive reelle Zahl r mit n ≤ r für alle n ∈ N. Dann ist N von oben beschränkt in R. Damit existiert S = sup N in R. Sei S0 = S − 21 . Dann muß ein n ∈ N existieren mit S0 < n, das heißt, S − 21 < n und daher S < n + 12 < n + 1 ∈ N im Widerspruch zur Supremums-Eigenschaft von S. Folgerung 2.3.2 (Eudoxos). Für jedes ε > 0 existiert ein m ∈ N>0 mit Beweis. Angenommen, es gibt ein ε > 0 mit alle m ∈ N im Widerspruch zu Satz 2.3.1. 1 m 1 m < ε. ≥ ε für alle m ∈ N>0 . Dann folgt 1 ε > m für 31 2 Die reellen Zahlen Lemma 2.3.3. Es gilt ∀a, b, c, d ∈ R (a < b ∧ c < d ⇒ a + c < b + d) . Beweis. Aus (O3 ) folgt a + c < b + c und b + c < b + d. Mit (O1 ) ergibt sich die Behauptung. Lemma 2.3.4 (Bernoulli). Für x ∈ R≥−1 und alle n ∈ N gilt (1 + x)n ≥ 1 + nx . (2.3.1) Beweis. Sei x ≥ −1. Für n = 0 gilt (1 + x)0 = 1 = 1 + 0x. Sei die Ungleichung (2.3.1) nun richtig für ein k ∈ N. Dann gilt (1 + x)k+1 = (1 + x)(1 + x)k ≥ (1 + x)(1 + kx) = 1 + (k + 1)x + kx2 ≥ 1 + (k + 1)x . Nach dem Induktionsprinzip gilt (2.3.1) damit für alle n ∈ N. Absolute Beträge Sei r ∈ R. Wir definieren |r| := r, falls r ≥ 0 , −r , falls r < 0 und nennen |r| den Betrag von r. Lemma 2.3.5. Für alle r, s,t ∈ R gelten: 1. |r| ≥ 0, |r| = 0 ⇔ r = 0 (positive Definitheit). 2. |r| = | − r|. 3. r ≤ |r|. 4. |rs| = |r| · |s| (Multiplikativität). 5. |r + s| ≤ |r| + |s| (Dreiecksungleichung). 6. | rs | = |r| |s| , wenn s 6= 0. 7. ||r| − |s|| ≤ |r − s|. 8. |r| < t ⇔ −t < r < t. 9. |r − s| < t ⇔ s − t < r < s + t. 32 2.3 Folgerungen aus den Axiomen Beweis. 1. trivial. −r , falls r ≤ 0 , −r , falls r < 0 , 2. | − r| = = = |r|. r, falls r > 0 r, falls r ≥ 0 3. und 4. ÜA mit Fallunterscheidung. 5. Aus 3. ergibt sich r ≤ |r| und s ≤ |s| und somit r + s ≤ |r| + |s| . Andererseits haben wir wegen 2. auch −r ≤ |r| und −s ≤ |s| und somit −(r + s) ≤ |r| + |s| . Nach Definition ist eine der beiden Zahlen r + s und −(r + s) gleich |r + s| und somit folgt die Behauptung. 6. Für s 6= 0 gilt wegen 4. |r| = |s · rs | = |s| · | rs | und daher | rs | = |r| |s| . 7. Wegen r = (r − s) + s folgt nach 5. |r| ≤ |r − s| + |s| und damit |r| − |s| ≤ |r − s| . Analog folgt aus 5. und s = (s − r) + r folgt nach 5. |s| ≤ |r − s| + |r| und damit |s| − |r| ≤ |r − s| . Somit folgt ||r| − |s|| ≤ |r − s| . 8. „⇒“ Aus |r| < t folgt −t < −|r| ≤ |r| < t. Da r = |r| oder r = −|r| folgt −t < r < t. „⇐“ Aus −t < r < t folgt −t < r und daher −r < t. Mit r < t folgt |r| < t. 9. ist triviale Folgerung aus 8. Intervalle Definition 2.3.6. Seien a, b ∈ R. Dann heißt • [a, b] := {x ∈ R : a ≤ x ≤ b} das abgeschlossene Intervall, • ]a, b[ := {x ∈ R : a < x < b} das offene Intervall, • ]a, b] := {x ∈ R : a < x ≤ b} das linksseitig halboffene Intervall, • [a, b[ := {x ∈ R : a ≤ x < b} das rechtsseitig halboffene Intervall mit den Endpunkten a und b. Wenn b ≥ a, dann heißt L := b−a die Länge des Intervalles.♦ 33 2 Die reellen Zahlen 2.3.2 Die Dichtheit der rationalen Zahlen in R Seien a, b ∈ K mit K ∈ {Q, R} und a < b . Dann gilt a+a < a+b < b+b und daher a< mit a+b 2 a+b <b 2 ∈ K. Damit haben wir: Lemma 2.3.7. Zwischen zwei verschiedenen reellen (rationalen) Zahlen liegt stets eine weitere reelle (rationale) Zahl. Die Frage ist nun, wie Q in R liegt. Lemma 2.3.8. Jede nichtleere Teilmenge M von N hat ein kleinstes Element. Beweis. Sei m ∈ M. Dann gibt es m + 1 natürliche Zahlen in N≤m und somit nur endlich viele natürliche Zahlen in M ∩ N≤m . Von diesen endlich vielen Zahlen ist eine die kleinste von M ∩ N≤m und damit auch von M. Satz 2.3.9. Die rationalen Zahlen Q liegen dicht in R, d.h., für alle r ∈ R und alle ε > 0 existiert ein q ∈ Q mit |q − r| < ε, d.h., r − ε < q < r + ε und q − ε < r < q + ε. Beweis. O.B.d.A. sei r ≥ 0. Nach Folgerung 2.3.2 existiert ein m ∈ N mit m > ε1 . Es genügt, q ∈ Q ∩ [r − m1 , r + m1 ] zu suchen. Nach Satz 2.3.1 existiert n ∈ N mit n > mr. Die Menge aller dieser natürlichen Zahlen m hat ein kleinstes Element n0 . Damit gilt n0 − 1 ≤ mr ≤ n0 . Setze nun q = nm0 . Dann gilt q − m1 ≤ r ≤ q und daher r ≤ q ≤ r + m1 . Weitere Aussagen zum Vergleich zwischen rationalen und reellen Zahlen werden später unter anderem in Abschnitt 3.6 (Abzählbarkeit und Überabzählbarkeit) getroffen. 2.4 Potenzen reeller Zahlen 2.4.1 Potenzen mit rationalen Exponenten Für a ∈ R und n ∈ N haben wir an schon definiert. Das Ziel besteht nun in der Definition von ab für a ∈ R>0 und b ∈ Q. Satz 2.4.1. Ist a ∈ R≥0 und n ∈ N>0 , so besitzt die Gleichung xn = a genau eine Lösung in R≥0 . 34 2.4 Potenzen reeller Zahlen Beweis. Durch vollständige Induktion zeigt man xm − ym = (x − y) · (xm−1 + xm−2 y + · · · + xym−2 + ym−1 ) . Damit gilt ∀x, y ∈ R≥0 ∀m ∈ N>0 : x<y xm < ym . ⇔ (2.4.1) Zeigen wir nun zuerst die Eindeutigkeit der Lösung. Dies ist wie häufig in der Mathematik der einfachere Teil: Angenommen, es existieren zwei verschiedene Lösungen x, y ∈ R≥0 der Gleichung. O.B.d.A. sei x < y. Dann erhalten wir den Widerspruch a = xn < yn = a zu (2.4.1). Nun zur Existenz der Lösung. Für n = 1 ist x = a Lösung. Sei nun n ∈ N>1 . Wir betrachten die Menge M = {y ∈ R : y ≥ 0 ∧ yn ≤ a} . Da 0 ∈ M, ist M nichtleer. Aus der Bernoulli-Ungleichung (2.3.1) folgt (1 + a)n > 1 + na > a ≥ yn . ∀y ∈ M : Nach (2.4.1) ist M damit von oben beschränkt. Nach Vollständigkeits-Axiom (V) existiert z := sup M . Wir zeigen nun zn = a. Angenommen, zn < a. Für beliebiges m ∈ N>0 gilt nach dem binomischen Lehrsatz 1.3.21 1 n 1 n 1 c n n n−1 =z + ∀m ∈ N>0 : z+ (2.4.2) z +···+ n ≤ zn + n m m 1 m m mit c := n 1 n−1 z +···+ n n . c c Wegen a − zn > 0 und c > 0, folgt a−z n > 0. Nach Satz 2.3.1 existiert ein k ∈ N mit k > a−zn . Daraus folgt zn + kc < a. Mit (2.4.2) folgt 1 z+ k n ≤ zn + c <a k und daher z + 1k ∈ M im Widerspruch zur Definition von z. Analog zeigt man, daß auch die Annahme zn > a zu einem Widerspruch führt. Also gilt zn = a. 1 Definition 2.4.2. Für a ∈ R≥0 und n ∈ N>0 definieren wir a n als die nichtnegative Lösung 1 der Gleichung xn = a und nennen a n n-te Wurzel von a. ♦ 35 2 Die reellen Zahlen Bezeichnungen: Folgende Bezeichnungen sind üblich: √ √ √ 1 n a := a n , a := 2 a . Definition 2.4.3. Für a ∈ R>0 und r = qp , p, q ∈ N>0 , definieren wir ar := √ q p a , a−r := √ −1 q p . a ♦ Bemerkung 2.4.4. 1. Man müßte die Definition rechtfertigen, nämlich zeigen, daß ar unabhängig von der Dartstellung von r = qp = st ist. √ 2. Die Aufgabe, n a zu definieren oder zu berechnen, ist streng zu unterscheiden von der Aufgabe, alle (reellen) Lösungen der Gleichung xn = a zu finden. Für a > 0 und gerades n √ √ ist n a die positive und − n a die negative Lösung von xn = a. √ n a nicht definiert. Jedoch kann xn = a reelle Lösungen besitzen. Für 3. Ist a < 0, so ist √ ungerades n ist − n −a Lösung von xn = a. √ √ n = a gilt stets für a ≥ 0. n an = a gilt n 4. Test zum Verständnis der Wurzeldefinition: ( a) p ♦ auch nur für a ≥ 0, denn zum Beispiel (−1)2 6= −1. 2.4.2 Exkurs: Potenzen mit reellem Exponenten und Logarithmen Das Ziel besteht nun in der Definition von ab für a ∈ R>0 und b ∈ R. Definition 2.4.5. Für a ∈ R>0 und b ∈ R definieren wir ( sup{ar : r ∈ Q≤b } für a ≥ 1 , b b −1 a := a−1 für a ∈ ]0, 1[ . ♦ Zu zeigen wären nun noch die Potenzgesetze: Satz 2.4.6. Für a, b ∈ R>0 und c, d ∈ R gilt: c d c+d a a =a , ac = ac−d , d a c c c a b = (ab) , ac a c = , bc b (ac )d = acd . Für alle b ∈ R>0 und für beliebige, fixierte Basis a ∈ R>0 \ {1} wollen wir nun auf ähnliche Weise eine Zahl x mit ax = b definieren. Sei a > 1. Da ax > ay für x > y, gibt es höchstens eine Lösung von ax = b. Wir zeigen, daß das Supremum der Menge M(a, b) = {x ∈ R : ax ≤ b} existiert und die gesuchte Lösung darstellt: Nach Satz von Archimedes 2.3.1 existiert ein n ∈ N mit b−1 − 1 ≤ n(a − 1) . 36 2.4 Potenzen reeller Zahlen Mit der Bernoulli-Ungleichung (2.3.1) folgt b−1 ≤ 1 + n(a − 1) ≤ an , d.h., a−n ≤ b . Damit ist M(a, b) nichtleer. Weiter existiert ein m ∈ N mit b ≤ 1 + m(a − 1) ≤ am . Da ar ≥ am für r ≥ m, ist m eine obere Schranke von M(a, b). Somit existiert S = sup M(a, b) für a > 1 und b > 0. Angenommen, es gilt aS > b. Dann ist aS b−1 > 1. Nach Satz von Archimedes 2.3.1 existiert ein n ∈ N mit a < n(aS b−1 − 1) . Mit der Bernoulli-Ungleichung (2.3.1) folgt a < (aS b−1 )n und damit 1 a n < aS b−1 . Somit existiert ein ε > 0 mit aε < aS b−1 . Für alle x ≥ S − ε folgt ax ≥ aS−ε = aS a−ε > aS a−S b = b . Damit kann S nicht das Supremum von M sein. Analog zeigt man, daß auch aS < b nicht gelten kann und somit aS = b sein muß. In ähnlicher Weise zeigt man, daß auch S = sup M(a, b) für a ∈ ]0, 1[ und b > 0 existiert und die Gleichung ax = b löst. Wir nennen sup M(a, b) den Logarithmus von b zur Basis a und schreiben loga b := sup M(a, b) . Damit gilt ∀a ∈ R>0 \ {1}∀b ∈ R>0 : b = aloga b . (2.4.3) Die Logarithmengesetze ergeben sich aus den Potenzgesetzen und (2.4.3): • Es existieren α, β ∈ R mit α = loga b, β = logb a. Damit gilt aα = b und bβ = a. Wegen (aα )β = aαβ , folgt αβ = 1, d.h. ∀a, b ∈ R>0 \ {1} : loga b · logb a = 1 . (2.4.4) 37 2 Die reellen Zahlen • Seien x, y ∈ R>0 und z = xy. Es existieren u = loga x, v = loga y, w = loga z und es gilt aw = z = xy = au av = au+v , so daß ∀a ∈ R>0 \ {1}∀x, y > 0 : loga (xy) = loga x + loga y (2.4.5) folgt. • Sei x ∈ R>0 , v ∈ R und u = loga x. Dann gilt xv = (au )v = auv , d.h. ∀a ∈ R>0 \ {1}∀x ∈ R>0 ∀v ∈ R : loga (xv ) = v loga x . (2.4.6) • Schließlich folgt die Umrechnungsformel ∀a, b ∈ R>0 \ {1}∀x ∈ R>0 : logb x = loga x · logb a (2.4.7) aus (2.4.3) und (2.4.6), da logb x = logb aloga x = loga x · logb a . 2.5 Die Symbole +∞ und −∞ In gewissen Situationen ist es sinnvoll, R um zwei Symbole −∞ und ∞ = +∞ zu ergänzen. Mit diesen Symbolen wird wie folgt gerechnet: 1. Für alle x ∈ R setzen wir −∞ < x , x < ∞, x+∞ = ∞, x − ∞ = −∞ , und ∞+x = ∞, −∞ + x = −∞ x x = = 0. ∞ −∞ 2. Für x > 0 wird gesetzt: x·∞ = ∞·x = ∞, x · (−∞) = (−∞)x = −∞ . 3. Für x < 0 wird gesetzt: x · ∞ = ∞ · x = −∞ , x · (−∞) = (−∞)x = ∞ . 4. Weiter setzt man: ∞+∞ = ∞, (−∞) + (−∞) = −∞ , (−∞) − ∞ = −∞ , ∞ − (−∞) = ∞ und ∞·∞ = ∞, (−∞) · (−∞) = ∞ , (−∞) · ∞ = −∞ , ∞ · (−∞) = −∞ . R ∪ {−∞, ∞} kann nicht unter Erhaltung der Körperaxiome von (R, +, ·) zu einem Körper fortgesetzt werden: Wenn (R ∪ {−∞, ∞}, +, ·) ein Körper wäre, würde zum Beispiel aus ∞ + ∞ = ∞ die Gleichung 2 = 1 folgen. Schließlich setzen wir inf 0/ := +∞ 38 und sup 0/ := −∞ . 2.6 Komplexe Zahlen 2.6 Komplexe Zahlen Wir betrachten die Menge R2 = R × R der Paare reeller Zahlen. Wir definieren in R2 eine Addition + in natürlicherweise durch (a, b) + (c, d) := (a + c, b + d) für a, b, c, d ∈ R . (2.6.1) Offensichtlich erfüllt diese Addition die Eigenschaften (A1 ) bis (A4 ) mit dem additiv-neutralen Element (0, 0) und dem zu (a, b) additiv-inversen Element (−a, −b). Weiter definieren wir (a, b) · (c, d) = (ac − bd, ad + bc) . (2.6.2) Leicht sieht man (M1 ), (M2 ). Die Gleichung (a, b)(x, y) = (1, 0) hat für (a, b) ∈ R2 mit (a, b) 6= (0, 0) die einzige Lösung a −b −1 (x, y) = (a, b) = , a2 + b2 a2 + b2 für (a, b) 6= 0 . Damit ist (R2 , +, ·) mit der durch (2.6.1) definierten Addition und der durch (2.6.2) definierten Multiplikation ein Zahlenkörper. Insbesondere haben wir ac + bd ad − bc , für (a, b) 6= 0 . (2.6.3) (c, d) : (a, b) = a2 + b2 a2 + b2 Definition 2.6.1. Der Zahlenkörper (R2 , +, ·) mit der durch (2.6.1) definierten Addition und der durch (2.6.2) definierten Multiplikation heißt Körper der komplexen Zahlen und wird mit C bezeichnet. ♦ 2.7 Reelle und komplexe Funktionen 2.7.1 Grundbegriffe Abbildungen f : D( f ) ⊆ Kn1 → Km 2 mit Ki ∈ {R, C} werden auch als Funktionen bezeichnet. Spezialfälle: m = n = 1 Reell- bzw. komplexwertige Funktion einer reellen bzw. komplexen Variablen. Beispiel: f : R → R mit f (x) = x2 + 3x + 1. m > 1, n = 1 Vektorfunktion einer reellen bzw. komplexen Variablen. Beispiel: f : D( f ) ⊆ r cost 2 R → R mit D( f ) = [0, 2π[ und f (t) = mit fixiertem r > 0 ergibt Kreislinie. r sint m = 1, n > 1 Reell- bzw. komplexwertige Funktion von n reellen bzw. komplexen Variablen. m > 1, n > 1 Vektorfunktion von n reellen bzw. komplexen Variablen. 39 2 Die reellen Zahlen Darstellung von Funktionen: Explizit (durch eine Formel oder Vorschrift): √ 4 − x auf D( f ) = R≥4 mit W ( f ) = R≥0 . x x≥0 • f (x) = auf D( f ) = R mit W ( f ) = R≥0 . 2 + sin x x < 0 −x x≥0 • f (x) = auf D( f ) = R mit W ( f ) = R≤0 ∪ [1, 3]. 2 + sin x x < 0 • f (x) = Implizit: x2 + y2 = 1. Wo kann y als Funktion von x dargestellt werden? 2.7.2 Operationen unter reellen und komplexen Funktionen Basierend auf den algebraischen und ordnungstheoretischen Eigenschaften der reellen Zahlen kann man gewisse Operationen mit reellen Funktionen ausführen. Seien f und g reelle Funktionen mit Definitionsbereichen D( f ) bzw. D(g). Man setzt D( f ± g) = D( f g) = D( f ∨ g) = D( f ∧ g) := D( f ) ∩ D(g) , sowie 1 D( ) := {x ∈ D( f ) : f (x) 6= 0} , f g 1 D( ) := D(g) ∩ D( ) f f und definiert die Funktionen f ± g, f g, f ∨ g, f ∧ g, | f |, 1f , ( f ± g)(x) := f (x) + g(x) ( f g)(x) := f (x)g(x) (λ f )(x) := λ f (x) ( f ∨ g)(x) := max{ f (x), g(x)} ( f ∧ g)(x) := min{ f (x), g(x)} | f |(x) := | f (x)| 1 ( 1f )(x) := f (x) ( gf )(x) := g(x) f (x) D(| f |) = D(λ f ) := D( f ) f g wie folgt: für x ∈ D( f ± g) für x ∈ D( f g) für x ∈ D(λ f ) für x ∈ D( f ∨ g) für x ∈ D( f ∧ g) für x ∈ D( f ) für x ∈ D( 1f ) Summe bzw. Differenz, Produkt, Vielfaches, Maximum, Minimum, Betrag, für x ∈ D( gf ) Quotient. Für beliebige reelle λ1 , . . . , λN und reelle Funktionen f1 , . . . , fN nennt man die Funktion λ1 f1 + · · · + λN fN Linearkombination der Funktionen f1 , . . . , fN . Bemerken wir noch, daß diese Operationen mit Ausnahme von Maximum und Minimum auch für komplexe Funktionen und λ ∈ C Sinn haben. 40 2.7 Reelle und komplexe Funktionen 2.7.3 Spezielle Funktionen Definition 2.7.1. Eine Abbildung p : K → K mit p(x) = an xn + · · · + a1 x + a0 und ai ∈ K bei K ∈ {R, C} heißt reelles bzw. komplexes Polynom. Gilt an 6= 0, so heißt degp = n der Grad des Polynoms. ♦ M i i Zwei Polynome p und q mit p(x) = ∑N i=1 ai x , q(x) = ∑i=1 bi x sind gleich, wenn degp = degq und ai = bi für i = 0, . . . , degp = degq. Addition, Multiplikation mit einer Zahl, Produkt und Division werden wie üblich definiert. Dabei gilt deg(p + q) ≤ max{degp, degq}, deg(pq) = degp + degq. Definition 2.7.2. Eine Funktion R : D(R) ⊆ K → K heißt gebrochen-rationale Funktion, p(x) wenn Polynome p und q existieren mit R(x) = q(x) für alle x ∈ D(R). R heißt echt (unecht) gebrochen, falls degp < degq (degp ≥ degq). ♦ In 2.4 haben wir für alle a > 0 und alle b ∈ R die Potenzen ab eingeführt. Daraus erhält man zwei Klassen von Funktionen: Fixieren des Exponenten: Sei b ∈ R fixiert. Dann kann man jedem x ∈ ]0, ∞[ die Potenz xb zuordnen. Die so entstehende Funktion potb : R>0 → R>0 nennt man Potenzfunktion mit Exponent b. Fixieren der Basis: Sei a ∈ ]0, ∞[ fixiert. Dann kann man jedem x ∈ R die Potenz ax zuordnen. Die so entstehende Funktion expa : R → R>0 nennt man Exponentialfunktion zur Basis a. Es gilt: D(potb ) = R>0 , W (potb ) = und D(expa ) = R , W (expa ) = R>0 , für b 6= 0 , {1} , für b = 0 . R>0 , für a 6= 1 , {1} , für a = 1 . Aus den Potenzgesetzen in R ergeben sich die folgenden Eigenschaften: ∀x, y ∈ D(potb ) = R>0 : potb (x) · potb (y) = xb yb = (xy)b = potb (xy) und ∀s,t ∈ D(expa ) = R : expa (t + s) = at+s = at as = expa (t) expa (s) . Für positive x und fixierte Basis a ∈ ]0, ∞[ \{1} haben wir in 2.4 den Logarithmus von x zur Basis a eingeführt. Dies führt zur Logarithmusfunktion loga mit D(loga ) = R>0 . Aus den Logarithmengesetzen ergibt sich ∀x, y ∈ D(loga ) = R>0 : loga (xy) = loga (x) + loga (y) . 41 2 Die reellen Zahlen Bemerkung 2.7.3. 1. expa (x) und expa x bzw. loga (x) und loga x werden gleichberechtigt verwendet. 2. Anstelle von potb bzw. expa wird meist (nicht korrekt) xb bzw. ax geschrieben. 3. Für a = e setzt man exp := expe und ln := loge und nennt ln den natürlichen Logarithmus. ♦ Als spezielle Linearkombinationen von Exponentialfunktionen erhält man die Hyperbelfunktionen 1 cosh : R → R mit cosh(x) = ex + e−x 2 mit W (cosh) = [1, ∞[, genannt Hyperbelcosinus oder Cosinus hyperbolicus, und sinh : R → R mit sinh(x) = 1 x e − e−x 2 mit W (sinh) = R, genannt Hyperbelsinus oder Sinus hyperbolicus. Weitere „elementare“ Funktionen sind die trigonometrischen Funktion sin, cos und daraus abgeleitete Funktionen (wie z.B. tan). Diese werden erst später über Potenzreihen oder als Lösung einer speziellen Differentialgleichung (Schwingungsgleichung) definiert. 42 3 Grenzwerttheorie 3.1 Metrische und normierte Räume 3.1.1 Der metrische Raum In der Analysis hat man häufig die folgende Situation: Sei x0 ein fixierter Punkt in einer Menge X. Man benötigt Punkte x, die in der „Nähe“ oder „Umgebung“ von x0 liegen. Eventuell muß man sogar den Abstand zwischen zwei Punkten zahlenmäßig angeben. In der Menge X benötigt man dazu eine gewisse Struktur, die die Entfernung zweier beliebiger Punkte x, y ∈ X angeben kann. Eine Menge mit einer zusätzlichen Struktur wird in der Mathematik Raum genannt. Definition 3.1.1. Sei X eine Menge und ρ : X × X → R eine Funktion. Die Funktion ρ heißt Metrik auf X, wenn die folgenden drei Bedingungen erfüllt sind: (M1 ) ∀x, y ∈ X : ρ(x, y) ≥ 0 ∧ (ρ(x, y) = 0 ⇔ x = y) (pos. Definitheit), (M2 ) ∀x, y ∈ X : ρ(x, y) = ρ(y, x) (Symmetrie), (M3 ) ∀x, y, z ∈ X : ρ(x, y) ≤ ρ(x, z) + ρ(z, y) (Dreiecksungleichung). Ist ρ Metrik auf X und sind x, y ∈ X, so heißt ρ(x, y) Entfernung oder Abstand von x zu y. Das Paar (X, ρ) heißt metrischer Raum. ♦ Beispiel 3.1.2. Sei X eine Menge mit mindestens zwei Elementen. Die Funktion ρ mit ρ(x, y) = 0, falls x = y, und ρ(x, y) = 1, falls x 6= y, ist eine Metrik auf X. ♦ Beispiel 3.1.3. X = R1 , ρ(x, y) = |x − y|. Beispiel 3.1.4. X = C, ρ(z, w) = |z − w| = ♦ p (ℜ(z − w))2 + (ℑ(z − w))2 . ♦ 3.1.2 Der euklidische Raum Sei n ∈ N>0 . Wir betrachten die Menge X = Rn = Xni=1 R 43 3 Grenzwerttheorie der reellen n-Tupel. In X definiert man die Addition von Elementen x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) und die Multiplikation mit einem Skalar λ ∈ R durch x + y = (x1 + y1 , . . . , xn + yn ) und λ x = (λ x1 , . . . , λ xn ) . In der linearen Algebra wird gezeigt, daß der Rn mit diesen Operationen zu einem Vektorraum (Rn , +, ·) oder linearen Raum (über den Körper R) wird. Spezielle Vektoren sind der Nullvektor 0 = (0, . . . , 0) und der i-te Einheitsvektor ei = (0, . . . , 0, 1, 0, . . . , 0), bei dem genau an der i-ten Stelle eine 1 steht. Ist dann x = (x1 , . . . , xn ) ein Vektor aus Rn , so kann man ihn als x = x1 e1 + x2 e2 + . . . + xn en darstellen. {e1 , . . . , en } heißt dann eine Basis von x und x1 , . . . , xn heißen die Koordinaten von x. Jedem Vektor x ∈ Rn ordnet man eine Zahl q 2 kxk = (x1 ) + · · · + (xn )2 (3.1.1) zu, die wir Länge des Vektors x nennen wollen. Bemerken wir nun einige wichtige Eigenschaften der Länge: (L1 ) ∀x ∈ Rn : kxk ≥ 0 ∧ (kxk = 0 ⇔ x = 0). (L2 ) ∀x ∈ Rn ∀λ ∈ R : kλ xk = |λ | · kxk. (L3 ) ∀x, y ∈ Rn : kx + yk ≤ kxk + kyk. (L1 ) und (L2 ) sind offensichtlich. Wir wollen (L3 ) zeigen. Zu diesem Zweck beweisen wir zwei Ungleichungen: !2 ! ! m ∀ai , bi ∈ R : m ∑ aibi i=1 und s ∀ai , bi ∈ R : m m ∑ a2i ≤ ∑ b2i i=1 ∑ (ai + bi) 2 s ≤ i=1 (3.1.2) i=1 s m m ∑ a2i + ∑ b2i . i=1 (3.1.3) i=1 Zu (3.1.2). Sei m m i=1 i=1 φ (λ ) = ∑ (ai λ + bi )2 = λ 2 ∑ a2i +2λ | {z } A m m ∑ aibi + ∑ b2i . |i=1{z } i=1 | {z } B C Dann ist φ (λ ) nichtnegativ für alle λ ∈ R. Der Ausdruck Aλ 2 + 2Bλ +C mit A ≥ 0 ist aber genau dann für alle λ ∈ R nichtnegativ, wenn die Diskriminante B2 − AC nichtpositiv ist. Damit folgt (3.1.2). 44 3.1 Metrische und normierte Räume Zu (3.1.3). Wegen (3.1.2) gilt m m m m i=1 i=1 i=1 m s ∑ (ai + bi)2 = ∑ a2i + 2 ∑ aibi + ∑ b2i ≤ ∑ a2i + 2 i=1 s = m ∑ a2i s i=1 ∑ a2i + i=1 i=1 m s m m m i=1 !2 i=1 ∑ b2i + ∑ b2i ∑ b2i . i=1 Damit haben wir q q q 1 1 2 n n 2 1 2 n 2 (x + y ) + · · · + (x + y ) ≤ (x ) + · · · + (x ) + (y1 )2 + · · · + (yn )2 , d.h., kx + yk ≤ kxk + kyk für alle x, y ∈ Rn . Der Vektorraum (Rn , +, ·) ausgestattet mit der Länge k · k definiert durch (3.1.1) heißt euklidischer Raum. Im euklidischen Raum können wir eine Metrik ρ durch ρ(x, y) := kx − yk für alle x, y ∈ Rn definieren. Diese Metrik heißt euklidische Metrik, der Abstand heißt euklidischer Abstand. 3.1.3 Der normierte Raum Den Begriff des euklidischen Räumen können wir zum Begriff des normierten Raumes verallgemeinern: Definition 3.1.5. Sei X ein linearer Raum (d.h. Vektorraum) und k · k : X → R eine Abbildung mit den folgenden Eigenschaften (N1 ) ∀x ∈ X : kxk ≥ 0 ∧ (kxk = 0 ⇔ x = 0), (N2 ) ∀x ∈ X ∀λ ∈ R : kλ xk = |λ | · kxk, (N3 ) ∀x, y ∈ X : kx + yk ≤ kxk + kyk. Dann heißt k · k Norm auf X und (X, k · k) heißt normierter Raum. ♦ Jeder euklidische Raum ist also ein normierter Raum, die Länge ist eine Norm, dann auch euklidische Norm genannt. In jedem normiertem Raum (X, k · k) kann eine Metrik ρ durch ρ(x, y) := kx − yk für alle x, y ∈ X 45 3 Grenzwerttheorie eingeführt werden. Durch | · | p , | · |∞ : Rn × Rn → R, p ≥ 1, mit s n |x| p = p ∑ (xi) p , i=1 |x|∞ = max |xi | i∈{1,...,n} sind weitere Normen in Rn gegeben. | · |2 ist die bekannte euklidische Norm. 3.1.4 Umgebungen Im folgenden sei (X, ρ) stets ein metrischer Raum. Sei x0 ∈ X und r ≥ 0. Wir bezeichnen mit B(x0 , r) := {x ∈ X : ρ(x, x0 ) < r} bzw. B̄(x0 , r) := {x ∈ X : ρ(x, x0 ) ≤ r} die offene bzw. abgeschlossene Kugel mit Zentrum x0 und Radius r. Definition 3.1.6. Eine Teilmenge U ⊆ X heißt Umgebung des Punktes x0 ∈ X, wenn ein r > 0 existiert mit B(x0 , r) ⊆ U. ♦ p Zum Beispiel sei X = R2 , ρ(x, y) = (x1 − y1 )2 + (x2 − y2 )2 , x0 = (0, 0). Dann ist U = {x : |xi | ≤ 12 } eine Umgebung von x0 und x1 = ( 13 , − 13 ). Definition 3.1.7. Sei A ⊆ X, x0 ∈ A. a) x0 heißt innerer Punkt von A, wenn x0 mit einer ganzen Umgebung zu A gehört, d.h., es existiert eine Umgebung U von x0 mit U ⊆ A. b) Die Menge A heißt offen, wenn sie nur aus inneren Punkt besteht. ♦ Beispiel 3.1.8. 1. Jede offene Kugel (in einem metrischen Raum) ist eine offene Menge. 2. X = R, x0 ∈ R, ε > 0. Dann B(x0 , ε) = {x ∈ R : |x − x0 | < ε} = ]x0 − ε, x0 + ε[ . 3. a, b ∈ R. ]a, b[ ist offene Menge, sogar offene Kugel: a+b b−a ]a, b[ = B , , wenn b > a . 2 2 4. a, b ∈ R. [a, b] ist abgeschlossene Kugel: a+b b−a [a, b] = B , , 2 2 wenn b > a . 5. Die leere Menge ist offen. 6. X selbst ist offen. 46 ♦ 3.2 Folgen und Grenzwerte von Folgen 3.2 Folgen und Grenzwerte von Folgen 3.2.1 Folgen Definition 3.2.1. Sei X eine Menge und sei M ⊆ N. Eine Abbildung x : M → X heißt Folge (von Elementen) in X. ♦ Bezeichnung: x, (xn )n∈M , (xn )∞ n=0 (wenn M = N) oder (xn ). ♦ Beispiel 3.2.2. 1. X = R, (xn )n∈N>0 (−1)n = 2+ n n∈N>0 2. X = C, (zn )n∈N>0 = 1 + n1 i n∈N . >0 3. X = R3 , (xn )n∈N>0 = (n, n12 , n1 ) . n∈N>0 . 4. X als Menge aller Polynome auf [0, 1], (xn )n∈N = (potn )n∈N = (t 7→ t n )n∈N . Bemerkung 3.2.3. Sei M ⊆ N unbeschränkt. Wir definieren m : N → M iterativ durch m(0) = min M, m(n + 1) = min M>m(n) . Dann ist m eine streng monoton wachsende, bijektive Abbildung von N auf M. Ist x = (xn )n∈M eine Folge in X, so ist y = x ◦m = (xmn )n∈N , d.h., yn = xmn für n ∈ N, eine (umnummerierte) Folge mit Indexmenge N. Ohne Beschränkung der Allgemeinheit bräuchte man damit nur Folgen mit Indexmenge N betrachten. ♦ 3.2.2 Grenzwerte Sei (X, ρ) ein metrischer Raum, M ⊆ N unbeschränkt und (xn )n∈M eine Folge in X. Definition 3.2.4. Der Punkt a ∈ X heißt Grenzwert der Folge (xn )n∈M , wenn für jede Umgebung U von a eine Zahl N ∈ M existiert, so daß xn ∈ U für alle n ∈ M≥N : ∀ Umg. U von a ∃N ∈ M∀n ∈ M≥N : xn ∈ U . Man sagt dann auch, daß die Folge (xn )n∈M gegen a konvergiert. Eine Folge heißt divergent, wenn sie nicht konvergiert. ♦ n→∞ Bezeichnung: a = lim x, a = limn→∞ xn , xn −→ a, xn → a für n → ∞, manchmal limn→∞ xn = x∞ . Bemerkung 3.2.5. a = lim x ist äquivalent zu: ∀ε > 0∃N ∈ N∀n ∈ M≥N : xn ∈ B(a, ε) . ♦ 47 3 Grenzwerttheorie Warnung! Definition 3.2.4 bedeutet nicht (nur), daß in jeder beliebigen Umgebung von a unendlich viele Glieder der Folge liegen, sondern Definition 3.2.4 besagt: Alle (bis auf endlich viele) Glieder der Folge (xn )n∈M liegen in U. n→∞ n→∞ Satz 3.2.6 (Eindeutigkeit des Grenzwertes). Wenn xn −→ a und xn −→ b, dann a = b. Beweis. Indirekt. Angenommen, es gilt a 6= b. Dann gilt ε := ρ(a, b) > 0. Die Kugeln Ka = B(a, ε3 ) und Kb = B(b, ε3 ) sind Umgebungen von a bzw. b. Damit existieren Na und Nb mit ∀n ∈ M≥Na : xn ∈ Ka und ∀n ∈ M≥Nb : xn ∈ Kb . Sei N = max{Na , Nb }. Für n ∈ M≥N erhalten wir den Widerspruch 0 < ε = ρ(a, b) ≤ ρ(a, xn ) + ρ(xn , b) < ε ε + <ε. 3 3 Satz 3.2.7. Der Punkt a ∈ X ist genau dann Grenzwert der Folge (xn )n∈M , wenn der Abstand ρ(xn , a) in R gegen 0 konvergiert: a = lim x ⇔ lim ρ(xn , a) = 0 . n→∞ Beweis. ÜA. 3.2.3 Beschränkte Mengen Definition 3.2.8. Eine Teilmenge A eines metrischen Raumes (X, ρ) heißt beschränkt, wenn es eine Kugel gibt, die A enthält: ∃x0 ∈ X∃r > 0 : A ⊆ B(x0 , r) . ♦ Satz 3.2.9. Sei (X, ρ) ein metrischer Raum und sei (xn )n∈M eine konvergente Folge in X. Dann ist {xn : n ∈ M} eine beschränkte Menge. Beweis. Zu zeigen ist die Existenz einer Kugel K in X mit xn ∈ K für alle n ∈ M. Aus der Konvergenz folgt die Existenz des Grenzwertes x∞ . Es existiert ein N mit xn ∈ B(x∞ , 1) für alle n ∈ M≥N . Sei r = 1 + max{ρ(xn , x∞ ) : n ∈ M<N } . Dann xn ∈ B(x∞ , r) für alle n ∈ M. Ist {xn : n ∈ M} eine beschränkte Menge, so nennen wir (xn )n∈M eine beschränkte Folge. 48 3.2 Folgen und Grenzwerte von Folgen 3.2.4 Teilfolgen Definition 3.2.10. Sei x = (xn )n∈M ein Folge in einem metrischen Raum (X, ρ). Sei n = (nk )k∈N eine streng monoton wachsende Folge von Zahlen aus M, d.h., nk+1 > nk für k ∈ N. Dann heißt x ◦ n = (xnk )k∈N ♦ Teilfolge von x. Selbstverständlich gibt es viele Möglichkeiten, aus einer gegebenen Folge Teilfolgen auszuwählen. Satz 3.2.11. Sei (xn )n∈M eine konvergente Folge im metrischen Raum (X, ρ) mit Grenzwert x∞ . Dann ist jede ihrer Teilfolgen konvergent mit dem Grenzwert x∞ . Beweis. Sei (xnk )k∈N beliebige Teilfolge von (xn )n∈M . Sei ε > 0 beliebig. Dann existiert ein N ∈ M mit xn ∈ B(x∞ , ε) für alle n ∈ M≥N . Da {nk : k ∈ N} nicht von oben beschränkt ist, existiert ein K ∈ N mit nk ≥ N für alle k ≥ K. Damit xnk ∈ B(x∞ , ε) für alle k ≥ K. Bemerkung 3.2.12. Die Konvergenz der Ausgangsfolge ist wesentlich. Für divergente Folgen ist alles möglich: Sei X = R, (xn )n∈N = ((−1)n )n∈N . (x5n )n∈N ist divergent, (x2n )n∈N ist konvergent gegen 1 und (x2n+1 )n∈N ist konvergent gegen −1. Die Folge (xn )n∈N = n2 n∈N besitzt keine konvergenten Teilfolgen. ♦ 3.2.5 Zahlenfolgen Zahlenfolgen sind Folgen in X = R oder X = C. Beispiel 3.2.13. Sei X = R. 1. Sei xn = n1 für n ∈ N>0 . Vermutung xn → 0 für n → ∞. Sei dazu ε > 0 beliebig. Wir haben |xn −0| < ε für alle n ab einem geeigneten N zu zeigen. Wegen |xn −0| = |xn | = 1 1 n benötigen wir N ∈ N mit n > ε für n ≥ N. Wir können daher N ∈ N> 1 wählen. ε n 2. Sei xn = 2 + (−1) n für n ∈ N>0 . Vermutung xn → 2 für n → ∞. Sei dazu ε > 0 beliebig. Zu zeigen ist die Existenz eines N ∈ N>0 mit |xn − 2| < ε für n ≥ N. Damit ist ein N ∈ N zu finden mit |xn − 2| = 1n < ε für alle n ≥ N. Wähle N ∈ N> 1 . ε 3. Sei xn = (−1)n . Die Folge ist divergent. ♦ 49 3 Grenzwerttheorie 3.3 Eigenschaften des Grenzwertes 3.3.1 Reelle Folgen Sei X = R. Lemma 3.3.1. Sei (xn )n∈N eine konvergente Folge in R mit Grenzwert x∞ . 1. Sei p < x∞ . Dann existiert ein N ∈ N mit xn > p für n ≥ N. 2. Sei q > x∞ . Dann existiert ein N ∈ N mit xn < q für n ≥ N. Beweis. Setze ε = x∞ − p. Dann ε > 0 und es existiert ein N ∈ N mit x∞ − ε = p < xn < x∞ + ε. Analog wird die zweite Aussage bewiesen. Folgerung 3.3.2. Falls x∞ > 0, dann sind alle Folgenglieder (bis auf endlich viele) positiv. Lemma 3.3.3 (Grenzübergang in Ungleichungen). Seien (xn )n∈N und (yn )n∈N konvergente Folgen in R mit Grenzwert x∞ bzw. y∞ . Existiert ein N ∈ N mit xn ≤ yn für n ≥ N, dann gilt x∞ ≤ y∞ . ∞ Beweis. Indirekt. Angenommen, es gilt x∞ > y∞ . Sei p = q = x∞ +y 2 . Wenden wir die erste Aussage von Lemma 3.3.1 auf (xn )n∈N und die zweite Aussage auf (yn )n∈N an, erhalten wir die Existenz eines N ∈ N mit yn < q = p < xn für alle n ≥ N. Dies steht in Widerspruch zur Voraussetzung. Bemerkung 3.3.4. Selbst wenn ab einer Stelle N die strenge Ungleichung xn < yn gilt, kann 1 man lediglich x∞ ≤ y∞ folgern: Wähle z.B. xn = 0, yn = n+1 . ♦ Satz 3.3.5 (Prinzip der zwei Milizionäre). Seien Folgen (xn )n∈N , (yn )n∈N und (zn )n∈N in R gegeben. Es gelte a) (xn )n∈N und (zn )n∈N konvergieren gegen a. b) Es existiert ein N0 mit xn ≤ yn ≤ zn für alle n ≥ N0 . Dann konvergiert auch (yn )n∈N gegen a. Beweis. Sei ε > 0 beliebig. Es existiert ein N ∈ N≥N0 mit a − ε < xn < a + ε und a − ε < zn < a + ε für n ≥ N. Damit gilt a − ε < xn ≤ yn ≤ zn < a + ε für alle n ≥ N, d.h., wir haben |yn − a| < ε für n ≥ N. Folgerung 3.3.6. Sei 0 ≤ yn ≤ zn und zn → 0. Dann yn → 0. 50 3.3 Eigenschaften des Grenzwertes Definition 3.3.7. Sei (xn )n∈N eine Folge in R. Gilt ∀K > 0∃N ∈ N∀n ≥ N : xn ≥ K , so nennt man die Folge divergent gegen +∞ oder (uneigentlich) konvergent gegen +∞. Gilt ∀K > 0∃N ∈ N∀n ≥ N : xn ≤ −K , so nennt man die Folge divergent gegen −∞ oder (uneigentlich) konvergent gegen −∞. ♦ In beiden Fällen heißt x bestimmt divergent. Bemerkung 3.3.8. Satz 3.2.11, Lemma 3.3.3 und Lemma 3.3.5 gelten auch für lim xn = a mit a = +∞ oder a = −∞. ♦ 3.3.2 Folgen in R p Lemma 3.3.9. Sei x = (x1 , . . . , x p ) ∈ R p . Dann gilt ∀i ∈ {1, . . . , p} : |xi | ≤ kxk ≤ |x1 | + · · · + |x p | . Beweis. Es gilt xi 2 p kxk2 = p ≤ ∑k=1 xk 2 ∑ xk ≤ k=1 2 p und somit |xi | ≤ kxk. Weiter gilt 2 ∑ xk + 2 k=1 p ∑ 2 |xk | · |xl | = |x1 | + · · · + |x p | . k=1,l<k Satz 3.3.10. Für die Konvergenz einer Folge (xn )n∈N in R p zu einem Punkt x∞ ist hinreii für jedes i ∈ {1, . . . , p}. chend und notwendig, daß xni → x∞ Beweis. Notwendigkeit. Sei xn → x∞ . Sei i ∈ {1, . . . , p} beliebig. Dann gilt i |xni − x∞ | ≤ kxn − x∞ k . i | → 0 mit Satz 3.3.5, d.h., (xi ) Wegen kxn − x∞ k → 0 folgt |xni − x∞ n n∈N konvergiert. i konvergieHinlänglichkeit. Für alle i ∈ {1, . . . , p} mögen jetzt die Folgen (xni )n∈N gegen x∞ ren. Sei ε > 0. Dann existiert ein N ∈ N mit ∀i ∈ {1, . . . , p}∀n ≥ N : i |xni − x∞ |< ε . p Damit gilt 1 kxn − x∞ k ≤ |xn1 − x∞ | + · · · + |xnp − x∞p | < ε für n ≥ N. 51 3 Grenzwerttheorie 3.3.3 Rechnen mit konvergenten Zahlenfolgen Satz 3.3.11. Sei X ∈ {R, C} und es seien x = (xn )n∈N und y = (yn )n∈N konvergente Folgen in X. Dann gilt: 1. lim(λ x) = λ lim x für λ ∈ X. 2. lim(x + y) = lim x + lim y. 3. lim(xy) = lim x · lim y. 4. Falls lim y 6= 0, dann lim xy = lim x lim y . Wir wollen nur 4. beweisen. Dazu benötigen wir das folgende Lemma: Lemma 3.3.12. Wenn lim y 6= 0, dann ist { |y1n | : n ∈ N ∧ yn 6= 0} beschränkt. Beweis. Sei y∞ = lim y. Aus y∞ 6= 0 folgt |y2∞ | = ε > 0. Damit existiert ein N ∈ N mit yn ∈ B(y∞ , ε) für n ≥ N, also |yn − y∞ | < |y2∞ | für n ≥ N. Damit gilt yn ∈ ]y∞ − |y2∞ | , y∞ + |y2∞ | [, d.h., |yn | ≥ |y2∞ | und deswegen |y1n | ≤ |y2∞ | für n ≥ N. Beweis. (Von Satz 3.3.11, 4.). Sei yn → y∞ 6= 0. Nach Lemma 3.3.12 existieren C ∈ R>0 und N ∈ N mit 1/|yn | ≤ C für n ≥ N. Für n ≥ N gilt | 1 C xn x∞ − |=| (y∞ xn − x∞ yn )| ≤ |y∞ xn − x∞ yn | . yn y∞ yn y∞ |y∞ | Nach den ersten beiden Aussagen des Satzes konvergiert y∞ xn − x∞ yn gegen 0. Mit Lemma 3.3.5 folgt | xynn − yx∞∞ | → 0, d.h., xynn → xy∞∞ . 3.3.4 Monotone Folgen reeller Zahlen Sei X = R. Definition 3.3.13. Die Folge x = (xn )n∈N heißt monoton wachsend (im weiteren Sinne) oder monoton nichtfallend (in Zeichen xn ↑), wenn xn+1 ≥ xn für alle n ∈ N. Analog werden streng monoton wachsend, monoton fallend (in Zeichen xn ↓) und streng monoton fallend definiert. ♦ Satz 3.3.14 (Monotone Folgen). Sei (xn )n∈N eine monoton wachsende Folge. 1. Wenn x[N] = {xn : n ∈ N} von oben beschränkt ist, dann besitzt sie einen (endlichen) Grenzwert. 2. Wenn x[N] = {xn : n ∈ N} nicht von oben beschränkt ist, dann xn → ∞. 52 3.3 Eigenschaften des Grenzwertes Beweis. 1. Die Menge x[N] = {xn : n ∈ N} ist nach Voraussetzung von oben beschränkt und besitzt somit nach Vollständigkeitsaxiom ein Supremum M ∗ = sup x[N]. Wir vermuten xn → M ∗ . Dazu sei ε > 0 beliebig. Die Zahl M ∗ − ε ist keine obere Schranke von x[N], d.h., es existiert ein N ∈ N mit M ∗ − ε < xN ≤ M ∗ . Wenn n ≥ N, dann M ∗ − ε < xN ≤ xn ≤ M ∗ , also |xn − M ∗ | < ε für n ≥ N. 2. Sei K > 0 beliebig. Da x[N] nicht von oben beschränkt ist, existiert ein N ∈ N mit xn ≥ xN ≥ K für n ≥ N. Dies bedeutet aber xn → ∞. Bemerkung 3.3.15. 1. lim xn = sup x[N] für jede monoton wachsende Folge x. (Falls x nach oben unbeschränkt ist, vereinbaren wir sup x[N] = ∞.) 2. lim xn = inf x[N] für jede monoton fallende Folge x. (Falls x nach unten unbeschränkt ist, vereinbaren wir inf x[N] = −∞.) 3. Der Satz ist eine reine Existenzaussage für den Grenzwert (ohne ihn berechnet zu haben oder ihn zu kennen). 4. xn % x∞ bedeutet xn ↑ und xn → x∞ . xn % ∞ bedeutet xn ↓ und x unbeschränkt. ♦ Satz 3.3.16 (Theorem of the two meeting sequences). Seien x = (xn )n∈N und y = (yn )n∈N zwei reelle Folgen mit xn ↑ und yn ↓. Es gelte 1. xn ≤ yn mindestens ab einem Index N ∈ N. 2. yn − xn → 0. Dann existiert ein c ∈ R mit xn % c und yn & c. Beweis. Wegen der Monotonie von x und 1. ist x[N] von oben beschränkt. Satz 3.3.14 impliziert die Existenz von x∞ = limn→∞ xn . Analog zeigt man die Konvergenz von y gegen ein y∞ ∈ R. Damit konvergiert x − y gegen x∞ − y∞ . Nach 2. ist x∞ − y∞ = 0, also c = x∞ = y∞ . 3.3.5 Die Zahl e Als Anwendung von Satz 3.3.14 zeigen wir die Existenz einer speziellen Zahl. Wir zeigen zuerst die Konvergenz von 1 yn = 1 + n n+1 . 53 3 Grenzwerttheorie Offensichtlich gilt yn ≥ 1 für alle n ≥ 1. Damit ist y von unten beschränkt. Wir zeigen nun, daß y nichtwachsend ist: 1 n 1 + n−1 yn−1 = n+1 = yn 1 + n1 n−1+1 n n2n+1 n−1 = n+1 n+1 (n − 1)n (n + 1)n+1 n 2 n+1 n−1 n (n − 1)n2n+2 n+1 n−1 1 = 1+ 2 = = n n2 − 1 n n −1 n [(n − 1)(n + 1)]n+1 1 n−1 1 n−1 n n−1 1 + (n + 1) 2 = 1+ = > n n −1 n n−1 n n−1 = 1, daß heißt yn < yn−1 für alle n ≥ 2. Nach Satz 3.3.14 konvergiert y von oben gegen ein y∞ ∈ R. Nun zeigen wir die Konvergenz von 1 xn = 1 + n n . Offensichtlich gilt xn = yn 1+1 1 . Der erste Faktor konvergiert gegen y∞ , der zweite gegen 1. n Nach Satz 3.3.11 konvergiert xn auch gegen y∞ . n Definition 3.3.17. Der Grenzwert der Folge 1 + 1n n∈N≥1 wird mit e bezeichnet (Eu- lersche Zahl), e = lim n→∞ 1 1+ n n ≈ 2.718281828459045 . ♦ 3.3.6 Weitere wichtige Beispiele für Grenzwerte 1. Es gilt 1 =0 lim √ p n→∞ n für p > 0 . Beweis. Sei ε > 0 gegeben. Da 1n → 0, existiert ein n0 ∈ N>0 mit n ∈ N≥n0 . Damit gilt √p1n < ε für alle n ∈ N≥n0 . 2. Es gilt 1 =0 n→∞ ns lim 54 für s ∈ Q>0 . 1 n < ε p für alle 3.3 Eigenschaften des Grenzwertes Beweis. Sei s = q/p mit p, q ∈ N>0 . Dann gilt 1 1 √ = √ q →0 p q p ( n) n nach 1. und Produktregel. 3. Es gilt lim √ n n→∞ a=1 für a > 0 . Beweis. Fallunterscheidung. a = 1 ist trivial. √ Sei a > 1. Setze xn := n a − 1 ≥ 0. Dann gilt a = (1 + xn )n ≥ 1 + nxn . Weiter gilt 0 ≤ xn < a →0 n und mit Satz 3.3.5 folgt xn → 0. Sei a < 1. Es gilt mit 1 a √ 1 n a= p n 1/a > 1. 4. Es gilt lim |q|n = 0 n→∞ für q ∈ C mit |q| < 1 . Beweis. Der Fall q = 0 ist trivial. Sei q 6= 0 und a := 1−|q| |q| > 0. Dann gilt |q| = Damit 1 1 1 0 ≤ |qn − 0| = |q|n = ≤ < → 0. n (1 + a) 1 + na na 5. Es gilt lim n→∞ 1 1+a . √ n n = 1. Beweis. ÜA. 6. Es gilt nk =0 n→∞ zn lim für k ∈ N, z ∈ Cmit |z| > 1 . Beweis. ÜA. (etwas schwieriger). 55 3 Grenzwerttheorie 3.3.7 Der Intervallschachtelungssatz und der Satz von Bolzano-Weierstraß Satz 3.3.18 (Intervallschachtelung). Sei ([an , bn ])n∈N eine Folge von abgeschlossenen Intervallen mit folgenden Eigenschaften: 1. ∀n ∈ N : [an+1 , bn+1 ] ⊆ [an , bn ]. 2. bn − an → 0. Dann besteht der Durchschnitt aller Intervalle aus genau einem Punkt. Dieser ist Grenzwert der monoton wachsenden Folge a und der monoton fallenden Folge b. Beweis. 1. Existenz. Mit Satz 3.3.16 folgt die Existenz eines c mit an % c und bn & c. Aus T c ∈ [an , bn ] für alle n ∈ N folgt c ∈ n∈N [an , bn ]. 2. Seien c, d ∈ n∈N [an , bn ]. Wenden wir Satz 3.3.5 mit der konstanten Folge (d)n∈N als mittlere Folge an, so folgt d = c. T Bemerkung 3.3.19. Abgeschlossenheit der Intervalle ist wesentlich. Es gilt z.B. \ n∈N>0 1 ]0, ] = 0/ . n ♦ Satz 3.3.20 (Bolzano (1782-1848), Weierstraß (1815-1897)). Jede beschränkte reelle Folge besitzt wenigstens eine konvergente Teilfolge. Beweis. Sei (xn )n∈N beschränkt. Dann existieren a0 und b0 mit a0 ≤ xn ≤ b0 für alle n ∈ N. Wir konstruieren eine Folge von ineinander geschachtelten Teilintervallen ([an , bn ])n∈N , die jeweils unendlich viele Glieder der Folge x enthalten, durch das folgende Verfahren: Sei [an , bn ] so konstruiert, daß dieses Intervall unendlich viele Glieder der Folge x enthält. Wean +bn n nigstens in einem der Teilintervalle [an , an +b 2 ] und [ 2 , bn ] liegen unendlich viele Folgenglieder von x. Sei dann [an+1 , bn+1 ] ein solches Intervall. Nach Konstruktion gilt bn − an = (b0 − a0 )2−n → 0. Nach Satz 3.3.18 gilt {c}. T n∈N [an , bn ] = Wir zeigen nun, daß c Grenzwert einer Teilfolge ist. Dazu konstruieren wir eine streng monoton wachsende Folge (nk ) in N durch das folgende Verfahren: Sei n0 = 0. Weiter sei nk+1 > nk gewählt mit xnk+1 ∈ [ak+1 , bk+1 ]. Dann gilt ak ≤ xnk ≤ bk und mit Satz 3.3.5 folgt xnk → c. 56 3.4 Weitere topologische Begriffe in metrischen Räumen 3.4 Weitere topologische Begriffe in metrischen Räumen 3.4.1 Cauchy-Folgen und Vollständigkeit Bisher haben wir eine Zahl als Grenzwert vermutet und dann gezeigt, daß sie tatsächlich Grenzwert ist. Kann man einer Folge x ansehen, ob sie einen Grenzwert besitzt oder nicht? Definition 3.4.1. Sei (X, d) ein metrischer Raum. Eine Folge (xn )n∈N in X heißt CauchyFolge, Fundamentalfolge oder in sich konvergente Folge in (X, d), wenn die CauchyBedingung ∀ε > 0∃N∀m, n ≥ N : d(xn , xm ) < ε ♦ erfüllt ist. Satz 3.4.2. 1. Jede konvergente Folge ist eine Cauchy-Folge. 2. Jede Cauchy-Folge ist beschränkt. 3. Enthält eine Cauchy-Folge eine konvergente Teilfolge, dann konvergiert die Folge selbst (und besitzt als Grenzwert den Grenzwert der Teilfolge). Beweis. Zu 1. Sei ε > 0. Dann existiert ein N > 0 mit d(xn , x∞ ) < d(xn , xm ) ≤ d(xn , x∞ ) + d(x∞ , xm ) < ε für n, m ≥ N. ε 2 für n ≥ N. Damit Zu 2. Wir fixieren ε = 1. Dann gibt es ein N mit d(xn , xm ) < 1 für alle n, m ≥ N. Somit d(xn , xN ) ≤ 1 für alle n ≥ N. Sei r = 1 + max{d(xk , xN ) : k ∈ N<N }. Dann xn ∈ B(xN , r) für alle n ∈ N. Zu 3. Sei (xn )n∈N eine Cauchy-Folge und sei (xnk )k∈N eine konvergente Teilfolge mit xnk → x∞ . Für jedes ε > 0 existieren N und K mit ∀m, n ≥ N : d(xn , xm ) < und ∀k ≥ K : d(xnk , x∞ ) < ε 2 ε . 2 Sei k0 fixiert mit k0 ≥ K und nk0 ≥ N. Dann gilt ∀n ≥ N : d(xn , x∞ ) ≤ d(xn , xnk0 ) + d(xnk0 , x∞ ) < ε ε + =ε, 2 2 d.h., xn → x∞ . Es entsteht nun die Frage, ob jede Cauchy-Folge konvergiert. Daß dies im allgemeinen nicht gilt, zeigt das folgende Beispiel: 57 3 Grenzwerttheorie Beispiel 3.4.3. Sei X = {x ∈ R2 : (x1 )2 + (x2 )2 < 1} und sei d(x, y) = q (x1 − y1 )2 + (x2 − y2 )2 für x, y ∈ X. Wir betrachten die Folge (xn )n∈N in X definiert durch xn = (0, 1 − n1 ). Sei ε > 0 beliebig und N ∈ N mit N2 < ε. Dann gilt ∀n, m ≥ N : 1 1 2 1 1 d(xn , xm ) = | − | ≤ + ≤ < ε . n m n m N Also ist (xn )n∈N eine Cauchy-Folge. Offensichtlich konvergiert sie aber nicht in X. ♦ Es gibt jedoch auch Situationen, wo die Cauchy-Bedingung hinreichend für Konvergenz ist. Satz 3.4.4. Eine Folge reeller Zahlen konvergiert (bzgl. der Betragsmetrik) genau dann, wenn sie eine Cauchy-Folge ist. Beweis. Wegen Satz 3.4.2 haben wir nur noch die Hinlänglichkeit zu zeigen. Sei dazu x eine Cauchy-Folge reeller Zahlen. Nach Aussage 2 von Satz 3.4.2 ist x beschränkt. Nach Satz von Bolzano-Weierstraß (Satz 3.3.20) existiert eine konvergente Teilfolge. Nach Aussage 3 von Satz 3.4.2 konvergiert x. In vielen Gebieten der Mathematik und ihren Anwendungen sind metrische Räume von besonderem Interesse, in denen die Cauchy-Bedingung hinreichend für die Konvergenz ist. Definition 3.4.5. Ein metrischer Raum (X, d) heißt vollständig, wenn in ihm jede CauchyFolge konvergiert. Ein vollständiger, normierter Raum (X, k · k) heißt Banach-Raum. ♦ Nach Satz 3.4.4 ist (R, d) mit d(x, y) = |x − y| ein vollständiger metrischer Raum. Durch Anwendung von Satz 3.3.10 folgt die Vollständigkeit von (Rn , d) mit d(x, y) = kx − yk und speziell von (C, d) mit d(x, y) = |x − y|. Beispiel 3.4.6. Sei dQ : Q × Q → R definiert durch dQ (x, y) = |x − y| für x, y ∈ Q. Der metrische Raum (Q, dQ ) ist nicht vollständig: Sei x0 = 2 und 1 2 xn+1 = xn + 2 xn √ für n ∈ N. Da (xn ) in (R, d) mit d(x, y) = |x − y| gegen 2 konvergiert (Babylonisches Wurzelziehen), ist (xn ) eine Cauchyfolge in (R, d) und da xn ∈ Q für alle n ∈ N auch in (Q, dQ ). In (Q, dQ ) konvergiert sie jedoch nicht. ♦ 58 3.4 Weitere topologische Begriffe in metrischen Räumen 3.4.2 Banachscher Fixpunktsatz Sei (X, d) ein metrischer Raum und sei f : X → X. Eine Lösung a der Gleichung x = f (x) nennen wir Fixpunkt von f . Wir nennen f kontraktiv, wenn ein q ∈ [0, 1[ existiert mit ∀x, y ∈ X : d( f (x), f (y)) ≤ qd(x, y) . (3.4.1) Als Folge der sukzessiven Approximation bezeichnen wir eine Folge (xn )n∈N in X mit xn+1 = f (xn ) für n ∈ N. Satz 3.4.7 (Banachscher Fixpunktsatz). Sei (X, d) ein vollständiger metrischer Raum und sei f : X → X kontraktiv. Dann gelten folgende Aussagen: 1. f hat genau einen Fixpunkt a. 2. Die Folgen der sukzessiven Approximation konvergieren für jedes x0 ∈ X gegen a. 3. Ist q eine Kontraktionskonstante für f , so gilt die Fehlerabschätzung ∀n ∈ N>0 : d(xn , a) ≤ qn d(x1 , x0 ) . 1−q Beweis. Eindeutigkeit: Es seien a und b zwei verschiedene Fixpunkte von f . Aus (3.4.1) folgt d(a, b) = d( f (a), f (b)) ≤ qd(a, b) und damit d(a, b) = 0, das heißt a = b. Existenz und Konvergenz: Sei x0 ∈ X und xn+1 = f (xn ) für n ∈ N. Dann gilt ∀n ∈ N>0 : d(xn+1 , xn ) = d( f (xn ), f (xn−1 )) ≤ qd(xn , xn−1 ) . Induktiv folgt hieraus ∀k ∈ N ∀n ∈ N≥k : d(xn+1 , xn ) ≤ qn−k d(xk+1 , xk ) . Für natürliche n > k ≥ 0 ergibt sich d(xn , xk ) ≤ d(xn , xn−1 ) + d(xn−1 , xn−2 ) + · · · + d(xk+1 , xk ) ≤ qn−k−1 + qn−k−2 + · · · + 1 d(xk+1 , xk ) = 1 − qn−k d(xk+1 , xk ) . 1−q Mit d( f (xk ), xk ) = d(xk+1 , xk ) ≤ qk d(x1 , x0 ) (3.4.2) folgt ∀k ∈ N ∀n ∈ N≥k : d(xn , xk ) ≤ qk − qn qk d(x1 , x0 ) ≤ d(x1 , x0 ) . 1−q 1−q (3.4.3) 59 3 Grenzwerttheorie Somit ist (xn )n∈N eine Cauchy-Folge im vollständigen, metrischen Raum X und konvergiert daher gegen ein a ∈ X. Da ( f (xn ))n∈N eine Teilfolge von (xn )n∈N ist, konvergiert ( f (xn ))n∈N auch gegen a. Aus d( f (xn ), f (a)) ≤ qd(xn , a) folgt daher durch Grenzübergang d(a, f (a)) = 0, d.h. a = f (a). Fehlerabschätzung: Da die Folge gegen a konvergiert, können wir in (3.4.3) den Grenzübergang n → ∞ durchführen und erhalten die behauptete Abschätzung. 3.4.3 Häufungspunkte und abgeschlossene Mengen Definition 3.4.8. Sei (X, ρ) ein metrischer Raum, A eine Teilmenge von X und x0 ein Element von X. Der Punkt x0 heißt • äußerer Punkt von A, wenn x0 innerer Punkt von X \ A ist; • Randpunkt von A, wenn x0 weder innerer noch äußerer Punkt von A ist; • Berührungspunkt von A, wenn für jede Umgebung U von x0 stets U ∩ A 6= 0/ gilt; • Häufungspunkt von A, wenn für jede Umgebung U von x0 stets (U ∩ A) \ {x0 } 6= 0; / • isolierter Punkt von A, wenn es eine Umgebung U von x0 gibt mit U ∩ A = {x0 }. ♦ Bemerkung 3.4.9. Eine Umgebung um x0 kann stets durch eine offene Kugel um x0 ersetzt werden. 1. Randpunkt: Für jede Umgebung U von x0 gilt U ∩ A 6= 0/ und U ∩ (X \ A) 6= 0, / das heißt in Umgebung von x0 liegen sowohl Punkte von A als auch vom Komplement von A. 2. Berührungspunkt: Es sind x0 ∈ A und x0 6∈ A möglich. Jeder Punkt von A ist Berührungspunkt von A. 3. Häufungspunkt: Jede Umgebung U von x0 enthält wenigstens einen von x0 verschiedenen Punkt von A. Jeder Häufungspunkt von A ist Berührungspunkt von A, aber nicht jeder Berührungspunkt von A ist Häufungspunkt von A. Sei A = ]0, 1[ ∪ {2}. Dann ist 2 Berührungspunkt von A aber nicht Häufungspunkt von A. 1 ist Häufungspunkt von A, gehört aber nicht zu A. 12 ist Häufungspunkt von A und gehört zu A. 4. Isolierter Punkt: Ein isolierter Punkt von A gehört stets zu A. ♦ Definition 3.4.10. Die Menge aller inneren Punkte von A heißt offener Kern oder Inneres ◦ von A und wird mit A bezeichnet. Die Menge aller Berührungspunkte von A heißt abgeschlossene Hülle oder Abschließung von A und wird mit Ā bezeichnet. ♦ 60 3.4 Weitere topologische Begriffe in metrischen Räumen Definition 3.4.11. Eine Menge A ⊆ X heißt abgeschlossen, wenn A = Ā. ♦ Wegen A ⊆ Ā, bedeutet Abgeschlossenheit einer Menge A: Ā ⊆ A, d.h., A enthält alle Berührungspunkte. Es gilt A = A. Beispiel 3.4.12. 1) A = [0, 1[ ∪ ]1, 2], dann Ā = [0, 2]. 2) A = [0, 1[ ∪ {2}, dann Ā = [0, 1] ∪ {2}. In beiden Fällen ist A weder abgeschlossen noch offen. ♦ Bemerkung 3.4.13. Die Mengen 0/ und X sind stets abgeschlossene und offene Teilmengen des metrischen Raumes (X, ρ). ♦ Lemma 3.4.14 (Charakterisierung von Häufungspunkten). Sei (X, ρ) ein metrischer Raum, A ⊆ X, x0 ∈ X. Dann x0 ist HP von A ⇐⇒ ∃(an ) in A \ {x0 } : an → x0 . Beweis. =⇒ Sei x0 Häufungspunkt von A. Es gilt 1 A ∩ B(x0 , ) \ {x0 } 6= 0/ . n Damit existiert für jedes n ein an ∈ A \ {x0 } mit an ∈ B(x0 , n1 ). Sei ε > 0 beliebig und N ∈ N≥ 1 . Dann ε 1 ∀n ≥ N : |x0 − an | < ≤ ε , n das heißt an → x0 . ⇐= Sei (an ) eine Folge aus A \ {x0 } mit an → x0 . Sei U eine beliebige Umgebung von x0 . O.B.d.A. sei U = B(x0 , ε) mit ε > 0. Wegen an → x0 gibt es ein N mit an ∈ B(x0 , ε) für n ≥ N. Wegen an ∈ A \ {x0 } gilt an ∈ (B(x0 , ε) ∩ A) \ {x0 }, das heißt x0 ist HP von A. Bemerkung 3.4.15. In einer Umgebung eines HP x0 von A liegen sogar unendlich viele Punkte von A. ♦ Lemma 3.4.16 (Charakterisierung von Berührungspunkten). Sei (X, ρ) ein metrischer Raum, A ⊆ X, x0 ∈ X. Dann x0 ist BP von A ⇐⇒ ∃(an ) in A : an → x0 . 61 3 Grenzwerttheorie Hier ist also an = x0 nicht ausgeschlossen, z.B. falls x0 isolierter Punkt von A ist. Beweis. ÜA Lemma 3.4.17 (Charakterisierung abgeschlossener Mengen). Sei (X, ρ) ein metrischer Raum und A ⊆ X. Folgende Aussagen sind äquivalent: 1. A ist abgeschlossen, das heißt A = Ā. 2. Das Komplement X \ A von A ist offen. 3. Ist (an )n∈N eine Folge in A, die in X gegen a∞ konvergiert, dann gilt a∞ ∈ A. Beweis. 1. ⇒ 2.: Sei b ∈ X \ A beliebig. Dann ist (wegen A = Ā) b 6∈ Ā, also ist b kein BP von A. Letzteres heißt, es gibt eine Umgebung U von b mit U ∩ A = 0. / Diese Umgebung U von b ist also in X \ A. Damit ist X \ A offen. 2. ⇒ 3.: Sei (an )n∈N eine Folge in A, die in X gegen a∞ konvergiert. Indirekt: Sei a∞ 6∈ A, dann a∞ ∈ X \ A. Da X \ A offen ist, ist a∞ innerer Punkt von X \ A. Damit existiert ein ε > 0 mit B(a∞ , ε) ⊆ X \A. Wegen der Konvergenz von (an ) gibt es ein N mit an ∈ A∩B(x0 , ε) = 0/ für alle n ≥ N. Damit wurde ein Widerspruch erhalten. 3. ⇒ 1.: Da stets A ⊆ Ā gilt, brauchen wir nur noch Ā ⊆ A zu zeigen. Sei a∞ ∈ Ā beliebig, d.h., sei a∞ ein BP von A. Nach Lemma 3.4.16 existiert eine Folge (an )n∈N in A mit an → a∞ . Nach Voraussetzung ist a∞ ∈ A, also Ā ⊆ A. 3.4.4 Kompaktheit Sei (X, d) ein metrischer Raum. Definition 3.4.18. Ein Mengensystem {Oi ⊆ X : i ∈ I} heißt Überdeckung der Menge K ⊆ S X, wenn K ⊆ i∈I Oi . Die Überdeckung heißt offen, wenn alle Oi offen sind. Ein Teilsystem einer Überdeckung heißt endliche Teilüberdeckung, wenn sie eine Überdeckung ist und nur aus endlich vielen Mengen besteht. ♦ Definition 3.4.19. Eine Teilmenge K von X heißt kompakt, falls jede offene Überdeckung von K eine endliche Teilüberdeckung besitzt. Eine Teilmenge K von X heißt folgenkompakt, falls jede Folge in K eine in K konvergente Teilfolge besitzt. ♦ Beispiel 3.4.20. 1. Sei (xn )n∈N eine konvergente Folge in (X, d) mit Grenzwert x∞ . Dann ist K = {xn : n ∈ N} ∪ {x∞ } kompakt: Es sei {Oi ⊆ X : i ∈ I} eine offene Überdeckung von K. Dann gibt es ein i∞ ∈ I mit x∞ ∈ Oi∞ und ein N ∈ N mit xn ∈ Oi∞ für n ≥ N. Für n < N S gibt es Indizes in mit xn ∈ Oin für n < N. Damit K ⊂ n<N Oin ∪ Oi∞ . 2. Die Menge der natürlichen Zahlen ist nicht kompakt in R: Sei On = ]n − 13 , n + 31 [ für n ∈ N. Dann ist {On : n ∈ N} eine offene Überdeckung von N, die keine endliche Teilüberdeckung besitzt. ♦ 62 3.5 Exkurs: Konstruktion reeller Zahlen Lemma 3.4.21. Jede folgenkompakte Menge K ⊆ X ist abgeschlossen und beschränkt. Beweis. Sei K folgenkompakt und sei x∞ ein beliebiger Berührungspunkt von K. Nach Lemma 3.4.16 existiert eine Folge (xn )n∈N in K mit Grenzwert x∞ . Damit gibt es eine in K konvergente Teilfolge. Da die Folge selbst konvergiert, liegt ihr Grenzwert x∞ in K. Somit enthält K alle Berührungspunkte, ist also abgeschlossen. Angenommen, K ist folgenkompakt und unbeschränkt. Sei x0 ∈ K fixiert. Wir konstruieren eine Folge (xn )n∈N durch die Eigenschaft, daß xn+1 ∈ K so gewählt sei, daß d(xn+1 , x0 ) > 1 + d(xn , x0 ). Dann gilt d(xn , xm ) > 1 für alle n, m ∈ N mit n 6= m, d.h., es kann keine konvergente Teilfolge geben. Satz 3.4.22. Eine Teilmenge des Rn ist genau dann folgenkompakt, wenn sie abgeschlossen und beschränkt ist. Beweis. Sei K eine folgenkompakte Teilmenge von Rn . Nach Lemma 3.4.21 ist K abgeschlossen und beschränkt. Sei nun K abgeschlossen und beschränkt. Sei (xn ) eine beliebige Folge in K. Nach Satz 3.3.10 und dem Satz von Bolzano-Weierstraß (Satz 3.3.20) existiert eine in Rn konvergente Teilfolge gegen ein x∞ ∈ RN . Nach Lemma 3.4.16 ist x∞ Berührungspunkt von K, gehört wegen der Abgeschlossenheit von K also zu K. Damit hat (xn ) eine in K konvergente Teilfolge und K ist folgenkompakt. Satz 3.4.23. Eine Teilmenge K eines metrischen Raumes (X, d) ist genau dann kompakt, wenn sie folgenkompakt ist. Beweis. Siehe z.B. Amann-Escher. Als Folgerung aus den Sätzen 3.4.22 und 3.4.23 erhalten wir: Satz 3.4.24 (Heine-Borel). Eine Teilmenge des Rn ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. 3.5 Exkurs: Konstruktion reeller Zahlen Im Folgenden geben wir nur die Grundideen an. Zum genaueren Nachlesen (auch der fehlenden Beweise) sei auf das Springerlehrbuch „Zahlen“ von Ebbinghaus et al. verwiesen. 3.5.1 Dedekind-Schnitte Definition 3.5.1. Ein Dedekindscher Schnitt ist ein Paar (A, B) =: A|B von Teilmengen A („Untermenge“) und B („Obermenge“) von Q mit folgenden Eigenschaften: 1. A ∩ B = 0, / A ∪ B = Q, A 6= 0, / B 6= 0. / 63 3 Grenzwerttheorie 2. ∀a ∈ A ∀b ∈ b : a ≤ b. ♦ 3. B hat kein Minimum. Definition 3.5.2. Die Menge R ist die Menge aller Dedekindschen Schnitte. ♦ Jede rationale Zahl s bestimmt den Schnitt A|B mit A = {r ∈ Q : r ≤ s} und B = Q \ A. In diesem Sinne sind die rationalen Zahlen in R enthalten. Die Addition und die Ordungsrelation werden wie folgt definiert: A|B +C|D := E|F mit E = {r + s : r ∈ A, s ∈ C} , F = Q \ E und A|B ≤ C|D :⇐⇒ A ⊆C. Sind A|B ≥ 0 und C|D ≥ 0 so definiert man A|B ·C|D := E|F mit E = {rs : r ∈ A, s ∈ C} , F = Q \ E . Man kann nun nachweisen, daß die so konstruierten reellen Zahlen (R, +, ·, ≤) den Axiomen des total angeordneten Körpers und dem Vollständigkeitsaxiom genügen. 3.5.2 Fundamentalfolgen Definition 3.5.3. Eine rationale Folge (rn )n∈N heißt Nullfolge, wenn limn→∞ rn = 0. Eine rationale Folge (rn )n∈N heißt positiv, wenn ein ε > 0 existiert mit rn ≥ ε für alle (bis auf endliche viele) n ∈ N. ♦ Zunächst bemerkt man, daß nach Satz 3.3.11 Summe und Produkt von rationalen Nullfolgen wieder rationale Nullfolgen sind. Sei F die Menge aller rationalen Fundamentalfolgen (Cauchy-Folgen). Auf F führen wir eine Äquivalenzrelation N ein durch r ∼N s :⇐⇒ r − s ist Nullfolge. Nach Cantor definiert man nun R := F/N , d.h., eine reelle Zahl ist eine Äquivalenzklasse [r]N von Cauchy-Folgen rationaler Zahlen. Addition und Multiplikation werden definiert durch [r]N + [s]N := [r + s]N , 64 [r]N · [s]N := [rs]N . 3.5 Exkurs: Konstruktion reeller Zahlen Nullelement und Einselement sind [(0)n∈N ]N und [(1)n∈N ]N . Eine rationale Zahl r wird mit der Restklasse [(r)n∈N ]N identifiziert. Sei P die Menge aller positiven rationalen Fundamentalfolgen. Damit definieren wir [r]N < [s]N :⇐⇒ s−r ∈ P und [r]N ≤ [s]N :⇐⇒ [r]N < [s]N ∨ [r]N = [s]N . Man kann nun wieder zeigen, daß (R, +, ·, ≤) den Axiomen des total angeordneten Körpers und dem Vollständigkeitsaxiom genügt. Diese Idee der Vervollständigung der rationalen Zahlen zu den reellen Zahlen kann auch allgemein zur Vervollständigung metrischer Räume verwandt werden. Spezielle Repräsentaten (d.h., Cauchy-Folgen rationaler Zahlen) für reelle Zahlen stellen Dezimalbrüche dar: Sei b ∈ N≥2 und sei (an ) ein Folge in Z mit an ∈ {0, . . . , b − 1} für n ≥ 1. Damit definieren wir die Folge (rn )n∈N durch n rn = ∑ ai b−i n für a0 ≥ 0 rn = a0 − ∑ ai b−i und i=0 für a0 < 0 . i=1 Offensichtlich ist dann (rn ) eine Cauchy-Folge und somit Repräsentant für eine reelle Zahl. Sei nun noch m |a0 | = ∑ ci bi , i=0 so enthält das Symbol cm · · · c0 .a1 · · · an für a0 ≥ 0 und − cm · · · c0 .a1 · · · an für a0 < 0 bei fixiertem b die volle Information über rn , kann daher mit rn identifiziert werden, und heißt b-adische Entwicklung von rn . b heißt Basis des Zahlensystems. Wichtige Spezialfälle sind b = 10 und b = 2, für die wir die Darstellung als endliche Dezimalbrüche bzw. endliche Dualbrüche erhalten. Beispiel 3.5.4. Die Folge (1, 1.4, 1.41, 1.414, √ 1.4142, . . .) ist (bei b = 10 und bei entsprechender Fortsetzung) ein Repräsentant für 2. ♦ Eine (unendlicher) Dezimalbruch ist somit als Folge endlicher Dezimalbrüche zu interpretieren. 3.5.3 Intervallschachtelungen Definition 3.5.5. Eine rationale Intervallschachtelung (In )n ist eine Folge abgeschlossener, rationaler Intervalle [rn , sn ] = {x ∈ Q : rn ≤ x ≤ sn } mit rn , sn ∈ Q, In+1 ⊆ In und 65 3 Grenzwerttheorie limn→∞ (sn − rn ) = 0. Eine Intervallschachtelung (Jn ) heißt feiner als eine Intervallschachtelung (In ), wenn Jn ⊆ In für alle n ∈ N. Man nennt (In ) und (Jn ) äquivalent, wenn es eine Intervallschachtelung (Kn ) gibt, die feiner als (In ) und (Jn ) ist. Als reelle Zahlen definiert man nun die dadurch entstehenden Äquivalenzklassen von Intervallschachtelungen. ♦ Beispiel 3.5.6. Sei In = [(1 + 1n )n , (1 + n1 )n+1 ]. Dann ist In eine Intervallschachtelung und sie ist ein Representant der reellen Zahl e. ♦ 3.6 Endliche und unendliche Mengen 3.6.1 Endliche Mengen Lemma 3.6.1. Jede injektive Selbstabbildung ψ : N<n → N<n ist bijektiv. Beweis. (durch vollständige Induktion). Offensichtlich gilt die Behauptung für n = 0 und n = 1. Sei die Behauptung richtig für n ∈ N und sei ψ : N<n+1 → N<n+1 eine Injektion. Sei k = ψ(n). Betrachte nun n für j = k γ( j) := k für j = n und κ := γ ◦ ψ . j sonst Dann ist γ bijektiv und somit κ mindestens injektiv. Es gilt κ(n) = γ(ψ(n)) = γ(k) = n. Somit ist κ N<n : N<n → N<n eine Injektion, welche nach Induktionsvoraussetzung eine Surjektion ist. Damit ist κ eine Bijektion von N<n+1 auf N<n+1 . Folglich ist γ −1 ◦ κ = γ −1 ◦ γ ◦ ψ ebenfalls eine Bijektion. Definition 3.6.2. Eine Menge M heißt endlich, falls ein n ∈ N und eine Bijektion φ : M → N<n von M auf N<n existieren. Die Zahl n heißt dann die Anzahl #M der Elemente von M. Ist M nicht endlich, heißt M unendlich und es wird #M := ∞ gesetzt. ♦ Bemerkung 3.6.3. 1. Die Anzahl der Elemente einer endlichen Menge ist wegen Lemma 3.6.1 wohldefiniert. 2. Es gilt z.B. #({0, 1}) = 2. 3. Wenn M leer ist, dann gibt es eine Bijektion φ : M → N<0 = 0. / Die leere Menge ist also endlich und hat 0 Elemente. 4. Teilmengen einer endlichen Menge sind endlich. 5. Die Vereinigung endlicher Mengen ist endlich. 6. Die Potenzmenge einer endlichen Menge ist endlich. Satz 3.6.4. N ist unendlich. 66 ♦ 3.6 Endliche und unendliche Mengen Beweis. Angenommen, N ist endlich. Dann gibt es ein m ∈ N und eine Bijektion φ : N → N<m . Somit ist ψ = φ N : N<m → N<m eine Injektion in sich, welche nach Lemma 3.6.1 <0 eine Bijektion ist. Da φ (m) ∈ N<m , gibt es wegen der Surjektivität von ψ ein n ∈ N<m mit ψ(n) = φ (m). Da n < m gilt ψ(n) = φ (n) und wir erhalten φ (n) = φ (m) mit n 6= m im Widerspruch zur Injektivität. 3.6.2 Gleichmächtigkeit von Mengen Endliche Mengen sind (neben der Mengeninklusion) durch die Anzahl ihrer Elemente vergleichbar. Wir wollen dies nun auf unendliche Mengen in einer Weise übertragen, die in gewissem Sinne eine Größenvergleich erlauben. Konkret steht die Frage ob R, Q, Z mehr Elemente als N hat. Definition 3.6.5. Zwei Mengen M und N heißen gleichmächtig, M ∼ N, wenn es eine Bijektion b : M → N von M auf N gibt. ♦ Bemerkung 3.6.6. Die Gleichmächtigkeit ist eine „Äquivalenzrelation auf der Klasse aller Mengen“. ♦ Beispiel 3.6.7. 1. Die Mengen M = {A, B,C} und N = {I, II, III} sind gleichmächtig: Wähle b : M → N mit b(A) = I, b(B) = II, b(C) = III. 2. Die Mengen M = {A, B,C} und N = {I, II} sind nicht gleichmächtig: Ist b : M → N eine surjektive Abbildung, dann hat I oder II zwei Urbilder, b ist also nicht injektiv. 3. Endliche Mengen sind genau dann gleichmächtig, wenn sie die gleiche Anzahl von Elementen haben. ♦ Bemerkung 3.6.8. Die angepaßte Erweiterung von „gleichviele Elemente“ ist „gleichmächtig“. Es treten aber Widersprüche zu den aus dem Endlichen gewohnten auf: ♦ Beispiel 3.6.9. Obwohl N ⊂ Z, sind N und Z gleichmächtig: Wähle b : N → Z mit b(2k) = k, b(2k + 1) = −k für k ∈ N. ♦ Allgemein gilt: Satz 3.6.10. Eine Menge M ist genau dann endlich, wenn sie zu keiner echten Teilmenge gleichmächtig ist. Beweis. Nicht trivial. Definition 3.6.11. Eine Menge M heißt abzählbar unendlich, wenn M ∼ N. Eine unendliche Menge heißt überabzählbar unendlich, wenn M unendlich aber M 6∼ N. Eine Menge M heißt höchstens abzählbar unendlich, wenn sie endlich oder abzählbar unendlich ist. ♦ Bemerkung 3.6.12. Ist M ∼ N, so ist wegen Satz 3.6.4 auch M unendlich. Abzählbar unendliche Mengen sind also tatsächlich unendlich. Wir haben also eine Dreiteilung der Klasse aller Mengen in die endlichen Mengen, die abzählbar unendlichen Mengen und die überabzählbar unendlichen Mengen. ♦ 67 3 Grenzwerttheorie 3.6.3 Die Mächtigkeit von Q , R und 2M Wir ordnen die positiven rationalen Zahlen entsprechend folgendem Schema an (waagerecht – wachsender Zähler, senkrecht – wachsender Nenner). Cantorsches Quadratseitenverfahren 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 ··· 1 2 2 2 3 2 4 2 5 2 6 2 7 2 8 2 ··· 1 3 2 3 3 3 4 3 5 3 6 3 7 3 8 3 ··· 1 4 2 4 3 4 4 4 5 4 6 4 7 4 8 4 ··· 1 5 2 5 3 5 4 5 5 5 6 5 7 5 8 5 ··· 1 6 2 6 3 6 4 6 5 6 6 6 7 6 8 6 ··· 1 7 2 7 3 7 4 7 5 7 6 7 7 7 8 7 ··· 1 8 2 8 3 8 4 8 5 8 6 8 7 8 8 8 ··· .. . .. . .. . .. . .. . .. . .. . .. . entlang der Pfeile und unter Auslassung der ungekürzten (wiederholten) Brüche erhalten wir eine eineindeutige Abbildung f : N → Q>0 von N auf Q>0 mit f (1) = 1, f (2) = 2, f (3) = 21 , f (4) = 3, f (5) = 23 , f (6) = 23 , f (7) = 13 , . . . . Damit erhalten wir: Satz 3.6.13. Die Menge der positiven rationalen Zahlen Q>0 ist gleichmächtig zur Menge der natürlichen Zahlen N. Folgerung 3.6.14. Z, Q> und Q sind wie jede andere unendliche Teilmenge von Q abzählbar. Angenommen, die reellen Zahlen in ]0, 1[ wären abzählbar, d.h., es gäbe eine Aufzählung (ri )i∈N der reellen Zahlen, r[N] = ]0, 1[. Wir stellen die ri als Dezimalbruch ohne Neuner-Periode eindeutig dar, Cantorsches Diagonalverfahren ∞ ri = ∑ ri,k 10−k−1 , ri,k ∈ {0, 1, . . . , 9} , k=0 Sei ∞ ρ= ∑ ρk 10−k−1 k=0 68 ( 1, mit ρk = 2, falls rk,k 6= 1 , falls rk,k = 1 . 3.6 Endliche und unendliche Mengen Dann ist die reelle Zahl ρ ∈ ]0, 1[ von allen reellen Zahlen ri verschieden. Wir erhalten also den Widerspruch ]0, 1[ 3 ρ 6∈ r[N] = ]0, 1[ . Satz 3.6.15. Das Intervall ]0, 1[ ist nicht gleichmächtig zu N, d.h., ]0, 1[ ist überabzählbar. Durch Konstruktion einer geeigneten Bijektion folgt, daß alle Intervalle ]a, b[, a < b, und sogar R gleichmächtig zu ]0, 1[ sind. Satz 3.6.16. Das Intervall ]0, 1[ und das Quadrat ]0, 1[ × ]0, 1[ sind gleichmächtig. Beweis. Betrachte die Abbildung b : ]0, 1[ × ]0, 1[ → ]0, 1[, welche das Paar (0.a1 a2 a3 . . . , 0.b1 b2 b3 . . .) auf 0.a1 b1 a2 b2 a3 b3 . . . abbildet. Folgerung 3.6.17. R und alle Rk , k ∈ N>0 , (und somit auch C) sind gleichmächtig zu ]0, 1[ und damit überabzählbar. Diagonalverfahren für Potenzmengen Satz 3.6.18. Ist M eine Menge, so sind M und 2M nicht gleichmächtig. Insbesondere ist 2N überabzählbar. Beweis. Angenommen, M und 2M wären gleichmächtig und φ : M → 2M wäre eine Bijektion. Sei Ω = {x ∈ M : x 6∈ φ (x)} . Dann ist Ω ∈ 2M , es existiert also ein ω ∈ M mit φ (ω) = Ω . Nach Definition von Ω folgt aus ω ∈ φ (ω) bzw. ω 6∈ φ (ω) jeweils ein Widerspruch. Folgerung 3.6.19. Die Menge F aller Folgen in {0, 1} ist überabzählbar. Beweis. 2N kann mit der Menge der 0-1-Folgen identifiziert werden. 3.6.4 Exkurs: Kardinalzahlen Bisher haben wir bei unendlichen Mengen nur zwischen abzählbaren und überabzählbaren Mengen unterschieden. Die Gleichmächtigkeit erlaubt aber noch weitere Differenzierungen. 69 3 Grenzwerttheorie Definition 3.6.20. Sei M eine Menge. Dann heißt Menge card(M) = |M| = {N : M ∼ N} aller zu M gelichmächtigen Mengen die Kardinalzahl von M. Die Kardinalzahl von N bzw. R heißen ℵ0 bzw. c. (ℵ, gesprochen Aleph, ist der erste Buchstabe im hebräischen Alphabet.). Kardinalzahlen unendlicher Mengen heißen transfinite Kardinalzahlen. ♦ Bemerkung 3.6.21. 1. Die Menge Ñ der Kardinalzahlen endlicher Mengen ist eine Menge natürlicher Zahlen: Durch b : N → Ñ mit b(n) = card(N<n ) ist eine Bijektion von N auf Ñ gegeben, welche die Nachfolgerabbildung überträgt. 2. Die Objekte n, {0, 1, . . . , n − 1} = N<n und card({0, 1, . . . , n − 1}) können somit miteinander identifiziert werden. 3. Wegen Z ∼ N und card(N) = ℵ0 gilt card(Z) = ℵ0 . 4. Es gilt card(Rk ) = card(R) = card(2N ) = c für alle k ∈ N>0 . ♦ Für Kardinalzahlen a und b sei a≤b a<b :⇔ :⇔ ∃A ∈ a, B ∈ b, φ : A → B : a ≤ b ∧ a 6= b . φ ist injektiv ; Satz 3.6.22. Für Kardinalzahlen a, b gilt Schröder-Bernstein: (a ≤ b ∧ b ≤ a) ⇒ a = b ; a ≤ b∨b ≤ a. Beweis. Nicht trivial. Aufgrund von Satz 3.6.18 und 3.6.22 gilt N card(N) < card(2N ) < card(22 ) < · · · . Es gibt also viele transfinite Kardinalzahlen. 3.7 Oberer und unterer Limes Im folgenden wenden wir uns der Struktur nicht notwendig konvergenter Folgen zu. Mit Satz 3.2.11 haben wir gezeigt, daß alle Teilfolgen einer konvergenten Folge gegen denselben Grenzwert konvergieren. Andererseits haben wir auch gesehen, daß divergente Folgen konvergente Teilfolgen besitzen können. 70 3.7 Oberer und unterer Limes ♦ Beispiel 3.7.1. Betrachte die Folgen: 1. (an )n∈N mit a2n = 0, a2n+1 = 1. 2. (an )n∈N als Durchnummerierung der rationalen Zahlen in ]0, 1[. 3. (an )n∈N = (n)n∈N . 4. (an )n∈N = (−n)n∈N . 5. (an )n∈N mit a2n = n und a2n+1 = 0. 6. (an )n∈N als Durchnummerierung der positiven rationalen Zahlen. 7. (an )n∈N als Durchnummerierung der rationalen Zahlen. Definition 3.7.2. Die Grenzwerte von Teilfolgen einer Folge nennt man Limeswerte oder Häufungswerte dieser Folge. Die Menge aller Limeswerte einer Folge heißt Limesmenge der Folge. ♦ Bezeichnung: H(a) ist Menge der Limespunkte der Folge a = (an )n∈N . Sei (xn )n∈N eine reelle Folge. Wir definieren die Zahlen mk := inf{xi : i ≥ k} und Mk := sup{xi : i ≥ k} . Dann gelten 1. ∀k ∈ N : 2. ∀k, l ∈ N : 3. ∀k ∈ N : − ∞ ≤ mk ≤ xk ≤ Mk ≤ ∞; mk ≤ Ml ; mk ≤ mk+1 , Mk+1 ≤ Mk . von oben beschränkt, Mk von unten beschränkt, mk Wenn x endlich. dann sind alle mk und Mk beschränkt, Sei x von unten beschränkt. Dann sind alle mk endlich und die Zahl ξ = lim mk = sup{mk : k ∈ N} = lim inf{xi : i ≥ k} =: lim inf xn k→∞ k→∞ n→∞ existiert in R ∪ {+∞}. Ist x nicht von unten beschränkt, dann gilt mk = −∞ für alle k ∈ N und wir setzen lim inf xn := −∞ . n→∞ 71 3 Grenzwerttheorie Sei x von oben beschränkt. Dann sind alle Mk endlich und die Zahl η = lim Mk = inf{Mk : k ∈ N} = lim sup{xi : i ≥ k} =: lim sup xn k→∞ k→∞ n→∞ existiert in R ∪ {−∞}. Ist x nicht von oben beschränkt, dann gilt Mk = ∞ für alle k ∈ N und wir setzen lim sup xn := ∞ . n→∞ Die so definierten Zahlen lim infn→∞ xn und lim supn→∞ xn heißen Limes inferior (unterer Grenzwert) bzw. Limes superior (oberer Grenzwert) der Folge. Offenbar gilt ξ = lim inf xn ≤ lim sup xn = η n→∞ und ξ , η ∈ [−∞, ∞] . n→∞ Satz 3.7.3. Sei (xn )n∈N eine reelle Folge und ξ = lim infn→∞ xn , η = lim supn→∞ xn . Dann gelten: 1. ξ und η sind (eventuell uneigentliche) Grenzwerte von Teilfolgen von (xn )n∈N . 2. Ist (xnk )k∈N eine beliebige (eigentlich oder uneigentlich) konvergente Teilfolge von (xn )n∈N mit Grenzwert a, dann gilt ξ ≤ a ≤ η. 3. Die Folge (xn )n∈N ist (eigentlich oder uneigentlich) konvergent genau dann, wenn lim inf xn = lim sup xn . n→∞ n→∞ Betrachten wir nun Beispiel 3.7.1. Bei 1. sind 0 und 1 Limespunkte, lim infn→∞ an = 0, lim supn→∞ an = 1. Bei 2. gilt H(a) = [0, 1], lim infn→∞ an = 0, lim supn→∞ an = 1. Bei 3. gilt H(a) = 0/ aber lim infn→∞ an = lim supn→∞ an = ∞. Bei 4. gilt H(a) = 0/ und lim infn→∞ an = lim supn→∞ an = −∞. Bei 5. gilt H(a) = {0} und lim infn→∞ an = 0, lim supn→∞ an = ∞. Bei 6. gilt H(a) = R≥0 und lim infn→∞ an = 0, lim supn→∞ an = ∞. Bei 7. gilt H(a) = R und lim infn→∞ an = −∞, lim supn→∞ an = ∞.. Bemerkung 3.7.4. Bezeichnen wir die Menge aller eigentlichen oder uneigentlichen Grenzwerte der Teilfolgen einer reellen Folge x mit Huneig (x), so gilt 1. Huneig (x) 6= 0, / 2. H(x) = Huneig (x), wenn x beschränkt ist, 3. lim infn→∞ xn = inf Huneig (x) und lim supn→∞ xn = sup Huneig (x). 72 4 Unendliche Reihen 4.1 Konvergenz von Zahlenreihen 4.1.1 Definition Definition 4.1.1. Sei z = (zn )n∈N eine Folge in C. Sei s = (sn )n∈N mit n sn := ∑ zi i=0 die n-te Partialsumme. Die Folge der Partialsummen s heißt unendliche Reihe und wird mit ∑∞ ♦ i=0 zi bezeichnet. Bemerkung 4.1.2. 1. Es gilt also ∞ n i=0 i=0 ∑ zi = ∑ zi ! . n∈N 2. Die Bezeichnung ist in folgender Hinsicht gerechtfertig: Ist s eine gegebene Folge in C, dann ist sie die Partialsummenfolge der eindeutig bestimmten Folge z mit z0 = s0 und weiter zn+1 = sn+1 − sn . 3. Konvergenzbegriff und -kriterien übertragen sich somit von Folgen auf Reihen, andererseits ergeben neue Konvergenzkriterien für Reihen auch weitere Konvergenzkriterien für Folgen! ♦ Da eine unendliche Reihe auch nur eine Folge ist, haben wir: n Definition 4.1.3. Die Reihe ∑∞ i=0 zi heißt konvergent, wenn die Folge s = (∑i=0 zi )n∈N ihrer Partialsummen konvergiert. Der Grenzwert s heißt Summe der Reihe und wird ebenfalls ∞ n mit ∑∞ i=0 zi bezeichnet. Die Reihe ∑i=0 zi heißt divergent, wenn die Folge (∑i=0 zi )n∈N divergiert. ♦ n ∞ Bemerkung 4.1.4. Die Reihe s = ∑∞ i=0 zi = (∑i=0 zi )n∈N und ihr Grenzwert s = ∑i=0 zi werden also mit dem gleichem Symbol bezeichnet. Je nach Kontext ist also zu unterscheiden, ob die Reihe, ihr Grenzwert oder beide gemeint sind. ♦ 73 4 Unendliche Reihen 4.1.2 Allgemeine Konvergenzkriterien Satz 4.1.5 (Cauchy-Konvergenzkriterium für Reihen). Die Reihe ∑∞ i=0 zi konvergiert genau dann, wenn m ∀ε > 0 ∃N ∈ N ∀m ≥ n ≥ N : | ∑ zi | < ε . i=n Beweis. Für die Partialsummen sn gilt m |sn − sm | = | ∑ zi | . i=n+1 Folgerung 4.1.6 (Notwendige Bedingung ). Ist ∑∞ i=0 zi konvergent, dann zn → 0. Beweis. Wähle in Cauchy-Bedingung m = n. Bemerkung 4.1.7. zn → 0 ist nicht hinreichend für die Konvergenz! Betrachte z.B. ∑∞ i=0 zi 1 √ mit z0 = 0, zn = √1n für n > 0, d.h., ∑∞ . Dann gilt z → 0 aber n i=1 i √ 1 1 1 1 sn = √ + √ + · · · + √ > n · √ = n → ∞ . n n 1 2 ♦ Satz 4.1.8. ∞ 1. Seien ∑∞ i=0 zi und ∑i=0 wi konvergente Reihen mit den Grenzwerten Z und W . Dann gilt: a) ∑∞ i=0 (zi + wi ) ist eine konvergente Reihe mit dem Grenzwert Z +W . b) Für jedes c ∈ C konvergiert ∑∞ i=0 (czi ) gegen cZ. 2. Wenn man in einer Reihe eine beliebige endliche Anzahl von Gliedern wegläßt, ersetzt oder beifügt, dann bleibt ihre Konvergenz (oder Divergenz) erhalten. Beweis. ÜA 4.2 Spezielle Reihen 4.2.1 Geometrische Reihen Definition 4.2.1. Die Reihe ∑∞ n=0 an heißt positiv, wenn an ∈ R≥0 für n ∈ N. 74 ♦ 4.2 Spezielle Reihen Die Folge der Partialsummen einer positiven Reihe ist monoton wachsend. Damit erhält man aus Satz 3.3.14 sofort: Satz 4.2.2. Eine positive Reihe konvergiert genau dann, wenn die Folge der Partialsummen beschränkt ist. n Definition 4.2.3. Sei q ∈ C. Dann heißt ∑∞ n=0 q geometrische Reihe. ♦ n Lemma 4.2.4. Die geometrische Reihe ∑∞ n=0 q konvergiert genau dann, wenn |q| < 1. Beweis. a) Sei |q| < 1. Dann gilt für sn = ∑ni=0 qi (1 − q)sn = (1 − q)(1 + q + q2 + · · · + qn ) = 1 + q + q2 + · · · + qn − q − q2 − · · · − qn+1 = 1 − qn+1 , d.h., sn = 1 − qn+1 1 qn+1 1 = − → für n → ∞ . 1−q 1−q 1−q 1−q b) Sei |q| ≥ 1. Dann ist |qi | = |q|i ≥ 1, d.h., (qi )∞ i=1 ist keine Nullfolge. Nach Folgerung 4.1.6 kann die Reihe also nicht konvergieren. 4.2.2 Harmonische Reihen 1 Definition 4.2.5. Sei α > 0. Dann heißt ∑∞ n=1 nα harmonische Reihe. Offenbar ist die notwendige Bedingung wegen 1 nα ♦ → 0 stets erfüllt. 1 Lemma 4.2.6. Die harmonische Reihe ∑∞ n=1 nα konvergiert genau dann, wenn α > 1. Beweis. Sei α > 1. Nach Satz 4.2.2 genügt es zu zeigen, daß sn = ∑ni=1 i1α beschränkt ist. Sei n ∈ N und sei m ∈ N mit n ≤ 2m . Es gilt 1 1 1 1 1 1 1 sn ≤ s2m = 1 + α + α + α + α + α + α + α + · · · 2 3 4 5 6 7 8 | {z } | {z } <2· 21α = 1 2α−1 <4· 41α = 1 (22 )α−1 1 1 + +···+ m α . (2m−1 + 1)α (2 ) | {z } <2m−1 1 (2m−1 )α = 1 (2m−1 )α−1 Damit 1 sn ≤ 1 + α 2 + 1 2 +···+ α−1 1 (2m−1 )α−1 = 1 m−1 1−α i + ∑ (2 ). 2α i=0 75 4 Unendliche Reihen Da 21−α < 1, stehen auf der rechten Seite die Partialsummen einer konvergenten geometrischen Reihe. Damit ist (sn ) beschränkt und nach Satz 4.2.2 ist die Reihe konvergent. Sei α = 1. Wir betrachten 1 1 1 1 1 1 1 1 1 + + + + + + + · · · + m−1 +···+ m s2m = 1 + 2 3 4 5 6 7 8 2 +1 2 | | {z } | {z } {z } >2· 41 = 12 >4· 18 = 21 >2m−1 21m = 21 1 >m → ∞ für m → ∞ . 2 Damit ist die Folge der Partialsummen (bestimmt) divergent. Sei α < 1. Dann gilt 1 nα > 1 n für n ∈ N>1 . Damit gilt n n 1 1 > ∑ iα ∑ i → ∞ für n → ∞ . i=1 i=1 4.3 Weitere Konvergenzsätze 4.3.1 Vergleichskriterien Satz 4.3.1 (Majoranten- oder Vergleichskriterium ). C. Dann gilt: 1. Sei a : N → C eine Folge in ∞ a) Die Konvergenz der Reihe ∑∞ n=0 |an | impliziert die Konvergenz von ∑n=0 an . ∞ b) Die Divergenz der Reihe ∑∞ n=0 an impliziert die Divergenz von ∑n=0 |an |. 2. Seien a, b : N → R Folgen in R und sei c > 0 mit 0 ≤ an ≤ cbn für n ≥ N. Dann gilt: ∞ a) Die Konvergenz von ∑∞ n=0 bn impliziert die Konvergenz von ∑n=0 an . ∞ b) Die Divergenz von ∑∞ n=0 an impliziert die Divergenz von ∑n=0 bn . Beweis. 1.a) Sei ε > 0. Aus der Konvergenz von ∑∞ n=0 |an | folgt die Existenz eines N ∈ N, so daß |am | + |am+1 | + · · · + |an | ≤ ε für alle n > m ≥ N. Wegen |am + am+1 + · · · + an | ≤ |am | + |am+1 | + · · · + |an | ≤ ε für alle n > m ≥ N, folgt die Konvergenz von ∑∞ n=0 an aus Satz 4.1.5. 1.b) Folgt direkt aus 1.a). 2.a) Seien sn = ∑ni=0 ai und tn = ∑ni=0 cbi . Dann gilt 0 ≤ sn ≤ tn (eventuell nach Änderung endlich vieler Summanden). Wenn (tn ) konvergiert, dann ist (sn ) beschränkt und konvergiert nach Satz 4.2.2. 2.b) Folgt direkt aus 2.a). 76 4.3 Weitere Konvergenzsätze 4.3.2 Exkurs: Weitere Vergleichskriterien Satz 4.3.2. Seien a, b : N → R≥0 Folgen in R≥0 und es existiere der (uneigentliche) Grenzwert lim abnn = L. ∞ 1. Falls 0 < L < ∞, dann konvergiert ∑∞ n=0 an genau dann, wenn ∑n=0 bn konvergiert. ∞ 2. Falls L = 0, dann impliziert die Konvergenz von ∑∞ n=0 bn diejenige von ∑n=0 an . ∞ 3. Falls L = ∞, dann impliziert die Konvergenz von ∑∞ n=0 an diejenige von ∑n=0 bn . Beweis. 1. Aus 0 < L < ∞ folgt die Existenz eines N ∈ N mit 12 L < abnn < 2L für n ≥ N. Somit gelten 0 < an < 2Lbn und 0 < 12 Lbn < an für n ≥ N. Durch Anwendung von Satz 4.3.1 folgt die Behauptung. 2. Sei L = 0. Dann existiert ein N ∈ N mit 0 < an ≤ bn für n ≥ N. Die Behauptung folgt nun aus Satz 4.3.1. 3. Sei L = ∞. Dann existiert ein N ∈ N mit 0 < bn ≤ an für n ≥ N. Die Behauptung folgt wieder aus Satz 4.3.1. n−3 Beispiel 4.3.3. 1. Wir betrachten ∑∞ n=1 n2 +2 . Da n−3 n2 +2 n→∞ 1 n lim n2 − 3n =1=L n→∞ n2 + 2 = lim 1 folgt die Divergenz der Reihe aus der Divergenz der harmonischen Reihe ∑∞ n=1 n (Lemma 4.2.6). 7n+1 2. Wir betrachten ∑∞ n=1 n3 +2n . Da 7n + 1 3 7n3 + n2 =7=L lim n + 2n = lim 3 1 n→∞ n→∞ n + 2n n2 1 folgt die Konvergenz der Reihe aus der Konvergenz der harmonischen Reihe ∑∞ n=1 n2 (Lem♦ ma 4.2.6). Satz 4.3.4. Seien (an ) und (bn ) Folgen in R≥0 mit aan+1 ≤ ∞ ∞ n ziert die Konvergenz von ∑n=0 bn diejenige von ∑n=0 an . bn+1 bn für alle n ≥ N. Dann impli- Beweis. O.b.d.A. sei N = 0. Es gilt an b1 b2 bn a1 a2 · ····· ≤ · ····· a0 a1 an−1 b0 b1 bn−1 und damit an ≤ a0 b0 bn . Mit Satz 4.3.1 folgt die Behauptung. 77 4 Unendliche Reihen 4.3.3 Alternierende Reihen Definition 4.3.5. Sei c : N → R≥0 eine Folge in R≥0 . Dann heißen ∞ ∑ (−1)ncn und n=0 ∞ ∑ (−1)n+1cn n=0 ♦ alternierende Reihen. i Sei cn & 0. Für die Partialsummen sn = ∑ni=0 (−1)i ci einer alternierenden Reihe ∑∞ i=0 (−1) ci gilt b2n+1 := b2n+2 := 2n+1 2n i=0 i=0 (−1)i ci = s2n+1 ≤ s2n+2 ≤ s2n = ∑ (−1)i ci =: a2n =: a2n+1 ≤ c0 , ∑ mit 0 ≤ c0 − c1 ≤ b2n ≤ b2n+1 = b2n+2 ≤ s2n+2 ≤ a2n+2 ≤ a2n+1 = a2n ≤ c0 . Ist c eine Nullfolge, dann gilt bn − an → 0 und nach Satz 3.3.16 und 3.3.5 konvergieren a, s und b gegen den gleichen Grenzwert. Ist s die Summe der Reihe, dann gilt s2n+1 = s2n − c2n+1 ≤ s ≤ s2n . Da ∞ ∞ n=0 n=0 ∑ (−1)n+1cn = − ∑ (−1)ncn , n+1 c übertragen. können wir diese Ergebnisse auch auf ∑∞ n n=0 (−1) Es gilt somit Satz 4.3.6 (Leibnitz-Kriterium für alternierende Reihen). Wenn c : N → R≥0 eine mo∞ n n+1 c noton fallende Nullfolge in R≥0 ist, dann konvergieren ∑∞ n n=0 (−1) cn und ∑n=0 (−1) und für ihre Summe s gilt 2n+1 2n i=0 i=0 ∑ (−1)ici = s2n+1 ≤ s ≤ s2n = ∑ (−1)ici beziehungsweise 2n 2n+1 i=0 i=0 ∑ (−1)i+1ci = s2n ≤ s ≤ s2n+1 = ∑ (−1)i+1ci . Damit ist die Summe einer alterniernden Reihe durch die n-the Partialsumme bis auf einen Fehler von höchstens cn bestimmt. 78 4.4 Absolute und unbedingte Konvergenz Beispiel 4.3.7. Wir betrachten c0 = 0 und cn = 1 n ∞ für n ∈ N>0 und damit die Reihe 1 ∑ (−1)n+1 n . n=1 Da cn & 0 konvergiert die Reihe nach dem Leibnitzkriterien. Weiter haben wir die Abschätzungen 1− ∞ 1 1 1 1 1 7 1 1 1 5 = ≤ 1− + − = ≤ ∑ (−1)n+1 ≤ 1 − + = ≤ 1 . 2 2 2 3 4 12 n=1 n 2 3 6 Später werden wir zeigen ∞ 1 ∑ (−1)n+1 n = ln 2 . n=1 ♦ 4.3.4 Reihen mit beliebigen Gliedern Satz 4.3.8. Seien a, b : N → R Folgen in R. Wenn 1. a konvergiert monoton gegen 0; 2. Die Menge {βn : n ∈ N} der Partialsummen βn = ∑ni=0 bi ist beschränkt; dann konvergiert ∑∞ i=0 ai bi . Das Leibnitzkriterium ist Spezialfall mit bi = (−1)i . Mit Hilfe des Satzes erhält man ∞ beispielsweise die Konvergenz von ∑∞ n=0 an cos(nx) und ∑n=0 an sin(nx) mit an & 0 für π x 6= 2 + kπ bzw. x 6= kπ, k ∈ Z. 4.4 Absolute und unbedingte Konvergenz 4.4.1 Definition Definition 4.4.1. Sei a : N → C eine Folge in C. Die Reihe ∑∞ n=0 an heißt absolut konvergent, wenn ∑∞ |a | konvergiert. ♦ n=0 n Nach Satz 4.3.1 gilt: Absolute Konvergenz =⇒ Konvergenz . Aber es ist Absolute Konvergenz 6⇐= Konvergenz , n (−1) wie z.B. die Reihe ∑∞ n=1 n zeigt. 79 4 Unendliche Reihen Lemma 4.4.2. Eine positive Reihe ist genau dann absolut konvergent, wenn sie konvergent ist. Definition 4.4.3. Sei a : N → C eine Folge in C. Die Reihe ∑∞ n=0 an heißt bedingt konvergent, wenn sie konvergent aber nicht absolut konvergent ist. ♦ n (−1) Die Reihe ∑∞ n=1 n ist also bedingt konvergent. 4.4.2 Quotienten- und Wurzelkriterium Auf dem Vergleich mit der geometrischen Reihe basieren die beiden folgenden Kriterien. Als Spezialfall enthalten sie Konvergenzaussagen für positive Reihen. Satz 4.4.4 (Cauchysches Wurzelkriterium). Sei a : N → C eine Folge in C und es sei p R = lim sup n |an | . n→∞ Dann gilt: 1. Falls R < 1, dann konvergiert ∑∞ n=1 an absolut. 2. Falls R > 1, dann divergiert ∑∞ n=1 an . 3. Bei R = 1 sind Divergenz und Konvergenz möglich. p Beweis. 1. Sei R < 1. Wähle q mit R < q < 1. Dann existiert ein N ∈ N mit n |an | < q und damit |an | < qn für n ≥ N. Die Konvergenz folgt mit dem Majorantenkriterium Satz 4.3.1 und der Konvergenz der geometrischen Reihe (Lemma 4.2.4). p 2. Sei R > 1. Dann existiert eine Teilfolge (ank )k∈N und ein K ∈ N mit n |an | > 1 und damit |ank | > 1 für k ≥ K. Damit kann a keine Nullfolge sein und mit Folgerung 4.1.6 folgt die Divergenz. 1 ∞ 1 3. Für ( n12 )n≥1 und ( n1 )n≥1 ergibt sich R = 1, ∑∞ n=1 n2 konvergiert und ∑n=1 n divergiert. 1 Beispiel 4.4.5. Betrachte ∑∞ n=1 1 − n s n 1 1− n (n2 ) (n2 ) . Dann 1 = 1− n n = 1 1+ 1 n n−1 → 1 < 1. e Damit konvergiert die Reihe. Leichter zu handhaben als das Wurzelkriterium aber nicht so weitreichend ist 80 ♦ 4.4 Absolute und unbedingte Konvergenz Satz 4.4.6 (D’Alambertsches Quotientenkriterium). Sei a : N → C eine Folge in C. Dann gilt: | < 1, dann konvergiert ∑∞ 1. Falls Q = lim supn→∞ | aan+1 n=0 an absolut. n 2. Falls | aan+1 | ≥ 1 für n ≥ N, dann divergiert ∑∞ n=0 an . n Bemerkung 4.4.7. Insbesondere ist Q = lim supn→∞ | aan+1 | > 1 hinreichend für die Divern genz. ♦ Beweis. 1. Sei Q < 1. Wähle q mit Q < q < 1. Dann existiert ein N ∈ N mit | aan+1 | < q und n −N n damit |an | < |aN |q q für n ≥ N. Die Konvergenz folgt mit dem Majorantenssatz 4.3.1 und der Konvergenz der geometrischen Reihe (Lemma 4.2.4). 2. Wegen | aan+1 | ≥ 1 für n ≥ N, gilt |an | ≥ |aN | > 0 für n ≥ N. Damit kann a keine Nullfolge n sein und mit Folgerung 4.1.6 folgt die Divergenz. z Beispiel 4.4.8. Betrachte ∑∞ n=0 n! für fixiertes z ∈ C. Wegen n |z|n+1 |z| (n + 1)! = →Q=0<1 n |z| n+1 n! z konvergiert ∑∞ n=0 n! absolut. n ♦ 4.4.3 Umordnung einer unendlichen Reihe Definition 4.4.9. Sei φ : N → N eine bijektive Abbildung. Dann heißt ∑∞ n=0 aφ (n) eine Um∞ ordnung der Reihe ∑n=0 an . ♦ Definition 4.4.10. Die Reihe ∑∞ n=0 an heißt unbedingt konvergent, wenn jede Umordnung zur gleichen Summe konvergiert. ♦ Satz 4.4.11. Eine konvergente Reihe ist genau dann unbedingt konvergent, wenn sie absolut konvergent ist. Satz 4.4.12 (Riemannscher Umordnungssatz). Ist ∑∞ n=0 an eine bedingt konvergente Reihe in R, dann gibt es für jedes s ∈ R eine Umordnung φ mit s = ∑∞ n=0 aφ (n) . Beweis. Seien a+ k ak + |ak | := = 2 ak , falls ak > 0 , 0 , falls ak ≤ 0 und a− k ak − |ak | := = 2 0 , falls ak ≥ 0 , ak , falls ak < 0 . 81 4 Unendliche Reihen − + ∞ ∞ Dann gilt ak = a+ k + ak . Wegen der Konvergenz der Reihe ∑k=0 ak müssen ∑k=0 ak und − ∞ ∑k=0 ak entweder beide konvergieren oder beide divergieren. Konvergieren sie beide, dann ist ∑∞ k=0 ak im Gegensatz zur Voraussetzung absolut konvergent. Also divergieren sie beide. Zur Folge (ak ) bilden wir die Teilfolgen (pk ), (nk ) der positiven bzw. negativen Glieder. Sei s ∈ R beliebig. Sei k0 die kleinste natürliche Zahl mit k0 ∑ pi > s . i=0 Dann wählen wir k1 als kleinste natürliche Zahl mit k0 k1 i=0 i=0 ∑ pi + ∑ ni < s . Danach bestimmen wir k2 als kleinste natürliche Zahl mit k0 k1 i=0 i=0 ∑ pi + ∑ ni + k2 ∑ pi > s . i=k0 +1 Durch Fortsetzung dieses Verfahrens erhalten wir eine Umordung der Reihe. Nach Konstruktion der Umordnung unterscheiden sich die zugehörigen Partialsummen von i = k2m bis k2m + k2m+1 mit m ∈ N höchstens um pk2m und von i = k2m+1 bis k2m+1 + k2m+2 höchstens um nk2m+1 von s. Da (pi ) und (ni ) Nullfolgen sind, folgt die Konvergenz gegen s. 4.4.4 Produktreihen Definition 4.4.13. Sei φ : N → N × N eine Bijektion. Dann heißt ∑∞ n=0 aφ 1 (n) bφ 2 (n) eine ∞ Produktreihe von ∑∞ a und b . ♦ ∑n=0 n n=0 n In einer Produkreihe werden also alle Produkte ak bi in einer (durch φ ) vorgegebenen Reihefolge „aufsummiert“. ∞ Satz 4.4.14 (Multiplikationssatz). Die Reihen ∑∞ n=0 an und ∑n=0 bn seien absolut konvergent. Dann konvergiert jede ihrer Produktreihen gegen die gleiche Summe. Bemerkung 4.4.15. 1. Unter den Voraussetzungen des Satzes wird der Grenzwert einer Produktreihe mit ! ! ∞ ∑ an · n=0 ∞ ∞ ∑ bn ∑ oder n=0 am bn m,n=0 bezeichnet. 2. Unter den Produktreihen spielt die Cauchysche Produktreihe eine besondere Rolle: ! ! ! ∞ ∑ an n=0 82 ∞ · ∑ bn n=0 = ∞ n n=0 k=0 ∑ ∑ ak bn−k . ♦ 5 Grenzwerte und Stetigkeit bei Abbildungen 5.1 Grenzwerte 5.1.1 Der Grenzwert einer Abbildung in einem Punkt Seien (X, ρ), (Y, d) metrische Räume, F : D ⊆ X → Y eine Abbildung und a ein Häufungspunkt von D. Definition 5.1.1. Ein Punkt y0 ∈ Y heißt Grenzwert der Abbildung F im Punkt a, wenn für jede Umgebung V des Punktes y0 (in Y ) eine Umgebung U von a (in X) existiert, so daß das Bild von (U ∩ D) \ {a} unter F in V liegt: ∀Umg.V von y0 ∃Umg. U von a ∀x ∈ (U ∩ D) \ {a} : F(x) ∈ V . (5.1.1) ♦ Bezeichnung: y0 = lima F oder y0 = limx→a F(x). Da man Umgebungen durch Kugeln ersetzen kann, kann man den Sachverhalt auch wie folgt beschreiben: ∀ε > 0 ∃δ > 0 ∀x ∈ D \ {a} mit ρ(x, a) < δ : d(F(x), y0 ) < ε . Spezialfall: Sei (X, ρ) = (Y, d) = (R1 , d) mit euklidischer Metrik, D ⊆ R1 , a HP von D, f : D → R1 . Dann y0 = lim f a ⇔ ∀ε > 0 ∃δ > 0 ∀x ∈ D \ {a} mit |x − a| < δ : | f (x) − y0 | < ε . Satz 5.1.2 (Charakterisierung des Grenzwertes durch Folgen). Seien (X, ρ), (Y, d) metrische Räume. Die Abbildung F : D ⊆ X → Y besitzt im HP a von D den Grenzwert y0 genau dann, wenn für jede beliebige Folge (xn )n∈N in D \ {a} mit xn → a die Folge (F(xn ))n∈N gegen y0 konvergiert. Beweis. ⇒ Sei y0 Grenzwert von F an der Stelle a. Wir betrachten nun eine beliebige Folge (xn )n∈N in D \ {a} mit xn → a und haben F(xn ) → y0 zu zeigen. Dazu sei ε > 0 beliebig. Dann existiert ein δ > 0 mit d(F(x), y0 ) < ε für alle x ∈ D \ {a} mit ρ(x, a) < δ . Weiter existiert ein N ∈ N mit ρ(xn , a) < δ für n ≥ N. Damit d(F(xn ), y0 ) < ε für n ≥ N. 83 5 Grenzwerte und Stetigkeit bei Abbildungen ⇐ Sei nun F(xn ) → y0 für jede Folge (xn )n∈N in D \ {a} mit xn → a. Angenommen, y0 ist nicht Grenzwert von F bei a. Dann ∃ε > 0 ∀δ > 0 ∃x ∈ D \ {a} mit ρ(x, a) < δ : d(F(x), y0 ) ≥ ε . Sei ε > 0 mit dieser Eigenschaft. Für alle n ∈ N>0 finden wir also Punkte xn ∈ D \ {a} mit ρ(xn , a) < δ = 1n und d(F(xn ), y0 ) ≥ ε. Die Folge (xn )n∈N konvergiert dann gegen a, F(xn ) konvergiert aber, im Widerspruch zur Voraussetzung, nicht gegen y0 . Folgerung 5.1.3. Der Grenzwert einer Abbildung in einem Punkt ist eindeutig. Beweis. Seien y0 und y1 Grenzwert von F bei a. Dann gilt nach Satz 5.1.2 F(xn ) → y0 und F(xn ) → y1 für jede Folge (xn )n∈N in D \ {a} mit xn → a. Aus der Eindeutigkeit des Grenzwertes von Folgen folgt y0 = y1 . −1, x < 0 0, x = 0 auf D = R1 . Dann existiert kein GrenzBeispiel 5.1.4. 1. f (x) = sgn(x) = 1, x>0 wert von f bei 0, obwohl f (0) = 0 existiert. 2 −1 auf D = R \ {−1}. a = −1 ist HP von D und −2 ist Grenzwert von f bei 2. f (x) = xx+1 −1. Beachte: f 6= g mit g(x) = x − 1 auf D(g) = R 6= D( f ). 3. f (x) = (x1 )2 +(x2 )2 2(x1 +x2 ) auf D = R2 \ {x : x1 + x2 = 0}. Als HP von D wählen wir a = 0. Sei xn = ( n1 , 1n α) mit α 6= −1. Dann xn → a und f (xn ) = mit α 6= 0. Dann xn → a und f (xn ) = keinen Grenzwert bei 0 besitzen. 1+( αn −1)2 2α → 1 α 1+α 2 2n(1+α) = 0. Sei xn = ( 1n , 1n ( αn − 1)) 6= 0. Damit kann f nach Satz 5.1.2 ♦ 5.1.2 Eigenschaften des Grenzwertes reellwertiger Funktionen Die Eigenschaften des Grenzwertes einer Funktion f : D ⊂ X → R ergeben sich nach Satz 5.1.2 aus den entsprechenden Eigenschaften von Grenzwerten von Folgen: 1. Sei y0 = lima f und p > y0 . Dann existiert eine Umgebung U von a so, daß f (x) < p für alle x ∈ (U ∩ D) \ {a}. 2. Wenn lima f > 0, dann existiert eine Umgebung U von a mit f (x) > 0 für alle x ∈ (U ∩ D) \ {a}. 3. Seien f und g zwei reellwertige Funktionen mit D( f ) ∩ D(g) =: M 6= 0. / Sei a HP der Menge M und es existiere lima f und lima g. Gibt es eine Umgebung U von a mit f (x) ≤ g(x) für x ∈ (U ∩ M) \ {a}, dann gilt lima f ≤ lima g. 4. Gibt es eine Umgebung U von a mit f (x) ≥ 0 für alle x ∈ (U ∩ D( f )) \ {a} und existiert lima f , dann lima f ≥ 0. 84 5.1 Grenzwerte 5. Seien f , g, h reellwertige Funktionen mit D( f ) ∩ D(g) ∩ D(h) =: M 6= 0. / Sei a HP der Menge M. Gibt es eine Umgebung U von a mit f (x) ≤ g(x) ≤ h(x) für x ∈ (U ∩ M) \ {a}, dann folgt aus lima f = lima h die Existenz von lima g und lima f = lima g = lima h. 6. Besitzt eine Funktion f in einem HP a von D( f ) einen Grenzwert, dann existiert eine Umgebung U von a, so daß f auf U ∩ D( f ) beschränkt ist. 7. Seien f und g zwei reellwertige Funktionen mit D( f ) ∩ D(g) =: M 6= 0. / Sei a HP der Menge M und es existiere F = lima f und G = lima g. Dann a) lima ( f ± g) = F ± G, b) lima ( f g) = FG, c) lima ( f /g) = F/G, falls G 6= 0. 8. Seien X, Y , Z metrische Räume und S und T Abbildungen mit S T X −→ Y −→ Z . Sei a HP von X. Wenn lima S = b HP von Y ist und limb T = c ∈ Z, dann lima T ◦ S = limlima S T = c. 5.1.3 Einseitige Grenzwerte Wir betrachten Abbildungen einer reellen Variablen mit Werten im metrischen Raum (Y, d). Definition 5.1.5. A ∈ Y heißt linksseitiger (rechtsseitiger) Grenzwert von f : D( f ) ⊆ R → Y an der Stelle a, wenn A = lima g mit g := f E , E :=]−∞, a[∩D( f ) bzw. E :=]a, ∞[∩D( f ), d.h., D(g) = E und g(x) = f (x) für x ∈ E. ♦ Bezeichnung: Man schreibt dann A = lima−0 f , A = limx→a−0 f (x) oder A = limx%a f (x) für linksseitige bzw. A = lima+0 f , A = limx→a+0 f (x) oder A = limx&a f (x) für rechtseitige Grenzwerte. A ist also linksseitiger Grenzwert von f an einem HP a von D∩ ] − ∞, a[, wenn ∀ε > 0∃δ > 0∀x ∈ D mit a − δ < x < a : d( f (x), A) < ε . Beispiel 5.1.6. f (x) = sgnx auf D = R. Dann lim−0 f = −1 und lim+0 f = 1. ♦ Satz 5.1.7. Die Abbildung f : D( f ) ⊆ R → Y besitzt im HP a von D∩ ]−∞, a[ und D∩ ]a, ∞[ den Grenzwert A = lima f genau dann, wenn lima−0 f und lima+0 f existieren und A = lima−0 f = lima+0 f . 85 5 Grenzwerte und Stetigkeit bei Abbildungen 5.1.4 Uneigentliche Grenzwerte und Grenzwerte im Unendlichen Sei f (x) = 1 |x| auf D = R \ {0}. Dann ist a = 0 HP von D. Für diese Funktion gilt: ∀K > 0 ∃δ > 0 ∀x ∈ D mit |x − a| < δ : f (x) ≥ K . Definition 5.1.8. Sei f : D ⊆ R → R eine Funktion, a HP von D. Man sagt, die Funktion f hat bei a den (uneigentlichen) Grenzwert +∞, wenn ∀K > 0 ∃δ > 0 ∀x ∈ D \ {a} mit |x − a| < δ : f (x) ≥ K . Analog definiert man den Grenzwert −∞. ♦ Bezeichnung: Man schreibt lima f = +∞ oder limx→a f (x) = +∞ bzw. lima f = −∞ oder limx→a f (x) = −∞. Sei nun f (x) = 5x−3 x auf D = R \ {0}. Uns interessiert das Verhalten von f bei immer größer werdenden x. Für diese Funktion gilt: ∀ε > 0 ∃δ > 0 ∀x ∈ D mit x > δ : | f (x) − 5| < ε und ∀ε > 0 ∃δ > 0 ∀x ∈ D mit x < −δ : | f (x) − 5| < ε . Definition 5.1.9. Sei f : D ⊆ R → R eine Funktion, E := {1/x : x ∈ D∩ ]0, ∞[} und g : E → R mit g(t) = f (1/t) für t ∈ E. Wenn 0 HP von E und wenn der (eigentliche oder uneigentliche) Grenzwert lim0 g existiert, dann nennt man lim0 g den (eigentlichen oder uneigentlichen) Grenzwert von f in +∞: lim f := lim g . +∞ 0 ♦ Analog wird lim−∞ f definiert. 5.1.5 Die erweiterten reellen Zahlen Wir kommen nun zur Begründung der Erweiterung der Rechenoperationen von den reellen Zahlen auf die Menge R = R ∪ {−∞} ∪ {+∞}. Eine Erweiterung sollte so geschehen, daß die entsprechenden Resultate auch für Grenzwerte von Funktionen gelten: Seien F, G ∈ R und op ∈ {+, −, ·, /}. Dann sollte F op G so definiert werden, daß lim( f op g) = F op G a für beliebige Funktionen f : D( f ) ⊆ R → R, g : D(g) ⊆ R → R mit lima f = F, lima g = G und a HP von D( f ) ∩ D(g) gilt. Nach Abschnitt 5.1.2 brauchen wir nur noch Kombinationen von F und G betrachten, bei denen wenigstens einmal +∞ oder −∞ auftritt, da auch hier die Division durch 0 nicht definiert werden kann. So überlegt man sich: 86 5.2 Stetigkeit 1. (+∞) + (+∞) = (+∞) − (−∞) = (+∞) + x = x + (+∞) = +∞ für x ∈ R. 2. (−∞) + (−∞) = (−∞) − (+∞) = (−∞) + x = x + (−∞) = −∞ für x ∈ R. 3. (+∞) · (+∞) = (−∞) · (−∞) = (+∞) · x = x · (+∞) = (−∞) · y = y · (−∞) = +∞ für x ∈ R>0 und y ∈ R<0 . 4. (+∞) · (−∞) = (−∞) · (+∞) = (−∞) · x = x · (−∞) = (+∞) · y = y · (+∞) = −∞ für x ∈ R>0 und y ∈ R<0 . 5. x ±∞ = 0 für x ∈ R. ±∞ Offen bleiben (+∞) − (+∞), (−∞) − (−∞), ±∞ ±∞ , ∓∞ , 0 · (+∞), 0 · (−∞) und Grenzwerte der −∞ Form 00 , +∞ 0 , 0 . Hier müssen entsprechende Grenzwertuntersuchungen für die konkreten Funktionen durchgeführt werden. 5.2 Stetigkeit 5.2.1 Stetigkeit in einem Punkt Seien (X, ρ) und (Y, d) metrische Räume und F : D ⊆ X → Y . Definition 5.2.1. Die Abbildung F heißt stetig im Punkt a, wenn a ∈ D und für jede Umgebung V von F(a) (in Y ) eine Umgebung U von a (in X) existiert mit F[D ∩U] ⊆ V : ∀Umg.V von F(a) ∃Umg. U von a ∀x ∈ U ∩ D : F(x) ∈ V . (5.2.1) ♦ Wir können (5.2.1) wieder durch ∀ε > 0∃δ > 0∀x ∈ D mit ρ(x, a) < δ : d(F(x), F(a)) < ε ersetzten. Sind X und Y normierte Räume mit Normen k · kX und k · kY , dann können wir (5.2.1) durch ∀ε > 0∃δ > 0∀x ∈ D mit kx − akX < δ : kF(x) − F(a)kY < ε ersetzten. Die Definition beschreibt eine lokale Eigenschaft (d.h. eine auf einen Punkt des Definitionsbereichs bezogene Eigenschaft) einer Abbildung. Beispiel 5.2.2. 1. f (x) = sgn(x) auf D = R. In a = 0 ist f nicht stetig: Sei ε < 12 und V = B(0, ε). Dann existiert keine Umgebung U von 0 mit f [U] ⊆ V , da in jeder Umgebung U von 0 Punkte a 6= 0 liegen mit | f (a)| = 1, d.h., f (a) 6∈ V . 2. f (x) = x auf D = R ist stetig in jedem a ∈ D: Sei a ∈ R1 und ε > 0. Offenbar kann δ = ε gewählt werden. ♦ 87 5 Grenzwerte und Stetigkeit bei Abbildungen Der Vergleich mit (5.1.1) in der Grenzwertdefinition (Def. 5.1.1) zeigt: • Für die Stetigkeit in a muß a zum Definitionsbereich gehören, braucht aber kein Häufungspunkt des Definitionsbereich zu sein. Damit gilt: Satz 5.2.3. Ist a ∈ D ein HP von D, dann gilt: F in a stetig ⇐⇒ (i) F besitzt in a einen GW (ii) lima F = F(a) . Bemerkung 5.2.4. Sei a ∈ D ein isolierter Punkt von D. Dann ist (5.2.1) offensichtlich erfüllt: Man wähle U so, daß U ∩ D = {a}. Damit ist F in jedem isoliertem Punkt stetig. ♦ Aus der Definition kann man sofort die Stetigkeit folgender Abbildungen in einem Punkt ablesen: Sei F : D ⊆ X → Y und F0 : D0 ⊆ X → Y mit D0 ⊆ D und F0 (x) = F(x) auf D0 (d.h., F0 ist die Einschränkung von F auf D0 : F0 := F D ). Sei a ∈ D0 . Dann gilt 0 F stetig in a =⇒ F0 stetig in a . Satz 5.2.5. Seien (X, ρ), (Y, d), (Z, µ) metrische Räume und S : D(S) ⊆ X → Y , T : D(T ) ⊆ Y → Z mit S[X] ⊆ D(T ). Ist S in a ∈ X stetig und ist T in S(a) ∈ Y stetig, dann ist die Superposition T ◦ S in a stetig. Beweis. Sei b = S(a), c = T (b). Für jede Umgebung W von c existiert Umgebung V von b mit T [D(T ) ∩V ] ⊆ W . Zur Umgebung V von b existiert Umgebung U von a mit S[D(S) ∩ U] ⊆ V . Mit D(T ◦ S) = D(S) gilt T ◦ S[D(T ◦ S) ∩U] ⊆ W . Analog zu Satz 5.1.2 ist Satz 5.2.6 (Charakterisierung der Stetigkeit durch Folgen). Seien (X, ρ), (Y, d) metrische Räume. Dann ist Abbildung F : D ⊆ X → Y in a ∈ D genau dann stetig, wenn für jede beliebige Folge (xn ) in D mit xn → a die Folge (F(xn )) gegen F(a) konvergiert. Beweis. Der Beweis ist analog zum Beweis von Satz 5.1.2 mit folgenden Änderungen: Ersetze y0 durch F(a) und streiche \{a}. Satz 5.2.7 (Lokale Beschränktheit). Sei F : D ⊆ X → Y in a ∈ D stetig. Dann ist F in einer Umgebung von a beschränkt. Beweis. Sei ε = 1. Wegen der Stetigkeit in a existiert ein δ mit F[D∩BX (a, δ )] ⊆ BY (a, 1). Satz 5.2.8 (Lokaler Vorzeichenerhalt). Sei F : D ⊆ X → R in a ∈ D stetig und gelte F(a) > 0 bzw. F(a) < 0. Dann gibt es eine Umgebung U von a, so daß F(x) > 0 bzw. F(x) < 0 für x ∈ D ∩U. Beweis. Sei ε = |F(a)|/2. Wegen der Stetigkeit in a existiert eine Umgebung U von a mit |F(x) − F(a)| < ε für x ∈ D ∩ U. Damit F(x) > F(a)/2 > 0 bei F(a) > 0 und F(x) < F(a)/2 < 0 bei F(a) < 0 für alle x ∈ D ∩U. 88 5.2 Stetigkeit 5.2.2 Operationen bei stetigen Funktionen Satz 5.2.9. Sei (X, ρ) ein metrischer Raum, fi : Di ⊆ X → R für i = 1, 2. Sei D := D1 ∩D2 6= 0/ und seien f1 und f2 stetig in a ∈ D. Dann sind auch die Funktionen α1 f 1 + α2 f 2 , f1 f2 , | f1 | , f1+ := f1 ∨ 0 , f1− := (− f1 ) ∨ 0 , mit α1 , α2 ∈ R in a stetig. Im Falle f2 (a) 6= 0 ist auch f1 f2 f1 ∨ f2 , f1 ∧ f2 in a stetig. Beweis. Wir zeigen hier nur die Stetigkeit von f1 f2 und | f1 |. Zu f1 f2 . Sei (xn ) eine beliebige Folge in D mit xn → a. Da f1 und f2 stetig in a, gilt fi (xn ) → fi (a) nach Satz 5.2.3. Dann gilt für die Zahlenfolge ( f1 (xn ) f2 (xn )) offenbar f1 (xn ) f2 (xn ) → f1 (a) f2 (a) , d.h., f1 f2 ist stetig in a. Zu | f1 |. Sei (xn ) eine beliebige Folge in D1 mit xn → a. Da f1 stetig in a, gilt f1 (xn ) → f1 (a). Wegen || f1 (xn )| − | f1 (a)|| ≤ | f1 (xn ) − f1 (a)| hat man folglich | f1 (xn )| → | f1 (a)|, d.h., | f1 |(xn ) → | f1 |(a). Satz 5.2.10. Jedes Polynom ist in jedem Punkt a ∈ R stetig. Jede gebrochen rationale Funktion R = qp ist in jedem Punkt a ∈ D = {x ∈ R : q(x) 6= 0} stetig. Beweis. Die Behauptung folgt aus der Stetigkeit der Identität x 7→ x in allen Punkten von R (siehe Beispiel 5.2.2) und Satz 5.2.9. Satz 5.2.11. Die Exponentialfunktion expa : R → R>0 für a > 0 und die Potenzfunktion potb : R>0 → R>0 für b ∈ R sind in jedem Punkt ihres Definitionsbereichs stetig. Beweis. Zu expa : Wir zeigen zuerst die Stetigkeit in 0. O.B.d.A. sei a > 1. Wir bemerken 1 1 1 zuerst a n → 1. Sei nun ε > 0. Wir wählen N ∈ N mit |a N − 1| < ε und |a− N − 1| < ε. Sei δ = N1 . Wegen der Monotonie von expa gilt | expa x − expa 0| = |ax − 1| ≤ max{aδ − 1, 1 − a−δ } < ε für |x| < δ . Nun zeigen wir die Stetigkeit in x0 ∈ R. Es gilt expa x = expa (x − x0 ) expa x0 . Da expa in 0 stetig ist, folgt damit und mit den Sätzen 5.2.5, 5.2.9 die Stetigkeit von expa in x0 . 89 5 Grenzwerte und Stetigkeit bei Abbildungen Zu potb . Wir können uns auf b > 0 beschränken. Zuerst zeigen wir die Stetigkeit bei 1. Für x ≥ 1 und m ∈ N≥b gilt 1 ≤ potb x = xb ≤ xm . Da die rechte Seite von rechts gegen 1 strebt, gilt lim1+0 potb = 1. Für x < 1 und m ∈ N≥b gilt xm ≤ potb x ≤ 1 , so daß lim1−0 potb = 1. Nach Satz 5.1.7 gilt lim1 potb = 1. Mit Satz 5.2.3 folgt die Stetigkeit in 1. Zeigen wir nun die Stetigkeit bei x0 > 0. Es gilt potb x − potb x0 = potb (x/x0 )(potb x0 − 1) . Mit den Sätzen 5.2.5, 5.2.9 und der Stetigkeit in 1 folgt die Stetigkeit in x0 > 0. 5.2.3 Einseitig stetige und halbstetige Funktionen Aus den Ordnungseigenschaften der reellen Zahlen ergeben sich zwei Verallgemeinerungen der Stetigkeit. Die Ordnung im Definitionsbereich führt zu: Definition 5.2.12. DieFunktion f : D ⊆ R1 → R1 heißt rechtsstetig (linksstetig) in a, wenn a ∈ D und f D∩[a,∞[ ( f D∩ ]−∞,a] ) stetig in a ist. ♦ Bemerkung 5.2.13. f : D ⊆ R1 → R1 ist • linksstetig im HP a ∈ D∩ ] − ∞, a] von D∩ ] − ∞, a] ⇐⇒ f (a) = lima−0 f . • rechtsstetig im HP a ∈ D ∩ [a, ∞[ von D ∩ [a, ∞[ ⇐⇒ f (a) = lima+0 f . ♦ Satz 5.2.14. Sei f : D ⊆ R1 → R1 und sei a ∈ D. Dann f ist stetig in a ⇐⇒ f ist sowohl links − als auch rechtsstetig in a . Die Ordnung im Wertebereich führt zu: Definition 5.2.15. Die Funktion f : D ⊆ R1 → R1 heißt von oben halbstetig (von unten halbstetig) in a, wenn a ∈ D und für alle ε > 0 ein δ > 0 existiert mit f (x) ≤ f (a) + ε ( f (x) ≥ f (a) − ε) für alle x ∈ D mit |x − a| < δ . ♦ Satz 5.2.16. Sei f : D ⊆ R1 → R1 und sei a ∈ D. Dann f ist stetig in a 90 ⇐⇒ f ist sowohl von oben als auch von unten halbstetig in a . 5.2 Stetigkeit 5.2.4 Stetigkeit auf einer Menge Definition 5.2.17. Seien (X, ρ) und (Y, d) metrische Räume. Eine Abbildung F : D ⊆ X → Y heißt stetig auf der Menge E ⊆ D, wenn sie in jedem Punkt von E stetig ist. Sie heißt stetig, wenn sie stetig auf ihrem Definitionsbereichs D ist. ♦ Bemerkung 5.2.18. Wie in den Sätzen 5.2.10, 5.2.11 gezeigt, sind zumindest Polynome, gebrochen rationale Funktionen und die Exponential- und Potenzfunktionen stetig. ♦ Sei E eine Teilmenge von X. Wir bezeichen mit C(E), wenn Y = R1 , und allgemein mit C(E,Y ) die Menge aller stetigen Abbildungen F : E ⊆ X → Y . Es gilt also F ∈ C(E,Y ) genau dann, wenn D(F) = E und F stetig von E nach Y . Beispiele: C([0, 1]), C(R1 ). Bemerkung 5.2.19. Man kann jede Aussage über Funktionen, die in einem Punkt stetig sind, so formulieren, daß sie anwendbar sind auf stetige Funktionen. So wird z.B. aus Satz 5.2.7 die Behauptung: Wenn f ∈ C(E,Y ), dann ist f in einer Umgebung jedes Punktes x ∈ E beschränkt. ♦ Fragen: 1. Ist jede Funktion f ∈ C(E,Y ) beschränkt? 2. Sei f ∈ C(E, R1 ) mit f (x) 6= 0 für alle x ∈ E. Hat f dann in allen Punkten von E das gleiche Vorzeichen? 3. f ∈ C(E,Y ) heißt ∀x0 ∈ E∀ε > 0∃δ > 0 : f [BX (x0 , δ ) ∩ E] ⊆ BY ( f (x0 , ε) . ∀ε > 0∃δ > 0∀x0 ∈ E : f [BX (x0 , δ ) ∩ E] ⊆ BY ( f (x0 , ε) , Gilt auch d.h., kann dasselbe δ für alle x0 ∈ E gewählt werden? Wir fragen hier also nach globalen Eigenschaften stetiger Funktionen. Die Antwort auf alle drei Fragen ist im allgemeinen „Nein“, jedoch „Ja“, wenn die Teilmenge E des metrischen Raumes (X, ρ) spezielle Eigenschaften hat. Dies untersuchen wir in den nächsten drei Abschnitten. Beispiel 5.2.20. 1. pot−1 ist stetig aber unbeschränkt. 2. Sei f : Z → R mit f (x) = x + 12 für x ∈ Z. Dann f [Z] = 21 + Z. 3. Für pot2 kann δ nicht unabhängig von x0 gewählt werden: Je größer |x0 |, desto kleiner muß δ sein. ♦ 91 5 Grenzwerte und Stetigkeit bei Abbildungen 5.2.5 Der Zwischenwertsatz Satz 5.2.21 (Nullstellensatz von Bolzano-Cauchy). Sei f ∈ C(I) mit einem Intervall I. Wenn f das Vorzeichen wechselt, dann gibt es wenigstens einen Punkt x0 ∈ I mit f (x0 ) = 0. Beweis. O.b.d.A. sei I = [a, b] mit f (a) < 0 und f (b) > 0. Die Menge M := {x ∈ I : f (x) ≤ 0} ist nichtleer und beschränkt, besitzt also ein endliches Supremum x0 . Da I abgeschlossen ist, gilt x0 ∈ I. Wir behaupten f (x0 ) = 0. Angenommen f (x0 ) < 0 (oder f (x0 ) > 0). Dann gibt es nach Satz 5.2.8 eine Umgebung U von x0 mit f (x) < 0 (bzw. f (x) > 0) für x ∈ U ∩ I. Dann kann x0 aber nicht das Supremum von M gewesen sein. Direkte Folgerung aus Satz 5.2.21 ist Folgerung 5.2.22 (Vorzeichenerhalt stetiger Funktionen). Sei f ∈ C(I) mit einem Intervall I. Wenn f auf I keine Nullstellen hat, dann behält sie ihr Vorzeichen. Satz 5.2.23 (Zwischenwertsatz von Bolzano-Cauchy). Sei f ∈ C(I) mit einem Intervall I. Sind A,C ∈ f [I] und A < B < C, dann gilt auch B ∈ f [I]. Beweis. Es gibt a und c in I mit f (a) = A und f (c) = C. O.B.d.A. sei a < c. Wende Satz 5.2.21 auf g : [a, c] → R1 mit g(x) = f (x) − B an. Satz 5.2.24 (Erhaltung von Intervallen). Sei f ∈ C(I) mit einem Intervall I. Dann ist f [I] ein Intervall. Beweis. Wegen Satz 5.2.23 muß mit A,C ∈ f [I] auch [A,C] ⊆ f [I] sein. Bemerkung 5.2.25. Die wesentliche Eigenschaft des Intervalles I ist die Zusammenhangseigenschaft: Ein metrischer Raum (X, ρ) heißt zusammenhängend, wenn X nicht als Vereinigung zweier abgeschlossener, nichtleerer, disjunkter Teilmengen dargestellt werden kann. Eine Teilmenge von R ist genau dann zusammenhängend, wenn sie ein Intervall ist. Satz 5.2.24 lautet dann allgemein, daß das stetige Bild einer zusammenhängenden Menge wieder zusammenhängend ist (siehe Amann/Escher I). ♦ 5.2.6 Beschränktheit und Existenz von Maxima und Minima Satz 5.2.26 (Erhaltung der Kompaktheit). Sei f ∈ C(K,Y ) mit einer kompakten Menge K ⊆ X. Dann ist f [K] kompakt. Beweis. Wegen Satz 3.4.23 genügt es, die Folgenkompaktheit zu zeigen. Sei also (yn )n∈N eine beliebige Folge in f [K]. Dann existieren xn ∈ K mit yn = f (xn ). Wegen der Kompaktheit von K existiert eine in K konvergente Teilfolge (xnk )k∈N mit Grenzwert x∞ ∈ K. Da f stetig ist und mit Satz 5.2.6, gilt f (xnk ) → f (x∞ ) ∈ f [K]. Somit hat (yn )n∈N eine in f [K] konvergente Teilfolge. Damit ist f [K] folgenkompakt. 92 5.2 Stetigkeit Folgerung 5.2.27 (Satz von Weierstraß). Sei f ∈ C(K,Y ) mit einer kompakten Menge K ⊆ X. Dann ist f [K] beschränkt. Gilt zusätzlich Y = R1 , dann existieren min f [K] = minx∈K f (x) und max f [K] = maxx∈K f (x). Beweis. Die erste Behauptung folgt aus Satz 5.2.26 ( f [K] ist kompakt) und der Beschränktheit einer kompakten Menge (Satz 3.4.23 und Lemma 3.4.21). Sei nun Y = R1 . Dann existieren inf f [K] und sup f [K] in R und sind Berührungspunkte von f [K]. Da eine kompakte Menge abgeschlossen ist (Satz 3.4.23 und Lemma 3.4.21), liegen inf f [K] und sup f [K] in f [K]. Bemerkung 5.2.28. Die Kompaktheit ist wesentlich: 1. f = pot2 ]1,2[ ist stetig, beschränkt; Minimum und Maximum von f (]1, 2[) existieren aber nicht. 2. f = pot2 [0,∞[ ist stetig aber unbeschränkt. ♦ 5.2.7 Gleichmäßige Stetigkeit Definition 5.2.29. Seien (X, ρ) und (Y, d) metrische Räume. Eine Abbildung F : D(F) ⊆ X → Y heißt gleichmäßig stetig, wenn ∀ε > 0∃δ > 0∀x, x0 ∈ D(F) mit ρ(x, x0 ) < δ : d(F(x), F(x0 )) < ε . ♦ Offensichtlich ist dies äquivalent zu ∀ε > 0∃δ > 0∀x0 ∈ D(F) : F[BX (x0 , δ ) ∩ D] ⊆ BY (F(x0 , ε) , das heißt der Eigenschaft aus der dritten Frage. Beispiel 5.2.30. 1. x 7→ x ist auf R gleichmäßig stetig. 2. x 7→ x2 ist auf R nicht gleichmäßig stetig. 3. x 7→ x2 ist auf ] − 1, 1[ gleichmäßig stetig. 4. x 7→ x−1 ist auf ]0, 1[ nicht gleichmäßig stetig. ♦ Satz 5.2.31 (Satz von Cantor). Sei F ∈ C(K,Y ) mit kompakter Menge K ⊆ X. Dann ist F gleichmäßig stetig. Beweis. Indirekt. Sei F ∈ C(K,Y ) also nicht gleichmäßig stetig. Dann ∃ε > 0∀δ > 0∃x, x0 ∈ K mit ρ(x, x0 ) < δ : d(F(x), F(x0 )) ≥ ε . 93 5 Grenzwerte und Stetigkeit bei Abbildungen Sei ε mit dieser Eigenschaft. Dann finden wir für δ = 1n Punkte xn , xn0 ∈ K mit ρ(xn , xn0 ) < 1n und d(F(xn ), F(xn0 )) ≥ ε. Wegen der Kompaktheit von K gibt es eine konvergente Teilfolge (xnk )k∈N von (xn )n∈N mit Grenzwert x∞ ∈ K. Nun gilt ρ(xn0 k , x∞ ) ≤ ρ(xn0 k , xnk ) + ρ(xnk , x∞ ) ≤ 1 + ρ(xnk , x∞ ) , nk so daß auch xn0 k → x∞ . Mit der Stetigkeit von F folgt der Widerspruch ε ≤ d(F(xnk ), F(xn0 k )) ≤ d(F(xnk ), F(x∞ )) + d(F(xn0 k ), F(x∞ )) → 0 . Damit ist die dritte Frage beantwortet. 5.2.8 Fortsetzung von stetigen Funktionen Sei F ∈ C(D,Y ) mit D ⊆ X und metrischen Räumen (X, ρ) und (Y, d). Kann F auf die Abschließung von D stetig fortgesetzt werden, d.h., existiert F̄ ∈ C(D̄,Y ) mit F̄(x) = F(x) für x ∈ D? Offensichtlich kann x 7→ x−1 mit D = ]0, 1] nicht auf D̄ fortgesetzt werden. Satz 5.2.32. Sei F : D ⊆ X → Y mit metrischen Räumen (X, ρ) und (Y, d), wobei (Y, d) vollständig ist. Ist F gleichmäßig stetig, dann kann F zu einer gleichmäßig stetigen Abbildung F̄ : D̄ → Y fortgesetzt werden. Für den Beweis des Satzes benötigen wir Lemma 5.2.33. Seien (X, ρ) und (Y, d) metrische Räume und F : D ⊆ X → Y gleichmäßig stetig. Dann überführt F jede Cauchy-Folge in (X, ρ) in eine Cauchy-Folge in (Y, d). Beweis. Sei (xn )n∈N eine Cauchy-Folge in (X, ρ) mit xn ∈ D für n ∈ N. Sei ε > 0 beliebig. Dann existiert ein δ > 0 mit d(F(x), F(x0 )) < ε für alle x, x0 ∈ D mit ρ(x, x0 ) < δ . Weiter existiert ein N mit ρ(xn , xm ) < δ für n, m ≥ N. Somit d(F(xn ), F(xm )) < ε für n, m ≥ N. Beweis. (von Satz 5.2.32) Wir wollen F̄ definieren durch F(x) , falls x ∈ D , F̄(x) := limx F , falls x ∈ D̄ \ D . Zu zeigen ist dazu, daß limx F existiert und daß F̄ gleichmäßig stetig ist. (I) Zur Existenz von lima F bei a ∈ D̄\D: Dann ist a Häufungspunkt von D. Sei (xn )n∈N eine beliebige Folge in D mit xn → a. Da (xn )n∈N eine Cauchy-Folge ist, ist (F(xn ))n∈N nach dem Lemma 5.2.33 ebenfalls eine Cauchy-Folge. Wegen der Vollständigkeit konvergiert (F(xn ))n∈N gegen ein A. 94 5.2 Stetigkeit Um Satz 5.1.2 anwenden zu können, muß nun noch gezeigt werden, daß der Grenzwert unabhängig von der Folge (xn )n∈N ist. Dazu sei (yn )n∈N eine Folge in D mit yn → a und F(yn ) → B. Wir bilden die Folge (zn )n∈N mit z2n = xn , z2n+1 = yn . Dann gilt zn ∈ D und zn → a und ist daher auch wieder eine Cauchyfolge, so daß sich nach Lemma 5.2.33 die Konvergenz von (F(zn ))n∈N gegen ein C ∈ Y ergibt. Nun enthält die konvergente Folge (F(zn ))n∈N aber zwei konvergente Teilfolgen (F(z2n ))n∈N und (F(z2n+1 ))n∈N , deren Grenzwerte A und B folglich mit C übereinstimmen müssen. Somit A = B, und Satz 5.1.2 ergibt lima F = A. (II) Zur gleichmäßigen Stetigkeit von F: Sei ε > 0 beliebig. Dann existiert ein δ > 0 mit ∀x1 , x2 ∈ D mit ρ(x1 , x2 ) < δ : d(F(x1 ), F(x2 )) < ε . 3 Seien u1 , u2 ∈ D̄ beliebig mit ρ(u1 , u2 ) < δ3 . Dann existieren xi ∈ D mit d(F(xi ), F̄(ui )) < δ ε und ρ(ui , xi ) < 3 3 für i = 1, 2 . Wegen ρ(x1 , x2 ) ≤ ρ(x1 , u1 ) + ρ(x2 , u2 ) + ρ(u1 , u2 ) < δ folgt d(F̄(u1 ), F̄(u2 )) ≤ d(F̄(u1 ), F(x1 )) + d(F(x1 ), F(x2 )) + d(F(x2 ), F̄(u2 )) < ε . 5.2.9 Stetigkeit monotoner und inverser Funktionen Der folgende Satz ist eine gewisse Umkehrung von Satz 5.2.24. Satz 5.2.34. Sei f : I ⊆ R → R eine monotone Funktion auf einem Intervall I. Wenn f [I] ein Intervall ist, dann ist f stetig. Beweis. O.B.d.A. sei f monoton wachsend. Wir zeigen, daß f in jedem Punkt x0 ∈ I stetig ist. Sei a := inf I, b := sup I. 1. Sei x0 = 6 a. Wäre f in x0 linksseitig unstetig, dann f (x0 − 0) := limx→x0 −0 f (x) 6= f (x0 ). Da f monoton wachsend ist, gilt dann f (x0 − 0) < f (x0 ). • Für alle x ∈ I mit x < x0 gilt f (x) ≤ f (x0 − 0) < f (x0 ). Da W ( f ) = f (I) ein Intervall ist und f (x), f (x0 ) ∈ W ( f ), gilt auch ] f (x0 − 0), f (x0 )[ ⊆ W ( f ). 95 5 Grenzwerte und Stetigkeit bei Abbildungen • Sei y ∈ ] f (x0 − 0), f (x0 )[. Dann existiert ein x ∈ I \ {x0 } mit f (x) = y und f (x) = y < f (x0 ). Wenn x < x0 , dann y = f (x) ≤ f (x0 − 0). Wenn aber x > x0 , dann y = f (x) ≥ f (x0 ). Damit erhalten wir einen Widerspruch, d.h., wir haben f (x0 − 0) = f (x0 ). 2. Sei x0 6= b. Analog zu oben erhalten wir f (x0 + 0) := limx→x0 +0 = f (x0 ), also rechtsseitige Stetigkeit. 3. Sei x0 ∈ ]a, b[. Mit 1. und 2. erhalten wir die Stetigkeit in x0 . 4. Sei x0 = a ∈ I oder x0 = b ∈ I. Mit 1. bzw. 2. erhalten wir die Stetigkeit in x0 . Wir betrachten nun eine streng monotone, stetige Funktion f : I → R mit einem Intervall I. Nach Satz 5.2.24 ist f [I] ein Intervall. Wegen der strengen Monotonie ist f injektiv. Damit existiert die Inverse f −1 : f [I] → I von f . Da f −1 [ f [I]] = I und f −1 streng monoton ist, ist f −1 nach Satz 5.2.34 eine stetige Funktion. Damit gilt Satz 5.2.35 (Stetigkeit der inversen Funktion). Sei I ⊆ R ein Intervall und sei f ∈ C(I) streng monoton. Dann existiert die inverse Funktion f −1 : f [I] → I und 1. f −1 ist streng monoton (im gleichen Sinne wie f ); 2. f −1 ist stetig. Folgerung 5.2.36. expa , sinh, cosh [0,∞[ , cosh ]−∞,0] sind stetig invertierbar. 96 6 Differentialrechnung 6.1 Ableitung einer skalaren Funktion in einem Punkt 6.1.1 Motivation bei geradliniger Bewegung eines Punktes. Die Bewegung erfolge nach dem Weg-Zeit-Gesetz s = f (t) (z.B. freier Fall: f (t) = 12 gt 2 ) Momentangeschwindigkeit ∆s 0 s s + ∆s Zum Zeitpunkt t beträgt die zurückgelegt Strecke s = f (t). Nach einer Zeit ∆t sind wir beim Zeitpunkt t + ∆t, die zurückgelegte Strecke ist s + ∆s = f (t + ∆t) mit ∆s als der im Zeitintervall [t,t + ∆t] zurückgelegten Strecke. Wir erhalten vm = ∆s ∆t als mittlere Geschwindigkeit im Zeitintervall [t,t + ∆t]. Überlegung: Je kleiner (kürzer) ∆t, desto besser charakterisiert ∆s ∆t die Geschwindigkeit im Moment t: ∆s f (t + ∆t) − f (t) = lim vm = lim . v(t) = lim ∆t→0 ∆t ∆t→0 ∆t→0 ∆t Dann ist v(t) die Geschwindigkeit zum Zeitpunkt t (falls der Grenzwert existiert). Sei z.B. s = f (t) = 12 gt 2 das Bewegungsgesetz eines Punktes. Man ermittle die Geschwindigkeit zum Zeitpunkt t > 0. Dann v(t) = lim ∆t→0 f (t + ∆t) − f (t) 1 (t + ∆t)2 − t 2 1 2t∆t + (∆t)2 = g lim = g lim = gt . ∆t 2 ∆t→0 ∆t 2 ∆t→0 ∆t in einem Punkt. Wir betrachten einen Stab, d.h. einen Körper, dessen Querschnitt im Vergleich zu seiner Länge vernachlässigbar klein ist. Die Masse m ist eine Funktion der Länge l: m = f (l). Massendichte 97 6 Differentialrechnung b 0 N M Von M zu N ändert sich die Länge um ∆l, für die Masse ergibt sich m + ∆m = f (M + ∆l). Die mittlere lineare Dichte des Stückes MN mit der Länge ∆l ist daher ρm = ∆m ∆l . Wie oben betrachten wir wieder den Grenzwert für ∆l → 0: f (l + ∆l) − f (l) ∆m = lim ρm = lim . ∆l→0 ∆l→0 ∆l→0 ∆l ∆l ρ(t) = lim Dies ergibt dann, wenn der Grenzwert existiert, die Massendichte an der Stelle l. Tangente an den Graphen einer Funktion in einem Punkt. Der Punkt M0 = (x0 , y0 ) sei auf dem Graphen fixiert. M = (x0 + ∆x, y0 + ∆y) sei ein weiterer Punkt auf dem Graphen. Wir betrachten die Sekante durch M0 und M. M bewege sich auf der Kurve zu M0 , d.h. ∆x → 0. Der Winkel β und die Sekante hängen von der Lage von M ab. Sekantengleichung: Für einen Punkt (x, y) auf der Sekante gilt (x, y) = (x0 , y0 ) + t(∆x, ∆y) mit einem t ∈ R, d.h. t = x−x0 ∆x und y = y0 + t∆y = y0 + ∆y (x − x0 ) . ∆x f M y ∆y M0 y0 α β x0 98 ∆x x 6.1 Ableitung einer skalaren Funktion in einem Punkt tan β = ∆y ∆x = f (x0 +∆x)− f (x0 ) ∆x ist der Anstieg der Sekante. Als Tangente an eine gegebene Kurve (Graphen einer Funktion) im Punkt M0 bezeichnet man die Grenzlage der Sekante durch M0 und M unter der Bedingung, daß M längs der Kurve zu M0 strebt. Gleichung der Tangente: y = y0 + (x − x0 ) tan α mit f (x0 + ∆x) − f (x0 ) ∆y = lim ∆x→0 ∆x→0 ∆x ∆x tan α = lim als Anstieg der Tangente. 6.1.2 Definition der Ableitung einer Funktion Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D. x0 erhält kleinen Zuwachs h = ∆x mit x0 + h ∈ D. Definition 6.1.1. Falls der (eigentliche oder uneigentliche) Grenzwert lim h→0 f (x0 + h) − f (x0 ) h (6.1.1) existiert, heißt er Ableitung von f in x0 . Der Grenzwert wird durch f 0 (x0 ) bezeichnet. ♦ Bemerkung 6.1.2. Wenn x0 ∈ D Häufungspunkt von D ∩ ] − ∞, x0 ] (D ∩ [x0 , ∞[) ist und ) in x0 existiert, dann heißt g0 (x0 ) linksseitige (g = f die Ableitung von g = f ]−∞,x0 ] [x0 ,∞[ (rechtsseitige) Ableitung von f in x0 . Sie wird mit f−0 (x0 ) = f 0 (x0 − 0) ( f+0 (x0 ) = f 0 (x0 + 0) bezeichnet. Es gilt f−0 (x0 ) = f 0 (x0 − 0) = lim f (x0 + h) − f (x0 ) h f+0 (x0 ) = f 0 (x0 + 0) = lim f (x0 + h) − f (x0 ) . h h%0 beziehungsweise h&0 ♦ Beispiel 6.1.3. Sei f (x) = |x| mit D( f ) = R, x0 = 0. Dann |x0 + h| − |x0 | |h| 1, falls h > 0 , = = sgnh = −1 , falls h < 0 . h h Damit existiert f 0 (0) nicht aber f+0 (0) = 1 und f−0 (0) = −1. ♦ 99 6 Differentialrechnung Satz 6.1.4. Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D∩ ] − ∞, x0 ] und D ∩ [x0 , ∞[. Dann existiert f 0 (x0 ) genau dann, wenn f+0 (x0 ) und f−0 (x0 ) existieren und beide gleich sind. Wenn f 0 (x0 ) existiert, gilt f 0 (x0 ) = f+0 (x0 ) = f−0 (x0 ) . Wir betrachten nun noch einmal das Problem der Tangente an graph( f ) in x0 . Die Tangente ist eine Gerade durch (x0 , f (x0 )) mit dem Anstieg f 0 (x0 ). • Sei f 0 (x0 ) endlich. Dann existiert eine Tangente in x0 und sie ist nicht parallel zur y-Achse. • | f 0 (x0 )| = ∞. Dann existiert eine Tangente in x0 und sie ist parallel zur y-Achse. p Betrachte z.B. f (x) = 3 |x|sgnx auf D( f ) = R. Dann f+0 (0) = und f−0 (0) = p 3 lim h%0 √ 3 h lim = lim h−2/3 = ∞ h&0 h h&0 p 3 |h|sgnh |h| = lim = lim h−2/3 = ∞. h h%0 |h| h&0 Damit f 0 (0) = ∞. • Existieren einseitige Ableitungen, dann existieren einseitige Tangenten. Betrachte 4 x + 1, x ≤ 0 z.B. f (x) = auf D( f ) = R in x0 = 0. Dann f+0 (0) = 1 mit der 1 − e−x , x > 0 rechtsseitigen Tangente y = x + 1 und f−0 (0) = 0 mit der linksseitigen Tangente y = 1. Definition 6.1.5. Sei f : D ⊆ R → R. f heißt differenzierbar in x0 , wenn x0 ∈ D Häufungspunkt von D ist und wenn f 0 (x0 ) existiert und endlich ist. ♦ Bemerkung 6.1.6. f ist also bei x0 differenzierbar, wenn in x0 eine Tangente an den Graphen existiert, die nicht parallel zur y-Achse ist. ♦ 6.1.3 Weierstraßsche Zerlegungsformel Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D. Ziel: Stelle den Zuwachs ∆y = f (x0 + h) − f (x0 ) der Funktion f im Punkt x0 dar als Summe eines zu h proportialen Anteils und eines Anteils dar, der bei h → 0 schneller zu 0 konvergiert als der zu h proportionale. Wenn dies gelingt ist der zu h proportionale Anteil der entscheidende für die Änderung der Funktion in x0 . 100 6.1 Ableitung einer skalaren Funktion in einem Punkt Proportionaler Anteil ist ah (ist lineare Funktion in h). Der restliche Teil sei mit r(h) bezeichnet. Er soll von der Qualität „konvergiert schneller zu 0 als ah“ sein, wenn man von a = 0 absieht. Damit meinen wir r(h) → 0 für h → 0 . h Also suchen wir eine Darstellung ∆y = f (x0 + h) − f (x0 ) = ah + r(h) mit r(h) → 0 für h → 0 . h (6.1.2) Beispiel 6.1.7. Sei f (x) = x3 + 1 mit D( f ) = R, x0 ∈ D( f ). Dann ∆y = (x0 + h)3 + 1 − x03 − 1 = 3x02 h + 3x0 h2 + h3 . |{z} | {z } ah r(h) h 7→ ah = 3x02 h ist eine in h lineare Funktion. Für r(h) = 3x0 h2 + h3 gilt r(h) = 3x0 h + h2 → 0 für h → 0 , h d.h., wir haben eine gewünschte Zerlegung. Beachte f 0 (x0 ) = lim h→0 f (x0 + h) − f (x0 ) = lim (3x02 + 3x0 h + h2 ) = 3x02 . h→0 h ♦ Vermutung: Wenn f in x0 differenzierbar, dann ist f 0 (x0 )h der gesuchte, zu h proportionale Teil. Sei dazu f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D und f differenzierbar in x0 . Dann ist f (x0 + h) − f (x0 ) f 0 (x0 ) = lim h→0 h endlich. Somit können wir dies äquivalent als lim h→0 f (x0 + h) − f (x0 ) − f 0 (x0 )h =0 h schreiben. Mit r(h) = f (x0 +h)− f (x0 )− f 0 (x0 )h gilt also die Weierstraßsche Zerlegungsformel f (x0 + h) − f (x0 ) = f 0 (x0 )h + r(h) (6.1.3) mit dem zu h proportionalen Anteil f 0 (x0 )h und r(h)/h → 0 für h → 0. Für eine in x0 differenzierbare Funktion haben wir also die gewünschte Zerlegung. Es gilt sogar Satz 6.1.8. Sei x0 ∈ D( f ) Häufungspunkt von D( f ). f ist differenzierbar in x0 genau dann, wenn eine Zahl f 0 (x0 ) existiert mit (6.1.3). 101 6 Differentialrechnung 6.1.4 Differenzierbare Abbildungen Die Weierstraßsche Zerlegungsformel (6.1.3) als äquivalente Bedingung für die Differenzierbarkeit einer skalaren Funktion einer Variablen ermöglicht es, den Differenzierbarkeitsbegriff auf allgemeinere Abbildungen zu verallgemeinern. Seien X und Y reelle Vektorräume, ausgestattet mit Normen k · kX und k · kY , so daß sie vollständige metrische Räume sind, d.h., seien (X, k · kX ) und (Y, k · kY ) reelle Banachräume. Definition 6.1.9. Eine Abbildung A : X → Y heißt linear, wenn A(αx + β y) = αAx + β Ay für alle α, β ∈ R und x, y ∈ X. Die Menge der stetigen linearen Abbildungen von X nach Y wird mit L(X,Y ) bezeichnet. ♦ Bemerkung 6.1.10. Sei X = Rn , Y = Rm und sei M = (mi j ) eine m × n-Matrix. Wir wählen in X und Y die kanonische Basis {e1 , . . . , en } bzw. { f1 , . . . , fm }. Dann x = (x1 , . . . , xn ) = i ∑ni=1 xi ei und y = (y1 , . . . , ym ) = ∑m i=1 y f i . Dann ist eine Abbildung A : X → Y durch ! m Ax = ∑ i=1 n ∑ mi j x j fi j=1 gegeben. Diese Abbildung ist linear. Als Linearkombination stetiger Abbildungen ist sie stetig. ♦ Definition 6.1.11. F : D ⊆ X → Y heißt differenzierbar in x0 , wenn x0 ∈ D innerer Punkt von D [Häufungspunkt von D, bei X = R,] ist und wenn A ∈ L(X,Y ) und R : X → Y existieren mit F(x0 + h) − F(x0 ) = Ah + R(h) für x0 + h ∈ D mit kR(h)kY → 0 für h → 0 . khkX ♦ Bemerkung 6.1.12. 1. Der lineare Operator A hängt von der Stelle x0 ab und ist eindeutig festgelegt. Er heißt Fréchet-Differential (oder totales oder vollständiges Differential) von F in x0 und wird mit ∂ F(x0 ) (oder auch dF(x0 ), DF(x0 )) bezeichnet. 2. Sei D(F 0 ) die Menge aller x0 ∈ D für die ∂ F(x0 ) existiert. Dann ist durch F 0 : D(F 0 ) → L(X,Y ) mit F 0 (x0 ) = ∂ F(x0 ) eine Abbildung von D(F 0 ) in L(X,Y ) gegeben. Diese Abbildung heißt Ableitung von F. Der Wert der Ableitung von F in x0 ist also das Differential von F in x0 . 3. Der lineare Anteil der durch h hervorgerufenen Veränderung, d.h. Ah = F 0 (x0 )h = ∂ F(x0 )h, ist der Hauptteil der Veränderung. 4. Sei L : X → Y eine stetige lineare Abbildung. Dann gilt L(x0 + h) = Lx0 + Lh für alle x0 , h ∈ X und damit L0 (x0 ) = ∂ L(x0 ) = L für alle x0 ∈ X. 102 6.1 Ableitung einer skalaren Funktion in einem Punkt 5. Die Identität idX : X → X ist für alle x0 ∈ X differenzierbar mit ∂ idX (x0 ) = idX . Bezeichnet man den linearen Operator idX durch dx, dann erhalten wir F 0 (x0 )dx := F 0 (x0 ) ◦ dx = F 0 (x0 ) ◦ idX = F 0 (x0 ) = ∂ F(x0 ) . 6. Wenn X = Rn und Y = Rm , dann wird F 0 (x0 ) durch eine (von den gewählten Basen abhängige) m × n-Matrix repräsentiert. Im Falle n = m = 1 also durch eine Zahl. 7. Wenn X = R, dann braucht x0 ∈ D auch nur Häufungspunkt von D sein. Im allgemeinen ist unter dieser abgeschwächten Voraussetzung die Eindeutigkeit der Ableitung nicht mehr gesichert. ♦ Beispiel 6.1.13. Sei X = Rn mit Skalarprodukt h·, ·i definiert durch n hx, yi := ∑ xi yi . i=0 Dann gilt kxk2 = hx, xi für die euklidische Norm k · k. Man betrachte nun F : X → R mit F(x) = kxk2 . Gesucht ist die Ableitung von F an einer Stelle x0 : Es gilt F(x0 + h) − F(x0 ) = hx0 + h, x0 + hi − hx0 , x0 i = hx0 , x0 i + 2 hx0 , hi + hh, hi − hx0 , x0 i = 2 hx0 , hi + hh, hi . Die Abbildung A : X → R mit Ah = 2 hx0 , hi ist linear und stetig. R : X → R mit R(h) = hh, hi khk2 0 erfüllt 0 ≤ |R(h)| = ♦ khk khk = khk → 0 für h → 0. Damit gilt F (x0 )h = 2 hx0 , hi. Definition 6.1.14. F : D ⊆ X → Y heißt differenzierbar, wenn F in jedem x0 ∈ D differenzierbar ist. Wenn F differenzierbar ist, dann ist x0 7→ F 0 (x0 ) eine Abbildung von D in L(X,Y ), die mit F 0 bezeichnet wird (Ableitungsabbildung). ♦ Offene Fragen: • Wie berechnet man F 0 (x0 )? • Welche Eigenschaften hat F 0 (x0 ) immer und welche nur unter bestimmten Voraussetzungen? 103 6 Differentialrechnung 6.2 Eigenschaften differenzierbarer Abbildungen 6.2.1 Die Landau-Symbole Definition 6.2.1. Seien F : D ⊆ X → Y , g : D ⊆ X → R, x0 Häufungspunkt von D. Die Abbildung F heißt unendlich klein bezüglich g in x0 , wenn ∀ε > 0∃Umgeb. U von x0 ∀x ∈ U ∩ D : kF(x)kY ≤ ε|g(x)| . (6.2.1) ♦ Man schreibt dafür nicht ganz korrekt F(x) = o(g(x)) für x → x0 (6.2.2) und liest „F(x) ist klein o von g(x) für x → x0 “. Bemerkung 6.2.2. 1. Gibt es eine Umgebung U von x0 , so daß g auf (U ∩ D) \ {x0 } von 0 Y verschieden ist, dann bedeutet F(x) = o(g(x)) für x → x0 , daß limx→x0 kF(x)k |g(x)| = 0. 2. In der Weierstraßschen Zerlegungsformel haben wir r(h)/h → 0 d.h. r(h) = o(h) für h → 0. 3. Die Symbolik f (x) = o(g(x)) für X = R und x → ∞ oder x → −∞ ist in unserer Definition mit enthalten. 4. Das Gleichheitszeichen in F(x) = o(g(x)) ist keine Gleichheitsrelation: Es gilt x3 = o(x) und x3 = o(x2 ) für x → 0 aber o(x) 6= o(x2 ). 5. Anstelle (6.2.2) wäre „F ∈ o(g, x0 )“ mit o(g, x0 ) als Menge aller F : D ⊆ X → Y mit ♦ (6.2.1) richtig. Beispiel 6.2.3. 1. Seien µ, ν ∈ R mit µ < ν und x0 ∈ R>0 . Dann gelten xν = o(xµ ) für x → 0, (x − x0 )ν = o((x − x0 )µ ) für x → x0 , xµ = o(xν ) für x → ∞ . Der Nachweis ergibt sich aus den bekannten Grenzwerten xν = lim xν−µ = 0 , x→0 xµ x→0 lim lim (x − x0 )ν−µ = 0 , x→x0 xµ = lim x−(ν−µ) = 0 . x→∞ xν x→∞ lim 2. sin x − x = o(x) für x → 0 und cos x − 1 − 12 x2 = o(x2 ) für x → 0. Man verwende dazu sin x lim = 1, x→0 x 104 1 − cos x 2 sin2 (x/2) 1 sin2 (x/2) 1 lim = lim = lim = . x→0 x→0 x2 x2 2 x→0 x2 /4 2 ♦ 6.2 Eigenschaften differenzierbarer Abbildungen „Rechenregeln“: Da aus F(h) = o(khk), G(h) = o(khk) für h → 0 auch (F + G)(h) = o(khk) bei x0 folgt, gilt o(khk) + o(khk) = o(khk) für h → 0 . Ist A eine stetige lineare Abbildung, dann folgt aus F(h) = o(khk) für h → 0 auch (A ◦ F)(h) = o(khk) bei h → 0, damit Ao(khk) = o(khk) für h → 0 . Sei nun F(h) = o(khk) für h → 0 und G(k) = o(kkk) für k → 0, dann ist (G◦F)(h) = o(khk) bei x0 und damit o(o(khk)) = o(khk) für h → 0 . 6.2.2 Die Berührungsordnung zweier Abbildungen Definition 6.2.4. Seien F, G : D ⊆ X → Y , x0 Häufungspunkt von D. Sei k ∈ N. Man sagt, F und G berühren sich in x0 mindestens mit der Ordnung k, wenn o(kx − x0 kkX ) für x → x0 , falls x0 ∈ X , F(x) − G(x) = o(|x|−k ) für x → x0 , falls X = R und x0 ∈ {−∞, ∞} . ♦ Beispiel 6.2.5. 1. Seien F, G : D ⊆ X → Y zwei Abbildungen, die stetig im Häufungspunkt x0 von D sind und F(x0 ) = G(x0 ) erfüllen. Dann berühren sie sich mit der Ordnung 0: Es gilt F(x0 ) − G(x0 ) = 0. Da F − G stetig in x0 , existiert für jedes ε > 0 eine Umgebung U von x0 mit kF(x) − G(x)kY < ε für alle x ∈ D ∩U. Dies bedeutet aber F(x) − G(x) = o(1) = o(kx − x0 k0X ). 2. In der Weierstraßschen Zerlegungsformel F(x) = F(x0 ) + F 0 (x0 )(x − x0 ) + R(x − x0 ) , R(x − x0 ) = o(kx − x0 kX ) erkennt man ein „Polynom P (höchstens) ersten Grades“ mit P(x) = F(x0 ) + F 0 (x0 )(x − x0 ). Es gilt P(x0 ) = F(x0 ) und F(x) − P(x) = o(kx − x0 kX ). Also berühren sich F und P in x0 mindestens mit erster Ordnung. Wir erkennen und vermuten eine lokale Approximation von F durch Polynome. ♦ 6.2.3 Differentiationsregeln Zu Tabellen der Ableitungen der Grundfunktionen siehe z.B. Bronstein/Semendjajew. Uns interessieren Differentiationsregeln für Abbildungen, die man mit Hilfe algebraischer Operationen und Superposition aus differenzierbaren Abbildungen erhält. Dazu seien (X, k · kX ) und (Y, k · kY ) reelle Banachräume. 105 6 Differentialrechnung Satz 6.2.6. Seien F, G : D ⊆ X → Y in x0 differenzierbar. Dann gilt: 1. (αF + β G)0 (x0 ) = αF 0 (x0 ) + β G0 (x0 ) für α, β ∈ R (Linearität); 2. (FG)0 (x0 ) = G(x0 )F 0 (x0 ) + F(x0 )G0 (x0 ), wenn Y = R (Produktregel); 0 F G(x0 )F 0 (x0 ) − F(x0 )G0 (x0 ) 3. , wenn Y = R und G(x) 6= 0 in einer Umge(x0 ) = G G(x0 )2 bung von x0 (Quotientenregel). Beweis. Zu 1. Es gilt F(x0 + h) = F(x0 ) + F 0 (x0 )h + o(khkX ) , G(x0 + h) = G(x0 ) + G0 (x0 )h + o(khkX ) für h → 0. Damit (αF + β G)(x0 + h) = (αF + β G)(x0 ) + [αF 0 (x0 ) + β G0 (x0 )]h + o(khkX ) . Zu 2. Es gilt F(x0 + h)G(x0 + h) = [F(x0 ) + F 0 (x0 )h + o(khkX )] · [G(x0 ) + G0 (x0 )h + o(khkX )] = F(x0 )G(x0 ) + [F(x0 )G0 (x0 ) + G(x0 )F 0 (x0 )]h + t(h) für h → 0 mit t(h) = [F(x0 ) + F 0 (x0 )h]o(khkX ) + [G(x0 ) + G0 (x0 )h]o(khkX ) + F 0 (x0 )G0 (x0 )h2 + o(khkX )o(khkX ) = o(khkX ) . Zu 3. Für t(h) = F(x0 + h) F(x0 ) G(x0 )F 0 (x0 ) − F(x0 )G0 (x0 ) − − h G(x0 + h) G(x0 ) G(x0 )2 gilt t(h)G(x0 )2 G(x0 + h) = G(x0 )2 F(x0 + h) − F(x0 )G(x0 )G(x0 + h) − G(x0 + h)[G(x0 )F 0 (x0 ) − F(x0 )G0 (x0 )]h = G(x0 )2 F(x0 ) + G(x0 )2 F 0 (x0 )h + G(x0 )2 o(khkX ) − F(x0 )G(x0 )2 − F(x0 )G(x0 )G0 (x0 )h − F(x0 )G(x0 )o(khkX ) − G(x0 )2 F 0 (x0 )h − G0 (x0 )hG(x0 )F 0 (x0 )h + G(x0 )F(x0 )G0 (x0 )h + G0 (x0 )hF(x0 )G0 (x0 )h − o(khkX )G(x0 )F 0 (x0 )h + o(khkX )F(x0 )G0 (x0 )h = o(khkX ) und daher t(h) = o(khkX ) für h → 0. 106 6.2 Eigenschaften differenzierbarer Abbildungen Satz 6.2.7 (Kettenregel). Sei F : D ⊆ X → Y differenzierbar in x0 ∈ D. Sei weiter G : E ⊆ Y → Z differenzierbar in F(x0 ) ∈ E. Dann ist G ◦ F in x0 differenzierbar und es gilt (G ◦ F)0 (x0 ) = G0 (F(x0 )) ◦ F 0 (x0 ) . Beweis. Es gilt G(F(x0 + h)) = G(F(x0 ) + F 0 (x0 )h + o(khkX )) = G(F(x0 )) + G0 (F(x0 )) ◦ [F 0 (x0 )h + o(khkX )] + o(kF 0 (x0 )h + o(khkX )kY ) = G(F(x0 )) + G0 (F(x0 )) ◦ F 0 (x0 )h + G0 ( f (x0 )) ◦ o(khkX ) + o(kF 0 (x0 )h + o(khkX )kX ) = G(F(x0 )) + G0 (F(x0 )) ◦ F 0 (x0 )h + o(khkX ) für h → 0. Bemerkung 6.2.8. Wenn X = Rn , Y = Rm , Z = Rl , dann wird (G ◦ F)0 (x0 ) durch eine (von den gewählten Basen abhängige) l × n-Matrix repräsentiert, die sich aus dem Produkt der l × m-Matrix für G0 (F(x0 )) und der m × n-Matrix für F 0 (x0 ) ergibt. ♦ Beispiel 6.2.9. 1. F(x) = tan x = anwendbar und ergibt sin x cos x auf D = R \ { π2 + kπ : k ∈ Z}. Quotientenregel ist sin0 x cos x − sin x cos0 x cos2 x + sin2 x 1 (tan x) = = = = 1 + tan2 x . 2 2 2 cos x cos x cos x 0 2. H(x) = sin(x2 ) auf D = R. Kettenregel ist anwendbar auf F(x) = x2 und G(x) = sin x und ergibt H 0 (x) = G0 (F(x))F 0 (x) = 2x cos(x2 ) . 3. Logarithmisches Differenzieren: Sei F : ]a, b[ → R>0 differenzierbar für alle x ∈ ]a, b[. Sei G(x) = ln x für x ∈ R. Dann hat H(x) = ln(F(x)) Sinn. Die Kettenregel ergibt (ln F(x))0 = F 0 (x) . F(x) 4. Ausdrücke der Form u(x)v(x) . Seien u, v : D ⊆ R → R in x0 ∈ D differenzierbar und sei u(x) > 0 für x ∈ D. Dann gilt u(x)v(x) = ev(x) ln u(x) und daher 0 u0 (x) v(x) v(x) ln u(x) 0 u(x) =e v (x) ln u(x) + v(x) u(x) 0 u (x) v(x) 0 = u(x) v (x) ln u(x) + v(x) u(x) = u(x)v(x) v0 (x) ln u(x) + u(x)v(x)−1 v(x)u0 (x) . 107 6 Differentialrechnung Somit gilt (xx )0 = xx (ln x + 1) . ♦ Satz 6.2.10 (Differenzierbarkeit der Umkehrfunktion). Sei f : I ⊆ R → R injektiv auf dem Intervall I. Sei f stetig1 und differenzierbar in a ∈ I, f −1 sei stetig in b = f (a). Dann ist f −1 in b genau dann differenzierbar, wenn f 0 (a) 6= 0. In diesem Fall gilt ( f −1 )0 ( f (a)) = 1 . f 0 (a) (6.2.3) Beweis. „=⇒“ Nach Voraussetzung gilt f −1 ◦ f = idI . Somit folgt nach Kettenregel 0 1 = id0I (a) = f −1 ( f (a)) f 0 (a) und damit f 0 (a) 6= 0 und (6.2.3). „⇐=“ Zuerst zeigen wir, daß b HP von f [I] ist. Nach Voraussetzung ist a HP von I. Also gibt es eine Folge (xk ) in I \ {a} mit limk→∞ xk = a. Wegen der Injektivität von f gilt f (xk ) 6= b für alle k. Somit ist ( f (xk )) eine Folge in f [I] \ {b} und wegen der Stetigkeit von f gilt f (xk ) → f (a) = b. Also ist b HP von f [I]. Es sei nun (yk ) eine Folge in f [I] mit yk 6= b für k ∈ N und limk→∞ yk = b. Sei xk := f −1 (yk ). Dann gilt xk 6= a für k ∈ N sowie limk→∞ xk = a, da f −1 in b stetig ist. Wegen 0 6= f 0 (a) = lim k→∞ f (xk ) − f (a) xk − a gibt es ein K mit 0 6= f (xk ) − f (a) yk − b = −1 xk − a f (yk ) − f −1 (b) für k ≥ K . Also erhalten wir f −1 (yk ) − f −1 (b) xk − a = = yk − b f (xk ) − f (a) f (xk ) − f (a) xk − a −1 für k ≥ K , und die Behauptung folgt durch Grenzübergang. Beispiel 6.2.11. f (x) = exp x. Dann ln0 y = 1 Nach 1 exp0 ln y = 1y . ♦ dem späteren Satz 6.2.13 ist f in a stetig, wenn f in a differenzierbar ist. Die Stetigkeit von f in a müßte also nicht extra vorausgesetzt werden. 108 6.2 Eigenschaften differenzierbarer Abbildungen 6.2.4 Höhere Ableitungen Sei F : D ⊆ X → Y differenzierbar mit Banach-Räumen X, Y . Dann ist F 0 : D ⊆ X → L(X,Y ) und man kann wieder die Frage stellen, ob F 0 differenzierbar ist. Zu klären wäre hier, ob L(X,Y ) wieder ein Banach-Raum ist (das ist tatsächlich der Fall). Wenn F 0 differenzierbar ist, erhalten wir die zweite Ableitung F 00 : D ⊆ X → L(X, L(X,Y )). Offensichtlich wird die Struktur immer komplizierter. Später betrachten wir einen Ausweg. Für X = Y = R können wir aber jetzt schon höhere Ableitungen bilden. Wir erhalten: • Wenn f differenzierbar auf D ist, dann existiert erste Abbildung f 0 auf D. • ... • Wenn die k-te Ableitung f (k) differenzierbar 0 auf D ist, dann existiert die (k + 1) (k+1) (k+1) (k) . Ableitung f auf D mit f = f Beispiel 6.2.12. 1. f (x) = xn auf R mit n ∈ N. Dann f 0 (x) = nxn−1 (für n ≥ 1), f 00 (x) = n(n − 1)xn−2 (für n ≥ 2), . . . , f (n) (x) = n!, f (k) (x) = 0 für k > n. 2. f (x) = sin x auf R. Dann f 0 (x) = cos x, f 00 (x) = − sin x, f 000 (x) = − cos x, f (4) (x) = sin x = f (x); also f (4k) (x) = f (x) = sin x , Z.B., f (135) (x) = f (4·33+3) (x) = − cos x. 3. Zweite Ableitung einer zusammengesetzten Funktion g = f ◦ φ . Es gilt g0 (x) = f 0 (φ (x))φ 0 (x) und g00 (x) = f 00 (φ (x))(φ 0 (x))2 + f 0 (φ (x))φ 00 (x) . ♦ 6.2.5 Differenzierbarkeit und Stetigkeit Es seien (X, k · kX ) und (Y, k · kY ) reelle Banachräume. Satz 6.2.13. Sei F : D ⊆ X → Y differenzierbar in x0 ∈ D. Dann ist F stetig in x0 . Folgerung 6.2.14. Eine differenzierbare Abbildung ist stetig. Beweis. (Des Satzes) Da F differenzierbar in x0 , gilt F(x0 + h) − F(x0 ) = F 0 (x0 )h + o(khkX ) . Wegen der Stetigkeit von F 0 (x0 ) existiert L = supkhkX ≤1 kF 0 (x0 )hkY . Damit gilt kF(x0 + h) − F(x0 )kY ≤ (L + o(1)) khkX . Die rechte Seite wird nun kleiner als jedes ε > 0, wenn nur khkX < δ . 109 6 Differentialrechnung Bemerkung 6.2.15. 1. Stetigkeit von F in x0 heißt F(x) ≈ F(x0 ) für x ≈ x0 . Das ist also eine Approximation durch Polynom nullten Grades (Konstante). 2. Differenzierbarkeit von F in x0 heißt F(x) ≈ F(x0 ) + F 0 (x0 )(x − x0 ) für x ≈ x0 . Das ist also eine Approximation durch Polynom ersten Grades (Tangente an Graph): Sei ε > 0 beliebig. Dann existiert ein δ ∈ ]0, 1[, so daß kF(x0 + h) − [F(x0 ) + F 0 (x0 )h]kY < εkhkX < εδ < ε . für alle h ∈ X mit khkX < δ . ♦ 6.2.6 Differenzierbarkeit und Extrema Sei (X, k · k) ein reeller Banachraum. Definition 6.2.16. Die Abbildung F : D ⊆ X → R hat bei x0 ∈ D ein lokales Minimum (Maximum), wenn eine Umgebung U von x0 existiert mit F(x) ≥ F(x0 ) (F(x) ≤ F(x0 )) für alle x ∈ U ∩ D. Ein lokales Extremum ist ein lokales Minimum oder Maximum. ♦ Satz 6.2.17 (Satz von Fermat). Sei F : D ⊆ X → R, x0 ∈ D. Sei x0 innerer Punkt von D und sei F in x0 differenzierbar. Dann gilt: F hat in x0 lokales Extremum ⇒ F 0 (x0 ) = 0 . Beweis. F habe ein lokales Minimum in x0 . Angenommen, es gilt F 0 (x0 ) 6= 0. Dann gibt es ein h0 ∈ X mit F 0 (x0 )h0 < 0. Es gilt F(x0 + τh0 ) = F(x0 ) + τF 0 (x0 )h0 + o(kτh0 kX ) = F(x0 ) + τF 0 (x0 )h0 + o(|τ|) für x0 +τh0 ∈ D. Damit gibt es beliebig kleine τ > 0 mit x0 +τh0 ∈ U ∩D und F(x0 +τh0 ) < F(x0 ). Analog verfährt man bei lokalem Maximum. Bemerkung 6.2.18. Wenn x0 kein innerer Punkt ist, muß die Behauptung nicht gelten! Betrachte z.B. x 7→ x2 auf [−1, 1]. Es liegen lokale Maxima in −1 und 1 vor, aber die Ableitung verschwindet dort nicht. ♦ 6.2.7 Mittelwertsätze Es seien (X, k · kX ) und (Y, k · kY ) reelle Banachräume. Satz 6.2.19 (Satz von Rolle). Sei f : [a, b] → R stetig, a < b, und sei f ]a,b[ differenzierbar. Dann gilt f (a) = f (b) ⇒ ∃c ∈ ]a, b[ : f 0 (c) = 0 . 110 6.2 Eigenschaften differenzierbarer Abbildungen Beweis. Nach Satz von Weierstraß (Folgerung 5.2.27) existieren globales Minimum und Maximum auf [a, b]. Liegen beide in den Randpunkten vor, so ist f konstant auf [a, b] und damit f 0 (c) = 0 für alle c ∈ [a, b]. Liegt wenigstens eines der beiden globalen Extrema in Innern von [a, b] vor, dann verschwindet dort nach Satz 6.2.17 die Ableitung. Im folgenden bezeichnen wir mit Ia,b die (offene) Verbindungsstrecke von a und b, d.h. Ia,b := {(1 − t)a + tb : t ∈ ]0, 1[} . Satz 6.2.20 (Satz von Cauchy, verallgemeinerter Mittelwertsatz). Seien F, G : D ⊆ X → R stetig, a und b in D mit Ia,b ⊂ D, a 6= b und es seien F, G differenzierbar auf Ia,b . Dann existiert ein c ∈ Ia,b mit (F(b) − F(a)) G0 (c)(b − a) = (G(b) − G(a)) F 0 (c)(b − a) d.h. F(b) − F(a) F 0 (c) = , falls X = R und G(x) 6= 0 auf Ia,b . G(b) − G(a) G0 (c) (6.2.4) Beweis. Sei h : [0, 1] → R mit h(t) = F((1 − t)a + tb) (G(b) − G(a)) + (G((1 − t)a + tb) − G(a)) (F(a) − F(b)) . Dann h(0) = h(1) = F(a) (G(b) − G(a)). Mit Satz von Rolle (Satz 6.2.19) existiert ein τ ∈ ]0, 1[ und damit c = (1 − τ)a + τb ∈ Ia,b mit 0 = h0 (τ) = F 0 (c)(b − a) (G(b) − G(a)) + G0 (c)(b − a) (F(a) − F(b)) . Da G(b) − G(a) und F(a) − F(b) reell sind, folgt die Behauptung. Satz 6.2.21 (Satz von Lagrange, Mittelwertsatz). Sei F : D ⊆ X → R stetig, seien a und b in D mit a 6= b und Ia,b ⊂ D und es sei F differenzierbar auf Ia,b . Dann existiert ein c ∈ Ia,b mit F(b) − F(a) = F 0 (c)(b − a) , d.h. F(b) − F(a) = F 0 (c), falls X = R . b−a Beweis. Setze G(x) = x in Satz 6.2.20. Dann existiert ein c ∈ Ia,b mit (F(b) − F(a)) (b − a) = (b − a)F 0 (c)(b − a) , wobei F(b) − F(a) und F 0 (c)(b − a) reelle Zahlen sind und b − a nicht der Nullvektor ist. Bemerkung 6.2.22. Die Aussagen der Sätze 6.2.20, 6.2.21 ist im allgemeinen falsch, wenn F : D ⊆ X → Y mit Y 6= R. Jedoch gilt: ♦ 111 6 Differentialrechnung Satz 6.2.23. Sei F : [a, b] ⊂ R → Y stetig, a 6= b, und es sei F ]a,b[ differenzierbar. Dann gilt kF(a) − F(b)kY ≤ sup kF 0 (c)kY (b − a) . c∈ ]a,b[ Beweis. O.B.d.A. sei F 0 beschränkt auf ]a, b[, d.h. es existiert ein M ≥ 0 mit kF 0 (x)kY < M für x ∈ ]a, b[. Sei ε ∈ ]0, b − a[ fixiert. Wir setzen S := {s ∈ [a + ε, b] : kF(s) − F(a + ε)kY ≤ M(s − a − ε)} . Da a + ε ∈ S ist S nichtleer. Wegen der Stetigkeit von F ist S abgeschlossen. Offensichtlich ist S beschränkt. Nach dem Satz von Heine-Borel (Satz 3.4.24) ist S kompakt. Somit ist σ := max S eine wohldefinerte Zahl in S. Es sei σ < b. Dann gilt für t ∈ ]σ , b[ kF(t) − F(a + ε)kY ≤ M(σ − a − ε) + kF(t) − F(σ )kY . Da F auf [a + ε, b[ differenzierbar ist, folgt kF(t) − F(σ )kY → F 0 (σ ) für t → σ . t −σ Aufgrund der Definition von M existiert ein δ ∈ ]0, b − σ [ mit kF(t) − F(σ )kY ≤ M(t − σ ) für 0 < t − σ < δ . Damit folgt kF(t) − F(a + ε)kY ≤ M(t − a − ε) für t ∈ [a + ε, σ + δ [ , was der Definition von σ widerspricht. Also gilt σ = b und somit kF(t) − F(a + ε)kY ≤ M(t − a − ε) für t ∈ [a + ε, b[ für jede obere Schranke M von kF 0 (x)kY auf ]a, b[, d.h. kF(t) − F(a + ε)kY ≤ sup kF 0 (c)kY (t − a − ε) für t ∈ [a + ε, b[ . c∈ ]a,b[ Mit ε → 0 und der Stetigkeit von F folgt nun die Behauptung. Satz 6.2.24 (Schrankensatz). Sei F : D ⊆ X → Y stetig, seien a und b in D mit Ia,b ⊂ D und es sei F differenzierbar auf Ia,b . Dann gilt kF(a) − F(b)kY ≤ sup kF 0 (c)(a − b)kY . c∈Ia,b Beweis. Sei h : [0, 1] → Y mit h(t) = F((1 − t)a + tb) . Dann gilt h0 (t) = F 0 ((1 − t)a + tb)(b − a) und Satz 6.2.23 impliziert kF(a) − F(b)kY = kh(0) − h(1)kY ≤ sup kh0 (t)k = sup kF 0 (c)(a − b)kY . t∈[0,1] 112 c∈Ia,b 6.2 Eigenschaften differenzierbarer Abbildungen 6.2.8 Die de l’Hospitalschen Regeln tan x − x ist ein Grenzwert vom unbstimmten Typ „ 00 “. Die Cauchy-Formel (6.2.4) erx→0 x − sin x laubt in manchen Fällen die Behandlung solcher Ausdrücke: lim Satz 6.2.25 (de l’Hospital). Sei 1. f , g : ]a, b[ → R differenzierbar mit g0 (x) 6= 0 für x ∈]a, b[. 2. limx&a f (x) = limx&a g(x) = 0. f 0 (x) existiert. x&a g0 (x) 3. Der (eigentliche oder uneigentliche) Grenzwert lim Dann gilt f 0 (x) f (x) = lim 0 . x&a g (x) x&a g(x) lim Bemerkung 6.2.26. 1. Der Satz gilt sinngemäß auch für x % a und somit für x → a. 2. Der Satz gilt sinngemäß auch für den Typ „ 00 “ für x → ±∞. 3. Sinngemäß gelten die Aussagen auch für den Typ „ ∞ ∞ “. 4. Unbestimmte Ausdrücke der Form „0 · ∞“, „+∞ − (+∞)“, „00 “, „1±∞ “, „∞0 “ werden ∞ (meist durch Logarithmieren) auf „ 00 “ oder „ ∞ “ zurückgeführt. ♦ tan x − x : Es gilt (tan x − x)0 = 1 + tan2 x − 1 = tan2 x und (x − sin x)0 = x→0 x − sin x Beispiel 6.2.27. lim 1 − cos x. Da tan2 x x→0 1 − cos x lim wieder vom Typ „ 00 “ ist, kann noch keine Entscheidung getroffen werden. Es gilt (tan2 x)0 = 2 tan x(1 + tan2 x) und (1 − cos x)0 = sin x. Es ist 2 tan x(1 + tan2 x) 2(1 + tan2 x) = lim =2 x→0 x→0 sin x cos x lim und damit tan x − x tan2 x 2 tan x(1 + tan2 x) = lim = lim = 2. x→0 x − sin x x→0 1 − cos x x→0 sin x lim ♦ 113 6 Differentialrechnung 6.3 Partielle Ableitungen 6.3.1 Differenzierbarkeit von Koordinatenfunktionen Ziel der nächsten drei Abschnitte ist es, die Fréchet-Ableitung durch klassische Ableitungen zu berechnen. Dazu beschränken wir uns auf X = Rn , Y = Rm mit den kanonischen Basen {e1 , . . . , en } und { f1 , . . . , fm }. Um mit Vektoren und Matrizen numerisch nach den Matrizenrechenregeln rechnen zu können, müssen wir Vektoren als spezielle einspaltige oder einzeilige Matrizen auffassen. Ein n-Tupel wird dabei mit einem Spaltenvektor identifiziert, x1 x = (x1 , . . . , xn ) = ... . xn Man beachte x> = (x1 , . . . , xn )> = (x1 xn ) . ... Bezüglich der kanonischen Basis gilt n x = (x , . . . , x ) = ∑ xi ei mit xi = hei , xi . 1 n i=1 Für das Standardskalarprodukt gilt hx1 , x2 i = ∑ x1i x2i = x1> x2 . Wir betrachten eine Abbildung F : D ⊆ Rn → Rm . Dann gilt m F = ∑ F i fi mit F i (x) = h fi , F(x)i . i=1 Wir bezeichnen mit [A] ∈ Rm×n die Matrixdarstellung einer linearen Abbildung A : Rn → Rm . Satz 6.3.1. Sei x0 ∈ D und F : D ⊆ Rn → Rm . Dann gilt F ist differenzierbar in x0 ⇐⇒ alle F i sind differenzierbar in x0 . Ist F differenzierbar in x0 , dann m ∂ F(x0 )h = ∑ ∂ F i (x0 )h fi . i=1 Beweis. Die Abbildungen Ei : Rm → R, Êi : R → Rm mit Ei (x) = h fi , xi und Êi (λ ) = λ fi sind stetige, lineare Abbildungen und daher differenzierbar. Da m m i=1 i=1 F i = Ei ◦ F und F = ∑ Êi ◦ F i = ∑ F i fi , folgt die Behauptung aus Additions- und Kettenregel. 114 6.3 Partielle Ableitungen 6.3.2 Partielle Ableitungen einer Abbildung Sei D ⊆ X = Rn eine offene Menge und F : D → Y = Rm und x0 ∈ D. Sei i ∈ {1, . . . , n} fixiert. Dann ist Di := {ξ ∈ R : x0 + ξ ei ∈ D} eine offene Teilmenge von R und 0 ∈ Di . Wir betrachten φi : Di → Y mit φi (ξ ) = F(x0 + ξ ei ) . Definition 6.3.2. Wenn φi an der Stelle 0 differenzierbar ist, dann heißt F in x0 partiell nach der i-ten Variablen differenzierbar mit der Ableitung ∂i F(x0 ) := ∂ φi (0) = φi0 (0). Falls die partielle Ableitung ∂i F(x0 ) in allen x0 ∈ D existiert, dann heißt F (auf D) partiell nach der i-ten Variablen differenzierbar. ♦ Bezeichnung: ∂i F(x0 ) = ∂F (x ) = Di F(x0 ) = Fx0i (x0 ) = Fi0 (x0 ). ∂ xi 0 Bemerkung 6.3.3. 1. Partielle Differentiation nach der i-ten Variablen heißt also Differentiation bei Festhaltung der anderen Variablen. 2. Ist F eine Abbildung aus Rn in R, dann ist die partielle Ableitung ∂i F(x0 ) eine reelle Zahl und F(x0 + ξ ei ) − F(x0 ) ξ ξ →0 ∂i F(x0 ) = lim F(x01 , . . . , x0i−1 , x0i + ξ , x0i+1 , . . . , x0n ) − F(x01 , . . . , x0i−1 , x0i , x0i+1 , . . . , x0n ) = lim ξ ξ →0 3. Die Existenz aller partieller Ableitungen ∂i F(x0 ), i = 1, . . . , n, in einem Punkt x0 enthält nur geringe Information über das Verhalten von F in der Umgebung von x0 ! Insbesondere folgt aus der Existenz aller partieller Ableitungen nicht die Stetigkeit in x0 und damit erst recht nicht die Differenzierbarkeit! Betrachte dazu F : R2 → R mit x1 x2 , wenn x 6= 0 , F(x) = (x1 )2 + (x2 )2 0, wenn x = 0 . Dann F(ξ , 0) = F(0, ξ ) = F(0, 0) = 0 und es existieren die partiellen Ableitungen ∂1 F(0) = ∂2 F(0) = 0 . Jedoch ist F in 0 nicht stetig, da lim F(ξ , ξ ) = ξ →0 1 1 6= lim F(ξ , −ξ ) = − . 2 ξ →0 2 ♦ 115 6 Differentialrechnung Satz 6.3.4. Sei F in x0 ∈ D differenzierbar. Dann existieren alle partiellen Ableitungen in x0 und es gilt ∂i F(x0 ) = ∂ F(x0 )ei . Beweis. Es gilt φi (ξ ) − φi (0) = F(x0 + ξ ei ) − F(x0 ) = ξ ∂ F(x0 )ei + o(kξ ei kX ) = ξ ∂ F(x0 )ei + o(|ξ |) . Bemerkung 6.3.5. 1. Mit hi = hei , hi gilt n n i=1 i=1 n ∂ F(x0 )h = ∂ F(x0 ) ∑ hei , hiei = ∑ ∂ F(x0 )ei h = ∑ ∂i F(x0 )hi . i i=1 Sei das Differential dxi : Rn → R in Richtung ei diejenige lineare Abbildung mit dxi (h) := hi = hei , hi . Dann erhalten wir n ∂ F(x0 ) = ∑ ∂i F(x0 )dxi . i=1 Das Differential dxi ist also keine unendlich kleine Größe (was soll das sein?) oder eine reelle Zahl sondern eine lineare Abbildung! 2. Mit m F= ∑ F j f j mit F j (x) = f j , F(x) j=1 erhalten wir weiter n ∂ F(x0 )h = ∑ m ∑ ∂iF j (x0)hi f j , i=1 j=1 d.h., [∂ F(x0 )h] = ∂i F j (x0 ) j,i · h . ♦ Folgerung 6.3.6. Ist D ⊆ Rn offen und ist F : D ⊆ Rn → Rm in x0 ∈ D differenzierbar, dann sind in x0 die m Koordinatenfunktionen F j partiell nach den n Variablen differenzierbar. Bezüglich den kanonischen Basen entspricht der Ableitung ∂ F(x0 ) die Matrix ∂1 F 1 (x0 ) · · · ∂n F 1 (x0 ) .. .. [∂ F(x0 )] := ∂i F j (x0 ) j,i = . . . m m ∂1 F (x0 ) · · · ∂n F (x0 ) 116 6.3 Partielle Ableitungen Bemerkung 6.3.7. 1. Die Matrix [∂ F(x0 )] wird Jacobi-Matrix von F an der Stelle x0 genannt. Die Anwendung der Abbildung ∂ F(x0 ) auf h entspricht der Matrizenmultiplikation der Matrix [∂ F(x0 )] mit dem Spaltenvektor h. 2. Ist Y = R, so ist [∂ F(x0 )] also ein Zeilenvektor. Der Spaltenvektor [∂ F(x0 )]> = (∂1 F(x0 ), . . . , ∂n F(x0 )) =: gradF(x0 ) heißt Gradient von F. Es gilt somit F 0 (x0 )h = hgradF(x0 ), hi . 3. Ist X = R, so ist [∂ F(x0 )] ein Spaltenvektor. 4. Normalerweise wird die Unterscheidung zwischen Vektor (Abbildung) und Koordinatenvektor (Matrix) bei festgelegten Basen aufgehoben, es werden also gleiche Bezeichnungen verwendet und aus dem Zusammenhang ist zu erschließen, was gemeint ist. ♦ 6.3.3 Differenzierbarkeit und partielle Ableitung Eine konkrete Abbildung F : D ⊆ Rn → Rm ist im allgemeinen koordinatenweise gegeben und es ist verhältnismäßig leicht, sich der partiellen Ableitungen ∂i F j der Koordinaten von F zu vergewissern. Die fundamentalen Sätze der mehrdimensionalen Differentialrechnung handeln aber von der Fréchet-Ableitung ∂ F von F. Wir benötigen daher eine Umkehrung von Folgerung 6.3.6. Wie Bemerkung 6.3.3 zeigt, brauchen wir zusätzliche Voraussetzungen. Satz 6.3.8. Sei D ⊆ Rn offen. Besitzt F : D → Rm sämtliche partiellen Ableitungen ∂i F j auf D und sind diese auf D beschränkt, dann ist F stetig auf D. Beweis. Wegen Satz 6.3.1 können wir uns auf m = 1 beschränken. Seien die partiellen Ableitungen durch M beschränkt. Sei x0 ∈ D. Für genügend kleine h gilt n F(x0 + h) − F(x0 ) = ∑ (F(xi ) − F(xi−1 )) i=1 mit x1 = x0 + h1 e1 , x2 = x1 + h2 e2 , . . . , xn = xn−1 + hn en . Auf die Differenzen rechts kann der Mittelwertsatz (Satz 6.2.21) angewendet werden, d.h., es existieren ci ∈ Ixi ,xi−1 mit F(xi ) − F(xi−1 ) = ∂i F(ci )hi . Damit n n n |F(x0 + h) − F(x0 )| = | ∑ ∂i F(ci )h | ≤ ∑ |∂i F(ci )| · |h | ≤ khkX ∑ |∂i F(ci )| ≤ nMkhkX . i=1 i i=1 i i=1 Folglich ist F stetig in x0 . 117 6 Differentialrechnung Satz 6.3.9. Sei D ⊆ Rn offen. Besitzt F : D → Rm sämtliche partiellen Ableitungen ∂i F j auf D und sind diese in x0 ∈ D stetig, dann ist F an der Stelle x0 differenzierbar und es gilt n ∂ F(x0 )h = ∑ m ∑ ∂iF j (x0)hi f j . (6.3.1) i=1 j=1 Sind die partiellen Ableitungen stetig auf D, so ist ∂ F stetig. Beweis. Wegen Satz 6.3.1 können wir uns auf m = 1 beschränken. Zu zeigen ist dann, daß n ∂ F(x0 )h := ∑ ∂i F(x0 )hi i=1 tatsächlich die Ableitung von F an der Stelle x0 ist, d.h., F(x0 + h) − F(x0 ) − ∂ F(x0 )h = 0. h→0 khkX lim Sei h ∈ Rn . Wir führen die Punkte x1 = x0 + h1 e1 , x2 = x1 + h2 e2 , . . . , xn = xn−1 + hn en ein. Dann ist xn = x0 + h und es gilt xi ∈ D für i = 1, . . . , n, wenn khkX klein genug ist. Damit gilt n F(x0 + h) − F(x0 ) = ∑ (F(xi ) − F(xi−1 )) . i=1 Auf die Differenzen rechts kann der Mittelwertsatz (Satz 6.2.21) angewendet werden, d.h., es existieren ci ∈ Ixi ,xi−1 mit F(xi ) − F(xi−1 ) = ∂i F(ci )hi . Damit n |F(x0 + h) − F(x0 ) − ∂ F(x0 )h| = | ∑ ∂i F(ci )hi − ∂i F(x0 )hi | i=1 n ≤ ∑ |∂i F(ci ) − ∂i F(x0 )khi | i=1 n ≤ khkX ∑ |∂i F(ci ) − ∂i F(x0 )| i=1 und folglich n |F(x0 + h) − F(x0 ) − ∂ F(x0 )h| ≤ ∑ |∂i F(ci ) − ∂i F(x0 )|. khkX i=1 Mit der Stetigkeit der partiellen Ableitungen folgt die Differenzierbarkeit von F. Die Stetigkeit folgt aus der Stetigkeit der partiellen Ableitungen und (6.3.1). 118 6.3 Partielle Ableitungen 6.3.4 Cr -Abbildungen und partielle Ableitungen höherer Ordnung Definition 6.3.10. Eine Abbildung F : D → Rm , D ⊆ Rn offen, heißt stetig differenzierbar oder C1 -Abbildung, wenn F auf D differenzierbar und die Ableitung stetig ist. Sie heißt stetig partiell differenzierbar, wenn alle partiellen Ableitungen ∂i F j auf D existieren und stetig sind. ♦ Bemerkung 6.3.11. 1. Wegen Satz 6.3.9 gilt F ist C1 − Abbildung ⇐⇒ F ist stetig partiell differenzierbar. 2. Das Differential ∂ F(x0 ) ist eine lineare Abbildung von Rn nach Rm . Diese kann mit einer m × n-Matrix (Jacobi-Matrix) identifiziert werden. Eine m × n-Matrix kann als ein Element von Rmn aufgefaßt werden. Damit können wir obige Überlegungen auch auf die Ableitung von ∂ F anwenden: Die zweite Ableitung ∂ 2 F existiert an der Stelle x0 , wenn die (ersten) partiellen Ableitungen von ∂ F, d.h. die zweiten partiellen Ableitungen ∂i ∂k F j von F, existieren und in x0 stetig sind. Die zweite Ableitung von F ist stetig, wenn die zweiten partiellen Ableitungen von F stetig sind. ♦ Definition 6.3.12. Eine Abbildung F : D → Rm , D ⊆ Rn offen, heißt r-mal stetig differenzierbar oder Cr -Abbildung mit r ∈ N>0 , wenn F auf D r-mal differenzierbar und die Ableitung ∂ r F stetig ist. Sie heißt r-mal stetig partiell differenzierbar, wenn alle r-ten partiellen Ableitungen von F auf D existieren und stetig sind. ♦ Bemerkung 6.3.13. 1. Es gilt also F ist Cr − Abbildung ⇐⇒ F ist r − mal stetig partiell differenzierbar. 2. Setzen wir als 0-te Ableitung von F die Abbildung F selbst, d.h. ∂ 0 F = F, so können wir die Mengen Cr (D, Rm ), r ∈ N, als die Menge aller Cr -Abbildungen von D in Rm einführen. 3. Es gilt Cr (D, Rm ) ⊆ Cs (D, Rm ) für r ≥ s. 4. Weiter sei C∞ (D, Rm ) die Menge aller Abbildungen von D nach Rm , die Cr für alle r ∈ N T sind, d.h. C∞ (D, Rm ) = r∈N Cr (D, Rm ). 5. Die Mengen Cr (D, Rm ), r ∈ N ∪ {∞}, sind Vektorräume. 6. Man schreibt kurz Cr (D) für Cr (D, R1 ). ♦ Beispiel 6.3.14. Sei f (x, y) = 2x3 y2 − 4x2 y + 2 auf D = R2 . Dann ∂1 f (x, y) = 6x2 y2 − 8xy , ∂2 f (x, y) = 4x3 y − 4x2 . ∂1 ∂1 f (x, y) = 12xy2 − 8y , ∂2 ∂1 f (x, y) = 12x2 y − 8x Weiter gilt und ∂1 ∂2 f (x, y) = 12x2 y − 8x , ∂2 ∂2 f (x, y) = 4x3 . Damit ist f mindestens C2 ( f ist sogar C∞ ). Wir bemerken ∂1 ∂2 f (x, y) = ∂2 ∂1 f (x, y). ♦ 119 6 Differentialrechnung Satz 6.3.15 (Satz von Schwarz). Für jede C2 -Abbildung F : D → R, D ⊆ Rn offen, gilt ∀x0 ∈ D ∀i, k ∈ {1, . . . , n} : ∂i ∂k F(x0 ) = ∂k ∂i F(x0 ) , d.h. die Matrix (∂i ∂k F(x0 ))i,k ist symmetrisch: (∂i ∂k F(x0 ))> i,k = (∂i ∂k F(x0 ))i,k . Als Folgerung ergibt sich, daß bei Cr -Abbildungen aus Rn in Rm die Reihenfolge der Bildung der partiellen Ableitungen bis zur Ordung r nicht wesentlich ist. Bezeichnungen: ∂22 = ∂2,2 = ∂2 ∂2 , ∂1,3 = ∂1 ∂3 = ∂3 ∂1 . 6.3.5 Komplexe Ableitung Wir beschäftigen uns hier kurz mit der Ableitung von Funktionen f : D → C, D ⊆ C offen. Da jede komplexe Zahl z = a + ib ∈ C mit einem Paar (a, b) ∈ R2 indentifiziert werden kann, kann f mit einer Abbildung F : D̃ ⊆ R2 → R2 , F(x, y) = (ℜ f (x + iy), ℑ f (x + iy)) für (x, y) ∈ D̃ := {(ξ , η) : ξ + iη ∈ D} identifiziert werden, deren Fréchet-Differenzierbarkeit untersucht werden kann. Andererseits können wir, da C ein Körper ist, den Differenzenquotienten f (z0 + h) − f (z0 ) h für z0 ∈ D und hinreichend kleine h ∈ C definieren und damit die Ableitung wie im skalaren Fall als Grenzwert des Differentialquotienten definieren. Definition 6.3.16. Die Funktion f heißt an der Stelle z0 ∈ D (komplex) differenzierbar mit der Ableitung f 0 (z0 ), wenn f 0 (z0 ) = lim h→0 f (z0 + h) − f (z0 ) h ♦ in C existiert. Analog zum reellen Fall kann man auch hier die Äquivalenz mit der Zerlegungsformel f (z0 + h) − f (z0 ) = f 0 (z0 )h + o(|h|) für h → 0 zeigen. 120 6.3 Partielle Ableitungen Satz 6.3.17. Die Funktion f ist genau dann in z0 = x0 + iy0 ∈ D komplex differenzierbar, wenn F in (x0 , y0 ) Fréchet-differenzierbar ist und die Cauchy-Riemann-Differentialgleichungen ∂1 F 1 (x0 , y0 ) = ∂2 F 2 (x0 , y0 ) , ∂2 F 1 (x0 , y0 ) = −∂1 F 2 (x0 , y0 ) (6.3.2) erfüllt sind. In diesem Fall gilt f 0 (z0 ) = ∂1 F 1 (x0 , y0 ) + i∂1 F 2 (x0 , y0 ) . Beweis. Seien A= α −β β α (6.3.3) , a = α + iβ und h = ξ + iη. Dann gilt A · (ξ , η) = (αξ − β η, β ξ + αη) = (ℜ(ah), ℑ(ah)) . (6.3.4) =⇒. Sei f in z0 = x0 + iy0 ∈ D komplex differenzierbar. Mit a = f 0 (z0 ) und α = ℜ f 0 (z0 ), β = ℑ f 0 (z0 ) und (6.3.4) ergibt sich kF(x0 + ξ , y0 + η) − F(x0 , y0 ) − A · (ξ , η)k k(ξ , η)k (ξ ,η)→(0,0) | f (z0 + h) − f (z0 ) − a · h| = 0. = lim h→0 |h| lim Also ist F in (x0 , y0 ) Fréchet-differenzierbar mit [F 0 (x0 , y0 )] = A , so daß (6.3.2) gilt. ⇐=. Sei F in (x0 , y0 ) Fréchet-differenzierbar mit (6.3.2). Sei a := ∂1 F 1 (x0 , y0 ) + i∂1 F 2 (x0 , y0 ) . Dann gilt [F 0 (x0 , y0 )] = A mit α = ℜa, β = ℑa. Wegen (6.3.4) folgt | f (z0 + h) − f (z0 ) − a · h| h→0 |h| kF(x0 + ξ , y0 + η) − F(x0 , y0 ) − A · (ξ , η)k = lim = 0. k(ξ , η)k (ξ ,η)→(0,0) lim Somit ist f komplex differenzierbar mit (6.3.3). Beispiel 6.3.18. 1. Sei f : C → C mit f (z) = z2 . Wegen f (x + iy) = (x + iy)2 = x2 − y2 + i2xy 121 6 Differentialrechnung haben wir F(x, y) = (x2 − y2 , 2xy). Damit lauten die Cauchy-Riemann-Differentialgleichungen ∂1 F 1 (x, y) = ∂2 F 2 (x, y) = 2x , ∂2 F 1 (x, y) = −∂1 F 2 (x, y) = −2y . Damit ist f komplex differenzierbar mit f 0 (x + iy) = ∂1 F 1 (x, y) + i∂1 F 2 (x, y) = 2x + i2y , d.h., wie erwartet, f 0 (z) = 2z . 2. Die Abbildung f : C → C mit f (z) = z̄ ist in keinem z ∈ C komplex differenzierbar: Wegen f (x + iy) = x − iy haben wir F(x, y) = (x, −y) und damit 1 = ∂1 F 1 (x, y) 6= ∂2 F 2 (x, y) = −1 , Man beachte aber 0 [F (x, y)] = ∂2 F 1 (x, y) = −∂1 F 2 (x, y) = 0 . 1 0 0 −1 , ♦ so daß F sogar stetig diffenzierbar ist. 6.4 Anwendungen der Fréchet-Ableitung 6.4.1 Fehlerabschätzung und Approximation Gesucht sei eine Größe z in Abhängigkeit von Größen x und y: z = f (x, y) . Anstelle der exakten Größen x und y seien nur gemessene oder nur näherungsweise bekannte Größen x̄ und ȳ bekannt. Damit x̄ = x + ∆x , ȳ = y + ∆y mit (absoluten) Meßfehlern ∆x und ∆y. Anstelle von z = f (x, y) hat man dann z̄ = f (x̄, ȳ). Häufig hat man eine Schranke für die Meßfehler |∆x| ≤ δx , |∆y| ≤ δy und interessiert sich für die Abschätzung des absoluten Fehlers | f (x, y) − f (x̄, ȳ)| . 122 6.4 Anwendungen der Fréchet-Ableitung Ist f im interessierenden Bereich D differenzierbar, dann erhalten wir mit dem Mittelwertsatz (Satz 6.2.21) f (x, y) − f (x̄, ȳ) = ∂ f (x̃, ỹ)(∆x, ∆y) mit (x̃, ỹ) zwischen (x, y) und (x̄, ȳ). Der Fréchet-Ableitung ∂ f (x̃, ỹ) entspricht die JacobiMatrix (∂1 f (x̃, ỹ), ∂2 f (x̃, ỹ)) und damit haben wir | f (x, y) − f (x̄, ȳ)| = |∂1 f (x̃, ỹ)∆x + ∂2 f (x̃, ỹ)∆y| |∂1 f (x̃, ỹ)| + δy ≤ δx sup sup |∂2 f (x̃, ỹ)| (x̃,ỹ)∈I(x,y),(x̄,ȳ) (x̃,ỹ)∈I(x,y),(x̄,ȳ) ≈ δx |∂1 f (x̄, ȳ)| + δy |∂2 f (x̄, ȳ)|, wenn δx , δy sehr klein. Beispiel 6.4.1. Wir betrachten den Drillwinkel φ eines zylindrischen Stabes φ= 2lN πr4 G mit der Länge l, dem Radius r, dem Drehmoment N und dem Torsionsmodul G. Durch Untersuchung des relativen Fehlers entscheide man, welche Größe bei der Berechnung von G besonders sorgfältig gemessen werden muß. Wir haben G = G(φ , l, r, N) = 2lN . πr4 φ Seien φ̄ , l,¯ r̄, N̄ die gemessenen Größen mit den Fehlern ∆φ , ∆l, ∆r, ∆N. Dann gilt für den relativen Fehler | G − Ḡ 1 |≈ |∂1 G∆φ + ∂2 G∆l + ∂3 G∆r + ∂4 G∆N| G |G| 2lN 2N −8lN 2l 1 | − 4 2 ∆φ + 4 ∆l + 5 + 4 ∆N| = |G| πr φ πr φ πr φ πr φ ∆φ ∆l ∆r ∆N = |− + −4 + | φ l r N ∆φ ∆l ∆r ∆N ≤ | | + | | + 4| | + | |. φ l r N Folglich hat der relative Fehler von r den größten Einfluß, r sollte also (relativ) am genauesten gemessen werden. ♦ 6.4.2 Richtungsableitungen Sei f : D ⊆ Rn → R. 123 6 Differentialrechnung Definition 6.4.2. Ein Vektor r ∈ Rn mit krk = 1 heißt Richtung. ♦ Sei x0 ∈ D, Sx0 ,r = {x0 + tr : t ≥ 0} der Strahl von x0 in Richtung r. Definition 6.4.3. Sei x0 Häufungspunkt von Sx0 ,r ∩ D. Falls der Grenzwert lim t&0 f (x0 + tr) − f (x0 ) t existiert, heißt er Richtungsableitung oder Gateaux-Differential von f an der Stelle x0 in Richtung r. ♦ Bezeichnung: ∂ f (x0 ) oder ∂r f (x0 ) . ∂r Satz 6.4.4. Sei f : D ⊆ Rn → R im inneren Punkt x0 ∈ D differenzierbar. Dann besitzt f in diesem Punkt für jede Richtung r ∈ Rn eine Richtungsableitung ∂r f (x0 ) und es gilt ∂r f (x0 ) | {z } = Gateaux−Differential ∂ f (x0 )r. | {z } (6.4.1) Frechet−Differential Beweis. Da f in x0 differenzierbar, gilt f (x0 + tr) − f (x0 ) = ∂ f (x0 )(tr) + o(ktrk) = t f (x0 )r + o(t) für t ≥ 0 mit x0 + tr ∈ D. Bemerkung 6.4.5. 1. Das Gateaux-Differential r 7→ ∂r f (x0 ) ist (im Gegensatz zum FréchetDifferential r 7→ ∂ f (x0 )r) im allgemeinen nicht linear in r. 2. Das Gateaux-Differential existiert unter schwächeren Bedingungen als das FréchetDifferential. ♦ Satz 6.4.6. Sei f : D ⊆ Rn → R und sei x0 ∈ D innerer Punkt von D. Besitzt f alle Richtungsableitungen ∂r f (x0 ) in x0 und ist r 7→ ∂r f (x0 ) stetig, dann ist f in x0 differenzierbar. Sei nun {e1 , . . . , en } wieder die kanonische Basis in Rn . Sei r ∈ Rn eine Richtung. Dann n r = ∑ ri ei und r = (r1 , . . . , rn ) mit ri = hr, ei i . i=1 Aus (6.3.1) erhalten wir die Berechnungsformel n ∂r f (x0 ) = ∑ ri ∂i f (x0 ) i=1 für in x0 differenzierbares f . Speziell haben wir ∂ei f (x0 ) = ∂i f (x0 ) , d.h., die partiellen Ableitungen sind spezielle Richtungsableitungen. 124 (6.4.2) 6.4 Anwendungen der Fréchet-Ableitung Beispiel 6.4.7. Wir betrachten f : R2 → R mit f (x, y) = 3x2 y3 + x + y. Gesucht sind zuerst die partiellen Ableitungen von f in (5, 2): ∂1 f (x, y) = 6xy3 + 1 und damit ∂1 f (5, 2) = 241 und ∂2 f (x, y) = 9x2 y2 + 1 und damit ∂2 f (5, 2) = 901 . Nun interessiert uns die Richtungsableitung von f in Richtung des noch zu normierenden √ Vektors r0 = (−2, 1). Da kr0 k = 5, ist r = (− √25 , √15 ). Nach Definition der Richtungsableitung haben wir f (x0 + tr) − f (x0 ) t t&0 h i2 h i3 2 1 √ √ 3 5−t 5 2 + t 5 + 7 − t √15 − 607 = lim t t&0 ih i h 3 25 − t √205 8 + t √125 − t √15 − 600 = lim t t&0 3·25·12 3·8·20 600 + t √5 − t √5 − t √15 − 600 = lim t t&0 900 − 480 − 1 419 √ = = √ . 5 5 ∂r f (x0 ) = lim Nutzen wir (6.4.2) so erhalten wir 1 −2 · 241 + 901 419 2 √ = √ . ∂r f (x0 ) = − √ ∂1 f (5, 2) + √ ∂2 f (5, 2) = 5 5 5 5 Offensichtlich ist der zweite Weg einfacher. ♦ 6.4.3 Der Gradient Sei D ⊆ Rn , F : D → Rm . Dann ist jedem x ∈ D ein Vektor F(x) zugeordnet. F nennt man daher auch Vektorfeld über D. Sei D ⊆ Rn offen und f ∈ C1 (D). Das Vektorfeld grad f : D → Rn mit grad f (x) = (∂1 f (x), . . . , ∂n f (x)) heißt Gradient oder Gradientenfeld von f auf D. 125 6 Differentialrechnung Bemerkung 6.4.8. 1. grad f (x) ist ein Vektor aus Rn . 2. Wegen (6.3.1) gilt ∂ f (x)h = hgrad f (x), hi . 3. Sei r eine Richtung in Rn . Wegen (6.4.1) gilt ∂r f (x) = hgrad f (x), ri . ♦ Wir untersuchen nun die Frage, für welche Richtung ∂s f (x0 ) maximal wird. Ist grad f (x0 ) = 0, so gilt ∂s f (x0 ) = 0 für jede Richtung s. Sei nun grad f (x0 ) 6= 0. Wegen (3.1.2) und ksk = 1 gilt ∂s f (x0 ) = hgrad f (x0 ), si ≤ kgrad f (x0 )k . (6.4.3) Sei r = grad f (x0 ) − hgrad f (x0 ), si s . Dann hr, si = 0 und kgrad f (x0 )k2 = hr + hgrad f (x0 ), si s, r + hgrad f (x0 ), si si = hr, ri + hgrad f (x0 ), si2 . Damit tritt in (6.4.3) genau dann das Gleichheitszeichen auf, wenn r = 0 und hgrad f (x0 ), si > 0 . Somit grad f (x0 ) = λ s mit λ = hgrad f (x0 ), si. Wir bestimmen λ aus ksk = 1 zu kgrad f (x0 )k. grad f (x0 ) Damit wird ∂s f (x0 ) maximal für s = kgrad f (x )k . 0 Folgerung 6.4.9. Der Gradient zeigt in Richtung des stärksten Anstiegs von f . Beispiel 6.4.10. Man finde die Richtung, in der f (x, y) = 4x2 − 3y2 + 5 am stärksten im Punkt (1, 1) wächst. Es gilt ∂1 f (1, 1) = 8, ∂2 f (1, 1) = −6 und daher grad f (1, 1) = (8, −6). Wegen √ kgrad f (1, 1)k = 64 + 36 = 10 , tritt der stärkste Anstieg in Richtung (4/5, −3/5) auf. Weitere Anwendungen des Gradienten gibt es in den nächsten Abschnitten. 126 ♦ 6.4 Anwendungen der Fréchet-Ableitung 6.4.4 Tangentialhyperebene und Normalenvektor Sei f : D → R mit D ⊆ Rn . Weiter sei f differenzierbar im inneren Punkt x0 ∈ D. Definition 6.4.11. Die Hyperebene ( ! n x, f (x0 ) + ∑ ai (xi − x0i ) ) : x ∈ Rn i=1 in Rn+1 heißt Tangentialhyperebene an die Hyperfläche graph f = {(x, f (x)) : x ∈ D} im Punkt (x0 , f (x0 )), wenn sich beide Hyperflächen mit Ordnung 1 berühren, d.h. ! n f (x) − f (x0 ) + ∑ ai (xi − x0i ) = o(kx − x0 k) . i=1 ♦ Dies bedeutet aber ai = ∂i f (x0 ) und n ∑ ai(xi − x0i ) = ∂ f (x0)(x − x0) = hgrad f (x0), x − x0i . i=1 Mit (a, b) = (a1 , . . . , an , b) für a ∈ Rn und b ∈ R erhalten wir damit: Lemma 6.4.12. Die Menge {(x0 , f (x0 )) + (h, hgrad f (x0 ), hi) : h ∈ Rn } ist die Tangentialhyperebene in (x0 , f (x0 )), wobei (h, hgrad f (x0 ), hi), h ∈ Rn , einen Tangentialvektor darstellt. Offensichtlich steht der Vektor n = (−grad f (x0 ), 1) senkrecht auf allen Tangentialvektoren (h, hgrad f (x0 ), hi) und damit auf der Tangentialebene. Lemma 6.4.13. Der Vektor n = (−grad f (x0 ), 1) ist Normalenvektor an die Tangentialhyperebene in (x0 , f (x0 )). Beispiel 6.4.14. Wir betrachten f (x, y) = 4x2 − 3y2 + 5 auf D = R2 in (−1, 3, 18). Es gilt ∂1 f (−1, 3) = −8, ∂2 f (−1, 3) = −18 , so daß n = (8, 18, 1) Normalenvektor an die Tangetialhyperebene in (−1, 3, 18) ist. Wegen √ √ knk = 64 + 324 + 1 = 389 , ist n0 = √ 1 (8, 18, 1) 389 Normaleneinheitsvektor. ♦ 127 6 Differentialrechnung 6.4.5 Niveauhyperflächen Sei g : D ⊆ Rn → R stetig partiell differenzierbar auf D. Sei c ∈ R. Wir betrachten die Menge N = {x ∈ Rn : g(x) = c} und nehmen an, daß N eine glatte differenzierbare Hyperfläche ist, d.h., N = {n(p) : p ∈ P}, n ∈ C1 (P, Rn ) mit P ⊆ Rn−1 . N heißt Niveauhyperfläche von g zum Niveau c. Wegen g(n(p)) = c auf P, folgt mit der Kettenregel 0 = ∂ g(n(p))∂ n(p)h = hgradg(n(p)), ∂ n(p)hi = 0 , d.h., der Gradient von g in n(p) steht senkrecht auf allen Vektoren ∂ n(p)h mit h ∈ Rn−1 . Wegen n(p + h) − n(p) = ∂ n(p)h + o(|h|) ist ∂ n(p)h ein Tangentialvektor an die Fläche N im Punkt n(p). Die Menge {n(p) + ∂ n(p)h : h ∈ Rn−1 } stellt also die Tangentialhyperebene an N in (n(p), g(n(p))) dar. Folgerung 6.4.15. Unter Voraussetzung von Existenz und Glattheit einer Niveauhyperfläche N von g steht der Gradient von g in einem Punkt n(p) der Fläche N senkrecht auf der Tangentialhyperebene an N in (n(p), g(n(p))). Insbesondere ändert sich g nicht in Richtung von Tangentialvektoren an N. Als Spezialfall betrachten wir die Situation n = 2. Dann sind die Niveauhyperflächen (unter geeigneten Voraussetzungen) Kurven im R3 (Höhenlinien) und der Gradient von g steht senkrecht auf den Tangenten an den Höhenlinien. 6.4.6 Taylorpolynome Definition 6.4.16. Sei f : D ⊆ R → R, x0 Häufungspunkt von D. Ein Polynom p heißt n-tes Taylor-Polynom der Funktion f in x0 , wenn 1. degp ≤ n, 2. f und p berühren sich in x0 mindestens mit der Ordnung n. ♦ Satz 6.4.17 (Eindeutigkeit). Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D. Dann gibt es für jedes n ∈ N höchstens ein n-tes Taylor-Polynom. 128 6.4 Anwendungen der Fréchet-Ableitung Beweis. Seien p und q n-te Taylor-Polynome von f in x0 . Dann gilt f (x0 ) = p(x0 ) = q(x0 ) und f (x) − p(x) = o(|x − x0 |n ) , f (x) − q(x) = o(|x − x0 |n ) für x → x0 . Damit gilt p(x) − q(x) = o(|x − x0 |n ) für x → x0 . Da p − q ein Polynom höchstens vom Grad n ist, folgt p = q. f Damit ist die Bezeichnung Tx0 ,n für das n-te Taylor-Polynom von f in x0 gerechtfertigt. Satz 6.4.18 (Existenz). Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D. Dann existiert f f Tx0 ,1 genau dann, wenn f in x0 differenzierbar ist. Es gilt dann Tx0 ,1 (x) = f (x0 ) + f 0 (x0 )(x − x0 ). Eigenschaften: f f k • Wenn Tx0 ,n (x) = ∑nk=0 ck (x − x0 )k , dann Tx0 ,n−1 (x) = ∑n−1 k=0 ck (x − x0 ) . • Ist f selbst ein Polynom p mit degp = n, dann gilt Txp0 ,n = p. Genauer: Wenn p(x) = p k ∑nk=0 ck (x − x0 )k , dann ist Tx0 ,m (x) = ∑m k=0 ck (x − x0 ) für alle m ≤ n. Offene Fragen: f • Wann existieren Tx0 ,n mit n > 1? f • Was kann Tx0 ,n als Ersatz für f leisten? 6.4.7 Die Taylor-Formel Sei f : R → R ein Polynom, d.h., n f (x) = ∑ ak x k k=0 mit ak ∈ R. Dann ist f T0,m (x) = m ∑ ak x k k=0 für m ≤ n. Da f (0) (x0 ) = a0 , f (1) (x0 ) = a1 , f (2) (x0 ) = 2a2 , . . . , f (k) (x0 ) = k!ak für k ≤ n haben wir m f (k) (x0 ) Txf0 ,m (x) := ∑ (x − x0 )k (6.4.4) k! k=0 für unsere spezielle Situation eines Polynoms f und x0 = 0 gefunden. 129 6 Differentialrechnung Mit Rm ( f , x0 )(x) := f (x) − Txf0 ,m (x) bezeichnen wir das Restglied. Damit gilt m f (x) = ∑ k=0 f (k) (x0 ) (x − x0 )k + Rm ( f , x0 )(x) . k! (6.4.5) für jede in x0 m-mal differenzierbare Funktion f . Wesentlich ist nun, zu zeigen, daß Rm ( f , x0 )(x) = o(|x − x0 |m ) für x → x0 . (6.4.6) Satz 6.4.19 (Taylor-Formel mit Restgliedabschätzung). Sei f ∈ Cm (D, R), D ⊆ R ein Intervall. Dann existiert eine Funktion θ : D → ]0, 1[, so daß (6.4.5), (6.4.6) gelten mit Rm ( f , x0 )(x) = f (m) (x0 + θ (x)(x − x0 )) − f (m) (x0 ) (x − x0 )m (1 − θ (x))m−1 (m − 1)! (6.4.7) und damit |Rm ( f , x0 )(x)| ≤ 1 sup | f (m) (x0 + t(x − x0 )) − f (m) (x0 )| · |x − x0 |m . (m − 1)! 0<t<1 Ist f im Innern von D sogar (m + 1)-mal differenzierbar, dann gibt es für jedes p > 0 ein ξ : D \ {x0 } → D mit ξ (x) ∈ Ix,x0 und der Schlömilch-Darstellung f (m+1) (ξ (x)) Rm ( f , x0 )(x) = pm! x − ξ (x) x − x0 m−p+1 (x − x0 )m+1 . (6.4.8) Speziell haben wir die Lagrange-Darstellung (p = m + 1) f (m+1) (ξ (x)) (x − x0 )m+1 Rm ( f , x0 )(x) = (m + 1)! (6.4.9) und die Cauchy-Darstellung (p = 1) f (m+1) (ξ (x)) Rm ( f , x0 )(x) = m! x − ξ (x) x − x0 m (x − x0 )m+1 . (6.4.10) Beweis. Sei x ∈ D \ {x0 } fixiert und sei m−1 h(t) := f (x) − ∑ k=0 f (k) (x0 + t(x − x0 )) f (m) (x0 ) (x − x0 )k (1 − t)k − (x − x0 )m (1 − t)m . k! m! Dann gilt h(0) = Rm ( f , x0 )(x) , 130 h(1) = 0 6.4 Anwendungen der Fréchet-Ableitung sowie h0 (t) = − m−1 ∑ f (k+1) (x0 + t(x − x0 )) (x − x0 )k+1 (1 − t)k k! k=0 m−1 + + =− ∑ f (k) (x0 + t(x − x0 )) (x − x0 )k (1 − t)k−1 (k − 1)! k=1 f (m) (x0 ) (m − 1)! (x − x0 )m (1 − t)m−1 f (m) (x0 + t(x − x0 )) − f (m) (x0 ) (x − x0 )m (1 − t)m−1 . (m − 1)! Nach dem Mittelwertsatz (Satz 6.2.21) existiert ein (von x abhängiges) θ ∈ ]0, 1[ mit −Rm ( f , x0 )(x) = h(1) − h(0) = h0 (θ ) und damit mit (6.4.7). Für (6.4.8) betrachtet man m g(ξ ) := ∑ k=0 f (k) (ξ ) (x − ξ )k , k! h(ξ ) := (x − ξ ) p für ξ ∈ Ix,x0 . Dann gilt g, h ∈ C(Ix,x0 , R1 ) und beide Funktionen sind auf Ix,x0 differenzierbar mit g0 (ξ ) = f (m+1) (ξ ) (x − ξ )m , m! h0 (ξ ) = −p(x − ξ ) p−1 . Mit dem verallgemeinertem Mittelwertsatz (Satz 6.2.20) folgt die Existenz eines (von x abhängigen) ξ ∈ Ix,x0 mit g(x) − g(x0 ) = g0 (ξ ) (h(x) − h(x0 )) . h0 (ξ ) Wegen g(x) − g(x0 ) = Rm ( f , x0 )(x) und h(x) − h(x0 ) = −(x − x0 ) p folgt (6.4.8). Beispiel 6.4.20. 1. Wir betrachten f (x) = ex auf R. Dann ist f ∈ C∞ (R) und wir haben f (x) = f 0 (x) = · · · = f (m+1) (x) . Somit ex = m xk ∑ + Rm( f , 0)(x) k=0 k! 131 6 Differentialrechnung mit |Rm ( f , 0)(x)| ≤ sup eξ ξ ∈I0,x |xm+1 | |x|m+1 ≤ e|x| → 0 für m → ∞ . (m + 1)! (m + 1)! Damit gilt ex = ∞ xk ∑ . k=0 k! Wir haben somit ex in eine Potenzreihe, Taylorreihe genannt, entwickelt. Aufgrund der Abschätzung des Restgliedes sehen wir, daß die Konvergenz in x auf jedem kompakten Intervall [a, b] gleichmäßig verläuft: n xk | = 0. k=0 k! lim max |ex − ∑ n→∞ x∈[a,b] 2. Wir betrachten f (x) = sin x und g(x) = cos x auf R. Dann sind f , g ∈ C∞ (R) und wir haben f 0 (x) = g(x) , f 00 (x) = − f (x) , f 000 (x) = −g(x) , f (4) (x) = f (x) und damit m x2k+1 sin x = ∑ (−1) + R2m+1 ( f , 0)(x) (2k + 1)! k=0 k mit |R2m+1 ( f , 0)(x)| ≤ und |x|2m+2 → 0 für m → ∞ (2m + 2)! m cos x = x2k ∑ (−1)k (2k)! + R2m(g, 0)(x) k=0 mit |x|2m+1 → 0 für m → ∞ . (2m + 1)! Somit haben wir die Taylorentwicklungen |R2m (g, 0)(x)| ≤ ∞ sin x = x2k+1 ∑ (−1)k (2k + 1)! , k=0 3. Sei f (x) = 0, −2 e−x , ∞ cos x = x2k ∑ (−1)k (2k)! . k=0 für x ≤ 0 , Dann ist f (−0) = f (+0) = 0, also f stetig. Es gilt für x > 0 . f 0 (x) = 1 −x−2 e x3 (x > 0) und f 0 (+0) = f 0 (−0) = 0. Durch Fortsetzung erhält man f ∈ C∞ (R) mit f (k) (0) = 0 für alle k ∈ N. Damit ist die Taylorreihe von f an der Stelle 0 identisch 0 und stimmt daher nicht mit f überein! Die Folge der Restglieder (Rm ( f , 0)(x))m kann also für x nahe 0 nicht konvergieren! ♦ 132 6.4 Anwendungen der Fréchet-Ableitung Bemerkung 6.4.21. Obwohl wir eine Darstellungen für das Restglied haben, ist die nichtlokale Approximation von f durch Taylorpolynome nicht die beste Wahl. Hierfür sollte man andere Polynom-Approximationen verwenden. ♦ 6.4.8 Mehrdimensionale Taylor-Formel Wir wollen nun die Taylorformel auf Abbildungen f : D ⊆ Rn → R verallgemeinern. Abbildungen aus Rn nach Rm können durch Betrachtung der Koordinaten-Funktionen hierauf zurückgeführt werden. Da wir höhere partielle Ableitungen benötigen, brauchen wir ein geeignete Schreibweise. Definition 6.4.22. Ein Element α von Nn heißt (n-dimensionaler) Multiindex. Die Zahl n |α| = ∑ α i i=1 ♦ heißt Odnung von α. Bezeichnung: Sei α ein Multiindex. Wir setzen 1 n ∂ α f := ∂1α · · · ∂nα f , d.h., ist f in Cm so kann jede partielle Ableitung von f der Ordung m kurz als ∂ α f mit einem α ∈ Nn und |α| = m geschrieben werden: So zum Beispiel ∂ (0,2,1,1) f = ∂4 ∂22 ∂3 f . Weiter setzen wir n α! := ∏ α i ! = α 1 ! · · · · · α n ! i=1 und n xα := ∏(xi )α für x = (x1 , . . . , xn ) ∈ Rn . i i=1 Satz 6.4.23. Sei f ∈ Cm (D, R), D ⊆ Rn konvex und offen. Dann gilt f (x) = 1 α ∂ f (x0 )(x − x0 )α + o(kx − x0 km ) für x → x0 . α! |a|≤m ∑ Beweis. Sei x ∈ D fixiert, h = x − x0 . Betrachte g : [0, 1] → R mit g(t) = f (x0 + th) . 133 6 Differentialrechnung Dann ist g ∈ Cm ([0, 1], R) und nach Satz 6.4.19 existiert ein τ : [0, 1] → ]0, 1[ mit m f (x) = g(1) = und Rm (g, 0)(t) = g(k) (0) ∑ k! + Rm(g, 0)(t) k=0 g(m) (τ(t)) − g(m) (0) m t (1 − τ(t))m−1 . (m − 1)! Zu zeigen ist nun noch der Aufbau der Ableitungen g(k) (t) für k ≤ m. Nach k-facher Anwendung der Kettenregel für jeweils n partiellen Ableitungen erhalten wir g(k) (t) = n n ik =1 i1 =1 ∑ · · · ∑ ∂ik · · · ∂i1 f (x0 + th)hi1 · · · · · hik . Aufgrund der Vertauschbarkeit der Reihenfolge der partiellen Ableitungen können wir Summanden zusammenfassen, die zum gleichen Multiindex α ∈ Nn mit |α| = k gehören. Ohne Beachtung mehrfacher partieller Ableitungen nach dem gleichen Argument sind dies k! Varianten. Tritt ∂i aber α i > 1 mal auf, so ist noch durch die Zahl der nicht unterscheidbaren Permutationen zu teilen. Somit gehören zu α genau k! α 1! · · · · · α n! = k! α! Varianten und wir haben g(k) (t) = k! α ∂ f (x0 + th)hα . α! |α|=k ∑ 6.4.9 Hinreichende Bedingungen für lokale Extrema Sei f ∈ C1 (D, R), D ⊆ Rn offen. Satz 6.2.17 ergab ∂ f (x0 ) = 0, d.h. grad f (x0 ) = 0 als notwendiges Kriterium für ein lokales Extremum. Ein Punkt x0 ∈ D mit grad f (x0 ) = 0 heißt daher kritischer Punkt. Wir wollen nun hinreichende Bedingungen für lokale Maxima oder Minima finden. Sei dazu f ∈ C2 (D, R) und x0 ein kritischer Punkt. Nach Satz 6.4.23 gilt f (x0 + h) − f (x0 ) = 1 α ∂ f (x0 )hα + o(khk2 ) α! |α|=2 ∑ 1 = QH ( f , x0 )(h) + o(khk2 ) 2 134 6.4 Anwendungen der Fréchet-Ableitung für h → 0 mit der quadratischen Form QH ( f , x0 ) : Rn → R mit n QH ( f , x0 )(h) = ∑ ∂i ∂ j f (x0 )hi h j . i, j=1 In der Algebra wird gezeigt, daß jede quadratische Form Q über Rn dargestellt werden kann durch eine symmetrische lineare Abbildung A : Rn → Rn , Q(x) = hx, Axi , oder eine symmetrische Matrix H ∈ Rn×n , Q(x) = x> Hx . Eine lineare Abbildung A : Rn → Rn heißt dabei symmetrisch, wenn ∀x ∈ Rn : hx, Axi = hAx, xi . Hier sehen wir QH ( f , x0 )(h) = [h]> H( f , x0 )[h] (h ∈ Rn ) mit der Hesse-Matrix ∂1 ∂1 f (x0 ) · · · ∂1 ∂n f (x0 ) .. .. H( f , x0 ) := ∂i ∂ j f (x0 ) i, j = . . ∂n ∂1 f (x0 ) · · · ∂n ∂n f (x0 ) von f an der Stelle x0 . Man beachte, daß H( f , x0 ) symmetrisch ist. Definition 6.4.24. Eine quadratische Form Q heißt • positiv definit, wenn Q(x) > 0 für alle x ∈ Rn mit x 6= 0; • negativ definit, wenn Q(x) < 0 für alle x ∈ Rn mit x 6= 0; • positiv semidefinit, wenn Q(x) ≥ 0 für alle x ∈ Rn ; • negativ semidefinit, wenn Q(x) ≤ 0 für alle x ∈ Rn ; • indefinit, wenn x1 , x2 ∈ Rn existieren mit Q(x1 ) < 0 < Q(x2 ). ♦ Lemma 6.4.25. Ist Q eine positiv definite quadratische Form auf Rn , dann existieren M, m > 0 mit ∀x ∈ Rn : mkxk2 ≤ Q(x) ≤ Mkxk2 . 135 6 Differentialrechnung Beweis. Sei S = {x ∈ Rn : kxk = 1}. Dann ist S eine abgeschlossene und beschränkte und daher kompakte Teilmenge von Rn . Sei A eine symmetrische lineare Abbildung mit Q(x) = hx, Axi. Dann gilt |Q(x + h) − Q(x)| = | hx + h, A(x + h)i − hx, Axi | = | hx, Ahi + hh, Axi + hh, Ahi | ≤ 2| hAx, hi | + | hh, Ahi | ≤ 2kAxk · khk + kAhk · khk , weswegen Q stetig ist. Als stetige Abbildung nimmt sie auf S aber ein Maximum M und ein Minimum m an, d.h., es existiert ein x0 ∈ S mit m = Q(x0 ) > 0. Für x ∈ Rn mit x 6= 0 gilt nun mkxk2 ≤ Q(x) = kxk2 Q(x/kxk) ≤ Mkxk2 . Satz 6.4.26. Sei f ∈ C2 (D, R), D ⊆ Rn offen, und x0 ein kritischer Punkt. Wenn QH ( f , x0 ) positiv (negativ) definit ist, dann hat f in x0 ein strenges lokales Minimum (Maximum). Beweis. Wie oben gezeigt haben wir f (x0 + h) − f (x0 ) = QH ( f , x0 )(h) + o(khk2 ) für h → 0 . Sei QH ( f , x0 ) positiv definit. Nach Lemma 6.4.25 existiert ein m > 0 mit QH ( f , x0 )(h) ≥ mkhk2 . Andererseits existiert für ε ∈ ]0, m[ ein δ > 0, so daß der Restterm betragsmäßig kleiner als εkhk2 ist für khk < δ . Damit gilt f (x0 + h) − f (x0 ) ≥ (m − ε)khk2 > 0 für 0 < khk < δ und f hat in x0 ein strenges Minimum. Ist QH ( f , x0 ) negativ definit, so betrachte man − f anstelle von f . Satz 6.4.27. Sei f ∈ C2 (D, R), D ⊆ Rn offen, und x0 ein kritischer Punkt. Wenn QH ( f , x0 ) indefinit ist, dann hat f in x0 kein lokales Extremum. Beweis. Wenn QH ( f , x0 ) indefinit ist, dann existieren h1 und h2 in Rn mit c1 := QH ( f , x0 )(h1 ) < 0 und c2 := QH ( f , x0 )(h2 ) > 0 . Für hinreichend kleine |τ| gilt also f (x0 + τhi ) − f (x0 ) = QH ( f , x0 )(τhi ) + o(kτhi k2 ) = ci τ 2 + o(τ 2 ) für τ → 0 . Damit haben wir f (x0 + τh1 ) < f (x0 ) und f (x0 + τh2 ) > f (x0 ) für hinreichend kleine |τ|. 136 6.4 Anwendungen der Fréchet-Ableitung Bemerkung 6.4.28. Es verbleibt also nur noch der Fall, daß QH ( f , x0 ) positiv oder negativ semidefinit ist. Hier ist ohne weitere Informationen (zum Beispiel über höhere Ableitungen) keine Aussage möglich. ♦ Die Definitheit von QH ( f , x0 ) kann man durch Untersuchung der Hesse-Matrix H( f , x0 ) erhalten: Sei Q(x) = ∑ni, j=1 ai j xi x j mit symmetrischer Matrix A = (ai j )ni, j=1 ∈ Rn×n . Mit µk bezeichnen wir den k-ten Hauptminoren von A, d.h. µk := det(ai j )ki, j=1 . Satz 6.4.29. Sei Q(x) = ∑ni, j=1 ai j xi x j mit symmetrischer Matrix A = (ai j )ni, j=1 ∈ Rn×n . • Q ist genau dann positiv definit (semidefinit), wenn alle Hauptminoren µ1 , . . . , µn positiv (nichtnegativ) sind. • Q ist genau dann negativ definit (semidefinit), wenn alle (−1)k µk positiv (nichtnegativ) sind. Bemerkung 6.4.30. Für n = 2 haben wir a a µ1 = a11 , µ2 = 11 12 a12 a22 = a11 a22 − a212 . Ist x0 kritischer Punkt von f , so erhalten wir die hinreichenden Bedingungen lokales Minimum: lokales Maximum: kein lokales Extremum: ∂12 f (x0 ) > 0 und ∂12 f (x0 )∂22 f (x0 ) − (∂1,2 f (x0 ))2 > 0 ∂12 f (x0 ) < 0 und ∂12 f (x0 )∂22 f (x0 ) − (∂1,2 f (x0 ))2 > 0 ∂12 f (x0 )∂22 f (x0 ) − (∂1,2 f (x0 ))2 < 0 ♦ Beispiel 6.4.31. Sei f (x, y) = 3x2 y + 4y3 − 3x2 − 12y2 + 1 auf R2 . Wir haben grad f (x, y) = (6xy − 6x, 3x2 + 12y2 − 24y) und daher (0, 0) , (0, 2) , (2, 1) , (−2, 1) als kritische Punkte. Weiter gilt ∂12 f (x, y) = 6y − 6 , (x, y) (0, 0) (0, 2) (2, 1) (−2, 1) ∂22 f (x, y) = 24y − 24 , ∂12 f (x, y) ∂22 f (x, y) ∂1,2 f (x, y) −6 −24 0 6 24 0 0 0 12 0 0 −12 ∂1,2 f (x, y) = 6x . lokales Maximum lokales Minimum kein lok. Extremum aber Sattelpunkt kein lok. Extremum aber Sattelpunkt ♦ 137 6 Differentialrechnung Bemerkung 6.4.32. Mit Hilfe der Differentialrechnung können neben lokalen Extrema auch weitere Eigenschaften der Abbildung untersucht werden: Wendepunkte, Monotonie, Konvexität, Konkavität. Dazu sei auf die Literatur verwiesen (z.B. Bronstein/Semendjajew). ♦ 6.4.10 Auflösungssätze Sei F : D(F) → R p mit D(F) ⊆ Rn × R p offen. Wir betrachten die Gleichung F(x, y) = 0 (6.4.11) und fragen, ob (6.4.11) in der Nähe einer Lösung (x0 , y0 ) von (6.4.11) nach y eindeutig aufgelöst werden kann, d.h., ob eine Umgebung U = V ×W von (x0 , y0 ) und eine Funktion f : V → W existiert, so daß (x, f (x)), x ∈ V , alle Lösungen von (6.4.11) in U darstellen. In diesem Fall nennt man (6.4.11) lokal eindeutig nach y auflösbar. Beispiel 6.4.33. 1. Sei F(x, y)√ = x − y2 in D(F) √ = R>0 × R. In U = R>0 × R>0 bzw. U = R>0 × R<0 finden wir y = x bzw. y = − x. √ 2. Sei F(x, y) = x2 +y2 −1 in D(F) = R×R. Für U = ]−1, 1[×R>0 haben wir y = 1 − x2 . Bei (x0 , y0 ) = (1, 0) und (x0 , y0 ) = (−1, 0) kann aber nicht nach y lokal aufgelöst werden. Jedoch kann nach x lokal aufgelöst werden. 3. Sei F(x, y) = x + y + µ sin y, |µ| < 1 in D(F) = R2 . Für jedes x gibt es genau ein y mit (6.4.11). Damit gibt es eine Funktion g : R → R mit (x, g(x)) als einziger Lösung von (6.4.11) für x ∈ R. Unter Voraussetzung der Differenzierbarkeit von g erhalten wir aus F(x, g(x)) = 0 mit der Kettenregel g0 (x) = − ∂1 F(x, (g(x)) , ∂2 F(x, (g(x)) falls ∂2 F(x, (g(x)) 6= 0. Es gilt hier aber ∂2 F(x, y) = 1 + µ cos y 6= 0. Bemerke, daß auch in den vorherigen Beispielen ∂2 F(x0 , y0 ) 6= 0 in den Auflösungspunkten (x0 , y0 ) war. ♦ Für F ∈ C1 (D(F), R p ), D(F) ⊆ Rn × R p offen, (x0 , y0 ) ∈ D(F) definieren wir die partiellen Ableitungen D1 F(x0 , y0 ) := ∂ φ (0) , D2 F(x0 , y0 ) := ∂ ψ(0) mit φ (ξ ) = F(x0 + ξ , y0 ) , ψ(ξ ) = F(x0 , y0 + ξ ) , d.h., D1 F(x0 , y0 ) sei die Ableitung von F nach dem ersten Argument bei festgehaltenem zweitem Argument an der Stelle (x0 , y0 ). Satz 6.4.34 (Satz über implizite Abbildungen). Sei F ∈ C1 (D(F), R p ) mit D(F) ⊆ Rn × R p offen und sei (x0 , y0 ) ∈ D(F) mit F(x0 , y0 ) = 0. 138 6.4 Anwendungen der Fréchet-Ableitung 1. Wenn D2 F(x0 , y0 ) invertierbar ist, dann existieren Umgebungen V und W von x0 und y0 , so daß (6.4.11) auf V × W eindeutig nach y auflösbar ist, d.h., es existiert ein g : V → W , so daß (x, g(x)) für x ∈ V die einzige Lösung von (6.4.11) in V ×W ist. 2. Ist zusätzlich F ∈ Ck (D(F), R p ), k ≥ 1, so ist auch g eine Ck -Abbildung und es gilt g0 (x0 ) = −D2 F(x0 , y0 )−1 D1 F(x0 , y0 ) . (6.4.12) Bemerkung 6.4.35. 1. Formel (6.4.12) ergibt sich einfach aus der Kettenregel. 2. Die Invertierbarkeit von D2 F(x0 , y0 ) ist gleichbedeutend mit der Invertierbarkeit der Jacobi-Matrix [D2 F(x0 , y0 )] bzw. dem Nichtverschwinden Jacobi-Determinante det([D2 F(x0 , y0 )]) . 3. Der übliche Beweis des Satzes verwendet den Banachschen Fixpunktsatz: Für geeignete V und W sei M die Menge von stetigen Funktionen von V nach W . Man betrachte nun die Abbildung G : M → (R p )V mit G(h)(x) := h(x) − D−1 2 F(x0 , y0 )F(x, h(x)) . Für ausreichend kleine V und W ist G eine kontrahierende Selbstabbildung, siehe Heuser, Teil 2. Ist g ∈ M dann der Fixpunkt von G, so gilt g(x) = g(x) − D−1 2 F(x0 , y0 )F(x, g(x)) und daher F(x, g(x)) = 0 für x ∈ V . ♦ Beispiel 6.4.36. Sei F(x, y) = (x2 + y2 − 1)(x2 + y2 − 9). Es gilt D2 F(x, y) = 2y(x2 + y2 − 9) + 2y(x2 + y2 − 1) = 4y(x2 + y2 − 5) . Lokale Auflösbarkeit folgt also für alle Punkte (x0 , y0 ) mit F(x0 , y0 ) = 0, y0 6= 0 und x02 + y20 6= 5. Satz 6.4.37 (Satz über die lokale Umkehrabbildung). Sei f ∈ Cr (D( f ), Rn ), D( f ) ⊆ Rn offen, r ≥ 1. Sei y0 ∈ D( f ) und sei f 0 (y0 ) invertierbar. Dann ist f in y0 lokal invertierbar, d.h., es existiert eine Umgebung V × W von ( f (y0 ), y0 ) und eine Abbildung g : V → W , so daß f (g(x)) = x für x ∈ V . Darüber hinaus gilt g ∈ Cr (V,W ) und g0 (x0 ) = f 0 (g(x0 ))−1 in x0 = f (y0 ) . Beweis. Wähle F(x, y) = f (y) − x und wende Satz 6.4.34 an. 139 6 Differentialrechnung Beispiel 6.4.38. 1. Sei f (y) = Ay mit einer linearen invertierbaren Abbildung A : Rn → Rn . Dann ist g(x) = A−1 x und −1 g0 (x)h = f 0 (g(x))−1 h = A0 (A−1 x) | {z } h = A−1 h . f 0 (A−1 x) Man beachte dabei f 0 (y) = A und nicht f 0 (y) = Ay! 2. Wir betrachten f (x, y) = (cos x cosh y, sin x sinh y) auf R2 und fragen nach der lokalen Umkehrbarkeit. Es gilt − sin x cosh y cos x sinh y [∂ f (x, y)] = cos x sinh y sin x cosh y mit det[∂ f (x, y)] = − sin2 x cosh2 y − cos2 x sinh2 y = − sin2 x(1 + sinh2 y) − cos2 x sinh2 y = − sinh2 y − sin2 x . Damit ist f lokal umkehrbar für (x, y) ∈ R2 \ {(kπ, 0) : k ∈ Z} . ♦ 6.4.11 Extremwerte unter Nebenbedingungen Beispiel 6.4.39. Gesucht ist ein Rechteck maximalen Flächeninhalts bei vorgebenem Umfang u. Wir haben also f (x, y) = xy, D( f ) = R≥0 × R≥0 zu maximieren unter der Nebenbedingung 2(x + y) = u. Aus der Nebenbedingung finden wir y = u/2 − x und damit ist g(x) = f (x, u/2 − x) = x(u/2 − x) auf [0, u/2] zu maximieren. Es gilt g0 (x) = u/2 − 2x, so daß sich x0 = u/4 ∈ [0, u/2] als kritischer Punkt ergibt. Offensichtlich ist dies auch die globale Maximalstelle. Das Rechteck mit größtem Flächeninhalt bei gegebenem Umfang ist also das Quadrat. ♦ Verallgemeinerung: Gegeben sei eine Funktion f : D( f ) ⊆ Rn → R und eine Nebenbedingungs- oder Restriktionsmenge N := {x ∈ D( f ) : φ (x) = 0} mit φ : D( f ) → R p . 140 6.4 Anwendungen der Fréchet-Ableitung Definition 6.4.40. f hat in x0 ∈ N ein relatives oder bedingtes Maximum (Minimum) unter der Nebenbedingung N, wenn eine Umgebung U von x0 existiert, so daß f (x) ≤ f (x0 ), ( f (x) ≥ f (x0 )) für alle x ∈ U ∩ N. ♦ Zur Herleitung einer notwendingen Bedingung für ein relatives Extremum gehen wir wie im Beispiel davan aus, daß wir die Nebenbedingung φ (x) = 0 nach einem Teil der Variablen auflösen können und damit eine explizite Beschreibung von N bekommen. Wir nehmen dazu an, daß (bei geeigneter Umsortierung von x) eine Funktion g : G ⊆ Rn−p → R p existiert mit (y, g(y)) ∈ D( f ) und φ (y, g(y)) = 0 für y ∈ G . Damit haben wir ein lokales Extremum von h(y) = f (y, g(y)) auf G zu suchen. Wenn G nun offen, f und g differenzierbar sind, so ist 0 = h0 (y0 ) = D1 f (y0 , g(y0 )) + D2 f (y0 , g(y0 )g0 (y0 ) (6.4.13) nach Satz 6.2.17 notwendig für ein Extremum in x0 = (y0 , g(y0 )). Ist φ differenzierbar, so erhalten wir aus φ (y, g(y)) = 0 für y ∈ G durch Anwendung der Kettenregel: D1 φ (y, g(y)) + D2 φ (y, g(y))g0 (y) = 0 . Ist die lineare Abbildung D2 φ (y, g(y)) invertierbar für alle y ∈ G, so folgt g0 (y) = −D2 φ (y, g(y))−1 D1 φ (y, g(y)) und durch Einsetzen in (6.4.13) erhalten wir D1 f (y0 , g(y0 )) − D2 f (y0 , g(y0 )D2 φ (y0 , g(y0 ))−1 D1 φ (y0 , g(y0 )) = 0 . Bezüglich der kanonischen Basen entspricht dies der Matrizen-Gleichung p [D1 φ (y0 , g(y0 ))] = 0 [D1 f (y0 , g(y0 ))] −(λ1,i )i=1 | {z } | {z } 1×(n−p) mit p×(n−p) p (λ1,i )i=1 := [D2 f (y0 , g(y0 )] [D2 φ (y0 , g(y0 )]−1 , | {z }| {z } 1×p d.h., p×p p [D2 f (y0 , g(y0 )] = (λ1,i )i=1 [D2 φ (y0 , g(y0 )] . 141 6 Differentialrechnung Damit erhalten wir p Di f (x01 , . . . , x0n ) = ∑ λ1, j Diφ j (x01, . . . , x0n) , j=1 d.h., p grad f (x0 ) − ∑ λ j gradφ j (x0 ) = 0 , φ (x0 ) = 0 (6.4.14) j=1 mit λ j ∈ R in einer bedingten Extremalstelle x0 von f in N, wobei die unbekannte Abbildung g nicht in (6.4.14) enthalten ist. Zusammenfassung: Wir benötigten • die Differenzierbarkeit von f und φ in x0 , • die lokale Auflösbarkeit von φ (x) = 0 bei x0 (d.h., Splittung von x ∈ Rn in (y, z) ∈ Rn−p × R p , Existenz der Abbildung g mit φ (y, g(y)) = 0 nahe y0 ), • die Glattheit von g und • die Invertierbarkeit von D2 φ (y0 , g(y0 )). Der letzte Punkt kann dahingehend verallgemeinert werden, daß [φ 0 (x0 )] eine invertierbare p × p-Untermatrix besitzt, also vom Rang p ist. Satz 6.4.34 sagt nun, daß gerade diese Rangeigenschaft hinreichend ist um Existenz und Glattheit zur erhalten. Damit haben wir Satz 6.4.41. Seien f ∈ C1 (D( f ), R), φ ∈ C1 (D( f ), R p ) mit offenem D( f ) ⊆ Rn , n ≥ p. Sei weiter N = {x ∈ D( f ) : φ (x) = 0}, x0 ∈ N und rang(φ 0 (x0 )) = p. Wenn f in x0 ein relatives Extremum unter der Nebenbedingung N hat, dann existieren Zahlen λ1 , . . . , λ p mit (6.4.14). Bemerkung 6.4.42. 1. Das Kriterium ist im allgemeinen nicht hinreichend, das heißt, ob in einer kritischen Stelle tatsächlich ein Extremum vorliegt, muß natürlich noch geprüft werden. 2. (6.4.14) ist ein nichtlineares System von n + p Gleichungen für die n + p Unbekannten x01 , . . . , x0n , λ1 , . . . , λ p . Setzt man p F(x, λ ) = f (x) − ∑ λ j φ j (x) j=0 so erhält man (6.4.14) durch gradF(x0 , λ ) = 0 . 3. Im Falle p = 1 lautet die Rangeigenschaft gradφ (x0 ) 6= 0 und (6.4.14) bedeutet, daß grad f (x0 ) und gradφ (x0 ) parallel sind. 4. Die Zahlen λi heißen Lagrange-Multiplikatoren. Meist haben sie keine inhaltliche Bedeutung. In einigen Fällen können sie aber als Zwangskräfte (Physik) oder Schattenpreise (Wirtschaft) interpretiert werden. ♦ 142 6.4 Anwendungen der Fréchet-Ableitung Beispiel 6.4.43. 1. Sei A eine lineare Abbildung von Rn nach Rn mit f (x) = hx, Axi = hAx, xi für x ∈ Rn . Gesucht sind Minimum und Maximum von f auf N = {x ∈ Rn : φ (x) = 0} , φ (x) = hx, xi − 1 (Vergleiche Lemma 6.4.25). Es gilt ∂ f (x)h = 2 hAx, hi und ∂ φ (x)h = 2 hx, hi also grad f (x) = 2Ax , gradφ (x) = 2x . Für eine Extremalstelle müssen wir also x0 ∈ N und λ ∈ R finden mit Ax0 = λ x0 . Als Extremalstellen kommen also alle normierten Eigenvektoren von A in Betracht, λ wäre der zu x0 gehörende Eigenwert. Bemerke, daß A nur reelle Eigenwerte hat, da A symmetrisch ist. Für eine solche kritische Stelle erhalten wir f (x0 ) = hx0 , Ax0 i = λ , so daß f das Maximum im normierten Eigenvektor mit dem größtem Eigenwert λmax (A) und das Minimum im normierten Eigenvektor mit dem kleinsten Eigenwert λmin (A) annimmt. Wir erhalten somit ∀x ∈ R : λmin (A)kxk2 ≤ hx, Axi ≤ λmin (A)kxk2 für symmetrisches, lineares A. 2. Man finde alle Punkte (x, y) auf der Ellipse φ (x, y) := 4x2 + y2 − 4 = 0, für welche der Abstand zu (2, 0) extremal wird. Da der Abstand genau dann extremal wird, wenn sein Quadrat extremal wird, können wir also nach Extremstellen von f (x, y) = (x − 2)2 + y2 suchen. Da grad f (x, y) = (2(x − 2), 2y) , gradφ (x, y) = (8x, 2y) , erhalten wir als notwendige Bedingung 2x0 − 4 − 8λ x0 = 0 , 2y0 − 2λ y0 = 0 , 4x02 + y20 = 4 . √ √ Wenn y0 6= 0, dann λ = 1 und daher x0 = − 32 und y0 = − 23 5 oder y0 = + 23 5. Wenn y0 = 0, dann ist x0 = 1 oder x0 = −1 mit λ = − 41 bzw. λ = 34 . √ √ Durch geometrische Betrachtungem erhalten wir, daß in − 32 , − 23 5 und − 23 , + 23 5 relative Maxima und in (1, 0), (−1, 0) relative Minima vorliegen. ♦ 143 6 Differentialrechnung 6.5 Potenzreihen 6.5.1 Definition und Problemstellung Definition 6.5.1. Sei (an ) eine Folge in C, z, z0 ∈ C. Dann heißt ∞ ∑ an(z − z0)n (6.5.1) n=0 Potenzreihe in z − z0 . ♦ Man beachte hierbei (z − z0 )0 = 1 auch für z = z0 . Aufgabenstellung: Untersuchung des Konvergenzverhaltens von Potenzreihen. Genauer: bei gegebenen (an ) und z0 ist nach der Menge aller z ∈ C gefragt für die (6.5.1) konvergiert. Beispiel 6.5.2. 1. Jede Potenzreihe (6.5.1) konvergiert für p z = z0 . Es ist möglich, daß sie n (z − z )n (Es gilt n nn |z − z |n = n|z − z | → ∞ und n nur für z = z0 konvergiert, z.B. ∑∞ 0 0 0 n=0 nach Wurzelkriterium liegt Divergenz vor). n (z−z0 ) konvergiert für alle z ∈ C, denn nach dem Quotientenkrite2. Die Potenzreihe ∑∞ n=0 n! rium ist 1 n!(z − z0 )n+1 |z − z0 | = 0 . | = lim ∀z ∈ C : lim | n n→∞ n + 1 n→∞ (n + 1)!(z − z0 ) ♦ 6.5.2 Konvergenzradius und Konvergenzkreis Sei (an ) eine Folge in C und sei falls ρ = ∞ , 0, p 1/ρ , falls 0 < ρ < ∞ , ρ := lim sup n |an | und r := n→∞ ∞, falls ρ = 0 . Definition 6.5.3. Die oben definierte Zahl r heißt Konvergenzradius der Potenzreihe ∞ ∑ an(z − z0)n , n=0 BC (z0 , r) heißt Konvergenzkreis. ♦ Satz 6.5.4. Die Potenzreihe (6.5.1) konvergiert für alle z ∈ BC (z0 , r) absolut. Für alle z 6∈ BC (z0 , r) divergiert sie. p Beweis. Wegen lim supn→∞ n |an (z − z0 )n | = ρ|z − z0 | und mit dem Wurzelkriterium (Satz n 4.4.4) erhalten wir die absolute Konvergenz der Potenzreihe ∑∞ n=0 an (z − z0 ) für alle z ∈ BC (z0 , r) und die Divergenz für alle z ∈ C \ BC (z0 , r). 144 6.5 Potenzreihen Folgerung 6.5.5. n 1. Die Potenzreihe ∑∞ n=0 an (z − z0 ) möge für ein z1 6= z0 konvergieren. Dann konvergiert sie auch für alle z ∈ C mit |z − z0 | < |z1 − z0 | und zwar absolut. Es gilt r ≥ |z1 − z0 |. n 2. Die Potenzreihe ∑∞ n=0 an (z − z0 ) möge für ein z1 divergieren. Dann divergiert sie auch für alle z ∈ C mit |z − z0 | > |z1 − z0 |. Es gilt r ≤ |z1 − z0 |. Beweis. Konvergiert die Reihe für z1 , so gilt z1 ∈ BC (z0 , r), d.h., |z1 − z0 | ≤ r, und die Reihe konvergiert für z ∈ BC (z0 , |z1 − z0 |) ⊆ BC (z0 , r). Die zweite Aussage folgt aus der ersten. Bemerkung 6.5.6. Über das Konvergenzverhalten auf dem Rand ihres Konvergenzkreises kann keine allgemeine Aussage gemacht werden. ♦ √ n n Beispiel 6.5.7. 1. ∑∞ n=0 z . Hier ist z0 = 0, an = 1, ρ = lim supn→∞ 1 = 1 und daher Konvergenzradius 1. Für |z| = 1 liegt nach Lemma 4.2.4 Divergenz vor. p √ zn 1 n 2. ∑∞ |an | = 1/ limn→∞ n n = 1 und n=1 n . Hier ist z0 = 0, an = n . Es gilt ρ = lim supn→∞ damit haben wir Konvergenzradius 1. Bei z = −1 liegt (bedingte) Konvergenz, bei z = 1 Divergenz vor. √ n −2 1 n 1 3. ∑∞ = 1 und daher Konvergenzn=1 n2 z . Hier ist z0 = 0, an = n2 , ρ = lim supn→∞ n 1 1 n ∞ ∞ radius 1. Da ∑n=1 n2 konvergente Majorante für ∑n=1 n2 z bei |z| = 1 ist, liegt bei |z| = 1 absolute Konvergenz vor. ♦ 6.5.3 Rechnen mit Potenzreihen ∞ n n Satz 6.5.8. Seien ∑∞ n=0 an (z − z0 ) und ∑n=0 bn (z − z0 ) Potenzreihen mit den Konvergenzradien ra und rb . n 1. Seien α, β ∈ C. Die Potenzreihe ∑∞ n=0 (αan + β bn )(z − z0 ) hat einen Konvergenzradius r ≥ min{ra , rb } und für alle z ∈ BC (z0 , min{ra , rb }) gilt ∞ ∑ (αan + β bn)(z − z0) n ∞ =α n=0 ∑ an(z − z0) n ∞ +β n=0 ∑ bn(z − z0)n . n=0 n 2. Sei cn = ∑nk=0 ak bn−k . Dann hat die Potenzreihe ∑∞ n=0 cn (z − z0 ) einen Konvergenzradius r ≥ min{ra , rb } und für alle z ∈ BC (z0 , min{r1 , r2 }) gilt ! ! ∞ ∑ cn(z − z0) n=0 n ∞ = ∑ an(z − z0) n=0 n ∞ · ∑ bn(z − z0)n . n=0 Beweis. Folgt aus entsprechenden Aussagen für Zahlenreihen. ∞ n n Satz 6.5.9 (Identitätssatz). Seien ∑∞ n=0 an (z − z0 ) und ∑n=0 bn (z − z0 ) Potenzreihen mit den Konvergenzradien ra , rb > 0. Sei (wi ) eine Folge in BC (z0 , min{ra , rb }) \ {z0 } mit 145 6 Differentialrechnung 1. limi→∞ wi = z0 . 2. ∀i ∈ N : ∞ n n ∑∞ n=0 an (wi − z0 ) = ∑n=0 bn (wi − z0 ) . Dann sind die beiden Potenzreihen gleich, d.h., an = bn für alle n ∈ N. Beweis. Siehe Literatur. k Satz 6.5.10 (Transformationssatz). Sei ∑∞ k=0 ak (z − z0 ) eine Potenzreihe mit Konvergenzradius r. Sei z1 ∈ BC (z0 , r). Dann gilt mindestens für alle z ∈ C mit |z − z1 | < r − |z1 − z0 | die Gleichung ∞ ∞ ∞ n k k mit bk = ∑ an (z1 − z0 )n−k . (6.5.2) ∑ ak (z − z0) = ∑ bk (z − z1) k k=0 k=0 n=k Satz 6.5.11 (Glattheit von Potenzreihen). Sei f : ]x0 −r, x0 +r[→ R mit f (x) = ∑∞ k=0 ak (x− k ∞ x0 ) und r als Konvergenzradius der Potenzreihe. Dann gilt f ∈ C (]x0 − r, x0 + r[) mit f 0 (x) = ∞ ∑ kak (x − x0)k−1 . k=1 k Insbesondere gilt Tm ( f , x0 )(x) = ∑m k=0 ak (x − x0 ) , die Taylorreihe stimmt also mit der Potenzreihe überein. Beweis. Sei x1 ∈ ]x0 − r, x0 + r[ beliebig. Dann existiert ein δ > 0 mit ∞ ∀x ∈ ]x1 − δ , x1 + δ [: f (x) = ∑ bk (x − x1)k (6.5.3) k=0 und bk nach (6.5.2). Wir zeigen limx→x1 f (x) = f (x1 ) = b0 . Sei α < δ . Wegen der absoluten ∞ k k Konvergenz der Potenzreihe ∑∞ k=0 bk (x − x1 ) , konvergiert ∑k=0 |bk |α . Damit gilt ∞ σ := ∑ |bk |α k−1 < ∞ . k=1 Somit ∞ | f (x) − b0 | = |(x − x1 ) ∑ bk (x − x1 )k−1 | ≤ |x − x1 |σ k=1 für |x − x1 | < α. Damit gilt limx→x1 f (x) = f (x1 ) = b0 und f ist stetig in x1 . Es gilt weiter ∞ f (x) − f (x1 ) = ∑ bk (x − x1 )k−1 . x − x1 k=1 Die rechts stehende Potenzreihe konvergiert und ist stetig in x. Damit existiert f 0 (x1 ) = lim x→x1 ∞ f (x) − f (x1 ) = b1 = ∑ nan (x1 − x0 )n−1 . x − x1 n=1 n−1 hat den gleichen Konvergenzradius wie die AusgangsDie Potenzreihe ∑∞ n=1 nan (x − x0 ) reihe. Durch vollständige Induktion folgt f ∈ C∞ (]x0 − r, x0 + r[). 146 7 Das Riemann-Integral 7.1 Definition und Eigenschaften 7.1.1 Definition des Riemann-Integrals Definition 7.1.1. Sei a = x0 < x1 < · · · < xn = b. Dann heißt Z = {[xk−1 , xk ] : k = 1, . . . , n} eine Zerlegung von [a, b] und Ik = [xk−1 , xk ] ein Zerlegungsintervall. Die Zahl λ (Z) = max |I| = max |xk − xk−1 | k=1,...,n I∈Z heißt Feinheit der Zerlegung. 0 Sind Z = {[xk−1 , xk ] : k = 1, . . . , n} und Z0 = {[xk−1 , xk0 ] : k = 1, . . . , n0 } zwei Zerlegungen, so sei {x0 , . . . , xn } ∪ {x00 , . . . , xn0 0 } = {y0 , . . . , ym } mit yk < yk+1 die Menge aller gemeinsamen Teilungspunkte und Z ∧ Z0 := {[yk−1 , yk ] : k = 1, . . . , m} . Eine Zerlegung Z0 heißt feiner als Z, wenn für jedes I 0 ∈ Z0 ein I ∈ Z existiert, mit I 0 ⊆ I. ♦ Definition 7.1.2. Eine Funktion f : [a, b] → R heißt Treppenfunktion, wenn es eine Zerle gung Z = {[xk−1 , xk ] : k = 1, . . . , n} von [a, b] gibt, so daß f ]x ,x [ , k = 1, . . . , n konstant k−1 k sind. ♦ Bemerkung 7.1.3. 1. Die Funktionswerte von f an den Teilungspunkten von Z sind beliebig. 2. Die Darstellung ist nicht eindeutig: Jede Verfeinerung Z0 vom Z (d.h., für alle I 0 ∈ Z0 gibt es ein I ∈ Z mit I 0 ⊆ I) leistet das gleiche. 3. Man kann f als Linearkombination von charakteristischen Funktionen schreiben N f (x) = ∑ ck χIk (x) k=1 mit ck ∈ R, Ik paarweise disjunkte (offene, abgeschlossene, . . . ) Intervalle mit [a, b]. SN k=1 Ik = 4. Mit T ([a, b]), B([a, b]) bezeichnen wir die Menge aller Treppenfunktionen bzw. aller beschränkten Funktionen auf [a, b]. ♦ 147 7 Das Riemann-Integral Lemma 7.1.4. B([a, b]) ist ein Vektorraum und T ([a, b]) ist ein Untervektorraum von B([a, b]). Beweis. ÜA. Definition 7.1.5 (Integral einer Treppenfunktion). Sei f ∈ T ([a, b]) und sei f ]x ,x [ = k−1 k ck ∈ R bezüglich einer Zerlegung Z = {[xk−1 , xk ], k = 1, . . . , n}. Dann setzt man n Z b f := a ∑ ck (xk − xk−1) . ♦ k=1 Bemerkung 7.1.6. 1. Damit diese Definition sinnvoll ist, muß gezeigt werden, daß sie von der konkreten Zerlegung Z unabhängig ist. Sei f dazu Treppenfunktion mit der Zerlegung Z0 . Dann ist f auch Treppenfunktion mit der Zerlegung Z ∧ Z0 . Man zeigt nun, daß mit Z ∧ Z0 an Stelle von Z der gleiche Wert für das Integral entsteht. 2. Andere Bezeichnungen sind: Z b Z f, Z f (x) dx , [a,b] f (x) dx . [a,b] a ♦ Satz 7.1.7 (Eigenschaften des Integrals von Treppenfunktionen). Seien f , g ∈ T ([a, b]), λ , µ ∈ R. Dann gilt 1. Rb a (λ f + µg) = λ Rb a f +µ Rb a g (Linearität). 2. Aus f ≤ g folgt ab f ≤ ab g (Monotonie). R Speziell folgt aus f ≥ 0 auch ab f ≥ 0 (Positivität). R 3. | Rb a f| ≤ Rb a R | f | ≤ (b − a) sup[a,b] | f |. Beweis. Seien f und g dargestellt mit den Zerlegungen Z und Z0 . Dann können f und g auch mit Z ∧ Z0 dargestellt werden. Hiermit sind die Aussagen aber trivial. Definition 7.1.8 (Ober- und Unterintegral). Sei f ∈ B([a, b]). Dann setzt man das Oberintegral bzw. Unterintegral von f über [a, b] durch Zb ∗ Z b f := inf{ a a g : g ∈ T ([a, b]), g ≥ f } , Zb Z b f := sup{ ∗ a g : g ∈ T ([a, b]), g ≤ f } . a ♦ 148 7.1 Definition und Eigenschaften Beispiel 7.1.9. 1. Für alle f ∈ T ([a, b]) gilt Zb ∗ Zb f= Z b f= f. ∗ a a a 2. Für die Dirichletfunktion f : [0, 1] → R mit f (x) = 1 für x rational und f (x) = 0 für x irrational gilt Z1 ∗ Z1 f = 1, f = 0. ∗ 0 0 ♦ Satz 7.1.10 (Eigenschaften von Ober- und Unterintegral). Für alle f , g ∈ B([a, b]), λ ≥ 0 gilt Zb f≤ ∗ a Zb ∗ ( f + g) ≤ a Zb ∗ Zb ∗ f, a Zb λf =λ a Zb ∗ ∗ Zb f, a f+ a Zb ∗ Zb g, ( f + g) ≥ ∗ a a ∗ a Zb Zb λf =λ Zb f+ ∗ a f. ∗ a g. ∗ a Definition 7.1.11 (Riemann-Integral). Eine Funktion f ∈ B([a, b]) heißt Riemann-integrierbar, wenn Zb ∗ Zb f. f= ∗ a a In diesem Fall setzt man Zb ∗ Z b f := a f a und nennt diese Zahl das Riemann-Integral von f über [a, b]. ♦ Die Menge aller Riemann-integrierbaren Funktionen über [a, b] wird durch R([a, b]) bezeichnet. Bemerkung 7.1.12. Aufgrund der Definition und von Beispiel 7.1.9 gilt T ([a, b]) ⊂ R([a, b]) ⊂ B([a, b]) . 6= 6= ♦ 149 7 Das Riemann-Integral 7.1.2 Existenz des Riemann-Integrals Satz 7.1.13. Für f : [a, b] → R gilt f ∈ R([a, b]) genau dann, wenn für jedes ε > 0 Funktionen g, h ∈ T ([a, b]) existieren mit g ≤ f ≤ h und Z b (h − g) ≤ ε . (7.1.1) a Beweis. „=⇒“ Wenn f ∈ R([a, b]), dann Zb ∗ Zb f= ∗ a f a und für jedes ε > 0 existieren g, h ∈ T ([a, b]) mit g ≤ f ≤ h und Z b h≤ Z b a a ε f+ , 2 Z b f− a ε ≤ 2 Z b g. a Daraus folgt (7.1.1). „⇐=“ Sei ε > 0 beliebig und seien g, h ∈ T ([a, b]) mit g ≤ f ≤ h und (7.1.1). Dann gilt Z b g≤ a und daher 0≤ Zb ∗ Zb f, ∗ a a Zb ∗ Zb a f− ∗ a f≤ Z b h a f <ε. Satz 7.1.14. 1. Jede stetige Funktion auf [a, b] ist Riemann-integrierbar auf [a, b]: C([a, b]) ⊂ R([a, b]) . 2. Jede monotone Funktion auf [a, b] ist Riemann-integrierbar auf [a, b]. Beweis. Zu 1. Da f stetig auf dem kompakten Intervall [a, b] ist, ist f auch gleichmäßig ε stetig. Sei ε > 0 beliebig. Dann existiert ein δ > 0 mit | f (x)− f (y)| < b−a für x, y ∈ [a, b] mit b−a b−a |x − y| < δ . Sei n ∈ N mit n < δ , xk = a + k n für k = 0, . . . , n und seien g, h ∈ T ([a, b]) definiert durch g(x) = min[xk−1 ,xk ] f (x) und h(x) = max[xk−1 ,xk ] f (x) für x ∈ [xk−1 , xk ] und ε k = 1, . . . , n. Dann gilt 0 ≤ h(x) − g(x) < b−a für alle x ∈ ]xk−1 , xk [ und alle k = 1, . . . , n, d.h., Rb Rb ε für alle x ∈ [a, b]. Somit gilt a (h − g) ≤ a b−a < ε. Mit Satz 7.1.13 folgt die Behauptung. Zu 2. O.B.d.A. sei f monoton wachsend. Sei ε > 0 beliebig und sei n ∈ N>0 mit b−a n ( f (b)− b−a f (a)) < ε. Wir setzen xk = a + k n für k = 0, . . . , n und defineren g, h ∈ T ([a, b]) durch 150 7.2 Hauptsatz der Differential- und Integralrechnung g(x) = f (xk−1 ) und h(x) = f (xk ) für x ∈ [xk−1 , xk ] und k = 1, . . . , n. Dann gilt g ≤ f ≤ h. Weiter gilt Z b a h− n Z b g= a ∑ k=1 n f (xk )(xk − xk−1 ) − ∑ f (xk−1 )(xk − xk−1 ) k=1 n b−a ∑ ( f (xk ) − f (xk−1)) n k=1 b−a ( f (b) − f (a)) < ε . = n = Mit Satz 7.1.13 folgt die Behauptung. Definition 7.1.15. Eine Teilmenge µ von [a, b] heißt Lebesgue-Nullmenge oder hat das Lebesgue-Maß 0, wenn es für jedes ε > 0 ein abzählbares System von Intervallen gibt, die µ überdecken und deren Summe der Intervallängen kleiner als ε ist. ♦ Bemerkung 7.1.16. Jede abzählbare Menge hat das Lebesgue-Maß 0. ♦ Satz 7.1.17 (Satz von Lebesgue (1875-1941)). Eine Funktion f gehört zu R([a, b]) genau dann, wenn f auf [a, b] beschränkt ist und auf [a, b] bis auf eine Lebesgue-Nullmenge stetig ist. Satz 7.1.18. Sei f ∈ R([a, b]) und sei f˜ : [a, b] → R mit f˜(x) = f (x) für alle x ∈ [a, b] mit Ausnahme von endlich vielen Punkten. Dann ist f˜ ∈ R([a, b]) und Z b Z b f= a f˜ . a Damit hängen Integrierbarkeit und auch der Wert des Integrals nicht davon ab, welche Werte die Funktion auf endlich vielen Punkten annimmt. 7.2 Hauptsatz der Differential- und Integralrechnung 7.2.1 Stammfunktionen Definition 7.2.1. Sei I ein Intervall. Eine Funktion F : I → R heißt Stammfunktion von f : I → R, wenn 1. F ist differenzierbar auf I 2. F 0 (x) = f (x) für alle x ∈ I. ♦ 151 7 Das Riemann-Integral Beispiel 7.2.2. 1) F(x) = 2.3 + cos x ist eine Stammfunktion von − sin x auf I = R. 2) I = ]0, ∞[ und f (x) = 1x . Stammfunktion auf ]0, ∞[ ist F(x) = ln(x). 3) I = ] − ∞, 0[ und f (x) = 1x . Stammfunktion auf ]0, ∞[ ist F(x) = ln(−x), denn [ln(−x)]0 = 1 1 ♦ −x (−1) = x . Die beiden letzten Beispiele geben Anlaß, manchmal F(x) = ln |x| als Stammfunktion von 1 x auf R \ {0} zu bezeichnen, obwohl R \ {0} kein Intervall ist! Lemma 7.2.3. Seien F1 und F2 Stammfunktionen von f auf dem Intervall I. Dann ist F1 −F2 konstant auf I. Ist F irgendeine Stammfunktion von f auf I und C eine beliebige Konstante, dann ist auch F +C eine Stammfunktion von f auf I. Beweis. (F1 − F2 )0 (x) = F10 (x) − F20 (x) = f (x) − f (x) = 0 für alle x ∈ [a, b]. Nach Mittelwertsatz (Satz 6.2.21) ist F1 − F2 konstant. Wenn F 0 = f dann auch (F +C)0 = F 0 = f . Definition 7.2.4. Die Menge aller Stammfunktionen von f : I → R heißt unbestimmtes InR tegral von f und wird mit f bezeichnet. ♦ Es gilt also Z f = {F +C : C ∈ R}, falls F eine Stammfunktion von f ist. Bemerkung 7.2.5. Anstelle R f = {F +C : C ∈ R} wird auch, verkürzt, Z f (x) dx = F(x) +C geschrieben. Dies ist aber nicht korrekt, da links eine Menge von Funktionen steht (mit gebundener Variablen x), aber rechts der Wert einer Funktion an einer nicht genauer spezifizierten Stelle steht (mit freier Variablen x). ♦ Um zu überprüfen, ob eine Funktion F Stammfunktion von f auf dem Intervall I ist, ist zu zeigen, daß F auf I differenzierbar ist mit F 0 (x) = f (x) für x ∈ I. Bemerkung 7.2.6. Eine Tabelle von Stammfunktionen zu ausgewählten Funktionen erhält man, indem man eine Liste von differenzierbaren Funktionen erstellt und neben einer solchen Funktion die Ableitung schreibt. Kehrt man eine solche Tabelle um, erhält man eine Zuordnung von Funktionen und Stammfunktionen: 152 Funktion Stammfunktion potα für α 6= 0 ln exp sin cos Ableitung Funktion αpotα−1 für α 6= 0 pot−1 exp cos − sin 7.2 Hauptsatz der Differential- und Integralrechnung 7.2.2 Die Existenz der Stammfunktion Seien f ∈ R([a, b]) und x ∈ [a, b]. Wegen [a, x] ⊆ [a, b] folgt f [a,x] ∈ R([a, x]), d.h., es existiert eine Funktion Φ : [a, b] → R mit Z x Φ(x) = f. a Es gilt Φ(a) = 0 und Φ(b) = Rb a f. Satz 7.2.7. Sei f ∈ R([a, b]) und Φ : [a, b] → R mit Φ(x) = Rx a f für x ∈ [a, b] . Dann gilt: 1. Φ ist stetig. 2. Wenn f in einem Punkt x0 ∈ [a, b] stetig ist, dann ist Φ in x0 differenzierbar und es gilt Φ 0 (x0 ) = f (x0 ) . Beweis. (Der Beweis verwendet schon die Resulate aus 7.2.4) 1. Aus f ∈ R([a, b]) ⊂ B([a, b]) folgt die Beschränktheit von f auf [a, b]. Damit existiert ein M > 0 mit | f (t)| ≤ M für t ∈ [a, b]. Seien x ∈ [a, b] und ε > 0. Sei h ∈ R mit |h| < δ := ε M+1 Dann Φ(x + h) − Φ(x) = und Z x+h x + h ∈ [a, b] . f− Z x a und daher Z x+h Z x+h f= a f x M ε <ε. M+1 x Somit ist Φ stetig (unabhängig davon, ob f Unstetigkeitsstellen besitzt). |Φ(x + h) − Φ(x)| = | f | ≤ |h|M ≤ 2. Sei f in x0 ∈ [a, b] stetig. Dann existiert eine Funktion δ : R≥0 → R≥0 mit |x − x0 | < δ (ε) ⇒ | f (x) − f (x0 )| < ε . Wir setzen φ = f − f (x0 ). Sei ε > 0 beliebig und |h| < δ (ε) mit x0 + h ∈ [a, b]. Dann | Z x0 +h φ | ≤ sign(h) x0 Z x0 +h x0 Z x0 +h = sign(h) x0 und somit | Z x0 +h |φ | | f − f (x0 )| < ε|h| φ | = o(|h|) für h → 0 x0 153 7 Das Riemann-Integral Somit ist Φ(x0 + h) − Φ(x0 ) = Z x0 +h Z x0 +h f= x0 Z x0 +h = x0 ( f (x0 ) + φ ) x0 Z x0 +h f (x0 ) + φ x0 = f (x0 )h + o(|h|) für h → 0 , d.h., Φ 0 (x0 ) = f (x0 ). R x5 √ R √ Beispiel 7.2.8. Man berechne F 0 für F(x) = √ 1 + t 2 dt. Sei Φ(u) = 0u 1 + t 2 dt. Dann x3 0 5 3 2 F(x) √ = Φ(x ) − Φ(x ). Der Integrand f (t) = 1 + t ist stetig, nach Satz 7.2.7 gilt Φ (u) = 1 + u2 . Damit p p 0 0 5 4 0 3 2 2 2 10 6 F (x) = Φ (x )5x − Φ (x )3x = x 5x 1 + x − 3 1 + x . ♦ Als Folgerung aus Satz 7.2.7 ergibt sich Satz 7.2.9. Jede auf einem kompakten Intervall [a, b] stetige Funktion f besitzt auf diesem Intervall eine durch Z x Φ(x) = f (7.2.1) a auf [a, b] definierte Stammfunktion Φ. 7.2.3 Der Hauptsatz Sei jetzt F : [a, b] → R eine beliebige Stammfunktion einer Funktion f ∈ C([a, b]) und sei Φ : [a, b] → R definiert durch (7.2.1). Nach Lemma 7.2.3 existiert eine Konstanten C mit F = Φ +C . Wegen F(a) = Φ(a) +C und Φ(a) = 0 folgt F(a) = C. Damit gilt Φ = F −C = F − F(a) . Wegen Φ(x) = Rx a f erhalten wir somit die Newton-Leibniz-Formel Z b a b x=b f = F(b) − F(a) =: F a = F(x)x=a . (7.2.2) Damit haben wir den folgenden Satz bewiesen: Satz 7.2.10 (Newton-Leibniz). Ist f eine stetige Funktion auf einem kompakten Intervall [a, b] und F eine beliebige Stammfunktion von f auf [a, b], dann gilt (7.2.2). 154 7.2 Hauptsatz der Differential- und Integralrechnung Bemerkung 7.2.11. Die Newton-Leibniz-Formel (7.2.2) stellt eine „Äquivalenz“ der Berechnung des bestimmten Integral und der Stammfunktion für die Klasse der stetigen Funktionen auf einem kompakten Intervall her: f ∈ C([a, b]) =⇒ f ∈ R([a, b]) ⇓ f hat Stammfunktion F ♦ Als Verallgemeinerung von Satz 7.2.10 zeigen wir Satz 7.2.12 (Hauptsatz der Differential- und Integralrechnung). Sei f ∈ R([a, b]) und es existiere eine Stammfunktion F von f auf [a, b]. Dann gilt (7.2.2). Beweis. Sei ε > 0 beliebig. RDann existieren nach Satz 7.1.13 Treppenfunktionen g und h auf [a, b] mit g ≤ f ≤ h und ab (h − g) < ε. Seien Zg und Zh die zugehörigen Zerlegungen und sei Z = Zg ∧ Zh = {[xk−1 , xk ] : k = 0, . . . , n}, a = x0 < x1 < · · · < xn = b . Dann gilt nach Mittelwertsatz 6.2.21 n F(b) − F(a) = n ∑ (F(xk ) − F(xk−1)) = ∑ f (ξk )(xk − xk−1) k=1 k=1 mit ξk ∈ ]xk−1 , xk [. Andererseits ist n Z b g= a n Z b ∑ g(ξk )(xk − xk−1) , h= a k=1 ∑ h(ξk )(xk − xk−1) k=1 und wegen g ≤ f ≤ h folgt Z b F(b) − F(a) ∈ [ Z b h] . g, a a Andererseits gilt auch Z b Z b f ∈[ a Z b g, a und damit |F(b) − F(a) − h] a Z b f| ≤ ε . a Da ε > 0 beliebig war, folgt die Behauptung. Bemerkung 7.2.13. 1. Satz 7.2.12 wird auch 1. Hauptsatz der Differential- und Integralrechnung genannt. Der 2. Hauptsatz ist Satz 7.2.9 zur Existenz der Stammfunktion. 2. Eine Funktion f kann eine Stammfunktion haben, √ obwohl sie nicht Riemann-integrierbar ist. Betrachte z.B. F : [0, 1] → R mit F(x) = x x sin 1x für x ∈ ]0, 1] und F(0) = 0. Sei 155 7 Das Riemann-Integral √ f : [0, 1] → R mit f (x) = 32 x sin 1x − √1x cos 1x für x ∈ ]0, 1] und f (0) = 0. Dann gilt F 0 = f , F ist also Stammfunktion von f . f ist aber nicht Riemann-integrierbar, da f nicht beschränkt ist. 3. Eine Riemann-integrierbare Funktion braucht keine Stammfunktion zu haben. Sei dazu f : [−1, 1] → R mit f (x) = 0 für x ∈ [−1, 0] und f (x) = 1 für x ∈ ]0, 1]. Da f eine Treppenfunktion ist, gilt f ∈ R([−1, 1]). f besitzt aber keine Stammfunktion: Angenommen, F wäre Stammfunktion. Nach Mittelwertsatz gilt F(h) − F(0) = F 0 (τh)h = f (τh)h mit einem = 1 und limh%0 F(h)−F(0) = 0. Somit ist F entgegen τ ∈ [0, 1]. Damit folgt limh&0 F(h)−F(0) h h der Annahme nicht differenzierbar bei 0. 4. Für (7.2.2) sind also Riemann-Integrierbarkeit von f und die Existenz der Stammfunktion zu fordern. Beides gilt aber wegen der Sätze 7.1.14 und 7.2.9 für stetiges f , siehe dann Satz 7.2.10. ♦ 7.2.4 Eigenschaften des bestimmten Integrals und Struktur von R([a, b]) Zuerst erweitern wir die Definition des Riemann-Integrals indem wir Z b f := − Z a f a b für a > b setzen. Für f : [a, b] → R und [c, d] ⊆ [a, b] schreiben wir kurz f ∈ R([c, d]) , wenn f [c,d] ∈ R([c, d]) und Z d f := c Z d c f [c,d] . Satz 7.2.14 (Algebraische Struktur). Für alle f , g ∈ R([a, b]) und alle λ , µ ∈ R gilt (λ f + µg) ∈ R([a, b]) und Z b Z b (λ f + µg) = λ a Z b f +µ a g. a Weiter gilt f g ∈ R([a, b]) . Beweis. kompliziert. Satz 7.2.15 (Monotonie-Eigenschaften bezüglich Integranden). Seien f , g ∈ R([a, b]), b ≥ a. Dann gilt 156 7.2 Hauptsatz der Differential- und Integralrechnung Rb a f. f≤ Rb 1. f ≥ 0 =⇒ 0 ≤ 2. f ≤ g =⇒ Rb a a g. Rb 3. m ≤ f ≤ M mit m, M ∈ R =⇒ m(b − a) ≤ 4. | f | ≤ M ∈ R =⇒ | Beweis. 1) f ≥ 0 ergibt Rb a f ≤ M(b − a). a f | ≤ M(b − a). Z ∗b f ≥ 0. Damit gilt Rb a 2) Aus g − f ≥ 0 folgt mit 1) Rb a (g − f ≥ 0. a f ) ≥ 0 und somit mit Linearität Rb a g≥ Rb a f. 3) Wähle g = M und wende 2) für obere Abschätzung an. 4) Folgt mit −M ≤ f ≤ M aus 3). Satz 7.2.16 (Monotonie und Additivität bezüglich Integrationsbereich). Es gelten: 1. f ∈ R([a, b]) ∧ [c, d] ⊆ [a, b] =⇒ f ∈ R([c, d]). 2. Sei c ∈ [a, b]. Dann f ∈ R([a, b]) ⇐⇒ f ∈ R([a, c]) ∧ f ∈ R([c, b]). 3. f ∈ R([a, b]) ∧ c ∈ [a, b] =⇒ reich). Rb a f= Rc a f+ 4. f ∈ R([a, b]) ∧ f ≥ 0 ∧ [c, d] ⊆ [a, b] =⇒ tionsbereich). Rb f (Additivität bezüglich Integrationsbe- c Rd c f≤ Rb a f (Monotonie bezüglich Integra- Satz 7.2.17 (Absolute Integrierbarkeit). Es gilt: 1. f ∈ R([a, b]) =⇒ | f | ∈ R([a, b]), aber | f | ∈ R([a, b]) 6=⇒ f ∈ R([a, b]). 2. Wenn f ∈ R([a, b]) und b ≥ a, dann | Rb a f| ≤ Rb a | f | ≤ (b − a) supx∈[a,b] | f (x)|. Beweis. Zu 2. Aus −| f | ≤ f ≤ | f | und den Sätzen 7.2.14, 7.2.15 folgt − Rb a | f |. Satz 7.2.18. Wenn f ∈ C([a, b]) mit f ≥ 0, dann Rb Rb a |f| ≤ Rb a f ≤ f = 0 =⇒ f = 0. a Satz 7.2.19 (1. Mittelwertsatz der Integralrechnung). Seien f , g ∈ R([a, b]) mit g ≥ 0. Dann existiert ein µ ∈ [m, M] mit m = infx∈[a,b] f (x), M = supx∈[a,b] f (x), so daß Z b Z b fg = µ a g. (7.2.3) a Speziell gilt für g = 1 Z b f = µ(b − a) . a Wenn zusätzlich f stetig ist, dann existiert ein ξ ∈ [a, b] mit Z b Z b f g = f (ξ ) a g. a 157 7 Das Riemann-Integral Beweis. Es gilt m ≤ f ≤ M und daher nach Satz 7.2.15 Z b m g≤ a Wenn setze Rb a g = 0, folgt Rb a Z b fg ≤ M a Z b g. (7.2.4) a f g und wegen (7.2.4) gilt (7.2.3) gilt trivialer Weise. Wenn Rb µ := Ra b a fg g Rb a g>0 . Wegen (7.2.4) gilt µ ∈ [m, M]. Ist f stetig, dann sind m und M Funktionswerte von f . Nach dem Satz von Bolzano-Cauchy Rb Rb (Satz 5.2.23) existiert ein ξ ∈ [a, b] mit f (ξ ) = µ. Somit a f g = µ a g. Satz 7.2.20 (2. Mittelwertsatz der Integralrechnung). Sei f monoton auf [a, b] und sei g ∈ C([a, b]). Dann existiert ein ξ ∈ [a, b] mit Z b Z b Z ξ f g = f (a) a g + f (b) a g. ξ 7.3 Integrationsmethoden Sei R f die Menge aller Stammfunktionen von f über einem gegebenen Intervall. Seien F, G Mengen von Funktionen über einem Intervall I. Seien λ , µ ∈ R und seien h : I → R , φ : J → I. Dann setzen wir λ F + µG := {λ f + µG : f ∈ F, g ∈ G} und F + h = { f + h : f ∈ F} , F ◦ φ = { f ◦ φ : f ∈ F} . 7.3.1 Linearität Satz 7.3.1 (Linearkombination von Funktionen). 1. Seien f , g : I → R und λ , µ ∈ R. Dann gilt Z Z Z (λ f + µg) ⊇ λ 2. Wenn zusätzlich f , g ∈ R([a, b]) und R f +µ R f 6= 0, / g 6= 0, / dann Z b Z b (λ f + µg) = λ a Beweis. 1. Seien F ∈ Differentiation gilt R auf I . g Z b f +µ a g. a R f und G ∈ g und sei H = λ F + µG. Wegen der Linearität der H 0 = λ F 0 + µG0 = λ f + µg R und somit H ∈ (λ f + µg). 2. Die Behauptung folgt aus 1. und dem Hauptsatz 7.2.12. 158 7.3 Integrationsmethoden 7.3.2 Partielle Integration Als Folgerung aus der Produktregel der Differentialrechnung ergibt sich Satz 7.3.2. 1. Seien u, v : I → R differenzierbar. Dann gilt Z 0 uv = uv − Z u0 v auf I . 2. Wenn zusätzlich uv0 , u0 v ∈ R([a, b]) und wenn u0 v 6= 0, / dann R Z b a b Z b 0 u v. uv0 = (uv)a − (7.3.1) a Beweis. 1. Sei F ∈ u0 v auf I. Die Funktion uv − F ist differenzierbar mit R (uv − F)0 = (uv)0 − F 0 = u0 v + uv0 − u0 v = uv0 , somit uv − Z u0 v ⊆ Z uv0 . Z 0 Z u0 v , Analog folgt uv − uv ⊆ und damit die erste Behauptung. 2. Die zweite Behauptung mit 1. und dem Hauptsatz 7.2.12. Bemerkung 7.3.3. 1. Aufgrund der Sätze 7.1.14 und 7.2.9 gilt uv0 , u0 v ∈ R([a, b]) und R 0 u v 6= 0, / wenn u, v ∈ C1 ([a, b]). 2. Stammfunktionen bzw. Integrale können durch partielle Integration bestimmt werden für: xn ex , xn sin x , xn cos x , xα ln x , xn arctan x , xn arcsin x Für die ersten drei Funktionen wird u = (x 7→ xn ) verwendet. Nach n-maliger partieller Integration entsteht die Aufgabe der Bestimmung von Stammfunktion bzw. Integral von exp , sin , cos . Für die letzten drei Typen verwendet man v0 (x) = xα bzw. v0 (x) = xn . Vereinfachung entsteht hier durch Differentiation der transzendenten Ausdrücke. ♦ Beispiel 7.3.4. 1. Mit 0 < a ≤ b gilt Z b Z b ln = a a b Z b 1 − x dx ln · 1 = (x → 7 x ln x) |{z} |{z} a a x u v0 = b ln b − b − a ln a + a . 159 7 Das Riemann-Integral 2. Sei Sm = sinm auf R. Dann gilt R Z Sm = Z m sin = m−1 cos)0 sin | {z } · (− | {z } u 0 Zv = − sinm−1 · cos +(m − 1) m−1 = − sin Z · cos +(m − 1) sinm−2 cos2 sinm−2 (1 − sin2 ) = − sinm−1 · cos +(m − 1)Sm−2 + (1 − m)Sm und wir erhalten daher die Rekursionsformel Sm = − Da Z S0 = m−1 1 m−1 sin · cos + Sm−2 . m m Z sin0 3 (x 7→ x) und S1 = sin1 3 − cos , können wir Sm für gerade und ungerade m iterativ aus S0 bzw. S1 bestimmen. Es gelten π 2 Z sin m 0 π m − 1 Z π2 m−2 1 m−1 cos 02 + = − sin sin m m 0 Z π m − 1 2 m−2 = sin m 0 und π 2 Z 0 π sin = , 2 0 Z π 2 sin1 = 1 . 0 Damit gilt 0 m−1 m−3 m m−2 m−1 m−3 m m−2 2 2 π 2 Z m sin = · · · · · 12 · 1 π2 , falls m gerade , · · · · · 23 · 1 , falls m ungerade . 3. Es gilt Z x cos |{z} |{z}x dx = (x 7→ x sin x) − 2 u v0 Z x |{z} sin x dx |{z} u1 v01 = (x 7→ x2 sin x) + 2(x 7→ x cos x) − 2 Z cos x dx 3 (x 7→ (x2 sin x + 2x cos x − 2 sin x)) . und daher Z b a 160 2 2 x2 cos |{z} |{z}x dx = b 7→ b sin b + 2b cos b − 2 sin b − a 7→ a sin a − 2a cos a + 2 sin a . u v0 ♦ 7.3 Integrationsmethoden 7.3.3 Substitutionsmethode Die Kettenregel für die Differentiation von zusammengesetzten Funktionen führt zu einer Methode der Transformation bestimmeter Integrale, der Substitutionsmethode der Integralvariablen. Satz 7.3.5. 1. Sei φ : I = [a, b] → R differenzierbar und sei f : φ (I) → R. Dann gilt Z Z 0 ( f ◦ φ )φ ⊇ f ◦ φ auf I . 2. Wenn zusätzlich f ∈ R(φ ([a, b])), ( f ◦ φ )φ 0 ∈ R([a, b]) und Z b 0 ( f ◦ φ )φ = R f 6= 0, / dann Z φ (b) f. (7.3.2) φ (a) a Beweis. 1. Sei F ∈ R f auf φ (I). Nach der Kettenregel gilt ∂ (F ◦ φ ) = ( f ◦ φ )φ 0 auf I und daher F ◦ φ ∈ ( f ◦ φ )φ 0 . R 2. Mit 1. und dem Hauptsatz 7.2.12 folgt Z φ (b) φ (a) b Z b f = F(φ (b)) − F(φ (a)) = F ◦ φ a = ( f ◦ φ )φ 0 . a Bemerkung 7.3.6. 1. Aufgrund der Sätze 7.1.14 und 7.2.9 gilt f ∈ R(φ ([a, b])), ( f ◦ φ )φ 0 ∈ R R([a, b]) und f 6= 0, / wenn φ ∈ C1 ([a, b]) und f ∈ C(φ ([a, b])). 2. Sei X = R und φ = idX = dx die Identität auf X. Dann gilt φ 0 = id0X = idX = dx und daher nach Satz 7.3.5 Z Z Z Z b b f (x) dx = a b f= a a ( f ◦ idX )id0X = b f dx a Das Symbol dx im linken Integral zur Bezeichnung der Integrationsvariablen ist also, wie im rechten Integral zu sehen ist, das Differential dx der Identität auf X. ♦ Beispiel 7.3.7. 1. Sei φ ∈ C1 ([a, b]). Dann und daher Z b 0 φ (x) a φ (x) dx = Z φ (b) dx φ (a) x R b φ 0 (x) a φ (x) Z f (αx + β )dx = ( Rb a = ln |φ (b)| − ln |φ (a)| , 2. Sei f ∈ C([a, b]), α, β ∈ R, α 6= 0. Dann φ (x) = αx + β und daher Z dx = f)◦φ , R f (φ (x))φ 0 (x) dx mit f (x) = wenn 0 6= φ ([a, b]) . f (αx + β ) dx = f (αx + β ) dx = a 1 α R Z φ (b) Z b 1 x f (φ (x))φ 0 (x) dx mit Z αb+β f= φ (a) f. αa+β 161 7 Das Riemann-Integral Speziell folgt dx 3 ln |(·) − a| x−a Z dx 1 ((·) − a)1−k 3 k 1−k (x − a) Z (7.3.3) (k 6= 1) . (7.3.4) 3. Seien a, b ∈ R mit c2 = b − a2 > 0. Mit f (x) = x−k und φ (x) = x2 + 2ax + b gilt 2x + 2a Z dx 3 x 7→ ln |x2 + 2ax + b| Z 2x + 2a 1 2 1−k (x + 2ax + b) dx 3 x 7→ 1−k (x2 + 2ax + b)k (7.3.5) x2 + 2ax + b (k 6= 1) . (7.3.6) ♦ In vielen Fällen ist der Integrand nicht sofort in der Form f (φ (x))φ 0 (x) mit geeigneter Substitution φ erkennbar. Vielfach ist aber der Integrand von der Form h(x) = g(x, φ (x)), und man vermutet, eine Substitution φ könnte erfolgreich sein. Der folgende Satz sagt, wie man dann die Funktion f mit f (φ (x))φ 0 (x) = g(x, φ (x)) = h(x) bestimmen muß: Satz 7.3.8. 1. Sei h : [a, b] → R und es mögen g ∈ C([a, b]×[c, d], R) und ein streng monotones und differenzierbares φ : [a, b] → R mit [c, d] = φ ([a, b]), φ 0 (x) 6= 0 und h(x) = g(x, φ (x)) für x ∈ [a, b] existieren. Sei f : [c, d] → R definiert durch f (z) := g(φ −1 (z), z) φ 0 (φ −1 (z)) für z ∈ [c, d] . Ist F eine Stammfunktion zu f auf [c, d], so ist F ◦ φ eine Stammfunktion zu h auf [a, b], d.h., Z Z h⊇ f ◦ φ auf [a, b] . 2. Wenn zusätzlich h ∈ C([a, b]), φ ∈ C1 ([a, b]), dann Z b g(x, φ (x)) dx = a Beweis. 1. Sei F ∈ R Z φ (b) Z b h= a f. φ (a) f auf [c, d]. Nach der Kettenregel gilt (F ◦ φ )0 (x) = f (φ (x))φ 0 (x) = g(x, φ (x)) 0 φ (x) = g(x, φ (x)) = h(x) auf [a, b] , φ 0 (x) R so daß F ◦ φ ∈ h folgt. 2. Nach Voraussetzung ist f stetig und ist damit integrierbar auf [c, d] und besitzt eine Stammfunktion F auf [c, d]. Die Behauptung folgt damit aus dem Hauptsatz. 162 7.4 Integration gebrochen-rationaler Funktionen Beispiel 7.3.9. Wir betrachten Z Wir vermuten φ (x) = ln x mit φ 0 (x) = Z 1 x dx . x(ln x)k und erhalten Z dx 1 1 dz ◦ ln = x(ln x)k ln−1 (z)zk ln0 (ln−1 (z)) Z Z 1 dz −1 ln (z)dz ◦ ln) = ◦ ln . zk ln−1 (z)zk Damit erhalten wir Z b dx a x ln x = ln | ln b| − ln | ln a| , Z b a dx 1 −1k 1−k (ln b) − (ln a) = x(ln x)k 1 − k wenn 0 < a ≤ b mit 1 6∈ [a, b]. für k > 1 , ♦ 7.4 Integration gebrochen-rationaler Funktionen 7.4.1 Partialbruchzerlegung Sei R : D(R) → C eine gebrochen-rationale Funktion mit R(x) = men p und q. p(x) q(x) auf D(R) mit Polyno- Zuerst bemerken wir, daß aufgrund von Satz ?? eindeutig bestimmte Polynome h und r existieren mit r(x) p(x) = h(x) + für x ∈ D(R) , degr < degq . q(x) q(x) Das Polynom h heißt Polynomanteil von R. Der Rest stellt eine echt gebrochen-rationale Funktion dar. Die Idee besteht nun darin, diesen echt gebrochen-rationalen Anteil in eine Summe einfacherer Brüche, Hauptteile genannt, zu zerlegen. Beispiel 7.4.1. 10x−23 x2 −5x+6 = 10x−23 (x−2)(x−3) = 3 x−2 7 + x−3 . ♦ Satz 7.4.2 (Partialbruchzerlegung). Es sei R : D(R) → C eine gebrochen rationale Funkp(x) für x ∈ D(R) mit Polynomen p, q und degp < degq. Seien z j , j = 1, . . . , n, tion mit R(x) = q(x) die Nullstellen von q mit den Vielfachheiten m j . Dann existieren eindeutig bestimmte a jk ∈ C mit n mj a jk R(x) = ∑ ∑ für x ∈ D(R) . (7.4.1) k (x − z ) j j=1 k=1 163 7 Das Riemann-Integral Beweis. O.B.d.A. sei der führende Koeffzient von q gleich 1, d.h., n q(x) = ∏ (x − z j )m j . j=1 Wir machen den Ansatz p(x) a p1 (x) = + m 1 q(x) (x − z1 ) q1 (x) (7.4.2) mit a ∈ C, einem Polynom p1 und einem Polynom q1 mit q1 (x) = q(x) . x − z1 Durch Multiplikation von (7.4.2) mit q(x) folgt n p(x) = a ∏ (x − z j )m j + (x − z1 )p1 (x) , (7.4.3) j=2 woraus wir n a = p(z1 )/ ∏ (z1 − z j )m j j=2 ablesen. Also ist a1m1 = a eindeutig bestimmt. Aus (7.4.3) folgt n degp1 < ∑ m j ≤ degq1 ∨ degp1 = degp − 1 < degq − 1 = degq1 . j=2 Folglich können wir obige Argumentation auf p1 , q1 anwenden und erhalten in endlich vielen Schritten die Behauptung. Satz 7.4.3 (Reelle Partialbruchzerlegung). Es sei R : D(R) ⊂ R → R eine gebrochen rap(x) tionale Funktion mit R(x) = q(x) für x ∈ D(R) mit Polynomen p, q und degp < degq mit reellen Koeffizienten. Seien z j , j = 1, . . . , nr , die reellen Nullstellen von q mit den Vielfachheiten m j und seien z j , z̄ j , j = nr+1 , . . . , n, die nichtreellen Nullstellen der Vielfachheit m j . Dann existieren eindeutig bestimmte a jk , b jk , c jk ∈ R mit nr m j m j n a jk b jk x + c jk + ∑ ∑ 2 R(x) = ∑ ∑ k 2 k j=1 k=1 (x − z j ) j=nr +1 k=1 (x − 2ℜ(z j )x + |z j | ) für x ∈ D(R) . (7.4.4) Beweis. Folgt aus Satz 7.4.2 durch Zusammenfassung der zu konjugiert komplexen Nullstellen gehörigen Terme. 164 7.4 Integration gebrochen-rationaler Funktionen 7.4.2 Praktische Berechnung der Partialbruchzerlegung 1. Schritt: Abspalten des Polynomanteils durch Division mit Rest R(x) = p0 (x) + p(x) . q(x) 2. Schritt: Bestimmung der Nenner-Nullstellen des echt-gebrochenen Anteils; kürzen von Zähler und Nenner, damit m q(x) = ∏(x − xi )αi mit p(xi ) 6= 0 ; i=1 Abspaltung der Hauptteile durch entsprechenden Ansatz: m αi R(x) = p0 (x) + ∑ Ai j ∑ (x − xi) j i=1 j=1 und damit m m αi k=1 i=1 j=1 [R(x) − p0 (x)] ∏ (x − xk )αk = ∑ ∑ Ai j αk ∏m k=1 (x − xk ) . (x − xi ) j Links und rechts stehen nun Polynome. Die Ai j ergeben sich durch Koeffizientenvergleich, der nach Satz 7.4.2 immer zum Erfolg führen muß. Beispiel 7.4.4. f (x) = x+1 . x(x−1)2 Der 1. Schritt ist überflüssig. 2.: Nullstellen des Nenners sind 0 und 1, letztere mit Vielfachheit 2. Daher Ansatz x+1 b c a f (x) = + + = . (7.4.5) 2 x(x − 1) x − 0 x − 1 (x − 1)2 Damit x + 1 = a(x − 1)2 + bx(x − 1) + cx = (a + b)x2 − (2a + b − c)x + a , (7.4.6) d.h., a = 1, −2a − b + c = 1 , a+b = 0 und deswegen a = 1, b = −1 , c = 2. Zusammengefaßt ergibt sich x+1 1 1 2 = − + . 2 x(x − 1) x x − 1 (x − 1)2 ♦ In vielen Fällen ist es sinnvoller, keinen vollständigen Koeffizientenvergleich durchzuführen, sondern einige Koeffizienten durch Einsetzen von Null- oder Polstellen oder auch anderen geeigneten Zahlen zu bestimmen. In (7.4.6) kann man z.B. 0 einsetzen und erhält sofort a = 1. Durch Einsetzen von 1 ergibt sich sofort c = 2. Der dritte Koeffizient b kann durch Koeffizientenvergleich oder durch Einsetzen einer geeigneten Zahl bestimmt werden. 165 7 Das Riemann-Integral 7.4.3 Integrale der Hauptteile von Partialbrüchen Mit Satz 7.4.2 bzw. 7.4.3 ist die Integration von gebrochen-rationalen Funktionen auf die Integration folgender Ausdrücke zurückgeführt: Ax + B (x2 + 2ax + b)k A , (x − a)k mit a2 < b. Mit (7.3.3) und (7.3.4) finden wir eine Stammfunktion zum ersten Ausdruck auf jedem Intervall, das a nicht enthält. Für k ∈ N≥1 gilt A 1 Ax + B 2x + 2a = + (B − aA) . k 2 (x2 + 2ax + b)k (x2 + 2ax + b)k (x2 + 2ax + b) {z } {z } | | Ik,1 (x) Ik,2 (x) Stammfunktionen zu Ik,1 finden wir mit (7.3.5) bzw. (7.3.6). Verbleibt noch, eine Stammfunktion zu Ik,2 zu finden. Mit c > 0 mit c2 = b − a2 , Jk (x) = (x2 + c2 )−k , φ (x) = x + a und Satz 7.3.5 haben wir auf jedem Intervall in R Z Z Z (Jk ◦ φ )φ 0 = Ik,2 = Jk ◦ φ . Wie man durch Differentiation sieht, gilt (·) 1 arctan ∈ c c Wir wollen nun Wegen R Z J1 . Jk iterativ für k > 1 bestimmen. Sei u(x) = x, v(x) = x2 + c2 2(x2 + c2 ) − 2c2 u(x)v (x) = (1 − k) = 2(1 − k)Jk−1 − 2(1 − k)c2 Jk 2 2 k (x + c ) 0 und u0 (x)v(x) = Jk−1 folgt mit partieller Integration (Satz 7.3.2), 2(1 − k) Z Jk−1 − 2(1 − k)c2 Z Jk = uv − Z Jk−1 und daher Z 3 − 2k Jk = (2 − 2k)c2 Z 1 Jk−1 + 2(1 − k)c2 Damit kann eine Stammfunktion von 166 R Ax+B (x2 +2ax+b)k x 7→ ! x k (x2 + c2 ) . iterativ bestimmt werden. −k+1 . 7.4 Integration gebrochen-rationaler Funktionen Beispiel 7.4.5. 1. R dx . x3 −1 Es gilt x3 − 1 = (x − 1)(x2 + x + 1). Daher Ansatz 1 A Bx +C = + 2 . 2 (x − 1)(x + x + 1) x − 1 x + x + 1 Multiplikation mit x − 1 und setzen von x = 1 liefert A = 31 . Durch Koeffizientenvergleich folgt weiter 1 1 1 2 1= +B x + − B +C x + −C, 3 3 3 d.h., C = − 32 , B = − 31 , B −C = 31 . Damit 1 dx = 3 x −1 3 Z 3 1 dx x+2 − dx 2 x−1 3 x +x+1 ! √ 1 3 2x + 1 1 arctan √ x 7→ ln |x − 1| − ln x2 + x + 1 − 3 6 3 3 Z Z auf jedem Intervall, das nicht 1 enthält. 2. R x3 +1 dx. x(x−1)3 Der Ansatz B C x3 + 1 A D + + = + x(x − 1)3 x x − 1 (x − 1)2 (x − 1)3 liefert sofort A = −1 und D = 2 (durch Multiplikation mit x bzw. (x − 1)3 und x := 0 bzw. x := 1). Weiter ergibt x3 + 1 = −(x − 1)3 + Bx(x − 1)2 +Cx(x − 1) + 2x = −x3 + 3x2 − 3x + 1 + Bx3 − 2Bx2 + Bx +Cx2 −Cx + 2x = (−1 + B)x3 + (3 − 2B +C)x2 + (−3 + B −C + 2)x + 1, d.h., −1 + B = 1, 3 − 2B +C = 0, −3 + B −C + 2 = 0, also B = 2, C = 1. Damit Z x3 + 1 dx dx dx dx dx = − +2 + +2 3 2 x(x − 1) x x−1 (x − 1) (x − 1)3 1 1 = x 7→ − ln |x| + 2 ln |x − 1| − − x − 1 (x − 1)2 Z Z Z Z auf jedem Intervall, das nicht 0 oder 1 enthält. 3. R dx x2 −a2 mit a 6= 0. 167 7 Das Riemann-Integral Es gilt 1 x 2 − a2 1 mit A = − 2a und B = Z 1 2a . = A B + x−a x+a Damit dx 1 1 dx dx = − + 2 2 x −a 2a x − a 2a x + a 1 1 3 x 7→ − ln |x − a| + ln |x + a| 2a 2a 1 |x + a| ln = x 7→ 2a |x − a| Z Z auf jedem Intervall, das nicht a oder −a enthält. ♦ 7.5 Uneigentliche Integrale In Abschnitt 7.1 haben wir das bestimmte Integral Z b f a (Riemann-Integral) einer beschränkten Funktion f auf einem kompakten Intervall [a, b] eingeführt. Dabei waren Beschränktheit von f und Kompaktheit von [a, b] wesentlich. Unser Ziel besteht nun darin, den Integralbegriff durch Grenzwertbetrachtungen auf unbeschränkte Intervalle bzw. unbeschränkte Funktionen zu erweitern. Ohne den Begriff genauer spezifiziern zu wollen, bezeichnen wir hier mit Singularität eine Stelle, bei der die Riemann-Integierbarkeit verletzt ist. 7.5.1 Einzige Singularität am Rand des Intervalls Definition 7.5.1. Sei I = [a, b] mit a, b ∈ R oder I = [a, ∞[ mit a ∈ R und b = ∞. Sei f ∈ R([a, β ]) für alle β ∈ [a, b[ aber f 6∈ R([a, b]) für b 6= ∞. Falls der endliche Grenzwert Z b Z β f := lim a existiert, nennen wir Rb a β %b a f f uneigentliches Integral von f über I mit Singularität in b. ♦ Man sagt dann auch, daß ab f konvergiert. Existiert der Grenzert nicht oder ist er unendlich, R dann sagt man, daß das Integral ab f divergiert (oder nicht existiert). R 168 7.5 Uneigentliche Integrale Bemerkung 7.5.2. 1. Falls f ∈ R([a, β ]) für alle β ∈ [a, b[ und F eine Stammfunktion von f auf [a, b[ ist, dann Z b f = lim F(β ) − F(a) . β %b a 2. Analog definiert man das uneigentliche Integral für alle α ∈ ]a, b] aber f 6∈ R([a, b]) für a 6= −∞. Rb a f mit Singularität in a für f ∈ R([α, b]) ♦ Beispiel 7.5.3. 1. Z ∞ Z β cos := lim β →∞ 0 0 2. Z ∞ dx 1 3. Z ∞ dx x2 1 4. 5. Z 1 dx 0 Z β dx β →∞ 1 = lim β →∞ β →∞ 1 x=β 1 = lim − = 1. = lim 1 − x2 β →∞ x x=1 β →∞ β Z 1 dx x α&0 α √ = lim x α&0 x β = lim ln 1 = lim ln β = ∞ . Z β dx β →∞ 1 x β →∞ β →∞ := lim := lim Z 1 dx 0 x β cos = lim sin 0 = lim sin β , existiert nicht! x=1 = lim (ln |x|) x=α = − lim ln α = ∞ . α&0 α&0 √ √ x=1 √ = lim 2 x x=α = 2 − lim 2 α = 2 . x α&0 α&0 Z 1 dx α ♦ 7.5.2 Endlich viele Singularitäten Definition 7.5.4. Sei I = ]a, b[ mit a ∈ R ∪ {−∞}, b ∈ R ∪ {∞}, f ∈ R([α, β ]) aber f 6∈ R([a, α]), f 6∈ R([β , b]) für α, β mit a < α < β < b. Sei c ∈ ]a, b[. Dann definieren wir das R uneigentliche Integral ab f mit Singularität in a und b durch Z c Z b f = lim a Z β f + lim α&a α β %b c f, falls beide rechts stehenden Grenzwerte existieren und endlich sind. ♦ Definition 7.5.5. Sei I = [a, b] mit a, b ∈ R, c ∈ ]a, b[ und f ∈ R([a, γ]), f ∈ R([δ , b]) für γ, δ mit a < γ < c < δ < b aber f 6∈ R([a, b]). Dann definieren wir das uneigentliche Integral Rb a f mit Singularität in c durch Z b f = lim a Z b Z γ γ%c a f + lim δ &c δ f, falls beide rechts stehenden Grenzwerte existieren und endlich sind. ♦ 169 7 Das Riemann-Integral Bemerkung 7.5.6. 1. In beiden Definitionen sind beide Grenzwerte unabhängig voneinander zu betrachten. 2. In der ersten Definition hängt der Wert des Integrals nicht von c ab. 3. Das uneigentliche Integral über ein Intervall mit endlich vielen Singularitäten wird durch Zerlegung des Intervalls auf obige Situationen mit Singularitäten nur am Rand oder genau einer im Innern zurückgeführt. Alle Grenzwerte der Teilintegrale müssen existieren und endlich sein. ♦ Warnung: Aus der Bezeichnung ab f geht nicht hervor, ob es sich um ein eigentliches oder uneigentliches Integral handelt. Ist aber f ∈ R([a, b]) (und damit beschränkt auf [a.b]), so gilt nach Satz 7.2.7 R Z b Z b Z β f = lim β %b a a f = lim f. α&a α Eine Fehlinterpretation eines eigentlichen Integral als uneigentliches Integral führt also nicht zu Fehlern, umgekehrt (vor allem bei Singularitäten in a und b oder in c ∈ ]a, b[) aber schon. Wir betrachten dazu I = Es gilt aber R 1 dx 1 −2 auf R <0 und R>0 ist x 7→ − x . −1 x2 . Stammfunktion von x 7→ x Z −ε dx I = lim + lim x2 1 1 1 −ε + lim − = lim − x −1 δ &0 x δ ε&0 1 1 − 1 + lim −1 + = lim δ ε&0 ε δ &0 =∞ 1 1 6= − = −2 . x −1 ε&0 −1 x2 Z 1 dx δ &0 δ Falls Z b Z γ f + lim lim δ &c δ γ%c a f nicht existiert, bestehen aber immer noch Chancen, daß der „symmetrische“ Grenzwert existiert, in diesem Fall heißt Z c−ε Z b Z b CH f := lim f+ f a der Cauchysche Hauptwert von R∞ sche Hauptwert von −∞ f durch ε&0 Rb a CH Z γ→∞ Z 0 γ f+ f := lim −∞ 170 c+ε f bei Singularität in c ∈ ]a, b[. Analog wird der Cauchy- Z ∞ definiert. a 0 f −γ 7.5 Uneigentliche Integrale ∞ Bemerkung 7.5.7. Wenn −∞ f existiert, dann existiert auch CH R∞ x Die Umkehrung gilt nicht, betrachte zum Beispiel −∞ x2 +3 dx. R R∞ −∞ f und beide sind gleich. 171 7 Das Riemann-Integral 172 8 Weg- und Kurvenintegrale 8.1 Wege und Kurven 8.1.1 Definition Der Kurvenbegriff hat eine lange Geschichte, ist kompliziert und wird in der Literatur auch mit uneinheitlichen Sprachgebrauch verwendet. Wichtig: Unterscheide das geometrische Gebilde „Kurve“ und die Vorschrift („Weg“), wie das Gebilde entsteht. Typische Fragestellungen: • Länge einer Kurve, Masse einer belegten Kurve • Arbeit bei Bewegung längs einer Kurve in einem Kraftfeld Wir wollen Pathologien vermeiden und beschränken uns auf (für uns) sinnvolle Begriffe. Definition 8.1.1. Ein Weg im Rn ist eine stetige Abbildung φ eines Intervalles I = [a, b] in den Rn . Die Bildmenge C := im(φ ) = φ [I] = {φ (t) : t ∈ I} heißt die von φ erzeugte Kurve im Rn , φ heißt auch eine Parameterdarstellung von C. Ist φ eineindeutig, so heißt φ Jordan-Weg und im(φ ) heißt Jordan-Kurve. φ (a) und φ (b) heißen Anfangs- bzw. Endpunkt des Weges. Die Kurve heißt geschlossen, wenn φ (a) = φ (b). φ heißt glatt, wenn φ ∈ C1 (I, Rn ) mit φ 0 (t) 6= 0 für alle t ∈ I. φ heißt stückweise glatt, wenn φ glatt bis auf endlich viele Punkte ist. Eine Kurve C heißt glatt, wenn es eine glatte Parameterdarstellung der Kurve gibt. ♦ Beispiel 8.1.2. 1. Eine Strecke AB, A 6= B, A, B ∈ Rn ist eine glatte Jordan-Kurve mit der Darstellung φ (t) = A + t(B − A) für t ∈ [0, 1] . 173 8 Weg- und Kurvenintegrale 2. Polygonzüge sind stückweise glatte Jordan-Kurven. 3. Der Einheitskreis in R2 ist eine geschlossen, glatte Jordan-Kurve mit der Darstellung cost φ (t) = für t ∈ [0, 2π] . sint ♦ Achtung: Eine Kurve C kann viele verschiedene Parameterdarstellungen haben. Übungsaufgabe 8.1.3. Betrachte C = {|x| : x ∈ [−1, 1]}. Finde veschiedene Parameterdarstellungen. ♦ C Definition 8.1.4. Zwei Darstellungen φ und ψ derselben Kurve C heißen äquivalent, φ ∼ ψ, wenn es eine stetige, monoton wachsende Abbildung h : D(ψ) → D(φ ) gibt, so daß ψ = φ ◦ h, d.h., ψ(t) = φ (h(t)) für alle t ∈ D(ψ). φ ψ D(φ ) D(ψ) h Übungsaufgabe 8.1.5. Zeige, daß ∼ eine Äquivalenzrelation ist. Anschauliche Bedeutung der Definition ist, daß die Kurve C bezüglich φ und ψ in derselben „zeitlichen“ Reihenfolge aber mit unterschiedlichen „Geschwindigkeiten“ durchlaufen werden. Ein Weg besitzt eine Orientierung, die Parameterdarstellung beschreibt, in welcher (zeitlichen) Reihenfolge C durchlaufen wird. Durch Umorientierung entsteht aus φ der Weg φ − mit φ − (t) = φ (a + b − t) für t ∈ D(φ ) = [a, b] . Dadurch entsteht die gleiche Kurve C, Anfangs- und Endpunkt des Weges werden aber getauscht. Satz 8.1.6. Seien φ und ψ zwei Jordan-Wege, welche die gleiche Jordan-Kurve C erzeugen. Dann gilt: Es existiert genau eine stetige Bijektion h : D(ψ) → D(φ ) mit ψ = φ ◦ h. Wenn φ und ψ glatt sind, dann gilt h ∈ C1 (D(ψ)) und h0 (t) 6= 0 für alle t ∈ D(ψ). Je nachdem ob h monoton wachsend oder fallend ist, gilt φ ∼ ψ oder φ − ∼ ψ. Definition 8.1.7. Eine Teilmenge M ⊆ Rn heißt: - wegweise zusammenhängend, wenn zu je zwei Punkten A, B ∈ M einen Weg φ : [a, b] → M in M mit φ (a) = A und φ (b) = B gibt. - Gebiet, wenn M offen und wegweise zusammenhängend ist. 174 ♦ 8.1 Wege und Kurven 8.1.2 Weglänge φ (t1 ) Sei φ : I = [a, b] → Rn ein Weg. Ziel ist, dem Weg eine Länge zuzuordnen. Idee: Approximation durch Polygonzug. φ (t5 ) φ (t0 ) Sei dazu Z = {[tk−1 ,tk ], k = 1, . . . , m} eine Zerlegung von [a, b] mit b > a, d.h., t0 = a < t1 < · · · < tm = b. Dann ist m L(Z, φ ) := ∑ |φ (ti ) − φ (ti−1 )| i=1 die Länge des durch Z und φ erzeugten Polygonzuges. Definition 8.1.8. Unter der Länge des Weges φ : [a, b] → Rn , b > a, (Weglänge) versteht man L(φ ) := sup L(Z, φ ) . Z Zerlegung von [a,b] Für b = a setzen wir L(φ ) = 0 . Der Weg heißt rektifizierbar, falls L(φ ) < ∞. ♦ Wegen m L(Z, φ ) := ∑ i=1 und q s n ∑ (φ j (ti) − φ j (ti−1))2 j=1 a21 + · · · + a2n ≤ |a1 | + · · · + |an | für reelle aa , . . . , an , erhält man m ∑ |φ i=1 j0 m (ti ) − φ (ti−1 )| ≤ L(Z, φ ) ≤ ∑ j0 n ∑ |φ j (ti) − φ j (ti−1)| i=1 j=1 für alle j0 ∈ {1, . . . , n}. Sei f : [a, b] → R und sei Z = {[tk−1 ,tk ], k = 1, . . . , m} eine Zerlegung von [a, b]. Dann nennen wir m V ( f , Z) := ∑ | f (ti−1 ) − f (ti )| i=1 Variation von f bezüglich Z. Die Zahl V ( f ) := supZ V ( f , Z) heißt totale Variation von f und f heißt von beschränkter Variation, wenn V ( f ) < ∞. Damit folgt unmittelbar: 175 8 Weg- und Kurvenintegrale Satz 8.1.9. Der Weg φ : [a, b] → Rn ist genau dann rektifizierbar, wenn alle Komponentenfunktionen von beschränkter Variation sind. Besonders nützlich ist die sogenannte Weg- oder Bogenlängenfunktion s. Sei dazu φ : I = [a, b] → Rn rektifizierbar. Wir definieren s : I → R durch für t ∈ [a, b] , s(t) := L(φ ) [a,t] d.h., s(t) ist die Länge des auf [a,t] eingeschränkten Wegstückes. Satz 8.1.10. i) Wenn φ : I → Rn rektifizierbar ist, dann ist die zugehörige Weglängenfunktion s auf I stetig und (streng bei Jordan-Wegen) monoton wachsend. ii) Wenn φ ∈ C1 (I, Rn ) (und damit rektifizierbar), so gilt s ∈ C1 (I, R) und es gilt ṡ(t) = Ds(t) = |Dφ (t)| . (8.1.1) Aus ii) folgt Z t s(t) = 0 |φ (τ)| dτ = Z tq a (Dφ 1 (τ))2 + · · · + (Dφ n (τ))2 dτ für t ∈ I . a Insbesondere gilt Z b L(φ ) = |Dφ (τ)| dτ . a Zusatz: Die Integraldarstellung von s gilt auch für stückweise glatte φ . Beweis. Wir zeigen ii). Sei dazu t ∈ ]a, b[ und h ≥ 0 so klein, daß t + h ≤ b. Dann gilt |φ (t + h) − φ (t)| ≤ s(t + h) − s(t) , da auf der linken Seite der geradlinige Abstand steht. Sei Z eine beliebige Zerlegung von [a, b]. Dann gilt mit komponentenweiser Anwendung des Hauptsatzes der Differential- und Integralrechnung |φ (tk ) − φ (tk−1 )| = | und somit Z tk Dφ (τ) dτ| ≤ Z tk tk−1 |Dφ (τ)| dτ tk−1 m Z b k=1 a ∑ |φ (tk ) − φ (tk−1)| ≤ |Dφ (τ)| dτ , d.h., L(φ ) ≤ Z b |Dφ (τ)| dτ . (8.1.2) a Wendet man nun (8.1.2) auf φ [t,t+h] an, so folgt φ (t + h) − φ (t) s(t + h) − s(t) 1 | |≤ ≤ h h h Z t+h |Dφ (τ)| dτ . t Für h & 0 folgt D+ s(t) = |Dφ (t)| für t ∈ I . Mit den entsprechenden Betrachtungen für h < 0 folgt D− s(t) = D+ s(t) = |Dφ (t)| und damit (8.1.1). 176 8.2 Weg- und Kurvenintegrale 8.1.3 Kurvenlänge Nun wollen wir einer Jordan-Kurve C eine Länge L(C) zuordnen. Der Wunsch besteht nun darin, L(C) = L(φ ) zu setzen, wenn φ eine Parameterdarstellung von C ist. Dazu muß man die Unabhängigkeit von der Parameterdarstellung zeigen. Ohne große Mühe zeigt man (aus der Definition über Zerlegungen): i) Sind φ und ψ zwei äquivalente Jordan-Wege, dann gilt L(φ ) = L(ψ). ii) Für jeden Weg φ gilt L(φ ) = L(φ − ). Damit ist folgende Definition sinnvoll: Definition 8.1.11. Sei C eine Jordan-Kurve. Unter der Länge von C versteht man die Länge L(φ ) eines Jordan-Weges φ , der C erzeugt. Bemerkung 8.1.12. 1. Die Definition läßt sich genauso auf Kurven/Wege ausdehnen, die Jordan-ähnlich sind, d.h., die nur endlich viele Doppelpunkte haben. 2. Die Bogenlänge s (aus der Weglängenfunktion) wird oft als natürlicher Parameter der Parameterdarstellung genommen. Das geht so: Sei C = φ [I] mit φ : I = [a, b] → Rn eine Jordan-Kurve und sei s(t) = L(φ [a,t] ) die Weglängenfunktion. Da φ ein Jordan-Weg ist, ist s : [a, b] → [0, L(φ )] stetig und streng monoton wachsend. Somit existiert die streng monoton wachsende Umkehrfunktion t : [0, L(φ )] → [a, b] zu s. Setze nun ψ = φ ◦t. Dann gilt φ ∼ ψ. Wenn man mit σ : [0, L(ψ)] = [0, L(φ )] → R die Weglängenfunktion von ψ bezeichnet, gilt nun σ (s) = s für s ∈ [0, L(ψ)]. Ist C glatt, so ist ψ stetig differenzierbar und es gilt |Dψ(s)| = Dσ (s) = 1 . ♦ 8.2 Weg- und Kurvenintegrale 8.2.1 Kurvenintegral Sei φ : I = [a, b] → Rn ein Jordan-Weg für eine rektifizierbare Kurve C, sei s die Bogenlängenfunktion. Auf C sei eine Funktion f : C → R definiert. Definition 8.2.1. Das Integral Z b Z f (φ (t)) ds(t) := f ds := C Z b a Z b f (φ (t))ṡ(t) dt = a f (φ (t))|φ̇ (t)| dt a ♦ heißt Kurvenintegral von f über C. 177 8 Weg- und Kurvenintegrale Bemerkung 8.2.2. i) Wenn f stetig ist und φ stetig differenzierbar, dann existiert obiges Integral auf jeden Fall. R ii) Damit C f ds eine sinnvolle Bezeichnung ist, muß gezeigt werden, daß das Integral unabhängig von der Parameterdarstellung ist (vgl. Satz 8.1.6, der angewendet wird). Insbesondere ist es auch unabhängig von der Orientierung. ♦ SatzR8.2.3. Sei C eine rektifizierbare Jordan-Kurve. Seien f , g : C → R und es mögen und C g ds existieren. Dann gelten: R C f ds i) Abschätzung: Z f ds ≤ L(C) sup | f | . C C ii) Linearität: Z Z [µ f + λ g] ds = µ C Z f ds + λ C für µ, λ ∈ R . g ds C iii) Wenn C = C1 ∪ C2 mit Jordan-Kurven C1 und C2 , für die C1 ∩ C2 nur aus endlich vielen Punkten besteht, dann Z Z Z f ds = f ds + f ds . C C1 C2 Anwendung: Z.B. Masse, Schwerpunkt, Trägheitsmoment Sei die Jordan-Kurve C kontinuierlich mit Masse der Dichte ρ, ρ : C → R, belegt. Dann gilt: Z M= ρ ds = Gesamtmasse von C . C Der Schwerpunkt S = (S1 , . . . , Sn ) hat die Koordinaten 1 S = M i 1 x ρ(x , . . . , x ) ds(x , . . . , x ) = M C Z i 1 n 1 n Z b φ i (t)ρ(φ (t))|φ̇ (t)| dt i ∈ {1, . . . , n} . a 8.2.2 Wegintegralephysik5-8.lyx Sei φ : I = [a, b] → Rn ein Weg. (Nicht notwendig ein Jordan-Weg). Sei f : C = φ [I] → R eine reelle Funktion über C oder sei F : C = φ [I] → Rn ein Vektorfeld über C. Definition 8.2.4. Unter dem Wegintegral von f bezüglich der k-ten Variablen längs φ versteht man das Riemann-Stieltjes-Integral Z k Z b f (x) dx := φ 178 k Z b f (φ (t)) dφ (t) := a a f (φ (t))φ̇ k (t) dt . 8.2 Weg- und Kurvenintegrale Unter dem Wegintegral von F längs φ versteht man Z hF(x), dxi := Z φ F(x) · dx := Z φ Z := φ n = ∑ (F 1 (x) dx1 + · · · + F n (x) dxn ) φ 1 1 F (x) dx + · · · + Z F n (x) dxn φ Z b F k (φ (t))φ̇ k (t) dt = Z b k=1 a hF(φ (t), φ̇ (t)i dt . ♦ a Anwendung: Arbeit im Kraftfeld. Sei dazu G ⊆ R3 ein Gebiet. F : G → R3 sei ein (hinreichend vernünftiges) Kraftfeld. Ein Massepunkt P bewege sich längs des Weges φ : I = [a, b] → G. Die dabei geleistete Arbeit ist Z A = hF(x), dxi . φ Die Herleitung ergibt sich über die Zwischensummen und der Tatsache, daß die Arbeit das Produkt aus Kraft und Weglänge ist, wenn der Weg gerade ist, und die Kraft tangential wirkt und konstant ist. Wir formulieren nun Eigenschaften für F; für f ist es dann klar (z.B. F = (F 1 , . . . , F n ) mit F k = f , F i = 0 für i 6= k. Satz 8.2.5. Es mögen R φ hF(x), dxi und R φ hG(x), dxi existieren. Dann gelten: i) Abschätzung: Z hF(x), dxi ≤ L(φ ) sup |F(x)| . φ x∈C ii) Linearität: Z hµF(x) + λ G(x), dxi = µ φ Z Z hF(x), dxi + λ φ hG(x), dxi für µ, λ ∈ R . φ iii) Wenn φ = φ1 ⊕ φ2 (= Aneinanderhängung von Wegen), dann Z hF(x), dxi = φ Z hF(x), dxi + Z φ1 hF(x), dxi . φ2 iv) Aus φ ∼ ψ folgt Z hF(x), dxi = ψ Z hF(x), dxi , φ aus φ − ∼ ψ folgt Z ψ hF(x), dxi = − Z hF(x), dxi Z und φ φ− hF(x), dxi = − Z hF(x), dxi . φ Wegintegrale sind also orientierungsabhängig! Statt eines Beweises dieser Aussagen soll eine wichtige Anwendung bzw. Verallgemeinerung von iv) gegeben werden: Wenn gewisse Wegstücke hin- und zurück durchlaufen werden, dann heben sich die entsprechenden Integrale hinweg. 179 8 Weg- und Kurvenintegrale 8.2.3 Zusammenhang von Kurven- und Wegintegralen Nun betrachten wir den Zusammenhang von Kurven- und Wegintegralen. Sei φ ein glatter Jordan-Weg, C = im(φ ), F : C → Rn , φ̇ (t) = φ̇ 1 (t) > φ̇ n (t) ... der Tangentialvektor an C im Punkt φ (t), t ∈ D(φ ). Sei weiter t(t) := 1 φ̇ (t) |φ̇ (t)| der normierte Tangentialvektor und Ft (x) := F(x), t(φ −1 (x)) = hF(φ (t)), t(t))i die Tangentialkomponente von F im Punkt x = φ (t). Dann gilt Z hF(x), dxi = Z b a φ Z b = b Z F(φ (t)), φ̇ (t) dt = F(φ (t), a hF(φ (t)), t(t)i ds(t) = Z C a 1 φ̇ (t) |φ̇ (t)| dt |φ̇ (t)| Ft ds . Bemerkung 8.2.6. i) In der letzten Formel ist die Orientierungsabhängigkeit in t versteckt. R R ii) Man schreibt oft C hF(x), dxi statt φ hF(x), dxi und setzt dabei stillschweigend voraus, daß mit C auch die Orientierung gegeben ist und daß C eine Jordan-Kurve ist. ♦ 8.2.4 Gradientenfelder, Wegunabhängigkeit Zwei Beispiele zur Motivation: R Beispiel 8.2.7. Berechne die Integrale Ik = φk y dx + (x − y) dy, k = 1, 2, 3, über folgende Wege φ1 , φ2 : [0, 2] → R2 , φ3 : [0, 1] → R2 mit φ1 (t) = 180 (t, 0) , t ∈ [0, 1] , (1,t − 1) , t ∈ ]1, 2] , φ2 (t) = (0,t) , t ∈ [0, 1] (t − 1, 1) , t ∈ ]1, 2] φ3 (t) = (t,t 2 ) . 8.2 Weg- und Kurvenintegrale Z 1 I1 = = 0 ẋ Z 2 1 ẏ 2 1 ((t − 1) · |{z} 0 +(2 − t) · |{z} 1 ) dt = − (t − 2)2 1 2 ẏ ẋ 1 , 2 Z 1 I2 = = (0 · |{z} 1 +(t − 0) · |{z} 0 ) dt + 0 (t · |{z} 0 +(0 − t) · |{z} 1 ) dt + Z 2 ẏ ẋ 1 1 1 (1 · |{z} 1 +(t − 2) · |{z} 0 ) dt = 1 − t 2 0 2 ẋ ẏ 1 , 2 Z 1 I3 = 0 2 2 (t · |{z} 1 +(t − t ) · |{z} 2t ) dt = ẋ ẏ Beispiel 8.2.8. Berechne Ik = in 1. Es gilt Z 1 I1 = 0 R φk y dx + (y − x) dy, (0 · |{z} 1 +(0 − t) · |{z} 0 ) dt + ẋ 1 3 2 3 2 4 1 1 t + t − t = . 0 3 3 4 2 ẏ Z 2 1 ♦ k = 1, 2, 3, über die gleichen Wege wie 2 1 1 ) dt = (t − 2)2 1 ((t − 1) · |{z} 0 +(t − 2) · |{z} 2 ẋ ẏ 1 =− , 2 Z 1 Z 2 1 1 3 (1 · |{z} 1 +(2 − t) · |{z} 0 ) dt = 1 + t 2 0 = , 2 2 0 1 ẏ ẋ ẋ ẏ Z 1 1 3 2 3 2 4 1 1 2 2 I3 = t − t + t (t · |{z} 1 +(t − t) · |{z} 2t ) dt = = . 0 3 3 4 6 0 I2 = 1 ) dt + (t · |{z} 0 +t · |{z} ẋ ♦ ẏ Woran liegt das? Definition 8.2.9. Sei v : G → Rn ein stetiges Vektorfeld auf einem Gebiet G ⊆ Rn . i) v heißt Gradientenfeld oder Potentialfeld, wenn es ein skalares Feld u : G → R gibt mit v(x) = gradu(x) für x ∈ G. u heißt Stammfunktion von v und w = −u heißt Potential des Vektorfeldes v. (Vorzeichen aus physikalischen Gründen). R ii) Das Integral φ hv(x), dxi heißt in G wegunabhängig, wenn für 2 beliebige Punkte A, B ∈ G und jeden stückweise glatten Weg φ mit Anfangspunkt A und Endpunkt B dieses Integral den gleichen Weg hat. In diesem Fall schreibt man auch Z B A hv(x), dxi := Z hv(x), dxi . ♦ φ R Äquivalent zur Definition der Wegunabhängigkeit ist die Forderung, daß φ hv(x), dxi = 0 für jeden stückweise glatten, geschlossenen Weg φ in G gilt. Man nennt dann v konservativ. 181 8 Weg- und Kurvenintegrale Problem: Unter welchen Bedingungen ist v ein Gradientenfeld bzw. konservativ? Folgender Satz folgt aus dem Mittelwertsatz: Satz 8.2.10. Wenn v ein Gradientenfeld ist, dann ist die Stammfunktion bis auf eine Konstante eindeutig bestimmt, d.h., wenn u1 und u2 Stammfunktionen zu v in G sind, dann ist u1 − u2 konstant auf G. Satz 8.2.11. Ein stetiges Vektorfeld v ist genau dann konservativ, wenn es ein Gradientenfeld ist. Genauer: i) Wenn u ∈ C1 (G, R), A, B ∈ G beliebig und φ ein stückweise glatter Weg in G von A nach B ist, dann gilt Z hgradu(x), dxi = u(B) − u(A) . φ ii) Wenn v konservativ ist und A ∈ G, dann gilt u ∈ C1 (G, R) und v(x) = gradu(x) für x ∈ G für die durch Z x hv(y), dyi u(x) := für x ∈ G A definierte Funktion u : G → R. Hinweis: Vergleiche den Satz mit dem Hauptsatz der Differential- und Integralrechnung. Beweis. i) Sei φ : [a, b] → G ⊆ Rn wie im Satz angegeben. Nach Kettenregel gilt n du(φ (t)) = ∑ Dk u(φ (t))Dφ k (t) = hgradu(φ (t)), Dφ (t)i . dt k=1 Mit Substitution folgt Z hgradu(x), dxi = φ Z b du(φ (t)) Z φ (b) Dφ (t) dt = du dt φ (a) = u(φ (b)) − u(φ (a)) = u(B) − u(A) . a ii) ist etwas aufwendiger. Die in diesem Satz gegebene Äquivalenz von konservativ und Gradientenfeld ist praktisch unhandlich. Wir geben daher ein weiteres Kriterium an: Satz 8.2.12. Wenn v ∈ C1 (G, Rn ) und wenn v ein Gradientfeld ist, dann erfüllt v die Integrabilitätsbedingungen Dk vi = Di vk auf G. 182 für alle i, k ∈ {1, . . . , k} (8.2.1) 8.2 Weg- und Kurvenintegrale Beweis. Sei v = gradu, d.h., vi = Di u. Dann gilt Dk vi = Dk Di u = Di Dk u = Di vk nach dem Satz von Schwarz 6.3.15. Bemerkung 8.2.13. 1. Im Fall n = 3 besagen die Integrabilitätsbedingungen gerade rotv = 0 in G . ♦ 2. Die Integrabilitätsbedingungen sind aber nicht hinreichend! Beispiel 8.2.14. Betrachte v mit v(x, y) = ( x2−y , x ) im Ringgebiet G = B(0, 2)\B(0, 1). +y2 x2 +y2 Dann sind die Integrabilitätsbedingungen erfüllt aber φ v1 (x, y) dx+v2 (x, y) dy 6= 0 für jeden das Loch umrundenden, glatten, geschlossenen Weg. Beweis: ÜA. R Woran liegt das? Die Antwort ist etwas verblüffend: An der Topologie von G! Definition 8.2.15. Eine Teilmenge M ⊆ Rn heißt: • einfach zusammenhängend, wenn M wegweise zusammenhängend und jede geschlossene, ganz in M verlaufende Kurve C sich stetig auf einen Punkt zusammenziehen läßt, d.h., für jedes solche C existieren P ∈ M und eine Abbildung r ∈ C([0, 1] × M, M), so daß für Ct := {r(t, x) : x ∈ C} die Beziehungen C0 = C, C1 = {P} und Ct ⊆ M für t ∈ [0, 1] gelten. einfach zusammenhängend nicht einfach zusammenh. • sternförmig, wenn ein Punkt P ∈ M existiert, so daß AP ⊆ M für alle A ∈ M. sternförmig nicht sternförmig ♦ • konvex, wenn AB ⊆ M für alle A, B ∈ M. Es gilt: konvex =⇒ sternförmig =⇒ einfach zusammenhängend . Beachte: „Einfach zusammenhängend“ ist eine topologische Eigenschaft, „sternförmig“ eine geometrische. Satz 8.2.16. Sei G ⊆ Rn ein einfach zusammenhängendes Gebiet, v ein stetig differenzierbares Vektorfeld auf G, daß die Integrabilitätsbedingungen (8.2.1) auf G erfüllt. Dann ist v ein Gradientenfeld und mithin ist das entsprechende Wegintegral wegunabhängig. 183 8 Weg- und Kurvenintegrale Beweis. Ist ziemlich aufwendig. Wir beweisen den Satz für den Spezialfall, daß G sternförmig ist. O.B.d.A. sei also G sternförmig bezüglich 0 ∈ G (sonst geeignete Translation). Für x ∈ G sei φx : [0, 1] → G mit φx (t) = tx eine geradlinige Verbindung von 0 zu x. Wir definieren nun u : G → R durch Z hv(y), dyi = u(x) := Z 1 hv(tx), xi dt für x ∈ G . 0 φx Wir zeigen v = gradu. Dazu sei x ∈ G beliebig. Es gilt hv(tx), xi = x1 v1 (tx) + · · · + xn vn (tx) und mit Dk als der partiellen Ableitung nach der k-ten Koordinate von x und unter Verwendung von (8.2.1) n n D1 hv(tx), xi = v1 (tx) + ∑ xk · t · D1 vk (tx) = v1 (tx) + ∑ xk · t · Dk v1 (tx) k=1 1 k=1 1 = v (tx) + gradv (tx),tx . Andererseits gilt n d tv1 (tx) = v1 (tx) + t · ∑ Dk v1 (tx)xk = v1 (tx) + gradv1 (tx),tx . dt k=1 Somit gilt Z 1 D1 u(x) = D1 = 0 Z 1 d dt = v (x) . 0 1 hv(tx), xi dt = Z 1 0 D1 hv(tx), xi dt 1 tv1 (tx) dt = tv1 (tx) 0 Analog folgt Di u(x) = vi (x) für alle i ∈ {1, . . . , n} und alle x ∈ G, d.h., v = gradu auf G. 184 9 Integralrechnung für Funktionen mehrerer Variabler 9.1 Das Riemann-Integral im Rn 9.1.1 Definition des Riemann-Integrals Für die Theorie ist das Riemann-Integral unzureichend, für praktische Belange reicht es meist. R Wir beginnen mit I f mit n-dimensionalem Intervall I. Später lassen wir dann statt I allgemeinere Bereiche B zu. Definition 9.1.1. Seien a, b ∈ Rn mit ai ≤ bi für i = 1, . . . , n. Die Menge I := [a, b] := {x ∈ Rn : ai ≤ xi ≤ bi mit i = 1, . . . , n} = [a1 , b1 ] × · · · × [an , bn ] heißt Intervall. Analog werden Intervalle ]a, b[, [a, b[, ]a, b] definiert. Die Zahl n |I| := ∏(bi − ai ) i=1 heißt Maß, Inhalt oder Volumen des Intervalls I ∈ {[a, b], ]a, b[, [a, b[, ]a, b]}. ♦ Wir betrachten nur einen speziellen Typ von Zerlegungen von I = [a, b]: Es seien Zi Zerlegungen der Intervalle [ai , bi ]. Dann ist Z := Z1 × · · · × Zn eine zulässige Zerlegung von [a, b]. Die Elemente von Z sind also Intervalle J der Form J = J1 × · · · × Jn mit Ji ∈ Zi . Numeriert man die Elemente von I durch, d.h., Z = {I j : j = 1, . . . , N} , 185 9 Integralrechnung für Funktionen mehrerer Variabler so erhält man I= N [ N |I| = Ij , ∑ |I j | , j=1 j=1 wobei I j und Ik für j 6= k keine gemeinsamen inneren Punkte haben. Die Zahl λ (Z) := max j∈{1,...,N} diam(I j ) mit diam(I j ) als dem Durchmesser von I j heißt Feinheit von Z. Sei nun β = (ξ1 , . . . , ξN ) mit ξk ∈ Ik für k = 1, . . . , N eine Belegung von Z und f : I → R. Dann heißt n σ ( f , Z, β ) = ∑ f (ξk )|Ik | k=1 Zwischensumme oder Riemannsche Summe von f zur Zerlegung Z mit der Belegung β . Definition 9.1.2. I sei ein kompaktes Intervall im Rn . Die Funktion f : I → R heißt auf I Riemann-integrierbar, wenn der Grenzwert lim σ ( f , Zk , βk ) k→∞ für jede Zerlegungsfolge (Zk )k∈N mit λ (Zk ) → 0 für k → ∞ und jede entsprechende Folge (βk )k∈N von Belegungen βk von Zk existiert und unabhängig von den gewählten Folgen ist. Diesen Grenzwert nennt man das Riemann-Integral von f über I. Mit R(I) wird die Menge der auf I Riemann-integrierbaren Funktionen bezeichnet. ♦ Bezeichnung: Z Z f= I Z f dµ = I Z f (x) dx = I f (x1 , . . . , xn ) d(x1 , · · · , xn ) . I Bemerkung 9.1.3. Riemann-integrierbare Funktionen sind beschränkt. Probleme: (P1) Beschreibung von R(I). f dµ zu R B f dµ. Welche B sind zulässig? (P3) Eigenschaften der Abbildung f 7→ R f dµ. (P2) Verallgemeinerung von R I B (P4) Verfahren zur Integralberechnung. Analog zum eindimensionalen Fall definieren wir: 186 9.1 Das Riemann-Integral im Rn Definition 9.1.4. i) Die Menge M ⊆ Rn hat das n-dimensionale Lebesgue-Maß 0 (ist Nullmenge), wenn es zu jedem ε > 0 abzählbar viele Intervalle I j ⊂ Rn , j ∈ J ⊆ N, gibt mit M⊆ [ Ij und j∈J ∑ |I j | < ε . j∈J ii) Sei E ⊆ Rn . Man sagt, eine Eigenschaft gilt „fast überall in E“, wenn es eine Menge F ⊆ Rn gibt, so daß die Eigenschaft auf E ∩ F gilt und E \ F eine Nullmenge ist. ♦ Beispiel 9.1.5. i) Abzählbare Mengen sind Nullmengen. ii) Wenn I ⊂ Rn−1 ein (n − 1)-dimensionales Intervall ist und wenn f : I → R stetig ist, dann ist graph( f ) = {(x, f (x)) : x ∈ I} eine Nullmenge in Rn . ♦ Satz 9.1.6 (Kriterium von Lebesgue). Sei I ⊂ Rn ein kompaktes Intervall. Die Funktion f : I → R ist genau dann Riemann-integrierbar, wenn f beschränkt ist und fast überall auf I stetig ist. Damit ist (P1) erledigt. 9.1.2 Verallgemeinerung auf zulässige Bereiche Wir klären nun Problem (P2). Offenbar darf B nicht zu „schlimm“ sein, damit definierbar ist. R B f dµ Definition 9.1.7. Eine Menge B ⊆ Rn heißt zulässig, wenn B beschränkt ist und wenn ∂ B eine Nullmenge in Rn ist. Beispiel 9.1.8. 1. Alle gängigen geometrischen Figuren im R2 sind zulässig. 2. Quader, Tetraeder, Kugel, Ellipsoid usw. im R3 sind zulässig. 3. Intervalle sind zulässige Bereiche. 4. Eine wichtige Klasse zulässiger Mengen erhält man so: Sei I ⊂ Rn−1 ein Intervall, f1 , f2 stetige, reellwertige Funktionen auf I mit f1 ≤ f2 . Dann ist die Menge B ⊂ Rn mit B = {(x, z) : x ∈ I und f1 (x) ≤ z ≤ f2 (x)} zulässig. 5. Beispiel einer nichtzulässigen Menge ist B = (Q ∩ [0, 1]) × (Q ∩ [0, 1]) . Hier gilt ∂ B = [0, 1] × [0, 1] und ∂ B ist daher keine Nullmenge. ♦ 187 9 Integralrechnung für Funktionen mehrerer Variabler Lemma 9.1.9. i) Vereinigung und Durchschnitt endlich vieler zulässiger Mengen ist zulässig. ii) Die Differenz zulässiger Mengen ist zulässig. Beweis. ÜA. Man zeige dazu zuerst Rechenregeln für den Rand: ∂ (B1 ∩ B2 ) ⊆ ∂ B1 ∪ ∂ B2 , ∂ (B1 ∪ B2 ) ⊆ ∂ B1 ∪ ∂ B2 , ∂ (B1 \ B2 ) ⊆ ∂ B1 ∪ ∂ B2 . Sei B ⊆ Rn eine beliebige Menge und sei f : D( f ) ⊆ Rn → R mit B ⊆ D( f ). Ohne Beschränkung der Allgemeinheit können wir annehmen, daß D( f ) = Rn (Eine Funktion f : D( f ) ⊆ Rn → R kann man zu einer Funktion fˆ auf Rn fortsetzen, indem man fˆ(x) = 0 für x 6∈ D( f ) setzt). Sei χB die charakteristische Funktion von B. Definition 9.1.10. Sei B ⊆ Rn eine beschränkte Menge und sei f : Rn → R. Unter dem Riemann-Integral von f über B versteht man Z Z B Z f db = f := B Z f dµ := B I f χB für ein beliebiges Intervall I ⊇ B, falls das rechte Integral existiert. f heißt dann Riemannintegrierbar über B. ♦ Offenbar bedarf diese Definition einer Rechtfertigung. ManR muß nämlich zeigen, daß gilt: R Wenn I1 , I2 ⊇ B, dann existiert I1 f χB dµ genau dann, wenn I2 f χB dµ und beide Werte sind gleich. Damit kann man das Lebesgue-Kriterium wie folgt formulieren: n n Satz 9.1.11. Sei B ⊂ R zulässig, f : R → R. Dann ist f auf B Riemann-integrierbar genau dann, wenn f B fast überall stetig auf B ist. Beweis. f χB hat im Vergleich zu f B höchstens noch auf ∂ B Unstetigkeitsstellen. Da ∂ B eine Nullmenge ist, ist f χB fast überall stetig in jedem Intervall I ⊇ B und daher auf I integrierbar. Sei nun f auf B Riemann-integrierbar. Dann ist f χB auf einem Intervall I ⊇ B fast über all stetig. Die Unstetigkeitsstellen von f B stimmen im Innern von B mit denen von f χB überein. Nur auf der Nullmenge ∂ B könnte es unterschiedliches Verhalten geben. 9.1.3 Allgemeine Eigenschaften des Integrals Die Eigenschaften sind eine fast wörtliche Übertragung der entsprechenden Eigenschaften des eindimensionalen Falls. Sei B ⊆ Rn zulässig und sei R(B) die Menge der über B Riemann-integrierbaren Funktionen. 188 9.1 Das Riemann-Integral im Rn • R(B) ist ein Vektorraum (sogar Algebra) und Z B Z (λ1 f1 + λ2 f2 ) dµ = λ1 R für fi ∈ R(B), λi ∈ R. Damit ist f 7→ B f1 dµ + λ2 B f2 dµ f dµ ein lineares Funktional auf R(B). Weiter gilt B f ∈ R(B) , Z Z f ≥0 f dµ ≥ 0 , =⇒ (9.1.1) B d.h., f 7→ R B f dµ ein lineares positives Funktional auf R(B). Aus (9.1.1) folgen weitere Aussagen (jede dann wieder aus der vorhergehenden) • Abschätzungen: Sind f , g ∈ R(B) und f ≤ g, dann Z f dµ ≤ Z B g dµ . B Seien f , g ∈ R(B) mit g ≥ 0 und m ≤ f ≤ M mit m, M ∈ R. Sei Z Z χB dµ = µ(B) := B Z 1 dµ = dµ . B (9.1.2) B Dann gilt m · µ(B) ≤ Z f dµ ≤ M · µ(B) B und m· Z g dµ ≤ B Z f g dµ ≤ M · Z g dµ . B B Wenn speziell m = infB f und M = supB f , dann folgt aus (9.1.2) und dem Mittelwertsatz die Existenz eines γ ∈ [m, M] mit Z f dµ = γ µ(B) . B Wenn f stetig ist und wenn B zusammenhängend ist, existiert ein ξ ∈ B mit Z f dµ = f (ξ )µ(B) . B • Fast-Überall-Gleichheit: Wenn f ∈ R(B) und f (x) = 0 fast überall auf B dann R B f dµ = 0. Beweis. (Idee) Beachte Definition des Integrals über Zwischensummen. Wähle als Zwischenpunkte ξi Punkte aus den Zerlegungsintervallen mit f (ξi ) = 0. Dann ist die RiemannSumme 0. Zu klären wäre dabei, ob solche Zwischenpunkte tatsächlich existieren. 189 9 Integralrechnung für Funktionen mehrerer Variabler Seien f , g ∈ R(B) mit f (x) = g(x) fast überall auf B. Dann gilt R B f dµ = R B g dµ. • Additivität des Integrals bezüglich des Integrationsbereiches: Seien B1 , B2 zulässig, f auf B1 ∪ B2 definiert. R R Das Integral B1 ∪B2Rf dµ existiert genau dann, wenn existiert dann auch B1 ∩B2 f dµ. Wenn µ(B1 ∩ B2 ) = 0 und wenn R Z I R B2 f dµ existieren. Es Z f dµ = B1 ∪B2 R f dµ und f dµ existiert, dann gilt B1 ∪B2 Z Sei I ein Intervall. Falls B1 f dµ + B1 f dµ . B2 f dµ = 0 und f ≥ 0, dann gilt f (x) = 0 fast überall auf I. Beweis. Es genügt zu zeigen, daß f (a) = 0 für alle a ∈ I, in denen f stetig ist. Angenommen, es existiert ein Stetigkeitspunkt a von f mit f (a) > 0. Dann existiert eine Umgebung U = B(a, ε) mit ε > 0 von a mit f (x) ≥ f (a)/2 für x ∈ I ∩U. Damit gilt Z Z Z f dµ = I f dµ ≥ µ(I ∩U) f (a)/2 > 0 f dµ + I\U I∩U und wir erhalten einen Widerspruch. Offensichtlich kann man das Intervall I auch durch zulässige Bereiche B ersetzen, bei denen µ(B ∩U) > 0 für jeden Punkt a ∈ B und jede (zulässige) Umgebung U von a gilt. In Zusammenhang mit dem allgemeineren Lebesgue-Integral kann man auch zeigen, daß die Aussage tatsächlich für beliebige zulässige Bereiche B anstelle von I gilt. 9.1.4 Der Satz von Fubini R Ziel ist die Zurückführung des Integrals I f dµ auf iterierte Integrale über niedrigdimensionale Intervalle. Damit hat man dann die Berechnungsmethode Z Z Z f= I f, X Y wenn X, Y Intervalle mit I = X ×Y . Plausibilitätsbetrachtung im R2 : Sei I = [a, b] × [c, d] = X × Y . Betrachte Zerlegung Z = ZX × ZY , ZX = {Ji : i ∈ {1, . . . , N}}, ZY = {K` : ` ∈ {1, , . . . , M}} von I, wie sie bei Definition der Riemannsummen verwendet wurden. Sei β eine Belegung mit ZwischenR punkten (xi , y` ) ∈ Ji × K` . Für f ∈ R(I) hat man als Zwischensumme zu I f dµ: ! ∑ f (xi, y`)|Ji × K`| = ∑ f (xi, y`)|Ji| · |K`| = ∑ ∑ f (xi, y`)|Ji| i,` ` i,` ! =∑ ∑ f (xi, y`)|K`| i | 190 ·|Ji | . ` {z =:F̃(xi ) } i · |K` | 9.1 Das Riemann-Integral im Rn R Man sieht, F̃(xi ) ist eine Zwischensumme zum Integral Y f (xi , y) dy =: F(xi ), während die R äußere Summe ∑i F̃(xi )|Ji | dann eine Näherung zur Zwischensumme zum Integral X F(x) dx ist. Mit der vertauschten Summation in der zweiten Zeile ergibt sich eine analoge Interpretation. Damit ist folgender Satz plausibel: Satz 9.1.12 (Satz von Fubini). Sei I = X ×Y ein Intervall in Rn , wobei X und Y Intervalle in Rk bzw. R` sind mit k + ` = n. Wenn f : I → R integrierbar ist, dann existieren die iterierten Integrale und es gilt Z Z ∗ Z f (x, y) d(x, y) = X×Y X Z ∗ Z f (x, y) dy dx = Y f (x, y) dx dy . Y X Bemerkung 9.1.13. 1. Man schreibt auch Z ∗ Z X Z Z ∗ f (x, y) dy dx = Y f (x, y) dydx = X Z ∗ Z Y f (x, y) dy , dx X Y wobeiR die letztere Schreibweise etwas strukturierter als die mittlere ist, aber voraussetzt,R daß man X und dx nicht als Klammern zur Begrenzung des Integranden auffaßt. Hier ist X dx R eher als Funktional anzusehen, das auf die Funktion x 7→ Y f (x, y) dy angewandt wird. R 2. Anstelle des inneren Integrals F(x) = Y f (x, y) dy haben wir im allgemeinen nur ein R Oberintegral: Um X F(x) dx betrachten zu können, müßte man sicher gehen, daß F(x) überhaupt existiert, d.h., man müßte wissen, daß f (·, y) über X für jedes y und f (x, ·) über Y für jedes x integrierbar ist. Dies ist jedoch nicht immer der Fall. In jedem Fall gibt es bei stetigem f keine Probleme. 3. Es ist ein Trugschluß, anzunehmen, daß aus der Existenz der iterierten Integrale die Existenz des Integrales folgt. ♦ Beispiel 9.1.14. Sei I = [0, π]×[− π2 , π2 ]×[0, 1] und sei f : I → R mit f (x, y, z) = z sin(x+y). Dann Z 1 Z f (x, y, z) d(x, y, z) = I Z dz 0 Z 1 = − π2 Z dz Z dz 0 Z 1 = 0 Z π z sin(x + y) dx dy 0 π 2 π dy [−z cos(x + y)] 0 π −2 0 Z 1 = π 2 π 2 − π2 z [− cos(π + y) + cos y] dy | {z } 2 cos y π 2 2z sin y− π dz 2 Z 1 = 4z dz = 2 . ♦ 0 191 9 Integralrechnung für Funktionen mehrerer Variabler Beispiel 9.1.15. Das ist eine etwas anspruchvollere Variante des Satzes von Fubini. Sei D ⊂ Rn−1 zulässig, B = {(x, y) = (x1 , . . . , xn−1 , y) ∈ Rn : x ∈ D , φ1 (x) ≤ y ≤ φ2 (x)} mit stetigen Funktionen φi auf D. Sei f ∈ R(B). Dann gilt Z Z φ2 (x) Z f (x, y) d(x, y) = f (x, y) dy . dx B φ1 (x) D Wir betrachten dazu den Schnitt Bx von B über x, [φ1 (x), φ2 (x)] für x ∈ D , Bx = 0/ für x 6∈ D . Man prüft leicht nach χB (x, y) = χD (x) × χBx (y) . Wenn Ix , Iy Intervalle mit D ⊆ Ix , Bx ⊆ Iy für alle x, dann I := Ix × Iy ⊇ B und Z Z Z Z f (x, y) d(x, y) = f (x, y)χB (x, y) d(x, y) = dx f (x, y)χB (x, y) dy Ix ⊇D Iy ⊇Bx Z Z Z Z φ2 (x) = f (x, y)χBx (y) dy χD (x) dx = f (x, y) dy χD (x) dx B I⊇B Ix Iy φ1 (x) Ix Z φ2 (x) Z = ♦ f (x, y) dy . dx D φ1 (x) Beispiel 9.1.16. Sei B = B(0, R) im R2 . Dann B = {(x, y) ∈ R2 : x ∈ [−R, R] , φ1 (x) ≤ y ≤ φ2 (x)} mit p φ1 (x) = − R2 − x2 , φ2 (x) = p R2 − x 2 . Wir betrachten Z 2 y p R2 − x2 d(x, y) = Z φ2 (x) Z R dx −R Z R B =2 = −R Z R 2 y2 p R2 − x2 dy φ1 (x) dx p R2 − x 2 Z φ2 (x) y2 dy 0 2 R −x 2 2 4 dx = 3 Z R R2 − x 2 2 dx 3 −R 0 Z 4 R 4 4 42 5 4 5 = [R − 2R2 x2 + x4 ]dx = R5 − R + R 3 0 3 33 15 32 5 = R . 45 192 ♦ 9.1 Das Riemann-Integral im Rn Beispiel 9.1.17. Man ändere im Integral Z 1 Z 1−x dx √ − 1−x2 0 f (x, y) dy die Integrationsreihenfolge. Hier ist p − 1 − x2 ≤ y ≤ 1 − x} B = {(x, y) ∈ R2 : x ∈ [0, 1] , = {(x, y) ∈ R2 : y ∈ [−1, 1] , mit 0 ≤ x ≤ φ (y)} p 1 − y2 für y ∈ [−1, 0[ , 1−y für y ∈ [0, 1] . φ (y) = Damit gilt Z 1 Z 1−x dx 0 √ − 1−x2 Z φ (y) Z 1 f (x, y) dy = f (x, y) dx dy −1 0 Z √1−y2 Z 0 = f (x, y) dx + dy −1 Z 1 0 Z 1−y f (x, y) dx , dy 0 0 falls f ∈ R(B). ♦ 9.1.5 Bemerkungen zur Inhalts- und Volumenbestimmung Definition 9.1.18. Eine beschränkte Menge B ⊂ Rn heißt quadrierbar oder Jordan-meßbar, wenn die charakteristische Funktion χB auf B Riemann-integrierbar ist, d.h., wenn Z Z B χB dµ = Z 1 dµ = dµ B B existiert. Die Größe µ(B) = |B| = Z dµ B heißt Jordan-Maß oder Jordan-Inhalt oder einfach Inhalt oder Volumen von B. ♦ Offenbar gilt B Jordan-meßbar ⇐⇒ B zulässig. Beispiel 9.1.19. Sei D ⊂ Rn−1 und B = {(x, y) = (x1 , . . . , xn−1 , y) ∈ Rn : x ∈ D , φ1 (x) ≤ y ≤ φ2 (x)} mit stetigen φ1 und φ2 Jordan-meßbar. Nach Beispiel 9.1.15 gilt Z µ(B) = dµ = B Z φ2 (x) Z 1dy = dx D Z φ1 (x) D (φ2 (x) − φ1 (x))dx . Vergleiche dazu insbesondere den bekannten Fall n = 2, d.h., D = [a, b]. ♦ 193 9 Integralrechnung für Funktionen mehrerer Variabler Beispiel 9.1.20. Sei B ⊂ R3 ein Rotationskörper, B = {(x, y, z) : x ∈ [a, b] , 0 ≤ p y2 + z2 ≤ r(x)} . Dann gilt Z b Z µ(B) = dµ = dx B Z b Z a √ 0≤ y2 +x2 ≤r(x) d(y, z) = π r2 (x) dx . a ♦ 9.2 Koordinatentransformation 9.2.1 Heuristik und Satz Hier geht es um die Substitutionsmethode für Mehrfachintegrale. Der Beweis des allgemeinen Resultates ist einer der aufwendigsten Beweise der Differential- und Integralrechnung. Wir geben hier einen heuristischen Zugang und zeigen auf, wo die Probleme liegen. Sei Bx ⊂ Rn , By ⊆ Rn und Φ : By → Bx eine Surjektion. Sei weiter f ∈ R(Bx ). Wie muß F : By → R aussehen, damit Z Z f (x) dx = F(y) dy ? Bx By Sei g = f ◦ Φ. Um zu verstehen, wo das Problem liegt, sei By = I ⊂ Rn ein Intervall und Φ sei ein Diffeomorphismus, das heißt Φ sei bijektiv und Φ und Φ −1 seien stetig differenzierbar. Sei S weiter I = Nj=1 I j mit Intervallen I j .Dann gilt Φ(I) = Φ(By ) = N [ Φ(I j ) = Bx j=1 und somit Z Bx f (x) dx = ∑ Z j f (x) dx , Φ(I j ) wenn die Φ(I j ) zulässig sind und µ(Φ(Ii ) ∩ Φ(I j )) = 0 für i 6= j. Sei f stetig. Dann gilt nach dem Mittelwertsatz Z Φ(I j ) f (x) dx = f (ξ j )µ(Φ(I j )) mit ξ j ∈ Φ(I j ). Sei I j 3 η j = Φ −1 (ξ j ). Dann Z Φ(I j ) 194 f (x) dx = f (Φ(η j ))µ(Φ(I j )) . 9.2 Koordinatentransformation Das dabei entstehende Problem ist nun: Wann ist das Bild Φ(M) einer Jordan-meßbaren Menge M wieder Jordan-meßbar und wie verhält sich der Inhalt Jordan-meßbarer Mengen unter Φ? Sei zuerst Φ eine lineare Abbildung, d.h., Φ(y)i = n ∑ ai j y j j=1 mit einer invertierbaren Matrix A = (ai j )ni, j=1 . Wenn I ein Intervall ist, dann ist Φ(I) ein Parallelepiped und es gilt (z.B. aus Algebra) µ(Φ(I)) = |detA| · µ(I) = |detΦ 0 (y)| · µ(I) . Satz 9.2.1 (Koordinatentransformation in Mehrfachintegralen). Die Menge By ⊂ Rn sei offen und Jordan-meßbar, die Abbildung Φ : By → Bx ⊂ Rn sei stetig differenzierbar, bijektiv sowie Lipschitz-stetig, d.h., es existiere ein Konstante L mit ∀y1 , y2 ∈ By : |Φ(y1 ) − Φ(y2 )| ≤ L|y1 − y2 | . Dann gelten die folgenden Aussagen: 1. Bx = Φ(By ) ist Jordan-meßbar. 2. f ∈ R(Bx ) genau dann, wenn F ∈ R(By ) mit F = ( f ◦ Φ) · |detΦ 0 |. Ist f ∈ R(Bx ), dann Z Z f (x) dx = Bx f (Φ(y)) · |detΦ 0 (y)| dy . By Bemerkung 9.2.2. 1. Unter den Voraussetzungen des Satzes besitzt jede Jordan-meßbare Menge B ⊂ By ein Jordan-meßbares Bild Φ(B) = A und Z µ(A) = µ(Φ(B)) = |detΦ 0 (y)| dy . B 2. Die Bedingungen an Φ dürfen auf einer Menge mit Jordan-Maß 0 verletzt sein. 3. Wenn Φ stetig differenzierbar ist, dann ist Φ auf jeder kompakten Teilmenge von By Lipschitz-stetig. ♦ Beispiel 9.2.3. Wir betrachten den Graphen einer Funktion f : I → R gegeben durch graph f = {(ξ (t), ρ(t)) : t ∈ [a, b]} , I = ξ [a, b] , ξ˙ (t) > 0 für t ∈ [a, b] in der (x, y)-Ebene. Wir lassen den Graphen im R3 um die x-Achse rotieren und betrachten den entstehenden Rotationskörper p R = {(x, y, z) : x = ξ (t) , 0 ≤ y2 + z2 ≤ ρ(t) , t ∈ [a, b]} . 195 9 Integralrechnung für Funktionen mehrerer Variabler Dieser Körper ist das Bild von Z = {(r, φ ,t) : t ∈ [a, b], 0 ≤ r ≤ ρ(t), 0 ≤ φ ≤ 2π} unter der Abbildung Φ : B0 → R3 , B0 = [0, ∞] × [0, 2π] × [a, b], mit Φ(r, φ ,t) = (ξ (t), r cos φ , r sin φ ) . Es gilt ξ˙ (t) 0 0 0 detΦ (r, φ ,t) = 0 cos φ −r sin φ 0 sin φ r cos φ = r · ξ˙ (t) . Damit sind die Bedingungen an Φ auf Z bis auf eine Menge vom Jordan-Maß 0 erfüllt. Somit erhalten wir Z Z µ(R) = r · ξ˙ (t) d(r, φ ,t) = dµ = R =π r · ξ˙ (t) drdtdφ φ =0 t=a r=0 Z Z b Z 2π Z b Z ρ(t) ρ 2 (t)ξ˙ (t) dt . ♦ a 9.2.2 Spezielle Koordinatentransformationen Ebene Polarkoordinaten. Sei Φ : B0 → R2 mit B0 = {(r, φ ) : r ≥ 0, 0 ≤ φ ≤ 2π} und Φ(r, φ ) = (r cos φ , r sin φ ) . Dann ist Φ eine stetige Bijektion von der offenen Menge B = {(r, φ ) : r > 0, 0 < φ < 2π} auf die offene Menge C = R2 \ {(ξ , 0) : ξ ∈ [0, ∞[} . Es gilt D Φ 1 (r, φ ) D2 Φ 1 (r, φ ) detΦ (r, φ ) = 1 2 D1 Φ (r, φ ) D2 Φ 2 (r, φ ) 0 cos φ −r sin φ = sin φ r cos φ = r > 0. Damit ist Φ nach Satz 6.4.34 ein Diffeomorphismus und Φ ist auf jeder kompakten Teilmenge von B Lipschitz-stetig. 196 9.2 Koordinatentransformation Der Schnitt der Ausnahmemenge B0 \ B mit einer Jordan-meßbaren Teilmenge von B0 ist vom Jordan-Maß 0. Wir können daher Satz 9.2.1 auf kompakte, Jordan-meßbare Teilmengen von B0 anwenden. Betrachte nun A = {(r, φ ) : α ≤ φ ≤ β , 0 ≤ r ≤ h(φ )} mit β − α ≤ 2π und stetigem, nichtnegtivem h. Für den Flächeninhalt von Φ(A) in kartesischen Koordinaten gilt dann |Φ(A)| = Z β Z h(φ ) 1 2 r drdφ = α 0 Z β h2 (φ ) dφ . α Dies ist die Leibnitzsche Sektorformel. Beispiel 9.2.4. Sei f (x, y) = xy und sei V = {(x, y) ∈ R2 : x2 + y2 ≤ R2 , x ≥ 0 , y ≥ 0} der Viertelkreis im ersten Quadranten. Mit Φ wie oben gilt Z Z xy d(x, y) = V Z π/2 Z R 3 Φ −1 (V ) 1 = R4 4 0 1 4 = R . 8 r sin φ cos φ d(r, φ ) = Z π/2 1 sin φ cos φ dφ = R4 8 r3 sin φ cos φ drdφ 0 0 Z π/2 1 sin 2φ dφ = R4 16 0 Z π sin φ dφ 0 ♦ Räumliche Polarkoordinaten (Kugelkoordinaten). Sei Φ : B0 → R3 mit B0 = {(r, φ , ϑ ) : r ≥ 0, 0 ≤ φ ≤ 2π, 0 ≤ ϑ ≤ π} und Φ(r, φ , ϑ ) = (r cos φ sin ϑ , r sin φ sin ϑ , r cos ϑ ) . Dann ist Φ eine stetige Bijektion von der offenen Menge B = {(r, φ , ϑ ) : r > 0, 0 < φ < 2π, 0 < ϑ < π} auf die offene Menge C = R3 \ {(r sin ϑ , 0, r cos ϑ ) : r ∈ [0, ∞[, ϑ ∈ [0, π]} . Man berechnet cos φ sin ϑ −r sin φ sin ϑ r cos φ cos ϑ 0 detΦ (r, φ , ϑ ) = sin φ sin ϑ r cos φ sin ϑ r sin φ cos ϑ cos ϑ 0 −r sin ϑ = −r2 sin ϑ . 197 9 Integralrechnung für Funktionen mehrerer Variabler Damit gilt detΦ 0 (r, φ , ϑ ) 6= 0 auf B. Der Schnitt der Ausnahmemenge B0 \ B mit einer Jordan-meßbaren Teilmenge von B0 ist wieder vom Jordan-Maß 0. Wir können daher Satz 9.2.1 auf kompakte, Jordan-meßbare Teilmengen von B0 anwenden. Beispiel 9.2.5. Berechnung des Kugelvolumens. Sei KR die Kugel mit Radius R und Mittelpunkt in (0, 0, 0). Dann Z 2π Z π Z R 1 |r2 sin ϑ | drdϑ dφ = R3 3 0 0 0 Z 2π 4π 3 2 dφ = R . = R3 3 3 0 µ(KR ) = Z 2π Z π sin ϑ dϑ dφ 0 0 ♦ Zylinderkoordinaten. Sei Φ : B0 → R3 mit B0 = {(r, φ , z) : r ≥ 0, 0 ≤ φ ≤ 2π, −∞ < z < ∞} und Φ(r, φ , z) = (r cos φ , r sin φ , z) . Dann ist Φ eine stetige Bijektion von der offenen Menge B = {(r, φ , ϑ ) : r > 0, 0 < φ < 2π + 2π, −∞ < z < ∞} auf die offene Menge C = R3 \ {(r, 0, z) : r ∈ [0, ∞[, z ∈ R} . Man berechnet cos φ −r sin φ 0 detΦ 0 (r, φ , z) = sin φ r cos φ 0 = r . 0 0 1 Damit gilt detΦ 0 (r, φ , z) 6= 0 auf B. Der Schnitt der Ausnahmemenge B0 \ B mit einer Jordan-meßbaren Teilmenge von B0 ist wieder vom Jordan-Maß 0. Wir können daher Satz 9.2.1 auf kompakte, Jordan-meßbare Teilmengen von B0 anwenden. 198 10 Fourier-Reihen Wir haben schon gesehen, daß eine glatte Funktion f unter gewissen Voraussetzungen in eine Potenzreihe (Taylorreihe) entwickelt werden kann. Eine solche Reihenentwicklung ist aber nicht nur mit Polynomen möglich, sondern man kann allgemein versuchen, f über eine Linearkombination anderer Funktionen anzunähern: N f (x) ≈ ∑ anϕn(x), n=0 wobei ϕn , n = 0, . . . , N, ein vorgegebenes Funktionensystem ist und a0 , . . . , aN ∈ R Parameter sind. Bei den Potenzreihen ist das Funktionensystem ϕn (n = 0, . . . , N) das System der Monome ϕn (x) = xn (n = 0, . . . , N). Man kann aber auch andere Polynome wählen: speziell konstruierte wie die Legendre-Polynome oder die Tschebitscheff-Polynome, oder aber – und das ist der Inhalt dieses Kapitels – ein Funktionensystem aus Sinus- und CosinusFunktionen. 10.1 Trigonometrische Polynome Unter einem trigonometrischen Polynom vom Grade N verstehen wir eine Funktion FN : R → R der Form N a0 FN (t) = + ∑ (an cos(nωt) + bn sin(nωt)) 2 n=1 mit Koeffizienten a0 , a1 , . . . , aN , b1 , . . . , bN ∈ R. Die Konstante ω ∈ R heißt Kreisfrequenz von FN und die Größe T = 2π ω die Periode von FN . Dazu beachte man, daß FN (t +T ) = FN (t) für alle t ∈ R gilt, so daß FN tatsächlich T -periodisch ist. Die in FN enthaltenen BausteinKreisfunktionen haben alle eine Periode, die ganzzahliger Teiler von T ist, siehe Abbildung. y 1 sin(ωt) sin(2ωt) sin(3ωt) T x -1 Trigonometrische Polynome lassen sich besonders elegant beschreiben, wenn man eine 199 10 Fourier-Reihen komplexe Schreibweise im Zusammenhang mit der Euler-Formel wählt. Das obige trigonometrische Polynom FN wird zu N ∑ FN (t) = ck eikωt = c−N e−iNωt + . . . + c−1 e−iωt + c0 + . . . + cN eiNωt k=−N mit den Formeln c0 = 12 a0 , cn = 12 (an − ibn ) , c−n = 12 (an + ibn ) , a0 = 2c0 , an = cn + c−n , bn = i(cn − c−n ) für n ∈ N≥1 . Beachte dabei cn = c̄−n und c−n = c̄n . Ein entscheidender Punkt für das Rechnen mit trigonometrischen Polynomen ist deren Orthogonalitätseigenschaft. Satz 10.1.1 (Orthonormalität). Für k, n ∈ Z gilt 1 T Z T ikωt e · einωt dt 1, k = n 0, sonst = 0 Beweis. Für k = n erhalten wir 1 T Z T e ikωt · eikωt dt 0 1 = T Z T ikωt e 0 −ikωt ·e 1 dt = T Z T dt = 1 0 und für k 6= n 1 T Z T ikωt e 0 · einωt dt 1 = T = Z T t=T 1 i(k−n)ωt e dt = i(k − n)ωT t=0 h i ei(k−n)2π − 1 = 0 . i(k−n)ωt e 0 1 i(k − n)ωT Wir fassen Eigenschaften trigonometrischer Polynome in einem Satz zusammen. Satz 10.1.2 (Hauptsatz über trigonometrische Polynome). Es gilt: a) FN hat in [0, T [ höchstens 2N Nullstellen. b) Es gilt FN (t) = 0 für alle t ∈ R genau dann, wenn alle Koeffizienten ck = 0 sind. c) Es gelten die Fourier-Formeln für 0 ≤ n ≤ N, −N ≤ k ≤ N 1 T ck = FN (t) · e−ikωt dt , T 0 Z 2 T FN (t) cos(nωt) dt , an = T 0 Z 2 T bn = FN (t) sin(nωt) dt . T 0 Z 200 10.1 Trigonometrische Polynome Beweis. a) und b) folgen aus dem Fundamentalsatz der Algebra, c) aus den Orthogonalitätsrelationen. Beachte: Aus b) ergibt sich die Möglichkeit, bei trigonometrischen Polynomen Koeffizientenvergleich anzuwenden. Bemerkung 10.1.3. Beachte die folgenden Formeln: N a) FN (t) = ∑ N ck k=−N b) ck = Z 1 T T 0 FN eikωt = ∑ −ikωt ck e k=−N (t) · e−ikωt dt = N = ∑ c−k eikωt = FN (t). k=−N Z 1 T T 0 ikωt FN (t) · e 1 dt = T Z T 0 FN (t) · eikωt dt. ♦ 201