Analysis für Physiker

Werbung
Analysis für Physiker
Doz.Dr. Koksch
Sommersemester 2004
1 Mengen und Abbildungen
1.1 Grundbegriffe der mathematischen Logik
1.1.1 Aussagenlogische Ausdrücke
Eine Aussage A ist ein sinnvolles sprachliches Gebilde, das die Eigenschaft hat, entweder
wahr oder falsch zu sein (Prinzip vom ausgeschlossenem Dritten). Man nennt „wahr“ bzw.
„falsch“ den Wahrheitswert W (A) der Aussage A. Die Wahrheitswerte werden üblicherweise mit w (wahr) bzw. f (falsch) bezeichnet.
Beispiel 1.1.1. 1) „5 ist eine Primzahl.“ (Aussage, wahr)
2) „3 ist Teiler von 7.“ (Aussage, falsch)
3) „Daniel ist krank.“ (keine Aussage, Daniel ist nicht festgelegt.)
4) „a2 + b2 = c2 “ (keine Aussage, was sind a, b, c?)
♦
Die letzten beiden Beispiele sind keine Aussagen, aber Aussageformen oder aussagenlogische Ausdrücke, die einen Wahrheitswert erhalten durch Belegung der Aussagevariablen
Daniel, a, b, c,
Sind A1 und A2 Aussagen, so lassen sich durch sprachliche Verbindung neue Aussagen
gewinnen:
Neue Aussage
„nicht A1 “
„A1 und A2 “
„A1 oder A2 “ (im Sinne von „oder
auch“)
„wenn A1 so A2 “, „aus A1 folgt
A2 “, „A1 ist hinreichend für A2 “,
„A1 impliziert A2 “, „A2 ergibt sich
aus A1 “
„A1 genau dann, wenn A2 “, „A1 gilt
dann und nur dann, wenn A2 “, „A1
ist äquivalent zu A2 “
Symbol
¬A1
A1 ∧ A2
A1 ∨ A2
Name
Negation
Konjunktion
Disjunktion
A1 ⇒ A2
Implikation
A1 ⇔ A2
Äquivalenz
¬, ∧, ∨, ⇒, ⇔ heißen Junktoren. Die Wahrheitswerte sind wie folgt definiert:
3
1 Mengen und Abbildungen
A1
w
f
¬
f
w
und
A1
w
w
f
f
A2
w
f
w
f
∧
w
f
f
f
∨
w
w
w
f
⇒
w
f
w
w
⇔
w
f
f
w
Elementarausdrücke sind die Konstanten w und f . Durch Zusammensetzen lassen sich nach
folgenden Regeln weitere aussagenlogische Ausdrücke bilden:
1. Jede Zeichenreihe, die nur aus einer Aussagevariablen oder aus einer Konstanten besteht, ist ein Ausdruck.
2. Sind A1 und A2 Ausdrücke, so sind auch ¬A1 , (A1 ∧ A2 ), (A1 ∨ A2 ), (A1 ⇒ A2 ), (A1 ⇔
A2 ) Ausdrücke.
3. Eine Zeichenreihe ist nur dann Ausdruck, wenn dies auf Grund von 1. oder 2. der
Fall ist.
Damit ist sind zum Beispiel
((A1 ⇒ ¬A2 ) ∧ ¬A3 )
ein Ausdruck,
((A1 ⇒ ¬A2 )∧ ⇒ A3 )
dagegen nicht.
Wie bei arithmetischen Ausdrücken führt man Abkürzungen ein, indem man festlegt: Jeder
Junktor trennt stärker als jeder in der Folge
⇔,⇒,∨,∧,¬.
Außerdem wird für A1 ∧ A2 kurz A1 A2 und für ¬A1 auch Ā1 geschrieben. Damit können
Klammern eingespart werden:
((A1 ⇒ A2 ) ∧ ¬A3 ) ist kurz (A1 ⇒ A2 )Ā3 .
1.1.2 Äquivalenz von aussagenlogischen Ausdrücken
Zwei Ausdrücke A1 , A2 heißen äquivalent bzw. werteverlaufsgleich (in Zeichen A1 = A2 ),
wenn für jede Belegung φ der Variablen sich jeweils die gleichen Wahrheitswerte ergeben:
W (φ (A1 )) = W (φ (A2 )) .
Wichtige Äquivalenzen sind:
w ∧ A1 = A1 ,
4
f ∧ A1 = f ,
w ∨ A1 = w ,
f ∨ A1 = A1 ,
1.1 Grundbegriffe der mathematischen Logik
A1 ∧ A1 = A1 ,
A1 ∧ A1 = f ,
A1 = A1 ,
A1 ∨ A1 = A1 ,
A1 ⇒ A1 = w ,
A1 ∨ A1 = w ,
A1 ⇔ A1 = w .
Kommutativität:
A1 ∧ A2 = A2 ∧ A1 ,
A1 ∨ A2 = A2 ∨ A1 .
Assoziativität:
(A1 ∧ A2 ) ∧ A3 = A1 ∧ (A2 ∧ A3 ) ,
(A1 ∨ A2 ) ∨ A3 = A1 ∨ (A2 ∨ A3 ) .
Distributivität:
(A1 ∧ A2 ) ∨ A3 = (A1 ∨ A3 ) ∧ (A2 ∨ A3 ) ,
(A1 ∨ A2 ) ∧ A3 = (A1 ∧ A3 ) ∨ (A2 ∧ A3 ) .
Konjunktion und Disjunktion verhalten sich also formal so wie Multiplikation und Addition.
Ersetzung der Implikation und Äquivalenz:
A1 ⇒ A2 = A1 ∨ A2 ,
A1 ⇔ A2 = (A1 ∨ A2 ) ∧ (A2 ∨ A1 ) .
de Morgansche Regeln:
A1 ∧ A2 = A1 ∨ A2 ,
A1 ∨ A2 = A1 ∧ A2 .
Satz 1.1.2. Jeder aussagenlogische Ausdruck A(p1 , . . . , pn ) ist äquivalent zu aussagenlogischen Ausdrücken K(p1 , . . . , pn ) bzw. D(p1 , . . . , pn ), die als Junktoren nur die Negation und
Konjunktion bzw. Disjunktion enthalten.
Als Junktoren sind daher ¬ und ∧ bzw. ∨ ausreichend. Zum Vergleich komplizierterer Ausdrücke kann man nun versuchen, die Ausdrücke auf solche Normalformen zurückzuführen.
Beispiel 1.1.3. Der Ausdruck A(p1 , . . . , p4 ) soll für die Belegungen
( f , f , w, w) ,
( f , w, f , w) ,
( f , w, w, f ) ,
(w, f , f , w) ,
(w, f , w, f ) ,
(w, w, f , f )
den Wert w und sonst f besitzen. Dann
A(p1 , . . . , pn ) = p1 p2 p3 p4 ∨ p1 p2 p3 p4 ∨ p1 p2 p3 p4 ∨ p1 p2 p3 p4 ∨ p1 p2 p3 p4 ∨ p1 p2 p3 p4 .
♦
Beispiel 1.1.4. Wir betrachten die Negation von A ⇒ B: A ⇒ B ist genau dann wahr, wenn
A wahr und B falsch ist. Damit
A ⇒ B = A∧B.
♦
5
1 Mengen und Abbildungen
1.1.3 Prädikative Ausdrücke, Quantifikatoren
Die in der Mathematik verwendeten Aussagen sind Aussagen über die Eigenschaften der
betrachteten Objekte: „3 ist eine Primzahl“, „7 ist Teiler von 343“. „ist Teiler von 343“ ist
ein einstufiges Prädikat, „ist Teiler von“ ein zweistufiges Prädikat.
Ist P z.B. ein einstufiges Prädikat und ist x eine Variable, so ist xP ein (nullstufiger) prädikativer Ausdruck.
xP wird auch als x : P geschrieben uns als „x mit P“ gesprochen.
Beispiel 1.1.5. „x > 3“ oder „x ist größer als 3“: Variable x, Prädikat P = „ist größer als 3“
„7|5“ oder „7 ist Teiler von 5“: Variable (Konstante) 7, Prädikat P = „ist Teiler von 5“ ♦
Die genannten Möglichkeiten zur Bildung neuer Aussageformen aus gegebenen reichen
noch nicht aus, um z.B. die Aussage „Die Gleichung x + 3 = 8 besitzt eine Lösung“ zu
bilden. Man betrachtet daher noch Quantifikatoren. Hier die beiden wichtigsten:
V
oder ∀ („für jedes“)
und
W
oder ∃ („es gibt ein“) ,
die auch Generalisator und Partikularisator genannt werden.
Bilden wir nun das einstufige Prädikat P = „ist Lösung von x +3 = 8“, so können wir obiges
Problem als ∃xP schreiben (zu lesen: „es existiert ein x mit der Eigenschaft P), oder in der
mathematische Umgangssprache
∃x (x + 3 = 8) .
Die Aussage
∀x (x2 ≥ 0)
mit der Bedeutung „Für jedes x gilt x2 ≥ 0“ ist falsch (z.B. für x = i), wenn wir uns nicht
auf spezielle x beschränken. Wahr wäre hingegen
∀x (x ∈ R ⇒ x2 ≥ 0) .
Um solche Ausdrücke kürzer schreiben zu können, definieren wir restringierte Quantifikatoren durch
∀x ∈ M P(x) := ∀x (x ∈ M ⇒ P(x))
und
∃x ∈ M P(x) := ∃x (x ∈ M ∧ P(x)) .
6
1.1 Grundbegriffe der mathematischen Logik
Häufig muß man Negationen von Quantifikatoren bilden. Es gelten folgende Äquivalenzen:
∃xP = ∀xP ,
∀xP = ∃xP .
Weiter gelten folgende Vertauschungssätze gelten:
∀x∀yP(x, y) ⇔ ∀y∀xP(x, y) ⇔: ∀x, yP(x, y) ,
∃x∃yP(x, y) ⇔ ∃y∃xP(x, y) ⇔: ∃x, yP(x, y) .
Beachte, daß im Gegensatz dazu im folgenden Fall nur die Implikation gilt:
∃x∀yP(x, y) ⇒ ∀y∃xP(x, y) .
Ferner gilt
∀xP(x) ⇒ P(y) ,
P(y) ⇒ ∃xP(x) .
Manchmal wollen wir auch die Existenz genau eines bzw. höchstens eines Individuums beschreiben. Dazu nutzen wir ∃=1 bzw. ∃≤1 . Analog ist die Bildung weiterer Quantifikatoren.
Bemerke:
∃ = ∃≥1 .
Eine Variable in einem Ausdruck A heißt gebunden, wenn sie nach einem Quantifikator
auftritt. Sie heißt vollfrei in A, wenn sie nirgends in A gebunden ist. Eine Variable außerhalb
des Wirkungsbereiches eines sie bindenden Quantifikators heißt frei. So ist in
(∃x(x > y)) ∨ x > 0
die Variable x gebunden und damit nicht vollfrei, an der dritten Stelle aber frei. Die Variable
y ist vollfrei.
Da Variablen nur stellvertretend stehen, können sie nach folgenden Regeln umbenannt werden:
1. Gebundene Umbenennung: Eine im Ausdruck A gebunden vorkommende Variable
kann unmittelbar hinter dem sie bindenden Quantifikator in eine im Ausdruck noch
nicht vorkommende Variable umbenannt werden und muß dann in allen Stellen im
Wirkungsbereich des Quantifikators in gleicher Weise umbenannt werden.
2. Freie Umbenennung: Eine im Ausdruck A frei vorkommende Variable kann an allen
Stellen, an denen sie frei ist, in eine im Ausdruck noch nicht vorkommende Variable
umbenannt werden.
Bei der Bezeichnung von Variablen gibt es keine Beschränkung:
∃Stephan : Stephan + 3 = 8.
7
1 Mengen und Abbildungen
1.1.4 Mathematische Aussagen
In der Mathematik haben wahre Aussagen meist eine besondere Bezeichnung:
Hauptsatz bzw. Theorem,
Satz,
Hilfssatz bzw. Lemma,
Behauptung,
Folgerung,
wobei die obige Reihenfolge (mit Ausnahme der Folgerung) auch eine Reihenfolge in fallender Bedeutung sind: Hauptsatz, Theorem und Satz sind wichtige mathematische (wahre)
Aussagen, Hilfssätze und Lemmas sind normalerweise mathematische (wahre) Aussagen
von lokaler Bedeutung (z.B. für die Herleitung oder den Beweis eines Satzes). Eine Folgerung ist eine wahre mathematische Aussage, die sich ohne größeren weiteren Aufwand aus
einer vorhergehenden Aussage oder aus ihrem Beweis ergibt.
Oberbegriff für alle wahren mathematischen Aussagen ist „Satz“.
Das Problem besteht nun darin, solche Aussagen zu vermuten und dann unter Anwendung
logischer Regeln nachzuweisen, d.h. zu beweisen, daß sie den Wahrheitswert w haben.
Umgangssprachlich gibt es mehrere Beweismethoden:
• Beweis durch Aufzählung einzelner Beispiele.
• Beweis durch Abstimmung.
• Beweis mit zunehmender Lautstärke.
• Beweis durch Diffamierung.
Diese sind natürlich in der Mathematik nicht zulässig.
Zulässige Beweise sind:
• Der direkte Beweis durch Herleitung der Aussage aus bekannten (bewiesenen, wahren) Aussagen.
• Der indirekte Beweis (Widerspruchsbeweis) durch Annahme der Negation der Aussage und Ableitung eines Widerspruchs.
Die Beweise basieren auf folgenden Regeln:
8
1.2 Grundbegriffe der Mengenlehre
Satz vom ausgeschlossenen Dritten:
Satz vom Widerspruch:
Satz von der doppelten Verneinung:
Kontrapositionssatz:
Satz vom modus ponens:
Satz vom modus tollens:
Satz vom modus barbara:
A ∨ ¬A
¬(A ∧ ¬A)
¬(¬A) ⇔ A
(A ⇒ B) ⇔ (¬B ⇒ ¬A)
((A ⇒ B) ∧ A) ⇒ B
((A ⇒ B) ∧ ¬B) ⇒ ¬A
((A ⇒ B) ∧ (B ⇒ C)) ⇒ (A ⇒ C)
In beiden Fällen müssen aber Grundaussagen vorausgesetzt werden, die als wahr angenommen werden, die aber nicht aus vorherigen Aussagen abgeleitet werden können. Solche
Aussagen heißen Axiome. Die Axiome werden dann zu Axiomensystemen zusammengefaßt (z.B. dem Axiomensystem der euklidischen Geometrie aus 5 Axiomen).
Man ist nun einerseits bestrebt, ein Axiomensystems klein und widerspruchsfrei zu halten,
und andererseits möglichst viele Aussagen daraus abzuleiten, d.h. eine Theorie zu bilden.
1.2 Grundbegriffe der Mengenlehre
1.2.1 Menge, Elemente
Mengen und die Elementbeziehung sind die wichtigste Grundlage der Mathematik.
Unter einer Menge versteht man (naiv!) die Zusammenfassung gewisser, wohlunterscheidbarer Dinge zu einem neuen Ganzen; die dabei zusammengefaßten Dinge heißen die Elemente der betroffenen Menge. Ist a ein Element der Menge M so schreibt man a ∈ M; ist a
nicht Element von M, so schreibt man a 6∈ M.
Zwei Mengen A und B heißen gleich, wenn sie dieselben Elemente enthalten:
A = B ⇔ ∀x(x ∈ A ⇔ x ∈ B) .
Häufig werden Mengen beschrieben als Teil einer Grundgesamtheit indem man eine Eigenschaft (Prädikat) für die Elemente zur Charakterisierung angibt:
Grundgesamtheit sei die Menge der natürlichen Zahlen. Die Menge der geraden natürlichen
Zahlen kann dann durch
{x ∈ N : 2 ist Teiler von x}
oder
{x ∈ N : ∃y ∈ N(x = 2y)}
beschrieben werden.
Eine besondere Menge ist die leere Menge 0,
/ das ist die Menge, die keine Elemente enthält:
0/ := {} = {x : x 6= x} .
9
1 Mengen und Abbildungen
Bemerke, daß es genau eine leere Menge gibt. Wären nämlich 0/ 1 und 0/ 2 zwei verschiedene
leere Mengen, dann hätten sie die gleichen Elemente (nämlich keine) und somit wäre 0/ 1 =
0/ 2 . Damit wäre ein Widerspruch gefunden, d.h., es gibt keine zwei verschiedenen leere
Mengen.
1.2.2 Teilmengen
Sind A und B Mengen und gilt
∀x (x ∈ A ⇒ x ∈ B) ,
d.h., ist jedes Element von A auch Element von B, dann nennt man A Teilmenge von B und
schreibt
A ⊆ B.
Gilt neben A ⊆ B auch A 6= B, dann heißt A auch echte Teilmenge von B und man schreibt
A ⊂ B.
Für Mengen A, B, C gelten:
1. Reflexivität:
A ⊆ A,
2. Antisymmetrie:
A ⊆ B∧B ⊆ A ⇒ A = B,
3. Transitivität:
A ⊆ B∧B ⊆C ⇒ A ⊆C,
A ⊂ B∧B ⊂C ⇒ A ⊂C
sowie
A 6⊂ A ,
A ⊂ B ⇒ A ⊆ B,
A ⊂ B ⇔ A ⊆ B ∧ A 6= B ,
Daraus ergibt sich ein wichtiges Beweisprinzip für die Gleichheit von Mengen:
A = B ⇔ A ⊆ B∧B ⊆ A.
Um A = B zu zeigen, zeigt man, daß A Teilmenge von B und gleichzeitig B Teilmenge von
A ist.
10
1.2 Grundbegriffe der Mengenlehre
1.2.3 Operationen mit Mengen
Seien A und B zwei Mengen.
Die Vereinigung A ∪ B ist die Menge, die aus allen Elementen von A und allen Elementen
von B besteht:
A ∪ B := {x : x ∈ A ∨ x ∈ B} .
Der Durchschnitt A ∩ B ist die Menge, die aus allen Elementen besteht, die sowohl zu A als
auch zu B gehören:
A ∩ B := {x : x ∈ A ∧ x ∈ B} .
Die Differenz A \ B ist die Menge, die aus allen Elementen von A besteht, die nicht Element
von B sind:
A \ B := {x : x ∈ A ∧ x 6∈ B} .
Zwei Mengen heißen disjunkt, wenn ihr Durchschnitt die leere Menge 0/ ist, d.h.,
A ∩ B = 0/ .
Die symmetrische Differenz A 4 B ist die Menge, die aus allen Elementen von A besteht,
die nicht Element von B sind und aus allen Elementen von B besteht, die nicht Element von
A sind:
A4B = A\B∪B\A.
Sei nun Ω eine gegebene Menge und A ⊆ Ω . Die Menge Ω \ A wird als Komplement von
A bezüglich Ω bezeichnet:
CΩ A := Ω \ A .
Wenn Ω durch den Kontext festgelegt ist, werden auch die Kurzbezeichnungen
CA oder Ac
verwendet.
Für Mengen A, B, C gelten u.a. folgende Eigenschaften:
A∩B ⊆ A ⊆ A∪B,
A ∪ 0/ = A ,
A ∩ 0/ = 0/ ,
A∪A = A∩A = A.
Sei ∗ ∈ {∩, ∪, 4}. Dann gelten:
Kommutativität:
A∗B = B∗A.
Assoziativität:
A ∗ (B ∗C) = (A ∗ B) ∗C .
11
1 Mengen und Abbildungen
Distributivität:
A ∪ (B ∩C) = (A ∪ B) ∩ (A ∪C) ,
A ∩ (B ∪C) = (A ∩ B) ∪ (A ∩C) .
Für die Differenz gilt zum Beispiel:
A \ (B ∪C) = (A \ B) ∩ (A \C) ,
A \ (B ∩C) = (A \ B) ∪ (A \C) .
De Morgansche Regeln:
CΩ (A ∩ B) = CΩ A ∪ CΩ B ,
CΩ (A ∪ B) = CΩ A ∩ CΩ B .
Der Beweis dieser Eigenschaften erfolgt durch direktes Überprüfen der Teilmengenbeziehungen durch Umformung der Prädikate unter Verwendung der logischen Umformungsregeln, z.B.:
A ∪ B = {x : (x ∈ A ∨ x ∈ B)} = {x : (x ∈ B ∨ x ∈ A)} = B ∪ A .
Eine andere, anschauliche Variante ist die Verwendung von Euler-Venn-Diagrammen: Dazu repräsentiert man die Mengen durch Gebiete in der Ebene. Als Beispiel betrachten wir
A ∩ (B ∪C) .
B
A
C
Man kann nun direkt ablesen:
A ∩ (B ∪C) = (A ∩ B) ∪ (A ∩C) .
12
1.2 Grundbegriffe der Mengenlehre
1.2.4 Spezielle Mengenbildungsprinzipien
Kartesisches Produkt (Direktes Produkt):
Unter dem geordnetem Paar (a, b) zweier Elemente versteht man die Menge
(a, b) := {{a}, {a, b}} .
Es gilt für beliebige Elemente a, b, c, d:
(a, b) = (c, d) ⇔ a = c ∧ b = d .
Im allgemeinen gilt
(a, b) 6= (b, a) .
Statt nur zwei Elemente zu einem geordnetem Paar zusammenzufassen, kann man allgemein
auch n Elemente a1 , . . . , an zu einem geordnetem n-Tupel (a1 , . . . , an ) zusammenfassen:
Dies wird rekursiv erklärt durch:

falls n = 1 ,
 a1 ,
(a1 , a2 ) ,
falls n = 2 ,
(a1 , . . . , an ) :=

((a1 , . . . , an−1 ), an ) , falls n > 2 .
Es gilt wiederum
(a1 , . . . , an ) = (b1 , . . . , bn ) ⇔ a1 = b1 ∧ · · · ∧ an = bn .
Sind nun A1 , . . . , An Mengen, so definieren wir das kartesische Produkt ×ni=1 Ai durch
×ni=1 Ai = A1 × · · · × An := {(a1 , . . . , an ) : a1 ∈ A1 ∧ · · · ∧ an ∈ An } .
Nach Konstruktion ist ×ni=1 Ai wieder eine Menge und zwar die Menge der entsprechenden
n-Tupel.
Im Spezialfall haben wir
A × B = {(a, b) : a ∈ A ∧ b ∈ B} .
Mengensysteme
Unter einem Mengensystem versteht man eine Menge, deren Elemente wieder Mengen sind.
Ist M ein solches Mengensystem definiert man die Vereinigung bzw. Durchschnitt durch
[
M := {x : ∃A(A ∈ M ∧ x ∈ A)} ,
\
M := {x : ∀A(A ∈ M ⇒ x ∈ A)} .
Sie sind also wieder Mengen. Im Spezialfall haben wir
[
{A, B} = A ∪ B ,
\
{A, B} = A ∩ B ,
die Definition ist also konsistent mit der Definition von Vereinigung und Durchschnitt von
Mengen.
13
1 Mengen und Abbildungen
Potenzmengen
Sei M eine Menge. Unter der Potenzmenge P(M) = 2M verstehen wir die Menge aller
Teilmengen von M:
2M = {x : x ⊆ M} .
Für M = {1, 2, 3} haben wir
2M = {0,
/ {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3}} .
Man bemerke, daß diese Menge genau 8 = 23 Elemente bei der 3-elementigen Menge M
hat. Dies ist ein Hinweis für das etwas eigentümliche Symbol für die Potenzmenge.
1.2.5 Paradoxien
Wie das folgende Paradoxon zeigt, ist der Mengenbegriff eigentlich genauer zu fassen:
Alle Männer in Sevilla rasieren sich selbst oder lassen sich vom Barbier in
Sevilla rasieren. Der Barbier rasiert aber nur die Männer, die sich nicht selbst
rasieren. Wer rasiert den Barbier?
Sei M die Menge der Männer in Sevilla, R die Menge der sich selbst rasierenden Männer, B
die Menge der Männer, die sich durch den Barbier rasieren lassen. Dann gilt
M = R∪B,
R ∩ B = 0/ .
Das Problem besteht nun darin, daß die Unterteilung in R und B durch eine Eigenschaft
bezüglich eines Elementes von M (dem Barbier) getroffen wird und damit selbstbezüglich
ist.
Ein anderes Paradoxon ist:
Sei M die Menge aller Mengen, die sich nicht selbst enthalten. Ist M Element
von M?
Zur Vermeidung der Parodoxien gibt es mehrere Möglichkeiten. Z.B.
• Axiomatische Mengenlehre.
• Einführung allgemeinerer Begriffe (Klassen), Mengen sind dann Klassen, die Element einer anderen Klasse sind.
• Ausgehend von der leeren Menge werden alle für die Mathematik wichtigen Mengen
konstruiert und nur diese zur Betrachtung zugelassen.
14
1.3 Relationen und Abbildungen
1.3 Relationen und Abbildungen
1.3.1 Relationen
Anschaulich versteht man unter einer Relation zwischen zwei Mengen A und B eine Beziehung, die zwischen den Elementen von A und besteht. Mathematisch nennen wir eine
Teilmenge R von A × B eine (2-stellige) Relation zwischen A und B. Relationen treten in
der Mathematik sehr häufig auf. Relationen mit bestimmten Eigenschaften haben besondere
Bezeichnungen.
Da Relationen Mengen sind, können die Mengenoperationen auch auf Relationen angewendet werden.
Sind R und S Relationen, so heißt R Teilrelation von S, wenn R ⊆ S. Weiter heißen R ∪ S
und R ∩ S Summe bzw. (absolutes) Produkt von R und S.
Die inverse Relation R−1 ist definiert durch
R−1 := {(x, y) : (y, x) ∈ R} .
Vorbereich VbR und Nachbereich NbR einer Relation R sind wie folgt definiert:
VbR := {x : ∃y((x, y) ∈ R)} ,
NbR := {y : ∃x((x, y) ∈ R)} .
Anstelle von (x, y) ∈ R schreibt man auch kurz
xRy .
Häufig untersuchte Eigenschaften von binären Relationen R in A (d.h., R ⊆ A × A) sind in
der folgenden Tabelle zusammengefaßt:
Eigenschaft
Reflexivität
Transitivität
Symmetrie
Antisymmetrie
Charakterisierung
∀a ∈ A (aRa)
∀a, b, c ∈ A (aRb ∧ bRc ⇒ aRc)
∀a, b ∈ A (aRb ⇒ bRa)
∀a, b ∈ A (aRb ∧ bRa ⇒ a = b)
1.3.2 Ordnungsrelationen
Definition 1.3.1. Eine binäre Relation R in M heißt Ordungsrelation oder Halbordnung,
wenn R reflexiv, transitiv und antisymmetrisch ist. Anstelle aRb schreibt man dann auch
a ≤R b .
♦
15
1 Mengen und Abbildungen
Beispiel 1.3.2. In den ganzen Zahlen definieren wir eine Ordnungsrelation ≤ durch
a≤b
b−a ∈ N.
:⇔
♦
Dies ist dann die übliche Ordnung.
Beispiel 1.3.3. Sei N eine Menge und sei M = 2N . Die Relation R in M werde durch
BRC
:⇐⇒
B⊆C
♦
definiert. Dann ist R eine Halbordnung auf M.
Bemerkung 1.3.4. Die Relation < definiert durch
x<y
:⇔
x ≤ y ∧ x 6= y
♦
(echt kleiner) ist keine Halbordnung!
Definition 1.3.5. Eine Ordnungsrelation ≤ in M heißt linear (oder total oder konnex),
wenn für je zwei Element x und y von M stets x ≤ y oder y ≤ x gilt.
♦
In Beispiel 1.3.2 ist R eine totale Ordung, in 1.3.3 aber nicht.
Bezeichnung: Ist ≤ eine Halbordnung in M, sind N ⊆ M und a ∈ M, so setzen wir
N≥a := {x ∈ N : x ≥ a} .
Analog werden N≤a , N>a , N<a definiert.
1.3.3 Abbildungen
Seien zwei Mengen X und Y gegeben. Eine Relation f ⊆ X ×Y heißt rechtseindeutig, wenn
∀x ∈ X, y, z ∈ Y (x f y ∧ x f z ⇒ y = z) .
Eine rechtseindeutige Relation f ⊆ X ×Y heißt Abbildung aus X in Y .
Ist (x, y) ∈ f , so nennt man y das Bild von x unter f und schreibt
y = f (x) .
f (x) wird Wert von f an der Stelle x genannt. Beachte
f 6= f (x) .
Man nennt f die Vorschrift, X den Urbildbereich,
dom f = D( f ) := Vb f = {x ∈ X : ∃y ∈ Y (y = f (x))}
16
1.3 Relationen und Abbildungen
den Definitionsbereich (Urbildmenge), Y den Bildbereich oder Wertebereich und
W ( f ) := im f := Nb f = {y ∈ Y : ∃x ∈ X(y = f (x))}
die Bildmenge.
Als Schreibweise sind dafür
(X,Y, f ) oder f : D( f ) ⊆ X → Y
üblich.
Für y ∈ Y heißt die Menge
{x ∈ X : f (x) = y}
das Urbild von y unter f und wird mit
f −1 (y)
bezeichnet.
Für eine Menge M ⊆ X heißt
f [M] := {y ∈ Y : ∃x ∈ M(y = f (x))}
Bild der Menge M unter f . Analog heißt
f −1 [N] := {x ∈ X : ∃y ∈ N(y = f (x))}
das Urbild der Menge N unter f .
Man beachte nun
W ( f ) = f [X] und
D( f ) = f −1 [Y ] .
Die Abbildung f : D( f ) ⊆ X → Y heißt linkstotal bzw. Abbildung von, wenn
D( f ) = X ,
sie heißt rechtstotal, surjektiv oder Abbildung auf , wenn
W(f) = Y .
Beispiel 1.3.6. Wir definieren die Relation f ⊆ R × R durch
f := {(x, x−2 ) : x ∈ R \ {0}} .
(1.3.1)
Dann ist Vb f = R \ {0}, Nb f = R>0 . Seien (x, y) ∈ f und (x, z) ∈ f . Dann gelten y =
x−2 und z = x−2 , also y = z. Somit ist f rechtseindeutig und damit eine Abbildung. Der
Definitionsbereich ist D( f ) = R \ {0}, die Bildmenge W ( f ) = R>0 . Somit ist f eine nicht
surjektive Abbildung aus R in R.
Definieren wir hingegen f ∈ R \ {0} × R>0 durch (1.3.1), so ist f eine Abbildung von R \ 0
auf R>0 .
♦
17
1 Mengen und Abbildungen
Die Menge
graph( f ) := {(x, f (x)) : x ∈ D( f )}
heißt Graph von (X,Y, f ). Ist die Abbildung (X,Y, f ) links- und rechtstotal, so wird sie
vollständig durch seinen Graphen, d.h., die Relation f beschrieben.
Man nennt eine Abbildung f : D( f ) ⊆ X → Y injektiv oder eineindeutig, wenn sie auch
linkseindeutig ist, d.h., wenn
∀x, y ∈ X(x 6= y ⇒ f (x) 6= f (y)) .
(1.3.2)
Äquivalent dazu ist (Kontrapositionssatz!)
∀x, y ∈ X( f (x) = f (y) ⇒ x = y) .
(1.3.3)
Eine injektive und surjektive Abbildung heißt bijektiv.
Beispiel 1.3.7. 1. Die Menge aller Autos in Deutschland wird in die Menge aller zulässigen
Autonummern abgebildet: injektiv aber nicht surjektiv.
2. Die Menge aller Einwohner in DD wird in die Menge aller Wohnadressen abgebildet:
Keine Abbildung, da nicht rechtseindeutig.
♦
Satz 1.3.8. Sei f : D( f ) ⊆ X → Y eine Abbildung.
1. Die inverse Relation f −1 ist genau dann eine Abbildung aus Y in X, wenn f injektiv ist.
2. Sei D( f ) = X. Die inverse Relation f −1 ist genau dann eine Abbildung von Y auf X, wenn
f bijektiv ist.
Beweis. 1. Sei f injektiv, d.h., linkseindeutig. Dann ist f −1 rechtseindeutig und somit eine
Abbildung aus Y in X. Sei nun die inverse Relation f −1 eine Abbildung aus Y in X. Dann
ist f −1 rechtseindeutig, d.h., f ist linkseindeutig, d.h., injektiv.
2. Sei f bijektiv. Nach 1. ist f −1 eine Abbildung aus Y in X. Da D( f ) = X und f surjektiv,
ist f links- und rechtstotal. Somit ist f −1 rechts- und linkstotal, d.h., eine Abbildung von
Y auf X. Sei nun f −1 eine Abbildung von Y auf X. Dann ist f eine Abbildung auf Y , also
surjektiv.
Abbildungen werden auch als Funktion oder Operator bezeichnet. Im engeren Sinne ist
eine Funktion eine Abbildung aus den reellen (oder komplexen) Zahlen in die reellen (oder
komplexen) Zahlen.
Definition 1.3.9. Seien f : D( f ) ⊆ X → Y und g : D(g) ⊆ Y → Z Abbildungen. Dann
versteht man unter der Verknüpfung h = g ◦ f (lies g verknüpft mit f ) die Abbildung
h : D(h) ⊆ X → Z mit
D(h) = f −1 [D(g)] ⊆ D( f ) ,
18
h(x) = g( f (x)) für x ∈ D(h) .
♦
1.3 Relationen und Abbildungen
Bemerkung 1.3.10. Im allgemeinen gilt f ◦ g 6= g ◦ f . Betrachte zum Beispiel f : R → R
mit f (x) = sin x und g : R>0 → R mit g(x) = ln x. Dann gilt
(g ◦ f )(x) = ln(sin x)
für
x ∈ D(g ◦ f ) =
[
]2kπ, (2k + 1)π[
k∈Z
und
( f ◦ g)(x) = sin(ln x)
für
x ∈ D( f ◦ g) = R>0
♦
1.3.4 Exkurs: Die natürlichen Zahlen
Axiom 1.3.11 (Peano-Axiome). Die natürlichen Zahlen bilden eine Menge N, in der ein
Element 0 ausgezeichnet ist und für die es eine Abbildung ν : N → N \ {0} gibt mit folgenden Eigenschaften:
1. (Axiome zu Nachfolger und Vorgänger) ν ist bijektiv.
2. (Induktionsaxiom) Enthält eine Teilmenge N von N das Element 0 und mit n auch
ν(n), so gilt N = N:
(N ⊆ N) ∧ (0 ∈ N) ∧ (∀n ∈ N(ν(n) ∈ N))
⇒
N = N.
Bemerkung 1.3.12. 1. Für n ∈ N heißt ν(n) Nachfolger von n.
2. 0 ist die einzige natürliche Zahl, die nicht Nachfolger einer natürlichen Zahl ist, das heißt,
ν ist surjektiv.
Beweis. Sei
N := {n ∈ N : ∃m ∈ N(ν(m) = n)} ∪ {0} .
Für n ∈ N gilt ν(n) ∈ W (ν) ⊆ N. Wegen 0 ∈ N folgt N = N aus dem Induktionsaxiom. Da
W (ν) ⊆ N \ {0}, folgt W (ν) = N \ {0}.
3. Statt 0, ν(0), ν(ν(0)), ν(ν(ν(0))), . . . schreibt man üblicherweise 0, 1, 2, 3, . . ..
4. Durch n + 1 := ν(n) kann die Addition mit den üblichen Kommutativ- und Assoziativgesetzen eingeführt werden. Anschließend kann auch die Multiplikation mit Kommutativ-,
Assoziativ- und Distributivgesetz eingeführt werden.
5. Bei axiomatischer Einführung der Mengenlehre kann man auch auch Modelle für natürliche Zahlen angeben: Man nennt eine Menge M induktiv, wenn sie 0/ enthält und mit m ∈ M
auch {m}. Man nimmt nun das Unendlichkeitsaxiom (Existenz von induktiven Mengen) an
und setzt
\
N := {M : M ist induktive Menge} .
19
1 Mengen und Abbildungen
Setzt man nun 0 := 0/ und definiert ν(n) := n ∪ {n}, so kann man beweisen, daß die so
konstruierten natürlichen Zahlen den Peano-Axiomen genügen. Man hat also
0 = 0/
und
n + 1 = {0, . . . , n} .
6. Man kann im Rahmen einer axiomatischen Mengenlehre zeigen, daß die natürlichen
Zahlen in einem gewissen Sinn eindeutig bestimmt sind und man daher von den natürlichen
Zahlen sprechen kann.
7. Das Induktionsaxiom ist die Grundlage für das Beweisprinzip der vollständigen Induktion.
♦
Satz 1.3.13 (Induktionsprinzip). Es sei n0 ∈ N, und für jedes n ∈ N≥n0 sei A(n) eine Aussage. Ferner gelte:
1. (Induktionsanfang) A(n0 ) ist eine wahre Aussage.
2. (Induktionsschritt) Für jedes n ∈ N≥n0 gilt: Wenn A(n) eine wahre Aussage ist, dann
ist auch A(n + 1) eine wahre Aussage.
Dann gilt A(n) für alle n ∈ N≥n0 .
Beweis. Wir setzen N := {n ∈ N : A(n + n0 ) ist wahr}. Aus dem Induktionsaxiom folgt
sofort N = N.
Ausgehend von N werden dann die ganzen Zahlen Z, die rationalen Zahlen Q, die reellen
Zahlen R, die komplexen Zahlen C sowie alle für die Analysis wichtigen Mengen von
Funktionen konstruiert.
Teile dieser Konstruktionen sind schon durchgeführt oder werden später noch durchgeführt.
Bemerkung 1.3.14. Die Menge aller Abbildungen von A in B wird auch mit BA bezeichnet.
Sei nun zum Beispiel B = 2 = {0, 1}. Dann ist jede Abbildung aus BA gerade dadurch
charakterisiert, welche Teilmenge von A auf 1 abgebildet wird. Somit kann {0, 1}A = 2A mit
der Potenzmenge von A identifiziert werden und wir erhalten hier eine weitere Begründung
für die Bezeichnung 2A für die Potenzmenge von A.
♦
1.3.5 Spezielle Abbildungen
Folgen
Eine Abbildung f : N → Y oder f : Z → Y heißt Folge aus Y .
Konstante Abbildung
Sei c ∈ Y und f : D( f ) ⊆ X → Y mit f (x) = c für alle x ∈ D( f ). Dann heißt f konstante
Abbildung.
20
1.3 Relationen und Abbildungen
Charakteristische Funktion
Sei 0/ 6= A ⊆ X. Die Abbildung χA : X → R werde definiert durch
1 , falls x ∈ A ,
χA (x) =
0 , falls x 6∈ A .
Sie heißt charakteristische Funktion oder Indikator(funktion) der Menge A in X.
1.3.6 Äquivalenzrelationen
Definition 1.3.15. Eine binäre Relation R in einer Menge M heißt Äquivalenzrelation, falls
R reflexiv, transitiv und symmetrisch ist.
♦
Ist R eine Äquivalenzrelation in M und sind a, b ∈ M, so schreibt man statt aRb auch
a ∼R b; gelesen a ist äquivalent zu b bzgl. R.
Äquivalenzrelation sind Grundlage für den Abstraktionsprozess. Mathematisch beschrieben
wird dies durch die Restklassenbildung: Man nennt
[a]R := {b ∈ M : a ∼R b}
die Äquivalenzklasse oder Restklasse von a bezüglich R. a heißt Repräsentant dieser Restklasse. Die Menge
M/R := {[a]R : a ∈ M}
aller Restklassen von M bezüglich R heißt Faktormenge oder auch Quotient von M bezüglich R.
Für derartige Restklassen gilt:
a ∈ [a]R 6= 0/ ,
[a]R = [b]R ⇔ a ∼R b ,
a 6∼R b ⇒ [a]R ∩ [b]R = 0/ ,
d.h., M/R ist ein Mengensystem aus paarweise disjunkten, nichtleeren Mengen mit Vereinigung M. Ein solches Mengensystem wird auch Zerlegung genannt.
Ist nun eine Zerlegung Z von M gegeben, können wir eine binäre Relation S in M in folgender Weise definieren:
aSb ⇔ ∃X(X ∈ Z ∧ a, b ∈ X) .
S ist dann wieder eine Äquivalenzrelation.
Beispiel 1.3.16. Wir betrachten die Konstruktion der ganzen Zahlen: Wir definieren eine
Äquivalenzrelation G in N × N durch
(n, m)G(p, q) :⇔ n + q = p + m .
21
1 Mengen und Abbildungen
Die Menge Z der ganzen Zahlen wird nun identifiziert mit der Menge (N × N)/G, d.h.,
Z := (N × N)/G .
Schreiben wir nun die Äquivalenzklasse [(n, m)]G zum Representanten (n, m) als
n − m := [(n, m)]G ,
so können wir uns die Äquivalenzklassen als formale Differenz von Paaren natürlicher Zahlen vorstellen, bei denen „gleiche“ Differenzen identifiziert werden: 0 − 1 und 1 − 2 sind
zum Beispiel die gleiche ganze Zahl.
Wir definieren die Addition und Multiplikation durch
(n − m) +Z (p − q) = [(n, m)]G +Z [(p, q)]G := [(n + p, m + q)]G = (n + p) − (m + q)
und
(n − m) ·Z (p − q) = [(n, m)]G ·Z [(p, q)]G
:= [(np + mq, nq + mp)]G = (np + mq) − (nq + mp)
für m, n, p, q ∈ N. Offensichtlich ist [(m, n)]G = m − n das bezüglich der Addition inverse
Element der ganzen Zahl [(n, m)]G = n − m. [(0, 0)]G = 0 − 0 und [(1, 0)]G = 1 − 0 sind die
neutralen Elemente bezüglich Addition bzw. Multiplikation.
Identifiziert man die natürliche Zahl n mit der ganzen Zahl [(n, 0)]G = n − 0, so erhält man
N ⊂ Z und Addition und Multiplikation sind die Fortsetzung der entsprechenden Operationen von den natürlichen Zahlen zu den ganzen Zahlen, die nun wieder mit + und · bezeichnet werden. Weiter kann man nun
−n := 0 − n = [(0, n)]G
setzen, und man erhält
Z = N ∪ {−n : n ∈ N} .
♦
Beispiel 1.3.17. Wir betrachten die Konstruktion der rationalen Zahlen: Wir definieren
in eine Äquivalenzrelation R in Z × {Z \ {0}} durch
(p, q)R(r, s) :⇔ ps = qr
und setzen
Q := (Z × (Z \ {0}))/R .
Schreiben wir die Äquivalenzklasse [(p, q)]R zum Representanten (p, q) als
p
:= [(p, q)]R ,
q
22
1.3 Relationen und Abbildungen
so besagt die Äquivalenzrelation R gerade, daß z.B. 23 und 64 als die gleiche rationale Zahl
betrachtet werden:
p
Q=
: p ∈ Z, q ∈ Z \ {0} .
q
Wir definieren die Addition und Multiplikation durch
r
p
ps + qr
+Q = [(p, q)]R +Q [(r, s)]R := [(ps + qr, qs)]R =
q
s
qs
und
pr
p r
·Q = [(p, q)]R ·Q [(r, s)]R := [(pr, qs)]R =
q s
qs
für p, r ∈ Z, q, s ∈ Z \ {0}. [(0, 1)]R = 10 und [(1, 1)]R = 11 sind die neutralen Elemente
bezüglich Addition bzw. Multiplikation. Offensichtlich ist [(q, p)]R = qp das bezüglich der
Multiplikation inverse Element der rationalen Zahl qp , wenn qp 6= 01 , d.h. p 6= 0.
Identifiziert man
p
1
mit der ganzen Zahl p, so erhält man Z ⊂ Q.
♦
1.3.7 Exkurs: Binomische Formel
Bevor wir uns im nächsten Kapitel intensiv mit reellen Zahlen beschäftigen, wollen wir
hier zum Ende dieses Kapitels noch einige elementare Resultate zu Binomialkoeffizienten
zusammenfassen.
Definition 1.3.18. Seien n, k ∈ N. Die Zahl
1,
n! :=
1·2·····n,
für n = 0 ,
für n ≥ 1
heißt Fakultät n! von n. Die Zahl
n!
n
k
Cn =
:=
,
k
k!(n − k)!
n ≥ k,
heißt Binomialkoeffizient von n über k.
♦
Lemma 1.3.19. Die Binomialkoeffizienten haben folgende Eigenschaften:
n
1.
=
für alle n ∈ N, k ∈ {0, 1, . . . , n}.
n−k
n
n
2.
=
= 1 für alle n ∈ N.
0
n
n
n
3.
=
= n für alle n ∈ N≥1 .
1
n−1
n
k
23
1 Mengen und Abbildungen
4.
5.
6.
7.
8.
n−1
n
n
= (k + 1)
für alle n ∈ N≥1 , k ∈ N≤n−1 .
k
k+1
n
n
n+1
+
=
für alle n ∈ N≥1 , k ∈ {1, . . . , n − 1}.
k
k−1
k
n n
Es gilt ∑
= 2n für alle n ∈ N.
k
k=0
n
n
k
Es gilt ∑ (−1)
= 0 für alle n ∈ N>0 .
k
k=0
n
n+1
n+k
n+k+1
Für alle k, n ∈ N gilt
+
+···+
=
.
n
n
n
n+1
Beweis. Die ersten drei Eigenschaften ergeben sich unmittelbar aus der Definition. Die
vierte Eigenschaft bestätigt man durch Ausrechnen, etwa
n!
(k + 1)n(n − 1)!
n
(k + 1)
= (k + 1)
=
k+1
(k + 1)![n − (k + 1)]! (k + 1)k![(n − 1) − k]!
(n − 1)!
n−1
=n
=n
,
k
k![(n − 1) − k]!
während man die fünfte folgendermaßen erhält:
n!
n!
n
n
+
+
=
k
k−1
k!(n − k)! (k − 1)!(n − k − 1)!
n!
1
1
(n + 1)!
=
+
=
(k − 1)!(n − k)! k n − k + 1
k!(n − k + 1)!
n+1
=
.
k
Definition 1.3.20. Für a ∈ Q und n ∈ N definieren wir die Potenzen an mit natürlichem
Exponenten n iterativ durch
a0 := 1 ,
ak+1 := a · ak
für k ∈ N .
♦
Satz 1.3.21 (Binomische Lehrsatz). Für zwei beliebige Zahlen a, b ∈ Q und eine beliebige
natürliche Zahl n ∈ N gilt
n n
n
(a + b) = ∑
ak bn−k .
k
k=0
Beweis. Beweis kann durch vollständige Induktion geführt werden.
Bemerkung 1.3.22. Satz 1.3.21 gilt natürlich auch für a, b ∈ R, wir führen R aber erst im
folgenden Kapitel ein.
24
2 Die reellen Zahlen
Von der Schule her sind die reellen Zahlen als Dezimalbrüche bekannt.
Im folgenden stellen wir die charakterisierenden Eigenschaften der rationalen und der reellen Zahlen als Axiome des angeordneten Körpers auf. Im Unterschied zu den rationalen
Zahlen fordern wir für die reellen Zahlen zusätzlich ein Vollständigkeitsaxiom. In einem
späteren Exkurs deuten wir dann an, daß die reellen Zahlen tatsächlich mit den Mitteln der
Mengenlehre aus den rationalen Zahlen konstruiert werden können.
2.1 Gemeinsame Eigenschaften der rationalen und der
reellen Zahlen
2.1.1 Die Körperaxiome
Definition 2.1.1. Ein Tripel (K, +, ·) mit einer Menge K und Abbildungen
+ : K × K → K und
·: K×K → K
heißt Körper, wenn die folgenden 3 Gruppen von Axiomen erfüllt sind:
1. Addition
Mit
x + y := +(x, y) für x, y ∈ K
gelten die folgenden Axiome:
(A1 )
(A2 )
(A3 )
(A4 )
∀x, y ∈ K(x + y = y + x) (Kommutativgesetz)
∀x, y, z ∈ K(x + (y + z) = (x + y) + z) (Assoziativgesetz)
∃=1 0 ∈ K∀x ∈ K(x + 0 = x) (Neutrales Element bzgl. Addition)
∀x ∈ K∃=1 − x ∈ K(x + (−x) = 0) (Inverses Element bzgl. Addition).
(K, +) bildet also eine kommutative Gruppe.
Die Abbildung + wird als Addition bezeichnet, x + y heißt Summe von x und y.
25
2 Die reellen Zahlen
2. Multiplikation
Mit
x · y := ·(x, y) für x, y ∈ K
gelten die folgenden Axiome:
(M1 )
(M2 )
(M3 )
(M4 )
∀x, y ∈ K(x · y = y · x) (Kommutativgesetz)
∀x, y, z ∈ K(x · (y · z) = (x · y) · z) (Assoziativgesetz)
∃=1 1 ∈ K \ {0}∀x ∈ K(x · 1 = x) (Neutr. Element bzgl. Multiplikation)
∀x ∈ K \ {0}∃=1 x−1 ∈ K(x · x−1 = 1) (Inverses Element bzgl. Multiplikation).
(K \ {0}, ·) bildet also ebenfalls eine kommutative Gruppe.
Die Abbildung · wird als Multiplikation bezeichnet, x · y heißt Produkt von x und y.
3. Verknüpfung von Addition und Multiplikation
Die Verknüpfung von Addition und Multiplikation unterliegt dem Axiom
(AM)
∀x, y, z ∈ K (x · (y + z) = x · y + x · z) (Distributivgesetz).
♦
Aus Addition und Multiplikation kann man die Operationen Subtraktion − : K × K → K
und Division ÷ : K × K6=0 → K ableiten:
x − y := −(x, y) := x + (−y) für alle x, y ∈ K
und
x ÷ y := ÷(x, y) := x · y−1
für alle x ∈ K, y ∈ K6=0 .
Die Elemente eines Körpers werden Zahlen genannt.
Man kann zeigen und es sollte aus der Schule bekannt sein, daß (Q, +, ·) ein Körper ist.
2.1.2 Die Anordnungsaxiome
Definition 2.1.2. Ein Quadrupel (K, +, ·, ≤) mit einer Menge K, Abbildungen
+ : K × K → K und
·: K×K → K
und einer Ordungsrelation
≤⊂ K × K
heißt total angeordneter Körper, wenn (K, +, ·) ein Körper bildet und zusätzlich die folgenden Axiome mit
<⊂ K × K definiert durch x < y := x ≤ y ∧ x 6= y
26
2.2 Das Vollständigkeitsaxiom der reellen Zahlen
erfüllt sind:
(O1 ) ∀x, y ∈ K(x ≤ y ∨ y ≤ x) (totale Ordnung)
(O2 ) (x, y ∈ K ∧ x < y) ⇒ ∃u ∈ K(x < u < y) (Dichte)
(O3 ) ∀x, y, z ∈ K(x < y ⇔ x + z < y + z) (Verträglichkeit mit Addition)
(O4 ) ∀x, y, z ∈ K(z > 0 ⇒ (x < y ⇔ x · z < y · z)) (Verträglichkeit mit Mult.)
♦
Die beiden letzten Eigenschaften charakterisieren die Verträglichkeit der Ordnungsrelation
mit den algebraischen Operationen auf K.
Ausgehend von der Ordnungsrelation ≤ und der Relation < werden die Relationen ≥, >
für x, y ∈ K definiert durch
x ≥ y :⇔ y ≤ x ,
x > y :⇔ y < x .
Damit gilt die Trichotomie-Eigenschaft, daß für je zwei Zahlen x, y ∈ K genau eine der drei
Beziehungen
x < y, x = y, x > y
gilt.
Eine Zahl x ∈ K heißt positiv, nichtnegativ, nichtpositiv bzw. negativ, wenn x > 0, x ≥ 0,
x ≤ 0 bzw. x < 0.
Man kann zeigen, daß (Q, +, ·, ≤) ein total angeordneter Körper ist.
Satz 2.1.3 (Archimedes, rational). Für alle x, y ∈ Q mit x > 0 existiert ein n ∈ N mit nx >
y.
Beweis. Seien x, y ∈ Q mit x > 0. Gilt y ≤ 0, so folgt x > y und wir können n = 1 wählen.
Seien nun x und y positiv. Dann existieren p, q, r, s ∈ N>0 mit x = qp , y = rs . Sei n := rq + 1.
Wegen
rq
n = rq + 1 >
= y/x
sp
gilt nx > y.
2.2 Das Vollständigkeitsaxiom der reellen Zahlen
2.2.1 Schranken und Extrema
Sei (K, +, ·, ≤) ein total angeordneter Körper.
Definition 2.2.1. Sei M ⊆ K. Eine Zahl S ∈ K mit der Eigenschaft x ≤ S für ∀x ∈ M heißt
obere Schranke der Menge M in K. Eine Zahl s ∈ K mit der Eigenschaft s ≤ x für ∀x ∈ M
heißt untere Schranke der Menge M in K. Eine Menge M ⊆ K heißt von oben beschränkt,
wenn eine obere Schranke für M existiert. Eine Menge M ⊆ K heißt von unten beschränkt,
wenn eine untere Schranke für M existiert. Schließlich heißt eine Menge M ⊆ K beschränkt,
wenn sie sowohl von oben als auch von unten beschränkt ist.
♦
27
2 Die reellen Zahlen
Eine Menge M ⊆ K ist folglich beschränkt, wenn es zwei Zahlen s, S ∈ K mit der Eigenschaft
∀x ∈ M(s ≤ x ≤ S)
gibt.
Besitzt eine Menge M eine obere Schranke, etwa S, dann ist jede Zahl S0 ≥ S ebenfalls eine
obere Schranke von M. Analog ist jede Zahl s0 ≤ s eine untere Schranke von M, falls s eine
solche ist. Eine beschränkte Menge besitzt also unendlich viele untere und obere Schranken.
Beispiel 2.2.2. Die Menge aller rationalen Zahlen zwischen 0 und 1 ist beschränkt. Untere
Schranken sind beispielsweise alle negativen rationalen Zahlen und 0.
♦
Beispiel 2.2.3. Die Menge der natürlichen Zahlen N ist von unten beschränkt aber, nach
♦
Satz 2.1.3, nicht von oben beschränkt in Q.
Beispiel 2.2.4. Die Menge Z ist unbeschränkt in Q.
♦
Sei M eine nichtleere Menge aus K. Unter allen oberen Schranken von M ist die kleinste
i.a. die wichtigste.
Definition 2.2.5. Eine Zahl m ∈ K heißt Maximum von M in K, wenn m obere Schranke
von M ist und m ∈ M. Eine Zahl S ∈ K heißt kleinste obere Schranke oder obere Grenze
oder Supremum von M, wenn S eine obere Schranke von M ist und wenn keine obere
Schranke S0 < S in K von M existiert. Das Maximum bzw. Supremum von M wird mit
max M bzw. sup M bezeichnet.
Analog definiert man das Minimum min M und die größte untere Schranke oder untere
Grenze oder das Infimum inf M einer Menge M.
♦
Zur Rechtfertigung der Definition betrachten wir folgenden Satz:
Satz 2.2.6. Wenn ein Supremum von M in K existiert, dann ist es eindeutig bestimmt.
Beweis. Angenommen, S1 6= S2 sind zwei Suprema der Menge M in K. O.B.d.A. sei S1 <
S2 . Dann ist S1 eine kleinere obere Schranke von M als S2 im Widerspruch zur Definition
des Supremums.
Satz 2.2.7. Wenn ein Maximum von M in K existiert, dann ist es gleich dem Supremum von
M in K und daher auch eindeutig bestimmt.
Beweis. Sei m ein Maximum von M in K. Damit ist m eine obere Schranke von M in K.
Angenommen, m 6= sup M. Dann existiert eine obere Schranke S ∈ K von M mit S < m. Da
m ∈ M folgt der Widerspruch m ≤ S.
Satz 2.2.8. Die folgenden Aussagen sind äquivalent:
28
2.2 Das Vollständigkeitsaxiom der reellen Zahlen
1. S = sup M.
2. S ist obere Schranke von M und für alle S0 ∈ K mit S0 < S existiert ein x ∈ M mit
S0 < x.
3. S ist obere Schranke von M und für alle ε ∈ K mit ε > 0 existiert ein x ∈ M mit
S − ε < x.
Beweis. 1. ⇒ 2.: Sei S = sup M und sei S0 < S. Nach Definition des Supremums ist S0 keine
obere Schranke von M, das heißt es existiert ein x ∈ M mit x > S0 .
2. ⇒ 1. S ist obere Schranke und sei S0 ∈ K mit S0 < S beliebig. Dann existiert ein x ∈ M
mit x > S0 . S0 ist also keine obere Schranke von M. Nach Definition ist S = sup M.
2. ⇔ 3.: Setze S0 = S − ε bzw. ε = S − S0 .
Analoge Aussagen gelten für Minimum min M und Infimum inf M von M.
Die Frage ist nun, ob max M und sup M überhaupt existieren und, wenn ja, für welche
Mengen.
2.2.2 Existenz des Supremums und Definition der reellen Zahlen
Beispiel 2.2.9. Sei K = Q und sei M = {x ∈ Q : x ≥ 0 ∧ x2 ≤ 2}. Dann ist 2 eine obere
Schranke von M: Angenommen, 2 ist keine oberere Schranke von M. Dann gibt es ein
x ∈ M mit x > 2. Dann gilt aber x · x > 2 · x > 2 · 2 = 4. Offensichtlich ist 0 untere Schranke
von M. Daher gilt min M = inf M = 0. Angenommen, S ∈ Q ist Supremum von M. Dann
gilt S ≤ 2. Da 1 ∈ M gilt S > 1.
Angenommen, es gilt S2 > 2. Sei ε ∈ Q beliebig mit 0 < ε <
alle x > S − ε gilt
S2 −2
1+2S .
Dann gilt ε < 1. Für
x2 ≥(S − ε)2 = S2 − 2Sε + ε 2 > S2 − ε(2S + 1)
>S2 − S2 + 2 = 2 .
Damit gibt es kein x ∈ M mit x > S − ε. Nach Satz 2.2.8 kann S nicht das Supremum
gewesen sein.
Sei nun S2 < 2. Sei ε ∈ Q beliebig mit 0 < ε <
2−S2
1+2S .
Dann gilt ε < 1 und
(S + ε)2 = S2 + 2Sε + ε 2 < S2 + ε(2S + 1) < 2 ,
das heißt S + ε ∈ M im Widerspruch dazu, daß S = sup M und damit auch S + ε ≤ S gelten
muß.
Wenn M also ein Supremum S besitzt, muß S2 = 2 gelten. Dies erfüllt aber keine rationale
Zahl.
Somit besitzt M kein Supremum in Q.
♦
29
2 Die reellen Zahlen
Nach obigen Beispiel existieren also beschränkte Teilmengen von Q, die kein Supremum
besitzen.
Definition 2.2.10. Ein total angeordneter Körper (K, +, ·, ≤) heißt vollständiger, total angeordneter Körper, wenn er folgendem Vollständigkeits-Axiom genügt:
(V)
Jede nichtleere, von oben beschränkte Teilmenge von K besitzt ein Supremum in K. ♦
(Q, +, ·, ≤) ist also kein vollständiger, total angeordneter Körper.
Definition 2.2.11. Unter einem Körper der reellen Zahlen (R, +, ·, ≤) verstehen wir einen
vollständigen, total angeordneten Körper.
♦
Im Sinne der Axiomatik nehmen wir nun die Existenz eines solchen Körpers an. Später
werden wir in einem Exkurs andeuten, wie man Modelle für reelle Zahlen tatsächlich konstruieren kann.
Ein in der Schule verwendetes Modell der Darstellung reeller Zahlen ist die Verwendung
von Dezimalbrüchen. Zu klärende Fragen wären aber:
• Was für ein mathematisches Objekt ist eigentlich ein Dezimalbruch?
• Sind sie eindeutig definiert?
• Wie definiert man Addition, Multiplikation und Ordnungsrelation?
Die Menge M in Beispiel 2.2.9 ist nichtleer und von oben beschränkt. Nach Axiom (V)
besitzt sie also ein Supremum S ∈ R. Wie oben gezeigt, gilt S2 = 2.
2.2.3 Exkurs: R enthält Q
In diesem Abschnitt wollen wir klären, ob R überhaupt die natürlichen Zahlen (und damit wegen den Körperaxiomen auch die ganzen und die rationalen Zahlen) enthält und in
welchem Sinne R eindeutig bestimmt ist.
Sei (R, +, ·, ≤) ein vollständiger, angeordneter Körper.
Eine Menge M heißt induktiv, wenn 0 ∈ M und wenn mit x ∈ M auch x + 1 ∈ M ist. Offensichtlich ist R induktiv. Sei nun
N :=
\
{M ⊆ R : M ist induktiv} .
Dann ist N die kleinste induktive Teilmenge von R: Offensichtlich gilt 0 ∈ N. Wenn x ∈ N,
dann ist x Element aller induktiven Teilmengen von R und somit auch x + 1. Also folgt aus
x ∈ N auch x + 1 ∈ N. Damit ist N eine induktive Menge. Aufgrund der Durchschnittsbildung gibt es keine echte Teilmenge von N, die auch eine induktive Menge ist.
30
2.3 Folgerungen aus den Axiomen
Da N die kleinste induktive Teilmenge von R ist, erfüllt N die Peano-Axiome mit ν(x) =
x + 1. Zu zeigen bleibt dazu nur das Induktionsaxiom: Sei K eine Teilmenge von N mit
0 ∈ N und x + 1 ∈ N wenn x ∈ N. Dann ist K nach Definition eine induktive Teilmenge von
R und damit gleich N.
N ist damit eine Teilmenge von R, die als Menge der natürlichen Zahlen bezeichnet werden
kann.
Wegen N ⊂ R, folgt Q ⊂ R.
Man kann zeigen, daß die reellen Zahlen als vollständiger, total angeordneter Körper in
gewissen Sinne eindeutig definiert sind: Seien (R, +, ·, ≤) und (R0 , +0 , ·0 , ≤0 ) zwei solche
Körper. Dann kann man zeigen, daß es eine Bijektion I (Isomorphismus genannt) von R
auf R0 gibt, die mit der algebraischen Struktur und der Ordnungsstruktur der beiden Körper
verträglich ist: Es gelten
I(0) = 00 , I(1) = 10
und
∀x, y ∈ R :
I(x + y) = I(x) +0 I(y) ,
I(xy) = I(x) ·0 I(y) ,
x ≤ y ⇒ I(x) ≤0 I(y)
sowie die entspechenden Beziehungen für I −1 .
In diesem Sinne können wir von den reellen (natürlichen, ganzen, rationalen) Zahlen sprechen.
2.3 Folgerungen aus den Axiomen
2.3.1 Beträge, Intervalle und spezielle Ungleichungen
Ungleichungen
Als Folgerung aus dem Vollständigkeitsaxiom (V) erhalten wir:
Satz 2.3.1 (Archimedes). Zu r > 0 existiert eine natürliche Zahl mit n > r, das heißt, N ist
nicht von oben beschränkt in R.
Beweis. Angenommen, es existiert eine positive reelle Zahl r mit n ≤ r für alle n ∈ N. Dann
ist N von oben beschränkt in R. Damit existiert S = sup N in R. Sei S0 = S − 21 . Dann muß
ein n ∈ N existieren mit S0 < n, das heißt, S − 21 < n und daher S < n + 12 < n + 1 ∈ N im
Widerspruch zur Supremums-Eigenschaft von S.
Folgerung 2.3.2 (Eudoxos). Für jedes ε > 0 existiert ein m ∈ N>0 mit
Beweis. Angenommen, es gibt ein ε > 0 mit
alle m ∈ N im Widerspruch zu Satz 2.3.1.
1
m
1
m
< ε.
≥ ε für alle m ∈ N>0 . Dann folgt
1
ε
> m für
31
2 Die reellen Zahlen
Lemma 2.3.3. Es gilt
∀a, b, c, d ∈ R (a < b ∧ c < d ⇒ a + c < b + d) .
Beweis. Aus (O3 ) folgt a + c < b + c und b + c < b + d. Mit (O1 ) ergibt sich die Behauptung.
Lemma 2.3.4 (Bernoulli). Für x ∈ R≥−1 und alle n ∈ N gilt
(1 + x)n ≥ 1 + nx .
(2.3.1)
Beweis. Sei x ≥ −1. Für n = 0 gilt (1 + x)0 = 1 = 1 + 0x. Sei die Ungleichung (2.3.1) nun
richtig für ein k ∈ N. Dann gilt
(1 + x)k+1 = (1 + x)(1 + x)k ≥ (1 + x)(1 + kx) = 1 + (k + 1)x + kx2 ≥ 1 + (k + 1)x .
Nach dem Induktionsprinzip gilt (2.3.1) damit für alle n ∈ N.
Absolute Beträge
Sei r ∈ R. Wir definieren
|r| :=
r,
falls r ≥ 0 ,
−r , falls r < 0
und nennen |r| den Betrag von r.
Lemma 2.3.5. Für alle r, s,t ∈ R gelten:
1. |r| ≥ 0, |r| = 0 ⇔ r = 0 (positive Definitheit).
2. |r| = | − r|.
3. r ≤ |r|.
4. |rs| = |r| · |s| (Multiplikativität).
5. |r + s| ≤ |r| + |s| (Dreiecksungleichung).
6. | rs | =
|r|
|s| ,
wenn s 6= 0.
7. ||r| − |s|| ≤ |r − s|.
8. |r| < t ⇔ −t < r < t.
9. |r − s| < t ⇔ s − t < r < s + t.
32
2.3 Folgerungen aus den Axiomen
Beweis. 1. trivial.
−r , falls r ≤ 0 ,
−r , falls r < 0 ,
2. | − r| =
=
= |r|.
r,
falls r > 0
r,
falls r ≥ 0
3. und 4. ÜA mit Fallunterscheidung.
5. Aus 3. ergibt sich r ≤ |r| und s ≤ |s| und somit
r + s ≤ |r| + |s| .
Andererseits haben wir wegen 2. auch −r ≤ |r| und −s ≤ |s| und somit
−(r + s) ≤ |r| + |s| .
Nach Definition ist eine der beiden Zahlen r + s und −(r + s) gleich |r + s| und somit folgt
die Behauptung.
6. Für s 6= 0 gilt wegen 4. |r| = |s · rs | = |s| · | rs | und daher | rs | =
|r|
|s| .
7. Wegen r = (r − s) + s folgt nach 5. |r| ≤ |r − s| + |s| und damit
|r| − |s| ≤ |r − s| .
Analog folgt aus 5. und s = (s − r) + r folgt nach 5. |s| ≤ |r − s| + |r| und damit
|s| − |r| ≤ |r − s| .
Somit folgt
||r| − |s|| ≤ |r − s| .
8. „⇒“ Aus |r| < t folgt −t < −|r| ≤ |r| < t. Da r = |r| oder r = −|r| folgt −t < r < t.
„⇐“ Aus −t < r < t folgt −t < r und daher −r < t. Mit r < t folgt |r| < t.
9. ist triviale Folgerung aus 8.
Intervalle
Definition 2.3.6. Seien a, b ∈ R. Dann heißt
• [a, b] := {x ∈ R : a ≤ x ≤ b} das abgeschlossene Intervall,
• ]a, b[ := {x ∈ R : a < x < b} das offene Intervall,
• ]a, b] := {x ∈ R : a < x ≤ b} das linksseitig halboffene Intervall,
• [a, b[ := {x ∈ R : a ≤ x < b} das rechtsseitig halboffene Intervall
mit den Endpunkten a und b. Wenn b ≥ a, dann heißt L := b−a die Länge des Intervalles.♦
33
2 Die reellen Zahlen
2.3.2 Die Dichtheit der rationalen Zahlen in R
Seien a, b ∈ K mit K ∈ {Q, R} und a < b . Dann gilt
a+a < a+b < b+b
und daher
a<
mit
a+b
2
a+b
<b
2
∈ K. Damit haben wir:
Lemma 2.3.7. Zwischen zwei verschiedenen reellen (rationalen) Zahlen liegt stets eine weitere reelle (rationale) Zahl.
Die Frage ist nun, wie Q in R liegt.
Lemma 2.3.8. Jede nichtleere Teilmenge M von N hat ein kleinstes Element.
Beweis. Sei m ∈ M. Dann gibt es m + 1 natürliche Zahlen in N≤m und somit nur endlich
viele natürliche Zahlen in M ∩ N≤m . Von diesen endlich vielen Zahlen ist eine die kleinste
von M ∩ N≤m und damit auch von M.
Satz 2.3.9. Die rationalen Zahlen Q liegen dicht in R, d.h., für alle r ∈ R und alle ε > 0
existiert ein q ∈ Q mit |q − r| < ε, d.h., r − ε < q < r + ε und q − ε < r < q + ε.
Beweis. O.B.d.A. sei r ≥ 0. Nach Folgerung 2.3.2 existiert ein m ∈ N mit m > ε1 . Es genügt,
q ∈ Q ∩ [r − m1 , r + m1 ] zu suchen. Nach Satz 2.3.1 existiert n ∈ N mit n > mr. Die Menge
aller dieser natürlichen Zahlen m hat ein kleinstes Element n0 . Damit gilt n0 − 1 ≤ mr ≤ n0 .
Setze nun q = nm0 . Dann gilt q − m1 ≤ r ≤ q und daher r ≤ q ≤ r + m1 .
Weitere Aussagen zum Vergleich zwischen rationalen und reellen Zahlen werden später
unter anderem in Abschnitt 3.6 (Abzählbarkeit und Überabzählbarkeit) getroffen.
2.4 Potenzen reeller Zahlen
2.4.1 Potenzen mit rationalen Exponenten
Für a ∈ R und n ∈ N haben wir an schon definiert. Das Ziel besteht nun in der Definition
von ab für a ∈ R>0 und b ∈ Q.
Satz 2.4.1. Ist a ∈ R≥0 und n ∈ N>0 , so besitzt die Gleichung xn = a genau eine Lösung in
R≥0 .
34
2.4 Potenzen reeller Zahlen
Beweis. Durch vollständige Induktion zeigt man
xm − ym = (x − y) · (xm−1 + xm−2 y + · · · + xym−2 + ym−1 ) .
Damit gilt
∀x, y ∈ R≥0 ∀m ∈ N>0 :
x<y
xm < ym .
⇔
(2.4.1)
Zeigen wir nun zuerst die Eindeutigkeit der Lösung. Dies ist wie häufig in der Mathematik
der einfachere Teil: Angenommen, es existieren zwei verschiedene Lösungen x, y ∈ R≥0
der Gleichung. O.B.d.A. sei x < y. Dann erhalten wir den Widerspruch a = xn < yn = a zu
(2.4.1).
Nun zur Existenz der Lösung. Für n = 1 ist x = a Lösung. Sei nun n ∈ N>1 . Wir betrachten
die Menge
M = {y ∈ R : y ≥ 0 ∧ yn ≤ a} .
Da 0 ∈ M, ist M nichtleer. Aus der Bernoulli-Ungleichung (2.3.1) folgt
(1 + a)n > 1 + na > a ≥ yn .
∀y ∈ M :
Nach (2.4.1) ist M damit von oben beschränkt. Nach Vollständigkeits-Axiom (V) existiert
z := sup M .
Wir zeigen nun zn = a. Angenommen, zn < a. Für beliebiges m ∈ N>0 gilt nach dem
binomischen Lehrsatz 1.3.21
1 n
1 n
1
c
n
n
n−1
=z +
∀m ∈ N>0 :
z+
(2.4.2)
z
+···+ n
≤ zn +
n
m
m 1
m
m
mit
c :=
n
1
n−1
z
+···+
n
n
.
c
c
Wegen a − zn > 0 und c > 0, folgt a−z
n > 0. Nach Satz 2.3.1 existiert ein k ∈ N mit k > a−zn .
Daraus folgt zn + kc < a. Mit (2.4.2) folgt
1
z+
k
n
≤ zn +
c
<a
k
und daher z + 1k ∈ M im Widerspruch zur Definition von z.
Analog zeigt man, daß auch die Annahme zn > a zu einem Widerspruch führt. Also gilt
zn = a.
1
Definition 2.4.2. Für a ∈ R≥0 und n ∈ N>0 definieren wir a n als die nichtnegative Lösung
1
der Gleichung xn = a und nennen a n n-te Wurzel von a.
♦
35
2 Die reellen Zahlen
Bezeichnungen: Folgende Bezeichnungen sind üblich:
√
√
√
1
n
a := a n ,
a := 2 a .
Definition 2.4.3. Für a ∈ R>0 und r = qp , p, q ∈ N>0 , definieren wir
ar :=
√
q p
a ,
a−r :=
√ −1
q p
.
a
♦
Bemerkung 2.4.4. 1. Man müßte die Definition rechtfertigen, nämlich zeigen, daß ar unabhängig von der Dartstellung von r = qp = st ist.
√
2. Die Aufgabe, n a zu definieren oder zu berechnen, ist streng zu unterscheiden von der
Aufgabe,
alle (reellen) Lösungen
der Gleichung xn = a zu finden. Für a > 0 und gerades n
√
√
ist n a die positive und − n a die negative Lösung von xn = a.
√
n
a nicht definiert. Jedoch kann xn = a reelle Lösungen besitzen. Für
3. Ist a < 0, so ist
√
ungerades n ist − n −a Lösung von xn = a.
√
√
n = a gilt stets für a ≥ 0. n an = a gilt
n
4. Test zum Verständnis der Wurzeldefinition:
(
a)
p
♦
auch nur für a ≥ 0, denn zum Beispiel (−1)2 6= −1.
2.4.2 Exkurs: Potenzen mit reellem Exponenten und Logarithmen
Das Ziel besteht nun in der Definition von ab für a ∈ R>0 und b ∈ R.
Definition 2.4.5. Für a ∈ R>0 und b ∈ R definieren wir
(
sup{ar : r ∈ Q≤b } für a ≥ 1 ,
b
b −1
a :=
a−1
für a ∈ ]0, 1[ .
♦
Zu zeigen wären nun noch die Potenzgesetze:
Satz 2.4.6. Für a, b ∈ R>0 und c, d ∈ R gilt:
c d
c+d
a a =a
,
ac
= ac−d ,
d
a
c c
c
a b = (ab) ,
ac a c
=
,
bc
b
(ac )d = acd .
Für alle b ∈ R>0 und für beliebige, fixierte Basis a ∈ R>0 \ {1} wollen wir nun auf ähnliche
Weise eine Zahl x mit ax = b definieren.
Sei a > 1. Da ax > ay für x > y, gibt es höchstens eine Lösung von ax = b. Wir zeigen, daß
das Supremum der Menge
M(a, b) = {x ∈ R : ax ≤ b}
existiert und die gesuchte Lösung darstellt: Nach Satz von Archimedes 2.3.1 existiert ein
n ∈ N mit
b−1 − 1 ≤ n(a − 1) .
36
2.4 Potenzen reeller Zahlen
Mit der Bernoulli-Ungleichung (2.3.1) folgt
b−1 ≤ 1 + n(a − 1) ≤ an ,
d.h.,
a−n ≤ b .
Damit ist M(a, b) nichtleer. Weiter existiert ein m ∈ N mit
b ≤ 1 + m(a − 1) ≤ am .
Da ar ≥ am für r ≥ m, ist m eine obere Schranke von M(a, b). Somit existiert S = sup M(a, b)
für a > 1 und b > 0.
Angenommen, es gilt aS > b. Dann ist aS b−1 > 1. Nach Satz von Archimedes 2.3.1 existiert
ein n ∈ N mit
a < n(aS b−1 − 1) .
Mit der Bernoulli-Ungleichung (2.3.1) folgt
a < (aS b−1 )n
und damit
1
a n < aS b−1 .
Somit existiert ein ε > 0 mit aε < aS b−1 . Für alle x ≥ S − ε folgt
ax ≥ aS−ε = aS a−ε > aS a−S b = b .
Damit kann S nicht das Supremum von M sein. Analog zeigt man, daß auch aS < b nicht
gelten kann und somit aS = b sein muß.
In ähnlicher Weise zeigt man, daß auch S = sup M(a, b) für a ∈ ]0, 1[ und b > 0 existiert und
die Gleichung ax = b löst.
Wir nennen sup M(a, b) den Logarithmus von b zur Basis a und schreiben
loga b := sup M(a, b) .
Damit gilt
∀a ∈ R>0 \ {1}∀b ∈ R>0 :
b = aloga b .
(2.4.3)
Die Logarithmengesetze ergeben sich aus den Potenzgesetzen und (2.4.3):
• Es existieren α, β ∈ R mit α = loga b, β = logb a. Damit gilt aα = b und bβ = a.
Wegen (aα )β = aαβ , folgt αβ = 1, d.h.
∀a, b ∈ R>0 \ {1} :
loga b · logb a = 1 .
(2.4.4)
37
2 Die reellen Zahlen
• Seien x, y ∈ R>0 und z = xy. Es existieren u = loga x, v = loga y, w = loga z und es gilt
aw = z = xy = au av = au+v ,
so daß
∀a ∈ R>0 \ {1}∀x, y > 0 :
loga (xy) = loga x + loga y
(2.4.5)
folgt.
• Sei x ∈ R>0 , v ∈ R und u = loga x. Dann gilt xv = (au )v = auv , d.h.
∀a ∈ R>0 \ {1}∀x ∈ R>0 ∀v ∈ R :
loga (xv ) = v loga x .
(2.4.6)
• Schließlich folgt die Umrechnungsformel
∀a, b ∈ R>0 \ {1}∀x ∈ R>0 :
logb x = loga x · logb a
(2.4.7)
aus (2.4.3) und (2.4.6), da
logb x = logb aloga x = loga x · logb a .
2.5 Die Symbole +∞ und −∞
In gewissen Situationen ist es sinnvoll, R um zwei Symbole −∞ und ∞ = +∞ zu ergänzen.
Mit diesen Symbolen wird wie folgt gerechnet:
1. Für alle x ∈ R setzen wir −∞ < x , x < ∞,
x+∞ = ∞,
x − ∞ = −∞ ,
und
∞+x = ∞,
−∞ + x = −∞
x
x
=
= 0.
∞ −∞
2. Für x > 0 wird gesetzt:
x·∞ = ∞·x = ∞,
x · (−∞) = (−∞)x = −∞ .
3. Für x < 0 wird gesetzt:
x · ∞ = ∞ · x = −∞ ,
x · (−∞) = (−∞)x = ∞ .
4. Weiter setzt man:
∞+∞ = ∞,
(−∞) + (−∞) = −∞ ,
(−∞) − ∞ = −∞ ,
∞ − (−∞) = ∞
und
∞·∞ = ∞,
(−∞) · (−∞) = ∞ ,
(−∞) · ∞ = −∞ ,
∞ · (−∞) = −∞ .
R ∪ {−∞, ∞} kann nicht unter Erhaltung der Körperaxiome von (R, +, ·) zu einem Körper
fortgesetzt werden: Wenn (R ∪ {−∞, ∞}, +, ·) ein Körper wäre, würde zum Beispiel aus
∞ + ∞ = ∞ die Gleichung 2 = 1 folgen.
Schließlich setzen wir
inf 0/ := +∞
38
und
sup 0/ := −∞ .
2.6 Komplexe Zahlen
2.6 Komplexe Zahlen
Wir betrachten die Menge R2 = R × R der Paare reeller Zahlen. Wir definieren in R2 eine
Addition + in natürlicherweise durch
(a, b) + (c, d) := (a + c, b + d)
für a, b, c, d ∈ R .
(2.6.1)
Offensichtlich erfüllt diese Addition die Eigenschaften (A1 ) bis (A4 ) mit dem additiv-neutralen
Element (0, 0) und dem zu (a, b) additiv-inversen Element (−a, −b). Weiter definieren wir
(a, b) · (c, d) = (ac − bd, ad + bc) .
(2.6.2)
Leicht sieht man (M1 ), (M2 ). Die Gleichung
(a, b)(x, y) = (1, 0)
hat für (a, b) ∈ R2 mit (a, b) 6= (0, 0) die einzige Lösung
a
−b
−1
(x, y) = (a, b) =
,
a2 + b2 a2 + b2
für (a, b) 6= 0 .
Damit ist (R2 , +, ·) mit der durch (2.6.1) definierten Addition und der durch (2.6.2) definierten Multiplikation ein Zahlenkörper. Insbesondere haben wir
ac + bd ad − bc
,
für (a, b) 6= 0 .
(2.6.3)
(c, d) : (a, b) =
a2 + b2 a2 + b2
Definition 2.6.1. Der Zahlenkörper (R2 , +, ·) mit der durch (2.6.1) definierten Addition und
der durch (2.6.2) definierten Multiplikation heißt Körper der komplexen Zahlen und wird
mit C bezeichnet.
♦
2.7 Reelle und komplexe Funktionen
2.7.1 Grundbegriffe
Abbildungen f : D( f ) ⊆ Kn1 → Km
2 mit Ki ∈ {R, C} werden auch als Funktionen bezeichnet.
Spezialfälle:
m = n = 1 Reell- bzw. komplexwertige Funktion einer reellen bzw. komplexen Variablen.
Beispiel: f : R → R mit f (x) = x2 + 3x + 1.
m > 1, n = 1 Vektorfunktion einer reellen bzw. komplexen Variablen. Beispiel: f : D( f ) ⊆
r cost
2
R → R mit D( f ) = [0, 2π[ und f (t) =
mit fixiertem r > 0 ergibt Kreislinie.
r sint
m = 1, n > 1 Reell- bzw. komplexwertige Funktion von n reellen bzw. komplexen Variablen.
m > 1, n > 1 Vektorfunktion von n reellen bzw. komplexen Variablen.
39
2 Die reellen Zahlen
Darstellung von Funktionen:
Explizit (durch eine Formel oder Vorschrift):
√
4 − x auf D( f ) = R≥4 mit W ( f ) = R≥0 .
x
x≥0
• f (x) =
auf D( f ) = R mit W ( f ) = R≥0 .
2 + sin x x < 0
−x
x≥0
• f (x) =
auf D( f ) = R mit W ( f ) = R≤0 ∪ [1, 3].
2 + sin x x < 0
• f (x) =
Implizit: x2 + y2 = 1. Wo kann y als Funktion von x dargestellt werden?
2.7.2 Operationen unter reellen und komplexen Funktionen
Basierend auf den algebraischen und ordnungstheoretischen Eigenschaften der reellen Zahlen kann man gewisse Operationen mit reellen Funktionen ausführen.
Seien f und g reelle Funktionen mit Definitionsbereichen D( f ) bzw. D(g). Man setzt
D( f ± g) = D( f g) = D( f ∨ g) = D( f ∧ g) := D( f ) ∩ D(g) ,
sowie
1
D( ) := {x ∈ D( f ) : f (x) 6= 0} ,
f
g
1
D( ) := D(g) ∩ D( )
f
f
und definiert die Funktionen f ± g, f g, f ∨ g, f ∧ g, | f |, 1f ,
( f ± g)(x) := f (x) + g(x)
( f g)(x) := f (x)g(x)
(λ f )(x) := λ f (x)
( f ∨ g)(x) := max{ f (x), g(x)}
( f ∧ g)(x) := min{ f (x), g(x)}
| f |(x) := | f (x)|
1
( 1f )(x) := f (x)
( gf )(x) :=
g(x)
f (x)
D(| f |) = D(λ f ) := D( f )
f
g
wie folgt:
für x ∈ D( f ± g)
für x ∈ D( f g)
für x ∈ D(λ f )
für x ∈ D( f ∨ g)
für x ∈ D( f ∧ g)
für x ∈ D( f )
für x ∈ D( 1f )
Summe bzw. Differenz,
Produkt,
Vielfaches,
Maximum,
Minimum,
Betrag,
für x ∈ D( gf )
Quotient.
Für beliebige reelle λ1 , . . . , λN und reelle Funktionen f1 , . . . , fN nennt man die Funktion
λ1 f1 + · · · + λN fN
Linearkombination der Funktionen f1 , . . . , fN .
Bemerken wir noch, daß diese Operationen mit Ausnahme von Maximum und Minimum
auch für komplexe Funktionen und λ ∈ C Sinn haben.
40
2.7 Reelle und komplexe Funktionen
2.7.3 Spezielle Funktionen
Definition 2.7.1. Eine Abbildung p : K → K mit p(x) = an xn + · · · + a1 x + a0 und ai ∈ K
bei K ∈ {R, C} heißt reelles bzw. komplexes Polynom. Gilt an 6= 0, so heißt degp = n der
Grad des Polynoms.
♦
M
i
i
Zwei Polynome p und q mit p(x) = ∑N
i=1 ai x , q(x) = ∑i=1 bi x sind gleich, wenn degp =
degq und ai = bi für i = 0, . . . , degp = degq.
Addition, Multiplikation mit einer Zahl, Produkt und Division werden wie üblich definiert.
Dabei gilt deg(p + q) ≤ max{degp, degq}, deg(pq) = degp + degq.
Definition 2.7.2. Eine Funktion R : D(R) ⊆ K → K heißt gebrochen-rationale Funktion,
p(x)
wenn Polynome p und q existieren mit R(x) = q(x)
für alle x ∈ D(R). R heißt echt (unecht)
gebrochen, falls degp < degq (degp ≥ degq).
♦
In 2.4 haben wir für alle a > 0 und alle b ∈ R die Potenzen ab eingeführt. Daraus erhält man
zwei Klassen von Funktionen:
Fixieren des Exponenten: Sei b ∈ R fixiert. Dann kann man jedem x ∈ ]0, ∞[ die Potenz xb
zuordnen. Die so entstehende Funktion potb : R>0 → R>0 nennt man Potenzfunktion mit
Exponent b.
Fixieren der Basis: Sei a ∈ ]0, ∞[ fixiert. Dann kann man jedem x ∈ R die Potenz ax
zuordnen. Die so entstehende Funktion expa : R → R>0 nennt man Exponentialfunktion
zur Basis a.
Es gilt:
D(potb ) = R>0 ,
W (potb ) =
und
D(expa ) = R ,
W (expa ) =
R>0 , für b 6= 0 ,
{1} , für b = 0 .
R>0 , für a 6= 1 ,
{1} , für a = 1 .
Aus den Potenzgesetzen in R ergeben sich die folgenden Eigenschaften:
∀x, y ∈ D(potb ) = R>0 :
potb (x) · potb (y) = xb yb = (xy)b = potb (xy)
und
∀s,t ∈ D(expa ) = R :
expa (t + s) = at+s = at as = expa (t) expa (s) .
Für positive x und fixierte Basis a ∈ ]0, ∞[ \{1} haben wir in 2.4 den Logarithmus von x zur
Basis a eingeführt. Dies führt zur Logarithmusfunktion loga mit D(loga ) = R>0 . Aus den
Logarithmengesetzen ergibt sich
∀x, y ∈ D(loga ) = R>0 :
loga (xy) = loga (x) + loga (y) .
41
2 Die reellen Zahlen
Bemerkung 2.7.3. 1. expa (x) und expa x bzw. loga (x) und loga x werden gleichberechtigt
verwendet.
2. Anstelle von potb bzw. expa wird meist (nicht korrekt) xb bzw. ax geschrieben.
3. Für a = e setzt man exp := expe und ln := loge und nennt ln den natürlichen Logarithmus.
♦
Als spezielle Linearkombinationen von Exponentialfunktionen erhält man die Hyperbelfunktionen
1
cosh : R → R mit cosh(x) = ex + e−x
2
mit W (cosh) = [1, ∞[, genannt Hyperbelcosinus oder Cosinus hyperbolicus, und
sinh : R → R mit sinh(x) =
1 x
e − e−x
2
mit W (sinh) = R, genannt Hyperbelsinus oder Sinus hyperbolicus.
Weitere „elementare“ Funktionen sind die trigonometrischen Funktion sin, cos und daraus
abgeleitete Funktionen (wie z.B. tan). Diese werden erst später über Potenzreihen oder als
Lösung einer speziellen Differentialgleichung (Schwingungsgleichung) definiert.
42
3 Grenzwerttheorie
3.1 Metrische und normierte Räume
3.1.1 Der metrische Raum
In der Analysis hat man häufig die folgende Situation: Sei x0 ein fixierter Punkt in einer
Menge X. Man benötigt Punkte x, die in der „Nähe“ oder „Umgebung“ von x0 liegen.
Eventuell muß man sogar den Abstand zwischen zwei Punkten zahlenmäßig angeben.
In der Menge X benötigt man dazu eine gewisse Struktur, die die Entfernung zweier beliebiger Punkte x, y ∈ X angeben kann.
Eine Menge mit einer zusätzlichen Struktur wird in der Mathematik Raum genannt.
Definition 3.1.1. Sei X eine Menge und ρ : X × X → R eine Funktion. Die Funktion ρ
heißt Metrik auf X, wenn die folgenden drei Bedingungen erfüllt sind:
(M1 ) ∀x, y ∈ X :
ρ(x, y) ≥ 0 ∧ (ρ(x, y) = 0 ⇔ x = y) (pos. Definitheit),
(M2 ) ∀x, y ∈ X :
ρ(x, y) = ρ(y, x) (Symmetrie),
(M3 ) ∀x, y, z ∈ X :
ρ(x, y) ≤ ρ(x, z) + ρ(z, y) (Dreiecksungleichung).
Ist ρ Metrik auf X und sind x, y ∈ X, so heißt ρ(x, y) Entfernung oder Abstand von x zu y.
Das Paar (X, ρ) heißt metrischer Raum.
♦
Beispiel 3.1.2. Sei X eine Menge mit mindestens zwei Elementen. Die Funktion ρ mit
ρ(x, y) = 0, falls x = y, und ρ(x, y) = 1, falls x 6= y, ist eine Metrik auf X.
♦
Beispiel 3.1.3. X = R1 , ρ(x, y) = |x − y|.
Beispiel 3.1.4. X = C, ρ(z, w) = |z − w| =
♦
p
(ℜ(z − w))2 + (ℑ(z − w))2 .
♦
3.1.2 Der euklidische Raum
Sei n ∈ N>0 . Wir betrachten die Menge
X = Rn = Xni=1 R
43
3 Grenzwerttheorie
der reellen n-Tupel. In X definiert man die Addition von Elementen x = (x1 , . . . , xn ), y =
(y1 , . . . , yn ) und die Multiplikation mit einem Skalar λ ∈ R durch
x + y = (x1 + y1 , . . . , xn + yn ) und
λ x = (λ x1 , . . . , λ xn ) .
In der linearen Algebra wird gezeigt, daß der Rn mit diesen Operationen zu einem Vektorraum (Rn , +, ·) oder linearen Raum (über den Körper R) wird.
Spezielle Vektoren sind der Nullvektor 0 = (0, . . . , 0) und der i-te Einheitsvektor ei =
(0, . . . , 0, 1, 0, . . . , 0), bei dem genau an der i-ten Stelle eine 1 steht. Ist dann x = (x1 , . . . , xn )
ein Vektor aus Rn , so kann man ihn als
x = x1 e1 + x2 e2 + . . . + xn en
darstellen. {e1 , . . . , en } heißt dann eine Basis von x und x1 , . . . , xn heißen die Koordinaten
von x.
Jedem Vektor x ∈ Rn ordnet man eine Zahl
q
2
kxk = (x1 ) + · · · + (xn )2
(3.1.1)
zu, die wir Länge des Vektors x nennen wollen.
Bemerken wir nun einige wichtige Eigenschaften der Länge:
(L1 ) ∀x ∈ Rn : kxk ≥ 0 ∧ (kxk = 0 ⇔ x = 0).
(L2 ) ∀x ∈ Rn ∀λ ∈ R : kλ xk = |λ | · kxk.
(L3 ) ∀x, y ∈ Rn : kx + yk ≤ kxk + kyk.
(L1 ) und (L2 ) sind offensichtlich. Wir wollen (L3 ) zeigen. Zu diesem Zweck beweisen wir
zwei Ungleichungen:
!2
!
!
m
∀ai , bi ∈ R :
m
∑ aibi
i=1
und
s
∀ai , bi ∈ R :
m
m
∑ a2i
≤
∑ b2i
i=1
∑ (ai + bi)
2
s
≤
i=1
(3.1.2)
i=1
s
m
m
∑ a2i + ∑ b2i .
i=1
(3.1.3)
i=1
Zu (3.1.2). Sei
m
m
i=1
i=1
φ (λ ) = ∑ (ai λ + bi )2 = λ 2 ∑ a2i +2λ
| {z }
A
m
m
∑ aibi + ∑ b2i .
|i=1{z } i=1
| {z }
B
C
Dann ist φ (λ ) nichtnegativ für alle λ ∈ R. Der Ausdruck Aλ 2 + 2Bλ +C mit A ≥ 0 ist aber
genau dann für alle λ ∈ R nichtnegativ, wenn die Diskriminante B2 − AC nichtpositiv ist.
Damit folgt (3.1.2).
44
3.1 Metrische und normierte Räume
Zu (3.1.3). Wegen (3.1.2) gilt
m
m
m
m
i=1
i=1
i=1
m
s
∑ (ai + bi)2 = ∑ a2i + 2 ∑ aibi + ∑ b2i
≤ ∑ a2i + 2
i=1
s
=
m
∑ a2i
s
i=1
∑ a2i +
i=1
i=1
m
s
m
m
m
i=1
!2
i=1
∑ b2i + ∑ b2i
∑ b2i
.
i=1
Damit haben wir
q
q
q
1
1
2
n
n
2
1
2
n
2
(x + y ) + · · · + (x + y ) ≤ (x ) + · · · + (x ) + (y1 )2 + · · · + (yn )2 ,
d.h.,
kx + yk ≤ kxk + kyk
für alle x, y ∈ Rn .
Der Vektorraum (Rn , +, ·) ausgestattet mit der Länge k · k definiert durch (3.1.1) heißt euklidischer Raum.
Im euklidischen Raum können wir eine Metrik ρ durch
ρ(x, y) := kx − yk für alle x, y ∈ Rn
definieren. Diese Metrik heißt euklidische Metrik, der Abstand heißt euklidischer Abstand.
3.1.3 Der normierte Raum
Den Begriff des euklidischen Räumen können wir zum Begriff des normierten Raumes verallgemeinern:
Definition 3.1.5. Sei X ein linearer Raum (d.h. Vektorraum) und k · k : X → R eine Abbildung mit den folgenden Eigenschaften
(N1 ) ∀x ∈ X : kxk ≥ 0 ∧ (kxk = 0 ⇔ x = 0),
(N2 ) ∀x ∈ X ∀λ ∈ R : kλ xk = |λ | · kxk,
(N3 ) ∀x, y ∈ X : kx + yk ≤ kxk + kyk.
Dann heißt k · k Norm auf X und (X, k · k) heißt normierter Raum.
♦
Jeder euklidische Raum ist also ein normierter Raum, die Länge ist eine Norm, dann auch
euklidische Norm genannt. In jedem normiertem Raum (X, k · k) kann eine Metrik ρ durch
ρ(x, y) := kx − yk
für alle x, y ∈ X
45
3 Grenzwerttheorie
eingeführt werden.
Durch | · | p , | · |∞ : Rn × Rn → R, p ≥ 1, mit
s
n
|x| p =
p
∑ (xi) p ,
i=1
|x|∞ = max |xi |
i∈{1,...,n}
sind weitere Normen in Rn gegeben. | · |2 ist die bekannte euklidische Norm.
3.1.4 Umgebungen
Im folgenden sei (X, ρ) stets ein metrischer Raum. Sei x0 ∈ X und r ≥ 0. Wir bezeichnen
mit
B(x0 , r) := {x ∈ X : ρ(x, x0 ) < r}
bzw. B̄(x0 , r) := {x ∈ X : ρ(x, x0 ) ≤ r}
die offene bzw. abgeschlossene Kugel mit Zentrum x0 und Radius r.
Definition 3.1.6. Eine Teilmenge U ⊆ X heißt Umgebung des Punktes x0 ∈ X, wenn ein
r > 0 existiert mit B(x0 , r) ⊆ U.
♦
p
Zum Beispiel sei X = R2 , ρ(x, y) = (x1 − y1 )2 + (x2 − y2 )2 , x0 = (0, 0). Dann ist U =
{x : |xi | ≤ 12 } eine Umgebung von x0 und x1 = ( 13 , − 13 ).
Definition 3.1.7. Sei A ⊆ X, x0 ∈ A.
a) x0 heißt innerer Punkt von A, wenn x0 mit einer ganzen Umgebung zu A gehört, d.h., es
existiert eine Umgebung U von x0 mit U ⊆ A.
b) Die Menge A heißt offen, wenn sie nur aus inneren Punkt besteht.
♦
Beispiel 3.1.8.
1. Jede offene Kugel (in einem metrischen Raum) ist eine offene Menge.
2. X = R, x0 ∈ R, ε > 0. Dann
B(x0 , ε) = {x ∈ R : |x − x0 | < ε} = ]x0 − ε, x0 + ε[ .
3. a, b ∈ R. ]a, b[ ist offene Menge, sogar offene Kugel:
a+b b−a
]a, b[ = B
,
, wenn b > a .
2
2
4. a, b ∈ R. [a, b] ist abgeschlossene Kugel:
a+b b−a
[a, b] = B
,
,
2
2
wenn b > a .
5. Die leere Menge ist offen.
6. X selbst ist offen.
46
♦
3.2 Folgen und Grenzwerte von Folgen
3.2 Folgen und Grenzwerte von Folgen
3.2.1 Folgen
Definition 3.2.1. Sei X eine Menge und sei M ⊆ N. Eine Abbildung x : M → X heißt Folge
(von Elementen) in X.
♦
Bezeichnung: x, (xn )n∈M , (xn )∞
n=0 (wenn M = N) oder (xn ).
♦
Beispiel 3.2.2.
1. X = R, (xn )n∈N>0
(−1)n
= 2+ n
n∈N>0
2. X = C, (zn )n∈N>0 = 1 + n1 i n∈N .
>0
3. X = R3 , (xn )n∈N>0 = (n, n12 , n1 )
.
n∈N>0
.
4. X als Menge aller Polynome auf [0, 1], (xn )n∈N = (potn )n∈N = (t 7→ t n )n∈N .
Bemerkung 3.2.3. Sei M ⊆ N unbeschränkt. Wir definieren m : N → M iterativ durch
m(0) = min M, m(n + 1) = min M>m(n) . Dann ist m eine streng monoton wachsende, bijektive Abbildung von N auf M. Ist x = (xn )n∈M eine Folge in X, so ist y = x ◦m = (xmn )n∈N , d.h.,
yn = xmn für n ∈ N, eine (umnummerierte) Folge mit Indexmenge N. Ohne Beschränkung
der Allgemeinheit bräuchte man damit nur Folgen mit Indexmenge N betrachten.
♦
3.2.2 Grenzwerte
Sei (X, ρ) ein metrischer Raum, M ⊆ N unbeschränkt und (xn )n∈M eine Folge in X.
Definition 3.2.4. Der Punkt a ∈ X heißt Grenzwert der Folge (xn )n∈M , wenn für jede Umgebung U von a eine Zahl N ∈ M existiert, so daß xn ∈ U für alle n ∈ M≥N :
∀ Umg. U von a ∃N ∈ M∀n ∈ M≥N : xn ∈ U .
Man sagt dann auch, daß die Folge (xn )n∈M gegen a konvergiert. Eine Folge heißt divergent,
wenn sie nicht konvergiert.
♦
n→∞
Bezeichnung: a = lim x, a = limn→∞ xn , xn −→ a, xn → a für n → ∞, manchmal limn→∞ xn =
x∞ .
Bemerkung 3.2.5. a = lim x ist äquivalent zu:
∀ε > 0∃N ∈ N∀n ∈ M≥N : xn ∈ B(a, ε) .
♦
47
3 Grenzwerttheorie
Warnung! Definition 3.2.4 bedeutet nicht (nur), daß in jeder beliebigen Umgebung von
a unendlich viele Glieder der Folge liegen, sondern Definition 3.2.4 besagt: Alle (bis auf
endlich viele) Glieder der Folge (xn )n∈M liegen in U.
n→∞
n→∞
Satz 3.2.6 (Eindeutigkeit des Grenzwertes). Wenn xn −→ a und xn −→ b, dann a = b.
Beweis. Indirekt. Angenommen, es gilt a 6= b. Dann gilt ε := ρ(a, b) > 0. Die Kugeln
Ka = B(a, ε3 ) und Kb = B(b, ε3 ) sind Umgebungen von a bzw. b. Damit existieren Na und Nb
mit
∀n ∈ M≥Na : xn ∈ Ka und ∀n ∈ M≥Nb : xn ∈ Kb .
Sei N = max{Na , Nb }. Für n ∈ M≥N erhalten wir den Widerspruch
0 < ε = ρ(a, b) ≤ ρ(a, xn ) + ρ(xn , b) <
ε ε
+ <ε.
3 3
Satz 3.2.7. Der Punkt a ∈ X ist genau dann Grenzwert der Folge (xn )n∈M , wenn der Abstand ρ(xn , a) in R gegen 0 konvergiert:
a = lim x
⇔
lim ρ(xn , a) = 0 .
n→∞
Beweis. ÜA.
3.2.3 Beschränkte Mengen
Definition 3.2.8. Eine Teilmenge A eines metrischen Raumes (X, ρ) heißt beschränkt, wenn
es eine Kugel gibt, die A enthält:
∃x0 ∈ X∃r > 0 : A ⊆ B(x0 , r) .
♦
Satz 3.2.9. Sei (X, ρ) ein metrischer Raum und sei (xn )n∈M eine konvergente Folge in X.
Dann ist {xn : n ∈ M} eine beschränkte Menge.
Beweis. Zu zeigen ist die Existenz einer Kugel K in X mit xn ∈ K für alle n ∈ M. Aus der
Konvergenz folgt die Existenz des Grenzwertes x∞ . Es existiert ein N mit xn ∈ B(x∞ , 1) für
alle n ∈ M≥N . Sei
r = 1 + max{ρ(xn , x∞ ) : n ∈ M<N } .
Dann xn ∈ B(x∞ , r) für alle n ∈ M.
Ist {xn : n ∈ M} eine beschränkte Menge, so nennen wir (xn )n∈M eine beschränkte Folge.
48
3.2 Folgen und Grenzwerte von Folgen
3.2.4 Teilfolgen
Definition 3.2.10. Sei x = (xn )n∈M ein Folge in einem metrischen Raum (X, ρ). Sei n =
(nk )k∈N eine streng monoton wachsende Folge von Zahlen aus M, d.h., nk+1 > nk für k ∈ N.
Dann heißt
x ◦ n = (xnk )k∈N
♦
Teilfolge von x.
Selbstverständlich gibt es viele Möglichkeiten, aus einer gegebenen Folge Teilfolgen auszuwählen.
Satz 3.2.11. Sei (xn )n∈M eine konvergente Folge im metrischen Raum (X, ρ) mit Grenzwert
x∞ . Dann ist jede ihrer Teilfolgen konvergent mit dem Grenzwert x∞ .
Beweis. Sei (xnk )k∈N beliebige Teilfolge von (xn )n∈M . Sei ε > 0 beliebig. Dann existiert
ein N ∈ M mit xn ∈ B(x∞ , ε) für alle n ∈ M≥N . Da {nk : k ∈ N} nicht von oben beschränkt
ist, existiert ein K ∈ N mit nk ≥ N für alle k ≥ K. Damit xnk ∈ B(x∞ , ε) für alle k ≥ K.
Bemerkung 3.2.12. Die Konvergenz der Ausgangsfolge ist wesentlich. Für divergente Folgen ist alles möglich: Sei X = R, (xn )n∈N = ((−1)n )n∈N . (x5n )n∈N ist divergent, (x2n )n∈N
ist konvergent gegen 1 und (x2n+1 )n∈N ist konvergent gegen −1.
Die Folge (xn )n∈N = n2 n∈N besitzt keine konvergenten Teilfolgen.
♦
3.2.5 Zahlenfolgen
Zahlenfolgen sind Folgen in X = R oder X = C.
Beispiel 3.2.13. Sei X = R.
1. Sei xn = n1 für n ∈ N>0 . Vermutung xn → 0 für n → ∞. Sei dazu ε > 0 beliebig. Wir
haben |xn −0| < ε für alle n ab einem geeigneten N zu zeigen. Wegen |xn −0| = |xn | =
1
1
n benötigen wir N ∈ N mit n > ε für n ≥ N. Wir können daher N ∈ N> 1 wählen.
ε
n
2. Sei xn = 2 + (−1)
n für n ∈ N>0 . Vermutung xn → 2 für n → ∞. Sei dazu ε > 0 beliebig.
Zu zeigen ist die Existenz eines N ∈ N>0 mit |xn − 2| < ε für n ≥ N. Damit ist ein
N ∈ N zu finden mit |xn − 2| = 1n < ε für alle n ≥ N. Wähle N ∈ N> 1 .
ε
3. Sei xn = (−1)n . Die Folge ist divergent.
♦
49
3 Grenzwerttheorie
3.3 Eigenschaften des Grenzwertes
3.3.1 Reelle Folgen
Sei X = R.
Lemma 3.3.1. Sei (xn )n∈N eine konvergente Folge in R mit Grenzwert x∞ .
1. Sei p < x∞ . Dann existiert ein N ∈ N mit xn > p für n ≥ N.
2. Sei q > x∞ . Dann existiert ein N ∈ N mit xn < q für n ≥ N.
Beweis. Setze ε = x∞ − p. Dann ε > 0 und es existiert ein N ∈ N mit x∞ − ε = p < xn <
x∞ + ε. Analog wird die zweite Aussage bewiesen.
Folgerung 3.3.2. Falls x∞ > 0, dann sind alle Folgenglieder (bis auf endlich viele) positiv.
Lemma 3.3.3 (Grenzübergang in Ungleichungen). Seien (xn )n∈N und (yn )n∈N konvergente Folgen in R mit Grenzwert x∞ bzw. y∞ . Existiert ein N ∈ N mit xn ≤ yn für n ≥ N, dann
gilt x∞ ≤ y∞ .
∞
Beweis. Indirekt. Angenommen, es gilt x∞ > y∞ . Sei p = q = x∞ +y
2 . Wenden wir die erste
Aussage von Lemma 3.3.1 auf (xn )n∈N und die zweite Aussage auf (yn )n∈N an, erhalten wir
die Existenz eines N ∈ N mit yn < q = p < xn für alle n ≥ N. Dies steht in Widerspruch zur
Voraussetzung.
Bemerkung 3.3.4. Selbst wenn ab einer Stelle N die strenge Ungleichung xn < yn gilt, kann
1
man lediglich x∞ ≤ y∞ folgern: Wähle z.B. xn = 0, yn = n+1
.
♦
Satz 3.3.5 (Prinzip der zwei Milizionäre). Seien Folgen (xn )n∈N , (yn )n∈N und (zn )n∈N in
R gegeben. Es gelte
a) (xn )n∈N und (zn )n∈N konvergieren gegen a.
b) Es existiert ein N0 mit xn ≤ yn ≤ zn für alle n ≥ N0 .
Dann konvergiert auch (yn )n∈N gegen a.
Beweis. Sei ε > 0 beliebig. Es existiert ein N ∈ N≥N0 mit a − ε < xn < a + ε und a − ε <
zn < a + ε für n ≥ N. Damit gilt
a − ε < xn ≤ yn ≤ zn < a + ε
für alle n ≥ N, d.h., wir haben |yn − a| < ε für n ≥ N.
Folgerung 3.3.6. Sei 0 ≤ yn ≤ zn und zn → 0. Dann yn → 0.
50
3.3 Eigenschaften des Grenzwertes
Definition 3.3.7. Sei (xn )n∈N eine Folge in R. Gilt
∀K > 0∃N ∈ N∀n ≥ N :
xn ≥ K ,
so nennt man die Folge divergent gegen +∞ oder (uneigentlich) konvergent gegen +∞.
Gilt
∀K > 0∃N ∈ N∀n ≥ N : xn ≤ −K ,
so nennt man die Folge divergent gegen −∞ oder (uneigentlich) konvergent gegen −∞.
♦
In beiden Fällen heißt x bestimmt divergent.
Bemerkung 3.3.8. Satz 3.2.11, Lemma 3.3.3 und Lemma 3.3.5 gelten auch für lim xn = a
mit a = +∞ oder a = −∞.
♦
3.3.2 Folgen in R p
Lemma 3.3.9. Sei x = (x1 , . . . , x p ) ∈ R p . Dann gilt
∀i ∈ {1, . . . , p} : |xi | ≤ kxk ≤ |x1 | + · · · + |x p | .
Beweis. Es gilt xi
2
p
kxk2 =
p
≤ ∑k=1
xk
2
∑ xk ≤
k=1
2
p
und somit |xi | ≤ kxk. Weiter gilt
2
∑ xk + 2
k=1
p
∑
2
|xk | · |xl | = |x1 | + · · · + |x p | .
k=1,l<k
Satz 3.3.10. Für die Konvergenz einer Folge (xn )n∈N in R p zu einem Punkt x∞ ist hinreii für jedes i ∈ {1, . . . , p}.
chend und notwendig, daß xni → x∞
Beweis. Notwendigkeit. Sei xn → x∞ . Sei i ∈ {1, . . . , p} beliebig. Dann gilt
i
|xni − x∞
| ≤ kxn − x∞ k .
i | → 0 mit Satz 3.3.5, d.h., (xi )
Wegen kxn − x∞ k → 0 folgt |xni − x∞
n n∈N konvergiert.
i konvergieHinlänglichkeit. Für alle i ∈ {1, . . . , p} mögen jetzt die Folgen (xni )n∈N gegen x∞
ren. Sei ε > 0. Dann existiert ein N ∈ N mit
∀i ∈ {1, . . . , p}∀n ≥ N :
i
|xni − x∞
|<
ε
.
p
Damit gilt
1
kxn − x∞ k ≤ |xn1 − x∞
| + · · · + |xnp − x∞p | < ε
für n ≥ N.
51
3 Grenzwerttheorie
3.3.3 Rechnen mit konvergenten Zahlenfolgen
Satz 3.3.11. Sei X ∈ {R, C} und es seien x = (xn )n∈N und y = (yn )n∈N konvergente Folgen
in X. Dann gilt:
1. lim(λ x) = λ lim x für λ ∈ X.
2. lim(x + y) = lim x + lim y.
3. lim(xy) = lim x · lim y.
4. Falls lim y 6= 0, dann lim xy =
lim x
lim y .
Wir wollen nur 4. beweisen. Dazu benötigen wir das folgende Lemma:
Lemma 3.3.12. Wenn lim y 6= 0, dann ist { |y1n | : n ∈ N ∧ yn 6= 0} beschränkt.
Beweis. Sei y∞ = lim y. Aus y∞ 6= 0 folgt |y2∞ | = ε > 0. Damit existiert ein N ∈ N mit
yn ∈ B(y∞ , ε) für n ≥ N, also |yn − y∞ | < |y2∞ | für n ≥ N. Damit gilt yn ∈ ]y∞ − |y2∞ | , y∞ + |y2∞ | [,
d.h., |yn | ≥ |y2∞ | und deswegen |y1n | ≤ |y2∞ | für n ≥ N.
Beweis. (Von Satz 3.3.11, 4.). Sei yn → y∞ 6= 0. Nach Lemma 3.3.12 existieren C ∈ R>0
und N ∈ N mit 1/|yn | ≤ C für n ≥ N. Für n ≥ N gilt
|
1
C
xn x∞
− |=|
(y∞ xn − x∞ yn )| ≤
|y∞ xn − x∞ yn | .
yn y∞
yn y∞
|y∞ |
Nach den ersten beiden Aussagen des Satzes konvergiert y∞ xn − x∞ yn gegen 0. Mit Lemma
3.3.5 folgt | xynn − yx∞∞ | → 0, d.h., xynn → xy∞∞ .
3.3.4 Monotone Folgen reeller Zahlen
Sei X = R.
Definition 3.3.13. Die Folge x = (xn )n∈N heißt monoton wachsend (im weiteren Sinne)
oder monoton nichtfallend (in Zeichen xn ↑), wenn xn+1 ≥ xn für alle n ∈ N. Analog werden
streng monoton wachsend, monoton fallend (in Zeichen xn ↓) und streng monoton fallend
definiert.
♦
Satz 3.3.14 (Monotone Folgen). Sei (xn )n∈N eine monoton wachsende Folge.
1. Wenn x[N] = {xn : n ∈ N} von oben beschränkt ist, dann besitzt sie einen (endlichen)
Grenzwert.
2. Wenn x[N] = {xn : n ∈ N} nicht von oben beschränkt ist, dann xn → ∞.
52
3.3 Eigenschaften des Grenzwertes
Beweis. 1. Die Menge x[N] = {xn : n ∈ N} ist nach Voraussetzung von oben beschränkt
und besitzt somit nach Vollständigkeitsaxiom ein Supremum M ∗ = sup x[N]. Wir vermuten
xn → M ∗ . Dazu sei ε > 0 beliebig. Die Zahl M ∗ − ε ist keine obere Schranke von x[N], d.h.,
es existiert ein N ∈ N mit M ∗ − ε < xN ≤ M ∗ . Wenn n ≥ N, dann M ∗ − ε < xN ≤ xn ≤ M ∗ ,
also |xn − M ∗ | < ε für n ≥ N.
2. Sei K > 0 beliebig. Da x[N] nicht von oben beschränkt ist, existiert ein N ∈ N mit
xn ≥ xN ≥ K für n ≥ N. Dies bedeutet aber xn → ∞.
Bemerkung 3.3.15.
1. lim xn = sup x[N] für jede monoton wachsende Folge x. (Falls x nach oben unbeschränkt ist, vereinbaren wir sup x[N] = ∞.)
2. lim xn = inf x[N] für jede monoton fallende Folge x. (Falls x nach unten unbeschränkt
ist, vereinbaren wir inf x[N] = −∞.)
3. Der Satz ist eine reine Existenzaussage für den Grenzwert (ohne ihn berechnet zu
haben oder ihn zu kennen).
4. xn % x∞ bedeutet xn ↑ und xn → x∞ . xn % ∞ bedeutet xn ↓ und x unbeschränkt.
♦
Satz 3.3.16 (Theorem of the two meeting sequences). Seien x = (xn )n∈N und y = (yn )n∈N
zwei reelle Folgen mit xn ↑ und yn ↓. Es gelte
1. xn ≤ yn mindestens ab einem Index N ∈ N.
2. yn − xn → 0.
Dann existiert ein c ∈ R mit xn % c und yn & c.
Beweis. Wegen der Monotonie von x und 1. ist x[N] von oben beschränkt. Satz 3.3.14
impliziert die Existenz von x∞ = limn→∞ xn . Analog zeigt man die Konvergenz von y gegen
ein y∞ ∈ R. Damit konvergiert x − y gegen x∞ − y∞ . Nach 2. ist x∞ − y∞ = 0, also c = x∞ =
y∞ .
3.3.5 Die Zahl e
Als Anwendung von Satz 3.3.14 zeigen wir die Existenz einer speziellen Zahl.
Wir zeigen zuerst die Konvergenz von
1
yn = 1 +
n
n+1
.
53
3 Grenzwerttheorie
Offensichtlich gilt yn ≥ 1 für alle n ≥ 1. Damit ist y von unten beschränkt. Wir zeigen nun,
daß y nichtwachsend ist:
1 n
1 + n−1
yn−1
=
n+1 =
yn
1 + n1
n−1+1 n
n2n+1
n−1
=
n+1 n+1
(n − 1)n (n + 1)n+1
n
2 n+1
n−1
n
(n − 1)n2n+2
n+1
n−1
1
=
1+ 2
=
=
n
n2 − 1
n
n −1
n [(n − 1)(n + 1)]n+1
1
n−1
1
n−1 n
n−1
1 + (n + 1) 2
=
1+
=
>
n
n −1
n
n−1
n n−1
= 1,
daß heißt yn < yn−1 für alle n ≥ 2. Nach Satz 3.3.14 konvergiert y von oben gegen ein
y∞ ∈ R.
Nun zeigen wir die Konvergenz von
1
xn = 1 +
n
n
.
Offensichtlich gilt xn = yn 1+1 1 . Der erste Faktor konvergiert gegen y∞ , der zweite gegen 1.
n
Nach Satz 3.3.11 konvergiert xn auch gegen y∞ .
n Definition 3.3.17. Der Grenzwert der Folge 1 + 1n
n∈N≥1
wird mit e bezeichnet (Eu-
lersche Zahl),
e = lim
n→∞
1
1+
n
n
≈ 2.718281828459045 .
♦
3.3.6 Weitere wichtige Beispiele für Grenzwerte
1. Es gilt
1
=0
lim √
p
n→∞ n
für p > 0 .
Beweis. Sei ε > 0 gegeben. Da 1n → 0, existiert ein n0 ∈ N>0 mit
n ∈ N≥n0 . Damit gilt √p1n < ε für alle n ∈ N≥n0 .
2. Es gilt
1
=0
n→∞ ns
lim
54
für s ∈ Q>0 .
1
n
< ε p für alle
3.3 Eigenschaften des Grenzwertes
Beweis. Sei s = q/p mit p, q ∈ N>0 . Dann gilt
1
1
√
= √
q →0
p q
p
( n)
n
nach 1. und Produktregel.
3. Es gilt
lim
√
n
n→∞
a=1
für a > 0 .
Beweis. Fallunterscheidung. a = 1 ist trivial.
√
Sei a > 1. Setze xn := n a − 1 ≥ 0. Dann gilt
a = (1 + xn )n ≥ 1 + nxn .
Weiter gilt
0 ≤ xn <
a
→0
n
und mit Satz 3.3.5 folgt xn → 0.
Sei a < 1. Es gilt
mit
1
a
√
1
n
a= p
n
1/a
> 1.
4. Es gilt
lim |q|n = 0
n→∞
für q ∈ C mit |q| < 1 .
Beweis. Der Fall q = 0 ist trivial. Sei q 6= 0 und a := 1−|q|
|q| > 0. Dann gilt |q| =
Damit
1
1
1
0 ≤ |qn − 0| = |q|n =
≤
<
→ 0.
n
(1 + a)
1 + na na
5. Es gilt
lim
n→∞
1
1+a .
√
n
n = 1.
Beweis. ÜA.
6. Es gilt
nk
=0
n→∞ zn
lim
für k ∈ N,
z ∈ Cmit |z| > 1 .
Beweis. ÜA. (etwas schwieriger).
55
3 Grenzwerttheorie
3.3.7 Der Intervallschachtelungssatz und der Satz von
Bolzano-Weierstraß
Satz 3.3.18 (Intervallschachtelung). Sei ([an , bn ])n∈N eine Folge von abgeschlossenen Intervallen mit folgenden Eigenschaften:
1. ∀n ∈ N :
[an+1 , bn+1 ] ⊆ [an , bn ].
2. bn − an → 0.
Dann besteht der Durchschnitt aller Intervalle aus genau einem Punkt. Dieser ist Grenzwert
der monoton wachsenden Folge a und der monoton fallenden Folge b.
Beweis. 1. Existenz. Mit Satz 3.3.16 folgt die Existenz eines c mit an % c und bn & c. Aus
T
c ∈ [an , bn ] für alle n ∈ N folgt c ∈ n∈N [an , bn ].
2. Seien c, d ∈ n∈N [an , bn ]. Wenden wir Satz 3.3.5 mit der konstanten Folge (d)n∈N als
mittlere Folge an, so folgt d = c.
T
Bemerkung 3.3.19. Abgeschlossenheit der Intervalle ist wesentlich. Es gilt z.B.
\
n∈N>0
1
]0, ] = 0/ .
n
♦
Satz 3.3.20 (Bolzano (1782-1848), Weierstraß (1815-1897)). Jede beschränkte reelle Folge besitzt wenigstens eine konvergente Teilfolge.
Beweis. Sei (xn )n∈N beschränkt. Dann existieren a0 und b0 mit a0 ≤ xn ≤ b0 für alle n ∈ N.
Wir konstruieren eine Folge von ineinander geschachtelten Teilintervallen ([an , bn ])n∈N , die
jeweils unendlich viele Glieder der Folge x enthalten, durch das folgende Verfahren: Sei
[an , bn ] so konstruiert, daß dieses Intervall unendlich viele Glieder der Folge x enthält. Wean +bn
n
nigstens in einem der Teilintervalle [an , an +b
2 ] und [ 2 , bn ] liegen unendlich viele Folgenglieder von x. Sei dann [an+1 , bn+1 ] ein solches Intervall.
Nach Konstruktion gilt bn − an = (b0 − a0 )2−n → 0. Nach Satz 3.3.18 gilt
{c}.
T
n∈N [an , bn ]
=
Wir zeigen nun, daß c Grenzwert einer Teilfolge ist. Dazu konstruieren wir eine streng
monoton wachsende Folge (nk ) in N durch das folgende Verfahren: Sei n0 = 0. Weiter sei
nk+1 > nk gewählt mit xnk+1 ∈ [ak+1 , bk+1 ]. Dann gilt ak ≤ xnk ≤ bk und mit Satz 3.3.5 folgt
xnk → c.
56
3.4 Weitere topologische Begriffe in metrischen Räumen
3.4 Weitere topologische Begriffe in metrischen Räumen
3.4.1 Cauchy-Folgen und Vollständigkeit
Bisher haben wir eine Zahl als Grenzwert vermutet und dann gezeigt, daß sie tatsächlich
Grenzwert ist.
Kann man einer Folge x ansehen, ob sie einen Grenzwert besitzt oder nicht?
Definition 3.4.1. Sei (X, d) ein metrischer Raum. Eine Folge (xn )n∈N in X heißt CauchyFolge, Fundamentalfolge oder in sich konvergente Folge in (X, d), wenn die CauchyBedingung
∀ε > 0∃N∀m, n ≥ N : d(xn , xm ) < ε
♦
erfüllt ist.
Satz 3.4.2.
1. Jede konvergente Folge ist eine Cauchy-Folge.
2. Jede Cauchy-Folge ist beschränkt.
3. Enthält eine Cauchy-Folge eine konvergente Teilfolge, dann konvergiert die Folge
selbst (und besitzt als Grenzwert den Grenzwert der Teilfolge).
Beweis. Zu 1. Sei ε > 0. Dann existiert ein N > 0 mit d(xn , x∞ ) <
d(xn , xm ) ≤ d(xn , x∞ ) + d(x∞ , xm ) < ε für n, m ≥ N.
ε
2
für n ≥ N. Damit
Zu 2. Wir fixieren ε = 1. Dann gibt es ein N mit d(xn , xm ) < 1 für alle n, m ≥ N. Somit
d(xn , xN ) ≤ 1 für alle n ≥ N. Sei r = 1 + max{d(xk , xN ) : k ∈ N<N }. Dann xn ∈ B(xN , r) für
alle n ∈ N.
Zu 3. Sei (xn )n∈N eine Cauchy-Folge und sei (xnk )k∈N eine konvergente Teilfolge mit xnk →
x∞ . Für jedes ε > 0 existieren N und K mit
∀m, n ≥ N :
d(xn , xm ) <
und
∀k ≥ K :
d(xnk , x∞ ) <
ε
2
ε
.
2
Sei k0 fixiert mit k0 ≥ K und nk0 ≥ N. Dann gilt
∀n ≥ N :
d(xn , x∞ ) ≤ d(xn , xnk0 ) + d(xnk0 , x∞ ) <
ε ε
+ =ε,
2 2
d.h., xn → x∞ .
Es entsteht nun die Frage, ob jede Cauchy-Folge konvergiert. Daß dies im allgemeinen nicht
gilt, zeigt das folgende Beispiel:
57
3 Grenzwerttheorie
Beispiel 3.4.3. Sei X = {x ∈ R2 : (x1 )2 + (x2 )2 < 1} und sei
d(x, y) =
q
(x1 − y1 )2 + (x2 − y2 )2
für x, y ∈ X. Wir betrachten die Folge (xn )n∈N in X definiert durch xn = (0, 1 − n1 ). Sei ε > 0
beliebig und N ∈ N mit N2 < ε. Dann gilt
∀n, m ≥ N :
1 1
2
1 1
d(xn , xm ) = | − | ≤ + ≤ < ε .
n m
n m N
Also ist (xn )n∈N eine Cauchy-Folge. Offensichtlich konvergiert sie aber nicht in X.
♦
Es gibt jedoch auch Situationen, wo die Cauchy-Bedingung hinreichend für Konvergenz ist.
Satz 3.4.4. Eine Folge reeller Zahlen konvergiert (bzgl. der Betragsmetrik) genau dann,
wenn sie eine Cauchy-Folge ist.
Beweis. Wegen Satz 3.4.2 haben wir nur noch die Hinlänglichkeit zu zeigen. Sei dazu x eine
Cauchy-Folge reeller Zahlen. Nach Aussage 2 von Satz 3.4.2 ist x beschränkt. Nach Satz
von Bolzano-Weierstraß (Satz 3.3.20) existiert eine konvergente Teilfolge. Nach Aussage 3
von Satz 3.4.2 konvergiert x.
In vielen Gebieten der Mathematik und ihren Anwendungen sind metrische Räume von
besonderem Interesse, in denen die Cauchy-Bedingung hinreichend für die Konvergenz ist.
Definition 3.4.5. Ein metrischer Raum (X, d) heißt vollständig, wenn in ihm jede CauchyFolge konvergiert. Ein vollständiger, normierter Raum (X, k · k) heißt Banach-Raum. ♦
Nach Satz 3.4.4 ist (R, d) mit d(x, y) = |x − y| ein vollständiger metrischer Raum. Durch
Anwendung von Satz 3.3.10 folgt die Vollständigkeit von (Rn , d) mit d(x, y) = kx − yk und
speziell von (C, d) mit d(x, y) = |x − y|.
Beispiel 3.4.6. Sei dQ : Q × Q → R definiert durch dQ (x, y) = |x − y| für x, y ∈ Q. Der
metrische Raum (Q, dQ ) ist nicht vollständig: Sei x0 = 2 und
1
2
xn+1 =
xn +
2
xn
√
für n ∈ N. Da (xn ) in (R, d) mit d(x, y) = |x − y| gegen 2 konvergiert (Babylonisches
Wurzelziehen), ist (xn ) eine Cauchyfolge in (R, d) und da xn ∈ Q für alle n ∈ N auch in
(Q, dQ ). In (Q, dQ ) konvergiert sie jedoch nicht.
♦
58
3.4 Weitere topologische Begriffe in metrischen Räumen
3.4.2 Banachscher Fixpunktsatz
Sei (X, d) ein metrischer Raum und sei f : X → X. Eine Lösung a der Gleichung x = f (x)
nennen wir Fixpunkt von f . Wir nennen f kontraktiv, wenn ein q ∈ [0, 1[ existiert mit
∀x, y ∈ X :
d( f (x), f (y)) ≤ qd(x, y) .
(3.4.1)
Als Folge der sukzessiven Approximation bezeichnen wir eine Folge (xn )n∈N in X mit
xn+1 = f (xn ) für n ∈ N.
Satz 3.4.7 (Banachscher Fixpunktsatz). Sei (X, d) ein vollständiger metrischer Raum und
sei f : X → X kontraktiv. Dann gelten folgende Aussagen:
1. f hat genau einen Fixpunkt a.
2. Die Folgen der sukzessiven Approximation konvergieren für jedes x0 ∈ X gegen a.
3. Ist q eine Kontraktionskonstante für f , so gilt die Fehlerabschätzung
∀n ∈ N>0 :
d(xn , a) ≤
qn
d(x1 , x0 ) .
1−q
Beweis. Eindeutigkeit: Es seien a und b zwei verschiedene Fixpunkte von f . Aus (3.4.1)
folgt
d(a, b) = d( f (a), f (b)) ≤ qd(a, b)
und damit d(a, b) = 0, das heißt a = b.
Existenz und Konvergenz: Sei x0 ∈ X und xn+1 = f (xn ) für n ∈ N. Dann gilt
∀n ∈ N>0 :
d(xn+1 , xn ) = d( f (xn ), f (xn−1 )) ≤ qd(xn , xn−1 ) .
Induktiv folgt hieraus
∀k ∈ N ∀n ∈ N≥k :
d(xn+1 , xn ) ≤ qn−k d(xk+1 , xk ) .
Für natürliche n > k ≥ 0 ergibt sich
d(xn , xk ) ≤ d(xn , xn−1 ) + d(xn−1 , xn−2 ) + · · · + d(xk+1 , xk )
≤ qn−k−1 + qn−k−2 + · · · + 1 d(xk+1 , xk )
=
1 − qn−k
d(xk+1 , xk ) .
1−q
Mit
d( f (xk ), xk ) = d(xk+1 , xk ) ≤ qk d(x1 , x0 )
(3.4.2)
folgt
∀k ∈ N ∀n ∈ N≥k :
d(xn , xk ) ≤
qk − qn
qk
d(x1 , x0 ) ≤
d(x1 , x0 ) .
1−q
1−q
(3.4.3)
59
3 Grenzwerttheorie
Somit ist (xn )n∈N eine Cauchy-Folge im vollständigen, metrischen Raum X und konvergiert
daher gegen ein a ∈ X. Da ( f (xn ))n∈N eine Teilfolge von (xn )n∈N ist, konvergiert ( f (xn ))n∈N
auch gegen a. Aus
d( f (xn ), f (a)) ≤ qd(xn , a)
folgt daher durch Grenzübergang d(a, f (a)) = 0, d.h. a = f (a).
Fehlerabschätzung: Da die Folge gegen a konvergiert, können wir in (3.4.3) den Grenzübergang n → ∞ durchführen und erhalten die behauptete Abschätzung.
3.4.3 Häufungspunkte und abgeschlossene Mengen
Definition 3.4.8. Sei (X, ρ) ein metrischer Raum, A eine Teilmenge von X und x0 ein Element von X. Der Punkt x0 heißt
• äußerer Punkt von A, wenn x0 innerer Punkt von X \ A ist;
• Randpunkt von A, wenn x0 weder innerer noch äußerer Punkt von A ist;
• Berührungspunkt von A, wenn für jede Umgebung U von x0 stets U ∩ A 6= 0/ gilt;
• Häufungspunkt von A, wenn für jede Umgebung U von x0 stets (U ∩ A) \ {x0 } 6= 0;
/
• isolierter Punkt von A, wenn es eine Umgebung U von x0 gibt mit U ∩ A = {x0 }. ♦
Bemerkung 3.4.9. Eine Umgebung um x0 kann stets durch eine offene Kugel um x0 ersetzt
werden.
1. Randpunkt: Für jede Umgebung U von x0 gilt U ∩ A 6= 0/ und U ∩ (X \ A) 6= 0,
/ das
heißt in Umgebung von x0 liegen sowohl Punkte von A als auch vom Komplement
von A.
2. Berührungspunkt: Es sind x0 ∈ A und x0 6∈ A möglich. Jeder Punkt von A ist Berührungspunkt von A.
3. Häufungspunkt: Jede Umgebung U von x0 enthält wenigstens einen von x0 verschiedenen Punkt von A. Jeder Häufungspunkt von A ist Berührungspunkt von A, aber nicht
jeder Berührungspunkt von A ist Häufungspunkt von A. Sei A = ]0, 1[ ∪ {2}. Dann ist
2 Berührungspunkt von A aber nicht Häufungspunkt von A. 1 ist Häufungspunkt von
A, gehört aber nicht zu A. 12 ist Häufungspunkt von A und gehört zu A.
4. Isolierter Punkt: Ein isolierter Punkt von A gehört stets zu A.
♦
Definition 3.4.10. Die Menge aller inneren Punkte von A heißt offener Kern oder Inneres
◦
von A und wird mit A bezeichnet. Die Menge aller Berührungspunkte von A heißt abgeschlossene Hülle oder Abschließung von A und wird mit Ā bezeichnet.
♦
60
3.4 Weitere topologische Begriffe in metrischen Räumen
Definition 3.4.11. Eine Menge A ⊆ X heißt abgeschlossen, wenn A = Ā.
♦
Wegen A ⊆ Ā, bedeutet Abgeschlossenheit einer Menge A: Ā ⊆ A, d.h., A enthält alle Berührungspunkte. Es gilt
A = A.
Beispiel 3.4.12. 1) A = [0, 1[ ∪ ]1, 2], dann Ā = [0, 2].
2) A = [0, 1[ ∪ {2}, dann Ā = [0, 1] ∪ {2}.
In beiden Fällen ist A weder abgeschlossen noch offen.
♦
Bemerkung 3.4.13. Die Mengen 0/ und X sind stets abgeschlossene und offene Teilmengen
des metrischen Raumes (X, ρ).
♦
Lemma 3.4.14 (Charakterisierung von Häufungspunkten). Sei (X, ρ) ein metrischer Raum,
A ⊆ X, x0 ∈ X. Dann
x0 ist HP von A
⇐⇒
∃(an ) in A \ {x0 } : an → x0 .
Beweis. =⇒ Sei x0 Häufungspunkt von A. Es gilt
1
A ∩ B(x0 , ) \ {x0 } 6= 0/ .
n
Damit existiert für jedes n ein an ∈ A \ {x0 } mit an ∈ B(x0 , n1 ). Sei ε > 0 beliebig und
N ∈ N≥ 1 . Dann
ε
1
∀n ≥ N : |x0 − an | < ≤ ε ,
n
das heißt an → x0 .
⇐= Sei (an ) eine Folge aus A \ {x0 } mit an → x0 . Sei U eine beliebige Umgebung von x0 .
O.B.d.A. sei U = B(x0 , ε) mit ε > 0. Wegen an → x0 gibt es ein N mit an ∈ B(x0 , ε) für
n ≥ N. Wegen an ∈ A \ {x0 } gilt
an ∈ (B(x0 , ε) ∩ A) \ {x0 },
das heißt x0 ist HP von A.
Bemerkung 3.4.15. In einer Umgebung eines HP x0 von A liegen sogar unendlich viele
Punkte von A.
♦
Lemma 3.4.16 (Charakterisierung von Berührungspunkten). Sei (X, ρ) ein metrischer
Raum, A ⊆ X, x0 ∈ X. Dann
x0 ist BP von A
⇐⇒
∃(an ) in A : an → x0 .
61
3 Grenzwerttheorie
Hier ist also an = x0 nicht ausgeschlossen, z.B. falls x0 isolierter Punkt von A ist.
Beweis. ÜA
Lemma 3.4.17 (Charakterisierung abgeschlossener Mengen). Sei (X, ρ) ein metrischer
Raum und A ⊆ X. Folgende Aussagen sind äquivalent:
1. A ist abgeschlossen, das heißt A = Ā.
2. Das Komplement X \ A von A ist offen.
3. Ist (an )n∈N eine Folge in A, die in X gegen a∞ konvergiert, dann gilt a∞ ∈ A.
Beweis. 1. ⇒ 2.: Sei b ∈ X \ A beliebig. Dann ist (wegen A = Ā) b 6∈ Ā, also ist b kein BP
von A. Letzteres heißt, es gibt eine Umgebung U von b mit U ∩ A = 0.
/ Diese Umgebung U
von b ist also in X \ A. Damit ist X \ A offen.
2. ⇒ 3.: Sei (an )n∈N eine Folge in A, die in X gegen a∞ konvergiert. Indirekt: Sei a∞ 6∈ A,
dann a∞ ∈ X \ A. Da X \ A offen ist, ist a∞ innerer Punkt von X \ A. Damit existiert ein ε > 0
mit B(a∞ , ε) ⊆ X \A. Wegen der Konvergenz von (an ) gibt es ein N mit an ∈ A∩B(x0 , ε) = 0/
für alle n ≥ N. Damit wurde ein Widerspruch erhalten.
3. ⇒ 1.: Da stets A ⊆ Ā gilt, brauchen wir nur noch Ā ⊆ A zu zeigen. Sei a∞ ∈ Ā beliebig,
d.h., sei a∞ ein BP von A. Nach Lemma 3.4.16 existiert eine Folge (an )n∈N in A mit an → a∞ .
Nach Voraussetzung ist a∞ ∈ A, also Ā ⊆ A.
3.4.4 Kompaktheit
Sei (X, d) ein metrischer Raum.
Definition 3.4.18. Ein Mengensystem {Oi ⊆ X : i ∈ I} heißt Überdeckung der Menge K ⊆
S
X, wenn K ⊆ i∈I Oi . Die Überdeckung heißt offen, wenn alle Oi offen sind. Ein Teilsystem
einer Überdeckung heißt endliche Teilüberdeckung, wenn sie eine Überdeckung ist und nur
aus endlich vielen Mengen besteht.
♦
Definition 3.4.19. Eine Teilmenge K von X heißt kompakt, falls jede offene Überdeckung
von K eine endliche Teilüberdeckung besitzt. Eine Teilmenge K von X heißt folgenkompakt, falls jede Folge in K eine in K konvergente Teilfolge besitzt.
♦
Beispiel 3.4.20. 1. Sei (xn )n∈N eine konvergente Folge in (X, d) mit Grenzwert x∞ . Dann
ist K = {xn : n ∈ N} ∪ {x∞ } kompakt: Es sei {Oi ⊆ X : i ∈ I} eine offene Überdeckung von
K. Dann gibt es ein i∞ ∈ I mit x∞ ∈ Oi∞ und ein N ∈ N mit xn ∈ Oi∞ für n ≥ N. Für n < N
S
gibt es Indizes in mit xn ∈ Oin für n < N. Damit K ⊂ n<N Oin ∪ Oi∞ .
2. Die Menge der natürlichen Zahlen ist nicht kompakt in R: Sei On = ]n − 13 , n + 31 [ für
n ∈ N. Dann ist {On : n ∈ N} eine offene Überdeckung von N, die keine endliche Teilüberdeckung besitzt.
♦
62
3.5 Exkurs: Konstruktion reeller Zahlen
Lemma 3.4.21. Jede folgenkompakte Menge K ⊆ X ist abgeschlossen und beschränkt.
Beweis. Sei K folgenkompakt und sei x∞ ein beliebiger Berührungspunkt von K. Nach
Lemma 3.4.16 existiert eine Folge (xn )n∈N in K mit Grenzwert x∞ . Damit gibt es eine in K
konvergente Teilfolge. Da die Folge selbst konvergiert, liegt ihr Grenzwert x∞ in K. Somit
enthält K alle Berührungspunkte, ist also abgeschlossen.
Angenommen, K ist folgenkompakt und unbeschränkt. Sei x0 ∈ K fixiert. Wir konstruieren
eine Folge (xn )n∈N durch die Eigenschaft, daß xn+1 ∈ K so gewählt sei, daß d(xn+1 , x0 ) >
1 + d(xn , x0 ). Dann gilt d(xn , xm ) > 1 für alle n, m ∈ N mit n 6= m, d.h., es kann keine
konvergente Teilfolge geben.
Satz 3.4.22. Eine Teilmenge des Rn ist genau dann folgenkompakt, wenn sie abgeschlossen
und beschränkt ist.
Beweis. Sei K eine folgenkompakte Teilmenge von Rn . Nach Lemma 3.4.21 ist K abgeschlossen und beschränkt. Sei nun K abgeschlossen und beschränkt. Sei (xn ) eine beliebige
Folge in K. Nach Satz 3.3.10 und dem Satz von Bolzano-Weierstraß (Satz 3.3.20) existiert
eine in Rn konvergente Teilfolge gegen ein x∞ ∈ RN . Nach Lemma 3.4.16 ist x∞ Berührungspunkt von K, gehört wegen der Abgeschlossenheit von K also zu K. Damit hat (xn )
eine in K konvergente Teilfolge und K ist folgenkompakt.
Satz 3.4.23. Eine Teilmenge K eines metrischen Raumes (X, d) ist genau dann kompakt,
wenn sie folgenkompakt ist.
Beweis. Siehe z.B. Amann-Escher.
Als Folgerung aus den Sätzen 3.4.22 und 3.4.23 erhalten wir:
Satz 3.4.24 (Heine-Borel). Eine Teilmenge des Rn ist genau dann kompakt, wenn sie abgeschlossen und beschränkt ist.
3.5 Exkurs: Konstruktion reeller Zahlen
Im Folgenden geben wir nur die Grundideen an. Zum genaueren Nachlesen (auch der fehlenden Beweise) sei auf das Springerlehrbuch „Zahlen“ von Ebbinghaus et al. verwiesen.
3.5.1 Dedekind-Schnitte
Definition 3.5.1. Ein Dedekindscher Schnitt ist ein Paar (A, B) =: A|B von Teilmengen A
(„Untermenge“) und B („Obermenge“) von Q mit folgenden Eigenschaften:
1. A ∩ B = 0,
/ A ∪ B = Q, A 6= 0,
/ B 6= 0.
/
63
3 Grenzwerttheorie
2. ∀a ∈ A ∀b ∈ b : a ≤ b.
♦
3. B hat kein Minimum.
Definition 3.5.2. Die Menge R ist die Menge aller Dedekindschen Schnitte.
♦
Jede rationale Zahl s bestimmt den Schnitt A|B mit A = {r ∈ Q : r ≤ s} und B = Q \ A. In
diesem Sinne sind die rationalen Zahlen in R enthalten.
Die Addition und die Ordungsrelation werden wie folgt definiert:
A|B +C|D := E|F
mit
E = {r + s : r ∈ A, s ∈ C} , F = Q \ E
und
A|B ≤ C|D
:⇐⇒
A ⊆C.
Sind A|B ≥ 0 und C|D ≥ 0 so definiert man
A|B ·C|D := E|F
mit
E = {rs : r ∈ A, s ∈ C} , F = Q \ E .
Man kann nun nachweisen, daß die so konstruierten reellen Zahlen (R, +, ·, ≤) den Axiomen des total angeordneten Körpers und dem Vollständigkeitsaxiom genügen.
3.5.2 Fundamentalfolgen
Definition 3.5.3. Eine rationale Folge (rn )n∈N heißt Nullfolge, wenn limn→∞ rn = 0. Eine
rationale Folge (rn )n∈N heißt positiv, wenn ein ε > 0 existiert mit rn ≥ ε für alle (bis auf
endliche viele) n ∈ N.
♦
Zunächst bemerkt man, daß nach Satz 3.3.11 Summe und Produkt von rationalen Nullfolgen
wieder rationale Nullfolgen sind.
Sei F die Menge aller rationalen Fundamentalfolgen (Cauchy-Folgen). Auf F führen wir
eine Äquivalenzrelation N ein durch
r ∼N s
:⇐⇒
r − s ist Nullfolge.
Nach Cantor definiert man nun
R := F/N ,
d.h., eine reelle Zahl ist eine Äquivalenzklasse [r]N von Cauchy-Folgen rationaler Zahlen.
Addition und Multiplikation werden definiert durch
[r]N + [s]N := [r + s]N ,
64
[r]N · [s]N := [rs]N .
3.5 Exkurs: Konstruktion reeller Zahlen
Nullelement und Einselement sind [(0)n∈N ]N und [(1)n∈N ]N . Eine rationale Zahl r wird mit
der Restklasse [(r)n∈N ]N identifiziert.
Sei P die Menge aller positiven rationalen Fundamentalfolgen. Damit definieren wir
[r]N < [s]N
:⇐⇒
s−r ∈ P
und
[r]N ≤ [s]N
:⇐⇒
[r]N < [s]N ∨ [r]N = [s]N .
Man kann nun wieder zeigen, daß (R, +, ·, ≤) den Axiomen des total angeordneten Körpers
und dem Vollständigkeitsaxiom genügt.
Diese Idee der Vervollständigung der rationalen Zahlen zu den reellen Zahlen kann auch
allgemein zur Vervollständigung metrischer Räume verwandt werden.
Spezielle Repräsentaten (d.h., Cauchy-Folgen rationaler Zahlen) für reelle Zahlen stellen
Dezimalbrüche dar: Sei b ∈ N≥2 und sei (an ) ein Folge in Z mit an ∈ {0, . . . , b − 1} für
n ≥ 1. Damit definieren wir die Folge (rn )n∈N durch
n
rn = ∑ ai b−i
n
für a0 ≥ 0
rn = a0 − ∑ ai b−i
und
i=0
für a0 < 0 .
i=1
Offensichtlich ist dann (rn ) eine Cauchy-Folge und somit Repräsentant für eine reelle Zahl.
Sei nun noch
m
|a0 | = ∑ ci bi ,
i=0
so enthält das Symbol
cm · · · c0 .a1 · · · an
für a0 ≥ 0
und
− cm · · · c0 .a1 · · · an
für a0 < 0
bei fixiertem b die volle Information über rn , kann daher mit rn identifiziert werden, und
heißt b-adische Entwicklung von rn . b heißt Basis des Zahlensystems. Wichtige Spezialfälle sind b = 10 und b = 2, für die wir die Darstellung als endliche Dezimalbrüche bzw.
endliche Dualbrüche erhalten.
Beispiel 3.5.4. Die Folge (1, 1.4, 1.41, 1.414,
√ 1.4142, . . .) ist (bei b = 10 und bei entsprechender Fortsetzung) ein Repräsentant für 2.
♦
Eine (unendlicher) Dezimalbruch ist somit als Folge endlicher Dezimalbrüche zu interpretieren.
3.5.3 Intervallschachtelungen
Definition 3.5.5. Eine rationale Intervallschachtelung (In )n ist eine Folge abgeschlossener, rationaler Intervalle [rn , sn ] = {x ∈ Q : rn ≤ x ≤ sn } mit rn , sn ∈ Q, In+1 ⊆ In und
65
3 Grenzwerttheorie
limn→∞ (sn − rn ) = 0. Eine Intervallschachtelung (Jn ) heißt feiner als eine Intervallschachtelung (In ), wenn Jn ⊆ In für alle n ∈ N. Man nennt (In ) und (Jn ) äquivalent, wenn es eine
Intervallschachtelung (Kn ) gibt, die feiner als (In ) und (Jn ) ist. Als reelle Zahlen definiert
man nun die dadurch entstehenden Äquivalenzklassen von Intervallschachtelungen.
♦
Beispiel 3.5.6. Sei In = [(1 + 1n )n , (1 + n1 )n+1 ]. Dann ist In eine Intervallschachtelung und
sie ist ein Representant der reellen Zahl e.
♦
3.6 Endliche und unendliche Mengen
3.6.1 Endliche Mengen
Lemma 3.6.1. Jede injektive Selbstabbildung ψ : N<n → N<n ist bijektiv.
Beweis. (durch vollständige Induktion). Offensichtlich gilt die Behauptung für n = 0 und
n = 1. Sei die Behauptung richtig für n ∈ N und sei ψ : N<n+1 → N<n+1 eine Injektion. Sei
k = ψ(n). Betrachte nun


n für j = k
γ( j) := k für j = n und κ := γ ◦ ψ .


j sonst
Dann ist γ bijektiv
und somit κ mindestens injektiv. Es gilt κ(n) = γ(ψ(n)) = γ(k) = n.
Somit ist κ N<n : N<n → N<n eine Injektion, welche nach Induktionsvoraussetzung eine
Surjektion ist. Damit ist κ eine Bijektion von N<n+1 auf N<n+1 . Folglich ist γ −1 ◦ κ =
γ −1 ◦ γ ◦ ψ ebenfalls eine Bijektion.
Definition 3.6.2. Eine Menge M heißt endlich, falls ein n ∈ N und eine Bijektion φ : M →
N<n von M auf N<n existieren. Die Zahl n heißt dann die Anzahl #M der Elemente von M.
Ist M nicht endlich, heißt M unendlich und es wird #M := ∞ gesetzt.
♦
Bemerkung 3.6.3. 1. Die Anzahl der Elemente einer endlichen Menge ist wegen Lemma
3.6.1 wohldefiniert.
2. Es gilt z.B. #({0, 1}) = 2.
3. Wenn M leer ist, dann gibt es eine Bijektion φ : M → N<0 = 0.
/ Die leere Menge ist also
endlich und hat 0 Elemente.
4. Teilmengen einer endlichen Menge sind endlich.
5. Die Vereinigung endlicher Mengen ist endlich.
6. Die Potenzmenge einer endlichen Menge ist endlich.
Satz 3.6.4. N ist unendlich.
66
♦
3.6 Endliche und unendliche Mengen
Beweis. Angenommen, N ist endlich. Dann gibt es ein m ∈ N und eine Bijektion φ : N →
N<m . Somit ist ψ = φ N : N<m → N<m eine Injektion in sich, welche nach Lemma 3.6.1
<0
eine Bijektion ist. Da φ (m) ∈ N<m , gibt es wegen der Surjektivität von ψ ein n ∈ N<m mit
ψ(n) = φ (m). Da n < m gilt ψ(n) = φ (n) und wir erhalten φ (n) = φ (m) mit n 6= m im
Widerspruch zur Injektivität.
3.6.2 Gleichmächtigkeit von Mengen
Endliche Mengen sind (neben der Mengeninklusion) durch die Anzahl ihrer Elemente vergleichbar. Wir wollen dies nun auf unendliche Mengen in einer Weise übertragen, die in
gewissem Sinne eine Größenvergleich erlauben.
Konkret steht die Frage ob R, Q, Z mehr Elemente als N hat.
Definition 3.6.5. Zwei Mengen M und N heißen gleichmächtig, M ∼ N, wenn es eine Bijektion b : M → N von M auf N gibt.
♦
Bemerkung 3.6.6. Die Gleichmächtigkeit ist eine „Äquivalenzrelation auf der Klasse aller
Mengen“.
♦
Beispiel 3.6.7. 1. Die Mengen M = {A, B,C} und N = {I, II, III} sind gleichmächtig: Wähle b : M → N mit b(A) = I, b(B) = II, b(C) = III.
2. Die Mengen M = {A, B,C} und N = {I, II} sind nicht gleichmächtig: Ist b : M → N eine
surjektive Abbildung, dann hat I oder II zwei Urbilder, b ist also nicht injektiv.
3. Endliche Mengen sind genau dann gleichmächtig, wenn sie die gleiche Anzahl von
Elementen haben.
♦
Bemerkung 3.6.8. Die angepaßte Erweiterung von „gleichviele Elemente“ ist „gleichmächtig“. Es treten aber Widersprüche zu den aus dem Endlichen gewohnten auf:
♦
Beispiel 3.6.9. Obwohl N ⊂ Z, sind N und Z gleichmächtig: Wähle b : N → Z mit b(2k) =
k, b(2k + 1) = −k für k ∈ N.
♦
Allgemein gilt:
Satz 3.6.10. Eine Menge M ist genau dann endlich, wenn sie zu keiner echten Teilmenge
gleichmächtig ist.
Beweis. Nicht trivial.
Definition 3.6.11. Eine Menge M heißt abzählbar unendlich, wenn M ∼ N. Eine unendliche Menge heißt überabzählbar unendlich, wenn M unendlich aber M 6∼ N. Eine Menge
M heißt höchstens abzählbar unendlich, wenn sie endlich oder abzählbar unendlich ist. ♦
Bemerkung 3.6.12. Ist M ∼ N, so ist wegen Satz 3.6.4 auch M unendlich. Abzählbar
unendliche Mengen sind also tatsächlich unendlich. Wir haben also eine Dreiteilung der
Klasse aller Mengen in die endlichen Mengen, die abzählbar unendlichen Mengen und die
überabzählbar unendlichen Mengen.
♦
67
3 Grenzwerttheorie
3.6.3 Die Mächtigkeit von Q , R und 2M
Wir ordnen die positiven rationalen Zahlen entsprechend folgendem Schema an (waagerecht – wachsender Zähler, senkrecht – wachsender
Nenner).
Cantorsches Quadratseitenverfahren
1
1
2
1
3
1
4
1
5
1
6
1
7
1
8
1
···
1
2
2
2
3
2
4
2
5
2
6
2
7
2
8
2
···
1
3
2
3
3
3
4
3
5
3
6
3
7
3
8
3
···
1
4
2
4
3
4
4
4
5
4
6
4
7
4
8
4
···
1
5
2
5
3
5
4
5
5
5
6
5
7
5
8
5
···
1
6
2
6
3
6
4
6
5
6
6
6
7
6
8
6
···
1
7
2
7
3
7
4
7
5
7
6
7
7
7
8
7
···
1
8
2
8
3
8
4
8
5
8
6
8
7
8
8
8
···
..
.
..
.
..
.
..
.
..
.
..
.
..
.
..
.
entlang der Pfeile und unter Auslassung der ungekürzten (wiederholten) Brüche erhalten
wir eine eineindeutige Abbildung f : N → Q>0 von N auf Q>0 mit f (1) = 1, f (2) = 2,
f (3) = 21 , f (4) = 3, f (5) = 23 , f (6) = 23 , f (7) = 13 , . . . .
Damit erhalten wir:
Satz 3.6.13. Die Menge der positiven rationalen Zahlen Q>0 ist gleichmächtig zur Menge
der natürlichen Zahlen N.
Folgerung 3.6.14. Z, Q> und Q sind wie jede andere unendliche Teilmenge von Q abzählbar.
Angenommen, die reellen Zahlen in ]0, 1[ wären abzählbar, d.h., es gäbe eine Aufzählung (ri )i∈N der reellen Zahlen, r[N] = ]0, 1[. Wir stellen
die ri als Dezimalbruch ohne Neuner-Periode eindeutig dar,
Cantorsches Diagonalverfahren
∞
ri =
∑ ri,k 10−k−1 ,
ri,k ∈ {0, 1, . . . , 9} ,
k=0
Sei
∞
ρ=
∑ ρk 10−k−1
k=0
68
(
1,
mit ρk =
2,
falls rk,k 6= 1 ,
falls rk,k = 1 .
3.6 Endliche und unendliche Mengen
Dann ist die reelle Zahl ρ ∈ ]0, 1[ von allen reellen Zahlen ri verschieden. Wir erhalten also
den Widerspruch
]0, 1[ 3 ρ 6∈ r[N] = ]0, 1[ .
Satz 3.6.15. Das Intervall ]0, 1[ ist nicht gleichmächtig zu N, d.h., ]0, 1[ ist überabzählbar.
Durch Konstruktion einer geeigneten Bijektion folgt, daß alle Intervalle ]a, b[, a < b, und
sogar R gleichmächtig zu ]0, 1[ sind.
Satz 3.6.16. Das Intervall ]0, 1[ und das Quadrat ]0, 1[ × ]0, 1[ sind gleichmächtig.
Beweis. Betrachte die Abbildung b : ]0, 1[ × ]0, 1[ → ]0, 1[, welche das Paar
(0.a1 a2 a3 . . . , 0.b1 b2 b3 . . .)
auf
0.a1 b1 a2 b2 a3 b3 . . .
abbildet.
Folgerung 3.6.17. R und alle Rk , k ∈ N>0 , (und somit auch C) sind gleichmächtig zu ]0, 1[
und damit überabzählbar.
Diagonalverfahren für Potenzmengen
Satz 3.6.18. Ist M eine Menge, so sind M und 2M nicht gleichmächtig. Insbesondere ist 2N
überabzählbar.
Beweis. Angenommen, M und 2M wären gleichmächtig und φ : M → 2M wäre eine Bijektion. Sei
Ω = {x ∈ M : x 6∈ φ (x)} .
Dann ist Ω ∈ 2M , es existiert also ein ω ∈ M mit φ (ω) = Ω . Nach Definition von Ω folgt
aus ω ∈ φ (ω) bzw. ω 6∈ φ (ω) jeweils ein Widerspruch.
Folgerung 3.6.19. Die Menge F aller Folgen in {0, 1} ist überabzählbar.
Beweis. 2N kann mit der Menge der 0-1-Folgen identifiziert werden.
3.6.4 Exkurs: Kardinalzahlen
Bisher haben wir bei unendlichen Mengen nur zwischen abzählbaren und überabzählbaren
Mengen unterschieden. Die Gleichmächtigkeit erlaubt aber noch weitere Differenzierungen.
69
3 Grenzwerttheorie
Definition 3.6.20. Sei M eine Menge. Dann heißt Menge
card(M) = |M| = {N : M ∼ N}
aller zu M gelichmächtigen Mengen die Kardinalzahl von M.
Die Kardinalzahl von N bzw. R heißen ℵ0 bzw. c. (ℵ, gesprochen Aleph, ist der erste
Buchstabe im hebräischen Alphabet.).
Kardinalzahlen unendlicher Mengen heißen transfinite Kardinalzahlen.
♦
Bemerkung 3.6.21. 1. Die Menge Ñ der Kardinalzahlen endlicher Mengen ist eine Menge
natürlicher Zahlen: Durch b : N → Ñ mit b(n) = card(N<n ) ist eine Bijektion von N auf Ñ
gegeben, welche die Nachfolgerabbildung überträgt.
2. Die Objekte n, {0, 1, . . . , n − 1} = N<n und card({0, 1, . . . , n − 1}) können somit miteinander identifiziert werden.
3. Wegen Z ∼ N und card(N) = ℵ0 gilt card(Z) = ℵ0 .
4. Es gilt card(Rk ) = card(R) = card(2N ) = c für alle k ∈ N>0 .
♦
Für Kardinalzahlen a und b sei
a≤b
a<b
:⇔
:⇔
∃A ∈ a, B ∈ b, φ : A → B :
a ≤ b ∧ a 6= b .
φ ist injektiv ;
Satz 3.6.22. Für Kardinalzahlen a, b gilt
Schröder-Bernstein: (a ≤ b ∧ b ≤ a) ⇒ a = b ;
a ≤ b∨b ≤ a.
Beweis. Nicht trivial.
Aufgrund von Satz 3.6.18 und 3.6.22 gilt
N
card(N) < card(2N ) < card(22 ) < · · · .
Es gibt also viele transfinite Kardinalzahlen.
3.7 Oberer und unterer Limes
Im folgenden wenden wir uns der Struktur nicht notwendig konvergenter Folgen zu.
Mit Satz 3.2.11 haben wir gezeigt, daß alle Teilfolgen einer konvergenten Folge gegen denselben Grenzwert konvergieren. Andererseits haben wir auch gesehen, daß divergente Folgen konvergente Teilfolgen besitzen können.
70
3.7 Oberer und unterer Limes
♦
Beispiel 3.7.1. Betrachte die Folgen:
1. (an )n∈N mit a2n = 0, a2n+1 = 1.
2. (an )n∈N als Durchnummerierung der rationalen Zahlen in ]0, 1[.
3. (an )n∈N = (n)n∈N .
4. (an )n∈N = (−n)n∈N .
5. (an )n∈N mit a2n = n und a2n+1 = 0.
6. (an )n∈N als Durchnummerierung der positiven rationalen Zahlen.
7. (an )n∈N als Durchnummerierung der rationalen Zahlen.
Definition 3.7.2. Die Grenzwerte von Teilfolgen einer Folge nennt man Limeswerte oder
Häufungswerte dieser Folge. Die Menge aller Limeswerte einer Folge heißt Limesmenge
der Folge.
♦
Bezeichnung: H(a) ist Menge der Limespunkte der Folge a = (an )n∈N .
Sei (xn )n∈N eine reelle Folge.
Wir definieren die Zahlen
mk := inf{xi : i ≥ k} und Mk := sup{xi : i ≥ k} .
Dann gelten
1. ∀k ∈ N :
2. ∀k, l ∈ N :
3. ∀k ∈ N :
− ∞ ≤ mk ≤ xk ≤ Mk ≤ ∞;
mk ≤ Ml ;
mk ≤ mk+1 , Mk+1 ≤ Mk .





 von oben beschränkt, 
 Mk
von unten beschränkt,
mk
Wenn x
endlich.
dann sind alle




mk und Mk
beschränkt,
Sei x von unten beschränkt. Dann sind alle mk endlich und die Zahl
ξ = lim mk = sup{mk : k ∈ N} = lim inf{xi : i ≥ k} =: lim inf xn
k→∞
k→∞
n→∞
existiert in R ∪ {+∞}.
Ist x nicht von unten beschränkt, dann gilt mk = −∞ für alle k ∈ N und wir setzen
lim inf xn := −∞ .
n→∞
71
3 Grenzwerttheorie
Sei x von oben beschränkt. Dann sind alle Mk endlich und die Zahl
η = lim Mk = inf{Mk : k ∈ N} = lim sup{xi : i ≥ k} =: lim sup xn
k→∞
k→∞
n→∞
existiert in R ∪ {−∞}. Ist x nicht von oben beschränkt, dann gilt Mk = ∞ für alle k ∈ N und
wir setzen
lim sup xn := ∞ .
n→∞
Die so definierten Zahlen lim infn→∞ xn und lim supn→∞ xn heißen Limes inferior (unterer
Grenzwert) bzw. Limes superior (oberer Grenzwert) der Folge.
Offenbar gilt
ξ = lim inf xn ≤ lim sup xn = η
n→∞
und
ξ , η ∈ [−∞, ∞] .
n→∞
Satz 3.7.3. Sei (xn )n∈N eine reelle Folge und ξ = lim infn→∞ xn , η = lim supn→∞ xn . Dann
gelten:
1. ξ und η sind (eventuell uneigentliche) Grenzwerte von Teilfolgen von (xn )n∈N .
2. Ist (xnk )k∈N eine beliebige (eigentlich oder uneigentlich) konvergente Teilfolge von
(xn )n∈N mit Grenzwert a, dann gilt ξ ≤ a ≤ η.
3. Die Folge (xn )n∈N ist (eigentlich oder uneigentlich) konvergent genau dann, wenn
lim inf xn = lim sup xn .
n→∞
n→∞
Betrachten wir nun Beispiel 3.7.1.
Bei 1. sind 0 und 1 Limespunkte, lim infn→∞ an = 0, lim supn→∞ an = 1.
Bei 2. gilt H(a) = [0, 1], lim infn→∞ an = 0, lim supn→∞ an = 1.
Bei 3. gilt H(a) = 0/ aber lim infn→∞ an = lim supn→∞ an = ∞.
Bei 4. gilt H(a) = 0/ und lim infn→∞ an = lim supn→∞ an = −∞.
Bei 5. gilt H(a) = {0} und lim infn→∞ an = 0, lim supn→∞ an = ∞.
Bei 6. gilt H(a) = R≥0 und lim infn→∞ an = 0, lim supn→∞ an = ∞.
Bei 7. gilt H(a) = R und lim infn→∞ an = −∞, lim supn→∞ an = ∞..
Bemerkung 3.7.4. Bezeichnen wir die Menge aller eigentlichen oder uneigentlichen Grenzwerte der Teilfolgen einer reellen Folge x mit Huneig (x), so gilt
1. Huneig (x) 6= 0,
/
2. H(x) = Huneig (x), wenn x beschränkt ist,
3. lim infn→∞ xn = inf Huneig (x) und lim supn→∞ xn = sup Huneig (x).
72
4 Unendliche Reihen
4.1 Konvergenz von Zahlenreihen
4.1.1 Definition
Definition 4.1.1. Sei z = (zn )n∈N eine Folge in C. Sei s = (sn )n∈N mit
n
sn := ∑ zi
i=0
die n-te Partialsumme. Die Folge der Partialsummen s heißt unendliche Reihe und wird
mit ∑∞
♦
i=0 zi bezeichnet.
Bemerkung 4.1.2. 1. Es gilt also
∞
n
i=0
i=0
∑ zi = ∑ zi
!
.
n∈N
2. Die Bezeichnung ist in folgender Hinsicht gerechtfertig: Ist s eine gegebene Folge in C,
dann ist sie die Partialsummenfolge der eindeutig bestimmten Folge z mit z0 = s0 und weiter
zn+1 = sn+1 − sn .
3. Konvergenzbegriff und -kriterien übertragen sich somit von Folgen auf Reihen, andererseits ergeben neue Konvergenzkriterien für Reihen auch weitere Konvergenzkriterien für
Folgen!
♦
Da eine unendliche Reihe auch nur eine Folge ist, haben wir:
n
Definition 4.1.3. Die Reihe ∑∞
i=0 zi heißt konvergent, wenn die Folge s = (∑i=0 zi )n∈N ihrer
Partialsummen konvergiert. Der Grenzwert s heißt Summe der Reihe und wird ebenfalls
∞
n
mit ∑∞
i=0 zi bezeichnet. Die Reihe ∑i=0 zi heißt divergent, wenn die Folge (∑i=0 zi )n∈N divergiert.
♦
n
∞
Bemerkung 4.1.4. Die Reihe s = ∑∞
i=0 zi = (∑i=0 zi )n∈N und ihr Grenzwert s = ∑i=0 zi werden also mit dem gleichem Symbol bezeichnet. Je nach Kontext ist also zu unterscheiden,
ob die Reihe, ihr Grenzwert oder beide gemeint sind.
♦
73
4 Unendliche Reihen
4.1.2 Allgemeine Konvergenzkriterien
Satz 4.1.5 (Cauchy-Konvergenzkriterium für Reihen). Die Reihe ∑∞
i=0 zi konvergiert genau dann, wenn
m
∀ε > 0 ∃N ∈ N ∀m ≥ n ≥ N :
| ∑ zi | < ε .
i=n
Beweis. Für die Partialsummen sn gilt
m
|sn − sm | = |
∑
zi | .
i=n+1
Folgerung 4.1.6 (Notwendige Bedingung ). Ist ∑∞
i=0 zi konvergent, dann zn → 0.
Beweis. Wähle in Cauchy-Bedingung m = n.
Bemerkung 4.1.7. zn → 0 ist nicht hinreichend für die Konvergenz! Betrachte z.B. ∑∞
i=0 zi
1
√
mit z0 = 0, zn = √1n für n > 0, d.h., ∑∞
.
Dann
gilt
z
→
0
aber
n
i=1 i
√
1
1
1
1
sn = √ + √ + · · · + √ > n · √ = n → ∞ .
n
n
1
2
♦
Satz 4.1.8.
∞
1. Seien ∑∞
i=0 zi und ∑i=0 wi konvergente Reihen mit den Grenzwerten Z und W . Dann
gilt:
a) ∑∞
i=0 (zi + wi ) ist eine konvergente Reihe mit dem Grenzwert Z +W .
b) Für jedes c ∈ C konvergiert ∑∞
i=0 (czi ) gegen cZ.
2. Wenn man in einer Reihe eine beliebige endliche Anzahl von Gliedern wegläßt, ersetzt
oder beifügt, dann bleibt ihre Konvergenz (oder Divergenz) erhalten.
Beweis. ÜA
4.2 Spezielle Reihen
4.2.1 Geometrische Reihen
Definition 4.2.1. Die Reihe ∑∞
n=0 an heißt positiv, wenn an ∈ R≥0 für n ∈ N.
74
♦
4.2 Spezielle Reihen
Die Folge der Partialsummen einer positiven Reihe ist monoton wachsend. Damit erhält
man aus Satz 3.3.14 sofort:
Satz 4.2.2. Eine positive Reihe konvergiert genau dann, wenn die Folge der Partialsummen
beschränkt ist.
n
Definition 4.2.3. Sei q ∈ C. Dann heißt ∑∞
n=0 q geometrische Reihe.
♦
n
Lemma 4.2.4. Die geometrische Reihe ∑∞
n=0 q konvergiert genau dann, wenn |q| < 1.
Beweis. a) Sei |q| < 1. Dann gilt für sn = ∑ni=0 qi
(1 − q)sn = (1 − q)(1 + q + q2 + · · · + qn )
= 1 + q + q2 + · · · + qn − q − q2 − · · · − qn+1
= 1 − qn+1 ,
d.h.,
sn =
1 − qn+1
1
qn+1
1
=
−
→
für n → ∞ .
1−q
1−q 1−q
1−q
b) Sei |q| ≥ 1. Dann ist |qi | = |q|i ≥ 1, d.h., (qi )∞
i=1 ist keine Nullfolge. Nach Folgerung
4.1.6 kann die Reihe also nicht konvergieren.
4.2.2 Harmonische Reihen
1
Definition 4.2.5. Sei α > 0. Dann heißt ∑∞
n=1 nα harmonische Reihe.
Offenbar ist die notwendige Bedingung wegen
1
nα
♦
→ 0 stets erfüllt.
1
Lemma 4.2.6. Die harmonische Reihe ∑∞
n=1 nα konvergiert genau dann, wenn α > 1.
Beweis. Sei α > 1. Nach Satz 4.2.2 genügt es zu zeigen, daß sn = ∑ni=1 i1α beschränkt ist.
Sei n ∈ N und sei m ∈ N mit n ≤ 2m . Es gilt
1
1
1
1
1
1
1
sn ≤ s2m = 1 + α + α + α + α + α + α + α + · · ·
2
3
4
5
6
7
8
|
{z
} |
{z
}
<2· 21α =
1
2α−1
<4· 41α =
1
(22 )α−1
1
1
+
+···+ m α .
(2m−1 + 1)α
(2 )
|
{z
}
<2m−1
1
(2m−1 )α
=
1
(2m−1 )α−1
Damit
1
sn ≤ 1 + α
2
+
1
2
+···+
α−1
1
(2m−1 )α−1
=
1 m−1 1−α i
+ ∑ (2
).
2α i=0
75
4 Unendliche Reihen
Da 21−α < 1, stehen auf der rechten Seite die Partialsummen einer konvergenten geometrischen Reihe. Damit ist (sn ) beschränkt und nach Satz 4.2.2 ist die Reihe konvergent.
Sei α = 1. Wir betrachten
1 1
1 1 1 1
1
1
1
+
+
+
+ + +
+ · · · + m−1
+···+ m
s2m = 1 +
2
3 4
5 6 7 8
2
+1
2
|
| {z } |
{z
}
{z
}
>2· 41 = 12
>4· 18 = 21
>2m−1 21m = 21
1
>m → ∞ für m → ∞ .
2
Damit ist die Folge der Partialsummen (bestimmt) divergent.
Sei α < 1. Dann gilt
1
nα
>
1
n
für n ∈ N>1 . Damit gilt
n
n
1
1
>
∑ iα ∑ i → ∞ für n → ∞ .
i=1
i=1
4.3 Weitere Konvergenzsätze
4.3.1 Vergleichskriterien
Satz 4.3.1 (Majoranten- oder Vergleichskriterium ).
C. Dann gilt:
1. Sei a : N → C eine Folge in
∞
a) Die Konvergenz der Reihe ∑∞
n=0 |an | impliziert die Konvergenz von ∑n=0 an .
∞
b) Die Divergenz der Reihe ∑∞
n=0 an impliziert die Divergenz von ∑n=0 |an |.
2. Seien a, b : N → R Folgen in R und sei c > 0 mit 0 ≤ an ≤ cbn für n ≥ N. Dann gilt:
∞
a) Die Konvergenz von ∑∞
n=0 bn impliziert die Konvergenz von ∑n=0 an .
∞
b) Die Divergenz von ∑∞
n=0 an impliziert die Divergenz von ∑n=0 bn .
Beweis. 1.a) Sei ε > 0. Aus der Konvergenz von ∑∞
n=0 |an | folgt die Existenz eines N ∈ N,
so daß
|am | + |am+1 | + · · · + |an | ≤ ε
für alle n > m ≥ N. Wegen
|am + am+1 + · · · + an | ≤ |am | + |am+1 | + · · · + |an | ≤ ε
für alle n > m ≥ N, folgt die Konvergenz von ∑∞
n=0 an aus Satz 4.1.5.
1.b) Folgt direkt aus 1.a).
2.a) Seien sn = ∑ni=0 ai und tn = ∑ni=0 cbi . Dann gilt 0 ≤ sn ≤ tn (eventuell nach Änderung
endlich vieler Summanden). Wenn (tn ) konvergiert, dann ist (sn ) beschränkt und konvergiert
nach Satz 4.2.2.
2.b) Folgt direkt aus 2.a).
76
4.3 Weitere Konvergenzsätze
4.3.2 Exkurs: Weitere Vergleichskriterien
Satz 4.3.2. Seien a, b : N → R≥0 Folgen in R≥0 und es existiere der (uneigentliche) Grenzwert lim abnn = L.
∞
1. Falls 0 < L < ∞, dann konvergiert ∑∞
n=0 an genau dann, wenn ∑n=0 bn konvergiert.
∞
2. Falls L = 0, dann impliziert die Konvergenz von ∑∞
n=0 bn diejenige von ∑n=0 an .
∞
3. Falls L = ∞, dann impliziert die Konvergenz von ∑∞
n=0 an diejenige von ∑n=0 bn .
Beweis. 1. Aus 0 < L < ∞ folgt die Existenz eines N ∈ N mit 12 L < abnn < 2L für n ≥ N.
Somit gelten 0 < an < 2Lbn und 0 < 12 Lbn < an für n ≥ N. Durch Anwendung von Satz
4.3.1 folgt die Behauptung.
2. Sei L = 0. Dann existiert ein N ∈ N mit 0 < an ≤ bn für n ≥ N. Die Behauptung folgt
nun aus Satz 4.3.1.
3. Sei L = ∞. Dann existiert ein N ∈ N mit 0 < bn ≤ an für n ≥ N. Die Behauptung folgt
wieder aus Satz 4.3.1.
n−3
Beispiel 4.3.3. 1. Wir betrachten ∑∞
n=1 n2 +2 . Da
n−3
n2 +2
n→∞ 1
n
lim
n2 − 3n
=1=L
n→∞ n2 + 2
= lim
1
folgt die Divergenz der Reihe aus der Divergenz der harmonischen Reihe ∑∞
n=1 n (Lemma
4.2.6).
7n+1
2. Wir betrachten ∑∞
n=1 n3 +2n . Da
7n + 1
3
7n3 + n2
=7=L
lim n + 2n = lim 3
1
n→∞
n→∞ n + 2n
n2
1
folgt die Konvergenz der Reihe aus der Konvergenz der harmonischen Reihe ∑∞
n=1 n2 (Lem♦
ma 4.2.6).
Satz 4.3.4. Seien (an ) und (bn ) Folgen in R≥0 mit aan+1
≤
∞
∞ n
ziert die Konvergenz von ∑n=0 bn diejenige von ∑n=0 an .
bn+1
bn
für alle n ≥ N. Dann impli-
Beweis. O.b.d.A. sei N = 0. Es gilt
an
b1 b2
bn
a1 a2
· ·····
≤ · ·····
a0 a1
an−1 b0 b1
bn−1
und damit an ≤
a0
b0 bn .
Mit Satz 4.3.1 folgt die Behauptung.
77
4 Unendliche Reihen
4.3.3 Alternierende Reihen
Definition 4.3.5. Sei c : N → R≥0 eine Folge in R≥0 . Dann heißen
∞
∑ (−1)ncn und
n=0
∞
∑ (−1)n+1cn
n=0
♦
alternierende Reihen.
i
Sei cn & 0. Für die Partialsummen sn = ∑ni=0 (−1)i ci einer alternierenden Reihe ∑∞
i=0 (−1) ci
gilt
b2n+1 := b2n+2 :=
2n+1
2n
i=0
i=0
(−1)i ci = s2n+1 ≤ s2n+2 ≤ s2n = ∑ (−1)i ci =: a2n =: a2n+1 ≤ c0 ,
∑
mit
0 ≤ c0 − c1 ≤ b2n ≤ b2n+1 = b2n+2 ≤ s2n+2 ≤ a2n+2 ≤ a2n+1 = a2n ≤ c0 .
Ist c eine Nullfolge, dann gilt bn − an → 0 und nach Satz 3.3.16 und 3.3.5 konvergieren a, s
und b gegen den gleichen Grenzwert. Ist s die Summe der Reihe, dann gilt
s2n+1 = s2n − c2n+1 ≤ s ≤ s2n .
Da
∞
∞
n=0
n=0
∑ (−1)n+1cn = − ∑ (−1)ncn ,
n+1 c übertragen.
können wir diese Ergebnisse auch auf ∑∞
n
n=0 (−1)
Es gilt somit
Satz 4.3.6 (Leibnitz-Kriterium für alternierende Reihen). Wenn c : N → R≥0 eine mo∞
n
n+1 c
noton fallende Nullfolge in R≥0 ist, dann konvergieren ∑∞
n
n=0 (−1) cn und ∑n=0 (−1)
und für ihre Summe s gilt
2n+1
2n
i=0
i=0
∑ (−1)ici = s2n+1 ≤ s ≤ s2n = ∑ (−1)ici
beziehungsweise
2n
2n+1
i=0
i=0
∑ (−1)i+1ci = s2n ≤ s ≤ s2n+1 = ∑ (−1)i+1ci .
Damit ist die Summe einer alterniernden Reihe durch die n-the Partialsumme bis auf einen
Fehler von höchstens cn bestimmt.
78
4.4 Absolute und unbedingte Konvergenz
Beispiel 4.3.7. Wir betrachten c0 = 0 und cn =
1
n
∞
für n ∈ N>0 und damit die Reihe
1
∑ (−1)n+1 n .
n=1
Da cn & 0 konvergiert die Reihe nach dem Leibnitzkriterien. Weiter haben wir die Abschätzungen
1−
∞
1 1
1 1 1
7
1
1 1 5
= ≤ 1− + − =
≤ ∑ (−1)n+1 ≤ 1 − + = ≤ 1 .
2 2
2 3 4 12 n=1
n
2 3 6
Später werden wir zeigen
∞
1
∑ (−1)n+1 n = ln 2 .
n=1
♦
4.3.4 Reihen mit beliebigen Gliedern
Satz 4.3.8. Seien a, b : N → R Folgen in R. Wenn
1. a konvergiert monoton gegen 0;
2. Die Menge {βn : n ∈ N} der Partialsummen βn = ∑ni=0 bi ist beschränkt;
dann konvergiert ∑∞
i=0 ai bi .
Das Leibnitzkriterium ist Spezialfall mit bi = (−1)i . Mit Hilfe des Satzes erhält man
∞
beispielsweise die Konvergenz von ∑∞
n=0 an cos(nx) und ∑n=0 an sin(nx) mit an & 0 für
π
x 6= 2 + kπ bzw. x 6= kπ, k ∈ Z.
4.4 Absolute und unbedingte Konvergenz
4.4.1 Definition
Definition 4.4.1. Sei a : N → C eine Folge in C. Die Reihe ∑∞
n=0 an heißt absolut konvergent, wenn ∑∞
|a
|
konvergiert.
♦
n=0 n
Nach Satz 4.3.1 gilt:
Absolute Konvergenz =⇒ Konvergenz .
Aber es ist
Absolute Konvergenz 6⇐= Konvergenz ,
n
(−1)
wie z.B. die Reihe ∑∞
n=1 n zeigt.
79
4 Unendliche Reihen
Lemma 4.4.2. Eine positive Reihe ist genau dann absolut konvergent, wenn sie konvergent
ist.
Definition 4.4.3. Sei a : N → C eine Folge in C. Die Reihe ∑∞
n=0 an heißt bedingt konvergent, wenn sie konvergent aber nicht absolut konvergent ist.
♦
n
(−1)
Die Reihe ∑∞
n=1 n ist also bedingt konvergent.
4.4.2 Quotienten- und Wurzelkriterium
Auf dem Vergleich mit der geometrischen Reihe basieren die beiden folgenden Kriterien.
Als Spezialfall enthalten sie Konvergenzaussagen für positive Reihen.
Satz 4.4.4 (Cauchysches Wurzelkriterium). Sei a : N → C eine Folge in C und es sei
p
R = lim sup n |an | .
n→∞
Dann gilt:
1. Falls R < 1, dann konvergiert ∑∞
n=1 an absolut.
2. Falls R > 1, dann divergiert ∑∞
n=1 an .
3. Bei R = 1 sind Divergenz und Konvergenz möglich.
p
Beweis. 1. Sei R < 1. Wähle q mit R < q < 1. Dann existiert ein N ∈ N mit n |an | < q und
damit |an | < qn für n ≥ N. Die Konvergenz folgt mit dem Majorantenkriterium Satz 4.3.1
und der Konvergenz der geometrischen Reihe (Lemma 4.2.4).
p
2. Sei R > 1. Dann existiert eine Teilfolge (ank )k∈N und ein K ∈ N mit n |an | > 1 und damit
|ank | > 1 für k ≥ K. Damit kann a keine Nullfolge sein und mit Folgerung 4.1.6 folgt die
Divergenz.
1
∞ 1
3. Für ( n12 )n≥1 und ( n1 )n≥1 ergibt sich R = 1, ∑∞
n=1 n2 konvergiert und ∑n=1 n divergiert.
1
Beispiel 4.4.5. Betrachte ∑∞
n=1 1 − n
s
n
1
1−
n
(n2 )
(n2 )
. Dann
1
= 1−
n
n
=
1
1+
1 n
n−1
→
1
< 1.
e
Damit konvergiert die Reihe.
Leichter zu handhaben als das Wurzelkriterium aber nicht so weitreichend ist
80
♦
4.4 Absolute und unbedingte Konvergenz
Satz 4.4.6 (D’Alambertsches Quotientenkriterium). Sei a : N → C eine Folge in C. Dann
gilt:
| < 1, dann konvergiert ∑∞
1. Falls Q = lim supn→∞ | aan+1
n=0 an absolut.
n
2. Falls | aan+1
| ≥ 1 für n ≥ N, dann divergiert ∑∞
n=0 an .
n
Bemerkung 4.4.7. Insbesondere ist Q = lim supn→∞ | aan+1
| > 1 hinreichend für die Divern
genz.
♦
Beweis. 1. Sei Q < 1. Wähle q mit Q < q < 1. Dann existiert ein N ∈ N mit | aan+1
| < q und
n
−N
n
damit |an | < |aN |q q für n ≥ N. Die Konvergenz folgt mit dem Majorantenssatz 4.3.1
und der Konvergenz der geometrischen Reihe (Lemma 4.2.4).
2. Wegen | aan+1
| ≥ 1 für n ≥ N, gilt |an | ≥ |aN | > 0 für n ≥ N. Damit kann a keine Nullfolge
n
sein und mit Folgerung 4.1.6 folgt die Divergenz.
z
Beispiel 4.4.8. Betrachte ∑∞
n=0 n! für fixiertes z ∈ C. Wegen
n
|z|n+1
|z|
(n + 1)!
=
→Q=0<1
n
|z|
n+1
n!
z
konvergiert ∑∞
n=0 n! absolut.
n
♦
4.4.3 Umordnung einer unendlichen Reihe
Definition 4.4.9. Sei φ : N → N eine bijektive Abbildung. Dann heißt ∑∞
n=0 aφ (n) eine Um∞
ordnung der Reihe ∑n=0 an .
♦
Definition 4.4.10. Die Reihe ∑∞
n=0 an heißt unbedingt konvergent, wenn jede Umordnung
zur gleichen Summe konvergiert.
♦
Satz 4.4.11. Eine konvergente Reihe ist genau dann unbedingt konvergent, wenn sie absolut
konvergent ist.
Satz 4.4.12 (Riemannscher Umordnungssatz). Ist ∑∞
n=0 an eine bedingt konvergente Reihe in R, dann gibt es für jedes s ∈ R eine Umordnung φ mit s = ∑∞
n=0 aφ (n) .
Beweis. Seien
a+
k
ak + |ak |
:=
=
2
ak , falls ak > 0 ,
0 , falls ak ≤ 0
und
a−
k
ak − |ak |
:=
=
2
0 , falls ak ≥ 0 ,
ak , falls ak < 0 .
81
4 Unendliche Reihen
−
+
∞
∞
Dann gilt ak = a+
k + ak . Wegen der Konvergenz der Reihe ∑k=0 ak müssen ∑k=0 ak und
−
∞
∑k=0 ak entweder beide konvergieren oder beide divergieren. Konvergieren sie beide, dann
ist ∑∞
k=0 ak im Gegensatz zur Voraussetzung absolut konvergent. Also divergieren sie beide.
Zur Folge (ak ) bilden wir die Teilfolgen (pk ), (nk ) der positiven bzw. negativen Glieder.
Sei s ∈ R beliebig. Sei k0 die kleinste natürliche Zahl mit
k0
∑ pi > s .
i=0
Dann wählen wir k1 als kleinste natürliche Zahl mit
k0
k1
i=0
i=0
∑ pi + ∑ ni < s .
Danach bestimmen wir k2 als kleinste natürliche Zahl mit
k0
k1
i=0
i=0
∑ pi + ∑ ni +
k2
∑
pi > s .
i=k0 +1
Durch Fortsetzung dieses Verfahrens erhalten wir eine Umordung der Reihe. Nach Konstruktion der Umordnung unterscheiden sich die zugehörigen Partialsummen von i = k2m
bis k2m + k2m+1 mit m ∈ N höchstens um pk2m und von i = k2m+1 bis k2m+1 + k2m+2 höchstens um nk2m+1 von s. Da (pi ) und (ni ) Nullfolgen sind, folgt die Konvergenz gegen s.
4.4.4 Produktreihen
Definition 4.4.13. Sei φ : N → N × N eine Bijektion. Dann heißt ∑∞
n=0 aφ 1 (n) bφ 2 (n) eine
∞
Produktreihe von ∑∞
a
und
b
.
♦
∑n=0 n
n=0 n
In einer Produkreihe werden also alle Produkte ak bi in einer (durch φ ) vorgegebenen Reihefolge „aufsummiert“.
∞
Satz 4.4.14 (Multiplikationssatz). Die Reihen ∑∞
n=0 an und ∑n=0 bn seien absolut konvergent. Dann konvergiert jede ihrer Produktreihen gegen die gleiche Summe.
Bemerkung 4.4.15. 1. Unter den Voraussetzungen des Satzes wird der Grenzwert einer
Produktreihe mit
!
!
∞
∑ an ·
n=0
∞
∞
∑ bn
∑
oder
n=0
am bn
m,n=0
bezeichnet.
2. Unter den Produktreihen spielt die Cauchysche Produktreihe eine besondere Rolle:
!
!
!
∞
∑ an
n=0
82
∞
·
∑ bn
n=0
=
∞
n
n=0
k=0
∑ ∑ ak bn−k
.
♦
5 Grenzwerte und Stetigkeit bei
Abbildungen
5.1 Grenzwerte
5.1.1 Der Grenzwert einer Abbildung in einem Punkt
Seien (X, ρ), (Y, d) metrische Räume, F : D ⊆ X → Y eine Abbildung und a ein Häufungspunkt von D.
Definition 5.1.1. Ein Punkt y0 ∈ Y heißt Grenzwert der Abbildung F im Punkt a, wenn für
jede Umgebung V des Punktes y0 (in Y ) eine Umgebung U von a (in X) existiert, so daß das
Bild von (U ∩ D) \ {a} unter F in V liegt:
∀Umg.V von y0 ∃Umg. U von a ∀x ∈ (U ∩ D) \ {a} :
F(x) ∈ V .
(5.1.1)
♦
Bezeichnung: y0 = lima F oder y0 = limx→a F(x).
Da man Umgebungen durch Kugeln ersetzen kann, kann man den Sachverhalt auch wie
folgt beschreiben:
∀ε > 0 ∃δ > 0 ∀x ∈ D \ {a} mit ρ(x, a) < δ :
d(F(x), y0 ) < ε .
Spezialfall: Sei (X, ρ) = (Y, d) = (R1 , d) mit euklidischer Metrik, D ⊆ R1 , a HP von D,
f : D → R1 . Dann
y0 = lim f
a
⇔
∀ε > 0 ∃δ > 0 ∀x ∈ D \ {a} mit |x − a| < δ :
| f (x) − y0 | < ε .
Satz 5.1.2 (Charakterisierung des Grenzwertes durch Folgen). Seien (X, ρ), (Y, d) metrische Räume. Die Abbildung F : D ⊆ X → Y besitzt im HP a von D den Grenzwert y0 genau dann, wenn für jede beliebige Folge (xn )n∈N in D \ {a} mit xn → a die Folge (F(xn ))n∈N
gegen y0 konvergiert.
Beweis. ⇒ Sei y0 Grenzwert von F an der Stelle a. Wir betrachten nun eine beliebige Folge
(xn )n∈N in D \ {a} mit xn → a und haben F(xn ) → y0 zu zeigen. Dazu sei ε > 0 beliebig.
Dann existiert ein δ > 0 mit d(F(x), y0 ) < ε für alle x ∈ D \ {a} mit ρ(x, a) < δ . Weiter
existiert ein N ∈ N mit ρ(xn , a) < δ für n ≥ N. Damit d(F(xn ), y0 ) < ε für n ≥ N.
83
5 Grenzwerte und Stetigkeit bei Abbildungen
⇐ Sei nun F(xn ) → y0 für jede Folge (xn )n∈N in D \ {a} mit xn → a. Angenommen, y0 ist
nicht Grenzwert von F bei a. Dann
∃ε > 0 ∀δ > 0 ∃x ∈ D \ {a} mit ρ(x, a) < δ :
d(F(x), y0 ) ≥ ε .
Sei ε > 0 mit dieser Eigenschaft. Für alle n ∈ N>0 finden wir also Punkte xn ∈ D \ {a} mit
ρ(xn , a) < δ = 1n und d(F(xn ), y0 ) ≥ ε. Die Folge (xn )n∈N konvergiert dann gegen a, F(xn )
konvergiert aber, im Widerspruch zur Voraussetzung, nicht gegen y0 .
Folgerung 5.1.3. Der Grenzwert einer Abbildung in einem Punkt ist eindeutig.
Beweis. Seien y0 und y1 Grenzwert von F bei a. Dann gilt nach Satz 5.1.2 F(xn ) → y0
und F(xn ) → y1 für jede Folge (xn )n∈N in D \ {a} mit xn → a. Aus der Eindeutigkeit des
Grenzwertes von Folgen folgt y0 = y1 .

 −1, x < 0
0,
x = 0 auf D = R1 . Dann existiert kein GrenzBeispiel 5.1.4. 1. f (x) = sgn(x) =

1,
x>0
wert von f bei 0, obwohl f (0) = 0 existiert.
2
−1
auf D = R \ {−1}. a = −1 ist HP von D und −2 ist Grenzwert von f bei
2. f (x) = xx+1
−1. Beachte: f 6= g mit g(x) = x − 1 auf D(g) = R 6= D( f ).
3. f (x) =
(x1 )2 +(x2 )2
2(x1 +x2 )
auf D = R2 \ {x : x1 + x2 = 0}. Als HP von D wählen wir a = 0. Sei
xn = ( n1 , 1n α) mit α 6= −1. Dann xn → a und f (xn ) =
mit α 6= 0. Dann xn → a und f (xn ) =
keinen Grenzwert bei 0 besitzen.
1+( αn −1)2
2α
→
1
α
1+α 2
2n(1+α)
= 0. Sei xn = ( 1n , 1n ( αn − 1))
6= 0. Damit kann f nach Satz 5.1.2
♦
5.1.2 Eigenschaften des Grenzwertes reellwertiger Funktionen
Die Eigenschaften des Grenzwertes einer Funktion f : D ⊂ X → R ergeben sich nach Satz
5.1.2 aus den entsprechenden Eigenschaften von Grenzwerten von Folgen:
1. Sei y0 = lima f und p > y0 . Dann existiert eine Umgebung U von a so, daß f (x) < p
für alle x ∈ (U ∩ D) \ {a}.
2. Wenn lima f > 0, dann existiert eine Umgebung U von a mit f (x) > 0 für alle x ∈
(U ∩ D) \ {a}.
3. Seien f und g zwei reellwertige Funktionen mit D( f ) ∩ D(g) =: M 6= 0.
/ Sei a HP der
Menge M und es existiere lima f und lima g. Gibt es eine Umgebung U von a mit
f (x) ≤ g(x) für x ∈ (U ∩ M) \ {a}, dann gilt lima f ≤ lima g.
4. Gibt es eine Umgebung U von a mit f (x) ≥ 0 für alle x ∈ (U ∩ D( f )) \ {a} und
existiert lima f , dann lima f ≥ 0.
84
5.1 Grenzwerte
5. Seien f , g, h reellwertige Funktionen mit D( f ) ∩ D(g) ∩ D(h) =: M 6= 0.
/ Sei a HP
der Menge M. Gibt es eine Umgebung U von a mit f (x) ≤ g(x) ≤ h(x) für x ∈
(U ∩ M) \ {a}, dann folgt aus lima f = lima h die Existenz von lima g und lima f =
lima g = lima h.
6. Besitzt eine Funktion f in einem HP a von D( f ) einen Grenzwert, dann existiert eine
Umgebung U von a, so daß f auf U ∩ D( f ) beschränkt ist.
7. Seien f und g zwei reellwertige Funktionen mit D( f ) ∩ D(g) =: M 6= 0.
/ Sei a HP der
Menge M und es existiere F = lima f und G = lima g. Dann
a) lima ( f ± g) = F ± G,
b) lima ( f g) = FG,
c) lima ( f /g) = F/G, falls G 6= 0.
8. Seien X, Y , Z metrische Räume und S und T Abbildungen mit
S
T
X −→ Y −→ Z .
Sei a HP von X. Wenn lima S = b HP von Y ist und limb T = c ∈ Z, dann lima T ◦ S =
limlima S T = c.
5.1.3 Einseitige Grenzwerte
Wir betrachten Abbildungen einer reellen Variablen mit Werten im metrischen Raum (Y, d).
Definition 5.1.5. A ∈ Y heißt linksseitiger (rechtsseitiger)
Grenzwert von f : D( f ) ⊆ R →
Y an der Stelle a, wenn A = lima g mit g := f E , E :=]−∞, a[∩D( f ) bzw. E :=]a, ∞[∩D( f ),
d.h., D(g) = E und g(x) = f (x) für x ∈ E.
♦
Bezeichnung: Man schreibt dann A = lima−0 f , A = limx→a−0 f (x) oder A = limx%a f (x)
für linksseitige bzw. A = lima+0 f , A = limx→a+0 f (x) oder A = limx&a f (x) für rechtseitige
Grenzwerte.
A ist also linksseitiger Grenzwert von f an einem HP a von D∩ ] − ∞, a[, wenn
∀ε > 0∃δ > 0∀x ∈ D mit a − δ < x < a :
d( f (x), A) < ε .
Beispiel 5.1.6. f (x) = sgnx auf D = R. Dann lim−0 f = −1 und lim+0 f = 1.
♦
Satz 5.1.7. Die Abbildung f : D( f ) ⊆ R → Y besitzt im HP a von D∩ ]−∞, a[ und D∩ ]a, ∞[
den Grenzwert A = lima f genau dann, wenn lima−0 f und lima+0 f existieren und A =
lima−0 f = lima+0 f .
85
5 Grenzwerte und Stetigkeit bei Abbildungen
5.1.4 Uneigentliche Grenzwerte und Grenzwerte im Unendlichen
Sei f (x) =
1
|x|
auf D = R \ {0}. Dann ist a = 0 HP von D. Für diese Funktion gilt:
∀K > 0 ∃δ > 0 ∀x ∈ D mit |x − a| < δ :
f (x) ≥ K .
Definition 5.1.8. Sei f : D ⊆ R → R eine Funktion, a HP von D. Man sagt, die Funktion f
hat bei a den (uneigentlichen) Grenzwert +∞, wenn
∀K > 0 ∃δ > 0 ∀x ∈ D \ {a} mit |x − a| < δ :
f (x) ≥ K .
Analog definiert man den Grenzwert −∞.
♦
Bezeichnung: Man schreibt lima f = +∞ oder limx→a f (x) = +∞ bzw. lima f = −∞ oder
limx→a f (x) = −∞.
Sei nun f (x) = 5x−3
x auf D = R \ {0}. Uns interessiert das Verhalten von f bei immer größer
werdenden x. Für diese Funktion gilt:
∀ε > 0 ∃δ > 0 ∀x ∈ D mit x > δ :
| f (x) − 5| < ε
und
∀ε > 0 ∃δ > 0 ∀x ∈ D mit x < −δ :
| f (x) − 5| < ε .
Definition 5.1.9. Sei f : D ⊆ R → R eine Funktion, E := {1/x : x ∈ D∩ ]0, ∞[} und g : E →
R mit g(t) = f (1/t) für t ∈ E. Wenn 0 HP von E und wenn der (eigentliche oder uneigentliche) Grenzwert lim0 g existiert, dann nennt man lim0 g den (eigentlichen oder uneigentlichen) Grenzwert von f in +∞:
lim f := lim g .
+∞
0
♦
Analog wird lim−∞ f definiert.
5.1.5 Die erweiterten reellen Zahlen
Wir kommen nun zur Begründung der Erweiterung der Rechenoperationen von den reellen
Zahlen auf die Menge R = R ∪ {−∞} ∪ {+∞}. Eine Erweiterung sollte so geschehen, daß
die entsprechenden Resultate auch für Grenzwerte von Funktionen gelten:
Seien F, G ∈ R und op ∈ {+, −, ·, /}. Dann sollte F op G so definiert werden, daß
lim( f op g) = F op G
a
für beliebige Funktionen f : D( f ) ⊆ R → R, g : D(g) ⊆ R → R mit lima f = F, lima g = G
und a HP von D( f ) ∩ D(g) gilt.
Nach Abschnitt 5.1.2 brauchen wir nur noch Kombinationen von F und G betrachten, bei
denen wenigstens einmal +∞ oder −∞ auftritt, da auch hier die Division durch 0 nicht
definiert werden kann.
So überlegt man sich:
86
5.2 Stetigkeit
1. (+∞) + (+∞) = (+∞) − (−∞) = (+∞) + x = x + (+∞) = +∞ für x ∈ R.
2. (−∞) + (−∞) = (−∞) − (+∞) = (−∞) + x = x + (−∞) = −∞ für x ∈ R.
3. (+∞) · (+∞) = (−∞) · (−∞) = (+∞) · x = x · (+∞) = (−∞) · y = y · (−∞) = +∞ für
x ∈ R>0 und y ∈ R<0 .
4. (+∞) · (−∞) = (−∞) · (+∞) = (−∞) · x = x · (−∞) = (+∞) · y = y · (+∞) = −∞ für
x ∈ R>0 und y ∈ R<0 .
5.
x
±∞
= 0 für x ∈ R.
±∞
Offen bleiben (+∞) − (+∞), (−∞) − (−∞), ±∞
±∞ , ∓∞ , 0 · (+∞), 0 · (−∞) und Grenzwerte der
−∞
Form 00 , +∞
0 , 0 . Hier müssen entsprechende Grenzwertuntersuchungen für die konkreten
Funktionen durchgeführt werden.
5.2 Stetigkeit
5.2.1 Stetigkeit in einem Punkt
Seien (X, ρ) und (Y, d) metrische Räume und F : D ⊆ X → Y .
Definition 5.2.1. Die Abbildung F heißt stetig im Punkt a, wenn a ∈ D und für jede Umgebung V von F(a) (in Y ) eine Umgebung U von a (in X) existiert mit F[D ∩U] ⊆ V :
∀Umg.V von F(a) ∃Umg. U von a ∀x ∈ U ∩ D :
F(x) ∈ V .
(5.2.1)
♦
Wir können (5.2.1) wieder durch
∀ε > 0∃δ > 0∀x ∈ D mit ρ(x, a) < δ :
d(F(x), F(a)) < ε
ersetzten.
Sind X und Y normierte Räume mit Normen k · kX und k · kY , dann können wir (5.2.1) durch
∀ε > 0∃δ > 0∀x ∈ D mit kx − akX < δ :
kF(x) − F(a)kY < ε
ersetzten.
Die Definition beschreibt eine lokale Eigenschaft (d.h. eine auf einen Punkt des Definitionsbereichs bezogene Eigenschaft) einer Abbildung.
Beispiel 5.2.2. 1. f (x) = sgn(x) auf D = R. In a = 0 ist f nicht stetig: Sei ε < 12 und
V = B(0, ε). Dann existiert keine Umgebung U von 0 mit f [U] ⊆ V , da in jeder Umgebung
U von 0 Punkte a 6= 0 liegen mit | f (a)| = 1, d.h., f (a) 6∈ V .
2. f (x) = x auf D = R ist stetig in jedem a ∈ D: Sei a ∈ R1 und ε > 0. Offenbar kann δ = ε
gewählt werden.
♦
87
5 Grenzwerte und Stetigkeit bei Abbildungen
Der Vergleich mit (5.1.1) in der Grenzwertdefinition (Def. 5.1.1) zeigt:
• Für die Stetigkeit in a muß a zum Definitionsbereich gehören, braucht aber kein Häufungspunkt des Definitionsbereich zu sein.
Damit gilt:
Satz 5.2.3. Ist a ∈ D ein HP von D, dann gilt:
F in a stetig
⇐⇒
(i) F besitzt in a einen GW
(ii) lima F = F(a) .
Bemerkung 5.2.4. Sei a ∈ D ein isolierter Punkt von D. Dann ist (5.2.1) offensichtlich
erfüllt: Man wähle U so, daß U ∩ D = {a}. Damit ist F in jedem isoliertem Punkt stetig. ♦
Aus der Definition kann man sofort die Stetigkeit folgender Abbildungen in einem Punkt
ablesen:
Sei F : D ⊆ X → Y und F0 : D0 ⊆ X → Y mit D0 ⊆ D und F0 (x) = F(x) auf D0 (d.h., F0 ist
die Einschränkung von F auf D0 : F0 := F D ). Sei a ∈ D0 . Dann gilt
0
F stetig in a
=⇒
F0 stetig in a .
Satz 5.2.5. Seien (X, ρ), (Y, d), (Z, µ) metrische Räume und S : D(S) ⊆ X → Y , T : D(T ) ⊆
Y → Z mit S[X] ⊆ D(T ). Ist S in a ∈ X stetig und ist T in S(a) ∈ Y stetig, dann ist die
Superposition T ◦ S in a stetig.
Beweis. Sei b = S(a), c = T (b). Für jede Umgebung W von c existiert Umgebung V von b
mit T [D(T ) ∩V ] ⊆ W . Zur Umgebung V von b existiert Umgebung U von a mit S[D(S) ∩
U] ⊆ V . Mit D(T ◦ S) = D(S) gilt T ◦ S[D(T ◦ S) ∩U] ⊆ W .
Analog zu Satz 5.1.2 ist
Satz 5.2.6 (Charakterisierung der Stetigkeit durch Folgen). Seien (X, ρ), (Y, d) metrische Räume. Dann ist Abbildung F : D ⊆ X → Y in a ∈ D genau dann stetig, wenn für
jede beliebige Folge (xn ) in D mit xn → a die Folge (F(xn )) gegen F(a) konvergiert.
Beweis. Der Beweis ist analog zum Beweis von Satz 5.1.2 mit folgenden Änderungen: Ersetze y0 durch F(a) und streiche \{a}.
Satz 5.2.7 (Lokale Beschränktheit). Sei F : D ⊆ X → Y in a ∈ D stetig. Dann ist F in
einer Umgebung von a beschränkt.
Beweis. Sei ε = 1. Wegen der Stetigkeit in a existiert ein δ mit F[D∩BX (a, δ )] ⊆ BY (a, 1).
Satz 5.2.8 (Lokaler Vorzeichenerhalt). Sei F : D ⊆ X → R in a ∈ D stetig und gelte F(a) >
0 bzw. F(a) < 0. Dann gibt es eine Umgebung U von a, so daß F(x) > 0 bzw. F(x) < 0 für
x ∈ D ∩U.
Beweis. Sei ε = |F(a)|/2. Wegen der Stetigkeit in a existiert eine Umgebung U von a mit
|F(x) − F(a)| < ε für x ∈ D ∩ U. Damit F(x) > F(a)/2 > 0 bei F(a) > 0 und F(x) <
F(a)/2 < 0 bei F(a) < 0 für alle x ∈ D ∩U.
88
5.2 Stetigkeit
5.2.2 Operationen bei stetigen Funktionen
Satz 5.2.9. Sei (X, ρ) ein metrischer Raum, fi : Di ⊆ X → R für i = 1, 2. Sei D := D1 ∩D2 6=
0/ und seien f1 und f2 stetig in a ∈ D. Dann sind auch die Funktionen
α1 f 1 + α2 f 2 ,
f1 f2 ,
| f1 | ,
f1+ := f1 ∨ 0 ,
f1− := (− f1 ) ∨ 0 ,
mit α1 , α2 ∈ R in a stetig. Im Falle f2 (a) 6= 0 ist auch
f1
f2
f1 ∨ f2 ,
f1 ∧ f2
in a stetig.
Beweis. Wir zeigen hier nur die Stetigkeit von f1 f2 und | f1 |.
Zu f1 f2 . Sei (xn ) eine beliebige Folge in D mit xn → a. Da f1 und f2 stetig in a, gilt
fi (xn ) → fi (a) nach Satz 5.2.3. Dann gilt für die Zahlenfolge ( f1 (xn ) f2 (xn )) offenbar
f1 (xn ) f2 (xn ) → f1 (a) f2 (a) ,
d.h., f1 f2 ist stetig in a.
Zu | f1 |. Sei (xn ) eine beliebige Folge in D1 mit xn → a. Da f1 stetig in a, gilt f1 (xn ) → f1 (a).
Wegen
|| f1 (xn )| − | f1 (a)|| ≤ | f1 (xn ) − f1 (a)|
hat man folglich | f1 (xn )| → | f1 (a)|, d.h., | f1 |(xn ) → | f1 |(a).
Satz 5.2.10. Jedes Polynom ist in jedem Punkt a ∈ R stetig. Jede gebrochen rationale Funktion R = qp ist in jedem Punkt a ∈ D = {x ∈ R : q(x) 6= 0} stetig.
Beweis. Die Behauptung folgt aus der Stetigkeit der Identität x 7→ x in allen Punkten von R
(siehe Beispiel 5.2.2) und Satz 5.2.9.
Satz 5.2.11. Die Exponentialfunktion expa : R → R>0 für a > 0 und die Potenzfunktion
potb : R>0 → R>0 für b ∈ R sind in jedem Punkt ihres Definitionsbereichs stetig.
Beweis. Zu expa : Wir zeigen zuerst die Stetigkeit in 0. O.B.d.A. sei a > 1. Wir bemerken
1
1
1
zuerst a n → 1. Sei nun ε > 0. Wir wählen N ∈ N mit |a N − 1| < ε und |a− N − 1| < ε. Sei
δ = N1 . Wegen der Monotonie von expa gilt
| expa x − expa 0| = |ax − 1| ≤ max{aδ − 1, 1 − a−δ } < ε
für |x| < δ .
Nun zeigen wir die Stetigkeit in x0 ∈ R. Es gilt
expa x = expa (x − x0 ) expa x0 .
Da expa in 0 stetig ist, folgt damit und mit den Sätzen 5.2.5, 5.2.9 die Stetigkeit von expa in
x0 .
89
5 Grenzwerte und Stetigkeit bei Abbildungen
Zu potb . Wir können uns auf b > 0 beschränken. Zuerst zeigen wir die Stetigkeit bei 1. Für
x ≥ 1 und m ∈ N≥b gilt
1 ≤ potb x = xb ≤ xm .
Da die rechte Seite von rechts gegen 1 strebt, gilt lim1+0 potb = 1. Für x < 1 und m ∈ N≥b
gilt
xm ≤ potb x ≤ 1 ,
so daß lim1−0 potb = 1. Nach Satz 5.1.7 gilt lim1 potb = 1. Mit Satz 5.2.3 folgt die Stetigkeit
in 1.
Zeigen wir nun die Stetigkeit bei x0 > 0. Es gilt
potb x − potb x0 = potb (x/x0 )(potb x0 − 1) .
Mit den Sätzen 5.2.5, 5.2.9 und der Stetigkeit in 1 folgt die Stetigkeit in x0 > 0.
5.2.3 Einseitig stetige und halbstetige Funktionen
Aus den Ordnungseigenschaften der reellen Zahlen ergeben sich zwei Verallgemeinerungen
der Stetigkeit.
Die Ordnung im Definitionsbereich führt zu:
Definition 5.2.12.
DieFunktion f : D ⊆ R1 → R1 heißt rechtsstetig (linksstetig) in a, wenn
a ∈ D und f D∩[a,∞[ ( f D∩ ]−∞,a] ) stetig in a ist.
♦
Bemerkung 5.2.13. f : D ⊆ R1 → R1 ist
• linksstetig im HP a ∈ D∩ ] − ∞, a] von D∩ ] − ∞, a] ⇐⇒ f (a) = lima−0 f .
• rechtsstetig im HP a ∈ D ∩ [a, ∞[ von D ∩ [a, ∞[ ⇐⇒ f (a) = lima+0 f .
♦
Satz 5.2.14. Sei f : D ⊆ R1 → R1 und sei a ∈ D. Dann
f ist stetig in a
⇐⇒
f ist sowohl links − als auch rechtsstetig in a .
Die Ordnung im Wertebereich führt zu:
Definition 5.2.15. Die Funktion f : D ⊆ R1 → R1 heißt von oben halbstetig (von unten
halbstetig) in a, wenn a ∈ D und für alle ε > 0 ein δ > 0 existiert mit f (x) ≤ f (a) + ε
( f (x) ≥ f (a) − ε) für alle x ∈ D mit |x − a| < δ .
♦
Satz 5.2.16. Sei f : D ⊆ R1 → R1 und sei a ∈ D. Dann
f ist stetig in a
90
⇐⇒
f ist sowohl von oben als auch von unten halbstetig in a .
5.2 Stetigkeit
5.2.4 Stetigkeit auf einer Menge
Definition 5.2.17. Seien (X, ρ) und (Y, d) metrische Räume. Eine Abbildung F : D ⊆ X →
Y heißt stetig auf der Menge E ⊆ D, wenn sie in jedem Punkt von E stetig ist. Sie heißt
stetig, wenn sie stetig auf ihrem Definitionsbereichs D ist.
♦
Bemerkung 5.2.18. Wie in den Sätzen 5.2.10, 5.2.11 gezeigt, sind zumindest Polynome,
gebrochen rationale Funktionen und die Exponential- und Potenzfunktionen stetig.
♦
Sei E eine Teilmenge von X. Wir bezeichen mit C(E), wenn Y = R1 , und allgemein mit
C(E,Y ) die Menge aller stetigen Abbildungen F : E ⊆ X → Y . Es gilt also F ∈ C(E,Y )
genau dann, wenn D(F) = E und F stetig von E nach Y .
Beispiele: C([0, 1]), C(R1 ).
Bemerkung 5.2.19. Man kann jede Aussage über Funktionen, die in einem Punkt stetig
sind, so formulieren, daß sie anwendbar sind auf stetige Funktionen. So wird z.B. aus Satz
5.2.7 die Behauptung: Wenn f ∈ C(E,Y ), dann ist f in einer Umgebung jedes Punktes x ∈ E
beschränkt.
♦
Fragen:
1. Ist jede Funktion f ∈ C(E,Y ) beschränkt?
2. Sei f ∈ C(E, R1 ) mit f (x) 6= 0 für alle x ∈ E. Hat f dann in allen Punkten von E das
gleiche Vorzeichen?
3. f ∈ C(E,Y ) heißt
∀x0 ∈ E∀ε > 0∃δ > 0 :
f [BX (x0 , δ ) ∩ E] ⊆ BY ( f (x0 , ε) .
∀ε > 0∃δ > 0∀x0 ∈ E :
f [BX (x0 , δ ) ∩ E] ⊆ BY ( f (x0 , ε) ,
Gilt auch
d.h., kann dasselbe δ für alle x0 ∈ E gewählt werden?
Wir fragen hier also nach globalen Eigenschaften stetiger Funktionen. Die Antwort auf alle
drei Fragen ist im allgemeinen „Nein“, jedoch „Ja“, wenn die Teilmenge E des metrischen
Raumes (X, ρ) spezielle Eigenschaften hat. Dies untersuchen wir in den nächsten drei Abschnitten.
Beispiel 5.2.20. 1. pot−1 ist stetig aber unbeschränkt.
2. Sei f : Z → R mit f (x) = x + 12 für x ∈ Z. Dann f [Z] = 21 + Z.
3. Für pot2 kann δ nicht unabhängig von x0 gewählt werden: Je größer |x0 |, desto kleiner
muß δ sein.
♦
91
5 Grenzwerte und Stetigkeit bei Abbildungen
5.2.5 Der Zwischenwertsatz
Satz 5.2.21 (Nullstellensatz von Bolzano-Cauchy). Sei f ∈ C(I) mit einem Intervall I. Wenn
f das Vorzeichen wechselt, dann gibt es wenigstens einen Punkt x0 ∈ I mit f (x0 ) = 0.
Beweis. O.b.d.A. sei I = [a, b] mit f (a) < 0 und f (b) > 0. Die Menge M := {x ∈ I : f (x) ≤
0} ist nichtleer und beschränkt, besitzt also ein endliches Supremum x0 . Da I abgeschlossen
ist, gilt x0 ∈ I. Wir behaupten f (x0 ) = 0. Angenommen f (x0 ) < 0 (oder f (x0 ) > 0). Dann
gibt es nach Satz 5.2.8 eine Umgebung U von x0 mit f (x) < 0 (bzw. f (x) > 0) für x ∈ U ∩ I.
Dann kann x0 aber nicht das Supremum von M gewesen sein.
Direkte Folgerung aus Satz 5.2.21 ist
Folgerung 5.2.22 (Vorzeichenerhalt stetiger Funktionen). Sei f ∈ C(I) mit einem Intervall I. Wenn f auf I keine Nullstellen hat, dann behält sie ihr Vorzeichen.
Satz 5.2.23 (Zwischenwertsatz von Bolzano-Cauchy). Sei f ∈ C(I) mit einem Intervall I.
Sind A,C ∈ f [I] und A < B < C, dann gilt auch B ∈ f [I].
Beweis. Es gibt a und c in I mit f (a) = A und f (c) = C. O.B.d.A. sei a < c. Wende Satz
5.2.21 auf g : [a, c] → R1 mit g(x) = f (x) − B an.
Satz 5.2.24 (Erhaltung von Intervallen). Sei f ∈ C(I) mit einem Intervall I. Dann ist f [I]
ein Intervall.
Beweis. Wegen Satz 5.2.23 muß mit A,C ∈ f [I] auch [A,C] ⊆ f [I] sein.
Bemerkung 5.2.25. Die wesentliche Eigenschaft des Intervalles I ist die Zusammenhangseigenschaft: Ein metrischer Raum (X, ρ) heißt zusammenhängend, wenn X nicht als Vereinigung zweier abgeschlossener, nichtleerer, disjunkter Teilmengen dargestellt werden kann.
Eine Teilmenge von R ist genau dann zusammenhängend, wenn sie ein Intervall ist. Satz
5.2.24 lautet dann allgemein, daß das stetige Bild einer zusammenhängenden Menge wieder
zusammenhängend ist (siehe Amann/Escher I).
♦
5.2.6 Beschränktheit und Existenz von Maxima und Minima
Satz 5.2.26 (Erhaltung der Kompaktheit). Sei f ∈ C(K,Y ) mit einer kompakten Menge
K ⊆ X. Dann ist f [K] kompakt.
Beweis. Wegen Satz 3.4.23 genügt es, die Folgenkompaktheit zu zeigen. Sei also (yn )n∈N
eine beliebige Folge in f [K]. Dann existieren xn ∈ K mit yn = f (xn ). Wegen der Kompaktheit von K existiert eine in K konvergente Teilfolge (xnk )k∈N mit Grenzwert x∞ ∈ K. Da f
stetig ist und mit Satz 5.2.6, gilt f (xnk ) → f (x∞ ) ∈ f [K]. Somit hat (yn )n∈N eine in f [K]
konvergente Teilfolge. Damit ist f [K] folgenkompakt.
92
5.2 Stetigkeit
Folgerung 5.2.27 (Satz von Weierstraß). Sei f ∈ C(K,Y ) mit einer kompakten Menge K ⊆
X. Dann ist f [K] beschränkt. Gilt zusätzlich Y = R1 , dann existieren min f [K] = minx∈K f (x)
und max f [K] = maxx∈K f (x).
Beweis. Die erste Behauptung folgt aus Satz 5.2.26 ( f [K] ist kompakt) und der Beschränktheit einer kompakten Menge (Satz 3.4.23 und Lemma 3.4.21). Sei nun Y = R1 . Dann existieren inf f [K] und sup f [K] in R und sind Berührungspunkte von f [K]. Da eine kompakte
Menge abgeschlossen ist (Satz 3.4.23 und Lemma 3.4.21), liegen inf f [K] und sup f [K] in
f [K].
Bemerkung 5.2.28. Die Kompaktheit ist wesentlich:
1. f = pot2 ]1,2[ ist stetig, beschränkt; Minimum und Maximum von f (]1, 2[) existieren
aber nicht.
2. f = pot2 [0,∞[ ist stetig aber unbeschränkt.
♦
5.2.7 Gleichmäßige Stetigkeit
Definition 5.2.29. Seien (X, ρ) und (Y, d) metrische Räume. Eine Abbildung F : D(F) ⊆
X → Y heißt gleichmäßig stetig, wenn
∀ε > 0∃δ > 0∀x, x0 ∈ D(F) mit ρ(x, x0 ) < δ :
d(F(x), F(x0 )) < ε .
♦
Offensichtlich ist dies äquivalent zu
∀ε > 0∃δ > 0∀x0 ∈ D(F) :
F[BX (x0 , δ ) ∩ D] ⊆ BY (F(x0 , ε) ,
das heißt der Eigenschaft aus der dritten Frage.
Beispiel 5.2.30. 1. x 7→ x ist auf R gleichmäßig stetig.
2. x 7→ x2 ist auf R nicht gleichmäßig stetig.
3. x 7→ x2 ist auf ] − 1, 1[ gleichmäßig stetig.
4. x 7→ x−1 ist auf ]0, 1[ nicht gleichmäßig stetig.
♦
Satz 5.2.31 (Satz von Cantor). Sei F ∈ C(K,Y ) mit kompakter Menge K ⊆ X. Dann ist F
gleichmäßig stetig.
Beweis. Indirekt. Sei F ∈ C(K,Y ) also nicht gleichmäßig stetig. Dann
∃ε > 0∀δ > 0∃x, x0 ∈ K mit ρ(x, x0 ) < δ :
d(F(x), F(x0 )) ≥ ε .
93
5 Grenzwerte und Stetigkeit bei Abbildungen
Sei ε mit dieser Eigenschaft. Dann finden wir für δ = 1n Punkte xn , xn0 ∈ K mit ρ(xn , xn0 ) < 1n
und d(F(xn ), F(xn0 )) ≥ ε. Wegen der Kompaktheit von K gibt es eine konvergente Teilfolge
(xnk )k∈N von (xn )n∈N mit Grenzwert x∞ ∈ K. Nun gilt
ρ(xn0 k , x∞ ) ≤ ρ(xn0 k , xnk ) + ρ(xnk , x∞ ) ≤
1
+ ρ(xnk , x∞ ) ,
nk
so daß auch xn0 k → x∞ . Mit der Stetigkeit von F folgt der Widerspruch
ε ≤ d(F(xnk ), F(xn0 k )) ≤ d(F(xnk ), F(x∞ )) + d(F(xn0 k ), F(x∞ )) → 0 .
Damit ist die dritte Frage beantwortet.
5.2.8 Fortsetzung von stetigen Funktionen
Sei F ∈ C(D,Y ) mit D ⊆ X und metrischen Räumen (X, ρ) und (Y, d). Kann F auf die
Abschließung von D stetig fortgesetzt werden, d.h., existiert F̄ ∈ C(D̄,Y ) mit F̄(x) = F(x)
für x ∈ D?
Offensichtlich kann x 7→ x−1 mit D = ]0, 1] nicht auf D̄ fortgesetzt werden.
Satz 5.2.32. Sei F : D ⊆ X → Y mit metrischen Räumen (X, ρ) und (Y, d), wobei (Y, d) vollständig ist. Ist F gleichmäßig stetig, dann kann F zu einer gleichmäßig stetigen Abbildung
F̄ : D̄ → Y fortgesetzt werden.
Für den Beweis des Satzes benötigen wir
Lemma 5.2.33. Seien (X, ρ) und (Y, d) metrische Räume und F : D ⊆ X → Y gleichmäßig
stetig. Dann überführt F jede Cauchy-Folge in (X, ρ) in eine Cauchy-Folge in (Y, d).
Beweis. Sei (xn )n∈N eine Cauchy-Folge in (X, ρ) mit xn ∈ D für n ∈ N. Sei ε > 0 beliebig.
Dann existiert ein δ > 0 mit d(F(x), F(x0 )) < ε für alle x, x0 ∈ D mit ρ(x, x0 ) < δ . Weiter
existiert ein N mit ρ(xn , xm ) < δ für n, m ≥ N. Somit d(F(xn ), F(xm )) < ε für n, m ≥ N.
Beweis. (von Satz 5.2.32) Wir wollen F̄ definieren durch
F(x) , falls x ∈ D ,
F̄(x) :=
limx F , falls x ∈ D̄ \ D .
Zu zeigen ist dazu, daß limx F existiert und daß F̄ gleichmäßig stetig ist.
(I) Zur Existenz von lima F bei a ∈ D̄\D: Dann ist a Häufungspunkt von D. Sei (xn )n∈N eine
beliebige Folge in D mit xn → a. Da (xn )n∈N eine Cauchy-Folge ist, ist (F(xn ))n∈N nach
dem Lemma 5.2.33 ebenfalls eine Cauchy-Folge. Wegen der Vollständigkeit konvergiert
(F(xn ))n∈N gegen ein A.
94
5.2 Stetigkeit
Um Satz 5.1.2 anwenden zu können, muß nun noch gezeigt werden, daß der Grenzwert
unabhängig von der Folge (xn )n∈N ist. Dazu sei (yn )n∈N eine Folge in D mit yn → a und
F(yn ) → B. Wir bilden die Folge (zn )n∈N mit
z2n = xn ,
z2n+1 = yn .
Dann gilt zn ∈ D und zn → a und ist daher auch wieder eine Cauchyfolge, so daß sich
nach Lemma 5.2.33 die Konvergenz von (F(zn ))n∈N gegen ein C ∈ Y ergibt. Nun enthält die konvergente Folge (F(zn ))n∈N aber zwei konvergente Teilfolgen (F(z2n ))n∈N und
(F(z2n+1 ))n∈N , deren Grenzwerte A und B folglich mit C übereinstimmen müssen. Somit
A = B, und Satz 5.1.2 ergibt lima F = A.
(II) Zur gleichmäßigen Stetigkeit von F: Sei ε > 0 beliebig. Dann existiert ein δ > 0 mit
∀x1 , x2 ∈ D mit ρ(x1 , x2 ) < δ :
d(F(x1 ), F(x2 )) <
ε
.
3
Seien u1 , u2 ∈ D̄ beliebig mit ρ(u1 , u2 ) < δ3 . Dann existieren xi ∈ D mit
d(F(xi ), F̄(ui )) <
δ
ε
und ρ(ui , xi ) <
3
3
für i = 1, 2 .
Wegen
ρ(x1 , x2 ) ≤ ρ(x1 , u1 ) + ρ(x2 , u2 ) + ρ(u1 , u2 ) < δ
folgt
d(F̄(u1 ), F̄(u2 )) ≤ d(F̄(u1 ), F(x1 )) + d(F(x1 ), F(x2 )) + d(F(x2 ), F̄(u2 )) < ε .
5.2.9 Stetigkeit monotoner und inverser Funktionen
Der folgende Satz ist eine gewisse Umkehrung von Satz 5.2.24.
Satz 5.2.34. Sei f : I ⊆ R → R eine monotone Funktion auf einem Intervall I. Wenn f [I]
ein Intervall ist, dann ist f stetig.
Beweis. O.B.d.A. sei f monoton wachsend. Wir zeigen, daß f in jedem Punkt x0 ∈ I stetig
ist. Sei a := inf I, b := sup I.
1. Sei x0 =
6 a. Wäre f in x0 linksseitig unstetig, dann f (x0 − 0) := limx→x0 −0 f (x) 6=
f (x0 ). Da f monoton wachsend ist, gilt dann f (x0 − 0) < f (x0 ).
• Für alle x ∈ I mit x < x0 gilt f (x) ≤ f (x0 − 0) < f (x0 ). Da W ( f ) = f (I) ein
Intervall ist und f (x), f (x0 ) ∈ W ( f ), gilt auch ] f (x0 − 0), f (x0 )[ ⊆ W ( f ).
95
5 Grenzwerte und Stetigkeit bei Abbildungen
• Sei y ∈ ] f (x0 − 0), f (x0 )[. Dann existiert ein x ∈ I \ {x0 } mit f (x) = y und f (x) =
y < f (x0 ). Wenn x < x0 , dann y = f (x) ≤ f (x0 − 0). Wenn aber x > x0 , dann
y = f (x) ≥ f (x0 ). Damit erhalten wir einen Widerspruch, d.h., wir haben f (x0 −
0) = f (x0 ).
2. Sei x0 6= b. Analog zu oben erhalten wir f (x0 + 0) := limx→x0 +0 = f (x0 ), also rechtsseitige Stetigkeit.
3. Sei x0 ∈ ]a, b[. Mit 1. und 2. erhalten wir die Stetigkeit in x0 .
4. Sei x0 = a ∈ I oder x0 = b ∈ I. Mit 1. bzw. 2. erhalten wir die Stetigkeit in x0 .
Wir betrachten nun eine streng monotone, stetige Funktion f : I → R mit einem Intervall I.
Nach Satz 5.2.24 ist f [I] ein Intervall. Wegen der strengen Monotonie ist f injektiv. Damit
existiert die Inverse f −1 : f [I] → I von f . Da f −1 [ f [I]] = I und f −1 streng monoton ist, ist
f −1 nach Satz 5.2.34 eine stetige Funktion.
Damit gilt
Satz 5.2.35 (Stetigkeit der inversen Funktion). Sei I ⊆ R ein Intervall und sei f ∈ C(I)
streng monoton. Dann existiert die inverse Funktion f −1 : f [I] → I und
1. f −1 ist streng monoton (im gleichen Sinne wie f );
2. f −1 ist stetig.
Folgerung 5.2.36. expa , sinh, cosh [0,∞[ , cosh ]−∞,0] sind stetig invertierbar.
96
6 Differentialrechnung
6.1 Ableitung einer skalaren Funktion in einem Punkt
6.1.1 Motivation
bei geradliniger Bewegung eines Punktes. Die Bewegung
erfolge nach dem Weg-Zeit-Gesetz s = f (t) (z.B. freier Fall: f (t) = 12 gt 2 )
Momentangeschwindigkeit
∆s
0
s
s + ∆s
Zum Zeitpunkt t beträgt die zurückgelegt Strecke s = f (t). Nach einer Zeit ∆t sind wir
beim Zeitpunkt t + ∆t, die zurückgelegte Strecke ist s + ∆s = f (t + ∆t) mit ∆s als der im
Zeitintervall [t,t + ∆t] zurückgelegten Strecke.
Wir erhalten vm =
∆s
∆t
als mittlere Geschwindigkeit im Zeitintervall [t,t + ∆t].
Überlegung: Je kleiner (kürzer) ∆t, desto besser charakterisiert ∆s
∆t die Geschwindigkeit im
Moment t:
∆s
f (t + ∆t) − f (t)
= lim vm = lim
.
v(t) = lim
∆t→0 ∆t
∆t→0
∆t→0
∆t
Dann ist v(t) die Geschwindigkeit zum Zeitpunkt t (falls der Grenzwert existiert).
Sei z.B. s = f (t) = 12 gt 2 das Bewegungsgesetz eines Punktes. Man ermittle die Geschwindigkeit zum Zeitpunkt t > 0. Dann
v(t) = lim
∆t→0
f (t + ∆t) − f (t) 1
(t + ∆t)2 − t 2 1
2t∆t + (∆t)2
= g lim
= g lim
= gt .
∆t
2 ∆t→0
∆t
2 ∆t→0
∆t
in einem Punkt. Wir betrachten einen Stab, d.h. einen Körper, dessen
Querschnitt im Vergleich zu seiner Länge vernachlässigbar klein ist. Die Masse m ist eine Funktion der Länge l: m = f (l).
Massendichte
97
6 Differentialrechnung
b
0
N
M
Von M zu N ändert sich die Länge um ∆l, für die Masse ergibt sich m + ∆m = f (M + ∆l).
Die mittlere lineare Dichte des Stückes MN mit der Länge ∆l ist daher ρm = ∆m
∆l . Wie oben
betrachten wir wieder den Grenzwert für ∆l → 0:
f (l + ∆l) − f (l)
∆m
= lim ρm = lim
.
∆l→0
∆l→0
∆l→0 ∆l
∆l
ρ(t) = lim
Dies ergibt dann, wenn der Grenzwert existiert, die Massendichte an der Stelle l.
Tangente an den Graphen einer Funktion in einem Punkt. Der Punkt M0 = (x0 , y0 ) sei auf
dem Graphen fixiert. M = (x0 + ∆x, y0 + ∆y) sei ein weiterer Punkt auf dem Graphen.
Wir betrachten die Sekante durch M0 und M. M bewege sich auf der Kurve zu M0 , d.h.
∆x → 0. Der Winkel β und die Sekante hängen von der Lage von M ab.
Sekantengleichung: Für einen Punkt (x, y) auf der Sekante gilt
(x, y) = (x0 , y0 ) + t(∆x, ∆y)
mit einem t ∈ R, d.h. t =
x−x0
∆x
und
y = y0 + t∆y = y0 +
∆y
(x − x0 ) .
∆x
f
M
y
∆y
M0
y0
α
β
x0
98
∆x
x
6.1 Ableitung einer skalaren Funktion in einem Punkt
tan β =
∆y
∆x
=
f (x0 +∆x)− f (x0 )
∆x
ist der Anstieg der Sekante.
Als Tangente an eine gegebene Kurve (Graphen einer Funktion) im Punkt M0 bezeichnet
man die Grenzlage der Sekante durch M0 und M unter der Bedingung, daß M längs der
Kurve zu M0 strebt.
Gleichung der Tangente:
y = y0 + (x − x0 ) tan α
mit
f (x0 + ∆x) − f (x0 )
∆y
= lim
∆x→0
∆x→0 ∆x
∆x
tan α = lim
als Anstieg der Tangente.
6.1.2 Definition der Ableitung einer Funktion
Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D. x0 erhält kleinen Zuwachs h = ∆x mit
x0 + h ∈ D.
Definition 6.1.1. Falls der (eigentliche oder uneigentliche) Grenzwert
lim
h→0
f (x0 + h) − f (x0 )
h
(6.1.1)
existiert, heißt er Ableitung von f in x0 . Der Grenzwert wird durch f 0 (x0 ) bezeichnet.
♦
Bemerkung 6.1.2. Wenn x0 ∈ D Häufungspunkt
von D ∩ ] − ∞, x0 ] (D ∩ [x0 , ∞[) ist und
) in x0 existiert, dann heißt g0 (x0 ) linksseitige
(g = f die Ableitung von g = f ]−∞,x0 ]
[x0 ,∞[
(rechtsseitige) Ableitung von f in x0 . Sie wird mit f−0 (x0 ) = f 0 (x0 − 0) ( f+0 (x0 ) = f 0 (x0 + 0)
bezeichnet. Es gilt
f−0 (x0 ) = f 0 (x0 − 0) = lim
f (x0 + h) − f (x0 )
h
f+0 (x0 ) = f 0 (x0 + 0) = lim
f (x0 + h) − f (x0 )
.
h
h%0
beziehungsweise
h&0
♦
Beispiel 6.1.3. Sei f (x) = |x| mit D( f ) = R, x0 = 0. Dann
|x0 + h| − |x0 | |h|
1,
falls h > 0 ,
=
= sgnh =
−1 , falls h < 0 .
h
h
Damit existiert f 0 (0) nicht aber f+0 (0) = 1 und f−0 (0) = −1.
♦
99
6 Differentialrechnung
Satz 6.1.4. Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D∩ ] − ∞, x0 ] und D ∩ [x0 , ∞[.
Dann existiert f 0 (x0 ) genau dann, wenn f+0 (x0 ) und f−0 (x0 ) existieren und beide gleich sind.
Wenn f 0 (x0 ) existiert, gilt
f 0 (x0 ) = f+0 (x0 ) = f−0 (x0 ) .
Wir betrachten nun noch einmal das Problem der Tangente an graph( f ) in x0 . Die Tangente
ist eine Gerade durch (x0 , f (x0 )) mit dem Anstieg f 0 (x0 ).
• Sei f 0 (x0 ) endlich. Dann existiert eine Tangente in x0 und sie ist nicht parallel zur
y-Achse.
• | f 0 (x0 )| = ∞. Dann existiert
eine Tangente in x0 und sie ist parallel zur y-Achse.
p
Betrachte z.B. f (x) = 3 |x|sgnx auf D( f ) = R. Dann
f+0 (0) =
und
f−0 (0) =
p
3
lim
h%0
√
3
h
lim
= lim h−2/3 = ∞
h&0 h
h&0
p
3
|h|sgnh
|h|
= lim
= lim h−2/3 = ∞.
h
h%0 |h|
h&0
Damit f 0 (0) = ∞.
• Existieren einseitige
Ableitungen, dann existieren einseitige Tangenten. Betrachte
4
x + 1, x ≤ 0
z.B. f (x) =
auf D( f ) = R in x0 = 0. Dann f+0 (0) = 1 mit der
1 − e−x , x > 0
rechtsseitigen Tangente y = x + 1 und f−0 (0) = 0 mit der linksseitigen Tangente y = 1.
Definition 6.1.5. Sei f : D ⊆ R → R. f heißt differenzierbar in x0 , wenn x0 ∈ D Häufungspunkt von D ist und wenn f 0 (x0 ) existiert und endlich ist.
♦
Bemerkung 6.1.6. f ist also bei x0 differenzierbar, wenn in x0 eine Tangente an den Graphen existiert, die nicht parallel zur y-Achse ist.
♦
6.1.3 Weierstraßsche Zerlegungsformel
Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D.
Ziel: Stelle den Zuwachs ∆y = f (x0 + h) − f (x0 ) der Funktion f im Punkt x0 dar als Summe
eines zu h proportialen Anteils und eines Anteils dar, der bei h → 0 schneller zu 0 konvergiert als der zu h proportionale.
Wenn dies gelingt ist der zu h proportionale Anteil der entscheidende für die Änderung der
Funktion in x0 .
100
6.1 Ableitung einer skalaren Funktion in einem Punkt
Proportionaler Anteil ist ah (ist lineare Funktion in h). Der restliche Teil sei mit r(h) bezeichnet. Er soll von der Qualität „konvergiert schneller zu 0 als ah“ sein, wenn man von
a = 0 absieht. Damit meinen wir
r(h)
→ 0 für h → 0 .
h
Also suchen wir eine Darstellung
∆y = f (x0 + h) − f (x0 ) = ah + r(h) mit
r(h)
→ 0 für h → 0 .
h
(6.1.2)
Beispiel 6.1.7. Sei f (x) = x3 + 1 mit D( f ) = R, x0 ∈ D( f ). Dann
∆y = (x0 + h)3 + 1 − x03 − 1 = 3x02 h + 3x0 h2 + h3 .
|{z} | {z }
ah
r(h)
h 7→ ah = 3x02 h ist eine in h lineare Funktion. Für r(h) = 3x0 h2 + h3 gilt
r(h)
= 3x0 h + h2 → 0 für h → 0 ,
h
d.h., wir haben eine gewünschte Zerlegung. Beachte
f 0 (x0 ) = lim
h→0
f (x0 + h) − f (x0 )
= lim (3x02 + 3x0 h + h2 ) = 3x02 .
h→0
h
♦
Vermutung: Wenn f in x0 differenzierbar, dann ist f 0 (x0 )h der gesuchte, zu h proportionale
Teil.
Sei dazu f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D und f differenzierbar in x0 . Dann
ist
f (x0 + h) − f (x0 )
f 0 (x0 ) = lim
h→0
h
endlich. Somit können wir dies äquivalent als
lim
h→0
f (x0 + h) − f (x0 ) − f 0 (x0 )h
=0
h
schreiben. Mit r(h) = f (x0 +h)− f (x0 )− f 0 (x0 )h gilt also die Weierstraßsche Zerlegungsformel
f (x0 + h) − f (x0 ) = f 0 (x0 )h + r(h)
(6.1.3)
mit dem zu h proportionalen Anteil f 0 (x0 )h und r(h)/h → 0 für h → 0.
Für eine in x0 differenzierbare Funktion haben wir also die gewünschte Zerlegung. Es gilt
sogar
Satz 6.1.8. Sei x0 ∈ D( f ) Häufungspunkt von D( f ). f ist differenzierbar in x0 genau dann,
wenn eine Zahl f 0 (x0 ) existiert mit (6.1.3).
101
6 Differentialrechnung
6.1.4 Differenzierbare Abbildungen
Die Weierstraßsche Zerlegungsformel (6.1.3) als äquivalente Bedingung für die Differenzierbarkeit einer skalaren Funktion einer Variablen ermöglicht es, den Differenzierbarkeitsbegriff auf allgemeinere Abbildungen zu verallgemeinern.
Seien X und Y reelle Vektorräume, ausgestattet mit Normen k · kX und k · kY , so daß sie vollständige metrische Räume sind, d.h., seien (X, k · kX ) und (Y, k · kY ) reelle Banachräume.
Definition 6.1.9. Eine Abbildung A : X → Y heißt linear, wenn A(αx + β y) = αAx + β Ay
für alle α, β ∈ R und x, y ∈ X. Die Menge der stetigen linearen Abbildungen von X nach Y
wird mit L(X,Y ) bezeichnet.
♦
Bemerkung 6.1.10. Sei X = Rn , Y = Rm und sei M = (mi j ) eine m × n-Matrix. Wir wählen
in X und Y die kanonische Basis {e1 , . . . , en } bzw. { f1 , . . . , fm }. Dann x = (x1 , . . . , xn ) =
i
∑ni=1 xi ei und y = (y1 , . . . , ym ) = ∑m
i=1 y f i . Dann ist eine Abbildung A : X → Y durch
!
m
Ax = ∑
i=1
n
∑ mi j x j
fi
j=1
gegeben. Diese Abbildung ist linear. Als Linearkombination stetiger Abbildungen ist sie
stetig.
♦
Definition 6.1.11. F : D ⊆ X → Y heißt differenzierbar in x0 , wenn x0 ∈ D innerer Punkt
von D [Häufungspunkt von D, bei X = R,] ist und wenn A ∈ L(X,Y ) und R : X → Y existieren mit
F(x0 + h) − F(x0 ) = Ah + R(h) für x0 + h ∈ D mit
kR(h)kY
→ 0 für h → 0 .
khkX
♦
Bemerkung 6.1.12.
1. Der lineare Operator A hängt von der Stelle x0 ab und ist eindeutig festgelegt. Er
heißt Fréchet-Differential (oder totales oder vollständiges Differential) von F in x0
und wird mit ∂ F(x0 ) (oder auch dF(x0 ), DF(x0 )) bezeichnet.
2. Sei D(F 0 ) die Menge aller x0 ∈ D für die ∂ F(x0 ) existiert. Dann ist durch F 0 : D(F 0 ) →
L(X,Y ) mit F 0 (x0 ) = ∂ F(x0 ) eine Abbildung von D(F 0 ) in L(X,Y ) gegeben. Diese
Abbildung heißt Ableitung von F. Der Wert der Ableitung von F in x0 ist also das
Differential von F in x0 .
3. Der lineare Anteil der durch h hervorgerufenen Veränderung, d.h. Ah = F 0 (x0 )h =
∂ F(x0 )h, ist der Hauptteil der Veränderung.
4. Sei L : X → Y eine stetige lineare Abbildung. Dann gilt
L(x0 + h) = Lx0 + Lh
für alle x0 , h ∈ X und damit L0 (x0 ) = ∂ L(x0 ) = L für alle x0 ∈ X.
102
6.1 Ableitung einer skalaren Funktion in einem Punkt
5. Die Identität idX : X → X ist für alle x0 ∈ X differenzierbar mit ∂ idX (x0 ) = idX . Bezeichnet man den linearen Operator idX durch dx, dann erhalten wir
F 0 (x0 )dx := F 0 (x0 ) ◦ dx = F 0 (x0 ) ◦ idX = F 0 (x0 ) = ∂ F(x0 ) .
6. Wenn X = Rn und Y = Rm , dann wird F 0 (x0 ) durch eine (von den gewählten Basen
abhängige) m × n-Matrix repräsentiert. Im Falle n = m = 1 also durch eine Zahl.
7. Wenn X = R, dann braucht x0 ∈ D auch nur Häufungspunkt von D sein. Im allgemeinen ist unter dieser abgeschwächten Voraussetzung die Eindeutigkeit der Ableitung
nicht mehr gesichert.
♦
Beispiel 6.1.13. Sei X = Rn mit Skalarprodukt h·, ·i definiert durch
n
hx, yi := ∑ xi yi .
i=0
Dann gilt kxk2 = hx, xi für die euklidische Norm k · k. Man betrachte nun F : X → R mit
F(x) = kxk2 . Gesucht ist die Ableitung von F an einer Stelle x0 :
Es gilt
F(x0 + h) − F(x0 ) = hx0 + h, x0 + hi − hx0 , x0 i
= hx0 , x0 i + 2 hx0 , hi + hh, hi − hx0 , x0 i
= 2 hx0 , hi + hh, hi .
Die Abbildung A : X → R mit Ah = 2 hx0 , hi ist linear und stetig. R : X → R mit R(h) = hh, hi
khk2
0
erfüllt 0 ≤ |R(h)|
=
♦
khk
khk = khk → 0 für h → 0. Damit gilt F (x0 )h = 2 hx0 , hi.
Definition 6.1.14. F : D ⊆ X → Y heißt differenzierbar, wenn F in jedem x0 ∈ D differenzierbar ist.
Wenn F differenzierbar ist, dann ist x0 7→ F 0 (x0 ) eine Abbildung von D in L(X,Y ), die mit
F 0 bezeichnet wird (Ableitungsabbildung).
♦
Offene Fragen:
• Wie berechnet man F 0 (x0 )?
• Welche Eigenschaften hat F 0 (x0 ) immer und welche nur unter bestimmten Voraussetzungen?
103
6 Differentialrechnung
6.2 Eigenschaften differenzierbarer Abbildungen
6.2.1 Die Landau-Symbole
Definition 6.2.1. Seien F : D ⊆ X → Y , g : D ⊆ X → R, x0 Häufungspunkt von D. Die
Abbildung F heißt unendlich klein bezüglich g in x0 , wenn
∀ε > 0∃Umgeb. U von x0 ∀x ∈ U ∩ D :
kF(x)kY ≤ ε|g(x)| .
(6.2.1)
♦
Man schreibt dafür nicht ganz korrekt
F(x) = o(g(x)) für x → x0
(6.2.2)
und liest „F(x) ist klein o von g(x) für x → x0 “.
Bemerkung 6.2.2. 1. Gibt es eine Umgebung U von x0 , so daß g auf (U ∩ D) \ {x0 } von 0
Y
verschieden ist, dann bedeutet F(x) = o(g(x)) für x → x0 , daß limx→x0 kF(x)k
|g(x)| = 0.
2. In der Weierstraßschen Zerlegungsformel haben wir r(h)/h → 0 d.h. r(h) = o(h) für
h → 0.
3. Die Symbolik f (x) = o(g(x)) für X = R und x → ∞ oder x → −∞ ist in unserer Definition
mit enthalten.
4. Das Gleichheitszeichen in F(x) = o(g(x)) ist keine Gleichheitsrelation: Es gilt x3 = o(x)
und x3 = o(x2 ) für x → 0 aber o(x) 6= o(x2 ).
5. Anstelle (6.2.2) wäre „F ∈ o(g, x0 )“ mit o(g, x0 ) als Menge aller F : D ⊆ X → Y mit
♦
(6.2.1) richtig.
Beispiel 6.2.3. 1. Seien µ, ν ∈ R mit µ < ν und x0 ∈ R>0 . Dann gelten
xν = o(xµ ) für x → 0,
(x − x0 )ν = o((x − x0 )µ ) für x → x0 ,
xµ = o(xν ) für x → ∞ .
Der Nachweis ergibt sich aus den bekannten Grenzwerten
xν
= lim xν−µ = 0 ,
x→0 xµ
x→0
lim
lim (x − x0 )ν−µ = 0 ,
x→x0
xµ
= lim x−(ν−µ) = 0 .
x→∞ xν
x→∞
lim
2. sin x − x = o(x) für x → 0 und cos x − 1 − 12 x2 = o(x2 ) für x → 0. Man verwende dazu
sin x
lim
= 1,
x→0 x
104
1 − cos x
2 sin2 (x/2) 1
sin2 (x/2) 1
lim
= lim
= lim
= .
x→0
x→0
x2
x2
2 x→0 x2 /4
2
♦
6.2 Eigenschaften differenzierbarer Abbildungen
„Rechenregeln“: Da aus F(h) = o(khk), G(h) = o(khk) für h → 0 auch (F + G)(h) =
o(khk) bei x0 folgt, gilt
o(khk) + o(khk) = o(khk) für h → 0 .
Ist A eine stetige lineare Abbildung, dann folgt aus F(h) = o(khk) für h → 0 auch (A ◦
F)(h) = o(khk) bei h → 0, damit
Ao(khk) = o(khk) für h → 0 .
Sei nun F(h) = o(khk) für h → 0 und G(k) = o(kkk) für k → 0, dann ist (G◦F)(h) = o(khk)
bei x0 und damit
o(o(khk)) = o(khk) für h → 0 .
6.2.2 Die Berührungsordnung zweier Abbildungen
Definition 6.2.4. Seien F, G : D ⊆ X → Y , x0 Häufungspunkt von D. Sei k ∈ N. Man sagt,
F und G berühren sich in x0 mindestens mit der Ordnung k, wenn
o(kx − x0 kkX ) für x → x0 , falls x0 ∈ X ,
F(x) − G(x) =
o(|x|−k ) für x → x0 ,
falls X = R und x0 ∈ {−∞, ∞} .
♦
Beispiel 6.2.5. 1. Seien F, G : D ⊆ X → Y zwei Abbildungen, die stetig im Häufungspunkt
x0 von D sind und F(x0 ) = G(x0 ) erfüllen. Dann berühren sie sich mit der Ordnung 0: Es
gilt F(x0 ) − G(x0 ) = 0. Da F − G stetig in x0 , existiert für jedes ε > 0 eine Umgebung U
von x0 mit kF(x) − G(x)kY < ε für alle x ∈ D ∩U. Dies bedeutet aber F(x) − G(x) = o(1) =
o(kx − x0 k0X ).
2. In der Weierstraßschen Zerlegungsformel
F(x) = F(x0 ) + F 0 (x0 )(x − x0 ) + R(x − x0 ) ,
R(x − x0 ) = o(kx − x0 kX )
erkennt man ein „Polynom P (höchstens) ersten Grades“ mit P(x) = F(x0 ) + F 0 (x0 )(x − x0 ).
Es gilt P(x0 ) = F(x0 ) und F(x) − P(x) = o(kx − x0 kX ). Also berühren sich F und P in x0
mindestens mit erster Ordnung. Wir erkennen und vermuten eine lokale Approximation von
F durch Polynome.
♦
6.2.3 Differentiationsregeln
Zu Tabellen der Ableitungen der Grundfunktionen siehe z.B. Bronstein/Semendjajew.
Uns interessieren Differentiationsregeln für Abbildungen, die man mit Hilfe algebraischer
Operationen und Superposition aus differenzierbaren Abbildungen erhält.
Dazu seien (X, k · kX ) und (Y, k · kY ) reelle Banachräume.
105
6 Differentialrechnung
Satz 6.2.6. Seien F, G : D ⊆ X → Y in x0 differenzierbar. Dann gilt:
1. (αF + β G)0 (x0 ) = αF 0 (x0 ) + β G0 (x0 ) für α, β ∈ R (Linearität);
2. (FG)0 (x0 ) = G(x0 )F 0 (x0 ) + F(x0 )G0 (x0 ), wenn Y = R (Produktregel);
0
F
G(x0 )F 0 (x0 ) − F(x0 )G0 (x0 )
3.
, wenn Y = R und G(x) 6= 0 in einer Umge(x0 ) =
G
G(x0 )2
bung von x0 (Quotientenregel).
Beweis. Zu 1. Es gilt
F(x0 + h) = F(x0 ) + F 0 (x0 )h + o(khkX ) ,
G(x0 + h) = G(x0 ) + G0 (x0 )h + o(khkX )
für h → 0. Damit
(αF + β G)(x0 + h) = (αF + β G)(x0 ) + [αF 0 (x0 ) + β G0 (x0 )]h + o(khkX ) .
Zu 2. Es gilt
F(x0 + h)G(x0 + h) = [F(x0 ) + F 0 (x0 )h + o(khkX )] · [G(x0 ) + G0 (x0 )h + o(khkX )]
= F(x0 )G(x0 ) + [F(x0 )G0 (x0 ) + G(x0 )F 0 (x0 )]h + t(h)
für h → 0 mit
t(h) = [F(x0 ) + F 0 (x0 )h]o(khkX ) + [G(x0 ) + G0 (x0 )h]o(khkX )
+ F 0 (x0 )G0 (x0 )h2 + o(khkX )o(khkX )
= o(khkX ) .
Zu 3. Für
t(h) =
F(x0 + h) F(x0 ) G(x0 )F 0 (x0 ) − F(x0 )G0 (x0 )
−
−
h
G(x0 + h) G(x0 )
G(x0 )2
gilt
t(h)G(x0 )2 G(x0 + h) = G(x0 )2 F(x0 + h) − F(x0 )G(x0 )G(x0 + h)
− G(x0 + h)[G(x0 )F 0 (x0 ) − F(x0 )G0 (x0 )]h
= G(x0 )2 F(x0 ) + G(x0 )2 F 0 (x0 )h + G(x0 )2 o(khkX )
− F(x0 )G(x0 )2 − F(x0 )G(x0 )G0 (x0 )h − F(x0 )G(x0 )o(khkX )
− G(x0 )2 F 0 (x0 )h − G0 (x0 )hG(x0 )F 0 (x0 )h
+ G(x0 )F(x0 )G0 (x0 )h + G0 (x0 )hF(x0 )G0 (x0 )h
− o(khkX )G(x0 )F 0 (x0 )h + o(khkX )F(x0 )G0 (x0 )h
= o(khkX )
und daher t(h) = o(khkX ) für h → 0.
106
6.2 Eigenschaften differenzierbarer Abbildungen
Satz 6.2.7 (Kettenregel). Sei F : D ⊆ X → Y differenzierbar in x0 ∈ D. Sei weiter G : E ⊆
Y → Z differenzierbar in F(x0 ) ∈ E. Dann ist G ◦ F in x0 differenzierbar und es gilt
(G ◦ F)0 (x0 ) = G0 (F(x0 )) ◦ F 0 (x0 ) .
Beweis. Es gilt
G(F(x0 + h)) = G(F(x0 ) + F 0 (x0 )h + o(khkX ))
= G(F(x0 )) + G0 (F(x0 )) ◦ [F 0 (x0 )h + o(khkX )]
+ o(kF 0 (x0 )h + o(khkX )kY )
= G(F(x0 )) + G0 (F(x0 )) ◦ F 0 (x0 )h + G0 ( f (x0 )) ◦ o(khkX )
+ o(kF 0 (x0 )h + o(khkX )kX )
= G(F(x0 )) + G0 (F(x0 )) ◦ F 0 (x0 )h + o(khkX )
für h → 0.
Bemerkung 6.2.8. Wenn X = Rn , Y = Rm , Z = Rl , dann wird (G ◦ F)0 (x0 ) durch eine (von
den gewählten Basen abhängige) l × n-Matrix repräsentiert, die sich aus dem Produkt der
l × m-Matrix für G0 (F(x0 )) und der m × n-Matrix für F 0 (x0 ) ergibt.
♦
Beispiel 6.2.9. 1. F(x) = tan x =
anwendbar und ergibt
sin x
cos x
auf D = R \ { π2 + kπ : k ∈ Z}. Quotientenregel ist
sin0 x cos x − sin x cos0 x cos2 x + sin2 x
1
(tan x) =
=
=
= 1 + tan2 x .
2
2
2
cos x
cos x
cos x
0
2. H(x) = sin(x2 ) auf D = R. Kettenregel ist anwendbar auf F(x) = x2 und G(x) = sin x
und ergibt
H 0 (x) = G0 (F(x))F 0 (x) = 2x cos(x2 ) .
3. Logarithmisches Differenzieren: Sei F : ]a, b[ → R>0 differenzierbar für alle x ∈ ]a, b[.
Sei G(x) = ln x für x ∈ R. Dann hat H(x) = ln(F(x)) Sinn. Die Kettenregel ergibt
(ln F(x))0 =
F 0 (x)
.
F(x)
4. Ausdrücke der Form u(x)v(x) . Seien u, v : D ⊆ R → R in x0 ∈ D differenzierbar und sei
u(x) > 0 für x ∈ D. Dann gilt
u(x)v(x) = ev(x) ln u(x)
und daher
0
u0 (x)
v(x)
v(x) ln u(x)
0
u(x)
=e
v (x) ln u(x) + v(x)
u(x)
0
u (x)
v(x)
0
= u(x)
v (x) ln u(x) + v(x)
u(x)
= u(x)v(x) v0 (x) ln u(x) + u(x)v(x)−1 v(x)u0 (x) .
107
6 Differentialrechnung
Somit gilt
(xx )0 = xx (ln x + 1) .
♦
Satz 6.2.10 (Differenzierbarkeit der Umkehrfunktion). Sei f : I ⊆ R → R injektiv auf
dem Intervall I. Sei f stetig1 und differenzierbar in a ∈ I, f −1 sei stetig in b = f (a). Dann
ist f −1 in b genau dann differenzierbar, wenn f 0 (a) 6= 0. In diesem Fall gilt
( f −1 )0 ( f (a)) =
1
.
f 0 (a)
(6.2.3)
Beweis. „=⇒“ Nach Voraussetzung gilt f −1 ◦ f = idI . Somit folgt nach Kettenregel
0
1 = id0I (a) = f −1 ( f (a)) f 0 (a)
und damit f 0 (a) 6= 0 und (6.2.3).
„⇐=“ Zuerst zeigen wir, daß b HP von f [I] ist. Nach Voraussetzung ist a HP von I. Also
gibt es eine Folge (xk ) in I \ {a} mit limk→∞ xk = a. Wegen der Injektivität von f gilt
f (xk ) 6= b für alle k. Somit ist ( f (xk )) eine Folge in f [I] \ {b} und wegen der Stetigkeit von
f gilt f (xk ) → f (a) = b. Also ist b HP von f [I].
Es sei nun (yk ) eine Folge in f [I] mit yk 6= b für k ∈ N und limk→∞ yk = b. Sei xk := f −1 (yk ).
Dann gilt xk 6= a für k ∈ N sowie limk→∞ xk = a, da f −1 in b stetig ist. Wegen
0 6= f 0 (a) = lim
k→∞
f (xk ) − f (a)
xk − a
gibt es ein K mit
0 6=
f (xk ) − f (a)
yk − b
= −1
xk − a
f (yk ) − f −1 (b)
für k ≥ K .
Also erhalten wir
f −1 (yk ) − f −1 (b)
xk − a
=
=
yk − b
f (xk ) − f (a)
f (xk ) − f (a)
xk − a
−1
für k ≥ K ,
und die Behauptung folgt durch Grenzübergang.
Beispiel 6.2.11. f (x) = exp x. Dann ln0 y =
1 Nach
1
exp0 ln y
= 1y .
♦
dem späteren Satz 6.2.13 ist f in a stetig, wenn f in a differenzierbar ist. Die Stetigkeit von f in a
müßte also nicht extra vorausgesetzt werden.
108
6.2 Eigenschaften differenzierbarer Abbildungen
6.2.4 Höhere Ableitungen
Sei F : D ⊆ X → Y differenzierbar mit Banach-Räumen X, Y . Dann ist F 0 : D ⊆ X →
L(X,Y ) und man kann wieder die Frage stellen, ob F 0 differenzierbar ist. Zu klären wäre
hier, ob L(X,Y ) wieder ein Banach-Raum ist (das ist tatsächlich der Fall). Wenn F 0 differenzierbar ist, erhalten wir die zweite Ableitung F 00 : D ⊆ X → L(X, L(X,Y )). Offensichtlich
wird die Struktur immer komplizierter. Später betrachten wir einen Ausweg.
Für X = Y = R können wir aber jetzt schon höhere Ableitungen bilden.
Wir erhalten:
• Wenn f differenzierbar auf D ist, dann existiert erste Abbildung f 0 auf D.
• ...
• Wenn die k-te Ableitung f (k) differenzierbar
0 auf D ist, dann existiert die (k + 1)
(k+1)
(k+1)
(k)
.
Ableitung f
auf D mit f
= f
Beispiel 6.2.12. 1. f (x) = xn auf R mit n ∈ N. Dann f 0 (x) = nxn−1 (für n ≥ 1), f 00 (x) =
n(n − 1)xn−2 (für n ≥ 2), . . . , f (n) (x) = n!, f (k) (x) = 0 für k > n.
2. f (x) = sin x auf R. Dann f 0 (x) = cos x, f 00 (x) = − sin x, f 000 (x) = − cos x, f (4) (x) = sin x =
f (x); also
f (4k) (x) = f (x) = sin x ,
Z.B., f (135) (x) = f (4·33+3) (x) = − cos x.
3. Zweite Ableitung einer zusammengesetzten Funktion g = f ◦ φ . Es gilt
g0 (x) = f 0 (φ (x))φ 0 (x) und g00 (x) = f 00 (φ (x))(φ 0 (x))2 + f 0 (φ (x))φ 00 (x) .
♦
6.2.5 Differenzierbarkeit und Stetigkeit
Es seien (X, k · kX ) und (Y, k · kY ) reelle Banachräume.
Satz 6.2.13. Sei F : D ⊆ X → Y differenzierbar in x0 ∈ D. Dann ist F stetig in x0 .
Folgerung 6.2.14. Eine differenzierbare Abbildung ist stetig.
Beweis. (Des Satzes) Da F differenzierbar in x0 , gilt
F(x0 + h) − F(x0 ) = F 0 (x0 )h + o(khkX ) .
Wegen der Stetigkeit von F 0 (x0 ) existiert L = supkhkX ≤1 kF 0 (x0 )hkY . Damit gilt
kF(x0 + h) − F(x0 )kY ≤ (L + o(1)) khkX .
Die rechte Seite wird nun kleiner als jedes ε > 0, wenn nur khkX < δ .
109
6 Differentialrechnung
Bemerkung 6.2.15. 1. Stetigkeit von F in x0 heißt F(x) ≈ F(x0 ) für x ≈ x0 . Das ist also
eine Approximation durch Polynom nullten Grades (Konstante).
2. Differenzierbarkeit von F in x0 heißt F(x) ≈ F(x0 ) + F 0 (x0 )(x − x0 ) für x ≈ x0 . Das
ist also eine Approximation durch Polynom ersten Grades (Tangente an Graph): Sei ε > 0
beliebig. Dann existiert ein δ ∈ ]0, 1[, so daß
kF(x0 + h) − [F(x0 ) + F 0 (x0 )h]kY < εkhkX < εδ < ε .
für alle h ∈ X mit khkX < δ .
♦
6.2.6 Differenzierbarkeit und Extrema
Sei (X, k · k) ein reeller Banachraum.
Definition 6.2.16. Die Abbildung F : D ⊆ X → R hat bei x0 ∈ D ein lokales Minimum
(Maximum), wenn eine Umgebung U von x0 existiert mit F(x) ≥ F(x0 ) (F(x) ≤ F(x0 )) für
alle x ∈ U ∩ D. Ein lokales Extremum ist ein lokales Minimum oder Maximum.
♦
Satz 6.2.17 (Satz von Fermat). Sei F : D ⊆ X → R, x0 ∈ D. Sei x0 innerer Punkt von D
und sei F in x0 differenzierbar. Dann gilt:
F hat in x0 lokales Extremum ⇒ F 0 (x0 ) = 0 .
Beweis. F habe ein lokales Minimum in x0 . Angenommen, es gilt F 0 (x0 ) 6= 0. Dann gibt es
ein h0 ∈ X mit F 0 (x0 )h0 < 0. Es gilt
F(x0 + τh0 ) = F(x0 ) + τF 0 (x0 )h0 + o(kτh0 kX ) = F(x0 ) + τF 0 (x0 )h0 + o(|τ|)
für x0 +τh0 ∈ D. Damit gibt es beliebig kleine τ > 0 mit x0 +τh0 ∈ U ∩D und F(x0 +τh0 ) <
F(x0 ). Analog verfährt man bei lokalem Maximum.
Bemerkung 6.2.18. Wenn x0 kein innerer Punkt ist, muß die Behauptung nicht gelten! Betrachte z.B. x 7→ x2 auf [−1, 1]. Es liegen lokale Maxima in −1 und 1 vor, aber die Ableitung
verschwindet dort nicht.
♦
6.2.7 Mittelwertsätze
Es seien (X, k · kX ) und (Y, k · kY ) reelle Banachräume.
Satz 6.2.19 (Satz von Rolle). Sei f : [a, b] → R stetig, a < b, und sei f ]a,b[ differenzierbar.
Dann gilt
f (a) = f (b) ⇒ ∃c ∈ ]a, b[ : f 0 (c) = 0 .
110
6.2 Eigenschaften differenzierbarer Abbildungen
Beweis. Nach Satz von Weierstraß (Folgerung 5.2.27) existieren globales Minimum und
Maximum auf [a, b]. Liegen beide in den Randpunkten vor, so ist f konstant auf [a, b] und
damit f 0 (c) = 0 für alle c ∈ [a, b]. Liegt wenigstens eines der beiden globalen Extrema in
Innern von [a, b] vor, dann verschwindet dort nach Satz 6.2.17 die Ableitung.
Im folgenden bezeichnen wir mit Ia,b die (offene) Verbindungsstrecke von a und b, d.h.
Ia,b := {(1 − t)a + tb : t ∈ ]0, 1[} .
Satz 6.2.20 (Satz von Cauchy, verallgemeinerter Mittelwertsatz). Seien F, G : D ⊆ X →
R stetig, a und b in D mit Ia,b ⊂ D, a 6= b und es seien F, G differenzierbar auf Ia,b . Dann
existiert ein c ∈ Ia,b mit
(F(b) − F(a)) G0 (c)(b − a) = (G(b) − G(a)) F 0 (c)(b − a)
d.h.
F(b) − F(a) F 0 (c)
=
, falls X = R und G(x) 6= 0 auf Ia,b .
G(b) − G(a) G0 (c)
(6.2.4)
Beweis. Sei h : [0, 1] → R mit
h(t) = F((1 − t)a + tb) (G(b) − G(a)) + (G((1 − t)a + tb) − G(a)) (F(a) − F(b)) .
Dann h(0) = h(1) = F(a) (G(b) − G(a)). Mit Satz von Rolle (Satz 6.2.19) existiert ein
τ ∈ ]0, 1[ und damit c = (1 − τ)a + τb ∈ Ia,b mit
0 = h0 (τ) = F 0 (c)(b − a) (G(b) − G(a)) + G0 (c)(b − a) (F(a) − F(b)) .
Da G(b) − G(a) und F(a) − F(b) reell sind, folgt die Behauptung.
Satz 6.2.21 (Satz von Lagrange, Mittelwertsatz). Sei F : D ⊆ X → R stetig, seien a und
b in D mit a 6= b und Ia,b ⊂ D und es sei F differenzierbar auf Ia,b . Dann existiert ein c ∈ Ia,b
mit
F(b) − F(a) = F 0 (c)(b − a) ,
d.h.
F(b) − F(a)
= F 0 (c), falls X = R .
b−a
Beweis. Setze G(x) = x in Satz 6.2.20. Dann existiert ein c ∈ Ia,b mit
(F(b) − F(a)) (b − a) = (b − a)F 0 (c)(b − a) ,
wobei F(b) − F(a) und F 0 (c)(b − a) reelle Zahlen sind und b − a nicht der Nullvektor ist.
Bemerkung 6.2.22. Die Aussagen der Sätze 6.2.20, 6.2.21 ist im allgemeinen falsch, wenn
F : D ⊆ X → Y mit Y 6= R.
Jedoch gilt:
♦
111
6 Differentialrechnung
Satz 6.2.23. Sei F : [a, b] ⊂ R → Y stetig, a 6= b, und es sei F ]a,b[ differenzierbar. Dann gilt
kF(a) − F(b)kY ≤ sup kF 0 (c)kY (b − a) .
c∈ ]a,b[
Beweis. O.B.d.A. sei F 0 beschränkt auf ]a, b[, d.h. es existiert ein M ≥ 0 mit kF 0 (x)kY < M
für x ∈ ]a, b[. Sei ε ∈ ]0, b − a[ fixiert. Wir setzen
S := {s ∈ [a + ε, b] : kF(s) − F(a + ε)kY ≤ M(s − a − ε)} .
Da a + ε ∈ S ist S nichtleer. Wegen der Stetigkeit von F ist S abgeschlossen. Offensichtlich
ist S beschränkt. Nach dem Satz von Heine-Borel (Satz 3.4.24) ist S kompakt. Somit ist
σ := max S eine wohldefinerte Zahl in S.
Es sei σ < b. Dann gilt für t ∈ ]σ , b[
kF(t) − F(a + ε)kY ≤ M(σ − a − ε) + kF(t) − F(σ )kY .
Da F auf [a + ε, b[ differenzierbar ist, folgt
kF(t) − F(σ )kY
→ F 0 (σ ) für t → σ .
t −σ
Aufgrund der Definition von M existiert ein δ ∈ ]0, b − σ [ mit
kF(t) − F(σ )kY ≤ M(t − σ ) für 0 < t − σ < δ .
Damit folgt
kF(t) − F(a + ε)kY ≤ M(t − a − ε) für t ∈ [a + ε, σ + δ [ ,
was der Definition von σ widerspricht. Also gilt σ = b und somit
kF(t) − F(a + ε)kY ≤ M(t − a − ε) für t ∈ [a + ε, b[
für jede obere Schranke M von kF 0 (x)kY auf ]a, b[, d.h.
kF(t) − F(a + ε)kY ≤ sup kF 0 (c)kY (t − a − ε) für t ∈ [a + ε, b[ .
c∈ ]a,b[
Mit ε → 0 und der Stetigkeit von F folgt nun die Behauptung.
Satz 6.2.24 (Schrankensatz). Sei F : D ⊆ X → Y stetig, seien a und b in D mit Ia,b ⊂ D
und es sei F differenzierbar auf Ia,b . Dann gilt
kF(a) − F(b)kY ≤ sup kF 0 (c)(a − b)kY .
c∈Ia,b
Beweis. Sei h : [0, 1] → Y mit
h(t) = F((1 − t)a + tb) .
Dann gilt
h0 (t) = F 0 ((1 − t)a + tb)(b − a)
und Satz 6.2.23 impliziert
kF(a) − F(b)kY = kh(0) − h(1)kY ≤ sup kh0 (t)k = sup kF 0 (c)(a − b)kY .
t∈[0,1]
112
c∈Ia,b
6.2 Eigenschaften differenzierbarer Abbildungen
6.2.8 Die de l’Hospitalschen Regeln
tan x − x
ist ein Grenzwert vom unbstimmten Typ „ 00 “. Die Cauchy-Formel (6.2.4) erx→0 x − sin x
laubt in manchen Fällen die Behandlung solcher Ausdrücke:
lim
Satz 6.2.25 (de l’Hospital). Sei
1. f , g : ]a, b[ → R differenzierbar mit g0 (x) 6= 0 für x ∈]a, b[.
2. limx&a f (x) = limx&a g(x) = 0.
f 0 (x)
existiert.
x&a g0 (x)
3. Der (eigentliche oder uneigentliche) Grenzwert lim
Dann gilt
f 0 (x)
f (x)
= lim 0
.
x&a g (x)
x&a g(x)
lim
Bemerkung 6.2.26. 1. Der Satz gilt sinngemäß auch für x % a und somit für x → a.
2. Der Satz gilt sinngemäß auch für den Typ „ 00 “ für x → ±∞.
3. Sinngemäß gelten die Aussagen auch für den Typ „ ∞
∞ “.
4. Unbestimmte Ausdrücke der Form „0 · ∞“, „+∞ − (+∞)“, „00 “, „1±∞ “, „∞0 “ werden
∞
(meist durch Logarithmieren) auf „ 00 “ oder „ ∞
“ zurückgeführt.
♦
tan x − x
: Es gilt (tan x − x)0 = 1 + tan2 x − 1 = tan2 x und (x − sin x)0 =
x→0 x − sin x
Beispiel 6.2.27. lim
1 − cos x. Da
tan2 x
x→0 1 − cos x
lim
wieder vom Typ „ 00 “ ist, kann noch keine Entscheidung getroffen werden. Es gilt (tan2 x)0 =
2 tan x(1 + tan2 x) und (1 − cos x)0 = sin x. Es ist
2 tan x(1 + tan2 x)
2(1 + tan2 x)
= lim
=2
x→0
x→0
sin x
cos x
lim
und damit
tan x − x
tan2 x
2 tan x(1 + tan2 x)
= lim
= lim
= 2.
x→0 x − sin x
x→0 1 − cos x
x→0
sin x
lim
♦
113
6 Differentialrechnung
6.3 Partielle Ableitungen
6.3.1 Differenzierbarkeit von Koordinatenfunktionen
Ziel der nächsten drei Abschnitte ist es, die Fréchet-Ableitung durch klassische Ableitungen
zu berechnen.
Dazu beschränken wir uns auf X = Rn , Y = Rm mit den kanonischen Basen {e1 , . . . , en } und
{ f1 , . . . , fm }. Um mit Vektoren und Matrizen numerisch nach den Matrizenrechenregeln
rechnen zu können, müssen wir Vektoren als spezielle einspaltige oder einzeilige Matrizen
auffassen. Ein n-Tupel wird dabei mit einem Spaltenvektor identifiziert,


x1


x = (x1 , . . . , xn ) =  ...  .
xn
Man beachte
x> = (x1 , . . . , xn )> = (x1
xn ) .
...
Bezüglich der kanonischen Basis gilt
n
x = (x , . . . , x ) = ∑ xi ei mit xi = hei , xi .
1
n
i=1
Für das Standardskalarprodukt gilt
hx1 , x2 i = ∑ x1i x2i = x1> x2 .
Wir betrachten eine Abbildung F : D ⊆ Rn → Rm . Dann gilt
m
F = ∑ F i fi mit F i (x) = h fi , F(x)i .
i=1
Wir bezeichnen mit [A] ∈ Rm×n die Matrixdarstellung einer linearen Abbildung A : Rn →
Rm .
Satz 6.3.1. Sei x0 ∈ D und F : D ⊆ Rn → Rm . Dann gilt
F ist differenzierbar in x0 ⇐⇒ alle F i sind differenzierbar in x0 .
Ist F differenzierbar in x0 , dann
m
∂ F(x0 )h = ∑ ∂ F i (x0 )h fi .
i=1
Beweis. Die Abbildungen Ei : Rm → R, Êi : R → Rm mit Ei (x) = h fi , xi und Êi (λ ) = λ fi
sind stetige, lineare Abbildungen und daher differenzierbar. Da
m
m
i=1
i=1
F i = Ei ◦ F und F = ∑ Êi ◦ F i = ∑ F i fi ,
folgt die Behauptung aus Additions- und Kettenregel.
114
6.3 Partielle Ableitungen
6.3.2 Partielle Ableitungen einer Abbildung
Sei D ⊆ X = Rn eine offene Menge und F : D → Y = Rm und x0 ∈ D.
Sei i ∈ {1, . . . , n} fixiert. Dann ist
Di := {ξ ∈ R : x0 + ξ ei ∈ D}
eine offene Teilmenge von R und 0 ∈ Di . Wir betrachten φi : Di → Y mit
φi (ξ ) = F(x0 + ξ ei ) .
Definition 6.3.2. Wenn φi an der Stelle 0 differenzierbar ist, dann heißt F in x0 partiell nach
der i-ten Variablen differenzierbar mit der Ableitung ∂i F(x0 ) := ∂ φi (0) = φi0 (0). Falls die
partielle Ableitung ∂i F(x0 ) in allen x0 ∈ D existiert, dann heißt F (auf D) partiell nach der
i-ten Variablen differenzierbar.
♦
Bezeichnung: ∂i F(x0 ) =
∂F
(x ) = Di F(x0 ) = Fx0i (x0 ) = Fi0 (x0 ).
∂ xi 0
Bemerkung 6.3.3. 1. Partielle Differentiation nach der i-ten Variablen heißt also Differentiation bei Festhaltung der anderen Variablen.
2. Ist F eine Abbildung aus Rn in R, dann ist die partielle Ableitung ∂i F(x0 ) eine reelle
Zahl und
F(x0 + ξ ei ) − F(x0 )
ξ
ξ →0
∂i F(x0 ) = lim
F(x01 , . . . , x0i−1 , x0i + ξ , x0i+1 , . . . , x0n ) − F(x01 , . . . , x0i−1 , x0i , x0i+1 , . . . , x0n )
= lim
ξ
ξ →0
3. Die Existenz aller partieller Ableitungen ∂i F(x0 ), i = 1, . . . , n, in einem Punkt x0 enthält
nur geringe Information über das Verhalten von F in der Umgebung von x0 ! Insbesondere
folgt aus der Existenz aller partieller Ableitungen nicht die Stetigkeit in x0 und damit erst
recht nicht die Differenzierbarkeit! Betrachte dazu F : R2 → R mit

x1 x2

, wenn x 6= 0 ,
F(x) =
(x1 )2 + (x2 )2

0,
wenn x = 0 .
Dann F(ξ , 0) = F(0, ξ ) = F(0, 0) = 0 und es existieren die partiellen Ableitungen
∂1 F(0) = ∂2 F(0) = 0 .
Jedoch ist F in 0 nicht stetig, da
lim F(ξ , ξ ) =
ξ →0
1
1
6= lim F(ξ , −ξ ) = − .
2 ξ →0
2
♦
115
6 Differentialrechnung
Satz 6.3.4. Sei F in x0 ∈ D differenzierbar. Dann existieren alle partiellen Ableitungen in
x0 und es gilt
∂i F(x0 ) = ∂ F(x0 )ei .
Beweis. Es gilt
φi (ξ ) − φi (0) = F(x0 + ξ ei ) − F(x0 ) = ξ ∂ F(x0 )ei + o(kξ ei kX ) = ξ ∂ F(x0 )ei + o(|ξ |) .
Bemerkung 6.3.5. 1. Mit hi = hei , hi gilt
n
n
i=1
i=1
n
∂ F(x0 )h = ∂ F(x0 ) ∑ hei , hiei = ∑ ∂ F(x0 )ei h = ∑ ∂i F(x0 )hi .
i
i=1
Sei das Differential dxi : Rn → R in Richtung ei diejenige lineare Abbildung mit
dxi (h) := hi = hei , hi .
Dann erhalten wir
n
∂ F(x0 ) = ∑ ∂i F(x0 )dxi .
i=1
Das Differential dxi ist also keine unendlich kleine Größe (was soll das sein?) oder eine
reelle Zahl sondern eine lineare Abbildung!
2. Mit
m
F=
∑ F j f j mit F j (x) =
f j , F(x)
j=1
erhalten wir weiter
n
∂ F(x0 )h = ∑
m
∑ ∂iF j (x0)hi f j ,
i=1 j=1
d.h.,
[∂ F(x0 )h] = ∂i F j (x0 ) j,i · h .
♦
Folgerung 6.3.6. Ist D ⊆ Rn offen und ist F : D ⊆ Rn → Rm in x0 ∈ D differenzierbar, dann
sind in x0 die m Koordinatenfunktionen F j partiell nach den n Variablen differenzierbar.
Bezüglich den kanonischen Basen entspricht der Ableitung ∂ F(x0 ) die Matrix


∂1 F 1 (x0 ) · · · ∂n F 1 (x0 )


..
..
[∂ F(x0 )] := ∂i F j (x0 ) j,i = 
.
.
.
m
m
∂1 F (x0 ) · · · ∂n F (x0 )
116
6.3 Partielle Ableitungen
Bemerkung 6.3.7. 1. Die Matrix [∂ F(x0 )] wird Jacobi-Matrix von F an der Stelle x0 genannt. Die Anwendung der Abbildung ∂ F(x0 ) auf h entspricht der Matrizenmultiplikation
der Matrix [∂ F(x0 )] mit dem Spaltenvektor h.
2. Ist Y = R, so ist [∂ F(x0 )] also ein Zeilenvektor. Der Spaltenvektor
[∂ F(x0 )]> = (∂1 F(x0 ), . . . , ∂n F(x0 )) =: gradF(x0 )
heißt Gradient von F. Es gilt somit
F 0 (x0 )h = hgradF(x0 ), hi .
3. Ist X = R, so ist [∂ F(x0 )] ein Spaltenvektor.
4. Normalerweise wird die Unterscheidung zwischen Vektor (Abbildung) und Koordinatenvektor (Matrix) bei festgelegten Basen aufgehoben, es werden also gleiche Bezeichnungen
verwendet und aus dem Zusammenhang ist zu erschließen, was gemeint ist.
♦
6.3.3 Differenzierbarkeit und partielle Ableitung
Eine konkrete Abbildung F : D ⊆ Rn → Rm ist im allgemeinen koordinatenweise gegeben
und es ist verhältnismäßig leicht, sich der partiellen Ableitungen ∂i F j der Koordinaten von
F zu vergewissern. Die fundamentalen Sätze der mehrdimensionalen Differentialrechnung
handeln aber von der Fréchet-Ableitung ∂ F von F.
Wir benötigen daher eine Umkehrung von Folgerung 6.3.6. Wie Bemerkung 6.3.3 zeigt,
brauchen wir zusätzliche Voraussetzungen.
Satz 6.3.8. Sei D ⊆ Rn offen. Besitzt F : D → Rm sämtliche partiellen Ableitungen ∂i F j auf
D und sind diese auf D beschränkt, dann ist F stetig auf D.
Beweis. Wegen Satz 6.3.1 können wir uns auf m = 1 beschränken. Seien die partiellen
Ableitungen durch M beschränkt. Sei x0 ∈ D. Für genügend kleine h gilt
n
F(x0 + h) − F(x0 ) = ∑ (F(xi ) − F(xi−1 ))
i=1
mit
x1 = x0 + h1 e1 ,
x2 = x1 + h2 e2 , . . . ,
xn = xn−1 + hn en .
Auf die Differenzen rechts kann der Mittelwertsatz (Satz 6.2.21) angewendet werden, d.h.,
es existieren ci ∈ Ixi ,xi−1 mit
F(xi ) − F(xi−1 ) = ∂i F(ci )hi .
Damit
n
n
n
|F(x0 + h) − F(x0 )| = | ∑ ∂i F(ci )h | ≤ ∑ |∂i F(ci )| · |h | ≤ khkX ∑ |∂i F(ci )| ≤ nMkhkX .
i=1
i
i=1
i
i=1
Folglich ist F stetig in x0 .
117
6 Differentialrechnung
Satz 6.3.9. Sei D ⊆ Rn offen. Besitzt F : D → Rm sämtliche partiellen Ableitungen ∂i F j auf
D und sind diese in x0 ∈ D stetig, dann ist F an der Stelle x0 differenzierbar und es gilt
n
∂ F(x0 )h = ∑
m
∑ ∂iF j (x0)hi f j .
(6.3.1)
i=1 j=1
Sind die partiellen Ableitungen stetig auf D, so ist ∂ F stetig.
Beweis. Wegen Satz 6.3.1 können wir uns auf m = 1 beschränken. Zu zeigen ist dann, daß
n
∂ F(x0 )h := ∑ ∂i F(x0 )hi
i=1
tatsächlich die Ableitung von F an der Stelle x0 ist, d.h.,
F(x0 + h) − F(x0 ) − ∂ F(x0 )h
= 0.
h→0
khkX
lim
Sei h ∈ Rn . Wir führen die Punkte
x1 = x0 + h1 e1 ,
x2 = x1 + h2 e2 , . . . ,
xn = xn−1 + hn en
ein. Dann ist xn = x0 + h und es gilt xi ∈ D für i = 1, . . . , n, wenn khkX klein genug ist.
Damit gilt
n
F(x0 + h) − F(x0 ) = ∑ (F(xi ) − F(xi−1 )) .
i=1
Auf die Differenzen rechts kann der Mittelwertsatz (Satz 6.2.21) angewendet werden, d.h.,
es existieren ci ∈ Ixi ,xi−1 mit
F(xi ) − F(xi−1 ) = ∂i F(ci )hi .
Damit
n
|F(x0 + h) − F(x0 ) − ∂ F(x0 )h| = | ∑ ∂i F(ci )hi − ∂i F(x0 )hi |
i=1
n
≤ ∑ |∂i F(ci ) − ∂i F(x0 )khi |
i=1
n
≤ khkX ∑ |∂i F(ci ) − ∂i F(x0 )|
i=1
und folglich
n
|F(x0 + h) − F(x0 ) − ∂ F(x0 )h|
≤ ∑ |∂i F(ci ) − ∂i F(x0 )|.
khkX
i=1
Mit der Stetigkeit der partiellen Ableitungen folgt die Differenzierbarkeit von F. Die Stetigkeit folgt aus der Stetigkeit der partiellen Ableitungen und (6.3.1).
118
6.3 Partielle Ableitungen
6.3.4 Cr -Abbildungen und partielle Ableitungen höherer Ordnung
Definition 6.3.10. Eine Abbildung F : D → Rm , D ⊆ Rn offen, heißt stetig differenzierbar
oder C1 -Abbildung, wenn F auf D differenzierbar und die Ableitung stetig ist. Sie heißt
stetig partiell differenzierbar, wenn alle partiellen Ableitungen ∂i F j auf D existieren und
stetig sind.
♦
Bemerkung 6.3.11. 1. Wegen Satz 6.3.9 gilt
F ist C1 − Abbildung ⇐⇒ F ist stetig partiell differenzierbar.
2. Das Differential ∂ F(x0 ) ist eine lineare Abbildung von Rn nach Rm . Diese kann mit
einer m × n-Matrix (Jacobi-Matrix) identifiziert werden. Eine m × n-Matrix kann als ein
Element von Rmn aufgefaßt werden. Damit können wir obige Überlegungen auch auf die
Ableitung von ∂ F anwenden: Die zweite Ableitung ∂ 2 F existiert an der Stelle x0 , wenn die
(ersten) partiellen Ableitungen von ∂ F, d.h. die zweiten partiellen Ableitungen ∂i ∂k F j von
F, existieren und in x0 stetig sind. Die zweite Ableitung von F ist stetig, wenn die zweiten
partiellen Ableitungen von F stetig sind.
♦
Definition 6.3.12. Eine Abbildung F : D → Rm , D ⊆ Rn offen, heißt r-mal stetig differenzierbar oder Cr -Abbildung mit r ∈ N>0 , wenn F auf D r-mal differenzierbar und die
Ableitung ∂ r F stetig ist. Sie heißt r-mal stetig partiell differenzierbar, wenn alle r-ten
partiellen Ableitungen von F auf D existieren und stetig sind.
♦
Bemerkung 6.3.13. 1. Es gilt also
F ist Cr − Abbildung ⇐⇒ F ist r − mal stetig partiell differenzierbar.
2. Setzen wir als 0-te Ableitung von F die Abbildung F selbst, d.h. ∂ 0 F = F, so können wir
die Mengen Cr (D, Rm ), r ∈ N, als die Menge aller Cr -Abbildungen von D in Rm einführen.
3. Es gilt Cr (D, Rm ) ⊆ Cs (D, Rm ) für r ≥ s.
4. Weiter sei C∞ (D, Rm ) die Menge aller Abbildungen von D nach Rm , die Cr für alle r ∈ N
T
sind, d.h. C∞ (D, Rm ) = r∈N Cr (D, Rm ).
5. Die Mengen Cr (D, Rm ), r ∈ N ∪ {∞}, sind Vektorräume.
6. Man schreibt kurz Cr (D) für Cr (D, R1 ).
♦
Beispiel 6.3.14. Sei f (x, y) = 2x3 y2 − 4x2 y + 2 auf D = R2 . Dann
∂1 f (x, y) = 6x2 y2 − 8xy ,
∂2 f (x, y) = 4x3 y − 4x2 .
∂1 ∂1 f (x, y) = 12xy2 − 8y ,
∂2 ∂1 f (x, y) = 12x2 y − 8x
Weiter gilt
und
∂1 ∂2 f (x, y) = 12x2 y − 8x ,
∂2 ∂2 f (x, y) = 4x3 .
Damit ist f mindestens C2 ( f ist sogar C∞ ).
Wir bemerken ∂1 ∂2 f (x, y) = ∂2 ∂1 f (x, y).
♦
119
6 Differentialrechnung
Satz 6.3.15 (Satz von Schwarz). Für jede C2 -Abbildung F : D → R, D ⊆ Rn offen, gilt
∀x0 ∈ D ∀i, k ∈ {1, . . . , n} :
∂i ∂k F(x0 ) = ∂k ∂i F(x0 ) ,
d.h. die Matrix (∂i ∂k F(x0 ))i,k ist symmetrisch:
(∂i ∂k F(x0 ))>
i,k = (∂i ∂k F(x0 ))i,k .
Als Folgerung ergibt sich, daß bei Cr -Abbildungen aus Rn in Rm die Reihenfolge der Bildung der partiellen Ableitungen bis zur Ordung r nicht wesentlich ist.
Bezeichnungen:
∂22 = ∂2,2 = ∂2 ∂2 ,
∂1,3 = ∂1 ∂3 = ∂3 ∂1 .
6.3.5 Komplexe Ableitung
Wir beschäftigen uns hier kurz mit der Ableitung von Funktionen f : D → C, D ⊆ C offen.
Da jede komplexe Zahl z = a + ib ∈ C mit einem Paar (a, b) ∈ R2 indentifiziert werden
kann, kann f mit einer Abbildung F : D̃ ⊆ R2 → R2 ,
F(x, y) = (ℜ f (x + iy), ℑ f (x + iy)) für (x, y) ∈ D̃ := {(ξ , η) : ξ + iη ∈ D}
identifiziert werden, deren Fréchet-Differenzierbarkeit untersucht werden kann. Andererseits können wir, da C ein Körper ist, den Differenzenquotienten
f (z0 + h) − f (z0 )
h
für z0 ∈ D und hinreichend kleine h ∈ C definieren und damit die Ableitung wie im skalaren
Fall als Grenzwert des Differentialquotienten definieren.
Definition 6.3.16. Die Funktion f heißt an der Stelle z0 ∈ D (komplex) differenzierbar mit
der Ableitung f 0 (z0 ), wenn
f 0 (z0 ) = lim
h→0
f (z0 + h) − f (z0 )
h
♦
in C existiert.
Analog zum reellen Fall kann man auch hier die Äquivalenz mit der Zerlegungsformel
f (z0 + h) − f (z0 ) = f 0 (z0 )h + o(|h|) für h → 0
zeigen.
120
6.3 Partielle Ableitungen
Satz 6.3.17. Die Funktion f ist genau dann in z0 = x0 + iy0 ∈ D komplex differenzierbar,
wenn F in (x0 , y0 ) Fréchet-differenzierbar ist und die Cauchy-Riemann-Differentialgleichungen
∂1 F 1 (x0 , y0 ) = ∂2 F 2 (x0 , y0 ) ,
∂2 F 1 (x0 , y0 ) = −∂1 F 2 (x0 , y0 )
(6.3.2)
erfüllt sind. In diesem Fall gilt
f 0 (z0 ) = ∂1 F 1 (x0 , y0 ) + i∂1 F 2 (x0 , y0 ) .
Beweis. Seien
A=
α −β
β α
(6.3.3)
,
a = α + iβ
und h = ξ + iη. Dann gilt
A · (ξ , η) = (αξ − β η, β ξ + αη) = (ℜ(ah), ℑ(ah)) .
(6.3.4)
=⇒. Sei f in z0 = x0 + iy0 ∈ D komplex differenzierbar. Mit a = f 0 (z0 ) und α = ℜ f 0 (z0 ),
β = ℑ f 0 (z0 ) und (6.3.4) ergibt sich
kF(x0 + ξ , y0 + η) − F(x0 , y0 ) − A · (ξ , η)k
k(ξ , η)k
(ξ ,η)→(0,0)
| f (z0 + h) − f (z0 ) − a · h|
= 0.
= lim
h→0
|h|
lim
Also ist F in (x0 , y0 ) Fréchet-differenzierbar mit
[F 0 (x0 , y0 )] = A ,
so daß (6.3.2) gilt.
⇐=. Sei F in (x0 , y0 ) Fréchet-differenzierbar mit (6.3.2). Sei
a := ∂1 F 1 (x0 , y0 ) + i∂1 F 2 (x0 , y0 ) .
Dann gilt [F 0 (x0 , y0 )] = A mit α = ℜa, β = ℑa. Wegen (6.3.4) folgt
| f (z0 + h) − f (z0 ) − a · h|
h→0
|h|
kF(x0 + ξ , y0 + η) − F(x0 , y0 ) − A · (ξ , η)k
=
lim
= 0.
k(ξ , η)k
(ξ ,η)→(0,0)
lim
Somit ist f komplex differenzierbar mit (6.3.3).
Beispiel 6.3.18. 1. Sei f : C → C mit f (z) = z2 . Wegen
f (x + iy) = (x + iy)2 = x2 − y2 + i2xy
121
6 Differentialrechnung
haben wir F(x, y) = (x2 − y2 , 2xy). Damit lauten die Cauchy-Riemann-Differentialgleichungen
∂1 F 1 (x, y) = ∂2 F 2 (x, y) = 2x ,
∂2 F 1 (x, y) = −∂1 F 2 (x, y) = −2y .
Damit ist f komplex differenzierbar mit
f 0 (x + iy) = ∂1 F 1 (x, y) + i∂1 F 2 (x, y) = 2x + i2y ,
d.h., wie erwartet,
f 0 (z) = 2z .
2. Die Abbildung f : C → C mit f (z) = z̄ ist in keinem z ∈ C komplex differenzierbar:
Wegen
f (x + iy) = x − iy
haben wir F(x, y) = (x, −y) und damit
1 = ∂1 F 1 (x, y) 6= ∂2 F 2 (x, y) = −1 ,
Man beachte aber
0
[F (x, y)] =
∂2 F 1 (x, y) = −∂1 F 2 (x, y) = 0 .
1 0
0 −1
,
♦
so daß F sogar stetig diffenzierbar ist.
6.4 Anwendungen der Fréchet-Ableitung
6.4.1 Fehlerabschätzung und Approximation
Gesucht sei eine Größe z in Abhängigkeit von Größen x und y:
z = f (x, y) .
Anstelle der exakten Größen x und y seien nur gemessene oder nur näherungsweise bekannte
Größen x̄ und ȳ bekannt. Damit
x̄ = x + ∆x ,
ȳ = y + ∆y
mit (absoluten) Meßfehlern ∆x und ∆y. Anstelle von z = f (x, y) hat man dann z̄ = f (x̄, ȳ).
Häufig hat man eine Schranke für die Meßfehler
|∆x| ≤ δx ,
|∆y| ≤ δy
und interessiert sich für die Abschätzung des absoluten Fehlers
| f (x, y) − f (x̄, ȳ)| .
122
6.4 Anwendungen der Fréchet-Ableitung
Ist f im interessierenden Bereich D differenzierbar, dann erhalten wir mit dem Mittelwertsatz (Satz 6.2.21)
f (x, y) − f (x̄, ȳ) = ∂ f (x̃, ỹ)(∆x, ∆y)
mit (x̃, ỹ) zwischen (x, y) und (x̄, ȳ). Der Fréchet-Ableitung ∂ f (x̃, ỹ) entspricht die JacobiMatrix
(∂1 f (x̃, ỹ), ∂2 f (x̃, ỹ))
und damit haben wir
| f (x, y) − f (x̄, ȳ)| = |∂1 f (x̃, ỹ)∆x + ∂2 f (x̃, ỹ)∆y|
|∂1 f (x̃, ỹ)| + δy
≤ δx
sup
sup
|∂2 f (x̃, ỹ)|
(x̃,ỹ)∈I(x,y),(x̄,ȳ)
(x̃,ỹ)∈I(x,y),(x̄,ȳ)
≈ δx |∂1 f (x̄, ȳ)| + δy |∂2 f (x̄, ȳ)|, wenn δx , δy sehr klein.
Beispiel 6.4.1. Wir betrachten den Drillwinkel φ eines zylindrischen Stabes
φ=
2lN
πr4 G
mit der Länge l, dem Radius r, dem Drehmoment N und dem Torsionsmodul G. Durch
Untersuchung des relativen Fehlers entscheide man, welche Größe bei der Berechnung von
G besonders sorgfältig gemessen werden muß.
Wir haben
G = G(φ , l, r, N) =
2lN
.
πr4 φ
Seien φ̄ , l,¯ r̄, N̄ die gemessenen Größen mit den Fehlern ∆φ , ∆l, ∆r, ∆N. Dann gilt für den
relativen Fehler
|
G − Ḡ
1
|≈
|∂1 G∆φ + ∂2 G∆l + ∂3 G∆r + ∂4 G∆N|
G
|G|
2lN
2N
−8lN
2l
1
| − 4 2 ∆φ + 4 ∆l + 5 + 4 ∆N|
=
|G|
πr φ
πr φ
πr φ πr φ
∆φ ∆l
∆r ∆N
= |−
+ −4 +
|
φ
l
r
N
∆φ
∆l
∆r
∆N
≤ | | + | | + 4| | + |
|.
φ
l
r
N
Folglich hat der relative Fehler von r den größten Einfluß, r sollte also (relativ) am genauesten gemessen werden.
♦
6.4.2 Richtungsableitungen
Sei f : D ⊆ Rn → R.
123
6 Differentialrechnung
Definition 6.4.2. Ein Vektor r ∈ Rn mit krk = 1 heißt Richtung.
♦
Sei x0 ∈ D, Sx0 ,r = {x0 + tr : t ≥ 0} der Strahl von x0 in Richtung r.
Definition 6.4.3. Sei x0 Häufungspunkt von Sx0 ,r ∩ D. Falls der Grenzwert
lim
t&0
f (x0 + tr) − f (x0 )
t
existiert, heißt er Richtungsableitung oder Gateaux-Differential von f an der Stelle x0 in
Richtung r.
♦
Bezeichnung:
∂
f (x0 ) oder ∂r f (x0 ) .
∂r
Satz 6.4.4. Sei f : D ⊆ Rn → R im inneren Punkt x0 ∈ D differenzierbar. Dann besitzt f in
diesem Punkt für jede Richtung r ∈ Rn eine Richtungsableitung ∂r f (x0 ) und es gilt
∂r f (x0 )
| {z }
=
Gateaux−Differential
∂ f (x0 )r.
| {z }
(6.4.1)
Frechet−Differential
Beweis. Da f in x0 differenzierbar, gilt
f (x0 + tr) − f (x0 ) = ∂ f (x0 )(tr) + o(ktrk) = t f (x0 )r + o(t)
für t ≥ 0 mit x0 + tr ∈ D.
Bemerkung 6.4.5. 1. Das Gateaux-Differential r 7→ ∂r f (x0 ) ist (im Gegensatz zum FréchetDifferential r 7→ ∂ f (x0 )r) im allgemeinen nicht linear in r.
2. Das Gateaux-Differential existiert unter schwächeren Bedingungen als das FréchetDifferential.
♦
Satz 6.4.6. Sei f : D ⊆ Rn → R und sei x0 ∈ D innerer Punkt von D. Besitzt f alle Richtungsableitungen ∂r f (x0 ) in x0 und ist r 7→ ∂r f (x0 ) stetig, dann ist f in x0 differenzierbar.
Sei nun {e1 , . . . , en } wieder die kanonische Basis in Rn . Sei r ∈ Rn eine Richtung. Dann
n
r = ∑ ri ei und r = (r1 , . . . , rn ) mit ri = hr, ei i .
i=1
Aus (6.3.1) erhalten wir die Berechnungsformel
n
∂r f (x0 ) = ∑ ri ∂i f (x0 )
i=1
für in x0 differenzierbares f . Speziell haben wir
∂ei f (x0 ) = ∂i f (x0 ) ,
d.h., die partiellen Ableitungen sind spezielle Richtungsableitungen.
124
(6.4.2)
6.4 Anwendungen der Fréchet-Ableitung
Beispiel 6.4.7. Wir betrachten f : R2 → R mit f (x, y) = 3x2 y3 + x + y. Gesucht sind zuerst
die partiellen Ableitungen von f in (5, 2):
∂1 f (x, y) = 6xy3 + 1 und damit ∂1 f (5, 2) = 241
und
∂2 f (x, y) = 9x2 y2 + 1 und damit ∂2 f (5, 2) = 901 .
Nun interessiert uns die Richtungsableitung
von f in Richtung des noch zu normierenden
√
Vektors r0 = (−2, 1). Da kr0 k = 5, ist r = (− √25 , √15 ).
Nach Definition der Richtungsableitung haben wir
f (x0 + tr) − f (x0 )
t
t&0
h
i2 h
i3
2
1
√
√
3 5−t 5
2 + t 5 + 7 − t √15 − 607
= lim
t
t&0
ih
i
h
3 25 − t √205 8 + t √125 − t √15 − 600
= lim
t
t&0
3·25·12
3·8·20
600 + t √5 − t √5 − t √15 − 600
= lim
t
t&0
900 − 480 − 1 419
√
=
= √ .
5
5
∂r f (x0 ) = lim
Nutzen wir (6.4.2) so erhalten wir
1
−2 · 241 + 901 419
2
√
= √ .
∂r f (x0 ) = − √ ∂1 f (5, 2) + √ ∂2 f (5, 2) =
5
5
5
5
Offensichtlich ist der zweite Weg einfacher.
♦
6.4.3 Der Gradient
Sei D ⊆ Rn , F : D → Rm . Dann ist jedem x ∈ D ein Vektor F(x) zugeordnet. F nennt man
daher auch Vektorfeld über D.
Sei D ⊆ Rn offen und f ∈ C1 (D). Das Vektorfeld
grad f : D → Rn mit grad f (x) = (∂1 f (x), . . . , ∂n f (x))
heißt Gradient oder Gradientenfeld von f auf D.
125
6 Differentialrechnung
Bemerkung 6.4.8. 1. grad f (x) ist ein Vektor aus Rn .
2. Wegen (6.3.1) gilt
∂ f (x)h = hgrad f (x), hi .
3. Sei r eine Richtung in Rn . Wegen (6.4.1) gilt
∂r f (x) = hgrad f (x), ri .
♦
Wir untersuchen nun die Frage, für welche Richtung ∂s f (x0 ) maximal wird.
Ist grad f (x0 ) = 0, so gilt ∂s f (x0 ) = 0 für jede Richtung s.
Sei nun grad f (x0 ) 6= 0. Wegen (3.1.2) und ksk = 1 gilt
∂s f (x0 ) = hgrad f (x0 ), si ≤ kgrad f (x0 )k .
(6.4.3)
Sei
r = grad f (x0 ) − hgrad f (x0 ), si s .
Dann
hr, si = 0
und
kgrad f (x0 )k2 = hr + hgrad f (x0 ), si s, r + hgrad f (x0 ), si si
= hr, ri + hgrad f (x0 ), si2 .
Damit tritt in (6.4.3) genau dann das Gleichheitszeichen auf, wenn
r = 0 und hgrad f (x0 ), si > 0 .
Somit grad f (x0 ) = λ s mit λ = hgrad f (x0 ), si. Wir bestimmen λ aus ksk = 1 zu kgrad f (x0 )k.
grad f (x0 )
Damit wird ∂s f (x0 ) maximal für s = kgrad
f (x )k .
0
Folgerung 6.4.9. Der Gradient zeigt in Richtung des stärksten Anstiegs von f .
Beispiel 6.4.10. Man finde die Richtung, in der f (x, y) = 4x2 − 3y2 + 5 am stärksten im
Punkt (1, 1) wächst.
Es gilt ∂1 f (1, 1) = 8, ∂2 f (1, 1) = −6 und daher grad f (1, 1) = (8, −6). Wegen
√
kgrad f (1, 1)k = 64 + 36 = 10 ,
tritt der stärkste Anstieg in Richtung (4/5, −3/5) auf.
Weitere Anwendungen des Gradienten gibt es in den nächsten Abschnitten.
126
♦
6.4 Anwendungen der Fréchet-Ableitung
6.4.4 Tangentialhyperebene und Normalenvektor
Sei f : D → R mit D ⊆ Rn . Weiter sei f differenzierbar im inneren Punkt x0 ∈ D.
Definition 6.4.11. Die Hyperebene
(
!
n
x, f (x0 ) + ∑ ai (xi − x0i )
)
: x ∈ Rn
i=1
in Rn+1 heißt Tangentialhyperebene an die Hyperfläche
graph f = {(x, f (x)) : x ∈ D}
im Punkt (x0 , f (x0 )), wenn sich beide Hyperflächen mit Ordnung 1 berühren, d.h.
!
n
f (x) −
f (x0 ) + ∑ ai (xi − x0i )
= o(kx − x0 k) .
i=1
♦
Dies bedeutet aber
ai = ∂i f (x0 )
und
n
∑ ai(xi − x0i ) = ∂ f (x0)(x − x0) = hgrad f (x0), x − x0i .
i=1
Mit
(a, b) = (a1 , . . . , an , b)
für a ∈ Rn und b ∈ R erhalten wir damit:
Lemma 6.4.12. Die Menge
{(x0 , f (x0 )) + (h, hgrad f (x0 ), hi) : h ∈ Rn }
ist die Tangentialhyperebene in (x0 , f (x0 )), wobei (h, hgrad f (x0 ), hi), h ∈ Rn , einen Tangentialvektor darstellt.
Offensichtlich steht der Vektor n = (−grad f (x0 ), 1) senkrecht auf allen Tangentialvektoren
(h, hgrad f (x0 ), hi) und damit auf der Tangentialebene.
Lemma 6.4.13. Der Vektor n = (−grad f (x0 ), 1) ist Normalenvektor an die Tangentialhyperebene in (x0 , f (x0 )).
Beispiel 6.4.14. Wir betrachten f (x, y) = 4x2 − 3y2 + 5 auf D = R2 in (−1, 3, 18). Es gilt
∂1 f (−1, 3) = −8,
∂2 f (−1, 3) = −18 ,
so daß n = (8, 18, 1) Normalenvektor an die Tangetialhyperebene in (−1, 3, 18) ist. Wegen
√
√
knk = 64 + 324 + 1 = 389 ,
ist n0 =
√ 1 (8, 18, 1)
389
Normaleneinheitsvektor.
♦
127
6 Differentialrechnung
6.4.5 Niveauhyperflächen
Sei g : D ⊆ Rn → R stetig partiell differenzierbar auf D. Sei c ∈ R. Wir betrachten die
Menge
N = {x ∈ Rn : g(x) = c}
und nehmen an, daß N eine glatte differenzierbare Hyperfläche ist, d.h.,
N = {n(p) : p ∈ P},
n ∈ C1 (P, Rn )
mit P ⊆ Rn−1 . N heißt Niveauhyperfläche von g zum Niveau c.
Wegen g(n(p)) = c auf P, folgt mit der Kettenregel
0 = ∂ g(n(p))∂ n(p)h = hgradg(n(p)), ∂ n(p)hi = 0 ,
d.h., der Gradient von g in n(p) steht senkrecht auf allen Vektoren ∂ n(p)h mit h ∈ Rn−1 .
Wegen n(p + h) − n(p) = ∂ n(p)h + o(|h|) ist ∂ n(p)h ein Tangentialvektor an die Fläche N
im Punkt n(p). Die Menge
{n(p) + ∂ n(p)h : h ∈ Rn−1 }
stellt also die Tangentialhyperebene an N in (n(p), g(n(p))) dar.
Folgerung 6.4.15. Unter Voraussetzung von Existenz und Glattheit einer Niveauhyperfläche N von g steht der Gradient von g in einem Punkt n(p) der Fläche N senkrecht auf der
Tangentialhyperebene an N in (n(p), g(n(p))). Insbesondere ändert sich g nicht in Richtung
von Tangentialvektoren an N.
Als Spezialfall betrachten wir die Situation n = 2. Dann sind die Niveauhyperflächen (unter
geeigneten Voraussetzungen) Kurven im R3 (Höhenlinien) und der Gradient von g steht
senkrecht auf den Tangenten an den Höhenlinien.
6.4.6 Taylorpolynome
Definition 6.4.16. Sei f : D ⊆ R → R, x0 Häufungspunkt von D. Ein Polynom p heißt n-tes
Taylor-Polynom der Funktion f in x0 , wenn
1. degp ≤ n,
2. f und p berühren sich in x0 mindestens mit der Ordnung n.
♦
Satz 6.4.17 (Eindeutigkeit). Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D. Dann gibt
es für jedes n ∈ N höchstens ein n-tes Taylor-Polynom.
128
6.4 Anwendungen der Fréchet-Ableitung
Beweis. Seien p und q n-te Taylor-Polynome von f in x0 . Dann gilt f (x0 ) = p(x0 ) = q(x0 )
und
f (x) − p(x) = o(|x − x0 |n ) , f (x) − q(x) = o(|x − x0 |n )
für x → x0 .
Damit gilt
p(x) − q(x) = o(|x − x0 |n )
für x → x0 .
Da p − q ein Polynom höchstens vom Grad n ist, folgt p = q.
f
Damit ist die Bezeichnung Tx0 ,n für das n-te Taylor-Polynom von f in x0 gerechtfertigt.
Satz 6.4.18 (Existenz). Sei f : D ⊆ R → R, x0 ∈ D Häufungspunkt von D. Dann existiert
f
f
Tx0 ,1 genau dann, wenn f in x0 differenzierbar ist. Es gilt dann Tx0 ,1 (x) = f (x0 ) + f 0 (x0 )(x −
x0 ).
Eigenschaften:
f
f
k
• Wenn Tx0 ,n (x) = ∑nk=0 ck (x − x0 )k , dann Tx0 ,n−1 (x) = ∑n−1
k=0 ck (x − x0 ) .
• Ist f selbst ein Polynom p mit degp = n, dann gilt Txp0 ,n = p. Genauer: Wenn p(x) =
p
k
∑nk=0 ck (x − x0 )k , dann ist Tx0 ,m (x) = ∑m
k=0 ck (x − x0 ) für alle m ≤ n.
Offene Fragen:
f
• Wann existieren Tx0 ,n mit n > 1?
f
• Was kann Tx0 ,n als Ersatz für f leisten?
6.4.7 Die Taylor-Formel
Sei f : R → R ein Polynom, d.h.,
n
f (x) =
∑ ak x k
k=0
mit ak ∈ R. Dann ist
f
T0,m (x) =
m
∑ ak x k
k=0
für m ≤ n. Da f (0) (x0 ) = a0 , f (1) (x0 ) = a1 , f (2) (x0 ) = 2a2 , . . . , f (k) (x0 ) = k!ak für k ≤ n
haben wir
m
f (k) (x0 )
Txf0 ,m (x) := ∑
(x − x0 )k
(6.4.4)
k!
k=0
für unsere spezielle Situation eines Polynoms f und x0 = 0 gefunden.
129
6 Differentialrechnung
Mit
Rm ( f , x0 )(x) := f (x) − Txf0 ,m (x)
bezeichnen wir das Restglied. Damit gilt
m
f (x) =
∑
k=0
f (k) (x0 )
(x − x0 )k + Rm ( f , x0 )(x) .
k!
(6.4.5)
für jede in x0 m-mal differenzierbare Funktion f . Wesentlich ist nun, zu zeigen, daß
Rm ( f , x0 )(x) = o(|x − x0 |m )
für x → x0 .
(6.4.6)
Satz 6.4.19 (Taylor-Formel mit Restgliedabschätzung). Sei f ∈ Cm (D, R), D ⊆ R ein Intervall. Dann existiert eine Funktion θ : D → ]0, 1[, so daß (6.4.5), (6.4.6) gelten mit
Rm ( f , x0 )(x) =
f (m) (x0 + θ (x)(x − x0 )) − f (m) (x0 )
(x − x0 )m (1 − θ (x))m−1
(m − 1)!
(6.4.7)
und damit
|Rm ( f , x0 )(x)| ≤
1
sup | f (m) (x0 + t(x − x0 )) − f (m) (x0 )| · |x − x0 |m .
(m − 1)! 0<t<1
Ist f im Innern von D sogar (m + 1)-mal differenzierbar, dann gibt es für jedes p > 0 ein
ξ : D \ {x0 } → D mit ξ (x) ∈ Ix,x0 und der Schlömilch-Darstellung
f (m+1) (ξ (x))
Rm ( f , x0 )(x) =
pm!
x − ξ (x)
x − x0
m−p+1
(x − x0 )m+1 .
(6.4.8)
Speziell haben wir die Lagrange-Darstellung (p = m + 1)
f (m+1) (ξ (x))
(x − x0 )m+1
Rm ( f , x0 )(x) =
(m + 1)!
(6.4.9)
und die Cauchy-Darstellung (p = 1)
f (m+1) (ξ (x))
Rm ( f , x0 )(x) =
m!
x − ξ (x)
x − x0
m
(x − x0 )m+1 .
(6.4.10)
Beweis. Sei x ∈ D \ {x0 } fixiert und sei
m−1
h(t) := f (x) −
∑
k=0
f (k) (x0 + t(x − x0 ))
f (m) (x0 )
(x − x0 )k (1 − t)k −
(x − x0 )m (1 − t)m .
k!
m!
Dann gilt
h(0) = Rm ( f , x0 )(x) ,
130
h(1) = 0
6.4 Anwendungen der Fréchet-Ableitung
sowie
h0 (t) = −
m−1
∑
f (k+1) (x0 + t(x − x0 ))
(x − x0 )k+1 (1 − t)k
k!
k=0
m−1
+
+
=−
∑
f (k) (x0 + t(x − x0 ))
(x − x0 )k (1 − t)k−1
(k − 1)!
k=1
f (m) (x0 )
(m − 1)!
(x − x0 )m (1 − t)m−1
f (m) (x0 + t(x − x0 )) − f (m) (x0 )
(x − x0 )m (1 − t)m−1 .
(m − 1)!
Nach dem Mittelwertsatz (Satz 6.2.21) existiert ein (von x abhängiges) θ ∈ ]0, 1[ mit
−Rm ( f , x0 )(x) = h(1) − h(0) = h0 (θ )
und damit mit (6.4.7).
Für (6.4.8) betrachtet man
m
g(ξ ) :=
∑
k=0
f (k) (ξ )
(x − ξ )k ,
k!
h(ξ ) := (x − ξ ) p für ξ ∈ Ix,x0 .
Dann gilt g, h ∈ C(Ix,x0 , R1 ) und beide Funktionen sind auf Ix,x0 differenzierbar mit
g0 (ξ ) =
f (m+1) (ξ )
(x − ξ )m ,
m!
h0 (ξ ) = −p(x − ξ ) p−1 .
Mit dem verallgemeinertem Mittelwertsatz (Satz 6.2.20) folgt die Existenz eines (von x
abhängigen) ξ ∈ Ix,x0 mit
g(x) − g(x0 ) =
g0 (ξ )
(h(x) − h(x0 )) .
h0 (ξ )
Wegen
g(x) − g(x0 ) = Rm ( f , x0 )(x) und h(x) − h(x0 ) = −(x − x0 ) p
folgt (6.4.8).
Beispiel 6.4.20. 1. Wir betrachten f (x) = ex auf R. Dann ist f ∈ C∞ (R) und wir haben
f (x) = f 0 (x) = · · · = f (m+1) (x) .
Somit
ex =
m
xk
∑ + Rm( f , 0)(x)
k=0 k!
131
6 Differentialrechnung
mit
|Rm ( f , 0)(x)| ≤ sup eξ
ξ ∈I0,x
|xm+1 |
|x|m+1
≤ e|x|
→ 0 für m → ∞ .
(m + 1)!
(m + 1)!
Damit gilt
ex =
∞
xk
∑ .
k=0 k!
Wir haben somit ex in eine Potenzreihe, Taylorreihe genannt, entwickelt. Aufgrund der
Abschätzung des Restgliedes sehen wir, daß die Konvergenz in x auf jedem kompakten
Intervall [a, b] gleichmäßig verläuft:
n
xk
| = 0.
k=0 k!
lim max |ex − ∑
n→∞ x∈[a,b]
2. Wir betrachten f (x) = sin x und g(x) = cos x auf R. Dann sind f , g ∈ C∞ (R) und wir
haben
f 0 (x) = g(x) , f 00 (x) = − f (x) , f 000 (x) = −g(x) , f (4) (x) = f (x)
und damit
m
x2k+1
sin x = ∑ (−1)
+ R2m+1 ( f , 0)(x)
(2k + 1)!
k=0
k
mit
|R2m+1 ( f , 0)(x)| ≤
und
|x|2m+2
→ 0 für m → ∞
(2m + 2)!
m
cos x =
x2k
∑ (−1)k (2k)! + R2m(g, 0)(x)
k=0
mit
|x|2m+1
→ 0 für m → ∞ .
(2m + 1)!
Somit haben wir die Taylorentwicklungen
|R2m (g, 0)(x)| ≤
∞
sin x =
x2k+1
∑ (−1)k (2k + 1)! ,
k=0
3. Sei f (x) =
0,
−2
e−x ,
∞
cos x =
x2k
∑ (−1)k (2k)! .
k=0
für x ≤ 0 ,
Dann ist f (−0) = f (+0) = 0, also f stetig. Es gilt
für x > 0 .
f 0 (x) =
1 −x−2
e
x3
(x > 0)
und f 0 (+0) = f 0 (−0) = 0. Durch Fortsetzung erhält man f ∈ C∞ (R) mit f (k) (0) = 0 für
alle k ∈ N. Damit ist die Taylorreihe von f an der Stelle 0 identisch 0 und stimmt daher
nicht mit f überein! Die Folge der Restglieder (Rm ( f , 0)(x))m kann also für x nahe 0 nicht
konvergieren!
♦
132
6.4 Anwendungen der Fréchet-Ableitung
Bemerkung 6.4.21. Obwohl wir eine Darstellungen für das Restglied haben, ist die nichtlokale Approximation von f durch Taylorpolynome nicht die beste Wahl. Hierfür sollte
man andere Polynom-Approximationen verwenden.
♦
6.4.8 Mehrdimensionale Taylor-Formel
Wir wollen nun die Taylorformel auf Abbildungen f : D ⊆ Rn → R verallgemeinern. Abbildungen aus Rn nach Rm können durch Betrachtung der Koordinaten-Funktionen hierauf
zurückgeführt werden.
Da wir höhere partielle Ableitungen benötigen, brauchen wir ein geeignete Schreibweise.
Definition 6.4.22. Ein Element α von Nn heißt (n-dimensionaler) Multiindex. Die Zahl
n
|α| = ∑ α i
i=1
♦
heißt Odnung von α.
Bezeichnung: Sei α ein Multiindex. Wir setzen
1
n
∂ α f := ∂1α · · · ∂nα f ,
d.h., ist f in Cm so kann jede partielle Ableitung von f der Ordung m kurz als ∂ α f mit
einem α ∈ Nn und |α| = m geschrieben werden: So zum Beispiel
∂ (0,2,1,1) f = ∂4 ∂22 ∂3 f .
Weiter setzen wir
n
α! := ∏ α i ! = α 1 ! · · · · · α n !
i=1
und
n
xα := ∏(xi )α für x = (x1 , . . . , xn ) ∈ Rn .
i
i=1
Satz 6.4.23. Sei f ∈ Cm (D, R), D ⊆ Rn konvex und offen. Dann gilt
f (x) =
1 α
∂ f (x0 )(x − x0 )α + o(kx − x0 km ) für x → x0 .
α!
|a|≤m
∑
Beweis. Sei x ∈ D fixiert, h = x − x0 . Betrachte g : [0, 1] → R mit
g(t) = f (x0 + th) .
133
6 Differentialrechnung
Dann ist g ∈ Cm ([0, 1], R) und nach Satz 6.4.19 existiert ein τ : [0, 1] → ]0, 1[ mit
m
f (x) = g(1) =
und
Rm (g, 0)(t) =
g(k) (0)
∑ k! + Rm(g, 0)(t)
k=0
g(m) (τ(t)) − g(m) (0) m
t (1 − τ(t))m−1 .
(m − 1)!
Zu zeigen ist nun noch der Aufbau der Ableitungen g(k) (t) für k ≤ m. Nach k-facher Anwendung der Kettenregel für jeweils n partiellen Ableitungen erhalten wir
g(k) (t) =
n
n
ik =1
i1 =1
∑ · · · ∑ ∂ik · · · ∂i1 f (x0 + th)hi1 · · · · · hik .
Aufgrund der Vertauschbarkeit der Reihenfolge der partiellen Ableitungen können wir Summanden zusammenfassen, die zum gleichen Multiindex α ∈ Nn mit |α| = k gehören.
Ohne Beachtung mehrfacher partieller Ableitungen nach dem gleichen Argument sind dies
k! Varianten. Tritt ∂i aber α i > 1 mal auf, so ist noch durch die Zahl der nicht unterscheidbaren Permutationen zu teilen. Somit gehören zu α genau
k!
α 1! · · · · · α n!
=
k!
α!
Varianten und wir haben
g(k) (t) =
k! α
∂ f (x0 + th)hα .
α!
|α|=k
∑
6.4.9 Hinreichende Bedingungen für lokale Extrema
Sei f ∈ C1 (D, R), D ⊆ Rn offen. Satz 6.2.17 ergab ∂ f (x0 ) = 0, d.h.
grad f (x0 ) = 0
als notwendiges Kriterium für ein lokales Extremum. Ein Punkt x0 ∈ D mit grad f (x0 ) = 0
heißt daher kritischer Punkt.
Wir wollen nun hinreichende Bedingungen für lokale Maxima oder Minima finden.
Sei dazu f ∈ C2 (D, R) und x0 ein kritischer Punkt. Nach Satz 6.4.23 gilt
f (x0 + h) − f (x0 ) =
1 α
∂ f (x0 )hα + o(khk2 )
α!
|α|=2
∑
1
= QH ( f , x0 )(h) + o(khk2 )
2
134
6.4 Anwendungen der Fréchet-Ableitung
für h → 0 mit der quadratischen Form QH ( f , x0 ) : Rn → R mit
n
QH ( f , x0 )(h) =
∑
∂i ∂ j f (x0 )hi h j .
i, j=1
In der Algebra wird gezeigt, daß jede quadratische Form Q über Rn dargestellt werden kann
durch eine symmetrische lineare Abbildung A : Rn → Rn ,
Q(x) = hx, Axi ,
oder eine symmetrische Matrix H ∈ Rn×n ,
Q(x) = x> Hx .
Eine lineare Abbildung A : Rn → Rn heißt dabei symmetrisch, wenn
∀x ∈ Rn :
hx, Axi = hAx, xi .
Hier sehen wir
QH ( f , x0 )(h) = [h]> H( f , x0 )[h] (h ∈ Rn )
mit der Hesse-Matrix


∂1 ∂1 f (x0 ) · · · ∂1 ∂n f (x0 )


..
..
H( f , x0 ) := ∂i ∂ j f (x0 ) i, j = 

.
.
∂n ∂1 f (x0 ) · · · ∂n ∂n f (x0 )
von f an der Stelle x0 . Man beachte, daß H( f , x0 ) symmetrisch ist.
Definition 6.4.24. Eine quadratische Form Q heißt
• positiv definit, wenn Q(x) > 0 für alle x ∈ Rn mit x 6= 0;
• negativ definit, wenn Q(x) < 0 für alle x ∈ Rn mit x 6= 0;
• positiv semidefinit, wenn Q(x) ≥ 0 für alle x ∈ Rn ;
• negativ semidefinit, wenn Q(x) ≤ 0 für alle x ∈ Rn ;
• indefinit, wenn x1 , x2 ∈ Rn existieren mit Q(x1 ) < 0 < Q(x2 ).
♦
Lemma 6.4.25. Ist Q eine positiv definite quadratische Form auf Rn , dann existieren M, m >
0 mit
∀x ∈ Rn : mkxk2 ≤ Q(x) ≤ Mkxk2 .
135
6 Differentialrechnung
Beweis. Sei S = {x ∈ Rn : kxk = 1}. Dann ist S eine abgeschlossene und beschränkte und
daher kompakte Teilmenge von Rn .
Sei A eine symmetrische lineare Abbildung mit Q(x) = hx, Axi. Dann gilt
|Q(x + h) − Q(x)| = | hx + h, A(x + h)i − hx, Axi |
= | hx, Ahi + hh, Axi + hh, Ahi |
≤ 2| hAx, hi | + | hh, Ahi |
≤ 2kAxk · khk + kAhk · khk ,
weswegen Q stetig ist. Als stetige Abbildung nimmt sie auf S aber ein Maximum M und ein
Minimum m an, d.h., es existiert ein x0 ∈ S mit m = Q(x0 ) > 0. Für x ∈ Rn mit x 6= 0 gilt
nun
mkxk2 ≤ Q(x) = kxk2 Q(x/kxk) ≤ Mkxk2 .
Satz 6.4.26. Sei f ∈ C2 (D, R), D ⊆ Rn offen, und x0 ein kritischer Punkt. Wenn QH ( f , x0 )
positiv (negativ) definit ist, dann hat f in x0 ein strenges lokales Minimum (Maximum).
Beweis. Wie oben gezeigt haben wir
f (x0 + h) − f (x0 ) = QH ( f , x0 )(h) + o(khk2 ) für h → 0 .
Sei QH ( f , x0 ) positiv definit. Nach Lemma 6.4.25 existiert ein m > 0 mit QH ( f , x0 )(h) ≥
mkhk2 . Andererseits existiert für ε ∈ ]0, m[ ein δ > 0, so daß der Restterm betragsmäßig
kleiner als εkhk2 ist für khk < δ . Damit gilt
f (x0 + h) − f (x0 ) ≥ (m − ε)khk2 > 0 für 0 < khk < δ
und f hat in x0 ein strenges Minimum.
Ist QH ( f , x0 ) negativ definit, so betrachte man − f anstelle von f .
Satz 6.4.27. Sei f ∈ C2 (D, R), D ⊆ Rn offen, und x0 ein kritischer Punkt. Wenn QH ( f , x0 )
indefinit ist, dann hat f in x0 kein lokales Extremum.
Beweis. Wenn QH ( f , x0 ) indefinit ist, dann existieren h1 und h2 in Rn mit
c1 := QH ( f , x0 )(h1 ) < 0 und c2 := QH ( f , x0 )(h2 ) > 0 .
Für hinreichend kleine |τ| gilt also
f (x0 + τhi ) − f (x0 ) = QH ( f , x0 )(τhi ) + o(kτhi k2 ) = ci τ 2 + o(τ 2 ) für τ → 0 .
Damit haben wir
f (x0 + τh1 ) < f (x0 ) und f (x0 + τh2 ) > f (x0 )
für hinreichend kleine |τ|.
136
6.4 Anwendungen der Fréchet-Ableitung
Bemerkung 6.4.28. Es verbleibt also nur noch der Fall, daß QH ( f , x0 ) positiv oder negativ
semidefinit ist. Hier ist ohne weitere Informationen (zum Beispiel über höhere Ableitungen)
keine Aussage möglich.
♦
Die Definitheit von QH ( f , x0 ) kann man durch Untersuchung der Hesse-Matrix H( f , x0 )
erhalten:
Sei Q(x) = ∑ni, j=1 ai j xi x j mit symmetrischer Matrix A = (ai j )ni, j=1 ∈ Rn×n . Mit µk bezeichnen wir den k-ten Hauptminoren von A, d.h.
µk := det(ai j )ki, j=1 .
Satz 6.4.29. Sei Q(x) = ∑ni, j=1 ai j xi x j mit symmetrischer Matrix A = (ai j )ni, j=1 ∈ Rn×n .
• Q ist genau dann positiv definit (semidefinit), wenn alle Hauptminoren µ1 , . . . , µn
positiv (nichtnegativ) sind.
• Q ist genau dann negativ definit (semidefinit), wenn alle (−1)k µk positiv (nichtnegativ) sind.
Bemerkung 6.4.30. Für n = 2 haben wir
a
a
µ1 = a11 , µ2 = 11 12
a12 a22
= a11 a22 − a212 .
Ist x0 kritischer Punkt von f , so erhalten wir die hinreichenden Bedingungen
lokales Minimum:
lokales Maximum:
kein lokales Extremum:
∂12 f (x0 ) > 0 und ∂12 f (x0 )∂22 f (x0 ) − (∂1,2 f (x0 ))2 > 0
∂12 f (x0 ) < 0 und ∂12 f (x0 )∂22 f (x0 ) − (∂1,2 f (x0 ))2 > 0
∂12 f (x0 )∂22 f (x0 ) − (∂1,2 f (x0 ))2 < 0
♦
Beispiel 6.4.31. Sei f (x, y) = 3x2 y + 4y3 − 3x2 − 12y2 + 1 auf R2 . Wir haben
grad f (x, y) = (6xy − 6x, 3x2 + 12y2 − 24y)
und daher
(0, 0) ,
(0, 2) ,
(2, 1) ,
(−2, 1)
als kritische Punkte.
Weiter gilt
∂12 f (x, y) = 6y − 6 ,
(x, y)
(0, 0)
(0, 2)
(2, 1)
(−2, 1)
∂22 f (x, y) = 24y − 24 ,
∂12 f (x, y) ∂22 f (x, y) ∂1,2 f (x, y)
−6
−24
0
6
24
0
0
0
12
0
0
−12
∂1,2 f (x, y) = 6x .
lokales Maximum
lokales Minimum
kein lok. Extremum aber Sattelpunkt
kein lok. Extremum aber Sattelpunkt
♦
137
6 Differentialrechnung
Bemerkung 6.4.32. Mit Hilfe der Differentialrechnung können neben lokalen Extrema auch
weitere Eigenschaften der Abbildung untersucht werden: Wendepunkte, Monotonie, Konvexität, Konkavität. Dazu sei auf die Literatur verwiesen (z.B. Bronstein/Semendjajew). ♦
6.4.10 Auflösungssätze
Sei F : D(F) → R p mit D(F) ⊆ Rn × R p offen. Wir betrachten die Gleichung
F(x, y) = 0
(6.4.11)
und fragen, ob (6.4.11) in der Nähe einer Lösung (x0 , y0 ) von (6.4.11) nach y eindeutig
aufgelöst werden kann, d.h., ob eine Umgebung U = V ×W von (x0 , y0 ) und eine Funktion
f : V → W existiert, so daß (x, f (x)), x ∈ V , alle Lösungen von (6.4.11) in U darstellen.
In diesem Fall nennt man (6.4.11) lokal eindeutig nach y auflösbar.
Beispiel 6.4.33. 1. Sei F(x, y)√
= x − y2 in D(F)
√ = R>0 × R. In U = R>0 × R>0 bzw.
U = R>0 × R<0 finden wir y = x bzw. y = − x.
√
2. Sei F(x, y) = x2 +y2 −1 in D(F) = R×R. Für U = ]−1, 1[×R>0 haben wir y = 1 − x2 .
Bei (x0 , y0 ) = (1, 0) und (x0 , y0 ) = (−1, 0) kann aber nicht nach y lokal aufgelöst werden.
Jedoch kann nach x lokal aufgelöst werden.
3. Sei F(x, y) = x + y + µ sin y, |µ| < 1 in D(F) = R2 . Für jedes x gibt es genau ein y
mit (6.4.11). Damit gibt es eine Funktion g : R → R mit (x, g(x)) als einziger Lösung von
(6.4.11) für x ∈ R. Unter Voraussetzung der Differenzierbarkeit von g erhalten wir aus
F(x, g(x)) = 0 mit der Kettenregel
g0 (x) = −
∂1 F(x, (g(x))
,
∂2 F(x, (g(x))
falls ∂2 F(x, (g(x)) 6= 0. Es gilt hier aber ∂2 F(x, y) = 1 + µ cos y 6= 0. Bemerke, daß auch in
den vorherigen Beispielen ∂2 F(x0 , y0 ) 6= 0 in den Auflösungspunkten (x0 , y0 ) war.
♦
Für F ∈ C1 (D(F), R p ), D(F) ⊆ Rn × R p offen, (x0 , y0 ) ∈ D(F) definieren wir die partiellen
Ableitungen
D1 F(x0 , y0 ) := ∂ φ (0) , D2 F(x0 , y0 ) := ∂ ψ(0)
mit
φ (ξ ) = F(x0 + ξ , y0 ) ,
ψ(ξ ) = F(x0 , y0 + ξ ) ,
d.h., D1 F(x0 , y0 ) sei die Ableitung von F nach dem ersten Argument bei festgehaltenem
zweitem Argument an der Stelle (x0 , y0 ).
Satz 6.4.34 (Satz über implizite Abbildungen). Sei F ∈ C1 (D(F), R p ) mit D(F) ⊆ Rn ×
R p offen und sei (x0 , y0 ) ∈ D(F) mit F(x0 , y0 ) = 0.
138
6.4 Anwendungen der Fréchet-Ableitung
1. Wenn D2 F(x0 , y0 ) invertierbar ist, dann existieren Umgebungen V und W von x0 und
y0 , so daß (6.4.11) auf V × W eindeutig nach y auflösbar ist, d.h., es existiert ein
g : V → W , so daß (x, g(x)) für x ∈ V die einzige Lösung von (6.4.11) in V ×W ist.
2. Ist zusätzlich F ∈ Ck (D(F), R p ), k ≥ 1, so ist auch g eine Ck -Abbildung und es gilt
g0 (x0 ) = −D2 F(x0 , y0 )−1 D1 F(x0 , y0 ) .
(6.4.12)
Bemerkung 6.4.35. 1. Formel (6.4.12) ergibt sich einfach aus der Kettenregel.
2. Die Invertierbarkeit von D2 F(x0 , y0 ) ist gleichbedeutend mit der Invertierbarkeit der
Jacobi-Matrix [D2 F(x0 , y0 )] bzw. dem Nichtverschwinden Jacobi-Determinante
det([D2 F(x0 , y0 )]) .
3. Der übliche Beweis des Satzes verwendet den Banachschen Fixpunktsatz: Für geeignete
V und W sei M die Menge von stetigen Funktionen von V nach W . Man betrachte nun die
Abbildung G : M → (R p )V mit
G(h)(x) := h(x) − D−1
2 F(x0 , y0 )F(x, h(x)) .
Für ausreichend kleine V und W ist G eine kontrahierende Selbstabbildung, siehe Heuser,
Teil 2. Ist g ∈ M dann der Fixpunkt von G, so gilt
g(x) = g(x) − D−1
2 F(x0 , y0 )F(x, g(x))
und daher F(x, g(x)) = 0 für x ∈ V .
♦
Beispiel 6.4.36. Sei F(x, y) = (x2 + y2 − 1)(x2 + y2 − 9). Es gilt
D2 F(x, y) = 2y(x2 + y2 − 9) + 2y(x2 + y2 − 1) = 4y(x2 + y2 − 5) .
Lokale Auflösbarkeit folgt also für alle Punkte (x0 , y0 ) mit F(x0 , y0 ) = 0, y0 6= 0 und x02 +
y20 6= 5.
Satz 6.4.37 (Satz über die lokale Umkehrabbildung). Sei f ∈ Cr (D( f ), Rn ), D( f ) ⊆ Rn
offen, r ≥ 1. Sei y0 ∈ D( f ) und sei f 0 (y0 ) invertierbar. Dann ist f in y0 lokal invertierbar,
d.h., es existiert eine Umgebung V × W von ( f (y0 ), y0 ) und eine Abbildung g : V → W , so
daß f (g(x)) = x für x ∈ V . Darüber hinaus gilt g ∈ Cr (V,W ) und
g0 (x0 ) = f 0 (g(x0 ))−1
in x0 = f (y0 ) .
Beweis. Wähle F(x, y) = f (y) − x und wende Satz 6.4.34 an.
139
6 Differentialrechnung
Beispiel 6.4.38. 1. Sei f (y) = Ay mit einer linearen invertierbaren Abbildung A : Rn → Rn .
Dann ist g(x) = A−1 x und
−1



g0 (x)h = f 0 (g(x))−1 h = A0 (A−1 x)
| {z }
h = A−1 h .
f 0 (A−1 x)
Man beachte dabei f 0 (y) = A und nicht f 0 (y) = Ay!
2. Wir betrachten f (x, y) = (cos x cosh y, sin x sinh y) auf R2 und fragen nach der lokalen
Umkehrbarkeit. Es gilt
− sin x cosh y cos x sinh y
[∂ f (x, y)] =
cos x sinh y sin x cosh y
mit
det[∂ f (x, y)] = − sin2 x cosh2 y − cos2 x sinh2 y
= − sin2 x(1 + sinh2 y) − cos2 x sinh2 y
= − sinh2 y − sin2 x .
Damit ist f lokal umkehrbar für
(x, y) ∈ R2 \ {(kπ, 0) : k ∈ Z} .
♦
6.4.11 Extremwerte unter Nebenbedingungen
Beispiel 6.4.39. Gesucht ist ein Rechteck maximalen Flächeninhalts bei vorgebenem Umfang u. Wir haben also f (x, y) = xy, D( f ) = R≥0 × R≥0 zu maximieren unter der Nebenbedingung 2(x + y) = u.
Aus der Nebenbedingung finden wir y = u/2 − x und damit ist
g(x) = f (x, u/2 − x) = x(u/2 − x)
auf [0, u/2] zu maximieren. Es gilt g0 (x) = u/2 − 2x, so daß sich x0 = u/4 ∈ [0, u/2] als
kritischer Punkt ergibt. Offensichtlich ist dies auch die globale Maximalstelle.
Das Rechteck mit größtem Flächeninhalt bei gegebenem Umfang ist also das Quadrat.
♦
Verallgemeinerung: Gegeben sei eine Funktion f : D( f ) ⊆ Rn → R und eine Nebenbedingungs- oder Restriktionsmenge
N := {x ∈ D( f ) : φ (x) = 0}
mit φ : D( f ) → R p .
140
6.4 Anwendungen der Fréchet-Ableitung
Definition 6.4.40. f hat in x0 ∈ N ein relatives oder bedingtes Maximum (Minimum) unter
der Nebenbedingung N, wenn eine Umgebung U von x0 existiert, so daß f (x) ≤ f (x0 ),
( f (x) ≥ f (x0 )) für alle x ∈ U ∩ N.
♦
Zur Herleitung einer notwendingen Bedingung für ein relatives Extremum gehen wir wie
im Beispiel davan aus, daß wir die Nebenbedingung φ (x) = 0 nach einem Teil der Variablen
auflösen können und damit eine explizite Beschreibung von N bekommen.
Wir nehmen dazu an, daß (bei geeigneter Umsortierung von x) eine Funktion g : G ⊆
Rn−p → R p existiert mit
(y, g(y)) ∈ D( f ) und
φ (y, g(y)) = 0
für y ∈ G .
Damit haben wir ein lokales Extremum von
h(y) = f (y, g(y))
auf G zu suchen.
Wenn G nun offen, f und g differenzierbar sind, so ist
0 = h0 (y0 ) = D1 f (y0 , g(y0 )) + D2 f (y0 , g(y0 )g0 (y0 )
(6.4.13)
nach Satz 6.2.17 notwendig für ein Extremum in x0 = (y0 , g(y0 )).
Ist φ differenzierbar, so erhalten wir aus φ (y, g(y)) = 0 für y ∈ G durch Anwendung der
Kettenregel:
D1 φ (y, g(y)) + D2 φ (y, g(y))g0 (y) = 0 .
Ist die lineare Abbildung D2 φ (y, g(y)) invertierbar für alle y ∈ G, so folgt
g0 (y) = −D2 φ (y, g(y))−1 D1 φ (y, g(y))
und durch Einsetzen in (6.4.13) erhalten wir
D1 f (y0 , g(y0 )) − D2 f (y0 , g(y0 )D2 φ (y0 , g(y0 ))−1 D1 φ (y0 , g(y0 )) = 0 .
Bezüglich der kanonischen Basen entspricht dies der Matrizen-Gleichung
p
[D1 φ (y0 , g(y0 ))] = 0
[D1 f (y0 , g(y0 ))] −(λ1,i )i=1
|
{z
}
|
{z
}
1×(n−p)
mit
p×(n−p)
p
(λ1,i )i=1
:= [D2 f (y0 , g(y0 )] [D2 φ (y0 , g(y0 )]−1 ,
|
{z
}|
{z
}
1×p
d.h.,
p×p
p
[D2 f (y0 , g(y0 )] = (λ1,i )i=1
[D2 φ (y0 , g(y0 )] .
141
6 Differentialrechnung
Damit erhalten wir
p
Di f (x01 , . . . , x0n ) =
∑ λ1, j Diφ j (x01, . . . , x0n) ,
j=1
d.h.,
p
grad f (x0 ) − ∑ λ j gradφ j (x0 ) = 0 ,
φ (x0 ) = 0
(6.4.14)
j=1
mit λ j ∈ R in einer bedingten Extremalstelle x0 von f in N, wobei die unbekannte Abbildung
g nicht in (6.4.14) enthalten ist.
Zusammenfassung: Wir benötigten
• die Differenzierbarkeit von f und φ in x0 ,
• die lokale Auflösbarkeit von φ (x) = 0 bei x0 (d.h., Splittung von x ∈ Rn in (y, z) ∈
Rn−p × R p , Existenz der Abbildung g mit φ (y, g(y)) = 0 nahe y0 ),
• die Glattheit von g und
• die Invertierbarkeit von D2 φ (y0 , g(y0 )).
Der letzte Punkt kann dahingehend verallgemeinert werden, daß [φ 0 (x0 )] eine invertierbare
p × p-Untermatrix besitzt, also vom Rang p ist. Satz 6.4.34 sagt nun, daß gerade diese
Rangeigenschaft hinreichend ist um Existenz und Glattheit zur erhalten. Damit haben wir
Satz 6.4.41. Seien f ∈ C1 (D( f ), R), φ ∈ C1 (D( f ), R p ) mit offenem D( f ) ⊆ Rn , n ≥ p. Sei
weiter N = {x ∈ D( f ) : φ (x) = 0}, x0 ∈ N und rang(φ 0 (x0 )) = p.
Wenn f in x0 ein relatives Extremum unter der Nebenbedingung N hat, dann existieren
Zahlen λ1 , . . . , λ p mit (6.4.14).
Bemerkung 6.4.42. 1. Das Kriterium ist im allgemeinen nicht hinreichend, das heißt, ob
in einer kritischen Stelle tatsächlich ein Extremum vorliegt, muß natürlich noch geprüft
werden.
2. (6.4.14) ist ein nichtlineares System von n + p Gleichungen für die n + p Unbekannten
x01 , . . . , x0n , λ1 , . . . , λ p . Setzt man
p
F(x, λ ) = f (x) − ∑ λ j φ j (x)
j=0
so erhält man (6.4.14) durch
gradF(x0 , λ ) = 0 .
3. Im Falle p = 1 lautet die Rangeigenschaft gradφ (x0 ) 6= 0 und (6.4.14) bedeutet, daß
grad f (x0 ) und gradφ (x0 ) parallel sind.
4. Die Zahlen λi heißen Lagrange-Multiplikatoren. Meist haben sie keine inhaltliche Bedeutung. In einigen Fällen können sie aber als Zwangskräfte (Physik) oder Schattenpreise
(Wirtschaft) interpretiert werden.
♦
142
6.4 Anwendungen der Fréchet-Ableitung
Beispiel 6.4.43. 1. Sei A eine lineare Abbildung von Rn nach Rn mit
f (x) = hx, Axi = hAx, xi
für x ∈ Rn . Gesucht sind Minimum und Maximum von f auf
N = {x ∈ Rn : φ (x) = 0} ,
φ (x) = hx, xi − 1
(Vergleiche Lemma 6.4.25).
Es gilt ∂ f (x)h = 2 hAx, hi und ∂ φ (x)h = 2 hx, hi also
grad f (x) = 2Ax ,
gradφ (x) = 2x .
Für eine Extremalstelle müssen wir also x0 ∈ N und λ ∈ R finden mit
Ax0 = λ x0 .
Als Extremalstellen kommen also alle normierten Eigenvektoren von A in Betracht, λ wäre
der zu x0 gehörende Eigenwert. Bemerke, daß A nur reelle Eigenwerte hat, da A symmetrisch ist. Für eine solche kritische Stelle erhalten wir
f (x0 ) = hx0 , Ax0 i = λ ,
so daß f das Maximum im normierten Eigenvektor mit dem größtem Eigenwert λmax (A) und
das Minimum im normierten Eigenvektor mit dem kleinsten Eigenwert λmin (A) annimmt.
Wir erhalten somit
∀x ∈ R :
λmin (A)kxk2 ≤ hx, Axi ≤ λmin (A)kxk2
für symmetrisches, lineares A.
2. Man finde alle Punkte (x, y) auf der Ellipse φ (x, y) := 4x2 + y2 − 4 = 0, für welche der
Abstand zu (2, 0) extremal wird.
Da der Abstand genau dann extremal wird, wenn sein Quadrat extremal wird, können wir
also nach Extremstellen von f (x, y) = (x − 2)2 + y2 suchen. Da
grad f (x, y) = (2(x − 2), 2y) ,
gradφ (x, y) = (8x, 2y) ,
erhalten wir als notwendige Bedingung
2x0 − 4 − 8λ x0 = 0 ,
2y0 − 2λ y0 = 0 ,
4x02 + y20 = 4 .
√
√
Wenn y0 6= 0, dann λ = 1 und daher x0 = − 32 und y0 = − 23 5 oder y0 = + 23 5.
Wenn y0 = 0, dann ist x0 = 1 oder x0 = −1 mit λ = − 41 bzw. λ = 34 .
√ √ Durch geometrische Betrachtungem erhalten wir, daß in − 32 , − 23 5 und − 23 , + 23 5
relative Maxima und in (1, 0), (−1, 0) relative Minima vorliegen.
♦
143
6 Differentialrechnung
6.5 Potenzreihen
6.5.1 Definition und Problemstellung
Definition 6.5.1. Sei (an ) eine Folge in C, z, z0 ∈ C. Dann heißt
∞
∑ an(z − z0)n
(6.5.1)
n=0
Potenzreihe in z − z0 .
♦
Man beachte hierbei (z − z0 )0 = 1 auch für z = z0 .
Aufgabenstellung: Untersuchung des Konvergenzverhaltens von Potenzreihen. Genauer:
bei gegebenen (an ) und z0 ist nach der Menge aller z ∈ C gefragt für die (6.5.1) konvergiert.
Beispiel 6.5.2. 1. Jede Potenzreihe (6.5.1) konvergiert für
p z = z0 . Es ist möglich, daß sie
n (z − z )n (Es gilt n nn |z − z |n = n|z − z | → ∞ und
n
nur für z = z0 konvergiert, z.B. ∑∞
0
0
0
n=0
nach Wurzelkriterium liegt Divergenz vor).
n
(z−z0 )
konvergiert für alle z ∈ C, denn nach dem Quotientenkrite2. Die Potenzreihe ∑∞
n=0
n!
rium ist
1
n!(z − z0 )n+1
|z − z0 | = 0 .
| = lim
∀z ∈ C : lim |
n
n→∞ n + 1
n→∞ (n + 1)!(z − z0 )
♦
6.5.2 Konvergenzradius und Konvergenzkreis
Sei (an ) eine Folge in C und sei

falls ρ = ∞ ,
 0,
p
1/ρ , falls 0 < ρ < ∞ ,
ρ := lim sup n |an | und r :=

n→∞
∞,
falls ρ = 0 .
Definition 6.5.3. Die oben definierte Zahl r heißt Konvergenzradius der Potenzreihe
∞
∑ an(z − z0)n ,
n=0
BC (z0 , r) heißt Konvergenzkreis.
♦
Satz 6.5.4. Die Potenzreihe (6.5.1) konvergiert für alle z ∈ BC (z0 , r) absolut. Für alle z 6∈
BC (z0 , r) divergiert sie.
p
Beweis. Wegen lim supn→∞ n |an (z − z0 )n | = ρ|z − z0 | und mit dem Wurzelkriterium (Satz
n
4.4.4) erhalten wir die absolute Konvergenz der Potenzreihe ∑∞
n=0 an (z − z0 ) für alle z ∈
BC (z0 , r) und die Divergenz für alle z ∈ C \ BC (z0 , r).
144
6.5 Potenzreihen
Folgerung 6.5.5.
n
1. Die Potenzreihe ∑∞
n=0 an (z − z0 ) möge für ein z1 6= z0 konvergieren. Dann konvergiert
sie auch für alle z ∈ C mit |z − z0 | < |z1 − z0 | und zwar absolut. Es gilt r ≥ |z1 − z0 |.
n
2. Die Potenzreihe ∑∞
n=0 an (z − z0 ) möge für ein z1 divergieren. Dann divergiert sie
auch für alle z ∈ C mit |z − z0 | > |z1 − z0 |. Es gilt r ≤ |z1 − z0 |.
Beweis. Konvergiert die Reihe für z1 , so gilt z1 ∈ BC (z0 , r), d.h., |z1 − z0 | ≤ r, und die Reihe
konvergiert für z ∈ BC (z0 , |z1 − z0 |) ⊆ BC (z0 , r). Die zweite Aussage folgt aus der ersten.
Bemerkung 6.5.6. Über das Konvergenzverhalten auf dem Rand ihres Konvergenzkreises
kann keine allgemeine Aussage gemacht werden.
♦
√
n
n
Beispiel 6.5.7. 1. ∑∞
n=0 z . Hier ist z0 = 0, an = 1, ρ = lim supn→∞ 1 = 1 und daher
Konvergenzradius 1. Für |z| = 1 liegt nach Lemma 4.2.4 Divergenz vor.
p
√
zn
1
n
2. ∑∞
|an | = 1/ limn→∞ n n = 1 und
n=1 n . Hier ist z0 = 0, an = n . Es gilt ρ = lim supn→∞
damit haben wir Konvergenzradius 1. Bei z = −1 liegt (bedingte) Konvergenz, bei z = 1
Divergenz vor.
√
n −2
1 n
1
3. ∑∞
= 1 und daher Konvergenzn=1 n2 z . Hier ist z0 = 0, an = n2 , ρ = lim supn→∞ n
1
1 n
∞
∞
radius 1. Da ∑n=1 n2 konvergente Majorante für ∑n=1 n2 z bei |z| = 1 ist, liegt bei |z| = 1
absolute Konvergenz vor.
♦
6.5.3 Rechnen mit Potenzreihen
∞
n
n
Satz 6.5.8. Seien ∑∞
n=0 an (z − z0 ) und ∑n=0 bn (z − z0 ) Potenzreihen mit den Konvergenzradien ra und rb .
n
1. Seien α, β ∈ C. Die Potenzreihe ∑∞
n=0 (αan + β bn )(z − z0 ) hat einen Konvergenzradius r ≥ min{ra , rb } und für alle z ∈ BC (z0 , min{ra , rb }) gilt
∞
∑ (αan + β bn)(z − z0)
n
∞
=α
n=0
∑ an(z − z0)
n
∞
+β
n=0
∑ bn(z − z0)n .
n=0
n
2. Sei cn = ∑nk=0 ak bn−k . Dann hat die Potenzreihe ∑∞
n=0 cn (z − z0 ) einen Konvergenzradius r ≥ min{ra , rb } und für alle z ∈ BC (z0 , min{r1 , r2 }) gilt
!
!
∞
∑ cn(z − z0)
n=0
n
∞
=
∑ an(z − z0)
n=0
n
∞
·
∑ bn(z − z0)n
.
n=0
Beweis. Folgt aus entsprechenden Aussagen für Zahlenreihen.
∞
n
n
Satz 6.5.9 (Identitätssatz). Seien ∑∞
n=0 an (z − z0 ) und ∑n=0 bn (z − z0 ) Potenzreihen mit
den Konvergenzradien ra , rb > 0. Sei (wi ) eine Folge in BC (z0 , min{ra , rb }) \ {z0 } mit
145
6 Differentialrechnung
1. limi→∞ wi = z0 .
2. ∀i ∈ N :
∞
n
n
∑∞
n=0 an (wi − z0 ) = ∑n=0 bn (wi − z0 ) .
Dann sind die beiden Potenzreihen gleich, d.h., an = bn für alle n ∈ N.
Beweis. Siehe Literatur.
k
Satz 6.5.10 (Transformationssatz). Sei ∑∞
k=0 ak (z − z0 ) eine Potenzreihe mit Konvergenzradius r. Sei z1 ∈ BC (z0 , r). Dann gilt mindestens für alle z ∈ C mit |z − z1 | < r − |z1 − z0 |
die Gleichung
∞
∞
∞ n
k
k
mit bk = ∑
an (z1 − z0 )n−k .
(6.5.2)
∑ ak (z − z0) = ∑ bk (z − z1)
k
k=0
k=0
n=k
Satz 6.5.11 (Glattheit von Potenzreihen). Sei f : ]x0 −r, x0 +r[→ R mit f (x) = ∑∞
k=0 ak (x−
k
∞
x0 ) und r als Konvergenzradius der Potenzreihe. Dann gilt f ∈ C (]x0 − r, x0 + r[) mit
f 0 (x) =
∞
∑ kak (x − x0)k−1 .
k=1
k
Insbesondere gilt Tm ( f , x0 )(x) = ∑m
k=0 ak (x − x0 ) , die Taylorreihe stimmt also mit der Potenzreihe überein.
Beweis. Sei x1 ∈ ]x0 − r, x0 + r[ beliebig. Dann existiert ein δ > 0 mit
∞
∀x ∈ ]x1 − δ , x1 + δ [:
f (x) =
∑ bk (x − x1)k
(6.5.3)
k=0
und bk nach (6.5.2). Wir zeigen limx→x1 f (x) = f (x1 ) = b0 . Sei α < δ . Wegen der absoluten
∞
k
k
Konvergenz der Potenzreihe ∑∞
k=0 bk (x − x1 ) , konvergiert ∑k=0 |bk |α . Damit gilt
∞
σ :=
∑ |bk |α k−1 < ∞ .
k=1
Somit
∞
| f (x) − b0 | = |(x − x1 ) ∑ bk (x − x1 )k−1 | ≤ |x − x1 |σ
k=1
für |x − x1 | < α. Damit gilt limx→x1 f (x) = f (x1 ) = b0 und f ist stetig in x1 .
Es gilt weiter
∞
f (x) − f (x1 )
= ∑ bk (x − x1 )k−1 .
x − x1
k=1
Die rechts stehende Potenzreihe konvergiert und ist stetig in x. Damit existiert
f 0 (x1 ) = lim
x→x1
∞
f (x) − f (x1 )
= b1 = ∑ nan (x1 − x0 )n−1 .
x − x1
n=1
n−1 hat den gleichen Konvergenzradius wie die AusgangsDie Potenzreihe ∑∞
n=1 nan (x − x0 )
reihe. Durch vollständige Induktion folgt f ∈ C∞ (]x0 − r, x0 + r[).
146
7 Das Riemann-Integral
7.1 Definition und Eigenschaften
7.1.1 Definition des Riemann-Integrals
Definition 7.1.1. Sei a = x0 < x1 < · · · < xn = b. Dann heißt Z = {[xk−1 , xk ] : k = 1, . . . , n}
eine Zerlegung von [a, b] und Ik = [xk−1 , xk ] ein Zerlegungsintervall. Die Zahl
λ (Z) = max |I| = max |xk − xk−1 |
k=1,...,n
I∈Z
heißt Feinheit der Zerlegung.
0
Sind Z = {[xk−1 , xk ] : k = 1, . . . , n} und Z0 = {[xk−1
, xk0 ] : k = 1, . . . , n0 } zwei Zerlegungen, so
sei {x0 , . . . , xn } ∪ {x00 , . . . , xn0 0 } = {y0 , . . . , ym } mit yk < yk+1 die Menge aller gemeinsamen
Teilungspunkte und
Z ∧ Z0 := {[yk−1 , yk ] : k = 1, . . . , m} .
Eine Zerlegung Z0 heißt feiner als Z, wenn für jedes I 0 ∈ Z0 ein I ∈ Z existiert, mit I 0 ⊆ I. ♦
Definition 7.1.2. Eine Funktion f : [a, b] → R heißt Treppenfunktion,
wenn es eine Zerle
gung Z = {[xk−1 , xk ] : k = 1, . . . , n} von [a, b] gibt, so daß f ]x ,x [ , k = 1, . . . , n konstant
k−1 k
sind.
♦
Bemerkung 7.1.3. 1. Die Funktionswerte von f an den Teilungspunkten von Z sind beliebig.
2. Die Darstellung ist nicht eindeutig: Jede Verfeinerung Z0 vom Z (d.h., für alle I 0 ∈ Z0 gibt
es ein I ∈ Z mit I 0 ⊆ I) leistet das gleiche.
3. Man kann f als Linearkombination von charakteristischen Funktionen schreiben
N
f (x) =
∑ ck χIk (x)
k=1
mit ck ∈ R, Ik paarweise disjunkte (offene, abgeschlossene, . . . ) Intervalle mit
[a, b].
SN
k=1 Ik
=
4. Mit T ([a, b]), B([a, b]) bezeichnen wir die Menge aller Treppenfunktionen bzw. aller
beschränkten Funktionen auf [a, b].
♦
147
7 Das Riemann-Integral
Lemma 7.1.4. B([a, b]) ist ein Vektorraum und T ([a, b]) ist ein Untervektorraum von B([a, b]).
Beweis. ÜA.
Definition 7.1.5 (Integral einer Treppenfunktion). Sei f ∈ T ([a, b]) und sei f ]x ,x [ =
k−1 k
ck ∈ R bezüglich einer Zerlegung Z = {[xk−1 , xk ], k = 1, . . . , n}. Dann setzt man
n
Z b
f :=
a
∑ ck (xk − xk−1) .
♦
k=1
Bemerkung 7.1.6. 1. Damit diese Definition sinnvoll ist, muß gezeigt werden, daß sie von
der konkreten Zerlegung Z unabhängig ist. Sei f dazu Treppenfunktion mit der Zerlegung
Z0 . Dann ist f auch Treppenfunktion mit der Zerlegung Z ∧ Z0 . Man zeigt nun, daß mit
Z ∧ Z0 an Stelle von Z der gleiche Wert für das Integral entsteht.
2. Andere Bezeichnungen sind:
Z b
Z
f,
Z
f (x) dx ,
[a,b]
f (x) dx .
[a,b]
a
♦
Satz 7.1.7 (Eigenschaften des Integrals von Treppenfunktionen).
Seien f , g ∈ T ([a, b]), λ , µ ∈ R. Dann gilt
1.
Rb
a (λ
f + µg) = λ
Rb
a
f +µ
Rb
a
g (Linearität).
2. Aus f ≤ g folgt ab f ≤ ab g (Monotonie).
R
Speziell folgt aus f ≥ 0 auch ab f ≥ 0 (Positivität).
R
3. |
Rb
a
f| ≤
Rb
a
R
| f | ≤ (b − a) sup[a,b] | f |.
Beweis. Seien f und g dargestellt mit den Zerlegungen Z und Z0 . Dann können f und g
auch mit Z ∧ Z0 dargestellt werden. Hiermit sind die Aussagen aber trivial.
Definition 7.1.8 (Ober- und Unterintegral). Sei f ∈ B([a, b]). Dann setzt man das Oberintegral bzw. Unterintegral von f über [a, b] durch
Zb ∗
Z b
f := inf{
a
a
g : g ∈ T ([a, b]), g ≥ f } ,
Zb
Z b
f := sup{
∗
a
g : g ∈ T ([a, b]), g ≤ f } .
a
♦
148
7.1 Definition und Eigenschaften
Beispiel 7.1.9. 1. Für alle f ∈ T ([a, b]) gilt
Zb ∗
Zb
f=
Z b
f=
f.
∗
a
a
a
2. Für die Dirichletfunktion f : [0, 1] → R mit f (x) = 1 für x rational und f (x) = 0 für x
irrational gilt
Z1 ∗
Z1
f = 1,
f = 0.
∗
0
0
♦
Satz 7.1.10 (Eigenschaften von Ober- und Unterintegral).
Für alle f , g ∈ B([a, b]), λ ≥ 0 gilt
Zb
f≤
∗
a
Zb ∗
( f + g) ≤
a
Zb ∗
Zb ∗
f,
a
Zb
λf =λ
a
Zb ∗
∗
Zb
f,
a
f+
a
Zb ∗
Zb
g,
( f + g) ≥
∗
a
a
∗
a
Zb
Zb
λf =λ
Zb
f+
∗
a
f.
∗
a
g.
∗
a
Definition 7.1.11 (Riemann-Integral). Eine Funktion f ∈ B([a, b]) heißt Riemann-integrierbar,
wenn
Zb ∗
Zb
f.
f=
∗
a
a
In diesem Fall setzt man
Zb ∗
Z b
f :=
a
f
a
und nennt diese Zahl das Riemann-Integral von f über [a, b].
♦
Die Menge aller Riemann-integrierbaren Funktionen über [a, b] wird durch R([a, b]) bezeichnet.
Bemerkung 7.1.12. Aufgrund der Definition und von Beispiel 7.1.9 gilt
T ([a, b]) ⊂ R([a, b]) ⊂ B([a, b]) .
6=
6=
♦
149
7 Das Riemann-Integral
7.1.2 Existenz des Riemann-Integrals
Satz 7.1.13. Für f : [a, b] → R gilt f ∈ R([a, b]) genau dann, wenn für jedes ε > 0 Funktionen g, h ∈ T ([a, b]) existieren mit g ≤ f ≤ h und
Z b
(h − g) ≤ ε .
(7.1.1)
a
Beweis. „=⇒“ Wenn f ∈ R([a, b]), dann
Zb ∗
Zb
f=
∗
a
f
a
und für jedes ε > 0 existieren g, h ∈ T ([a, b]) mit g ≤ f ≤ h und
Z b
h≤
Z b
a
a
ε
f+ ,
2
Z b
f−
a
ε
≤
2
Z b
g.
a
Daraus folgt (7.1.1).
„⇐=“ Sei ε > 0 beliebig und seien g, h ∈ T ([a, b]) mit g ≤ f ≤ h und (7.1.1). Dann gilt
Z b
g≤
a
und daher
0≤
Zb ∗
Zb
f,
∗
a
a
Zb ∗
Zb
a
f−
∗
a
f≤
Z b
h
a
f <ε.
Satz 7.1.14. 1. Jede stetige Funktion auf [a, b] ist Riemann-integrierbar auf [a, b]:
C([a, b]) ⊂ R([a, b]) .
2. Jede monotone Funktion auf [a, b] ist Riemann-integrierbar auf [a, b].
Beweis. Zu 1. Da f stetig auf dem kompakten Intervall [a, b] ist, ist f auch gleichmäßig
ε
stetig. Sei ε > 0 beliebig. Dann existiert ein δ > 0 mit | f (x)− f (y)| < b−a
für x, y ∈ [a, b] mit
b−a
b−a
|x − y| < δ . Sei n ∈ N mit n < δ , xk = a + k n für k = 0, . . . , n und seien g, h ∈ T ([a, b])
definiert durch g(x) = min[xk−1 ,xk ] f (x) und h(x) = max[xk−1 ,xk ] f (x) für x ∈ [xk−1 , xk ] und
ε
k = 1, . . . , n. Dann gilt 0 ≤ h(x) − g(x) < b−a
für alle x ∈ ]xk−1 , xk [ und alle k = 1, . . . , n, d.h.,
Rb
Rb ε
für alle x ∈ [a, b]. Somit gilt a (h − g) ≤ a b−a < ε. Mit Satz 7.1.13 folgt die Behauptung.
Zu 2. O.B.d.A. sei f monoton wachsend. Sei ε > 0 beliebig und sei n ∈ N>0 mit b−a
n ( f (b)−
b−a
f (a)) < ε. Wir setzen xk = a + k n für k = 0, . . . , n und defineren g, h ∈ T ([a, b]) durch
150
7.2 Hauptsatz der Differential- und Integralrechnung
g(x) = f (xk−1 ) und h(x) = f (xk ) für x ∈ [xk−1 , xk ] und k = 1, . . . , n. Dann gilt g ≤ f ≤ h.
Weiter gilt
Z b
a
h−
n
Z b
g=
a
∑
k=1
n
f (xk )(xk − xk−1 ) − ∑ f (xk−1 )(xk − xk−1 )
k=1
n
b−a
∑ ( f (xk ) − f (xk−1))
n k=1
b−a
( f (b) − f (a)) < ε .
=
n
=
Mit Satz 7.1.13 folgt die Behauptung.
Definition 7.1.15. Eine Teilmenge µ von [a, b] heißt Lebesgue-Nullmenge oder hat das
Lebesgue-Maß 0, wenn es für jedes ε > 0 ein abzählbares System von Intervallen gibt, die
µ überdecken und deren Summe der Intervallängen kleiner als ε ist.
♦
Bemerkung 7.1.16. Jede abzählbare Menge hat das Lebesgue-Maß 0.
♦
Satz 7.1.17 (Satz von Lebesgue (1875-1941)). Eine Funktion f gehört zu R([a, b]) genau
dann, wenn f auf [a, b] beschränkt ist und auf [a, b] bis auf eine Lebesgue-Nullmenge stetig
ist.
Satz 7.1.18. Sei f ∈ R([a, b]) und sei f˜ : [a, b] → R mit f˜(x) = f (x) für alle x ∈ [a, b] mit
Ausnahme von endlich vielen Punkten. Dann ist f˜ ∈ R([a, b]) und
Z b
Z b
f=
a
f˜ .
a
Damit hängen Integrierbarkeit und auch der Wert des Integrals nicht davon ab, welche Werte
die Funktion auf endlich vielen Punkten annimmt.
7.2 Hauptsatz der Differential- und Integralrechnung
7.2.1 Stammfunktionen
Definition 7.2.1. Sei I ein Intervall. Eine Funktion F : I → R heißt Stammfunktion von
f : I → R, wenn
1. F ist differenzierbar auf I
2. F 0 (x) = f (x) für alle x ∈ I.
♦
151
7 Das Riemann-Integral
Beispiel 7.2.2. 1) F(x) = 2.3 + cos x ist eine Stammfunktion von − sin x auf I = R.
2) I = ]0, ∞[ und f (x) = 1x . Stammfunktion auf ]0, ∞[ ist F(x) = ln(x).
3) I = ] − ∞, 0[ und f (x) = 1x . Stammfunktion auf ]0, ∞[ ist F(x) = ln(−x), denn [ln(−x)]0 =
1
1
♦
−x (−1) = x .
Die beiden letzten Beispiele geben Anlaß, manchmal F(x) = ln |x| als Stammfunktion von
1
x auf R \ {0} zu bezeichnen, obwohl R \ {0} kein Intervall ist!
Lemma 7.2.3. Seien F1 und F2 Stammfunktionen von f auf dem Intervall I. Dann ist F1 −F2
konstant auf I. Ist F irgendeine Stammfunktion von f auf I und C eine beliebige Konstante,
dann ist auch F +C eine Stammfunktion von f auf I.
Beweis. (F1 − F2 )0 (x) = F10 (x) − F20 (x) = f (x) − f (x) = 0 für alle x ∈ [a, b]. Nach Mittelwertsatz (Satz 6.2.21) ist F1 − F2 konstant.
Wenn F 0 = f dann auch (F +C)0 = F 0 = f .
Definition 7.2.4. Die Menge
aller Stammfunktionen von f : I → R heißt unbestimmtes InR
tegral von f und wird mit f bezeichnet.
♦
Es gilt also
Z
f = {F +C : C ∈ R},
falls F eine Stammfunktion von f ist.
Bemerkung 7.2.5. Anstelle
R
f = {F +C : C ∈ R} wird auch, verkürzt,
Z
f (x) dx = F(x) +C
geschrieben. Dies ist aber nicht korrekt, da links eine Menge von Funktionen steht (mit
gebundener Variablen x), aber rechts der Wert einer Funktion an einer nicht genauer spezifizierten Stelle steht (mit freier Variablen x).
♦
Um zu überprüfen, ob eine Funktion F Stammfunktion von f auf dem Intervall I ist, ist zu
zeigen, daß F auf I differenzierbar ist mit F 0 (x) = f (x) für x ∈ I.
Bemerkung 7.2.6. Eine Tabelle von Stammfunktionen zu ausgewählten Funktionen erhält
man, indem man eine Liste von differenzierbaren Funktionen erstellt und neben einer solchen Funktion die Ableitung schreibt. Kehrt man eine solche Tabelle um, erhält man eine
Zuordnung von Funktionen und Stammfunktionen:
152
Funktion
Stammfunktion
potα für α 6= 0
ln
exp
sin
cos
Ableitung
Funktion
αpotα−1 für α 6= 0
pot−1
exp
cos
− sin
7.2 Hauptsatz der Differential- und Integralrechnung
7.2.2 Die Existenz der Stammfunktion
Seien f ∈ R([a, b]) und x ∈ [a, b]. Wegen [a, x] ⊆ [a, b] folgt f [a,x] ∈ R([a, x]), d.h., es existiert
eine Funktion Φ : [a, b] → R mit
Z
x
Φ(x) =
f.
a
Es gilt Φ(a) = 0 und Φ(b) =
Rb
a
f.
Satz 7.2.7. Sei f ∈ R([a, b]) und Φ : [a, b] → R mit Φ(x) =
Rx
a
f für x ∈ [a, b] . Dann gilt:
1. Φ ist stetig.
2. Wenn f in einem Punkt x0 ∈ [a, b] stetig ist, dann ist Φ in x0 differenzierbar und es
gilt
Φ 0 (x0 ) = f (x0 ) .
Beweis. (Der Beweis verwendet schon die Resulate aus 7.2.4)
1. Aus f ∈ R([a, b]) ⊂ B([a, b]) folgt die Beschränktheit von f auf [a, b]. Damit existiert ein
M > 0 mit | f (t)| ≤ M für t ∈ [a, b]. Seien x ∈ [a, b] und ε > 0. Sei h ∈ R mit
|h| < δ :=
ε
M+1
Dann
Φ(x + h) − Φ(x) =
und
Z x+h
x + h ∈ [a, b] .
f−
Z x
a
und daher
Z x+h
Z x+h
f=
a
f
x
M
ε <ε.
M+1
x
Somit ist Φ stetig (unabhängig davon, ob f Unstetigkeitsstellen besitzt).
|Φ(x + h) − Φ(x)| = |
f | ≤ |h|M ≤
2. Sei f in x0 ∈ [a, b] stetig. Dann existiert eine Funktion δ : R≥0 → R≥0 mit
|x − x0 | < δ (ε) ⇒ | f (x) − f (x0 )| < ε .
Wir setzen φ = f − f (x0 ). Sei ε > 0 beliebig und |h| < δ (ε) mit x0 + h ∈ [a, b]. Dann
|
Z x0 +h
φ | ≤ sign(h)
x0
Z x0 +h
x0
Z x0 +h
= sign(h)
x0
und somit
|
Z x0 +h
|φ |
| f − f (x0 )| < ε|h|
φ | = o(|h|) für h → 0
x0
153
7 Das Riemann-Integral
Somit ist
Φ(x0 + h) − Φ(x0 ) =
Z x0 +h
Z x0 +h
f=
x0
Z x0 +h
=
x0
( f (x0 ) + φ )
x0
Z x0 +h
f (x0 ) +
φ
x0
= f (x0 )h + o(|h|)
für h → 0 ,
d.h., Φ 0 (x0 ) = f (x0 ).
R x5 √
R √
Beispiel 7.2.8. Man berechne F 0 für F(x) = √
1 + t 2 dt. Sei Φ(u) = 0u 1 + t 2 dt. Dann
x3
0
5
3
2
F(x)
√ = Φ(x ) − Φ(x ). Der Integrand f (t) = 1 + t ist stetig, nach Satz 7.2.7 gilt Φ (u) =
1 + u2 . Damit
p
p
0
0 5
4
0 3
2
2
2
10
6
F (x) = Φ (x )5x − Φ (x )3x = x 5x 1 + x − 3 1 + x .
♦
Als Folgerung aus Satz 7.2.7 ergibt sich
Satz 7.2.9. Jede auf einem kompakten Intervall [a, b] stetige Funktion f besitzt auf diesem
Intervall eine durch
Z x
Φ(x) =
f
(7.2.1)
a
auf [a, b] definierte Stammfunktion Φ.
7.2.3 Der Hauptsatz
Sei jetzt F : [a, b] → R eine beliebige Stammfunktion einer Funktion f ∈ C([a, b]) und sei
Φ : [a, b] → R definiert durch (7.2.1). Nach Lemma 7.2.3 existiert eine Konstanten C mit
F = Φ +C .
Wegen F(a) = Φ(a) +C und Φ(a) = 0 folgt F(a) = C. Damit gilt
Φ = F −C = F − F(a) .
Wegen Φ(x) =
Rx
a
f erhalten wir somit die Newton-Leibniz-Formel
Z b
a
b
x=b
f = F(b) − F(a) =: F a = F(x)x=a .
(7.2.2)
Damit haben wir den folgenden Satz bewiesen:
Satz 7.2.10 (Newton-Leibniz). Ist f eine stetige Funktion auf einem kompakten Intervall
[a, b] und F eine beliebige Stammfunktion von f auf [a, b], dann gilt (7.2.2).
154
7.2 Hauptsatz der Differential- und Integralrechnung
Bemerkung 7.2.11. Die Newton-Leibniz-Formel (7.2.2) stellt eine „Äquivalenz“ der Berechnung des bestimmten Integral und der Stammfunktion für die Klasse der stetigen Funktionen auf einem kompakten Intervall her:
f ∈ C([a, b]) =⇒ f ∈ R([a, b])
⇓
f hat Stammfunktion F
♦
Als Verallgemeinerung von Satz 7.2.10 zeigen wir
Satz 7.2.12 (Hauptsatz der Differential- und Integralrechnung). Sei f ∈ R([a, b]) und es
existiere eine Stammfunktion F von f auf [a, b]. Dann gilt (7.2.2).
Beweis. Sei ε > 0 beliebig. RDann existieren nach Satz 7.1.13 Treppenfunktionen g und h
auf [a, b] mit g ≤ f ≤ h und ab (h − g) < ε. Seien Zg und Zh die zugehörigen Zerlegungen
und sei
Z = Zg ∧ Zh = {[xk−1 , xk ] : k = 0, . . . , n},
a = x0 < x1 < · · · < xn = b .
Dann gilt nach Mittelwertsatz 6.2.21
n
F(b) − F(a) =
n
∑ (F(xk ) − F(xk−1)) =
∑ f (ξk )(xk − xk−1)
k=1
k=1
mit ξk ∈ ]xk−1 , xk [. Andererseits ist
n
Z b
g=
a
n
Z b
∑ g(ξk )(xk − xk−1) ,
h=
a
k=1
∑ h(ξk )(xk − xk−1)
k=1
und wegen g ≤ f ≤ h folgt
Z b
F(b) − F(a) ∈ [
Z b
h] .
g,
a
a
Andererseits gilt auch
Z b
Z b
f ∈[
a
Z b
g,
a
und damit
|F(b) − F(a) −
h]
a
Z b
f| ≤ ε .
a
Da ε > 0 beliebig war, folgt die Behauptung.
Bemerkung 7.2.13. 1. Satz 7.2.12 wird auch 1. Hauptsatz der Differential- und Integralrechnung genannt. Der 2. Hauptsatz ist Satz 7.2.9 zur Existenz der Stammfunktion.
2. Eine Funktion f kann eine Stammfunktion haben,
√ obwohl sie nicht Riemann-integrierbar
ist. Betrachte z.B. F : [0, 1] → R mit F(x) = x x sin 1x für x ∈ ]0, 1] und F(0) = 0. Sei
155
7 Das Riemann-Integral
√
f : [0, 1] → R mit f (x) = 32 x sin 1x − √1x cos 1x für x ∈ ]0, 1] und f (0) = 0. Dann gilt F 0 = f ,
F ist also Stammfunktion von f . f ist aber nicht Riemann-integrierbar, da f nicht beschränkt
ist.
3. Eine Riemann-integrierbare Funktion braucht keine Stammfunktion zu haben. Sei dazu
f : [−1, 1] → R mit f (x) = 0 für x ∈ [−1, 0] und f (x) = 1 für x ∈ ]0, 1]. Da f eine Treppenfunktion ist, gilt f ∈ R([−1, 1]). f besitzt aber keine Stammfunktion: Angenommen, F
wäre Stammfunktion. Nach Mittelwertsatz gilt F(h) − F(0) = F 0 (τh)h = f (τh)h mit einem
= 1 und limh%0 F(h)−F(0)
= 0. Somit ist F entgegen
τ ∈ [0, 1]. Damit folgt limh&0 F(h)−F(0)
h
h
der Annahme nicht differenzierbar bei 0.
4. Für (7.2.2) sind also Riemann-Integrierbarkeit von f und die Existenz der Stammfunktion
zu fordern. Beides gilt aber wegen der Sätze 7.1.14 und 7.2.9 für stetiges f , siehe dann Satz
7.2.10.
♦
7.2.4 Eigenschaften des bestimmten Integrals und Struktur von
R([a, b])
Zuerst erweitern wir die Definition des Riemann-Integrals indem wir
Z b
f := −
Z a
f
a
b
für a > b setzen.
Für f : [a, b] → R und [c, d] ⊆ [a, b] schreiben wir kurz
f ∈ R([c, d]) ,
wenn f [c,d] ∈ R([c, d])
und
Z d
f :=
c
Z d c
f [c,d] .
Satz 7.2.14 (Algebraische Struktur). Für alle f , g ∈ R([a, b]) und alle λ , µ ∈ R gilt (λ f +
µg) ∈ R([a, b]) und
Z b
Z b
(λ f + µg) = λ
a
Z b
f +µ
a
g.
a
Weiter gilt
f g ∈ R([a, b]) .
Beweis. kompliziert.
Satz 7.2.15 (Monotonie-Eigenschaften bezüglich Integranden). Seien f , g ∈ R([a, b]), b ≥
a. Dann gilt
156
7.2 Hauptsatz der Differential- und Integralrechnung
Rb
a
f.
f≤
Rb
1. f ≥ 0 =⇒ 0 ≤
2. f ≤ g =⇒
Rb
a
a
g.
Rb
3. m ≤ f ≤ M mit m, M ∈ R =⇒ m(b − a) ≤
4. | f | ≤ M ∈ R =⇒ |
Beweis. 1) f ≥ 0 ergibt
Rb
a
f ≤ M(b − a).
a
f | ≤ M(b − a).
Z ∗b
f ≥ 0. Damit gilt
Rb
a
2) Aus g − f ≥ 0 folgt mit 1)
Rb
a (g −
f ≥ 0.
a
f ) ≥ 0 und somit mit Linearität
Rb
a
g≥
Rb
a
f.
3) Wähle g = M und wende 2) für obere Abschätzung an.
4) Folgt mit −M ≤ f ≤ M aus 3).
Satz 7.2.16 (Monotonie und Additivität bezüglich Integrationsbereich). Es gelten:
1. f ∈ R([a, b]) ∧ [c, d] ⊆ [a, b] =⇒ f ∈ R([c, d]).
2. Sei c ∈ [a, b]. Dann f ∈ R([a, b]) ⇐⇒ f ∈ R([a, c]) ∧ f ∈ R([c, b]).
3. f ∈ R([a, b]) ∧ c ∈ [a, b] =⇒
reich).
Rb
a
f=
Rc
a
f+
4. f ∈ R([a, b]) ∧ f ≥ 0 ∧ [c, d] ⊆ [a, b] =⇒
tionsbereich).
Rb
f (Additivität bezüglich Integrationsbe-
c
Rd
c
f≤
Rb
a
f (Monotonie bezüglich Integra-
Satz 7.2.17 (Absolute Integrierbarkeit). Es gilt:
1. f ∈ R([a, b]) =⇒ | f | ∈ R([a, b]), aber | f | ∈ R([a, b]) 6=⇒ f ∈ R([a, b]).
2. Wenn f ∈ R([a, b]) und b ≥ a, dann |
Rb
a
f| ≤
Rb
a
| f | ≤ (b − a) supx∈[a,b] | f (x)|.
Beweis. Zu 2. Aus −| f | ≤ f ≤ | f | und den Sätzen 7.2.14, 7.2.15 folgt −
Rb
a | f |.
Satz 7.2.18. Wenn f ∈ C([a, b]) mit f ≥ 0, dann
Rb
Rb
a
|f| ≤
Rb
a
f ≤
f = 0 =⇒ f = 0.
a
Satz 7.2.19 (1. Mittelwertsatz der Integralrechnung). Seien f , g ∈ R([a, b]) mit g ≥ 0.
Dann existiert ein µ ∈ [m, M] mit m = infx∈[a,b] f (x), M = supx∈[a,b] f (x), so daß
Z b
Z b
fg = µ
a
g.
(7.2.3)
a
Speziell gilt für g = 1
Z b
f = µ(b − a) .
a
Wenn zusätzlich f stetig ist, dann existiert ein ξ ∈ [a, b] mit
Z b
Z b
f g = f (ξ )
a
g.
a
157
7 Das Riemann-Integral
Beweis. Es gilt m ≤ f ≤ M und daher nach Satz 7.2.15
Z b
m
g≤
a
Wenn
setze
Rb
a
g = 0, folgt
Rb
a
Z b
fg ≤ M
a
Z b
g.
(7.2.4)
a
f g und wegen (7.2.4) gilt (7.2.3) gilt trivialer Weise. Wenn
Rb
µ := Ra b
a
fg
g
Rb
a
g>0
.
Wegen (7.2.4) gilt µ ∈ [m, M].
Ist f stetig, dann sind m und M Funktionswerte von f . Nach
dem Satz
von Bolzano-Cauchy
Rb
Rb
(Satz 5.2.23) existiert ein ξ ∈ [a, b] mit f (ξ ) = µ. Somit a f g = µ a g.
Satz 7.2.20 (2. Mittelwertsatz der Integralrechnung). Sei f monoton auf [a, b] und sei
g ∈ C([a, b]). Dann existiert ein ξ ∈ [a, b] mit
Z b
Z b
Z ξ
f g = f (a)
a
g + f (b)
a
g.
ξ
7.3 Integrationsmethoden
Sei
R
f die Menge aller Stammfunktionen von f über einem gegebenen Intervall.
Seien F, G Mengen von Funktionen über einem Intervall I. Seien λ , µ ∈ R und seien
h : I → R , φ : J → I. Dann setzen wir
λ F + µG := {λ f + µG : f ∈ F, g ∈ G}
und
F + h = { f + h : f ∈ F} ,
F ◦ φ = { f ◦ φ : f ∈ F} .
7.3.1 Linearität
Satz 7.3.1 (Linearkombination von Funktionen). 1. Seien f , g : I → R und λ , µ ∈ R.
Dann gilt
Z
Z
Z
(λ f + µg) ⊇ λ
2. Wenn zusätzlich f , g ∈ R([a, b]) und
R
f +µ
R
f 6= 0,
/ g 6= 0,
/ dann
Z b
Z b
(λ f + µg) = λ
a
Beweis. 1. Seien F ∈
Differentiation gilt
R
auf I .
g
Z b
f +µ
a
g.
a
R
f und G ∈ g und sei H = λ F + µG. Wegen der Linearität der
H 0 = λ F 0 + µG0 = λ f + µg
R
und somit H ∈ (λ f + µg).
2. Die Behauptung folgt aus 1. und dem Hauptsatz 7.2.12.
158
7.3 Integrationsmethoden
7.3.2 Partielle Integration
Als Folgerung aus der Produktregel der Differentialrechnung ergibt sich
Satz 7.3.2. 1. Seien u, v : I → R differenzierbar. Dann gilt
Z
0
uv = uv −
Z
u0 v
auf I .
2. Wenn zusätzlich uv0 , u0 v ∈ R([a, b]) und wenn u0 v 6= 0,
/ dann
R
Z b
a
b Z b 0
u v.
uv0 = (uv)a −
(7.3.1)
a
Beweis. 1. Sei F ∈ u0 v auf I. Die Funktion uv − F ist differenzierbar mit
R
(uv − F)0 = (uv)0 − F 0 = u0 v + uv0 − u0 v = uv0 ,
somit
uv −
Z
u0 v ⊆
Z
uv0 .
Z
0
Z
u0 v ,
Analog folgt
uv −
uv ⊆
und damit die erste Behauptung.
2. Die zweite Behauptung mit 1. und dem Hauptsatz 7.2.12.
Bemerkung 7.3.3. 1. Aufgrund der Sätze 7.1.14 und 7.2.9 gilt uv0 , u0 v ∈ R([a, b]) und
R 0
u v 6= 0,
/ wenn u, v ∈ C1 ([a, b]).
2. Stammfunktionen bzw. Integrale können durch partielle Integration bestimmt werden für:
xn ex ,
xn sin x ,
xn cos x ,
xα ln x ,
xn arctan x ,
xn arcsin x
Für die ersten drei Funktionen wird u = (x 7→ xn ) verwendet. Nach n-maliger partieller
Integration entsteht die Aufgabe der Bestimmung von Stammfunktion bzw. Integral von
exp ,
sin ,
cos .
Für die letzten drei Typen verwendet man v0 (x) = xα bzw. v0 (x) = xn . Vereinfachung entsteht
hier durch Differentiation der transzendenten Ausdrücke.
♦
Beispiel 7.3.4. 1. Mit 0 < a ≤ b gilt
Z b
Z b
ln =
a
a
b Z b 1
−
x dx
ln
·
1
=
(x
→
7
x
ln
x)
|{z} |{z}
a
a x
u
v0
= b ln b − b − a ln a + a .
159
7 Das Riemann-Integral
2. Sei Sm = sinm auf R. Dann gilt
R
Z
Sm =
Z
m
sin =
m−1
cos)0
sin
| {z } · (−
| {z }
u
0
Zv
= − sinm−1 · cos +(m − 1)
m−1
= − sin
Z
· cos +(m − 1)
sinm−2 cos2
sinm−2 (1 − sin2 )
= − sinm−1 · cos +(m − 1)Sm−2 + (1 − m)Sm
und wir erhalten daher die Rekursionsformel
Sm = −
Da
Z
S0 =
m−1
1 m−1
sin
· cos +
Sm−2 .
m
m
Z
sin0 3 (x 7→ x) und
S1 =
sin1 3 − cos ,
können wir Sm für gerade und ungerade m iterativ aus S0 bzw. S1 bestimmen.
Es gelten
π
2
Z
sin
m
0
π m − 1 Z π2 m−2
1 m−1
cos 02 +
= − sin
sin
m
m 0
Z π
m − 1 2 m−2
=
sin
m 0
und
π
2
Z
0
π
sin = ,
2
0
Z
π
2
sin1 = 1 .
0
Damit gilt
0
m−1 m−3
m m−2
m−1 m−3
m m−2
2
2
π
2
Z
m
sin =
· · · · · 12 · 1 π2 , falls m gerade ,
· · · · · 23 · 1 ,
falls m ungerade .
3. Es gilt
Z
x cos
|{z}
|{z}x dx = (x 7→ x sin x) − 2
u
v0
Z
x |{z}
sin x dx
|{z}
u1
v01
= (x 7→ x2 sin x) + 2(x 7→ x cos x) − 2
Z
cos x dx
3 (x 7→ (x2 sin x + 2x cos x − 2 sin x)) .
und daher
Z b
a
160
2
2
x2 cos
|{z}
|{z}x dx = b 7→ b sin b + 2b cos b − 2 sin b − a 7→ a sin a − 2a cos a + 2 sin a .
u
v0
♦
7.3 Integrationsmethoden
7.3.3 Substitutionsmethode
Die Kettenregel für die Differentiation von zusammengesetzten Funktionen führt zu einer
Methode der Transformation bestimmeter Integrale, der Substitutionsmethode der Integralvariablen.
Satz 7.3.5. 1. Sei φ : I = [a, b] → R differenzierbar und sei f : φ (I) → R. Dann gilt
Z Z
0
( f ◦ φ )φ ⊇
f ◦ φ auf I .
2. Wenn zusätzlich f ∈ R(φ ([a, b])), ( f ◦ φ )φ 0 ∈ R([a, b]) und
Z b
0
( f ◦ φ )φ =
R
f 6= 0,
/ dann
Z φ (b)
f.
(7.3.2)
φ (a)
a
Beweis. 1. Sei F ∈
R
f auf φ (I). Nach der Kettenregel gilt
∂ (F ◦ φ ) = ( f ◦ φ )φ 0
auf I
und daher F ◦ φ ∈ ( f ◦ φ )φ 0 .
R
2. Mit 1. und dem Hauptsatz 7.2.12 folgt
Z φ (b)
φ (a)
b Z b
f = F(φ (b)) − F(φ (a)) = F ◦ φ a =
( f ◦ φ )φ 0 .
a
Bemerkung 7.3.6.
1. Aufgrund der Sätze 7.1.14 und 7.2.9 gilt f ∈ R(φ ([a, b])), ( f ◦ φ )φ 0 ∈
R
R([a, b]) und f 6= 0,
/ wenn φ ∈ C1 ([a, b]) und f ∈ C(φ ([a, b])).
2. Sei X = R und φ = idX = dx die Identität auf X. Dann gilt φ 0 = id0X = idX = dx und daher
nach Satz 7.3.5
Z
Z
Z
Z
b
b
f (x) dx =
a
b
f=
a
a
( f ◦ idX )id0X =
b
f dx
a
Das Symbol dx im linken Integral zur Bezeichnung der Integrationsvariablen ist also, wie
im rechten Integral zu sehen ist, das Differential dx der Identität auf X.
♦
Beispiel 7.3.7. 1. Sei φ ∈ C1 ([a, b]). Dann
und daher
Z b 0
φ (x)
a
φ (x)
dx =
Z φ (b)
dx
φ (a)
x
R b φ 0 (x)
a φ (x)
Z
f (αx + β )dx = (
Rb
a
= ln |φ (b)| − ln |φ (a)| ,
2. Sei f ∈ C([a, b]), α, β ∈ R, α 6= 0. Dann
φ (x) = αx + β und daher
Z
dx =
f)◦φ ,
R
f (φ (x))φ 0 (x) dx mit f (x) =
wenn 0 6= φ ([a, b]) .
f (αx + β ) dx =
f (αx + β ) dx =
a
1
α
R
Z φ (b)
Z b
1
x
f (φ (x))φ 0 (x) dx mit
Z αb+β
f=
φ (a)
f.
αa+β
161
7 Das Riemann-Integral
Speziell folgt
dx
3 ln |(·) − a|
x−a
Z
dx
1
((·) − a)1−k
3
k
1−k
(x − a)
Z
(7.3.3)
(k 6= 1) .
(7.3.4)
3. Seien a, b ∈ R mit c2 = b − a2 > 0. Mit f (x) = x−k und φ (x) = x2 + 2ax + b gilt
2x + 2a
Z
dx 3 x 7→ ln |x2 + 2ax + b|
Z
2x + 2a
1
2
1−k
(x + 2ax + b)
dx 3 x 7→
1−k
(x2 + 2ax + b)k
(7.3.5)
x2 + 2ax + b
(k 6= 1) .
(7.3.6)
♦
In vielen Fällen ist der Integrand nicht sofort in der Form f (φ (x))φ 0 (x) mit geeigneter Substitution φ erkennbar. Vielfach ist aber der Integrand von der Form h(x) = g(x, φ (x)), und
man vermutet, eine Substitution φ könnte erfolgreich sein. Der folgende Satz sagt, wie man
dann die Funktion f mit
f (φ (x))φ 0 (x) = g(x, φ (x)) = h(x)
bestimmen muß:
Satz 7.3.8. 1. Sei h : [a, b] → R und es mögen g ∈ C([a, b]×[c, d], R) und ein streng monotones und differenzierbares φ : [a, b] → R mit [c, d] = φ ([a, b]), φ 0 (x) 6= 0 und h(x) = g(x, φ (x))
für x ∈ [a, b] existieren. Sei f : [c, d] → R definiert durch
f (z) :=
g(φ −1 (z), z)
φ 0 (φ −1 (z))
für z ∈ [c, d] .
Ist F eine Stammfunktion zu f auf [c, d], so ist F ◦ φ eine Stammfunktion zu h auf [a, b], d.h.,
Z Z
h⊇
f ◦ φ auf [a, b] .
2. Wenn zusätzlich h ∈ C([a, b]), φ ∈ C1 ([a, b]), dann
Z b
g(x, φ (x)) dx =
a
Beweis. 1. Sei F ∈
R
Z φ (b)
Z b
h=
a
f.
φ (a)
f auf [c, d]. Nach der Kettenregel gilt
(F ◦ φ )0 (x) = f (φ (x))φ 0 (x) =
g(x, φ (x)) 0
φ (x) = g(x, φ (x)) = h(x) auf [a, b] ,
φ 0 (x)
R
so daß F ◦ φ ∈ h folgt.
2. Nach Voraussetzung ist f stetig und ist damit integrierbar auf [c, d] und besitzt eine
Stammfunktion F auf [c, d]. Die Behauptung folgt damit aus dem Hauptsatz.
162
7.4 Integration gebrochen-rationaler Funktionen
Beispiel 7.3.9. Wir betrachten
Z
Wir vermuten φ (x) = ln x mit φ 0 (x) =
Z
1
x
dx
.
x(ln x)k
und erhalten
Z
dx
1
1
dz ◦ ln
=
x(ln x)k
ln−1 (z)zk ln0 (ln−1 (z))
Z
Z
1
dz
−1
ln (z)dz ◦ ln) =
◦ ln .
zk
ln−1 (z)zk
Damit erhalten wir
Z b
dx
a
x ln x
= ln | ln b| − ln | ln a| ,
Z b
a
dx
1 −1k
1−k
(ln
b)
−
(ln
a)
=
x(ln x)k 1 − k
wenn 0 < a ≤ b mit 1 6∈ [a, b].
für k > 1 ,
♦
7.4 Integration gebrochen-rationaler Funktionen
7.4.1 Partialbruchzerlegung
Sei R : D(R) → C eine gebrochen-rationale Funktion mit R(x) =
men p und q.
p(x)
q(x)
auf D(R) mit Polyno-
Zuerst bemerken wir, daß aufgrund von Satz ?? eindeutig bestimmte Polynome h und r
existieren mit
r(x)
p(x)
= h(x) +
für x ∈ D(R) , degr < degq .
q(x)
q(x)
Das Polynom h heißt Polynomanteil von R. Der Rest stellt eine echt gebrochen-rationale
Funktion dar.
Die Idee besteht nun darin, diesen echt gebrochen-rationalen Anteil in eine Summe einfacherer Brüche, Hauptteile genannt, zu zerlegen.
Beispiel 7.4.1.
10x−23
x2 −5x+6
=
10x−23
(x−2)(x−3)
=
3
x−2
7
+ x−3
.
♦
Satz 7.4.2 (Partialbruchzerlegung). Es sei R : D(R) → C eine gebrochen rationale Funkp(x)
für x ∈ D(R) mit Polynomen p, q und degp < degq. Seien z j , j = 1, . . . , n,
tion mit R(x) = q(x)
die Nullstellen von q mit den Vielfachheiten m j . Dann existieren eindeutig bestimmte a jk ∈ C
mit
n mj
a jk
R(x) = ∑ ∑
für x ∈ D(R) .
(7.4.1)
k
(x
−
z
)
j
j=1 k=1
163
7 Das Riemann-Integral
Beweis. O.B.d.A. sei der führende Koeffzient von q gleich 1, d.h.,
n
q(x) = ∏ (x − z j )m j .
j=1
Wir machen den Ansatz
p(x)
a
p1 (x)
=
+
m
1
q(x) (x − z1 )
q1 (x)
(7.4.2)
mit a ∈ C, einem Polynom p1 und einem Polynom q1 mit
q1 (x) =
q(x)
.
x − z1
Durch Multiplikation von (7.4.2) mit q(x) folgt
n
p(x) = a ∏ (x − z j )m j + (x − z1 )p1 (x) ,
(7.4.3)
j=2
woraus wir
n
a = p(z1 )/ ∏ (z1 − z j )m j
j=2
ablesen. Also ist a1m1 = a eindeutig bestimmt.
Aus (7.4.3) folgt
n
degp1 <
∑ m j ≤ degq1
∨
degp1 = degp − 1 < degq − 1 = degq1 .
j=2
Folglich können wir obige Argumentation auf p1 , q1 anwenden und erhalten in endlich
vielen Schritten die Behauptung.
Satz 7.4.3 (Reelle Partialbruchzerlegung). Es sei R : D(R) ⊂ R → R eine gebrochen rap(x)
tionale Funktion mit R(x) = q(x)
für x ∈ D(R) mit Polynomen p, q und degp < degq mit
reellen Koeffizienten. Seien z j , j = 1, . . . , nr , die reellen Nullstellen von q mit den Vielfachheiten m j und seien z j , z̄ j , j = nr+1 , . . . , n, die nichtreellen Nullstellen der Vielfachheit m j .
Dann existieren eindeutig bestimmte a jk , b jk , c jk ∈ R mit
nr m j
m
j
n
a jk
b jk x + c jk
+ ∑ ∑ 2
R(x) = ∑ ∑
k
2 k
j=1 k=1 (x − z j )
j=nr +1 k=1 (x − 2ℜ(z j )x + |z j | )
für x ∈ D(R) .
(7.4.4)
Beweis. Folgt aus Satz 7.4.2 durch Zusammenfassung der zu konjugiert komplexen Nullstellen gehörigen Terme.
164
7.4 Integration gebrochen-rationaler Funktionen
7.4.2 Praktische Berechnung der Partialbruchzerlegung
1. Schritt: Abspalten des Polynomanteils durch Division mit Rest
R(x) = p0 (x) +
p(x)
.
q(x)
2. Schritt: Bestimmung der Nenner-Nullstellen des echt-gebrochenen Anteils; kürzen von
Zähler und Nenner, damit
m
q(x) = ∏(x − xi )αi
mit p(xi ) 6= 0 ;
i=1
Abspaltung der Hauptteile durch entsprechenden Ansatz:
m αi
R(x) = p0 (x) + ∑
Ai j
∑ (x − xi) j
i=1 j=1
und damit
m
m αi
k=1
i=1 j=1
[R(x) − p0 (x)] ∏ (x − xk )αk = ∑
∑ Ai j
αk
∏m
k=1 (x − xk )
.
(x − xi ) j
Links und rechts stehen nun Polynome. Die Ai j ergeben sich durch Koeffizientenvergleich, der nach Satz 7.4.2 immer zum Erfolg führen muß.
Beispiel 7.4.4. f (x) =
x+1
.
x(x−1)2
Der 1. Schritt ist überflüssig.
2.: Nullstellen des Nenners sind 0 und 1, letztere mit Vielfachheit 2. Daher Ansatz
x+1
b
c
a
f (x) =
+
+
=
.
(7.4.5)
2
x(x − 1)
x − 0 x − 1 (x − 1)2
Damit
x + 1 = a(x − 1)2 + bx(x − 1) + cx = (a + b)x2 − (2a + b − c)x + a ,
(7.4.6)
d.h.,
a = 1,
−2a − b + c = 1 ,
a+b = 0
und deswegen
a = 1,
b = −1 ,
c = 2.
Zusammengefaßt ergibt sich
x+1
1
1
2
= −
+
.
2
x(x − 1)
x x − 1 (x − 1)2
♦
In vielen Fällen ist es sinnvoller, keinen vollständigen Koeffizientenvergleich durchzuführen, sondern einige Koeffizienten durch Einsetzen von Null- oder Polstellen oder auch anderen geeigneten Zahlen zu bestimmen.
In (7.4.6) kann man z.B. 0 einsetzen und erhält sofort a = 1. Durch Einsetzen von 1 ergibt
sich sofort c = 2. Der dritte Koeffizient b kann durch Koeffizientenvergleich oder durch
Einsetzen einer geeigneten Zahl bestimmt werden.
165
7 Das Riemann-Integral
7.4.3 Integrale der Hauptteile von Partialbrüchen
Mit Satz 7.4.2 bzw. 7.4.3 ist die Integration von gebrochen-rationalen Funktionen auf die
Integration folgender Ausdrücke zurückgeführt:
Ax + B
(x2 + 2ax + b)k
A
,
(x − a)k
mit a2 < b.
Mit (7.3.3) und (7.3.4) finden wir eine Stammfunktion zum ersten Ausdruck auf jedem
Intervall, das a nicht enthält.
Für k ∈ N≥1 gilt
A
1
Ax + B
2x + 2a
=
+
(B
−
aA)
.
k
2 (x2 + 2ax + b)k
(x2 + 2ax + b)k
(x2 + 2ax + b)
{z
}
{z
}
|
|
Ik,1 (x)
Ik,2 (x)
Stammfunktionen zu Ik,1 finden wir mit (7.3.5) bzw. (7.3.6). Verbleibt noch, eine Stammfunktion zu Ik,2 zu finden.
Mit c > 0 mit c2 = b − a2 , Jk (x) = (x2 + c2 )−k , φ (x) = x + a und Satz 7.3.5 haben wir auf
jedem Intervall in R
Z Z
Z
(Jk ◦ φ )φ 0 =
Ik,2 =
Jk ◦ φ .
Wie man durch Differentiation sieht, gilt
(·)
1
arctan
∈
c
c
Wir wollen nun
Wegen
R
Z
J1 .
Jk iterativ für k > 1 bestimmen. Sei u(x) = x, v(x) = x2 + c2
2(x2 + c2 ) − 2c2
u(x)v (x) = (1 − k)
= 2(1 − k)Jk−1 − 2(1 − k)c2 Jk
2
2
k
(x + c )
0
und
u0 (x)v(x) = Jk−1
folgt mit partieller Integration (Satz 7.3.2),
2(1 − k)
Z
Jk−1 − 2(1 − k)c2
Z
Jk = uv −
Z
Jk−1
und daher
Z
3 − 2k
Jk =
(2 − 2k)c2
Z
1
Jk−1 +
2(1 − k)c2
Damit kann eine Stammfunktion von
166
R
Ax+B
(x2 +2ax+b)k
x 7→
!
x
k
(x2 + c2 )
.
iterativ bestimmt werden.
−k+1
.
7.4 Integration gebrochen-rationaler Funktionen
Beispiel 7.4.5. 1.
R dx
.
x3 −1
Es gilt x3 − 1 = (x − 1)(x2 + x + 1). Daher Ansatz
1
A
Bx +C
=
+ 2
.
2
(x − 1)(x + x + 1) x − 1 x + x + 1
Multiplikation mit x − 1 und setzen von x = 1 liefert A = 31 . Durch Koeffizientenvergleich
folgt weiter
1
1
1
2
1=
+B x +
− B +C x + −C,
3
3
3
d.h., C = − 32 , B = − 31 , B −C = 31 . Damit
1
dx
=
3
x −1
3
Z
3
1
dx
x+2
−
dx
2
x−1 3 x +x+1
!
√
1
3
2x
+
1
1
arctan √
x 7→ ln |x − 1| − ln x2 + x + 1 −
3
6
3
3
Z
Z
auf jedem Intervall, das nicht 1 enthält.
2.
R x3 +1
dx.
x(x−1)3
Der Ansatz
B
C
x3 + 1
A
D
+
+
=
+
x(x − 1)3
x x − 1 (x − 1)2 (x − 1)3
liefert sofort A = −1 und D = 2 (durch Multiplikation mit x bzw. (x − 1)3 und x := 0 bzw.
x := 1). Weiter ergibt
x3 + 1 = −(x − 1)3 + Bx(x − 1)2 +Cx(x − 1) + 2x
= −x3 + 3x2 − 3x + 1 + Bx3 − 2Bx2 + Bx +Cx2 −Cx + 2x
= (−1 + B)x3 + (3 − 2B +C)x2 + (−3 + B −C + 2)x + 1,
d.h.,
−1 + B = 1,
3 − 2B +C = 0,
−3 + B −C + 2 = 0,
also B = 2, C = 1. Damit
Z
x3 + 1
dx
dx
dx
dx
dx = −
+2
+
+2
3
2
x(x − 1)
x
x−1
(x − 1)
(x − 1)3
1
1
=
x 7→ − ln |x| + 2 ln |x − 1| −
−
x − 1 (x − 1)2
Z
Z
Z
Z
auf jedem Intervall, das nicht 0 oder 1 enthält.
3.
R
dx
x2 −a2
mit a 6= 0.
167
7 Das Riemann-Integral
Es gilt
1
x 2 − a2
1
mit A = − 2a
und B =
Z
1
2a .
=
A
B
+
x−a x+a
Damit
dx
1
1
dx
dx
= −
+
2
2
x −a
2a x − a 2a x + a
1
1
3
x 7→ − ln |x − a| + ln |x + a|
2a
2a
1 |x + a|
ln
=
x 7→
2a |x − a|
Z
Z
auf jedem Intervall, das nicht a oder −a enthält.
♦
7.5 Uneigentliche Integrale
In Abschnitt 7.1 haben wir das bestimmte Integral
Z b
f
a
(Riemann-Integral) einer beschränkten Funktion f auf einem kompakten Intervall [a, b] eingeführt. Dabei waren Beschränktheit von f und Kompaktheit von [a, b] wesentlich.
Unser Ziel besteht nun darin, den Integralbegriff durch Grenzwertbetrachtungen auf unbeschränkte Intervalle bzw. unbeschränkte Funktionen zu erweitern.
Ohne den Begriff genauer spezifiziern zu wollen, bezeichnen wir hier mit Singularität eine
Stelle, bei der die Riemann-Integierbarkeit verletzt ist.
7.5.1 Einzige Singularität am Rand des Intervalls
Definition 7.5.1. Sei I = [a, b] mit a, b ∈ R oder I = [a, ∞[ mit a ∈ R und b = ∞. Sei
f ∈ R([a, β ]) für alle β ∈ [a, b[ aber f 6∈ R([a, b]) für b 6= ∞. Falls der endliche Grenzwert
Z b
Z β
f := lim
a
existiert, nennen wir
Rb
a
β %b a
f
f uneigentliches Integral von f über I mit Singularität in b.
♦
Man sagt dann auch, daß ab f konvergiert. Existiert der Grenzert nicht oder ist er unendlich,
R
dann sagt man, daß das Integral ab f divergiert (oder nicht existiert).
R
168
7.5 Uneigentliche Integrale
Bemerkung 7.5.2. 1. Falls f ∈ R([a, β ]) für alle β ∈ [a, b[ und F eine Stammfunktion von
f auf [a, b[ ist, dann
Z b
f = lim F(β ) − F(a) .
β %b
a
2. Analog definiert man das uneigentliche Integral
für alle α ∈ ]a, b] aber f 6∈ R([a, b]) für a 6= −∞.
Rb
a
f mit Singularität in a für f ∈ R([α, b])
♦
Beispiel 7.5.3. 1.
Z ∞
Z β
cos := lim
β →∞ 0
0
2.
Z ∞
dx
1
3.
Z ∞
dx
x2
1
4.
5.
Z 1
dx
0
Z β
dx
β →∞ 1
= lim
β →∞
β →∞
1 x=β
1
= lim −
= 1.
= lim 1 −
x2 β →∞
x x=1 β →∞
β
Z 1
dx
x
α&0 α
√ = lim
x α&0
x
β
= lim ln 1 = lim ln β = ∞ .
Z β
dx
β →∞ 1
x
β →∞
β →∞
:= lim
:= lim
Z 1
dx
0
x
β
cos = lim sin 0 = lim sin β , existiert nicht!
x=1
= lim (ln |x|) x=α = − lim ln α = ∞ .
α&0
α&0
√ √ x=1
√ = lim 2 x x=α = 2 − lim 2 α = 2 .
x α&0
α&0
Z 1
dx
α
♦
7.5.2 Endlich viele Singularitäten
Definition 7.5.4. Sei I = ]a, b[ mit a ∈ R ∪ {−∞}, b ∈ R ∪ {∞}, f ∈ R([α, β ]) aber f 6∈
R([a, α]), f 6∈ R([β , b]) für α, β mit a < α < β < b. Sei c ∈ ]a, b[. Dann definieren wir das
R
uneigentliche Integral ab f mit Singularität in a und b durch
Z c
Z b
f = lim
a
Z β
f + lim
α&a α
β %b c
f,
falls beide rechts stehenden Grenzwerte existieren und endlich sind.
♦
Definition 7.5.5. Sei I = [a, b] mit a, b ∈ R, c ∈ ]a, b[ und f ∈ R([a, γ]), f ∈ R([δ , b]) für γ, δ
mit a < γ < c < δ < b aber f 6∈ R([a, b]). Dann definieren wir das uneigentliche Integral
Rb
a f mit Singularität in c durch
Z b
f = lim
a
Z b
Z γ
γ%c a
f + lim
δ &c δ
f,
falls beide rechts stehenden Grenzwerte existieren und endlich sind.
♦
169
7 Das Riemann-Integral
Bemerkung 7.5.6. 1. In beiden Definitionen sind beide Grenzwerte unabhängig voneinander zu betrachten.
2. In der ersten Definition hängt der Wert des Integrals nicht von c ab.
3. Das uneigentliche Integral über ein Intervall mit endlich vielen Singularitäten wird durch
Zerlegung des Intervalls auf obige Situationen mit Singularitäten nur am Rand oder genau
einer im Innern zurückgeführt. Alle Grenzwerte der Teilintegrale müssen existieren und
endlich sein.
♦
Warnung: Aus der Bezeichnung ab f geht nicht hervor, ob es sich um ein eigentliches oder
uneigentliches Integral handelt. Ist aber f ∈ R([a, b]) (und damit beschränkt auf [a.b]), so
gilt nach Satz 7.2.7
R
Z b
Z b
Z β
f = lim
β %b a
a
f = lim
f.
α&a α
Eine Fehlinterpretation eines eigentlichen Integral als uneigentliches Integral führt also
nicht zu Fehlern, umgekehrt (vor allem bei Singularitäten in a und b oder in c ∈ ]a, b[)
aber schon.
Wir betrachten dazu I =
Es gilt aber
R 1 dx
1
−2 auf R
<0 und R>0 ist x 7→ − x .
−1 x2 . Stammfunktion von x 7→ x
Z −ε
dx
I = lim
+ lim
x2
1 1
1 −ε
+
lim
−
= lim −
x −1 δ &0
x δ
ε&0
1
1
− 1 + lim −1 +
= lim
δ
ε&0 ε
δ &0
=∞
1 1
6= −
= −2 .
x −1
ε&0 −1
x2
Z 1
dx
δ &0 δ
Falls
Z b
Z γ
f + lim
lim
δ &c δ
γ%c a
f
nicht existiert, bestehen aber immer noch Chancen, daß der „symmetrische“ Grenzwert existiert, in diesem Fall heißt
Z c−ε
Z b
Z b CH
f := lim
f+
f
a
der Cauchysche Hauptwert
von
R∞
sche Hauptwert von −∞
f durch
ε&0
Rb
a
CH
Z
γ→∞
Z 0
γ
f+
f := lim
−∞
170
c+ε
f bei Singularität in c ∈ ]a, b[. Analog wird der Cauchy-
Z ∞
definiert.
a
0
f
−γ
7.5 Uneigentliche Integrale
∞
Bemerkung 7.5.7. Wenn −∞
f existiert, dann existiert
auch CH
R∞ x
Die Umkehrung gilt nicht, betrachte zum Beispiel −∞ x2 +3 dx.
R
R∞
−∞
f und beide sind gleich.
171
7 Das Riemann-Integral
172
8 Weg- und Kurvenintegrale
8.1 Wege und Kurven
8.1.1 Definition
Der Kurvenbegriff hat eine lange Geschichte, ist kompliziert und wird in der Literatur auch
mit uneinheitlichen Sprachgebrauch verwendet.
Wichtig: Unterscheide das geometrische Gebilde „Kurve“ und die Vorschrift („Weg“), wie
das Gebilde entsteht.
Typische Fragestellungen:
• Länge einer Kurve, Masse einer belegten Kurve
• Arbeit bei Bewegung längs einer Kurve in einem Kraftfeld
Wir wollen Pathologien vermeiden und beschränken uns auf (für uns) sinnvolle Begriffe.
Definition 8.1.1. Ein Weg im Rn ist eine stetige Abbildung φ eines Intervalles I = [a, b] in
den Rn . Die Bildmenge
C := im(φ ) = φ [I] = {φ (t) : t ∈ I}
heißt die von φ erzeugte Kurve im Rn , φ heißt auch eine Parameterdarstellung von C.
Ist φ eineindeutig, so heißt φ Jordan-Weg und im(φ ) heißt Jordan-Kurve.
φ (a) und φ (b) heißen Anfangs- bzw. Endpunkt des Weges.
Die Kurve heißt geschlossen, wenn φ (a) = φ (b).
φ heißt glatt, wenn φ ∈ C1 (I, Rn ) mit φ 0 (t) 6= 0 für alle t ∈ I.
φ heißt stückweise glatt, wenn φ glatt bis auf endlich viele Punkte ist.
Eine Kurve C heißt glatt, wenn es eine glatte Parameterdarstellung der Kurve gibt.
♦
Beispiel 8.1.2. 1. Eine Strecke AB, A 6= B, A, B ∈ Rn ist eine glatte Jordan-Kurve mit der
Darstellung
φ (t) = A + t(B − A)
für t ∈ [0, 1] .
173
8 Weg- und Kurvenintegrale
2. Polygonzüge sind stückweise glatte Jordan-Kurven.
3. Der Einheitskreis in R2 ist eine geschlossen, glatte Jordan-Kurve mit der Darstellung
cost
φ (t) =
für t ∈ [0, 2π] .
sint
♦
Achtung: Eine Kurve C kann viele verschiedene Parameterdarstellungen haben.
Übungsaufgabe 8.1.3. Betrachte C = {|x| : x ∈ [−1, 1]}. Finde veschiedene Parameterdarstellungen.
♦
C
Definition 8.1.4. Zwei Darstellungen φ und
ψ derselben Kurve C heißen äquivalent, φ ∼
ψ, wenn es eine stetige, monoton wachsende
Abbildung h : D(ψ) → D(φ ) gibt, so daß ψ =
φ ◦ h, d.h., ψ(t) = φ (h(t)) für alle t ∈ D(ψ).
φ
ψ
D(φ )
D(ψ)
h
Übungsaufgabe 8.1.5. Zeige, daß ∼ eine Äquivalenzrelation ist.
Anschauliche Bedeutung der Definition ist, daß die Kurve C bezüglich φ und ψ in derselben „zeitlichen“ Reihenfolge aber mit unterschiedlichen „Geschwindigkeiten“ durchlaufen
werden.
Ein Weg besitzt eine Orientierung, die Parameterdarstellung beschreibt, in welcher (zeitlichen) Reihenfolge C durchlaufen wird.
Durch Umorientierung entsteht aus φ der Weg φ − mit
φ − (t) = φ (a + b − t)
für t ∈ D(φ ) = [a, b] .
Dadurch entsteht die gleiche Kurve C, Anfangs- und Endpunkt des Weges werden aber
getauscht.
Satz 8.1.6. Seien φ und ψ zwei Jordan-Wege, welche die gleiche Jordan-Kurve C erzeugen.
Dann gilt: Es existiert genau eine stetige Bijektion h : D(ψ) → D(φ ) mit ψ = φ ◦ h. Wenn
φ und ψ glatt sind, dann gilt h ∈ C1 (D(ψ)) und h0 (t) 6= 0 für alle t ∈ D(ψ). Je nachdem ob
h monoton wachsend oder fallend ist, gilt φ ∼ ψ oder φ − ∼ ψ.
Definition 8.1.7. Eine Teilmenge M ⊆ Rn heißt:
- wegweise zusammenhängend, wenn zu je zwei Punkten A, B ∈ M einen Weg φ : [a, b] →
M in M mit φ (a) = A und φ (b) = B gibt.
- Gebiet, wenn M offen und wegweise zusammenhängend ist.
174
♦
8.1 Wege und Kurven
8.1.2 Weglänge
φ (t1 )
Sei φ : I = [a, b] → Rn ein Weg. Ziel ist, dem
Weg eine Länge zuzuordnen.
Idee: Approximation durch Polygonzug.
φ (t5 )
φ (t0 )
Sei dazu Z = {[tk−1 ,tk ], k = 1, . . . , m} eine Zerlegung von [a, b] mit b > a, d.h., t0 = a < t1 <
· · · < tm = b. Dann ist
m
L(Z, φ ) := ∑ |φ (ti ) − φ (ti−1 )|
i=1
die Länge des durch Z und φ erzeugten Polygonzuges.
Definition 8.1.8. Unter der Länge des Weges φ : [a, b] → Rn , b > a, (Weglänge) versteht
man
L(φ ) :=
sup
L(Z, φ ) .
Z Zerlegung von [a,b]
Für b = a setzen wir
L(φ ) = 0 .
Der Weg heißt rektifizierbar, falls L(φ ) < ∞.
♦
Wegen
m
L(Z, φ ) := ∑
i=1
und
q
s
n
∑ (φ j (ti) − φ j (ti−1))2
j=1
a21 + · · · + a2n ≤ |a1 | + · · · + |an |
für reelle aa , . . . , an , erhält man
m
∑ |φ
i=1
j0
m
(ti ) − φ (ti−1 )| ≤ L(Z, φ ) ≤ ∑
j0
n
∑ |φ j (ti) − φ j (ti−1)|
i=1 j=1
für alle j0 ∈ {1, . . . , n}.
Sei f : [a, b] → R und sei Z = {[tk−1 ,tk ], k = 1, . . . , m} eine Zerlegung von [a, b]. Dann
nennen wir
m
V ( f , Z) := ∑ | f (ti−1 ) − f (ti )|
i=1
Variation von f bezüglich Z. Die Zahl V ( f ) := supZ V ( f , Z) heißt totale Variation von f
und f heißt von beschränkter Variation, wenn V ( f ) < ∞.
Damit folgt unmittelbar:
175
8 Weg- und Kurvenintegrale
Satz 8.1.9. Der Weg φ : [a, b] → Rn ist genau dann rektifizierbar, wenn alle Komponentenfunktionen von beschränkter Variation sind.
Besonders nützlich ist die sogenannte Weg- oder Bogenlängenfunktion s. Sei dazu φ : I =
[a, b] → Rn rektifizierbar. Wir definieren s : I → R durch
für t ∈ [a, b] ,
s(t) := L(φ )
[a,t]
d.h., s(t) ist die Länge des auf [a,t] eingeschränkten Wegstückes.
Satz 8.1.10. i) Wenn φ : I → Rn rektifizierbar ist, dann ist die zugehörige Weglängenfunktion s auf I stetig und (streng bei Jordan-Wegen) monoton wachsend.
ii) Wenn φ ∈ C1 (I, Rn ) (und damit rektifizierbar), so gilt s ∈ C1 (I, R) und es gilt
ṡ(t) = Ds(t) = |Dφ (t)| .
(8.1.1)
Aus ii) folgt
Z t
s(t) =
0
|φ (τ)| dτ =
Z tq
a
(Dφ 1 (τ))2 + · · · + (Dφ n (τ))2 dτ
für t ∈ I .
a
Insbesondere gilt
Z b
L(φ ) =
|Dφ (τ)| dτ .
a
Zusatz: Die Integraldarstellung von s gilt auch für stückweise glatte φ .
Beweis. Wir zeigen ii). Sei dazu t ∈ ]a, b[ und h ≥ 0 so klein, daß t + h ≤ b. Dann gilt
|φ (t + h) − φ (t)| ≤ s(t + h) − s(t) ,
da auf der linken Seite der geradlinige Abstand steht.
Sei Z eine beliebige Zerlegung von [a, b]. Dann gilt mit komponentenweiser Anwendung
des Hauptsatzes der Differential- und Integralrechnung
|φ (tk ) − φ (tk−1 )| = |
und somit
Z tk
Dφ (τ) dτ| ≤
Z tk
tk−1
|Dφ (τ)| dτ
tk−1
m
Z b
k=1
a
∑ |φ (tk ) − φ (tk−1)| ≤
|Dφ (τ)| dτ ,
d.h.,
L(φ ) ≤
Z b
|Dφ (τ)| dτ .
(8.1.2)
a
Wendet man nun (8.1.2) auf φ [t,t+h]
an, so folgt
φ (t + h) − φ (t)
s(t + h) − s(t) 1
|
|≤
≤
h
h
h
Z t+h
|Dφ (τ)| dτ .
t
Für h & 0 folgt
D+ s(t) = |Dφ (t)|
für t ∈ I .
Mit den entsprechenden Betrachtungen für h < 0 folgt D− s(t) = D+ s(t) = |Dφ (t)| und
damit (8.1.1).
176
8.2 Weg- und Kurvenintegrale
8.1.3 Kurvenlänge
Nun wollen wir einer Jordan-Kurve C eine Länge L(C) zuordnen. Der Wunsch besteht nun
darin, L(C) = L(φ ) zu setzen, wenn φ eine Parameterdarstellung von C ist. Dazu muß man
die Unabhängigkeit von der Parameterdarstellung zeigen.
Ohne große Mühe zeigt man (aus der Definition über Zerlegungen):
i) Sind φ und ψ zwei äquivalente Jordan-Wege, dann gilt L(φ ) = L(ψ).
ii) Für jeden Weg φ gilt L(φ ) = L(φ − ).
Damit ist folgende Definition sinnvoll:
Definition 8.1.11. Sei C eine Jordan-Kurve. Unter der Länge von C versteht man die Länge
L(φ ) eines Jordan-Weges φ , der C erzeugt.
Bemerkung 8.1.12. 1. Die Definition läßt sich genauso auf Kurven/Wege ausdehnen, die
Jordan-ähnlich sind, d.h., die nur endlich viele Doppelpunkte haben.
2. Die Bogenlänge s (aus der Weglängenfunktion) wird oft als natürlicher Parameter der
Parameterdarstellung genommen. Das geht so:
Sei C = φ [I] mit φ : I = [a, b] → Rn eine Jordan-Kurve und sei s(t) = L(φ [a,t] ) die Weglängenfunktion. Da φ ein Jordan-Weg ist, ist s : [a, b] → [0, L(φ )] stetig und streng monoton
wachsend. Somit existiert die streng monoton wachsende Umkehrfunktion t : [0, L(φ )] →
[a, b] zu s. Setze nun ψ = φ ◦t. Dann gilt φ ∼ ψ. Wenn man mit σ : [0, L(ψ)] = [0, L(φ )] →
R die Weglängenfunktion von ψ bezeichnet, gilt nun σ (s) = s für s ∈ [0, L(ψ)].
Ist C glatt, so ist ψ stetig differenzierbar und es gilt
|Dψ(s)| = Dσ (s) = 1 .
♦
8.2 Weg- und Kurvenintegrale
8.2.1 Kurvenintegral
Sei φ : I = [a, b] → Rn ein Jordan-Weg für eine rektifizierbare Kurve C, sei s die Bogenlängenfunktion. Auf C sei eine Funktion f : C → R definiert.
Definition 8.2.1. Das Integral
Z b
Z
f (φ (t)) ds(t) :=
f ds :=
C
Z b
a
Z b
f (φ (t))ṡ(t) dt =
a
f (φ (t))|φ̇ (t)| dt
a
♦
heißt Kurvenintegral von f über C.
177
8 Weg- und Kurvenintegrale
Bemerkung 8.2.2. i) Wenn f stetig ist und φ stetig differenzierbar, dann existiert obiges
Integral auf jeden Fall.
R
ii) Damit C f ds eine sinnvolle Bezeichnung ist, muß gezeigt werden, daß das Integral unabhängig von der Parameterdarstellung ist (vgl. Satz 8.1.6, der angewendet wird). Insbesondere ist es auch unabhängig von der Orientierung.
♦
SatzR8.2.3. Sei C eine rektifizierbare Jordan-Kurve. Seien f , g : C → R und es mögen
und C g ds existieren. Dann gelten:
R
C
f ds
i) Abschätzung:
Z
f ds ≤ L(C) sup | f | .
C
C
ii) Linearität:
Z
Z
[µ f + λ g] ds = µ
C
Z
f ds + λ
C
für µ, λ ∈ R .
g ds
C
iii) Wenn C = C1 ∪ C2 mit Jordan-Kurven C1 und C2 , für die C1 ∩ C2 nur aus endlich vielen
Punkten besteht, dann
Z
Z
Z
f ds =
f ds +
f ds .
C
C1
C2
Anwendung: Z.B. Masse, Schwerpunkt, Trägheitsmoment
Sei die Jordan-Kurve C kontinuierlich mit Masse der Dichte ρ, ρ : C → R, belegt. Dann
gilt:
Z
M=
ρ ds = Gesamtmasse von C .
C
Der Schwerpunkt S = (S1 , . . . , Sn ) hat die Koordinaten
1
S =
M
i
1
x ρ(x , . . . , x ) ds(x , . . . , x ) =
M
C
Z
i
1
n
1
n
Z b
φ i (t)ρ(φ (t))|φ̇ (t)| dt
i ∈ {1, . . . , n} .
a
8.2.2 Wegintegralephysik5-8.lyx
Sei φ : I = [a, b] → Rn ein Weg. (Nicht notwendig ein Jordan-Weg). Sei f : C = φ [I] → R
eine reelle Funktion über C oder sei F : C = φ [I] → Rn ein Vektorfeld über C.
Definition 8.2.4. Unter dem Wegintegral von f bezüglich der k-ten Variablen längs φ versteht man das Riemann-Stieltjes-Integral
Z
k
Z b
f (x) dx :=
φ
178
k
Z b
f (φ (t)) dφ (t) :=
a
a
f (φ (t))φ̇ k (t) dt .
8.2 Weg- und Kurvenintegrale
Unter dem Wegintegral von F längs φ versteht man
Z
hF(x), dxi :=
Z
φ
F(x) · dx :=
Z
φ
Z
:=
φ
n
=
∑
(F 1 (x) dx1 + · · · + F n (x) dxn )
φ
1
1
F (x) dx + · · · +
Z
F n (x) dxn
φ
Z b
F k (φ (t))φ̇ k (t) dt =
Z b
k=1 a
hF(φ (t), φ̇ (t)i dt .
♦
a
Anwendung: Arbeit im Kraftfeld.
Sei dazu G ⊆ R3 ein Gebiet. F : G → R3 sei ein (hinreichend vernünftiges) Kraftfeld. Ein
Massepunkt P bewege sich längs des Weges φ : I = [a, b] → G. Die dabei geleistete Arbeit
ist
Z
A = hF(x), dxi .
φ
Die Herleitung ergibt sich über die Zwischensummen und der Tatsache, daß die Arbeit das
Produkt aus Kraft und Weglänge ist, wenn der Weg gerade ist, und die Kraft tangential wirkt
und konstant ist.
Wir formulieren nun Eigenschaften für F; für f ist es dann klar (z.B. F = (F 1 , . . . , F n ) mit
F k = f , F i = 0 für i 6= k.
Satz 8.2.5. Es mögen
R
φ
hF(x), dxi und
R
φ
hG(x), dxi existieren. Dann gelten:
i) Abschätzung:
Z
hF(x), dxi ≤ L(φ ) sup |F(x)| .
φ
x∈C
ii) Linearität:
Z
hµF(x) + λ G(x), dxi = µ
φ
Z
Z
hF(x), dxi + λ
φ
hG(x), dxi
für µ, λ ∈ R .
φ
iii) Wenn φ = φ1 ⊕ φ2 (= Aneinanderhängung von Wegen), dann
Z
hF(x), dxi =
φ
Z
hF(x), dxi +
Z
φ1
hF(x), dxi .
φ2
iv) Aus φ ∼ ψ folgt
Z
hF(x), dxi =
ψ
Z
hF(x), dxi ,
φ
aus φ − ∼ ψ folgt
Z
ψ
hF(x), dxi = −
Z
hF(x), dxi
Z
und
φ
φ−
hF(x), dxi = −
Z
hF(x), dxi .
φ
Wegintegrale sind also orientierungsabhängig!
Statt eines Beweises dieser Aussagen soll eine wichtige Anwendung bzw. Verallgemeinerung von iv) gegeben werden: Wenn gewisse Wegstücke hin- und zurück durchlaufen werden, dann heben sich die entsprechenden Integrale hinweg.
179
8 Weg- und Kurvenintegrale
8.2.3 Zusammenhang von Kurven- und Wegintegralen
Nun betrachten wir den Zusammenhang von Kurven- und Wegintegralen. Sei φ ein glatter
Jordan-Weg, C = im(φ ), F : C → Rn ,
φ̇ (t) = φ̇ 1 (t)
>
φ̇ n (t)
...
der Tangentialvektor an C im Punkt φ (t), t ∈ D(φ ). Sei weiter
t(t) :=
1
φ̇ (t)
|φ̇ (t)|
der normierte Tangentialvektor und
Ft (x) := F(x), t(φ −1 (x)) = hF(φ (t)), t(t))i
die Tangentialkomponente von F im Punkt x = φ (t).
Dann gilt
Z
hF(x), dxi =
Z b
a
φ
Z b
=
b
Z
F(φ (t)), φ̇ (t) dt =
F(φ (t),
a
hF(φ (t)), t(t)i ds(t) =
Z
C
a
1
φ̇ (t) |φ̇ (t)| dt
|φ̇ (t)|
Ft ds .
Bemerkung 8.2.6. i) In der letzten Formel ist die Orientierungsabhängigkeit in t versteckt.
R
R
ii) Man schreibt oft C hF(x), dxi statt φ hF(x), dxi und setzt dabei stillschweigend voraus,
daß mit C auch die Orientierung gegeben ist und daß C eine Jordan-Kurve ist.
♦
8.2.4 Gradientenfelder, Wegunabhängigkeit
Zwei Beispiele zur Motivation:
R
Beispiel 8.2.7. Berechne die Integrale Ik = φk y dx + (x − y) dy, k = 1, 2, 3, über folgende
Wege φ1 , φ2 : [0, 2] → R2 , φ3 : [0, 1] → R2 mit
φ1 (t) =
180
(t, 0) ,
t ∈ [0, 1] ,
(1,t − 1) , t ∈ ]1, 2] ,
φ2 (t) =
(0,t) ,
t ∈ [0, 1]
(t − 1, 1) , t ∈ ]1, 2]
φ3 (t) = (t,t 2 ) .
8.2 Weg- und Kurvenintegrale
Z 1
I1 =
=
0
ẋ
Z 2
1
ẏ
2
1
((t − 1) · |{z}
0 +(2 − t) · |{z}
1 ) dt = − (t − 2)2 1
2
ẏ
ẋ
1
,
2
Z 1
I2 =
=
(0 · |{z}
1 +(t − 0) · |{z}
0 ) dt +
0
(t · |{z}
0 +(0 − t) · |{z}
1 ) dt +
Z 2
ẏ
ẋ
1
1 1
(1 · |{z}
1 +(t − 2) · |{z}
0 ) dt = 1 − t 2 0
2
ẋ
ẏ
1
,
2
Z 1
I3 =
0
2
2
(t · |{z}
1 +(t − t ) · |{z}
2t ) dt =
ẋ
ẏ
Beispiel 8.2.8. Berechne Ik =
in 1. Es gilt
Z 1
I1 =
0
R
φk y dx + (y − x) dy,
(0 · |{z}
1 +(0 − t) · |{z}
0 ) dt +
ẋ
1 3 2 3 2 4 1 1
t + t − t
= .
0
3
3
4
2
ẏ
Z 2
1
♦
k = 1, 2, 3, über die gleichen Wege wie
2
1
1 ) dt = (t − 2)2 1
((t − 1) · |{z}
0 +(t − 2) · |{z}
2
ẋ
ẏ
1
=− ,
2
Z 1
Z 2
1 1 3
(1 · |{z}
1 +(2 − t) · |{z}
0 ) dt = 1 + t 2 0 = ,
2
2
0
1
ẏ
ẋ
ẋ
ẏ
Z 1
1 3 2 3 2 4 1 1
2
2
I3 =
t − t + t
(t · |{z}
1 +(t − t) · |{z}
2t ) dt =
= .
0
3
3
4
6
0
I2 =
1 ) dt +
(t · |{z}
0 +t · |{z}
ẋ
♦
ẏ
Woran liegt das?
Definition 8.2.9. Sei v : G → Rn ein stetiges Vektorfeld auf einem Gebiet G ⊆ Rn .
i) v heißt Gradientenfeld oder Potentialfeld, wenn es ein skalares Feld u : G → R gibt mit
v(x) = gradu(x) für x ∈ G. u heißt Stammfunktion von v und w = −u heißt Potential des
Vektorfeldes v. (Vorzeichen aus physikalischen Gründen).
R
ii) Das Integral φ hv(x), dxi heißt in G wegunabhängig, wenn für 2 beliebige Punkte A, B ∈
G und jeden stückweise glatten Weg φ mit Anfangspunkt A und Endpunkt B dieses Integral
den gleichen Weg hat. In diesem Fall schreibt man auch
Z B
A
hv(x), dxi :=
Z
hv(x), dxi .
♦
φ
R
Äquivalent zur Definition der Wegunabhängigkeit ist die Forderung, daß φ hv(x), dxi = 0
für jeden stückweise glatten, geschlossenen Weg φ in G gilt. Man nennt dann v konservativ.
181
8 Weg- und Kurvenintegrale
Problem: Unter welchen Bedingungen ist v ein Gradientenfeld bzw. konservativ?
Folgender Satz folgt aus dem Mittelwertsatz:
Satz 8.2.10. Wenn v ein Gradientenfeld ist, dann ist die Stammfunktion bis auf eine Konstante eindeutig bestimmt, d.h., wenn u1 und u2 Stammfunktionen zu v in G sind, dann ist
u1 − u2 konstant auf G.
Satz 8.2.11. Ein stetiges Vektorfeld v ist genau dann konservativ, wenn es ein Gradientenfeld ist. Genauer:
i) Wenn u ∈ C1 (G, R), A, B ∈ G beliebig und φ ein stückweise glatter Weg in G von A nach
B ist, dann gilt
Z
hgradu(x), dxi = u(B) − u(A) .
φ
ii) Wenn v konservativ ist und A ∈ G, dann gilt u ∈ C1 (G, R) und v(x) = gradu(x) für x ∈ G
für die durch
Z
x
hv(y), dyi
u(x) :=
für x ∈ G
A
definierte Funktion u : G → R.
Hinweis: Vergleiche den Satz mit dem Hauptsatz der Differential- und Integralrechnung.
Beweis. i) Sei φ : [a, b] → G ⊆ Rn wie im Satz angegeben. Nach Kettenregel gilt
n
du(φ (t))
= ∑ Dk u(φ (t))Dφ k (t) = hgradu(φ (t)), Dφ (t)i .
dt
k=1
Mit Substitution folgt
Z
hgradu(x), dxi =
φ
Z b
du(φ (t))
Z φ (b)
Dφ (t) dt =
du
dt
φ (a)
= u(φ (b)) − u(φ (a)) = u(B) − u(A) .
a
ii) ist etwas aufwendiger.
Die in diesem Satz gegebene Äquivalenz von konservativ und Gradientenfeld ist praktisch
unhandlich. Wir geben daher ein weiteres Kriterium an:
Satz 8.2.12. Wenn v ∈ C1 (G, Rn ) und wenn v ein Gradientfeld ist, dann erfüllt v die
Integrabilitätsbedingungen
Dk vi = Di vk
auf G.
182
für alle i, k ∈ {1, . . . , k}
(8.2.1)
8.2 Weg- und Kurvenintegrale
Beweis. Sei v = gradu, d.h., vi = Di u. Dann gilt
Dk vi = Dk Di u = Di Dk u = Di vk
nach dem Satz von Schwarz 6.3.15.
Bemerkung 8.2.13. 1. Im Fall n = 3 besagen die Integrabilitätsbedingungen gerade
rotv = 0
in G .
♦
2. Die Integrabilitätsbedingungen sind aber nicht hinreichend!
Beispiel 8.2.14. Betrachte v mit v(x, y) = ( x2−y
, x ) im Ringgebiet G = B(0, 2)\B(0, 1).
+y2 x2 +y2
Dann sind die Integrabilitätsbedingungen erfüllt aber φ v1 (x, y) dx+v2 (x, y) dy 6= 0 für jeden
das Loch umrundenden, glatten, geschlossenen Weg. Beweis: ÜA.
R
Woran liegt das? Die Antwort ist etwas verblüffend: An der Topologie von G!
Definition 8.2.15. Eine Teilmenge M ⊆ Rn heißt:
• einfach zusammenhängend, wenn M wegweise zusammenhängend und jede geschlossene, ganz in M verlaufende Kurve C sich
stetig auf einen Punkt zusammenziehen läßt,
d.h., für jedes solche C existieren P ∈ M und
eine Abbildung r ∈ C([0, 1] × M, M), so daß
für Ct := {r(t, x) : x ∈ C} die Beziehungen
C0 = C, C1 = {P} und Ct ⊆ M für t ∈ [0, 1]
gelten.
einfach zusammenhängend
nicht einfach zusammenh.
• sternförmig, wenn ein Punkt P ∈ M existiert, so daß AP ⊆ M für alle A ∈ M.
sternförmig
nicht sternförmig
♦
• konvex, wenn AB ⊆ M für alle A, B ∈ M.
Es gilt:
konvex =⇒ sternförmig =⇒ einfach zusammenhängend .
Beachte: „Einfach zusammenhängend“ ist eine topologische Eigenschaft, „sternförmig“ eine geometrische.
Satz 8.2.16. Sei G ⊆ Rn ein einfach zusammenhängendes Gebiet, v ein stetig differenzierbares Vektorfeld auf G, daß die Integrabilitätsbedingungen (8.2.1) auf G erfüllt. Dann ist v
ein Gradientenfeld und mithin ist das entsprechende Wegintegral wegunabhängig.
183
8 Weg- und Kurvenintegrale
Beweis. Ist ziemlich aufwendig. Wir beweisen den Satz für den Spezialfall, daß G sternförmig ist. O.B.d.A. sei also G sternförmig bezüglich 0 ∈ G (sonst geeignete Translation). Für
x ∈ G sei φx : [0, 1] → G mit φx (t) = tx eine geradlinige Verbindung von 0 zu x.
Wir definieren nun u : G → R durch
Z
hv(y), dyi =
u(x) :=
Z 1
hv(tx), xi dt
für x ∈ G .
0
φx
Wir zeigen v = gradu. Dazu sei x ∈ G beliebig. Es gilt
hv(tx), xi = x1 v1 (tx) + · · · + xn vn (tx)
und mit Dk als der partiellen Ableitung nach der k-ten Koordinate von x und unter Verwendung von (8.2.1)
n
n
D1 hv(tx), xi = v1 (tx) + ∑ xk · t · D1 vk (tx) = v1 (tx) + ∑ xk · t · Dk v1 (tx)
k=1
1
k=1
1
= v (tx) + gradv (tx),tx .
Andererseits gilt
n
d
tv1 (tx) = v1 (tx) + t · ∑ Dk v1 (tx)xk = v1 (tx) + gradv1 (tx),tx .
dt
k=1
Somit gilt
Z 1
D1 u(x) = D1
=
0
Z 1
d
dt
= v (x) .
0
1
hv(tx), xi dt =
Z 1
0
D1 hv(tx), xi dt
1
tv1 (tx) dt = tv1 (tx) 0
Analog folgt Di u(x) = vi (x) für alle i ∈ {1, . . . , n} und alle x ∈ G, d.h., v = gradu auf G.
184
9 Integralrechnung für Funktionen
mehrerer Variabler
9.1 Das Riemann-Integral im Rn
9.1.1 Definition des Riemann-Integrals
Für die Theorie ist das Riemann-Integral unzureichend, für praktische Belange reicht es
meist.
R
Wir beginnen mit I f mit n-dimensionalem Intervall I. Später lassen wir dann statt I allgemeinere Bereiche B zu.
Definition 9.1.1. Seien a, b ∈ Rn mit ai ≤ bi für i = 1, . . . , n. Die Menge
I := [a, b] := {x ∈ Rn : ai ≤ xi ≤ bi mit i = 1, . . . , n} = [a1 , b1 ] × · · · × [an , bn ]
heißt Intervall. Analog werden Intervalle ]a, b[, [a, b[, ]a, b] definiert. Die Zahl
n
|I| := ∏(bi − ai )
i=1
heißt Maß, Inhalt oder Volumen des Intervalls I ∈ {[a, b], ]a, b[, [a, b[, ]a, b]}.
♦
Wir betrachten nur einen speziellen Typ von Zerlegungen von I = [a, b]: Es seien Zi Zerlegungen der Intervalle [ai , bi ]. Dann ist
Z := Z1 × · · · × Zn
eine zulässige Zerlegung von [a, b]. Die Elemente von Z sind also Intervalle J der Form
J = J1 × · · · × Jn
mit Ji ∈ Zi .
Numeriert man die Elemente von I durch, d.h.,
Z = {I j : j = 1, . . . , N} ,
185
9 Integralrechnung für Funktionen mehrerer Variabler
so erhält man
I=
N
[
N
|I| =
Ij ,
∑ |I j | ,
j=1
j=1
wobei I j und Ik für j 6= k keine gemeinsamen inneren Punkte haben.
Die Zahl
λ (Z) :=
max
j∈{1,...,N}
diam(I j )
mit diam(I j ) als dem Durchmesser von I j heißt Feinheit von Z.
Sei nun β = (ξ1 , . . . , ξN ) mit ξk ∈ Ik für k = 1, . . . , N eine Belegung von Z und f : I → R.
Dann heißt
n
σ ( f , Z, β ) =
∑ f (ξk )|Ik |
k=1
Zwischensumme oder Riemannsche Summe von f zur Zerlegung Z mit der Belegung β .
Definition 9.1.2. I sei ein kompaktes Intervall im Rn . Die Funktion f : I → R heißt auf I
Riemann-integrierbar, wenn der Grenzwert
lim σ ( f , Zk , βk )
k→∞
für jede Zerlegungsfolge (Zk )k∈N mit λ (Zk ) → 0 für k → ∞ und jede entsprechende Folge
(βk )k∈N von Belegungen βk von Zk existiert und unabhängig von den gewählten Folgen ist.
Diesen Grenzwert nennt man das Riemann-Integral von f über I. Mit R(I) wird die Menge
der auf I Riemann-integrierbaren Funktionen bezeichnet.
♦
Bezeichnung:
Z
Z
f=
I
Z
f dµ =
I
Z
f (x) dx =
I
f (x1 , . . . , xn ) d(x1 , · · · , xn ) .
I
Bemerkung 9.1.3. Riemann-integrierbare Funktionen sind beschränkt.
Probleme:
(P1) Beschreibung von R(I).
f dµ zu
R
B
f dµ. Welche B sind zulässig?
(P3) Eigenschaften der Abbildung f 7→
R
f dµ.
(P2) Verallgemeinerung von
R
I
B
(P4) Verfahren zur Integralberechnung.
Analog zum eindimensionalen Fall definieren wir:
186
9.1 Das Riemann-Integral im Rn
Definition 9.1.4. i) Die Menge M ⊆ Rn hat das n-dimensionale Lebesgue-Maß 0 (ist Nullmenge), wenn es zu jedem ε > 0 abzählbar viele Intervalle I j ⊂ Rn , j ∈ J ⊆ N, gibt mit
M⊆
[
Ij
und
j∈J
∑ |I j | < ε .
j∈J
ii) Sei E ⊆ Rn . Man sagt, eine Eigenschaft gilt „fast überall in E“, wenn es eine Menge
F ⊆ Rn gibt, so daß die Eigenschaft auf E ∩ F gilt und E \ F eine Nullmenge ist.
♦
Beispiel 9.1.5. i) Abzählbare Mengen sind Nullmengen.
ii) Wenn I ⊂ Rn−1 ein (n − 1)-dimensionales Intervall ist und wenn f : I → R stetig ist, dann
ist
graph( f ) = {(x, f (x)) : x ∈ I}
eine Nullmenge in Rn .
♦
Satz 9.1.6 (Kriterium von Lebesgue). Sei I ⊂ Rn ein kompaktes Intervall. Die Funktion
f : I → R ist genau dann Riemann-integrierbar, wenn f beschränkt ist und fast überall auf
I stetig ist.
Damit ist (P1) erledigt.
9.1.2 Verallgemeinerung auf zulässige Bereiche
Wir klären nun Problem (P2). Offenbar darf B nicht zu „schlimm“ sein, damit
definierbar ist.
R
B
f dµ
Definition 9.1.7. Eine Menge B ⊆ Rn heißt zulässig, wenn B beschränkt ist und wenn ∂ B
eine Nullmenge in Rn ist.
Beispiel 9.1.8. 1. Alle gängigen geometrischen Figuren im R2 sind zulässig.
2. Quader, Tetraeder, Kugel, Ellipsoid usw. im R3 sind zulässig.
3. Intervalle sind zulässige Bereiche.
4. Eine wichtige Klasse zulässiger Mengen erhält man so: Sei I ⊂ Rn−1 ein Intervall, f1 , f2
stetige, reellwertige Funktionen auf I mit f1 ≤ f2 . Dann ist die Menge B ⊂ Rn mit
B = {(x, z) : x ∈ I und f1 (x) ≤ z ≤ f2 (x)}
zulässig.
5. Beispiel einer nichtzulässigen Menge ist
B = (Q ∩ [0, 1]) × (Q ∩ [0, 1]) .
Hier gilt ∂ B = [0, 1] × [0, 1] und ∂ B ist daher keine Nullmenge.
♦
187
9 Integralrechnung für Funktionen mehrerer Variabler
Lemma 9.1.9. i) Vereinigung und Durchschnitt endlich vieler zulässiger Mengen ist zulässig.
ii) Die Differenz zulässiger Mengen ist zulässig.
Beweis. ÜA. Man zeige dazu zuerst Rechenregeln für den Rand:
∂ (B1 ∩ B2 ) ⊆ ∂ B1 ∪ ∂ B2 ,
∂ (B1 ∪ B2 ) ⊆ ∂ B1 ∪ ∂ B2 ,
∂ (B1 \ B2 ) ⊆ ∂ B1 ∪ ∂ B2 .
Sei B ⊆ Rn eine beliebige Menge und sei f : D( f ) ⊆ Rn → R mit B ⊆ D( f ). Ohne Beschränkung der Allgemeinheit können wir annehmen, daß D( f ) = Rn (Eine Funktion f : D( f ) ⊆
Rn → R kann man zu einer Funktion fˆ auf Rn fortsetzen, indem man fˆ(x) = 0 für x 6∈ D( f )
setzt).
Sei χB die charakteristische Funktion von B.
Definition 9.1.10. Sei B ⊆ Rn eine beschränkte Menge und sei f : Rn → R. Unter dem
Riemann-Integral von f über B versteht man
Z
Z
B
Z
f db =
f :=
B
Z
f dµ :=
B
I
f χB
für ein beliebiges Intervall I ⊇ B, falls das rechte Integral existiert. f heißt dann Riemannintegrierbar über B.
♦
Offenbar bedarf diese Definition
einer Rechtfertigung. ManR muß nämlich zeigen, daß gilt:
R
Wenn I1 , I2 ⊇ B, dann existiert I1 f χB dµ genau dann, wenn I2 f χB dµ und beide Werte sind
gleich.
Damit kann man das Lebesgue-Kriterium wie folgt formulieren:
n
n
Satz 9.1.11. Sei B ⊂
R zulässig, f : R → R. Dann ist f auf B Riemann-integrierbar
genau dann, wenn f B fast überall stetig auf B ist.
Beweis. f χB hat im Vergleich zu f B höchstens noch auf ∂ B Unstetigkeitsstellen. Da ∂ B
eine Nullmenge ist, ist f χB fast überall stetig in jedem Intervall I ⊇ B und daher auf I
integrierbar.
Sei nun f auf B Riemann-integrierbar. Dann
ist f χB auf einem Intervall I ⊇ B fast über
all stetig. Die Unstetigkeitsstellen von f B stimmen im Innern von B mit denen von f χB
überein. Nur auf der Nullmenge ∂ B könnte es unterschiedliches Verhalten geben.
9.1.3 Allgemeine Eigenschaften des Integrals
Die Eigenschaften sind eine fast wörtliche Übertragung der entsprechenden Eigenschaften
des eindimensionalen Falls.
Sei B ⊆ Rn zulässig und sei R(B) die Menge der über B Riemann-integrierbaren Funktionen.
188
9.1 Das Riemann-Integral im Rn
• R(B) ist ein Vektorraum (sogar Algebra) und
Z
B
Z
(λ1 f1 + λ2 f2 ) dµ = λ1
R
für fi ∈ R(B), λi ∈ R. Damit ist f 7→
B
f1 dµ + λ2
B
f2 dµ
f dµ ein lineares Funktional auf R(B). Weiter gilt
B
f ∈ R(B) ,
Z
Z
f ≥0
f dµ ≥ 0 ,
=⇒
(9.1.1)
B
d.h., f 7→
R
B
f dµ ein lineares positives Funktional auf R(B).
Aus (9.1.1) folgen weitere Aussagen (jede dann wieder aus der vorhergehenden)
• Abschätzungen:
Sind f , g ∈ R(B) und f ≤ g, dann
Z
f dµ ≤
Z
B
g dµ .
B
Seien f , g ∈ R(B) mit g ≥ 0 und m ≤ f ≤ M mit m, M ∈ R. Sei
Z
Z
χB dµ =
µ(B) :=
B
Z
1 dµ =
dµ .
B
(9.1.2)
B
Dann gilt
m · µ(B) ≤
Z
f dµ ≤ M · µ(B)
B
und
m·
Z
g dµ ≤
B
Z
f g dµ ≤ M ·
Z
g dµ .
B
B
Wenn speziell m = infB f und M = supB f , dann folgt aus (9.1.2) und dem Mittelwertsatz
die Existenz eines γ ∈ [m, M] mit
Z
f dµ = γ µ(B) .
B
Wenn f stetig ist und wenn B zusammenhängend ist, existiert ein ξ ∈ B mit
Z
f dµ = f (ξ )µ(B) .
B
• Fast-Überall-Gleichheit:
Wenn f ∈ R(B) und f (x) = 0 fast überall auf B dann
R
B
f dµ = 0.
Beweis. (Idee) Beachte Definition des Integrals über Zwischensummen. Wähle als Zwischenpunkte ξi Punkte aus den Zerlegungsintervallen mit f (ξi ) = 0. Dann ist die RiemannSumme 0. Zu klären wäre dabei, ob solche Zwischenpunkte tatsächlich existieren.
189
9 Integralrechnung für Funktionen mehrerer Variabler
Seien f , g ∈ R(B) mit f (x) = g(x) fast überall auf B. Dann gilt
R
B
f dµ =
R
B g dµ.
• Additivität des Integrals bezüglich des Integrationsbereiches: Seien B1 , B2 zulässig, f auf
B1 ∪ B2 definiert.
R
R
Das Integral B1 ∪B2Rf dµ existiert genau dann, wenn
existiert dann auch B1 ∩B2 f dµ.
Wenn µ(B1 ∩ B2 ) = 0 und wenn
R
Z
I
R
B2
f dµ existieren. Es
Z
f dµ =
B1 ∪B2
R
f dµ und
f dµ existiert, dann gilt
B1 ∪B2
Z
Sei I ein Intervall. Falls
B1
f dµ +
B1
f dµ .
B2
f dµ = 0 und f ≥ 0, dann gilt f (x) = 0 fast überall auf I.
Beweis. Es genügt zu zeigen, daß f (a) = 0 für alle a ∈ I, in denen f stetig ist. Angenommen, es existiert ein Stetigkeitspunkt a von f mit f (a) > 0. Dann existiert eine Umgebung
U = B(a, ε) mit ε > 0 von a mit f (x) ≥ f (a)/2 für x ∈ I ∩U. Damit gilt
Z
Z
Z
f dµ =
I
f dµ ≥ µ(I ∩U) f (a)/2 > 0
f dµ +
I\U
I∩U
und wir erhalten einen Widerspruch.
Offensichtlich kann man das Intervall I auch durch zulässige Bereiche B ersetzen, bei denen
µ(B ∩U) > 0 für jeden Punkt a ∈ B und jede (zulässige) Umgebung U von a gilt.
In Zusammenhang mit dem allgemeineren Lebesgue-Integral kann man auch zeigen, daß
die Aussage tatsächlich für beliebige zulässige Bereiche B anstelle von I gilt.
9.1.4 Der Satz von Fubini
R
Ziel ist die Zurückführung des Integrals I f dµ auf iterierte Integrale über niedrigdimensionale Intervalle. Damit hat man dann die Berechnungsmethode
Z
Z Z
f=
I
f,
X Y
wenn X, Y Intervalle mit I = X ×Y .
Plausibilitätsbetrachtung im R2 : Sei I = [a, b] × [c, d] = X × Y . Betrachte Zerlegung
Z = ZX × ZY , ZX = {Ji : i ∈ {1, . . . , N}}, ZY = {K` : ` ∈ {1, , . . . , M}} von I, wie sie bei
Definition der Riemannsummen verwendet wurden. Sei β eine Belegung
mit ZwischenR
punkten (xi , y` ) ∈ Ji × K` . Für f ∈ R(I) hat man als Zwischensumme zu I f dµ:
!
∑ f (xi, y`)|Ji × K`| = ∑ f (xi, y`)|Ji| · |K`| = ∑ ∑ f (xi, y`)|Ji|
i,`
`
i,`
!
=∑
∑ f (xi, y`)|K`|
i
|
190
·|Ji | .
`
{z
=:F̃(xi )
}
i
· |K` |
9.1 Das Riemann-Integral im Rn
R
Man sieht, F̃(xi ) ist eine Zwischensumme zum Integral Y f (xi , y) dy =: F(xi ), während
die
R
äußere Summe ∑i F̃(xi )|Ji | dann eine Näherung zur Zwischensumme zum Integral X F(x) dx
ist.
Mit der vertauschten Summation in der zweiten Zeile ergibt sich eine analoge Interpretation.
Damit ist folgender Satz plausibel:
Satz 9.1.12 (Satz von Fubini). Sei I = X ×Y ein Intervall in Rn , wobei X und Y Intervalle
in Rk bzw. R` sind mit k + ` = n. Wenn f : I → R integrierbar ist, dann existieren die
iterierten Integrale und es gilt




Z
Z ∗
Z
f (x, y) d(x, y) =
X×Y
X
Z ∗
Z
f (x, y) dy dx =

Y
f (x, y) dx dy .

Y
X
Bemerkung 9.1.13. 1. Man schreibt auch


Z ∗
Z
X
Z Z ∗
f (x, y) dy dx =

Y
f (x, y) dydx =
X
Z ∗
Z
Y
f (x, y) dy ,
dx
X
Y
wobeiR die letztere Schreibweise etwas strukturierter als die mittlere ist, aber voraussetzt,R daß
man X und dx nicht als Klammern zur Begrenzung des Integranden
auffaßt. Hier ist X dx
R
eher als Funktional anzusehen, das auf die Funktion x 7→ Y f (x, y) dy angewandt wird.
R
2. Anstelle des inneren
Integrals F(x) = Y f (x, y) dy haben wir im allgemeinen nur ein
R
Oberintegral: Um X F(x) dx betrachten zu können, müßte man sicher gehen, daß F(x)
überhaupt existiert, d.h., man müßte wissen, daß f (·, y) über X für jedes y und f (x, ·) über
Y für jedes x integrierbar ist. Dies ist jedoch nicht immer der Fall. In jedem Fall gibt es bei
stetigem f keine Probleme.
3. Es ist ein Trugschluß, anzunehmen, daß aus der Existenz der iterierten Integrale die
Existenz des Integrales folgt.
♦
Beispiel 9.1.14. Sei I = [0, π]×[− π2 , π2 ]×[0, 1] und sei f : I → R mit f (x, y, z) = z sin(x+y).
Dann
Z 1
Z
f (x, y, z) d(x, y, z) =
I
Z
dz
0
Z 1
=
− π2
Z
dz
Z
dz
0
Z 1
=
0
Z π
z sin(x + y) dx
dy
0
π
2
π
dy
[−z
cos(x
+
y)]
0
π
−2
0
Z 1
=
π
2
π
2
− π2
z [− cos(π + y) + cos y] dy
|
{z
}
2 cos y
π
2
2z sin y− π dz
2
Z 1
=
4z dz = 2 .
♦
0
191
9 Integralrechnung für Funktionen mehrerer Variabler
Beispiel 9.1.15. Das ist eine etwas anspruchvollere Variante des Satzes von Fubini. Sei
D ⊂ Rn−1 zulässig,
B = {(x, y) = (x1 , . . . , xn−1 , y) ∈ Rn : x ∈ D , φ1 (x) ≤ y ≤ φ2 (x)}
mit stetigen Funktionen φi auf D. Sei f ∈ R(B). Dann gilt
Z
Z φ2 (x)
Z
f (x, y) d(x, y) =
f (x, y) dy .
dx
B
φ1 (x)
D
Wir betrachten dazu den Schnitt Bx von B über x,
[φ1 (x), φ2 (x)] für x ∈ D ,
Bx =
0/
für x 6∈ D .
Man prüft leicht nach
χB (x, y) = χD (x) × χBx (y) .
Wenn Ix , Iy Intervalle mit D ⊆ Ix , Bx ⊆ Iy für alle x, dann I := Ix × Iy ⊇ B und
Z
Z
Z
Z
f (x, y) d(x, y) =
f (x, y)χB (x, y) d(x, y) =
dx
f (x, y)χB (x, y) dy
Ix ⊇D
Iy ⊇Bx
Z Z
Z Z φ2 (x)
=
f (x, y)χBx (y) dy χD (x) dx =
f (x, y) dy χD (x) dx
B
I⊇B
Ix
Iy
φ1 (x)
Ix
Z φ2 (x)
Z
=
♦
f (x, y) dy .
dx
D
φ1 (x)
Beispiel 9.1.16. Sei B = B(0, R) im R2 . Dann
B = {(x, y) ∈ R2 : x ∈ [−R, R] , φ1 (x) ≤ y ≤ φ2 (x)}
mit
p
φ1 (x) = − R2 − x2 ,
φ2 (x) =
p
R2 − x 2 .
Wir betrachten
Z
2
y
p
R2 − x2 d(x, y) =
Z φ2 (x)
Z R
dx
−R
Z R
B
=2
=
−R
Z R
2
y2
p
R2 − x2 dy
φ1 (x)
dx
p
R2 − x 2
Z φ2 (x)
y2 dy
0
2
R −x
2 2
4
dx =
3
Z R
R2 − x 2
2
dx
3 −R
0
Z
4 R 4
4
42 5 4 5
=
[R − 2R2 x2 + x4 ]dx = R5 −
R + R
3 0
3
33
15
32 5
= R .
45
192
♦
9.1 Das Riemann-Integral im Rn
Beispiel 9.1.17. Man ändere im Integral
Z 1
Z 1−x
dx
√
− 1−x2
0
f (x, y) dy
die Integrationsreihenfolge. Hier ist
p
− 1 − x2 ≤ y ≤ 1 − x}
B = {(x, y) ∈ R2 : x ∈ [0, 1] ,
= {(x, y) ∈ R2 : y ∈ [−1, 1] ,
mit
0 ≤ x ≤ φ (y)}
p
1 − y2 für y ∈ [−1, 0[ ,
1−y
für y ∈ [0, 1] .
φ (y) =
Damit gilt
Z 1
Z 1−x
dx
0
√
− 1−x2
Z φ (y)
Z 1
f (x, y) dy =
f (x, y) dx
dy
−1
0
Z √1−y2
Z 0
=
f (x, y) dx +
dy
−1
Z 1
0
Z 1−y
f (x, y) dx ,
dy
0
0
falls f ∈ R(B).
♦
9.1.5 Bemerkungen zur Inhalts- und Volumenbestimmung
Definition 9.1.18. Eine beschränkte Menge B ⊂ Rn heißt quadrierbar oder Jordan-meßbar,
wenn die charakteristische Funktion χB auf B Riemann-integrierbar ist, d.h., wenn
Z
Z
B
χB dµ =
Z
1 dµ =
dµ
B
B
existiert. Die Größe
µ(B) = |B| =
Z
dµ
B
heißt Jordan-Maß oder Jordan-Inhalt oder einfach Inhalt oder Volumen von B.
♦
Offenbar gilt
B
Jordan-meßbar
⇐⇒
B zulässig.
Beispiel 9.1.19. Sei D ⊂ Rn−1 und
B = {(x, y) = (x1 , . . . , xn−1 , y) ∈ Rn : x ∈ D , φ1 (x) ≤ y ≤ φ2 (x)}
mit stetigen φ1 und φ2 Jordan-meßbar. Nach Beispiel 9.1.15 gilt
Z
µ(B) =
dµ =
B
Z φ2 (x)
Z
1dy =
dx
D
Z
φ1 (x)
D
(φ2 (x) − φ1 (x))dx .
Vergleiche dazu insbesondere den bekannten Fall n = 2, d.h., D = [a, b].
♦
193
9 Integralrechnung für Funktionen mehrerer Variabler
Beispiel 9.1.20. Sei B ⊂ R3 ein Rotationskörper,
B = {(x, y, z) : x ∈ [a, b] , 0 ≤
p
y2 + z2 ≤ r(x)} .
Dann gilt
Z b
Z
µ(B) =
dµ =
dx
B
Z b
Z
a
√
0≤
y2 +x2 ≤r(x)
d(y, z) = π
r2 (x) dx .
a
♦
9.2 Koordinatentransformation
9.2.1 Heuristik und Satz
Hier geht es um die Substitutionsmethode für Mehrfachintegrale. Der Beweis des allgemeinen Resultates ist einer der aufwendigsten Beweise der Differential- und Integralrechnung.
Wir geben hier einen heuristischen Zugang und zeigen auf, wo die Probleme liegen.
Sei Bx ⊂ Rn , By ⊆ Rn und Φ : By → Bx eine Surjektion. Sei weiter f ∈ R(Bx ). Wie muß
F : By → R aussehen, damit
Z
Z
f (x) dx =
F(y) dy ?
Bx
By
Sei g = f ◦ Φ.
Um zu verstehen, wo das Problem liegt, sei By = I ⊂ Rn ein Intervall und Φ sei ein Diffeomorphismus, das heißt Φ sei bijektiv und Φ und Φ −1 seien stetig differenzierbar. Sei
S
weiter I = Nj=1 I j mit Intervallen I j .Dann gilt
Φ(I) = Φ(By ) =
N
[
Φ(I j ) = Bx
j=1
und somit
Z
Bx
f (x) dx = ∑
Z
j
f (x) dx ,
Φ(I j )
wenn die Φ(I j ) zulässig sind und µ(Φ(Ii ) ∩ Φ(I j )) = 0 für i 6= j.
Sei f stetig. Dann gilt nach dem Mittelwertsatz
Z
Φ(I j )
f (x) dx = f (ξ j )µ(Φ(I j ))
mit ξ j ∈ Φ(I j ). Sei I j 3 η j = Φ −1 (ξ j ). Dann
Z
Φ(I j )
194
f (x) dx = f (Φ(η j ))µ(Φ(I j )) .
9.2 Koordinatentransformation
Das dabei entstehende Problem ist nun: Wann ist das Bild Φ(M) einer Jordan-meßbaren
Menge M wieder Jordan-meßbar und wie verhält sich der Inhalt Jordan-meßbarer Mengen
unter Φ?
Sei zuerst Φ eine lineare Abbildung, d.h.,
Φ(y)i =
n
∑ ai j y j
j=1
mit einer invertierbaren Matrix A = (ai j )ni, j=1 . Wenn I ein Intervall ist, dann ist Φ(I) ein
Parallelepiped und es gilt (z.B. aus Algebra)
µ(Φ(I)) = |detA| · µ(I) = |detΦ 0 (y)| · µ(I) .
Satz 9.2.1 (Koordinatentransformation in Mehrfachintegralen). Die Menge By ⊂ Rn sei
offen und Jordan-meßbar, die Abbildung Φ : By → Bx ⊂ Rn sei stetig differenzierbar, bijektiv
sowie Lipschitz-stetig, d.h., es existiere ein Konstante L mit
∀y1 , y2 ∈ By :
|Φ(y1 ) − Φ(y2 )| ≤ L|y1 − y2 | .
Dann gelten die folgenden Aussagen:
1. Bx = Φ(By ) ist Jordan-meßbar.
2. f ∈ R(Bx ) genau dann, wenn F ∈ R(By ) mit F = ( f ◦ Φ) · |detΦ 0 |. Ist f ∈ R(Bx ), dann
Z
Z
f (x) dx =
Bx
f (Φ(y)) · |detΦ 0 (y)| dy .
By
Bemerkung 9.2.2. 1. Unter den Voraussetzungen des Satzes besitzt jede Jordan-meßbare
Menge B ⊂ By ein Jordan-meßbares Bild Φ(B) = A und
Z
µ(A) = µ(Φ(B)) =
|detΦ 0 (y)| dy .
B
2. Die Bedingungen an Φ dürfen auf einer Menge mit Jordan-Maß 0 verletzt sein.
3. Wenn Φ stetig differenzierbar ist, dann ist Φ auf jeder kompakten Teilmenge von By
Lipschitz-stetig.
♦
Beispiel 9.2.3. Wir betrachten den Graphen einer Funktion f : I → R gegeben durch
graph f = {(ξ (t), ρ(t)) : t ∈ [a, b]} ,
I = ξ [a, b] ,
ξ˙ (t) > 0 für t ∈ [a, b]
in der (x, y)-Ebene. Wir lassen den Graphen im R3 um die x-Achse rotieren und betrachten
den entstehenden Rotationskörper
p
R = {(x, y, z) : x = ξ (t) , 0 ≤ y2 + z2 ≤ ρ(t) , t ∈ [a, b]} .
195
9 Integralrechnung für Funktionen mehrerer Variabler
Dieser Körper ist das Bild von
Z = {(r, φ ,t) : t ∈ [a, b], 0 ≤ r ≤ ρ(t), 0 ≤ φ ≤ 2π}
unter der Abbildung Φ : B0 → R3 , B0 = [0, ∞] × [0, 2π] × [a, b], mit
Φ(r, φ ,t) = (ξ (t), r cos φ , r sin φ ) .
Es gilt
ξ˙ (t)
0
0
0
detΦ (r, φ ,t) = 0 cos φ −r sin φ
0
sin φ r cos φ
= r · ξ˙ (t) .
Damit sind die Bedingungen an Φ auf Z bis auf eine Menge vom Jordan-Maß 0 erfüllt.
Somit erhalten wir
Z
Z
µ(R) =
r · ξ˙ (t) d(r, φ ,t) =
dµ =
R
=π
r · ξ˙ (t) drdtdφ
φ =0 t=a r=0
Z
Z b
Z 2π Z b Z ρ(t)
ρ 2 (t)ξ˙ (t) dt .
♦
a
9.2.2 Spezielle Koordinatentransformationen
Ebene Polarkoordinaten.
Sei Φ : B0 → R2 mit
B0 = {(r, φ ) : r ≥ 0, 0 ≤ φ ≤ 2π}
und
Φ(r, φ ) = (r cos φ , r sin φ ) .
Dann ist Φ eine stetige Bijektion von der offenen Menge
B = {(r, φ ) : r > 0, 0 < φ < 2π}
auf die offene Menge
C = R2 \ {(ξ , 0) : ξ ∈ [0, ∞[} .
Es gilt
D Φ 1 (r, φ ) D2 Φ 1 (r, φ )
detΦ (r, φ ) = 1 2
D1 Φ (r, φ ) D2 Φ 2 (r, φ )
0
cos φ −r sin φ
=
sin φ r cos φ
= r > 0.
Damit ist Φ nach Satz 6.4.34 ein Diffeomorphismus und Φ ist auf jeder kompakten Teilmenge von B Lipschitz-stetig.
196
9.2 Koordinatentransformation
Der Schnitt der Ausnahmemenge B0 \ B mit einer Jordan-meßbaren Teilmenge von B0 ist
vom Jordan-Maß 0. Wir können daher Satz 9.2.1 auf kompakte, Jordan-meßbare Teilmengen von B0 anwenden.
Betrachte nun
A = {(r, φ ) : α ≤ φ ≤ β , 0 ≤ r ≤ h(φ )}
mit β − α ≤ 2π und stetigem, nichtnegtivem h. Für den Flächeninhalt von Φ(A) in kartesischen Koordinaten gilt dann
|Φ(A)| =
Z β Z h(φ )
1
2
r drdφ =
α
0
Z β
h2 (φ ) dφ .
α
Dies ist die Leibnitzsche Sektorformel.
Beispiel 9.2.4. Sei f (x, y) = xy und sei V = {(x, y) ∈ R2 : x2 + y2 ≤ R2 , x ≥ 0 , y ≥ 0} der
Viertelkreis im ersten Quadranten. Mit Φ wie oben gilt
Z
Z
xy d(x, y) =
V
Z π/2 Z R
3
Φ −1 (V )
1
= R4
4
0
1 4
= R .
8
r sin φ cos φ d(r, φ ) =
Z π/2
1
sin φ cos φ dφ = R4
8
r3 sin φ cos φ drdφ
0
0
Z π/2
1
sin 2φ dφ = R4
16
0
Z π
sin φ dφ
0
♦
Räumliche Polarkoordinaten (Kugelkoordinaten).
Sei Φ : B0 → R3 mit
B0 = {(r, φ , ϑ ) : r ≥ 0, 0 ≤ φ ≤ 2π, 0 ≤ ϑ ≤ π}
und
Φ(r, φ , ϑ ) = (r cos φ sin ϑ , r sin φ sin ϑ , r cos ϑ ) .
Dann ist Φ eine stetige Bijektion von der offenen Menge
B = {(r, φ , ϑ ) : r > 0, 0 < φ < 2π, 0 < ϑ < π}
auf die offene Menge
C = R3 \ {(r sin ϑ , 0, r cos ϑ ) : r ∈ [0, ∞[, ϑ ∈ [0, π]} .
Man berechnet
cos φ sin ϑ −r sin φ sin ϑ r cos φ cos ϑ
0
detΦ (r, φ , ϑ ) = sin φ sin ϑ r cos φ sin ϑ r sin φ cos ϑ
cos ϑ
0
−r sin ϑ
= −r2 sin ϑ .
197
9 Integralrechnung für Funktionen mehrerer Variabler
Damit gilt detΦ 0 (r, φ , ϑ ) 6= 0 auf B.
Der Schnitt der Ausnahmemenge B0 \ B mit einer Jordan-meßbaren Teilmenge von B0 ist
wieder vom Jordan-Maß 0. Wir können daher Satz 9.2.1 auf kompakte, Jordan-meßbare
Teilmengen von B0 anwenden.
Beispiel 9.2.5. Berechnung des Kugelvolumens. Sei KR die Kugel mit Radius R und Mittelpunkt in (0, 0, 0). Dann
Z 2π Z π Z R
1
|r2 sin ϑ | drdϑ dφ = R3
3
0
0
0
Z 2π
4π 3
2
dφ =
R .
= R3
3
3
0
µ(KR ) =
Z 2π Z π
sin ϑ dϑ dφ
0
0
♦
Zylinderkoordinaten.
Sei Φ : B0 → R3 mit
B0 = {(r, φ , z) : r ≥ 0, 0 ≤ φ ≤ 2π, −∞ < z < ∞}
und
Φ(r, φ , z) = (r cos φ , r sin φ , z) .
Dann ist Φ eine stetige Bijektion von der offenen Menge
B = {(r, φ , ϑ ) : r > 0, 0 < φ < 2π + 2π, −∞ < z < ∞}
auf die offene Menge
C = R3 \ {(r, 0, z) : r ∈ [0, ∞[, z ∈ R} .
Man berechnet
cos φ −r sin φ 0 detΦ 0 (r, φ , z) = sin φ r cos φ 0 = r .
0
0
1 Damit gilt detΦ 0 (r, φ , z) 6= 0 auf B.
Der Schnitt der Ausnahmemenge B0 \ B mit einer Jordan-meßbaren Teilmenge von B0 ist
wieder vom Jordan-Maß 0. Wir können daher Satz 9.2.1 auf kompakte, Jordan-meßbare
Teilmengen von B0 anwenden.
198
10 Fourier-Reihen
Wir haben schon gesehen, daß eine glatte Funktion f unter gewissen Voraussetzungen in
eine Potenzreihe (Taylorreihe) entwickelt werden kann. Eine solche Reihenentwicklung ist
aber nicht nur mit Polynomen möglich, sondern man kann allgemein versuchen, f über eine
Linearkombination anderer Funktionen anzunähern:
N
f (x) ≈
∑ anϕn(x),
n=0
wobei ϕn , n = 0, . . . , N, ein vorgegebenes Funktionensystem ist und a0 , . . . , aN ∈ R Parameter sind. Bei den Potenzreihen ist das Funktionensystem ϕn (n = 0, . . . , N) das System der
Monome ϕn (x) = xn (n = 0, . . . , N). Man kann aber auch andere Polynome wählen: speziell konstruierte wie die Legendre-Polynome oder die Tschebitscheff-Polynome, oder aber
– und das ist der Inhalt dieses Kapitels – ein Funktionensystem aus Sinus- und CosinusFunktionen.
10.1 Trigonometrische Polynome
Unter einem trigonometrischen Polynom vom Grade N verstehen wir eine Funktion FN :
R → R der Form
N
a0
FN (t) = + ∑ (an cos(nωt) + bn sin(nωt))
2 n=1
mit Koeffizienten a0 , a1 , . . . , aN , b1 , . . . , bN ∈ R. Die Konstante ω ∈ R heißt Kreisfrequenz
von FN und die Größe T = 2π
ω die Periode von FN . Dazu beachte man, daß FN (t +T ) = FN (t)
für alle t ∈ R gilt, so daß FN tatsächlich T -periodisch ist. Die in FN enthaltenen BausteinKreisfunktionen haben alle eine Periode, die ganzzahliger Teiler von T ist, siehe Abbildung.
y
1
sin(ωt)
sin(2ωt) sin(3ωt)
T
x
-1
Trigonometrische Polynome lassen sich besonders elegant beschreiben, wenn man eine
199
10 Fourier-Reihen
komplexe Schreibweise im Zusammenhang mit der Euler-Formel wählt. Das obige trigonometrische Polynom FN wird zu
N
∑
FN (t) =
ck eikωt = c−N e−iNωt + . . . + c−1 e−iωt + c0 + . . . + cN eiNωt
k=−N
mit den Formeln
c0 = 12 a0 , cn = 12 (an − ibn ) , c−n = 12 (an + ibn ) ,
a0 = 2c0 , an = cn + c−n ,
bn = i(cn − c−n )
für n ∈ N≥1 . Beachte dabei cn = c̄−n und c−n = c̄n .
Ein entscheidender Punkt für das Rechnen mit trigonometrischen Polynomen ist deren Orthogonalitätseigenschaft.
Satz 10.1.1 (Orthonormalität). Für k, n ∈ Z gilt
1
T
Z T
ikωt
e
· einωt dt
1, k = n
0, sonst
=
0
Beweis. Für k = n erhalten wir
1
T
Z T
e
ikωt
· eikωt dt
0
1
=
T
Z T
ikωt
e
0
−ikωt
·e
1
dt =
T
Z T
dt = 1
0
und für k 6= n
1
T
Z T
ikωt
e
0
· einωt dt
1
=
T
=
Z T
t=T
1
i(k−n)ωt e
dt =
i(k − n)ωT
t=0
h
i
ei(k−n)2π − 1 = 0 .
i(k−n)ωt
e
0
1
i(k − n)ωT
Wir fassen Eigenschaften trigonometrischer Polynome in einem Satz zusammen.
Satz 10.1.2 (Hauptsatz über trigonometrische Polynome). Es gilt:
a) FN hat in [0, T [ höchstens 2N Nullstellen.
b) Es gilt FN (t) = 0 für alle t ∈ R genau dann, wenn alle Koeffizienten ck = 0 sind.
c) Es gelten die Fourier-Formeln für 0 ≤ n ≤ N, −N ≤ k ≤ N
1 T
ck =
FN (t) · e−ikωt dt ,
T 0
Z
2 T
FN (t) cos(nωt) dt ,
an =
T 0
Z
2 T
bn =
FN (t) sin(nωt) dt .
T 0
Z
200
10.1 Trigonometrische Polynome
Beweis. a) und b) folgen aus dem Fundamentalsatz der Algebra, c) aus den Orthogonalitätsrelationen.
Beachte: Aus b) ergibt sich die Möglichkeit, bei trigonometrischen Polynomen Koeffizientenvergleich anzuwenden.
Bemerkung 10.1.3. Beachte die folgenden Formeln:
N
a) FN (t) =
∑
N
ck
k=−N
b) ck =
Z
1 T
T
0
FN
eikωt
=
∑
−ikωt
ck e
k=−N
(t) · e−ikωt dt
=
N
=
∑
c−k eikωt = FN (t).
k=−N
Z
1 T
T
0
ikωt
FN (t) · e
1
dt =
T
Z T
0
FN (t) · eikωt dt.
♦
201
Herunterladen