Analysis I Differential- und Integralrechnung von Funktionen einer

Werbung
Analysis I
Differential- und Integralrechnung von Funktionen einer
reellen Variablen
Mitschrift der Vorlesung, gehalten von
Professor Knapp
Bergische Universität Gesamthochschule Wuppertal
Ausgearbeitet von
Harald Reimann und Ulrich Maruhn
Überarbeitet und angepaßt von David Fritzsche
Wintersemester 1990/91
Wintersemester 1998/99
Sommersemester 2005
Inhaltsverzeichnis
1 Vorbereitungen
1.1
4
Aussagelogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.1.1
Gesetze der Aussagelogik . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.1.2
Gesetze der Prädikatenlogik . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2
Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.3
Abbildungen, Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1.4
Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
. . . . . . . . . . . . . . . . . . . . . . . .
14
1.4.1
Vollständige Induktion und
N:
2 Die reellen Zahlen
2.1
17
Axiome der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.1.1
Die algebraischen Axiome . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.1.2
Ordnungsaxiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
3 Der Grenzwertbegriff: Folgen und Reihen
31
3.1
Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
3.2
Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
3.3
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
3.3.1
Konvergenzradius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
3.3.2
Rechnen mit Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
4 Die elementaren Funktionen
62
4.1
Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
4.2
Polynome und rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . .
63
4.3
Die Klasse der elementaren Funktionen . . . . . . . . . . . . . . . . . . . . . . . .
67
4.3.1
Beispiele für Kompositionen . . . . . . . . . . . . . . . . . . . . . . . . . .
68
Die Exponentialfunktion, der Logarithmus und die trigonometrischen Funktionen
68
4.4.1
Die Exponentialfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
4.4.2
Die Hyperbelfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
4.4.3
Die Logarithmusfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . .
74
4.4.4
Die trigonometrischen Funktionen . . . . . . . . . . . . . . . . . . . . . .
75
4.4
5 Stetige Funktionen
5.1
78
Einleitung, Definition, lokale Eigenschaften . . . . . . . . . . . . . . . . . . . . .
78
5.1.1
Definition der Stetigkeit mit Folgen
. . . . . . . . . . . . . . . . . . . . .
79
5.1.2
ε-δ-Definition der Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . .
82
3
Inhaltsverzeichnis
5.2
Eigenschaften stetiger Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
5.3
Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
5.3.1
Rechts- und Linksseitige Grenzwerte . . . . . . . . . . . . . . . . . . . . .
91
Globale Eigenschaften stetiger Funktionen . . . . . . . . . . . . . . . . . . . . . .
92
5.4.1
Der Zwischenwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
5.4.2
Der Umkehrsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
96
5.4.3
Injektivität und Monotonie für stetige Funktionen . . . . . . . . . . . . .
98
5.4.4
Gleichmäßige Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
5.4
6 Differentialrechnung
6.1
6.2
Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6.1.1
Tangentenproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6.1.2
Geschwindigkeitsproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.1.3
Approximationsproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.1.4
Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Der Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.2.1
6.3
Regel von L’Hospital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Untersuchung von Funktionen (Kurvendiskussion) . . . . . . . . . . . . . . . . . 123
6.3.1
Ableitung der Arcus-Funktionen . . . . . . . . . . . . . . . . . . . . . . . 126
7 Taylor-Entwicklung
7.1
Näherungsweise Berechnung von Funktionswerten
8.2
. . . . . . . . . . . . . 133
Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
8 Integration
8.1
129
Taylorpolynome und Restterme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7.1.1
7.2
100
138
Stammfunktionen und die Technik des unbestimmten Integrierens . . . . . . . . . 138
8.1.1
Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
8.1.2
Zur Existenz von Stammfunktionen . . . . . . . . . . . . . . . . . . . . . 143
Das Riemannintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
8.2.1
Definition des Riemann Integrals . . . . . . . . . . . . . . . . . . . . . . . 146
8.3
Hauptsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
8.4
Funktionenfolgen und Grenzwertsätze . . . . . . . . . . . . . . . . . . . . . . . . 165
Hinweis auf ausgelassene Begriffe
174
Empfohlene Literatur
175
A Symbole
177
A.1 Griechische Buchstaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
A.2 Unterschiedliche Schreibweisen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
1
Vorbereitungen
1.1
Aussagelogik
Definition 1.1:
1.1.1
Im folgenden werden folgende Abkürzungen verwendet:
W
Existenzquantor: x∈M A(x) bedeutet: Es gibt (mindestens) ein x ∈ M , für das die
Aussage A(x) gilt.
V
Allquantor: x∈M A(x) bedeutet: Für alle x ∈ M gilt die Aussage A(x).
Gesetze der Aussagelogik
Eine Aussageverknüpfung, die immer wahr ist — unabhängig vom Wahrheitswert der verknüpften Aussagen — bezeichnet man als Gesetz, Regel, Tautologie oder Satz der Aussagenlogik.
Diese können ohne weiteres beim logischen Schließen verwendet werden.
Wichtige Beispiele
• ¬(¬A) ⇔ A
(Satz von der doppelten Verneinung)
• A ∨ ¬A
(Satz vom ausgeschlossenen Dritten)
• ¬(A ∧ ¬A)
(Satz vom ausgeschlossenen Widerspruch)
• A∧B ⇔B∧A
• A∨B ⇔B∨A
• ¬(A ∧ B) ⇔ ¬A ∨ ¬B
• ¬(A ∨ B) ⇔ ¬A ∧ ¬B
• A ∧ (B ∨ C) ⇔ (A ∧ B) ∨ (A ∧ C)
• A ∨ (B ∧ C) ⇔ (A ∨ B) ∧ (A ∨ C)
• (A ⇒ B) ⇔ (¬A ∨ B)
• ¬(A ⇒ B) ⇔ (A ∧ ¬B)
• ¬(A ⇔ B) ⇔ (A ⇔ ¬B)
• (A ⇒ B) ⇔ (¬B ⇒ ¬A)
(Kontrapositionsgestz)
• (A ⇒ B) ⇔ (A ∧ ¬B ⇒ ¬A)
(für Widerspruchsbeweis)
• (A ⇒ B) ⇔ (A ∧ ¬B ⇒ B)
(für Widerspruchsbeweis)
• (A ⇒ B) ⇔ (A ∧ ¬B ⇒ C ∧ ¬C)
(für Widerspruchsbeweis)
5
1.1 Aussagelogik
• ((A ∨ B) ∧ ¬A) ⇒ B
• (A ∧ (A ⇒ B)) ⇒ B
(Abtrennungsregel)
• ((A ⇒ B) ∧ ¬B) ⇒ ¬A
• ((A ⇒ B) ∧ (B ⇒ C)) ⇒ (A ⇒ C)
(Kettenschlußregel)
• A ⇒A∨B
• B ⇒A∨B
1.1.2
•
•
•
•
•
•
•
•
•
•
W
W
V
Gesetze der Prädikatenlogik
x (A(x)
x (A(x)
∨ B(x)) ⇔
∧ B(x)) ⇒
W
W
x A(x)
x A(x)
∨
∧
W
x B(x)
W
x B(x)
V
V
∧ B(x)) ⇔ x A(x) ∧ x B(x)
V
V
V
x A(x) ∨ x B(x) ⇒
x (A(x) ∨ B(x))
V
W
¬( x A(x)) ⇔ x (¬A(x))
V
W
¬( x A(x)) ⇔ x (¬A(x))
V
W
(Der Bereich für x sei als nicht leer vorausgestzt)
x A(x) ⇒
x A(x)
V V
V V
y x A(x, y)
x y A(x, y) ⇔
W W
W W
y x A(x, y)
x y A(x, y) ⇔
V W
W V
y x A(x, y)
x y A(x, y) ⇒
x (A(x)
6
1 Vorbereitungen
1.2
Mengen
Zur Beschreibung mathematischer Sachverhalte benutzen wir die Sprache der Mengenlehre. Wir
stellen uns dabei auf einen naiven“ Standpunkt (anstelle einer axiomatischen Einführung). Wir
”
nehmen an, daß der Mengenbegriff bereits bekannt ist.
Definition 1.2 (Cantor’s Mengendefinition):
Eine Menge M ist eine genau abgegrenzte Gesamtheit von realen oder gedachten Objekten,
die Elemente von M heißen.
Definition 1.3:
Für a ist Element der Menge M“ schreiben wir a ∈ M . Für a ist nicht Element der
”
”
Menge M“ wird a ∈
/ M geschrieben.
Wichtig: Eine Menge M ist vollständig durch die Elemente, die sie enthält, bestimmt (D.h.
Mengen werden existentional und nicht konstruktiv aufgefaßt).
Eine Menge kann man angeben durch
1. Aufzählen der Elemente: M = {a, b, c}.
2. Angeben einer Eigenschaft: M = {x ∈ B | x hat Eigenschaft A(x)}. B sei dabei eine
bereits bekannte Menge.
Beispiel: M = Menge der Primzahlen = {n ∈
N | n ist nur durch 1 oder n teilbar}1 .
△
Definition 1.4:
Zwei Mengen sind gleich, wenn sie die gleichen Elemente enthalten. Die Reihenfolge ist
dabei unwesentlich.
Beispiel: F , G und H sind im Folgenden nur unterschiedliche Schreibweisen der gleichen Menge:
F
= {2, 3}
N | n ist Primzahl und n ≤ 4 ∧ n ≥ 1}
{x ∈ R | es gilt x2 − 5x + 6 = 0}
G = {n ∈
H =
△
Wie zeigt man, daß zwei Mengen A und B gleich sind? Antwort: Man zeigt
1. x ∈ A ⇒ x ∈ B
2. x ∈ B ⇒ x ∈ A.
Definition 1.5:
Gegeben seien zwei Mengen M und N .
1. M ∪ N := {x | x ∈ M ∨ x ∈ N } Vereinigung.
1
M
N
Dies ist eigentlich nicht ganz korrekt, da auch n = 1 durch 1 und n teilbar ist. 1 wird aber nicht zu den
Primzahlen gezählt.
7
1.2 Mengen
2. M ∩ N := {x | x ∈ M ∧ x ∈ N } Durchschnitt.
M
N
3. M − N := {x | x ∈ M ∧ x ∈
/ N } Differenz.
M
N
4. N ⊂ M :⇔ Für alle x gilt: Aus x ∈ N folgt x ∈ M .
N heißt dann Teilmenge von M und ⊂“ Inklusion.
”
M
N
5. ∅ := Symbol der leeren Menge.
6. ℘(M ) = {A | A ⊂ M } Potenzmenge von M := Menge aller Teilmengen von M .
Beispiel: M = {a, b}.
℘(M ) = {∅, M, {a}, {b}}
△
Definition 1.6:
Ist A Teilmenge einer festen Menge X, so setzt man
∁A := {x ∈ X | x ∈
/ A} = X − A = Komplement
von A in X
∁A
A
Satz 1.1:
A und B seien Teilmengen einer festen Menge X. Es gelten folgende Regeln“:
”
1. A ∪ B = B ∪ A
2. (A ∪ B) ∪ C = A ∪ (B ∪ C)
und
(A ∩ B) ∩ C = A ∩ (B ∩ C)
3. ∁(A ∪ B) = (∁A) ∩ (∁B) und ∁(A ∩ B) = (∁A) ∪ (∁B) (de Morgansche Regeln)
4. ∁(∁A) = A
5. N ⊂ M ⇔ M ∩ N = N
Beispiel: N ⊂ M ⇒ M ∩ N = N
△
Beweis: 1. Wir zeigen, wenn N ⊂ M gilt, dann gilt auch N ⊂ M ∩ N . Dazu sei x ∈ N gegeben.
Nach Voraussetzung gilt N ⊂ M , daraus folgt x ∈ M . Also gilt x ∈ N und x ∈ M . Nach
Definition von ∩“ gilt dann x ∈ M ∩ N , d.h. es gilt N ⊂ M ∩ N
”
2. Die Inklusion M ∩ N ⊂ N gilt immer. Beweis: x ∈ M ∩ N bedeutet nach Definition x ∈
M ∧ x ∈ N also gilt x ∈ N d.h. x ∈ M ∩ N ⇒ x ∈ N oder M ∩ N ⊂ N .
3. M ∩ N ⊂ N und N ⊂ M ∩ N ⇒ N = M ∩ N .
8
1 Vorbereitungen
Definition 1.7:
I 6= ∅ sei eine Menge (genannte Indexmenge) und zu jedem i ∈ I sei eine Menge Ai
gegeben. Man spricht dann von einer Familie von Mengen und schreibt (Ai )i∈I . Weiterhin
definiert man:
[
Ai := {x | x liegt in mindestens einer der Mengen Ai }
\
Ai := {x | x liegt in allen Ai }
i∈I
und
i∈I
= {x | Es gibt ein i ∈ I mit x ∈ Ai }
 


 _

x ∈ Ai
= x


 
i∈I
= {x | Für alle i ∈ I gilt x ∈ Ai }
 


 ^

= x
x ∈ Ai


 
i∈I
1.3
Abbildungen, Funktionen
Definition 1.8:
Gegeben seien a ∈ A und b ∈ B. Dann bezeichnen wir mit (a, b) das sogenannte geordnete
Paar von a und b.
Auch dieser Begriff gehört zu den nicht weiter zu klärenden Grundbegriffen.
Je nach Mengenlehre könnte man (a, b) durch {{a}, {a, b}} definieren. Aber auch das erklärt
nicht, was ein geordnetes Paar wirklich ist. Uns genügt es zu wissen, daß es zu a ∈ A und
b ∈ B das geordnete Paar (a, b) gibt, und daß es auf die Reihenfolge ankommt (im Gegensatz
zu {a, b} = {b, a}).
Definition 1.9:
Zwei geordnete Paare (a, b) und (a′ , b′ ) sind genau dann gleich, wenn sie Komponentenweise
übereinstimmen. D.h.: (a, b) = (a′ , b′ ) :⇔ a = a′ ∧ b = b′ (es kommt auf die Reihenfolge
an).
Es seien A, B Mengen. Dann kann man alle geordneten Paare (a, b) zu einer neuen Menge
zusammenfassen.
Definition 1.10:
A × B := {(a, b) | a ∈ A und b ∈ B} heißt das Kreuzprodukt von A und B.
Beispiele:
9
1.3 Abbildungen, Funktionen
1. A = {a, b, c}
B = {1, 2}
2. A × B = {(a, 1), (a, 2), (b, 1), (b, 2), (c, 1), (c, 2)}
3. A = S 1 (Einheitskreis)
4. S 1 × S 1 (Torus)
5. A = I = [0, 1] ⊂
R (Einheitsintervall)
6. I × I (Einheitsquadrat), (I × I) × I (Würfel)
△
Der Begriff des Kreuzprodukts und des geordneten Paars läßt sich verallgemeinern: Paar =
2-Tupel, 3-Tupel, . . . , n-Tupel.
Definition 1.11 (Funktionendefinition 1):
A und B seien Mengen. Dann verstehen wir unter einer Funktion oder Abbildung f
von A nach B (Symbolisch f : A → B) eine Vorschrift, die jedem Element a ∈ A genau ein
Element b ∈ B zuordnet. a ∈ A heißt Argument. b = f (a) heißt Funktionswert oder
f
Bild von a unter f . Symbolisch: f (a) = b, a 7→ b, a 7→ f (a). A heißt Definitionsbereich
oder Urbildbereich. B heißt Werte- oder Bildbereich.
Der Funktionsbegriff wurde im 17 Jhd. entwickelt. y = f (x) war im Wesentlichen durch die
Formel gegeben.
Rückführung auf Mengenlehre: (Erklärung für Vorschriften).
Definition 1.12:
Gegeben sei eine Abbildung f : A → B. Γf := {(a, b) ∈ A × B | a ∈ A, b = f (a)} =
{a, f (a) | a ∈ A} ⊂ A × B heißt Graph von f .
Wir fassen also ein Element a ∈ A mit seinem Funktionswert zu einem geordneten Paar (a, f (a))
zusammen — dies ist dann gerade die Vorschrift. Die Abbildung f wird durch die Menge der
Paare (a, f (a)) gegeben (=ideelle Wertetabelle für f ). Es spielt keine Rolle wie die Vorschrift
gegeben wird, die inhaltliche Bedeutung der Vorschrift ist weggefallen.
Beispiel: A = B =
R, f : R → R, f (x) = x2, Γf ⊂ R × R (Siehe Abbildung 1.1).
△
Definition 1.13:
Eine Zuordnung hat die Eigenschaft (⋆), wenn es zu jedem x ∈ A genau ein y ∈ B mit
(x, y) ∈ Γf gibt. (Dies ist eine Übersetzung von: jedem a ∈ A wird genau ein b ∈ B
zugeordnet)
Definition 1.14 (Funktionendefinition 2):
Eine Abbildung f : A → B ist ein 3-Tupel (A, B, Γf ) bestehend aus den Mengen A, B
und der Teilmenge Γf ⊂ A × B mit Eigenschaft (⋆).
10
1 Vorbereitungen
a2
b
(a, a2 )
a
Abbildung 1.1: Der Graph zur Funktion f :
R → R mit f : x 7→ x2.
Wichtig: Insbesondere sind zwei Funktionen nur dann gleich, wenn Definitionsbereich, Wertebereich und Graph übereinstimmen. Die Eigenschaften einer Abbildung hängen oft vom
Definitions- und Wertebereich ab.
Inhaltliche Diskussion Mathematischer Arbeitsweise. In der Praxis arbeitet man eher
mit Definition 1 (Vorschrift, eine Größe ist von einer anderen abhängig) statt mit Defintion 2.
Man hat zwei Denkebenen
1. Präzise mathematische Definition des Begriffs
2. Intuitive Vorstellung des Begriffs
Definition 1.15:
f : X → Y sei eine Funktion.
1. Sei A ⊂ X. f (A) := {f (a) | a ∈ A} heißt Bildmenge von A unter f .
2. f (X) = Bild(f ) heißt die Bildmenge von f .
3. Sei B ⊂ Y . f −1 (B) := {x ∈ X | f (x) ∈ B} heißt Urbildmenge von B unter f .
11
1.3 Abbildungen, Funktionen
Definition 1.16:
Eine Abbildung f : X → Y heißt surjektiv
(Auch Abbildung auf Y )
2
1
:⇔ Bild von f = Y .
:⇔ Jedes y ∈ Y kommt als Wert unter f vor.
−2
:⇔ Zu jedem y ∈ Y gibt es ein x ∈ X, so daß
y = f (x).
V
W
:⇔ y∈Y x∈X y = f (x)
R
R
Beispiel: Abbildung 1.2 zeigt eine durch f :
→
3
mit f : x 7→ x − 2x definierte surjektive Funktion. △
−1
1
−1
Γf
−2
Abbildung 1.2: Beispiel einer surjektiven Funktion
Definition 1.17:
Eine Abbildung f : X → Y heißt injektiv (eindeutig)
:⇔ Je zwei verschiedene Argumente x1 , x2 ∈ X haben verschiedene Bilder.
:⇔ Für x1 , x2 ∈ X gilt: aus x1 6= x2 folgt f (x1 ) 6= f (x2 ).
:⇔
V
x1 ,x2 ∈X
x1 6= x2 ⇒ f (x1 ) 6= f (x2 ).
:⇔ Für x1 , x2 ∈ X gilt: aus f (x1 ) = f (x2 ) folgt x1 = x2 .
:⇔
V
x1 ,x2 ∈X
f (x1 ) = f (x2 ) ⇒ x1 = x2 .
:⇔ Zu jedem y ∈ f (X) gibt es genau ein Urbild x ∈ X mit f (x) = y.
π
2
−4
−3
−2
−1
1
2
2
3
4
− π2
Abbildung 1.3: Beispiel einer injektiven Funktion (f (x) = arctan(x)).
12
1 Vorbereitungen
Definition 1.18:
f : X → Y heißt bijektiv (eineindeutig)
2
:⇔ f ist injektiv und surjektiv.
1
:⇔ Zu jedem y ∈ Y gibt es genau ein x ∈ X mit f (x) = y.
:⇔ f (X) = Y und f ist injektiv.
R R
−1
x3
Beispiel: Die Funktion f : →
f : x 7→
ist bijektiv. Abbildung 1.5 zeigt, daß die Auswahl der Definitions- und Wertebereiche die Eigenschaften einer Funktion beeinflußt. So ist f : →
f : x 7→ x2 weder injektiv noch surjektiv. Durch das Verkleinern
des Definitionsbereichs auf + kann man Injektivität erreichen.
Wenn man den Wertebereich auf + einschränkt, wird die Funktion surjektiv. D.h. Die Funktion g : + → + g : x 7→ x2 ist
bijektiv, obwohl sie die gleiche Formel“ wie f hat.
△
”
−1
R R
R
−2
−1
R
R
R
4
4
3
3
2
2
1
1
1
2
−1
−2
−1
1
−2
Abbildung 1.4: Beispiel
einer bijektiven Funktion.
1
2
−1
Abbildung 1.5: f : x 7→ x2 für unterschiedliche Definitions- und Wertebereiche.
Definition 1.19:
f : X → Y sei bijektiv. f −1 : Y → X wird durch f −1 (y) = x :⇔ f (x) = y definiert. f −1
heißt Umkehrabbildung.
Beispiel: f :
R → R, f (x) = x + 2, f −1(x) = x − 2
△
Beachte: Statt f −1 ({y}) = {x ∈ X | f (x) = y} schreibt man f −1 (y).
Gegeben seien Abbildungen f : X → Y und g : Y → Z (der Bildbereich von f ist gleich dem
Definitionsbereich von g). In diesem Fall kann man die Zuordnungsvorschriften nacheinander
durchlaufen und eine neue Abbildung (g ◦ f ) : X → Y , die sogenannte Komposition oder
Hintereinanderschaltung von f und g definieren:
Definition 1.20:
13
1.4 Zahlen
Sind zwei Abbildungen f : X → Y und g : Y → Z gegeben, so definiert man ihre
Komposition bzw. Hintereinanderschaltung:
g◦f :X →Z
R
R
R
Beispiel: f :
→
und g :
→
sind Funktionen mit f (x) = x3
und g(x) = 2x. Dann gilt für die
Kompositionen:
R
(g ◦ f )(x) = g(f (x))
3
2
3
Γf ◦g
2
Γg
Γg◦f
3
(g ◦ f )(x) = g(f (x)) = g(x )
= 2x3
(f ◦ g)(x) = f (g(x)) = f (2x)
= (2x)3
= 8x3
In Abbildung 1.6 sind die Graphen
von f , g (gestrichelt), g ◦ f und f ◦ g
(gepunktet) gezeichnet.
Es gilt also im Allgemeinen f ◦ g 6=
g ◦ f.
△
1
−1
−1
1
Γf
1
−1
−1
−2
−2
−3
−3
1
Abbildung 1.6: Die Graphen von f , g, g ◦ f und f ◦ g.
Satz 1.2:
Sind f : X → Y und g : Y → Z zwei Bijektionen, so ist (g ◦ f )−1 = f −1 ◦ g−1 .
Satz 1.3:
Sind f : X → Y , g : Y → Z und h : Z → W Abbildungen, so gilt: h ◦ (g ◦ f ) = (h ◦ g) ◦ f .
Definition 1.21:
idX : X → X mit idX (a) = a heißt die Identische Abbildung oder Identität auf X.
1.4
Zahlen
N := {0, 1, 2, 3, . . . } Menge der natürlichen Zahlen (manchmal ohne 0).
Z := {. . . , −3, −2, −1, 0, +1, +2, +3, . . . } ganze Zahlen, N ⊂ Z.
Wenn man die Rechenoperationen + und − unbeschränkt ausführen will, muß man von
übergehen. Analoges Problem für · und / führt zu
Z
Q
p :=
p, q ∈ , q 6= 0 , den rationalen Zahlen,
q
Z
Z ⊂ Q.
N nach
14
1 Vorbereitungen
A
R
Q
Bemerkung: Algebraische Zahlen : r ∈
heißt algebraisch, wenn r Nullstelle eines Poly2
n
noms a0 + a1 x + a2 x + · · · + an x mit ai ∈ ist ( ⊂ ⊂ ).
Die reellen Zahlen :Jede reelle Zahl läßt sich durch seine Dezimal-Bruch (-Entwicklung)
darstellen. Der Übergang von
nach
ist nötig, wenn man Grenzprozesse, Approximatonen
wie z.B. Flächenberechnungen ausführen will.
R
Q
Q A R
R
Beispiel eines Widerspruchbeweises
Satz 1.4:
√
2∈
/
Q.
Z
Q
√
dann gibt es ganze
Beweis: Vorbemerkung:
n ∈ , n2 gerade ⇒ n gerade. Annahme: 2 ∈
√
Zahlen p, q mit 2 = pq . Wir können annehmen, daß pq gekürzt ist; insbesondere: p und q
√
2
nicht beide gerade. Aus 2 = pq folgt 2 = pq2 und damit 2q 2 = p2 . Also ist p2 gerade. Nach
Z
Vorbemerkung ist p gerade, d.h. es gibt p′ ∈ mit p = 2p′ . Also 2q 2 = (2p′ )2 = 4p′ 2 und damit
q 2 = 2p′ 2 . Also q 2 gerade und √
daher q gerade. Dies√ist ein Widerspruch zu p und q nicht beide
gerade. Also ist die Annahme 2 ∈ falsch oder 2 ∈
/
richtig.
Q
Definition 1.22:
r ∈ heißt irrational :⇔ r ∈
R
Wie stellt man sich
···
−6
−5
Q
R − Q.
R vor? Modell Zahlengerade:
−4
−3
−2
−1
0
1
2
3
4
5
6
···
Abbildung 1.7: Ein Ausschnitt der Zahlengerade
Jedem Punkt auf der Zahlengeraden entspricht genau eine reelle Zahl. Nach
komplexen Zahlen .
C
1.4.1
Vollständige Induktion und
R, kommen die
N:
Die natürlichen Zahlen dienten ursprünglich hauptsächlich zum Zählen.
Definition 1.23:
Es sei A eine Menge und n ∈
N − {0}
1. A hat n Elemente (symbolisch ♯A = n oder |A| = n) :⇔ Es gibt eine bijektive
Abbildung f : {1, . . . , n} → A.
Das heißt man nummeriert A einfach durch: A = {f (1), f (2), . . . , f (n)} oder auch
A = {a1 , a2 , . . . , an } mit ai := f (i).
N
2. Gibt es ein n ∈ − {0} mit ♯A = n, so heißt A endliche Menge, sonst unendlich.
Auch unendliche Mengen kann man versuchen abzuzählen:
N
3. A heißt abzählbar unendlich :⇔ Es gibt Bijektion f :
→ A. Ist A 6= ∅ weder
endlich noch abzählbar unendlich, so heißt A überabzählbar.
Beispiele:
N, und Q, sind abzählbar, R ist überabzählbar.
△
15
1.4 Zahlen
Vollständige Induktion
N kann man durch z.B. die Peano-Axiome kennzeichen. Zu diesen zählt:
Definition 1.24 (Induktionsprinzip):
Es sei A(n) eine Aussage, die für alle n ∈
N erklärt ist.
1. Es gelte A(0) (Induktionsanfang oder kurz: I.A.)
N
2. Für jedes n ∈
gilt, falls A(n) richtig ist, dann ist auch A(n + 1) richtig (Induktionsschluß, Induktionsschritt oder kurz: I.S.).
Dann gilt A(n) für alle n ∈
N.
Äquivalente Umformulierung des Induktionsprinzips:
Satz 1.5:
A sei Teilmenge von
N mit 0 ∈ A und n ∈ A ⇒ n + 1 ∈ A. Dann ist A = N.
Beweis: Verwende A(n) : (n ∈ N) ⇒ (n ∈ A) und vollständige Induktion.
N
Umgekehrt: Es gelte Satz 1.5, dann folgt das Induktionsprinzip: Definiere dazu: A := {n ∈ |
A(n) gilt}.
Wir nehmen an, mit ganzen Zahlen rechnen zu können.
.
Beispiel: A(n) sei die Aussage 0 + 1 + 2 + 3 + · · · + n = (n+1)n
2
Induktionsanfang: A(0): 0 = 0. Was offensichtlich stimmt.
! (n+2)(n+1)
2
Induktionsschluß: Es gelte A(n) (n ≥ 0). Wir müssen zeigen: 0+ 1+ · · ·+ n + (n + 1) =
(0 + 1 + 2 + 3 + · · · + n) + (n + 1) =
(n + 1)n
+ (n + 1)
2
↑
es gilt A(n)
=
=
Damit ist gezeigt: A(n) gilt für alle n ∈
N.
(n + 1)n + 2(n + 1)
2
(n + 1)(n + 2)
2
△
Die Aussage A(n) beim Induktionsschritt nennt man Induktionsvoraussetzung.
Definition 1.25 (Summensymbol):
Gegeben seien ganze Zahlen m und n mit m ≤ n und reelle Zahlen am , am+1 , . . . , an . Dann
setzt man:
n
X
ak := am + am+1 + · · · + an .
k=m
Für m > n setzt man
n
X
k=m
ak := 0
16
1 Vorbereitungen
Satz 1.6:
m
X
Es gilt:
ak = am
n
X
und
k=m
ak =
k=1
k=m
ak+1
k=0
Definition 1.26 (Produktsymbol):
Analog zum Summensymbol definiert man:
n
Y
n−1
X
ak := am · am+1 · · · · · an .
Erweiterte Fassung des Induktionsprinzips
Nicht immer kann man einen Induktionsbeweis bei 0 beginnen, sondern erst mit einer festen
Zahl n0 ∈ .
N
Satz 1.7:
Sei n0 ∈
N fest, A(n) sei eine Aussage, die für n ≥ n0 erklärt ist.
1. Es gelte A(n0 )
2. Für alle n ≥ n0 gilt: Falls A(n) richtig ist, dann ist auch A(n + 1) richtig.
Dann gilt A(n) für alle n ≥ n0 .
Satz 1.8:
Für alle n ≥ 5 gilt 2n > n2 .
Beweis: Induktionsanfang: 25 = 32 > 52 = 25.
Induktionsschluß: Es gelte 2n > n2 für n ≥ n0 . Zu zeigen ist: 2n+1 > (n + 1)2 .
Es gilt (n + 1)2 = n2 + 2n + 1 < n2 + 2n + n = n2 + 3n < n2 + n · n = 2n2 . Nach Induktionsvoraussetzung ist 2n2 < 2 · 2n = 2n+1 also (n + 1)2 < 2n+1 .
Rekursive Definitionen
Satz 1.5 zeigt die Berechtigung von rekursiven Definitionen: M sei eine Menge, man möchte
eine Funktion f : → M konstruieren. Dazu genügt es
N
1. f (0) zu erklären.
2. Zu erklären, wie man aus f (n) durch Formel, Vorschrift f (n + 1) erhält. Aus Satz 1.5 folgt:
der Definitionsbereich dieser Funktion ist .
N
Beispiel: Definiere a(0) = 1 und a(n + 1) =
1
1+a(n) .
Definition 1.27:
Es sei n ∈ gegeben. Dann ist n! (n-Fakultät) rekursiv durch
N
0! := 1
und
(n + 1)! := n! · (n + 1)
definiert.
Satz 1.9:
Es sei M eine nicht leere Teilmenge von
N. Dann besitzt M ein kleinstes Element.
△
2
Die reellen Zahlen
2.1
Axiome der reellen Zahlen
R soll nicht konstruiert werden. Alle nötigen Eigenschaften von reellen Zahlen werden als Axiome
formuliert.
Axiome: Eigenschaften, Gesetze, Aussagen, die nicht bewiesen werden, sondern als wahr angenommen werden.
Wichtig: Nur diese dürfen verwendet werden, keine anderen Eigenschaften auch wenn diese
anschaulich evident sind.
Man kann Analysis treiben, indem man nur diese Axiome verwendet. Überspitzt formuliert, ohne
zu wissen was reelle Zahlen eigentlich sind. Es gibt drei Gruppen von Axiomen:
1. Algebraische Axiome
2. Ordnungsaxiome
3. Vollständigkeitsaxiom
2.1.1
Die algebraischen Axiome
Die algebraischen Axiome regeln, wie man mit reellen Zahlen rechnet“. Für die reellen Zahlen
”
sind zwei Verknüpfungen oder Operationen, nämlich Addition + und Multiplikation · erklärt: zu
a, b ∈ ist a + b und a · b aus erklärt. Was ist eine Verknüpfung? Antwort: eine ungewöhnlich
geschriebene Abbildung nämlich
R
R
R×R→R
(a, b) 7→ a + b
Statt +(a, b) schreibt man a + b.
Axiome der Addition
Bezüglich + soll gelten:
V
(A1 ) x,y,z∈R (x + y) + z = x + (y + z)
W
V
(A2 ) 0∈R x∈R 0 + x = x + 0 = x
V
W
(A3 ) x∈R x′ ∈R x + x′ = x′ + x = 0
V
(A4 ) x,y∈R x + y = y + x
Assoziativgesetz
Existenz des neutralen Elements
Existenz des inversen Elements
Kommutativgesetz
18
2 Die reellen Zahlen
Einfache Folgerungen
Satz 2.1:
1. Es gibt genau ein Element 0 ∈
R
R.
R
2. Zu jedem x ∈ gibt es genau ein x′ ∈ mit x + x′ = x′ + x = 0. Dieses eindeutig
bestimmte x′ mit x + x′ = 0 wird mit −x bezeichnet und heißt das Negative von x.
3. −(−x) = x
4. Gilt a + x = b und a + y = b, so folgt x = y (Eindeutigkeit der Lösung einer
Gleichung)
Beweis:
1. Wenn x + 0 = 0 + x und 0̃ + x = x + 0̃ gilt, dann folgt 0 = 0 + 0̃ = 0̃
2. Es gelte x+x′ = x′ +x = 0 und x+x′′ = x′′ +x = 0. Dann gilt: x′′ = x′′ +0 = x′′ +(x+x′ ) =
(x′′ + x) + x = 0 + x′ = x′ .
3. −(−x) = −(−x) + 0 = −(−x) + (−x + x) = (−(−x) + (−x)) + x = 0 + x = x
4. Es gelte a+x = b = a+y. Addition von −a auf beiden Seiten: −a+(a+x) = −a+(a+y) ⇔
(−a + a) + x = (−a + a) + y ⇔ 0 + x = 0 + y ⇔ x = y. Damit ist die Eindeutigkeit der
Lösung gezeigt worden. Es gibt immer eine Lösung: Nämlich x = b + (−a).
Definition 2.1:
Im folgenden wird folgende Abkürzung verwendet: b − a := b + (−a)
Axiome der Multiplikation und das Distributivgesetz
Die Multiplikation erfüllt:
V
(M1 ) x,y,z∈R (x · y) · z = x · (y · z)
W
V
(M2 ) e∈R−{0} x∈R e · x = x · e = x
V
W
(M3 ) x∈R−{0} x′ ∈R x · x′ = x′ · x = e
V
(M4 ) x,y∈R x · y = y · x
Assoziativgesetz
Existenz des neutralen Elements
Existenz des inversen Elements
Kommutativgesetz
Wie bei + zeigt man: e ist eindeutig bestimmt. e wird mit 1 bezeichnet. x′ mit x · x′ = e ist das
multiplikative Inverse von x (x′ ist nur für x 6= 0 definiert). Es ist eindeutig bestimmt und wird
mit x−1 oder x1 bezeichnet.
Durch das Distributivgesetz werden + und · verbunden:
V
(D ) a,b,c∈R a · (b + c) = a · b + a · c
Satz 2.2:
1. 0 · x = 0 für alle x ∈
2. (−a) · b = −(a · b).
R.
Distributivgesetz
19
2.1 Axiome der reellen Zahlen
3. a, b ∈
R und a · b = 0 ⇒ a = 0 ∨ b = 0.
4. a 6= 0, dann ist (a−1 )−1 = a
5. Für a 6= 0 und b ∈
6. Für b, d 6= 0 gilt:
R gibt es genau eine Lösung für a · x = b nämlich x = ab
a c
ad + bc
+ =
b d
bd
Beweis:
1. 0 · x = (0 + 0) · x = 0 · x + 0 · x. Subtraktion von −(0 · x) ergibt: 0 · x = 0
2. Behauptet wird, daß (−a) · b das Negative von a · b ist, dies ist richtig, denn (−a) · b + a · b =
(−a + a) · b = 0 · b = 0
3. a = 0: fertig. Für a 6= 0 löst b die Gleichung a · x = 0 und 0 ist auch eine Lösung. Also
b = 0.
Die Axiome (A1 )–(A4 ), (M1 )–(M4 ) und (D ) bilden die Körperaxiome.
Rechnen mit den algebraischen Axiomen
Abkürzungen: Mit Induktion folgt: In der Summe ((((x1 + x2 ) + x3 ) + x4 ) + · · · + xn ) ist die
Art der Klammerung unerheblich, d.h. sie dürfen weggelassen werden. Das Gleiche gilt für das
Produkt (es sei m ≤ n):
n
X
xi := xm + xm+1 + · · · + xn
i=m
n
Y
i=m
xi := xm · xm+1 · · · · · xn
Mit Induktion folgt:
(a1 + a2 + · · · + am ) · (b1 + b2 + · · · + bn )
= a1 b1 + a1 b2 + · · · + a1 bn + a2 b1 + a2 b2 + · · · + a2 bn + am b1 + · · · + am bn
m
X
i=1
!  n 
m X
n
X
X
X


ai ·
bj =
ai bj =:
ai bj
j=1
i=1 j=1
1≤i<m
1≤j<n
Definition 2.2 (Potenzschreibweise):
Analog zu n · a = a
{z· · · + a}, definiert man:
| +a+
n Summanden
Für n ∈
N mit n ≥ 1 sei
an = a
| · a ·{z· · · · a}
n Faktoren
Für n = 0 gelte: a0 = 1
20
2 Die reellen Zahlen
Satz 2.3:
Es gelten folgende Rechenregeln: an · am = an+m , (a · b)n = an · bn und (an )m = an·m .
Definition 2.3:
Für a 6= 0, n ∈
N n 6= 0 setzt man a−n = a1n . Alle Regeln gelten weiter.
Satz 2.4 (Geometrische Reihe):
n
X
1 − q n+1
qi =
Für q ∈ − {1} gilt
1−q
R
i=0
Beweis: Beweis mit Induktion über n:
0
X
Induktionsanfang: Für n = 0 gilt:
qi = q0 = 1
und
i=0
Induktionsschluß: Es gelte
n
X
qi =
i=0
n+1
X
qi =
i=0
n
X
q i + q n+1 =
i=0
1 − q n+1
1−q
=
=1
1−q
1−q
1 − q n+1
. Dann ist
1−q
1 − q n+1 + q n+1 · (1 − q)
1 − q n+2
1 − q n+1
+ q n+1 =
=
1−q
1−q
1−q
Der binomische Lehrsatz
Definition 2.4 (Binomialkoeffizient):
Für k ≥ 0 und k ≤ n wird
k
Y
n
n−j +1
n · (n − 1) · · · · · (n − k + 1)
n!
:=
=
=
k
j
1 · 2 · 3 · ··· · k
k! · (n − k)!
j=1
als Binomialkoeffizient n über k bezeichnet.
Für k > n gilt nk = 0.
n
n!
Für 0 ≤ k ≤ n gilt nk = k!(n−k)!
= n−k
Kombinatorische Bedeutung: A sei Menge mit n Elementen. Dann ist
elementigen Teilmengen von A. Aus der Definition folgt 1 ≤ k ≤ n.
Satz 2.5:
Es gilt:
n
k
die Anzahl der k-
n+1
n
n
=
+
k
k−1
k
Beweis:
n+1
(n + 1)!
n!(k + n − k + 1)
n! · k + n!(n − k + 1)
=
=
=
k
k!(n + 1 − k)!
k!(n − k + 1)!
k!(n − k + 1)!
n! · k
n!(n − k + 1)
n!
n!
=
+
=
+
k!(n − k + 1)! k!(n − k + 1)!
(k − 1)!(n − k + 1)! k!(n − k)!
n
n
=
+
k−1
k
21
2.1 Axiome der reellen Zahlen
Satz 2.6 (Binomischer Lehrsatz):
Seien a, b ∈
R und n ∈ N
n
(a + b)
n X
n
an−i bi
i
i=0
n n−1
n n−2 2
n
n
= a +
a
b+
a
b + ··· +
a1 bn−1 + bn
1
2
n−1
=
Für n = 0, 1, 2, 3 gilt dann:
(a + b)0 = 1
(n = 0)
1
(a + b) = a + b
(n = 1)
(a + b)2 = a2 + 2ab + b2
3
3
2
(n = 2)
2
3
(a + b) = a + 3a b + 3ab + b
(n = 3)
Beweis: Beweis mit Induktion über n.
Induktionsanfang: n = 0: n einsetzen ergibt 1 = 1.
Induktionsschluß: von n auf n + 1:
(a + b)n+1 = (a + b)n · (a + b)
!
n X
n n−i i
=
a b · (a + b)
i
i=0
!
!
n n X
X
n n−i i
n n−i i
=
a b ·a+
a b ·b
i
i
i=0
i=0
n n X
X
n n−i+1 i
n n−i i+1
=
a
b ·+
a b
i
i
i=0
i=0
n n−1 X
n n−i+1 i X n n−j j+1
n+1
=a
+
a
b +
a b
+ bn+1
i
j
i=1
j=0
n n−1+1 1
n n 0
n n−1 2
n n−1 2
n+1
=a
+
a
b +
a b +
a
b +
a
b + · · · + bn+1
1
0
2
1
n+1 n
n + 1 n−1 2
n+1
=a
+
a b+
a
b + · · · + bn+1
1
2
n + 1 n+1
n + 1 n+1−1 1
n + 1 n+1−2 2
n + 1 n+1
=
a
+
a
b +
a
b + ··· +
b
0
1
2
n+1
n+1
X n + 1
=
an+1−j bj
j
j=0
Die natürlichen Zahlen in
R
N ist die kleinste Menge, mit der man zählen kann. N entsteht aus 0 durch fortgesetzte Addition
von 1: 0, 0 + 1, 0 + 1 + 1, . . .
22
2 Die reellen Zahlen
Exkurs: Die kombinatorische Bedeutung des Binomialkoeffizienten
N
Für i, m ∈ mit i ≤ m sei
m
:= Anzahl der i-elementigen Teilmengen einer m-elementigen Menge.
i
Man liest dieses Symbol als m über i“ und nennt es Binomialkoeffizient. Offensichtlich ist
”
m
m
=
= 1,
0
m
denn eine m-elementige Menge M enthält genau eine 0-elementige Teilmenge (nämlich die
leere Menge) und genau eine m-elementige Teilmenge (nämlich die Menge M selbst). Für
0 < i < m gilt
m
m m−1
=
,
i
i i−1
wie man folgendermaßen einsieht: Man betrachte alle i-elementigen Teilmengen A von M
und prüfe jeweils für alle x ∈ M , ob x ∈ A gilt. Dabei zähle man, wie oft dies geschieht
auf zwei verschiedene Arten:
(1) Für A gibt es mi Möglichkeiten, bei jeder solchen gibt es dann i Möglichkeiten für die
Wahl von x; insgesamt gibt es also i · m
i Möglichkeiten.
(2) Für
die Wahl von x gibt es zunächst m Möglichkeiten, für jede solche Wahl dann
m−1
m−1
i−1 Ergänzungen zu einer i-elementigen Teilmenge A; insgesamt gibt es also m · i−1
Möglichkeiten.
m−1
Aus i · m
i = m · i−1 ergibt sich die oben behauptete Formel. Aus ihr folgt nun
m
m m−1 m−2
m−i+1
m(m − 1)(m − 2) · · · · · (m − i + 1)
=
·
·
· ··· ·
=
i
i i−1 i−2
i
i(i − 1)(i − 2) · · · · · 1
m!
=
i!(m − i)!
Nun wollen wir den Term (a + b)n durch Auflösen der Klammern in eine Summe von
Potenzprodukten
am−i bi (i = 0, 1, . . . , m) verwandeln. Der Summand am−i bi tritt genau
m
i -mal auf. Denn er entsteht, wenn man in dem Produkt
(a + b)(a + b) · · · · · (a + b)
(m Faktoren)
aus i der Klammern den Faktor b und
aus den übrigen den Faktor a wählt, und aus den
m Klammern kann man auf genau mi verschiedene Arten i Klammern auswählen.
Die Formel
m m
m m−1
m m−2 2
m m
m
(a + b) =
a +
a
b+
a
b + ···+
b
0
1
2
m
bzw.
(a + b)m =
heißt Binomischer Lehrsatz.
m X
m m−i i
a
b
i
i=0
23
2.1 Axiome der reellen Zahlen
Definition 2.5:
Eine Teilmenge M ⊂
R heißt induktiv :⇔
1. 0 ∈ M ,
2. wenn x ∈ M dann auch x + 1 ∈ M .
R
Es gibt induktive Mengen: z.B.
selbst.
Idee:
ist die kleinste induktive Teilmenge von
menge enthalten.
N
R, diese ist in jeder anderen induktiven Teil-
Definition 2.6:
\
:=
A, wobei I die Familie aller induktiven Teilmengen von
N
R ist.
A∈I
Satz 2.7:
\
A ist induktiv.
A∈I
Beweis:
zu 1. 0 ∈ A für alle A ∈ I ⇒ 0 ∈
zu 2. sei x ∈
⇒
N
N
0 ∈ , 0+1 ∈ , 2 = 1+1+0 ∈
einem beweisbaren Satz.
^
A∈I
\
A∈I
\
A∈I
A ⇒ für alle A ∈ I gilt x ∈ A
x + 1 ∈ A ⇒ (x + 1) ∈
\
A
A∈I
N usw. Jetzt wird das Prinzip der vollständigen Induktion zu
Satz 2.8:
A⊂
N mit 0 ∈ A und wenn x ∈ A dann auch x + 1 ∈ A. Dann folgt A = N.
Beweis: A ist also induktive
Teilmenge von R, gehört also zu I, kommt also beim Durchschnitt
T
vor. Also gilt N =
M ⊂ A also gilt A ⊂ N und N ⊂ A ⇒ A = N
M ∈I
2.1.2
Ordnungsaxiome
R
R
ist eine Teilmenge P ⊂
ausgezeichnet, die sogenannte Menge der positiven Zahlen.
In
Diese erfüllt drei Axiome:
(ORD1 ) Von den drei Aussagen x ∈ P , −x ∈ P , x = 0 ist für jedes x ∈ genau eine wahr.
R
(ORD2 ) Zu x, y ∈ P ist x + y ∈ P
(ORD3 ) Zu x, y ∈ P ist x · y ∈ P
Definition 2.7:
x > y :⇔ x − y ∈ P und
x < y :⇔ y − x ∈ P .
24
2 Die reellen Zahlen
(ORD1 ) besagt, daß
R aus den drei disjunkten Teilmengen P , {0} und −P besteht. Also:
Definition 2.8:
R mit x ∈ P , so sagen wir: x ist positiv. Ist −x ∈ P , dann sagen wir: x ist
Ist x ∈
negativ.
Satz 2.9:
x > 0 ⇔ x ∈ P , d.h. x ist positiv. x < 0 ⇔ −x ∈ P , d.h. x ist negativ.
Die folgenden Sätze (U1 )–(U11 ) sind Regeln für den Umgang mit < und >.
R
(U1 ) Für x, y ∈
ist von den drei Aussagen x < y, x > y und x = y genau eine wahr.
Hinweis: (U1 ) ist eine triviale Umformung von (ORD1 ).
(U2 ) Für x, y ∈
R gilt: x < y und y < z ⇒ x < z
Beweis: Nach Voraussetzung gilt: y − x ∈ P und z − y ∈ P . Nach (ORD2 ) ist (y − x) + (z − y) ∈
P ⇒z−x∈P ⇒x<z
(U3 ) Für x, y, z ∈
R gilt x < y ⇔ x + z < y + z
(U4 ) x < y und z > 0 ⇒ x · z < y · z
(U5 ) x < y und z < 0 ⇒ x · z > y · z
Bemerkung:
1. Eine Aussage der Form a < b heißt Ungleichung, < und > heißen Ordnungsrelationen.
2. (U1 )–(U5 ) sind äquivalent zu (ORD1 )–(ORD3 ).
Umgang mit Ungleichungen:
(U6 ) a < b und c < d ⇒ a + c < b + d
(man kann Ungleichungen addieren)
(U7 ) 0 < a < b und 0 < c < d ⇒ a · c < b · d
(man kann Ungleichungen zwischen positiven Zahlen multiplizieren)
(U8 ) 0 < a < b ⇒ 0 <
(U9 ) a ∈
1
1
<
b
a
R − {0} ⇒ a2 > 0
(U10 ) 0 < a und 0 < b ⇒ (a < b) ⇔ (a2 < b2 )
(U11 ) n ∈
N − {0} ⇒ n > 0
Beweis: (U6 ): b−a ∈ P und d−c ∈ P nach Voraussetzung. Mit (ORD2 ) folgt: (b−a)+(d−c) ∈
P ⇒ (b + d) − (a + c) ∈ P ⇒ a + c < b + d.
(U7 ): Durch zweimaliges Anwenden von (U4 ) erhält man a · c < b · c und bc < bd. Mit (U2 )
folgt die Behauptung.
25
2.1 Axiome der reellen Zahlen
(U8 ): Man zeigt zuerst: 1 ∈ P und a ∈ P ⇒ 1/a ∈ P . Annahme: −1 ∈ P . Dann ist 1 ∈
/ P und
nach (ORD3 ) (−1) · (−1) = 1 ∈ P . Widerspruch! Also gilt 1 ∈ P . Annahme: Es gilt a > 0 und
1/a < 0. Dann ist −(1/a) > 0 und damit a · (−(1/a)) = −1 ∈ P . Widerspruch! Also 1/a > 0.
Jetzt multipliziert man 0 < a < b mit 1/(a · b) ∈ P durch und erhält die Behauptung.
(U9 ): a ∈ P ⇒ a·a ∈ P , also a2 > 0. −a ∈ P ⇒ (−a)·(−a) ∈ P , d.h. a2 ∈ P , da (−a)·(−a) = a2 .
(U10 ): Es seien a, b ∈ P . Dann gilt wegen (a + b) ∈ P , 1/(a + b) ∈ P und b2 − a2 = (b − a) · (b + a)
die Äquivalenz (b − a) ∈ P ⇔ (b2 − a2 ) ∈ P .
(U11 ): 1 ∈ , 1 ∈ P ⇒ 1 + 1 = 2 ∈ P . Mit vollständiger Induktion folgt n > 0.
N
Ab jetzt: N ⊂ Z ⊂ Q ⊂ R
Definition 2.9:
x ≤ y :⇔ x < y ∨ x = y
x ≥ y :⇔ x > y ∨ x = y
Es gelten analoge Regeln zu (U1 )–(U11 ).
Beliebter Schluß: a ≥ b und b ≥ a ⇒ b = a
Satz 2.10 (Bernoulli’sche Ungleichung):
Es sei x ≥ −1 und n ∈
N dann gilt: (1 + x)n ≥ 1 + n · x.
Beweis: Induktionsanfang: n = 0: 1 ≥ 1.
Induktionsschluss: Es gelte (1 + x)n ≥ 1 + n · x. Behauptung: (1 + x)n+1 ≥ 1 + (n + 1) · x
Nach Induktionsvoraussetzung ist (1+x) ≥ 0 aber (1+nx)(1+x) = 1+nx+x+nx2 ≥ 1+nx+x
denn n · x2 ≥ 0.
Eine bequeme Einrichtung ist der Absolutbetrag:
Definition 2.10 (Absolutbetrag):
R R mit
Als Absolutbetrag bezeichnen wir die Funktion | | : →


falls x > 0
x
|x| = −x falls x < 0


0
falls x = 0
Direkt aus der Definition folgt:
(Ab0 ) − |x| ≤ x ≤ |x|
(Ab1 ) |x|2 = x2
(Ab2 ) Für c > 0 gilt: |a| ≤ c ⇔ −c ≤ a ≤ c
Für alle x, y ∈
R gilt:
(Ab3 ) |x| ≥ 0 und |x| = 0 ⇔ x = 0
(Ab4 ) |x · y| = |x| · |y|
26
2 Die reellen Zahlen
(Ab5 ) |x + y| ≤ |x| + |y|
(Ab6 ) |x| − |y| ≤ |x − y|
(Dreiecksungleichung)
Beweis: (Ab3 ) ist klar nach Definition von |x|.
(Ab4 ) Man untersucht alle vier Fälle: (i) x ≥ 0 und y ≥ 0, (ii) x ≥ 0 und y < 0, (iii) x < 0 und
y < 0, (iv) x < 0 und y ≥ 0.
(Ab5 ) |x + y| ≤ |x| + |y| ⇔ (|x + y|)2 ≤ (|x| + |y|)2 ⇔ (x + y)2 ≤ |x|2 + 2|x||y| + |y|2 ⇔
(Ab0 )
x2 + 2xy + y 2 ≤ x2 + 2|x||y| + y 2 ⇔ 2xy ≤ 2|x · y| ⇔ x · y ≤ |x · y|.
(Ab6 ) wird genauso bewiesen.
Übung: Es gelte für alle ε > 0 aus
kleine Zahl ist 0.
R: |a| ≤ ε. Zeige a = 0. Mit anderen Worten, eine beliebig
Das Vollständigkeitsaxiom
Q
R
R
Bemerkung: Die Körper- und Ordnungsaxiome werden auch von
erfüllt, aber
ist umfangreicher als . Wir haben bereits gesehen: In
gibt es keine Zahl q mit q 2 = 2.In soll es eine
solche Zahl geben. Analog auch π, e, etc. Das Vollständigkeitsaxiom sichert die Existenz solcher
Zahlen.
Q
Q
Definition 2.11:
S
V sei eine beliebige Teilmenge von . Eine obere Schranke für S ist eine Zahl c mit
eine obere Schranke, dann heißt S nach oben beschränkt.
a∈S a ≤ c. Gibt es für S ⊂
R
R
R
Beispiele: S1 = {x ∈ | x < 1}
c = 1, 2, 3, . . . sind obere Schranke von S1 .
2
S2 = {x ∈ | x < 2}
c = 2, 3, . . . sind obere Schranken.
S3 = ist unbeschränkt.
S4 = { Flächeninhalt von in S1 einbeschriebenen Polygonen P}
N
R
Definition 2.12:
c ∈ heißt genau dann kleinste obere Schranke von S ⊂
V
• c obere Schranke von S ( t∈S t ≤ c) ist
R
△
R, wenn
• und für jede weitere obere Schranke c′ gilt: c ≤ c′
Klar: Je zwei kleinste obere Schranken sind gleich, deshalb definiert man:
Definition 2.13 (Supremum):
Die kleinste obere Schranke von S wird als Supremum von S (kurz: sup(S)), bzw. als
obere Grenze von S bezeichnet.
√
Die Existenz von Zahlen wie 2 = sup(S2 ), π = sup(S4 ) folgt nicht aus den Körper- und
Anordnungsaxiomen (Diese gelten auch für ).
Q
Axiom (Vollständigkeitsaxiom):
Jede nicht leere nach oben beschränkte Teilmenge von
kleinste obere Schranke) in .
R
R besitzt ein Supremum (eine
27
2.1 Axiome der reellen Zahlen
Definition 2.14:
Für s ist Supremum von A schreiben wir s = sup(A).
Q
√
Bemerkung: Das Vollständigkeitsaxiom gilt nicht in
(sonst folgt 2 ∈
√
Existenz von reellen Zahlen wie beispielsweise π, e, n a für (a > 0), usw.
Beispiel:
e = sup
1
1+
n
n n∈
N
Q). Es garantiert die
− {0}
△
Die Herleitung der Existenz solcher Zahlen geschieht einfacher durch Folgen und Reihen.
Unterschied zum Maximum:
Definition 2.15 (Maximum):
S seine ein nicht leere
V Teilmenge von
(max(S)), wenn gilt: a∈S a ≤ t
R. t
∈ S heißt genau dann Maximum von S
Zum Nachweis, daß eine Zahl s das Supremum einer Teilmenge S ist, benutzt man häufig folgende
Umformulierung:
Satz 2.11:
s = sup(S) ⇔ (1)
V
t∈S
t ≤ s und (2)
V
ε>0
W
m∈S
s − ε < m.
Beweis:
W
V ”⇒“: s = sup(S). (1) gilt, da s obere Schranke. Angenommen (2) wäre falsch, d.h.
ε>0 m∈S s − ε ≥ m. Dann wäre aber s − ε eine obere Schranke, dies wäre ein Widerspruch zu
s ist kleinste obere Schranke, also ist auch (2) richtig.
⇐“: Gegeben s mit (1) und (2). Zu zeigen: s = sup(S). s ist obere Schranke nach (1). s′ = s − ε;
”
Mit ε > 0 gibt es nach (2) ein m ∈ S mit m > s − ε = s′ , d.h. s′ ist keine obere Schranke von S
und damit ist s die kleinste obere Schranke.
Definition 2.16:
V
S ⊂ seigegeben. c ∈ heißt untere Schranke von S :⇔ m∈S c ≤ m.
c ∈
heißt größte untere Schranke oder Infimum (c = inf(S)) :⇔ 1) c ist untere
Schranke und 2) für jede weitere untere Schranke c′ von S gilt: c′ ≤ c
R
R
R
Satz 2.12:
S ⊂ sei nach unten beschränkt, dann existiert inf(S).
R
Definition 2.17:
−S := {−m | m ∈ S}
Beweis: Ist c eine obere Schranke von S, dann ist −c obere Schranke von −S. Nach dem
Vollständigkeitsaxiom existiert d = sup(−S).
Behauptung: −d = inf(S). Beweis: (1) s ∈ S ⇒ −s ∈ −S also −s ≤ d ⇒ s ≥ −d also ist −d
eine untere Schranke von S. (2) c′ ist weitere untere Schranke von S ⇒ −c ist weitere obere
Schranke von −S, also −c′ ≥ sup(−S) = d, d.h. c′ ≤ −d und −d ist die größte untere Schranke
von S.
28
2 Die reellen Zahlen
Es gilt (ohne Beweis):
Satz* 2.13 (Eindeutigkeitssatz):
Es gibt bis auf Äquivalenz“ höchstens einen Körper K mit P ⊂ K, so daß (ORD1)–
”
(ORD3) und das Vollständigkeitsaxiom gelten.
Satz* 2.14 (Existenzsatz):
Es gibt einen solchen Körper.
Varianten des Vollständigkeitsaxioms:
R
(V2
A, B ⊂ , A 6= ∅, B 6= ∅.
V) gegeben
V
a∈A b∈B a ≤ c ≤ b. (Lückenlosigkeit von
V
R)
a∈A
V
b∈B
a ≤ b dann gibt es c ∈
R
mit
(V3 ) Jede beschränkte monotone Folge konvergiert.
(V4 ) Axiom“ von Archimedes + Jede Cauchyfolge konvergiert in
”
Satz 2.15 ( Axiom“ von Archimedes):
”
zu jedem d > 0, m ∈ gibt es ein n ∈ mit n · d > m, kurz:
^ ^
_
d>0⇒
n·d >m
R
R.
N
R
m∈
R
N
d∈
Beweis: Widerspruchsbeweis S := {n · d | n ∈
n∈
NV}.
Wäre die Folgerung falsch, dann würde gelten: n∈N n · d ≤ m, d.h. m ist obere Schranke für
S. Nach dem Vollständigkeitsaxiom existiert s = sup(S). Dann ist s − d keine obere Schranke
für S (da s − d < s, d > 0). Es gibt ein a = k · d aus S mit s − d < k · d = a (k ∈ ). Also gilt
s < k · d + d = (k + 1) · d. Da (k + 1) · d ∈ S ist, ist s keine obere Schranke also gilt Folgerung. N
Satz 2.16:
N ist nicht nach oben beschränkt, d.h. zu jedem m ∈ R gibt es ein n ∈ N mit n = n·1 > m.
Satz 2.17:
Zu jeder (noch so kleinen) reellen Zahl ε > 0 gibt es ein n ∈
Beweis:
1
1
< ε ⇔ n > . Setze m =
n
ε
1
ε
in Satz 2.16 ein.
N mit n1 < ε.
2.1 Axiome der reellen Zahlen
29
Exkurs: Aus: Richard Dedekind Was sind und was sollen die Zahlen?“
”
Definition 2.18:
Zwei Mengen heißen ähnlich, wenn es eine Bijektion zwischen ihnen gibt.
Definition 2.19:
Eine Menge M heißt unendlich, wenn M zu einer echten Teilmenge von sich selbst ähnlich ist.
Im anderen Fall heißt M endlich.
Satz 2.18:
Sind M und N ähnlich, so ist M genau dann unendlich, wenn N es ist.
Beweis: Sei f : N → M eine Bijektion und N unendlich. Dann gibt es eine Bijektion zwischen N und
einer echten Teilmenge N ′ von N . Dann gibt es aber auch eine Bijektion zwischen M und der echten
Teilmenge f (N ′ ) von M .
Satz 2.19:
Jede Menge, die eine unendliche Teilmenge besitzt, ist selber unendlich; oder mit anderen Worten,
jede Teilmenge einer endlichen Menge ist selber endlich.
Beweis: Sei M eine Menge mit einer unendlichen Teilmenge T . Dann gibt es also eine echte Teilmenge
ϕ(T ) von T und eine Bijektion ϕ : T → ϕ(T ). Diese Abbildung ϕ kann zu einer Selbstabbildung
Ψ : M → M fortgesetzt werden, indem man für ein beliebiges m ∈ M setzt Ψ(m) = ϕ(m) bzw.
Ψ(m) = m, je nachdem, ob m in T liegt oder nicht. Die Abbildung Ψ ist eine Bijektion auf ihr Bild;
bedeutet nämlich, a, b verschiedene Elemente von M , so ist, wenn sie zugleich in T enthalten sind, das
Bild Ψ(a) = ϕ(a) verschieden von dem Bilde Ψ(b) = ϕ(b), weil ϕ eine Bijektion ist; wenn ferner a in T , b
nicht in T enthalten ist, so ist Ψ(a) = ϕ(a) verschieden von Ψ(b) = b, weil ϕ(a) in T enthalten ist; wenn
endlich weder a noch b in T enthalten ist, so ist ebenfalls Ψ(a) = a verschieden von Ψ(b) = b, was zu
zeigen war. Da ferner ϕ(T ) Teil von T , also auch Teil von M ist, so leuchtet ein, daß auch Ψ(M ) ⊂ M
ist. Da endlich ϕ(T ) echter Teil von T ist, so gibt es in T , also auch in M ein Element t, welches nicht
in ϕ(T ) = Ψ(T ) enthalten ist; da nun das Bild Ψ(m) jedes nicht in T enthaltenen Elements m selbst
= m, also auch von t verschieden ist, so kann t überhaupt nicht in Ψ(M ) enthalten sein; mithin ist
Ψ(M ) echter Teil von M , und folglich ist M unendlich, was zu beweisen war.
Anwendungen:
Satz 2.20:
Ist M eine endliche Menge und f : M → M eine injektive (surjektive) Abbildung, so ist f bijektiv.
Beweis: Wenn f : M → M injektiv, aber nicht surjektiv ist, so ist f (M ) eine echte zu M ähnliche
Teilmenge, also ist M unendlich. Ist f surjektiv, so gibt es ein g : M → M mit f ◦ g = idM , so daß also
g injektiv und deshalb auch bijektiv ist. Dann ist aber auch f = g −1 bijektiv.
Satz 2.21:
Ist M eine nicht leere endliche Menge, so gibt es eine natürliche Zahl n und eine Bijektion
f : {1, . . . , n} → M .
30
2 Die reellen Zahlen
N
Beweis: Es sei I = {(f, n) | n ∈ , f : {1, . . . , n} → M ist eine injektive Abbildung }. Da M nicht leer
ist, ist auch I nicht leer. Auf I sei durch
(f, n) ≤ (g, m) :⇔ n ≤ m ∧ g|{1,...,n} = f
eine Ordnungsrelation definiert.
Da es keine injektive Abbildung
→ M geben kann (M enthielte dann eine unendliche Menge und
wäre selber unendlich), definiert die Vereinigung einer Kette in I wieder
S eine Element von I. Präziser:
Sei K = {(fx , nx ) | x ∈ X} eine Kette in I. Dann läßt sich auf D := x∈X {1, . . . , nx } eine Abbildung
H : D → M durch H(i) := fx (i) falls i ∈ {1, . . . , nx } definieren. Da für zwei Elemente (fx , nx ) und
(fy , ny ) aus K die Abbildung fx und fy auf dem Durchschnitt der Definitionsbereiche übereinstimmen,
ist H wohldefiniert. Die Abbildung H ist auch injektiv, denn sind i < j in D, so gibt es ein (fx , nx )
in K mit j ≤ nx , und H stimmt auf {1, . . . , nx } mit der injektiven Abbildung fx überein. Da D
mit jeder natürlichen Zahl n auch alle natürlichen Zahlen m ≤ n enthält und auf der anderen Seite
von
verschieden sein muß, gibt es ein N mit D = {1, . . . , N }. Dann stimmt aber (H, N ) mit einem
geeigneten (gx , nx ) aus K überein. Nach Konstruktion gilt für alle (fy , ny ) aus K auch (fy , ny ) ≤ (H, N ),
das Element (H, N ) ist also eine obere Schranke für die Kette K.
Nach dem Zornschen Lemma gibt es also ein maximales Element (F.M ) in I. Dann muß F aber auch
surjektiv sein, da man sonst F injektiv auf {1, . . . , M + 1} fortsetzten könnte.
N
N
Satz 2.22:
Sind m < n natürliche Zahlen, so gibt es keine Bijektion zischen {1, . . . , m} und {1, . . . , n}.
Beweis: Wir beweisen die Behauptung durch Induktion über n. Für n = 1 ist die Behauptung klar. Ist
sie für n gezeigt und ϕ : {1, . . . , m} → {1, . . . , n + 1} eine Bijektion, so muß ϕ(m) 6= n + 1 sein, da sonst
ϕ|{1,...,m−1} eine Bijektion zwischen {1, . . . , m − 1} und {1, . . . , n} wäre. Sei also ϕ(m) = i < n + 1. Die
Abbildung
r : {1, . . . , n + q} → {1,
 . . . , n + 1}

falls k ∈
/ {i, n + 1}
k
k
7→
i
falls k = n + 1


n + 1 falls k = i
ist eine Bijektion. Die Komposition ψ := r ◦ ϕ ist folglich eine Bijektion zwischen {1, . . . , m} und
{1, . . . , n + 1} mit ψ(m) = n + 1, was nicht sein kann.
Korollar 2.23:
Ist M eine nicht leere endliche Menge, so gibt es eine eindeutig bestimmte natürliche Zahl n und
eine Bijektion f : {1, . . . , n} → M .
3
Der Grenzwertbegriff: Folgen und Reihen
3.1
Folgen
Charakteristisch für Analysis sind Grenzwertbildungen. Diese entstehen dadurch, daß man
eine endliche Approximation im Gedanken beliebig weit fortsetzt und sozusagen zu Ende denkt“
”
(neue Grundidee).
Seit dem 18. Jhdt. bei Entstehung der Differential/Integralrechnung mit unendlich kleinen
Größen. — Damals nicht exakt faßbar — Erst nach 1820 lieferten Bolzano, Cauchy, Weierstraß exakte Grundlagen, die Epsilontik“. Dies spiegelt sich auch im Wesen der reellen Zahlen
”
wieder: γ ∈ − kann man im Allgemeinen nicht direkt hinschreiben,
genauer in einem end√
lichen Prozeß durch rationale Zahlen beschreiben. Z.B. π, 2, r ∈ −
kann man beliebig
genau approximieren und das Vollständigkeitsaxiom besagt dann, daß es überhaupt etwas gibt,
gegen das alle Approximationen streben.
R Q
R Q
Grenzwertbegriff kennenlernen mit Folgen:
Beispiele von Folgen:
0.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
1, 1, 1, 1, 1, . . .
1, 21 , 13 , 41 , 15 , . . .
1
1, 12 , 14 , 81 , 16
, ...
0, 1, 2, 3, 4, . . .
1, 12 , 1, 13 , 1, 14 , . . .
0, 21 , 0, 13 , 0, . . .
1, 21 , 2, 13 , 3, . . .
0.8, 655.36, 30233.088, . . .
√ √ √
2, 2 2, 3 2, 4 2, . . .
2
3
(1 + 1)1 , 1 + 12 , 1 + 13 , . . .
3, 3.1, 3.14, . . .
√
a0 = 1 an+1 = 1 + an
an = 1
an = n1 (n ≥ 1)
an = 21n
an = n
1
a2n = 1, a2n+1 = n+2
1
a2n = 0, a2n+1 = n+2
1
a2n = n + 1, a2n+1 = n+2
an = nk · q n mit k = 10 und q = 0, 8
√
an = n 2
n
an = 1 + n1
Dezimalbruchentwicklung von π
rekursiv definierte Folge
Definition 3.1:
N R
Eine Folge reeller Zahlen ist eine Abbildung a :
→ . Jeder natürlichen Zahl n wird
eine reelle Zahl a(n) — die man üblicherweise an nennt — zugeordnet.
Statt der üblichen Funktionsschreibweise verwendet man die Symbole (an )n∈N oder (an )n≥0 oder
a0 , a1 , a2 , . . . , an . Je nach Konvention über 0 ∈ beginnt die Folge mit a0 oder a1 .
N
Beispiele 1, 2: Folgenglieder werden immer kleiner, nähern sich immer mehr der Zahl 0 (ohne
diese zu erreichen), kommen der 0 beliebig nahe. Man sagt: 0 ist der Grenzwert dieser Folgen
oder auch (an )n∈N konvergiert gegen 0.
Beispiel 7: Man denkt an wächst, trotzdem: Folge konvergiert gegen 0. Eine genauere Definition
ist nötig.
32
3 Der Grenzwertbegriff: Folgen und Reihen
Umgangssprachliche Formulierung: (an )n∈N konvergiert gegen a, wenn die Folgenglieder der Zahl
a beliebig nahe kommen.
Beliebig nahe heißt doch: Unterschied von a und an — das ist die Zahl |a − an | — soll beliebig klein werden, wenn n groß wird. Der Unterschied |a − an | kann als Approximationsfehler
aufgefaßt werden. Es fehlt die Präzisierung der logischen Reihenfolge.
a) man macht zuerst n groß, dann soll |a − an | klein werden.
b) man schreibt eine Fehlergrenze vor und sagt ab welchem Folgenglied diese Fehlergrenze
nicht mehr überschritten wird.
b) ist offensichtlich richtig und zwar für alle Fehlergrenzen ε. Für jede Fehlergrenze ε > 0 muß
ein Index Nε ∈ gefunden werden, ab dem der Fehler |a − an |, ε nicht überschreitet.
N
Definition 3.2:
(an )n∈N konvergiert gegen a ∈
:⇔ Für alle ε > 0 gibt es ein Nε ∈
n ≥ Nε gilt: |a − an | < ε.
^ _ ^
|a − an | < ε
R
N, so daß für alle
ε>0 Nε n>Nε
Beispiel: (an )n∈N sei eine Folge mit an =
1.0
1
.
n
b
b
0.5
b
1
2
3
b
4
b
b
b
b
b
b
b
b
5
6
7
8
9
10
11
12
Abbildung 3.1: Der Graph zu an =
ε=1:
1
n ≥ N1 = 2 ⇒ < 1
n
1
ε=
:
10
1
n
n ≥ N10
1
1
= 11 ⇒ <
n
10
△
Andere Möglichkeit: Schreibe a und an als Dezimalbrüche. (an )n∈N konvergiert gegen a ⇔ zu
jeder vorgegebenen Stellenzahl S (entspricht ε) gibt es Index NS ∈ , ab dem gilt, die ersten
S-Stellen von an und a stimmen überein (genauer: wegen Nichteindeutigkeit der Dezimalbruchentwicklung: 1 = 0.99999 . . . ) die ersten S-Stellen von a − an sind 0.
Philosophische Probleme beim Grenzwertbegriff: Paradoxon von Zenon von Elea (ca. 450
v.Chr.): Achill und eine Schildkröte veranstalten einen Wettlauf. Achill läuft 10 mal so schnell
wie die Schildkröte. Die Schildkröte erhält eine Vorgabe von 10 m.
N
Hat Achill diese 10 m durchlaufen, dann ist die Schildkröte 1 m weit gekommen.
Hat Achill diesen 1 m durchlaufen, dann ist die Schildkröte 0.1 m weiter gekommen.
..
.
33
3.1 Folgen
Diskussion: Doppelsinnige Bedeutung von niemals“. Zenon hat Recht, wenn niemals nicht in
”
endlich vielen Denkschritten bedeutet. Zenon hat Unrecht, wenn niemals nicht in endlicher Zeit
bedeutet. Das Paradoxon lebt davon, daß eine unendliche Aufeinanderfolge von Einzelschritten,
deren Vollendung man in der Vorstellung nicht nachvollziehen kann, in der Wirklichkeit abgeschlossen vorliegen soll.
Wir beginnen mit Nullfolgen a = 0.
Definition 3.3:
(an )n∈N heißt genau dann Nullfolge (NF), wenn (an )n∈N gegen 0 konvergiert:
(an )n∈N ist Nullfolge :⇔
^ _ ^
ε>0 Nε n≥Nε
|an | < ε
Satz 3.1:
(an )n∈N konvergiert gegen a ⇔ (a − an )n∈N ist Nullfolge.
Satz 3.2:
1
n n≥1
ist eine Nullfolge.
Beweis: Wir müsse für alle ε > 0 etwas zeigen. Dies macht man wie folgt.
1. ε > 0 sei vorgegeben. (Man denkt sich ε als variabel oder unbestimmt. Beweist dann mit
einem solchen ε eine Aussage, so hat man sie für alle ε > 0 gezeigt, denn alle konkreten
ε’s kann man dann ja in den Beweis einsetzen.)
V
2. Gesucht ist Nε mit n>Nε |an | < ε. Verwende Satz 2.17, zu ε > 0 gibt es ein m ∈
mit
1
<
ε.
Setze
N
:=
m
ε
m
V
1
3. n ≥ Nε gegeben, dann n1 ≤ N1ε = m
< ε es gilt also n≥Nε n1 < ε
N
Satz 3.3:
Es sei q ∈
R. Dann gilt: (qn)n∈N
ist Nullfolge ⇔ |q| < 1
1
1
Beweis: ⇐“: Es sei |q| < 1, also |q|
> 1. Setze |q|
= 1 + h mit h > 0. Nach dem Axiom von
”
1
Archimedes gibt es ein N mit 1 + N · h > ε . Setze Nε = N . Für n ≥ N gilt:
|q n | = |q|n =
1
1
1
≤
≤
<ε
(1 + h)n ↑ 1 + nh
1+N ·h
Bernoulli Ungleichung
⇒“: wir zeigen |q| ≥ 1 ⇒ (q n )n∈N ist keine Nullfolge.
”
W
V W
Verneinung von (an )n∈N ist Nullfolge: ε>0 Nε n≥Nε |an | ≥ ε. ε = 1, Nε vorgegeben, n = Nε .
Dann gilt: |q n | = |q|n ≥ 1n = 1 (a > b > 0 ⇒ an > bn )
Definition 3.4:
Eine Folge (an )n∈N heißt monoton fallend (steigend)
:⇔ Für alle n gilt an+1 ≤ an (an+1 ≥ an )
34
3 Der Grenzwertbegriff: Folgen und Reihen
Nicht alle Folgen sind monoton. Man kann zwei Folgen mischen.
1 1 1 1
1 1 1 1
1 1 1 1 1
1, , , , , . . . gemischt mit 1, , , , , . . . ergibt 1, 1, , , , , , . . .
2 4 8 16
2 3 4 5
2 2 3 4 8
Lemma 3.4:
(an )n∈N Nullfolge, (bn )n∈N Nullfolge ⇒ a0 , b0 , a1 , b1 , . . . ist Nullfolge.
Beweis: Übung.
Allgemeine Folgen: Eine Folge kann nicht gegen zwei verschiedene Zahlen konvergieren.
Lemma 3.5 (Eindeutigkeit des Grenzwertes):
Konvergiert eine Folge (an )n∈N gegen a und gegen b so folgt a = b.
Beweisidee: Annahme a 6= b
b+ε
b
b
b−ε
b
b
a+ε
b
b
a
b
b
b
b
b
b
b
a−ε
N1
N2
Abbildung 3.2: Skizze zum Beweis der Eindeutigkeit des Grenzwertes
Beweis: |a − b| = |a − an + an − b| ≤ |a − an | + |an − b| zu jedem ε > 0 gibt es N1 und N2 mit
^
^
|a − an | < ε und
|b − an | < ε
n≥N1
n≥N2
Ab n ≥ N3 := max{N1 , N2 } gelten beide Ungleichungen gleichzeitig, also
n ≥ N3 ⇒ |a − b| ≤ |a − an | + |an − b| < ε + ε = 2ε
Es gilt also |a − b| < 2ε für alle ε > 0. D.h. |a − b| = 0 oder a = b.
Definition 3.5:
Die für eine konvergente Folge (an )n∈N eindeutig bestimmte Zahl a heißt Grenzwert oder
Limes der Folge. Man schreibt:
a = lim (an ) ⇔ Die Folge (an )n∈N konvergiert gegen a
n→∞
Bemerkung:
35
3.1 Folgen
1. lim an = a bedeutet immer:
n→∞
(a) Die Folge (an )n∈N ist konvergent.
(b) Der Grenzwert ist a
2. ∞ ist nur ein Symbol keine Zahl
Definition 3.6:
Gibt es keine Zahl a, gegen die (an )n∈N konvergiert, so heißt (an )n∈N divergent.
Definition 3.7:
N
Eine Folge (an )n∈N heißt beschränkt :⇔ {an | n ∈ } ist eine beschränkte Teilmenge
von
_ ^
⇔
|an | < M
R
R
M∈
N
n∈
Satz 3.6:
Eine konvergente Folge (an )n∈N ist beschränkt.
Beweis: Es sei a = lim an . Zu ε = 1 gibt es N1 , so daß für alle n ≥ N1 gilt: |a − an | < 1. Also
n→∞
gilt |a| − |an | ≤ |a − an | ≤ 1. D.h. −1 + |a| ≤ |an | ≤ 1 + |a|. V
Setze M = max{1 + |a| , |a0 | , |a1 | , |a2 | , . . . , |aN1 |}. Dann gilt: n∈N |an | ≤ M
Übung: (an )n∈N ist beschränkt, (bn )n∈N ist Nullfolge ⇒ (an bn ) ist Nullfolge.
Bemerkung: (an )n∈N monoton steigend, dann ist (an )n∈N beschränkt, falls nach oben beschränkt.
Lemma 3.7:
Es sei a = lim an , b = lim bn und es gelte an ≤ bn für alle n (oder alle n ≥ N0 ). ⇒ a ≤ b
n→∞
n→∞
Beachte: Auch wenn an < bn für alle n braucht nicht a < b zu folgen.
Beispiel: an = n1 , bn = 0
△
Beweis: Angenommen a V
> b, dann ist ε = (a − b)/3 größer als 0. Dazu gibt es N1 und N2 mit
V
|a
−
a
|
<
ε
und
n
n≥N1
n≥N2 |b − bn | < ε. Sei N3 = max{N1 , N2 }. Für n ≥ N3 gelten beide
Ungleichungen, also gilt für n ≥ N3 :
3ε = a − b = a − an + an − b ≤ a − an + bn − b ≤ |a − an | + |−an + b| ≤ ε + ε = 2ε
Widerspruch! ⇒ a ≤ b
Satz 3.8 (Einschließungssatz):
Es gelte für die Folgen (an )n∈N , (bn )n∈N und (cn )n∈N die Ungleichung an ≤ bn ≤ cn für
alle n. Falls (an )n∈N und (cn )n∈N konvergieren mit Grenzwerten a und c und es gilt a = c,
so folgt (bn )n∈N konvergiert mit lim bn = a = c
36
3 Der Grenzwertbegriff: Folgen und Reihen
Beweis: Es gilt an − a ≤ bn − a ≤ cn − a . ε > 0 vorgegeben.
| {z }
| {z }
Nullfolge
Nullfolge
V
V
Es gibt N1 mit n≥N |a − an | < ε und N2 mit n≥N |a − cn | < ε. Setze N3 = max{N1 , N2 }.
1
2
Für n ≥ N3 gelten beide Ungleichungen.
Dann gilt: −ε < bn − a < ε für all n ≥ N3 , da −ε ≤ an − a und cn − a ≤ ε. D.h. |bn − a| < ε
oder (bn )n∈N konvergiert gegen a.
Vermeidung der Epsilontik: Um lim an = a zu zeigen, zeigt man, daß |an − a| eine Nullfolge ist.
n→∞
Dies zeigt man durch Vergleich. D.h. man zeigt es gilt |an − a| ≤ |cn | für alle n wobei (cn )n∈N
eine bereits bekannte Nullfoge ist.
Für lim an = a hat man |an − a| abzuschätzen. Oft erhält man nur |an − a| < k · ε, wobei k
n→∞
konstant ist.
Lemma 3.9:
Für eine Folge (an )n∈N und a ∈ gelte
^ _ ^
|a − an | < k · ε
R
mit k ∈
ε>0 Nε n≥Nε
R konstant
Dann konvergiert (an )n∈N gegen a.
ε
gibt es nach Voraussetzung ein Nε , so daß
k+1
^
ε
|a − an | < k · ε′ = k ·
≤ ε.
k+1
Beweis: ε > 0 vorgegeben. Zu ε′ =
n≥Nε
D.h. Für alle ε > 0 gibt es ein Nε mit |a − an | < ε für alle n ≥ Nε .
Definition 3.8:
Sind zwei Folgen (an )n∈N , (bn )n∈N und λ, µ ∈
gegeben, so kann man folgende neue
Folgen definieren:
Summenfolge (an + bn )n∈N
Folge (cn )n∈N mit cn := an + bn
Linearkombination (λan + µbn )n∈N Folge (cn )n∈N mit cn := λan + µbn
Produktfolge (an · bn )n∈N
Folge (cn )n∈N mit cn := an · bn
V
Gilt zusätzlich n bn 6= 0, definiert man die Quotientenfolge (an /bn )n∈N
R
Beachte: Unterschied zwischen Summe von Folgen und Summe von Zahlen.
Satz 3.10:
(1) (an )n∈N ist Nullfolge, k Konstante ⇒ (k · an )n∈N ist Nullfolge.
(2) (an )n∈N Nullfolge, (bn )n∈N Nullfolge ⇒ (an + bn )n∈N ist Nullfolge.
V
ε
ε
gibt es ein Nε , so daß n≥Nε |an | ≤
. Durch ausmulti|k|
|k|
V
plizieren der Ungleichung mit |k| und (Ab4 ) ergibt sich n≥Nε |k · an | ≤ ε.
V
V
ε
ε
(2) ε > 0 vorgegeben. Dazu gibt es N1 mit n≥N |an | < und N2 mit n≥N |bn | < . Für
1
2
2
2
ε ε
n ≥ N3 := max{N1 , N2 } gilt also: |an + bn | ≤ |an | + |bn | < + = ε
2 2
Beweis: (1) ε > 0 vorgegeben. Zu
37
3.1 Folgen
Satz 3.11 (Hauptsatz über konvergente Folgen, Grenzwertsatz):
Voraussetzungen: (an )n∈N und (bn )n∈N seien konvergente Folgen mit a = lim an und
n→∞
b = lim bn . λ, µ ∈
R
n→∞
Dann konvergieren die Folgen
(λan + µbn )n∈N
mit lim (λan + µbn ) = λa + µb = λ · lim an + µ · lim bn
n→∞
(an · bn )n∈N
n→∞
n→∞
mit lim (an · bn ) = a · b
n→∞
und falls bn 6= 0 für alle n und b 6= 0
(an /bn )n∈N
Beweis:
mit lim (an /bn ) = a/b
n→∞
1. ε > 0 vorgegeben (λ 6= 0 und µ 6= 0). Dazu gibt es N1 und N2 mit
^
^
ε
ε
|an − a| <
und
|bn − b| <
|λ| + |µ|
|λ| + |µ|
n≥N1
n≥N2
Für n ≥ N3 := max{N1 , N2 } gilt also:
|(λan + µbn ) − (λa + µb)| = |λan + µbn − λa − µb| = |λ(an − a) − µ(b − bn )|
≤ |λ| |an − a| + |µ| |bn − b|
|λ| ε
|µ| ε
≤
+
|λ| + |µ| |λ| + |µ|
=ε
2.
|an bn − ab| = |an bn − an b + an b − ab| = |an (bn − b) + b(an − a)|
≤ |an (bn − b)| + |b(an − a)| = |an | |bn − b| + |b| |an − a|
(an )n∈N konvergiert ⇒ (an )n∈N ist beschränkt. ⇒
W
M
≤ M · |bn − b| + |b| · |an − a|
|
{z
}
V
N |an | ≤ M
n∈
ergibt Nullfolge
⇒ (an · bn − a · b)n∈N ist Nullfolge ⇒ lim an bn = a · b.
n→∞
3. Es genügt zu zeigen:
Setze ε =
|b|
2 .
1
bn
N
konvergiert gegen
n∈
Dazu gibt es Nε mit
V
n≥Nε
1
. Der Rest folgt aus 2.
b
|bn − b| < ε =
|b|
2
|b|
|b|
|bn | = |b − (b − bn )| ≥ |b| − |b − bn | = |b| − |b − bn | ≥ |b| −
=
2
2
1
2
1
2 1
1
1
Also
≤
für n ≥ Nε . Also insgesamt:
≤ M = max
,
,
,...,
|bn |
|b|
|bn |
|b| |b0 | |b1 |
|bNε |
38
3 Der Grenzwertbegriff: Folgen und Reihen
1
1 bn − b 1
M
Weiterhin gilt: 0 ≤ − = =
· |bn − b| ≤
· |bn − b|
b bn
b · bn
|b| |bn |
|b|
|
{z
}
ergibt Nullfolge
1
1
=
n→∞ bn
b
Also: lim
Beispiele:
3n2 + 1
1. Bei der Folge
ist Satz 3.11 nicht unmittelbar anwendbar. Trick: erwei2n2 − n − 1 n∈N
3 + n12
1
tern mit 2 liefert
. Zähler- und Nennerfolgen konvergieren:
n
2 − n1 n12
lim
3+
n→∞
2−
1
n
lim
1
n2
−
1
n2
=
n→∞
3+
lim 2 −
n→∞
1
n2
1 1
n n2
1
· lim 1
n→∞ n n→∞ n
lim 1 − lim n1 · lim n1
n→∞ n
n→∞
n→∞
3 + lim
=
2−
=
3
2
2. Wo ist der Fehler?
Folge (an )n∈N mit an =
1
1+
n
· 1+
1
n+1
1
· ··· · 1 +
2n − 1
Jede Faktorfolge hat Grenzwert 1 also auch Produktfolge?
1
1
1
an = 1 +
· 1+
· ··· · 1 +
n
n+1
2n − 1
n+1
n+2
n+3
2n
=
·
·
· ··· ·
n
n+1
n+2
2n − 1
2n
=
= 2?
n
R
N
√
und n ∈
− {0} existiert n a, d.h. Zahl x mit xn = a.
3. Angenommen zu a > 0 aus
√
√
Behauptung: Für a > 0 gilt lim n a = 1. Wir zeigen bn := n a − 1 ist Nullfolge. Sei
n→∞
√
zunächst a > 1, dann ist n a > 1 ((U10 ), (U7 ) und Induktion), d.h.
√
n
a = 1 + bn (bn ≥ 0) ⇒ a = (1 + bn )n ≥ 1 + n · bn ⇔
|
{z
}
Bernoulli Ungleichung
Ergibt Nullfolge also (bn )n∈N Nullfolge ⇒ lim
n→∞
√
n
a=1
a−1
≥ bn ≥ 0
n
39
3.1 Folgen
4. lim
n→∞
√
n
n = 1. Genauso wie oben: bn =
bn + 1 =
√
n
n
n
⇒
√
n
n − 1 ≥ 0 liefert Nullfolge.
n = (bn + 1) =
n X
n
bin
n
= 1 + nbn +
bn 2 + · · · + bn n
2
i
i=0
n
≥
bn 2
(da bn ≥ 0 und ni ≥ 0)
2
2
n·2
=
⇒ bn 2 ≤
n · (n − 1)
n−1
r
2
⇒ 0 ≤ bn ≤
(für n ≥ 2)
n−1
| {z }
Nullfolge
5. Behauptung: lim
n→∞
√
n+1−
Also: 0 ≤
√
√
√
n+1− n=0
n=
√
√ √
√ n+1− n ·
n+1+ n
n+1−n
1
√
=√
√
√ =√
√
n+1+ n
n+1 n
n+1 n
√
√
1
n + 1 − n ≤ √ . Daraus folgt die Behauptung.
2 n
△
Bisher: (an )n∈N Folge, zur Grenzwertbetrachtung war Kenntnis des Grenzwerts nötig. Problem:
Wie stellt man Konvergenz einer Folge fest ohne den Grenzwert zu kennen?
Satz 3.12:
Jede beschränkte monotone Folge konvergiert.
(Bemerkung: Dieser Satz ist äquivalent zum Vollständigkeitsaxiom.)
N
Beweis: (an )n∈N sei monoton steigend (fallend analog). Die Menge A = {an | n ∈ } ist
beschränkt⇒ Es existiert kleinste obere Schranke a =sup A. Behauptung: a = lim an . Beweis:
n→∞
ε > 0 vorgegeben. Wegen a − ε < a ist a − ε keine obere Schranke mehr, d.h. es gibt n0 mit
a − ε < an0 ≤ a ≤ a + ε. Da die Folge monoton steigt gilt für n ≥ n0 : an0 ≤ an ≤ a insgesamt:
n > n0 ⇒ a − ε < an < a + ε d.h. |a − an | < ε Nε = n0 , d.h.
^
|a − an | < ε ⇒ lim an = a
n→∞
n≥Nε
Beispiele:
1. Jeder Dezimalbruch beschreibt eine reelle Zahl: z = a0 , a1 a2 a3 . . . a0 ≥ 0 ai die Ziffer an
der i-ten Stelle 0 ≤ ai ≤ 9. zn = a0 , a1 a2 . . . an Abbrechen nach der n-ten Stelle hinter
dem Komma. (zn )n∈N ist monoton steigend und beschränkt, konvergiert also.
2. Stetige Verzinsung: Kapital a > 0 wird zu 100% Zinsen verzinst. Nach 1 Jahr: Kapital
beträgt 2a. Schlägt man Zinsen nach 21 Jahr zum Kapital, so erhält man nach:
40
3 Der Grenzwertbegriff: Folgen und Reihen
1 Jahr a(1 + 12 )(1 + 12 )
1
1
1
1
3 Jahr: a(1 + 3 )(1 + 3 )(1 + 3 )
1
1 n
n Jahr: a(1 + n )
Betrachte die Folge an = (1 + n1 )n . Behauptung: Diese Folge ist monoton steigend und
beschränkt.
1
1+
n
n
n n
X
X
n 1
n(n − 1)(n − 2) · · · · · (n − k + 1)
=
=
k nk
k! · nk
k=0
k=0
n
X
1(1 − n1 )(1 − n2 ) · · · · · (1 −
=
k!
k−1
n )
k=0
Hieraus folgt die Monotonie:
1
1+
n+1
n+1
=
≥
n+1
X
k=0
n
X
k=0
1(1 −
1
n+1 )(1
−
2
n+1 )
k!
· · · · · (1 −
1(1 − n1 )(1 − n2 ) · · · · · (1 −
k!
k−1
n+1 )
k−1
n )
Beschränktheit (verwende (1 − ni ) ≤ 1):
1
1+
n
n
n
X
1(1 − n1 )(1 − n2 ) · · · · · (1 −
=
k!
k−1
n )
k=0
n
X
1
≤
k!
k=0
1
1
1
1
1
1
1
= 1 + 1 + + + ··· +
≤1+1+ +
+
+ · · · + n−1
2! 3!
n!
2 2·2 2·2·2
2
1 − (1/2)n
=1+
<3
△
1 − (1/2)
Definition 3.9 (Eulersche Zahl):
e := lim
n→∞
1
1+
n
n
Eulersche Zahl
Bemerkung: e auf neun Stellen genau: 2.718 281 828.
Beispiele:
1. Wurzeln: a > 0 und x0 vorgegeben. Definiere rekursiver Folge (xn )n∈N durch
xn+1 :=
1
2
xn +
a
xn
41
3.1 Folgen
Behauptung: (xn )n∈N ist monoton fallend und beschränkt, also konvergent. xn > 0 nach
Konstruktion.
a
1
1
xn − xn+1 = xn −
xn +
=
x2n − a
2
xn
2xn
2
1
a
1
1
1
x2n − a =
xn−1 +
− a = x2n−1 + a + xn−1 − a
4
xn−1
4
2
4
2
1
1
xn−1 −
=
≥0
(da Quadrat)
4
xn−1
⇒ xn − xn+1 ≥ 0 also xn+1 ≤ xn . Insbesondere x0 ≥ xn ⇒ x0 xn ≥ x2n ≥ a, da x2n − a ≥ 0.
Daraus folgt: xn ≥ xa0 , also (xn )n∈N beschränkt.
√
Also x := lim xn Behauptung: x2 = a oder x = a
n→∞
Beweis: mit (xn )n∈N konvergiert auch xan
nach dem Grenzwertsatz gilt:
N
n∈
a
1
xn +
x = lim xn = lim
n→∞
n→∞ 2
xn
!
1
a
1
a
=
lim xn +
=
x+
2 n→∞
lim xn
2
x
n→∞
d.h. x = 21 (x + xa ) ⇒ x2 = 12 x2 + 12 a ⇒ 12 x2 = 12 a. Reelle Zahlen x mit x > 0 und x2 = a
gibt es nur genau eine.
Annahme: Es gäbe weitere mit y 2 = a und x 6= y entweder x > y (oder x < y) dann folgt
x2 > y 2 (x2 < y 2 ) Widerspruch!
a
2. a > 0, x0 > 0, k ≥ 2 aus . Definiere xn+1 := k1 (k − 1)xn + k−1
N
xn
Wie für k = 2 zeigt man Monotonie und Beschränktheit. ⇒ x − lim xn existiert. xk = a,
√
x= ka
△
Satz 3.13:
a > 0, a ∈
R, n ∈ √N − {0} Dann gibt es genau ein b > 0 mit bn = a.
Bezeichnung: b =
n
a (später weiterer Beweis).
Teilfolgen, Häufungswert, Cauchyfolge
Die Folge an = (−1)n (+1, −1, +1, −1, +1, . . . ) enthält zwei Teilfolgen“, die jeweils konver”
gieren. Teilfolgen erhält man so: Man läßt Folgenglieder weg und numeriert neu.
Definition 3.10 (Teilfolgen):
Ist (an )n∈N eine Folge und k 7→ nk eine streng monoton steigende Folge von Indizes
(n0 < n1 < n2 < . . . ), so heißt die durch k 7→ ank definierte Folge (ank )n∈N Teilfolge von
(an )n∈N
Beispiel: an = (−1)n , nk = 2k. Dann ergibt sich: ank = a2k = (−1)2k = 1
△
42
3 Der Grenzwertbegriff: Folgen und Reihen
Klar:
1. Jede Teilfolge einer gegen a konvergenten Folge konvergiert gegen a. Kurz: lim an = a ⇒
k→∞
lim ank = a
n→∞
2. Enthält ein Folge (an )n∈N zwei Teilfolgen, die gegen verschiedene Grenzwerte konvergieren,
so kann (an )n∈N nicht konvergieren.
Definition 3.11 (Häufungswert):
Eine reelle Zahl a heißt Häufungswert (kurz: HW) von (an )n∈N :⇔ es gibt eine gegen a
konvergierende Teilfolge (ank )n∈N .
Beispiel: ((−1)n )n∈N hat +1 und −1 als Häufungswerte.
△
Satz 3.14:
a ist Häufungswert von (an )n∈N ⇔ Für alle ε > 0 gibt es unendlich viele n mit |an − a| < ε
Beweis: ⇒“: Nach Voraussetzung gibt es Teilfolge (ank )k∈N mit lim ank = a. ε > 0 vorgege”
k→∞
V
ben. Dazu gibt es wegen lim ank = a ein Nε mit k≥Nε |a − ank | < ε. Also gibt es unendlich
k→∞
viele an ’s mit |a − an | < ε, nämlich die ank ’s
⇐“: Bedingung sei erfüllt: Konstruktion einer Teilfolge: zu ε = 1 gibt es unendlich viele am ’s
”
mit |am − a| < 1 wähle ein solches am aus nenne es i1 := m. Zu ε = 12 gibt es unendlich viele
am ’s mit |am − a| < 12 . Wähle ein solches am aus mit m > i1 . Setze i2 = m. Fahre so fort: Zu
ε = n1 gibt es unendlich viele am ’s mit |am − a| < n1 . Wähle ein solches am aus mit m > in−1 .
Setze in = m.
wir erhalten Teilfolge (aik )n∈N mit |aik − a| < k1 ⇒ (aik )n∈N ist Nullfolge ⇒ lim aik = a
k→∞
Definition 3.12:
Eine Intervallschachtelung ist eine Folge von Intervallen I1 , I2 , . . . , Ik = [ak , bk ] mit
1. Ik+1 ⊂ Ik
2. Die Folge der Intervalllängen (bk − ak )k∈N ist eine Nullfolge.
Satz 3.15:
(Ik )k≥1 sei Intervallschachtelung, Ik := [ak , bk ]. Dann gilt: (ak )k∈N und (bk )k∈N konvergieren mit lim ak = lim bk
k→∞
Übung:
\
k≥1
Ik =
k→∞
lim ak
k→∞
Beweis: Es gilt a1 ≤ · · · ≤ ak−2 ≤ ak−1 ≤ ak ≤ bk ≤ bk−1 ≤ · · · ≤ b1 nach der Definition von
Intervallschachtelung. (ak )k∈N monoton und beschränkt also konvergent a = lim ak . Analog für
(bk )k∈N mit b = lim bk . Also: ak < a ≤ b < bk .
Nach Voraussetzung ist (bk − ak )k∈N Nullfolge. Daraus folgt a = b, denn es gilt: |b − a| =
|b − bk + bk − ak + ak − a| ≤ |b − bk | + |bk − ak | + |ak − a|
(an )n∈N sei beschränkte Folge, d.h. es gibt Konstante K mit
V
n
|an | < K
(an ∈ (−K, +K))
43
3.1 Folgen
Satz 3.16 (Bolzano-Weierstraß):
Jede beschränkte Folge reeller Zahlen besitzt mindestens einen Häufungswert (d.h. eine
konvergente Teilfoge).
Beweis: Wir konstruieren eine Intervallschachtelung (Ik )k≥1
V , Ik = [ck , dk ] mit an ∈ Ik für unendlich viele an ’s. Beginne mit I1 = [−K, +K], wo K mit n |an | < K, also alle an ’s in I1 .
Schritt von k auf k + 1: m = Mittelpunkt von Ik = [ck , dk ]


[ck , m] falls [ck , m] unendlich viele an ’s enthält
Setze Ik+1 = [ck+1 , dk+1 ] := [m, dk ] falls [ck , m] nur endlich viele an ’s enthält


(dann enthält [m, dk ] unendlich viele an ’s)
Es gilt: Ik+1 ⊂ Ik und dk+1 − ck+1 = (dk − ck )/2 liefert Nullfolge. Daraus folgt: a = lim ck =
lim dk (Nach Satz 3.15). Noch zu zeigen: a ist Häufungswert von (an )n∈N .
k→∞
k→∞
Beweis: ε > 0 vorgegeben. ck konvergiert gegen a, monoton steigend ab Nε ist ck > a − ε.
dk konvergiert gegen a, monoton fallend, ab Nε ist dk < a + ε. D.h. wir können ein k mit
Ik = [ck , dk ] ⊂ (a − ε, a + ε) wählen. Da Ik unendlich viele an ’s enthält gilt für unendlich viele
an ’s |a − an | < ε, d.h. an ∈ (a − ε, a + ε)
Satz 3.17:
(an )n∈N konvergiert ⇔ (an )n∈N ist beschränkt und hat genau einen Häufungswert.
Beweis: ⇒“: bereits erledigt.
”
⇐“: a sei der einzig vorkommende Häufungswert. Behauptung: a = lim an .
”
n→∞
W
V W
Annahme: Die Behauptung ist falsch, d.h. es gelte ε>0 n n>n |a − an | > ε Wir nehmen
0
0
das gegebene ε. Dann gibt es zu jedem n0 ein n mit |a − an | > ε. Beginne mit n0 = 1. Wähle
ein an mit |a − an | > ε und nenne dieses n i1 . Wähle dann n0 = i1 und als i2 ein m ≥ n0 mit
|a − an | > ε. Auf diese Weise erhält man — wie oben — eine Teilfolge (aik )k∈N mit
^
|a − aik | > ε.
k
Diese Teilfolge ist beschränkt, da (an )n∈N beschränkt war — sie besitzt nach dem Satz von
Bolzano-Weierstraß eine konvergente Teilfolge, die gegen einen Limes b konvergiert. Wegen
|a − aik | gilt für den Limes |b − a| ≥ ε. Widerspruch!
Hat eine Folge mehrere Häufungswerte, dann gibt es einen größten“ und einen kleinsten“ (dies
”
”
muß bewiesen werden!). Diese erhalten besondere Namen:
Definition 3.13 (Limes Superior und Limes Inferior):
(an )n∈N sei eine beschränkte Folge. Dann sei:
R
R
lim sup(an ) := sup{c ∈ | c ist Häufungswert von (an )n∈N }.
lim inf(an ) := inf{c ∈ | c ist Häufungswert von (an )n∈N }.
Für lim sup bzw. lim inf wird auch lim bzw. lim geschrieben.
44
3 Der Grenzwertbegriff: Folgen und Reihen
Exkurs: Abzählbarkeit von
Bemerkung:
Q und R
Q ∩ [0, 1] durchnummerieren:
0, 1,
1
,
2
1
,
3
1
,
4
1
,
5
1
,
6
2
,
3
/,
2
4
2 ..
, .
5
3
,
4
3
5
1
, ...
7
..
.
4
5
Abbildung 3.3: Durchnummerierung aller rationalen Zahlen im Intervall [0, 1]
Es gibt Folge an , die alle rationalen Zahlen in [0, 1] durchläuft. Was sind die Häufungswerte
abzählen.
dieser Folge? Genauso kann man
Q
M abzählbar ⇔ Es gibt Bijektion N → M . [a, b] ⊂ R ist überabzählbar (a < b). Angenommen
[a, b] wäre abzählbar, d.h. es gäbe eine Bijektion f : N → [a, b].
Konstruiere eine Intervallschachtelung (Ik )k≥1 mit Ik = [ak , bk ]. [a1 , b1 ] ⊂ [a, b] sei so gewählt,
daß f (1) ∈
/ [a1 , b1 ]
Wähle rekursiv [ak+1 , bk+1 ] := Ik+1 ⊂ Ik so daß
1. Länge Ik+1 ≤ 21 Länge Ik (bk+1 − ak+1 ≤ (bk − ak )/2).
2. f (k + 1) ∈
/ Ik+1
In [an , bn ] kommen f (0), f (1), . . . , f (n) nicht vor. γ = lim an = lim bn sei die durch die
n→∞
n→∞
V
V
Intervallschachtellung definierte Zahl. Dann gilt: n an ≤ γ ≤ bn d.h. n γ ∈ In . Aber es gibt
n0 mit f (n0 ) = γ. D.h. nach Konstruktion gilt γ = f (n0 ) ∈
/ In0 . Widerspruch! Die Annahme
es gäbe eine Bijektion f : → [a, b] ist falsch.
N
Satz 3.18:
lim sup(an ) und lim inf(an ) sind selbst Häufungswerte von (an )n∈N (sie sind also Maximum
und Minimum der Häufungswertmenge von (an )n∈N ).
Man könnte meinen, die Konvergenz einer Folge wäre gleichbedeutend damit, daß die Differenzen
|an − an+1 | beliebig klein werden, genauer
^ _ ^
ε>0 N n>N
|an+1 − an | < ε
Dies ist gilt natürlich für eine konvergente Folge (|an+1 − an | ≤ |an+1 − a| + |a − an | mit a =
lim an ). Im Allgemeinen is es aber falsch hieraus auf Konvergenz zu schließen.
n→∞
45
3.1 Folgen
Beispiel: an =
√
n
√
√ √
√ √
√ n + 1 − n · n + 1 + n
√
|an+1 − an | = n + 1 − n =
n + 1 + √n
=
√
n+1−n
1
√ ≤ √
2 n
n+1+ n
√
Diese Differenzen werden mit n → ∞ beliebig klein aber ( n)n∈N divergiert.
△
Man muß obige Bedingung an |an − an+1 | verschärfen. Dies wurde unabhängig voneinander von
Bolzano und Cauchy gefunden.
Definition 3.14 (Cauchyfolge):
Eine Folge (an )n∈N heißt genau dann Cauchyfolge, wenn gilt:
^ _
^
^
|an − am | < ε
N
ε>0 Nε ∈
m≥Nε n≥Nε
D.h. die Folgeglieder einer Cauchy-Folge rücken beliebig nahe zusammen:
|an − an+1 | < ε,
|an − an+2 | < ε,
|an − an+3 | < ε,
...,
|an − an+k | < ε
Satz 3.19 (Cauchy’sches Konvergenzkriterium):
Eine Folge reeler Zahlen (an )n∈N konvergiert ⇔ (an )n∈N ist eine Cauchyfolge
Beachte:
1. Mit Hilfe dieses Konvergenzkriteriums kann man versuchen Konvergenz festzustellen ohne
einen Grenzwert bereits zu kennen.
Q
2. Satz 3.19 beruht im Wesentlichen auf dem Vollständigkeitsaxiom, für Folgen aus
ist
dieser Satz im Allgemeinen falsch. Es gibt Cauchyfolgen in , die nicht konvergieren da
der Grenzwert fehlt, d.h. in − liegt.
R Q
Q
3. Zu unserem Vollständigkeitsaxiom ist äquivalent: Satz von Archimedes und Satz 3.19
V
Beweis: ⇒“ Es sei lim an = a. ε vorgegeben: dann gibt es N mit n≥N |an − a| ≤ 2ε . Also
”
n→∞
gilt für alle n, m ≥ N
^ ^
|an − am | = |an − a + a − am | ≤ |an − a| + |am − a|
n≥N m≥N
≤
ε ε
+ =ε
2 2
und (an )n∈N ist eine Cauchyfolge.
^ _ ^ ^
⇐“ Es gelte
|an − am | < ε. Wir zeigen zuerst: Diese Folge ist beschränkt.
”
ε>0 N n≥N m≥N
V
V
Zu ε = 1 gibt es N1 mit n≥N m≥N |an − am | < 1, also |an | − |am | ≤ |an − am | < 1, also
1
1
46
3 Der Grenzwertbegriff: Folgen und Reihen
|an | − |am | < 1 oder |an | < 1 + |am |.
Wir wählen jetzt für m eine feste Zahl oberhalb N1 , dann gilt mit K = 1 + |am |: |an | ≤ K für
n ≥ N1 . Da vorher nur endlich viele Folgenglieder vorkommen, ist (an )n∈N beschränkt. Es gibt
also nach Bolzano-Weierstraß einen Häufungswert a.
Behauptung: a = lim an .
n→∞
V
Beweis: ε > 0 vorgegeben. Wähle N so groß, daß gilt n,m>N |an − am | < 2ε . Da a Häufungswert
von (an )n∈N ist, gibt es nach Definition mindestens ein m0 > N mit |am0 − a| ≤ 2ε also
|an − a| = |an − am0 + am0 − a| ≤ |an − am0 | + |am0 − a| < ε
für alle n > N . D.h. lim an = a
n→∞
Beispiel: Betrachte die Folge (1+ 12 + 13 +· · ·+ n1 )n∈N also an = 1+ 21 + 13 +· · ·+ n1 . Der Unterschied
1
zwischen an und an+1 ist n+1
, wird also beliebig klein. Wie sieht es aber mit a2n − an aus?
a2n − an =
1
1
1
1
n
1
+
+ ··· +
≥n·
=
=
n+1 n+2
2n
2n
2n
2
d.h. egal wie groß n auch ist, die Differenz |a2n − an | ist immer größer als 1/2. Damit haben
wir bewiesen
_ ^ _
|an − am | > ε
(∗)
ε>0 N0 n,m>N0
Nämlich mit ε =
1
2
und zu vorgegebenem N0 nehmen wir n = N0 und m = 2N0 .
△
(∗) ist die Verneinung von ist Cauchyfolge“. Mit anderen Worten
”
Satz 3.20:
Die Folge (1 + 21 + 13 + · · · + n1 )n∈N divergiert.
Bemerkung: Das Cauchy’sche Konvergenzkriterium ist vorwiegend von theoretischem Interesse,
d.h. beim Beweisen, in der Praxis, für eine konkrete Folge, ist es im Allgemeinen nur schwer
einzusetzen.
Zusammenfassung: Konvergenzkriterien für Folgen
1. Arbeiten mit Definition
2. Vergleich von Folgen: lim an = a ⇔ (an − a) ist Nullfolge, Vergleich mit Nullfolgen,
Einschließungssatz. Axiom von Archimedes liefert ( n1 )n∈N und (q n )n∈N für |q| < 1
sind Nullfolgen. Allgemeine
Eigenschaften: (an )n∈N konvergiert ⇒ (an )n∈N beschränkt.
V
lim an = a, lim bn = b, n an ≤ bn ⇒ a ≤ b
3. Grenzwertsatz: Summe, Produkt, Quotient von Folgen.
4. Monotone, beschränkte Folgen sind konvergent.
5. Arbeiten mit Häufungswerten und Bolzano-Weierstraß: lim an = a ⇔ (an )n∈N ist ben→∞
schränkt und hat genau einen Häufungswert.
6. Cauchy-Kriterium
47
3.2 Reihen
3.2
Reihen
Ein Läufer L will die Strecke [0, 1] durchlaufen. L läuft mit konstanter Geschwindigkeit. Er
braucht für die Strecke von 1 bis 1/2 1 Sekunde, für die Strecke 1/2 bis 1/4 1/2 Sekunde, von
1/4 bis 1/8 1/4 Sekunde, . . . . Fragt man sich, wie lange braucht L für die ganze Strecke? So
fragt man nach der Summe aller dieser Zeiten, dies scheint eine unlösbare Aufgabe zu sein, denn
unendlich viele Zahlen kann man nicht addieren. Trotzdem wissen wir: L kommt an, nach 2
Sekunden!
Lösung des Paradoxons?
Sinnvolle Interpretation für das Aufsummieren unendlich vieler Zahlen? Antwort: Man studiert
Teilsummen
1
1+
1+
1+
1+
1
2
1
2
1
2
1
2
+
+
+
1
4
1
4
1
4
+
+
..
.
n
P
i=0
1
8
1
8
+
1
16
1
2i
und fragt nach dem Grenzwert, dieser ist 2.
Unendliche Reihen sind nichts anderes als spezielle Folgen. (an )n∈N sei eine Folge reeller Zahlen,
aus dieser Folge kann man eine neue Folge, nämlich die Folge ihrer Partialsummen herstellen.
sn :=
n
X
i=0
ai = a0 + a1 + a2 + · · · + an
Definition 3.15:
Diese Folge der Partialsummen nennt man auch unendliche Reihe und schreibt dafür
∞
X
ar [= (sn )n∈N ]
r=0
ai heißt i-tes Glied der Reihe.
P
In diesem Sinn ist also ∞ ar nicht das Ergebnis einer unendlichen Aufsummierung, sondern
eine Folge. Falls die Folge (sn )n∈N konvergiert und S als Grenzwert hat schreibt man dafür auch
"
#
∞
n
X
X
S=
ak := lim sn = lim
aν
k=0
P∞
n→∞
n→∞
ν=0
D.h. man versteht unter
ak auch eine Zahl. Dies ist natürlich ungenau und inkonsequent —
ein Symbol hat 2 Bedeutungen — aber dies hat sich historisch entwickelt und ist einleuchtend
und praktisch.
P∞
r=0 ar bedeutet also
48
3 Der Grenzwertbegriff: Folgen und Reihen
P
1. Folge der Partialsummen ( ni=0 ai )n∈N
Pn
2. lim
i=0 ai falls dieser existiert.
n→∞
Bemerkung: Bemerkung: Natürlich läßt sich jede Folge (an )n∈N auch als Reihe auffassen:
an = a0 +
n
X
k=1
(ak − ak−1 )
|
{z
}
ck
Vom logischen Standpunkt ist daher die Theorie der Reihen äquivalent zur Theorie der Folgen.
Trotzdem ist es nützlich unendliche Reihen eigenständig zu behandeln, denn viele Folgen treten
in natürlicher Weise in dieser Gestalt auf (Physik). Die besondere Bauart der Partialsummen
ermöglicht es, handliche Konvergenzkriterien herzuleiten. Schreiben wir zuerst einmal die
Definition für Konvergenz einer Folge um in die Reihenschreibweise:
∞
m
X
^ _ ^ X
ai = S ⇔
ai < ε
S −
i=0
ε>0 N m≥N
i=0
Ebenso einfach können wir das Cauchykriterium übersetzen:
Satz 3.21 (Cauchykriterium):
P
Die Reihe ∞ ai konvergiert genau dann, wenn es zu jedem ε > 0 ein Nε ∈
daß für alle n ≥ m ≥ Nε gilt
n
X ai < ε
(Reihenrest beliebig klein)
N gibt, so
i=m
P∞
Wir sehen, daß für alle konvergenten Reihen
ai limi→∞ ai = 0 folgt (setze n = m + 1
im Cauchy Kriterium), aber daß die Umkehrung
ai = 0 folgt im
P nicht richtig ist: aus limi→∞P
Allgemeinen nicht die Konvergenz der Reihe ∞ ai . Ein bekanntes Beispiel: ∞ n1 divergiert
obwohl ( n1 )n∈N eine Nullfolge ist. Historisch glaubte man lange, daß die Umkehrung richtig war.
Das Cauchykriterium besagt, daß nicht nur einzelne Reihenglieder ai nach 0 gehen müssen,
sondern ganze Abschnitte der Reihe, wenn sie nur genügend spät beginnen.
P
P
Während ∞ n1 divergiert, konvergiert ∞ n12 :
Satz 3.22:
P∞ 1
n2
konvergiert (gegen
π2
6 .
Was hier nicht bewiesen wird).
Beweis (als Beispiel zum Cauchy-Kriterium):
folgender Trick:
1
1
≤
und
k(k − 1)
k2
Damit ergibt sich
Pm
1
k=n k 2
≤ (m − n) ·
1
n2
führt zu nichts, aber
1
1
1
=
−
k(k − 1)
k−1 k
m
m
m X
X
X
1
1
1
1
1
1
≤
=
−
=
−
2
k(k − 1)
k−1 k
k
|n − 1{z m}
k=n
k=n
k=n
Teleskopsumme
49
3.2 Reihen
Zu gegebenem ε > 0 wähle N mit N > 2ε . Dann gilt für n, m ≥ N :
1
1 1
1
1
1
n − 1 − m ≤ n + m < N + N = ε
Zu den bekanntesten Reihen gehört die geometrische Reihe
Satz 3.23 (Konvergenz der geometrischen Reihe):
P
n
Es sei |q| < 1 dann konvergiert die geometrische Reihe ∞
n=0 q gegen
∞
X
kurz:
qn =
n=0
Beweis: Wir wissen schon sm =
(sm )m∈N eine konvergente Folge
1
1−q
1−q n+1
n
und lim q n
n=0 q =
1−q
n→∞
1
mit 1−0
=
als
Grenzwert.
1−q
1−q
Pm
∞
i
1
1
=
2
1−
i=0
X
1 1
Beispiel: 1 + + + · · · =
2 4
1
2
=
1
1
1−q .
= 0, wenn |q| < 1. Also ist
△
=2
1
2
Rechenregeln für unendliche Reihen
Satz 3.24:
Sind
auch
∞
P
an und
∞
P
bn konvergente Reihen mit Grenzwerten
n=0
n=0
P∞
n=0 (λan + µbn ) konvergent mit Grenzwert λs + µt
kurz:
λ
∞
X
an + µ
n=0
∞
X
bn =
n=0
∞
X
s bzw. t so ist für λ, µ ∈
R
(λan + µbn )
n=0
P
Pm
Beweis: sm = m
n=0 an und tm =
n=0 bn seien
P∞ die Partialsummen der gegebenen Reihen, dann
ist λsm + µtm die m-te Partialsumme von n=0 (λan + µbn ). Aus dem Hauptsatz über Folgen
folgt lim (λsm + µbm ) = λ lim sm + µ lim bm .
m→∞
m→∞
m→∞
Betrachten wir einmal Reihen mit nichtnegativen Gliedern:
∞
X
an
mit
n=0
^
n
an ≥ 0
Dann wächst die Partialsummenfolge monoton, da bei jedem Schritt sk → sk+1 die nichtnegative
Zahl ak+1 hinzukommt. Eine monotone Folge konvergiert aber genau dann, wenn sie beschränkt
ist, also erhalten wir folgendes Konvergenzkriterium:
Satz 3.25 (Konvergenzkriterium für Reihen mit nichtnegativen Gliedern):
P
Es sei ∞
n=0 an eine Reihe mit an ≥ 0 für alle n. Dann gilt
∞
X
an konvergiert ⇔
_
R
M∈
^
N
k∈
sk =
k
X
n=0
an ≤ M
50
3 Der Grenzwertbegriff: Folgen und Reihen
Beispiel: Da
P∞
1
n
divergiert heißt dies, daß die Partialsummenfolge unbeschränkt wächst. △
Besonders oft anwendbar und daher für die Praxis wichtig ist das
Satz 3.26 (Majoranten- oder Vergleichskriterium):
P
P
Es sei ∞ an eine konvergente Reihe mit nichtnegativen Gliedern. Für die Reihe ∞ bn
gelte |bn | ≤ an für alle nP
ab einem gewissen
P∞ N0 (d.h. bis aufPendlich viele Ausnahmen).
∞
Dann konvergieren
auch
b
(und
|bn |). Man nennt
an dann eine konvergente
n
P
Majorante zu
bn
BeweisP(mit Cauchy Kriterium): ε > 0 sei vorgegeben. Dann gibt es wegen der Konvergenz der
Reihe
an ein N1 mit
m
X
ak < ε für m ≥ n ≥ N1 .
k=n
Setze N2 = max(N1 , N0 ) (N0 aus der Voraussetzung). Dann gilt:
m m
m
X X
X
bk ≤
|bk | ≤
ak < ε
für m ≥ n ≥ N2 .
k=n
k=n
also konvergieren die beiden Reihen
k=n
P∞
bk und
P∞
|bk |
Bemerkung: Leider gibt es keine Reihe, die am langsamsten“ konvergiert (als universelle Ma”
jorante)
Beispiele:
P∞ 1
P∞ 1
konvergiert und n13 ≤ n12 gilt.
1.
n=1 n3 konvergiert, da
n2
P 1
P1
1
√ divergiert, da sonst auch
√1
2.
n wegen n ≤ n konvergieren würde.
n
△
Durch Vergleich mit der geometrischen Reihe erhält man aus dem Majorantenkriterium das
sogenannte Wurzelkriterium:
Satz 3.27 (Wurzelkriterium):
P
Es sei ∞
Angenommen
es gibt ein q mit 0 ≤Pq < 1 so daß für alle n ∈ 1
n=0 an eine Reihe.P
P
1
gilt: |an | ≤ q n . Dann sind
an und
|an | konvergent und ∞ an ≤ 1−q
P n
Beweis: Die konvergente geometrische Reihe
q ist eine Majorante.
N
P
P∞
Es gibt keine
am
langsamsten
konvergierende
Reihe
a
,
a
≥
0.
ν
ν
ν=0 aν sei konvergent. Dann
P∞
ist rn := ν=n+1 aν der Reihenrest nachPdem n-ten Glied von aν . Definiere P
nun b1 := 1 und
√
√
√
bn := rn−1 −P rn für n ≥ 2. Es gilt lim bn = 1 + r1 und lim abnν = 0, d.h.
bn konvergiert
langsamer als
an . Wurzelkriterium heißt dieser Satz weil
p
|an | ≤ q n ⇔ n |an | ≤ q
(Streng genommen haben wir bisher nur die Existenz von Quadratwurzeln bewiesen, die Exi√
stenz von n a war Übung, Beweis später)
1
Da es bei einer Reihe für das Konvergenzverhalten nicht auf endlich viele Glieder ankommt, braucht man die
Bedingung nur ab einem N0 zu fordern, d.h. man kann endlich viele Ausnahmen zulassen.
51
3.2 Reihen
Satz 3.28 (Wurzelkriterium′ ):
P
Es sei
an eine Reihe mit
_
_ ^ p
n
0≤q<1 N0 n≥N0
Dann konvergieren
P
an und
P
|an | ≤ q < 1.
|an |.
Indem man die Häufungswerte der Folge
p
n
|an |
N
n∈
betrachtet, erhält man
Satz 3.29 (2-te Form des Wurzelkriteriums):
P∞
an sei eine Reihe:
p
P
P
|an | und
an konvergieren.
1. Aus lim sup k |ak | < 1 folgt:
p
p
P
2. Aus lim sup k |ak | > 1 oder n |an |
nicht beschränkt folgt
|an | divergiert.
N
n∈
Beweis:
p
√
1. r := lim sup k |ak | = sup{c | c ist Häufungswert von ( k ak )k∈N )} = ( größter“
”
√
Häufungswert von ( k ak )k∈N ). Es sei
q mit r < q < 1 gewählt. Die Voraussetzung bep
deutet: Bis auf endlich viele n gilt n |an | ≤ q < 1, d.h. es gilt Satz
3.28 und damit folgt
p
n
Behauptung (Denn: Wenn es unendlich viele Werte von n mit
|an | ∈ [q, 1] gibt, dann
gibt es nach Bolzano Weierstraß einen Häufungswert in [q, 1], d.h. einen Häufungswert,
der größer als r ist).
p
√
2. r > 1 oder ( k ak )k∈N ) unbeschränkt impliziert: Für unendlich viele n ist n P
|an | > 1.
Daraus folgt: |an | ≥ 1 für unendlich viele n. Das bedeutet Divergenz der Reihe
|an |, da
diese monoton und unbeschränkt ist.
Auch auf der geometrischen Reihe als Majorante beruht das Quotientenkriterium:
Satz 3.30 (Quotientenkriterium):
P
Es sei
an mit an 6= 0 für alle n gegeben. Wenn es ein q mit 0 ≤ q < 1 gibt, so
P daß für
alle
n
bis
auf
endlich
viele
Ausnahmen
|a
/a
|
<
q
gilt,
dann
konvergieren
an und
n+1 n
P
|an |.
Beweis: Ab n ≥ N0 gelte |aP
| ≤ q · |an |. Wiederholen liefert |aN0 +r | ≤
n+1 /an | ≤ q, also |an+1P
|aN0 | · q r . Also hat die Reihe ∞
a
+
r
die
Reihe
|aN0 | · q r als Majorante, konvergiert also
N
0
r=0
und damit natürlich auch
NX
∞
∞
0 −1
X
X
ai +
ar+N0 =
ai
i=0
r=0
i=0
Bemerkung:
1. Quotienten- und Wurzelkriterium beruhen beide auf der gleichen Idee: bei der geometrischen Reihe ist der Quotient zweier aufeinander folgender Reihenglieder (bzw. die n-te
Wurzel) immer konstant gleich q. Obige Kriterien behandeln also Reihen wo der Quotient
(bzw. die n-te Wurzel) nicht so regelmäßig ist, sondern nur unter q schwankt (≤ q < 1).
52
3 Der Grenzwertbegriff: Folgen und Reihen
2. Deshalb kann man auch statt der geometrischen Reihe eine andere konvergente Reihe mit
positiven Gliedern verwenden:
Satz 3.31 ( Quotienten Kriterium“):
”
P
P
Es sei ∞ an konvergent und an > 0 fürPalle n. Gilt für die Reihe
bn für alle n ≥ N0
|bn+1 /bn | ≤ |an+1 /an |, dann konvergiert
bn .
Beweis: Übung.
Beispiele:
∞
X
xn
R
konvergiert für alle x ∈ .
n!
Beweis: x = 0 trivial, x 6= 0 sei fest. Wähle N0 > 2 · |x|. Dann gilt
n+1 x
(n+1)! |x|
1 N0
1
xn =
< ·
< q = für n ≥ N0 .
n+1
2 n+1
2
n!
1. die Reihe
n=0
P1
n
2. Für die harmonische Reihe
n liefert das Quotientenkriterium die Quotienten n+1 und
n
n
damit läßt sich kein q < 1 finden mit n+1
< q für alle n > N0 (obwohl n+1
< 1 für alle n!)
3. Beachte: Auch wenn ein Kriterium wie Wurzel- oder Quotientenkrit. versagen,
kann die
P 1
Reihe konvergieren, die meisten Kriterien sind nur hinreichend. Beispiel:
konvergiert
n2
aber weder Wurzel- noch Quotientenkrit. helfen (Grund später).
P
n
4. Beispiel für Wurzelkriterium: ∞
n=0 2n
r
r
√
n
1√
n
3
n
n
n
=
n und lim n = 1 impliziert: Ab einem N0 ist n n <
n
n→∞
2
2
2
4
5. Das Wurzelkriterium ist oft besser“ als das Quotientenkriterium:
”
k
∞
k+(−1)
X 1
1 1 1 1
1
1
= + + + +
+
+ ...
2
2 1 8 4 32 16
k=0
Die Quotienten sind abwechselnd 2 und 21 .
s
s
s
k
k+(−1)k
(−1)k
1
1 k 1 (−1)
1
k
k
Wurzelkriterium:
=
und lim
=1
k→∞
2
2
2
2
△
Wir haben bisher vorwiegend Reihen mit nichtnegativen Gliedern betrachtet. Betrachtet man
Reihen mit alternierenden Vorzeichen so gilt:
Satz 3.32 (Leibnizsches Konvergenz Kriterium):
Es sei (an )n∈N eine monoton fallende Folge positiver Zahlen mit lim an = 0. Dann
n→∞
P
na
konvergiert die Reihe ∞
(−1)
n
n=0
53
3.2 Reihen
Beispiele:
∞
X
(−1)n
n=0
n+1
=1−
∞
X
(−1)n
π
= ,
2n + 1
4
1 1 1
+ − + · · · = ln(2),
2 3 4
n=0
∞
X
(−1)n
3n + 1
n=0
△
Beweis: Wir betrachten die Partialsummen sn =
Offenbar ist
s0 ≥ s2 ≥ s4 ≥ . . .
s1 ≤ s3 ≤ s5 ≤ . . .
und
s2n−1 ≤ s2n
Pn
i
i=0 (−1) ai :
denn s4 = s2 − a3 + a4
| {z }
≤0
denn s5 = s3 + a4 − a5
| {z }
≥0
denn s7 ≤ s7 + a8 = s8
Außerdem ist |sn+1 − sn | = |an | und dies konvergiert gegen 0. Also: Die Teilfolgen (s2n )n∈N und
(s2n+1 )n∈N sind monoton und beschränkt, konvergieren also. Wegen |s2n+1 − s2n | = |a2n | haben
diese den gleichen Grenzwert (=S mit s2n−1 ≤ S ≤ s2n ).
P∞
n+1 1
n=1 (−1)
n
konvergiert während
P∞
1
n=1 n
divergiert!
P
Man kann also im Allgemeinen nicht von der Konvergenz von ∞ bn auf dei Konvergenz von
P
∞
|bn | schließen.
Beachte:
Bevor wir diesen Sachverhalt genauer untersuchen, halten wir fest:
P
Merkregeln: ∞ an sei gegeben
1. Man darf endlich viele Glieder vertauschen, ohne daß sich am Konvergenzverhalten und
am Limes etwas ändert (denn die Partialsummenfolge ist bis auf endlich viele Ausnahmen
die Gleiche)
2. Man darf endlich viele Glieder weglassen oder hinzutun, ohne daß sich
P das Konvergenzverhalten
ändert.
Der
Grenzwert
ist
im
Allgemeinen
verändert.
Aber:
an konvergent 6⇒
P
P
1
n+1
a2n konvergent, siehe z.B. (−1)
n.
3. Man darf durch Klammersetzen in konvergenten Reihen mehrere Glieder zusammenfassen
ohne das Konvergenzverhalten zu ändern (→ Teilfolge der Partialsummenfolge)
4. Aber: Klammern weglassen ist im Allgemeinen. nicht erlaubt, wie folgendes Beispiel zeigt:
0 = (1 − 1) + (1 − 1) + (1 − 1) + · · ·
= 1 + (−1 + 1) + (−1 + 1) + (−1 + 1) + · · ·
Klammern weglassen und neusetzen
=1
Man darf also nicht alle bei endlichen Summen gültigen Rechenregeln ohne weiteres auf unendliche Reihen übertragen (es handelt sich ja auch um Grenzwerte und nicht einfache Summen).
Insbesondere: Klammern weglassen und unendliche Umordnungen sind nicht ohne weiteres erlaubt.
54
3 Der Grenzwertbegriff: Folgen und Reihen
Beispiel (Umordnungsbeispiel): s sei der Grenzwert von 1 − 12 + 13 − 14 + · · · , s liegt zwischen 1
und 21 = 1 − 12 (s = ln(2) aber das brauchen wir nicht) denn s2n+1 ≤ lim sn ≤ s2n . Betrachte
∞
∞
X
1 1X
1
1
(−1)n+1 +
(−1)n+1
s+ s=
2
n 2
n
n=1
n=1
(
1 − 12 + 13 − 14 + 51 − 16 + · · ·
=
− 14
+ 16 · · ·
+ 12
1 1 1 1 1 1
= 1 + − + + − + − ···
3 2 5 7 4 9
Dies ist offenbar die Ausgangsreihe, nur umgeordnet. Deren Grenzwert kann nicht s sondern
muß 32 s sein!
△
Dieses erstaunliche Verhalten kann bei Reihen mit nur positiven Gliedern offensichtlich nicht
passieren. Man definiert deshalb:
Definition 3.16:
P
P
P
Eine Reihe ∞ an heißt absolut konvergent :⇔ ∞ |an | konvergiert. Eine Reihe ∞ an
die konvergent, aber nicht absolut konvergent ist, heißt bedingt konvergent.
Merke: absolut konvergente Reihen verhalten sich absolut normal. Bedingt konvergente Reihen
sind nur bedingt tauglich (für die üblichen Rechenregeln).
P (−1)n
ist bedingt konvergent.
Beispiel:
n
P
P
P
Pm
Klar: an absolut konvergent ⇒ an konvergent. (Abschätzung | m
n ak | ≤
n |ak | + Cauchy
Kriterium).
∞
X
(−1)n
1
5
s=
, s1 = ≤ s ≤ = s2
n
+
1
2
6
n=0
Umordnung (immer 2 positive, dann ein negatives):
1 1
1 1 1
1
1
1
1+ −
+
+ −
+
+
−
+···
3 2
5 7 4
9 11 6
|
{z
} |
{z
} |
{z
}
= 56
>0
>0
also ist der Grenzwert größer als 65 .
Lemma 3.33:
∞
X
Es sei
an eine konvergente Reihe mit nichtnegativen Gliedern, dann gilt
∞
X
n=0
an = sup{ak1 + ak2 + · · · + akl | k1 , . . . , kl paarweise verschieden}
Interpretation: Eine solche Reihe darf man irgenwie aufsummieren“.
”
△
55
3.2 Reihen
V
Pn
Beweis: Wegen k ak ≥ 0P
ist die Folge der Partialsummen
s
=
ai monoton steigend und
n
P∞
∞
durch den Grenzwert s =
ai beschränkt. Also gilt
an = sup{sk | k ∈ }. Behauptung:
sup{sk | k ∈ } = sup{ak1 + · · · + akl | k1 , . . . , kl paarweise verschieden}.
N
N
N
Beweis: N := {sk | k ∈ } und M := sup{ak1 + · · · + akl | k1 , . . . , kl paarweise verschieden}.
Jede Partialsumme sk kommt in M vor also ist jede obere Schranke von M auch ein von N ,
d.h. sup N ≤ sup M . Andererseits ist jede obere Schranke von N auch eine von M , denn für
genügend große r ist ak1 + · · · + akl ≤ sr (alle aki müssen in sr vorkommen), also sup M ≤ sup N .
Damit folgt die Behauptung: N = M .
Was ist eine Umordnung einer Reihe?
Definition 3.17:
Ist die
P Abbildung σ :
von ∞
n=0 an
N −→ N bijektiv, so heißt die Reihe P∞n=0 aσ(n) eine Umordnung
Aus Lemma 3.33 folgt
Satz 3.34:
P
P
Es
sei
a
konvergent
und
a
≥
0
für
alle
n.
Mit
an konvergiert auch jede Umordnung
n
n
P
aσ(n) und zwar gegen den gleichen Grenzwert.
Beweis: Die Mengen M = {ak1 + · · · + akl | k1 , . . . , kl paarweise verschieden } sind offenbar für
beide Reihen gleich, haben also gleiches Supremum.
Es sei eine Reihe
Gliedern: Für b ∈
P
R
an gegeben. Wir zerlegen diese Reihe in zwei Reihen mit nichtnegativen
setze
(
|b| wenn b ≥ 0
|b|
+
b
b+ :=
=
2
0 sonst
(
|b| wenn b ≤ 0
|b| − b
b− :=
=
2
0 sonst
Es ist b+ + b− = |b| und b+ − b− = b.
Beispiele:
1. (−3)+ = 0 und (−3)− = 3
2.
∞
X
(−1)n
=1−
1 1 1
+ − ···
2 3 4
n+1
(−1)n +
1
1
= 1 + 0 + + 0 + + ···
n+1
3
5
n=0
∞ X
(−1)n −
1
1
= 0 + + 0 + + 0 + ···
n+1
2
4
n=0
∞ X
n=0
△
56
3 Der Grenzwertbegriff: Folgen und Reihen
Lemma 3.35:
P
P +
P −
Die Reihe
an ist genau dann absolut konvergent, wenn die Reihen
an und
an
konvergent sind.
P
Beweis: ⇒“: Wegen 0 ≤ a+
≤ |an | und 0 ≤ a−
≤ |an | hat man
|an | als konvergente
n
n
”
Majorante.
P +
P −
+ − a− = a und a+ + a− = |a | folgt aus der Konvergenz von
⇐“: Wegen aP
an und
an
n
n
n
n
n
n
”
auch die von
|an |.
Satz 3.36 (kleiner Umordnungssatz):
P∞
Die Reihe P
an sei absolut konvergent und σ : P
→ eine
PBijektion. Dann ist auch die
Umordnung
aσ(n) absolut konvergent und es ist
an = aσ(n)
N N
+
−
−
Beweis: Schreibe an = a+
n −an . Also ist auch aσ(n) = aσ(n) −aσ(n) . Aus der absoluten Konvergenz
P
P +
P −
P +
von
an folgt, daß auch
an und
an konvergieren. Nach Satz 3.34 konvergieren
a
P −
P
P +
Pσ(n)
und
aσ(n) . Nach Lemma 3.35 folgt dann die Konvergenz von
aσ(n) . Aus
aσ(n) =
a+
n
P −
P −
P
P
und
aσ(n) = an folgt dann auch
aσ(n) = an
Bemerkung:
1. Absolut konvergente Reihen sind also gegen Umordnung völlig invariant anders mit bedingt
konvergenten Reihen.
2. P
Ist
R
P
an eine bedingt konvergente Reihe, so existiert zu jedem s ∈P eine Umordnung
aσ(n) die gegen s konvergiert. Es gibt auch Umordnungen, so daß
aσ(n) divergiert.
Das Produkt von Reihen:
Wie
Reihen addiert, ergibt sich ganz natürlich, nicht so bei einem Produkt
P man konvergente
P∞
( ∞
a
)
·
(
b
).
Schreibt
man alle möglichen Produkte der Reihenglieder in einem Schema
i=0 i
j=0 j
(wie in Abbildung 3.4), so hat man die Wahl diese anzuordnen.
a0 b0
a1 b0
a2 b0
a3 b0
..
.
a0 b1
a1 b1
a2 b1
a3 b1
..
.
a0 b2
a1 b2
a2 b2
a3 b2
..
.
a0 b3
a1 b3
a2 b3
a3 b3
..
.
···
···
···
···
Abbildung 3.4: Schema der Produkte der Reihenglieder zweier Reihen ai und bj .
57
3.2 Reihen
P
1. Möglichkeit: Diagonalprodukt
e0 = a0 b0
en mit
e1 = a0 b1
a0 b0 a0 b1 a0 b2 a0 b3
e2 = a1 b0
..
.
···
a1 b0 a1 b1 a1 b2 a1 b3
···
a2 b0 a2 b1 a2 b2 a2 b3
···
a3 b0 a3 b1 a3 b2 a3 b3
···
P
2. Möglichkeit: Cauchyprodukt
cn mit Klammern
setzen beim Diagonalprodukt (wie bei Polynommultiplikation):
..
.
c0 = a0 b0
c1 = a0 b1 + a1 b0
i=0
d0 = a0 b0
P
dn mit
i=0
Schreibe An :=
..
.
a0 b0 a0 b1 a0 b2 a0 b3
···
a1 b0 a1 b1 a1 b2 a1 b3
···
a2 b0 a2 b1 a2 b2 a2 b3
···
a3 b0 a3 b1 a3 b2 a3 b3
···
d1 = a0 b1 + a1 b1 + a1 b0
d2 = a0 b2 + a1 b2 + a2 b2 + a2 b1 + a2 b0
..
.
n
n
X
X
dn =
ai bn +
an bn−i
..
.
Abbildung 3.5: Diagonal- und Cauchyprodukt
c2 = a0 b2 + a1 b1 + a2 b0
..
.
n
X
cn =
ai bn−i
(n-te Diagonale)
3. Möglichkeit Kastenprodukt
..
.
..
.
..
.
..
.
..
.
Abbildung 3.6: Kastenprodukt
i=1
n
X
ai , Bn :=
i=0
n
X
bj und En :=
j=0
n
X
i=0
di . Nach der Definition gilt En = An · Bn .
Lemma 3.37:
P
P
P
Falls i∈N ai und j∈N bj konvergieren, dann konvergiert auch das Kastenprodukt ( di )
und es gilt:


! 
! 
n
n
n
X
X
X
X
X
lim
di = lim
ai ·  lim
bj  =
ai · 
bj 
n→∞
i=0
n→∞
i=0
n→∞
j=0
N
i∈
Warnung: Das gilt nicht für das Cauchyprodukt. Gegenbeispiel: ai = bi =
giert nach dem Liebnizkriterium, aber das Cauchyprodukt divergiert.
Frage: Wann konvergiert das Cauchyprodukt?
N
j∈
(−1)i
√
.
i+1
(ai )n konver-
1. Falls das Diagonalprodukt konvergiert, dann auch das Cauchyprodukt (Es werden nur
Klammern gesetzt). Im Allgemeinen gilt das aber nicht umgekehrt.
58
3 Der Grenzwertbegriff: Folgen und Reihen
2. Das Kastenprodukt
P entsteht
P aus dem Diagonalprodukt durch Umordnen und Klammern
setzen. Sind also
an ,
bn absolut konvergent, dann spielen Umordnungen keine Rolle.
Satz 3.38:
Sind
P
N
n∈
an und
P
N
bn absolut konvergent, dann ist auch das Cauchyprodukt
n∈
X
N|
n∈
absolut konvergent und es gilt:
X
N
cn =
n∈
n
X
ai bn−1
i=0
{z
cn
X
N
i∈
!
}

! 
X
ai · 
bj 
N
j∈
Beweis: Aus der Voraussetzung und dem Lemma folgt, daß das Kastenprodukt absolut konvergiert:
n
n
∞
∞
X
X
X
X
|En | = |An · Bn | ≤
|ai | ·
|bj | ≤
|ai | ·
|bj |
i=0
j=0
i=0
Auch das Diagonalprodukt konvergiert absolut, denn
n
n
∞
n
X
X
X
X
ek ≤
|ek | ≤
|dk | ≤
|dk |
k=0
k=0
k=0
j=0
k=0
Also konvergiert auch das durch Klammersetzen entstehende Cauchyprodukt: Alle drei Produkte haben den gleichen Grenzwert, denn Kastenprodukt = Umordnung des Diagonalprodukts
+ Klammern setzen und Cauchyprodukt = Diagonalprodukt + Klammern setzen.
59
3.3 Potenzreihen
3.3
Potenzreihen
Eine Reihe der Form
∞
X
i
ai x oder auch
i=0
∞
X
i=0
ai (x − x0 )i heißt Potenzreihe.
Hierbei sind x, x0 reelle Zahlen und (ai )i∈N eine Folge, ai heißt i-ter Koeffizient und x0 Entwicklungspunkt.
Potenzreihen sind eine direkte Verallgemeinerungen
von Polynomen. Genau wie bei diesen, kann
P
i als Funktion von x aufzufassen, d.h. die Zuordnung x 7→
man
versuchen,
eine
Potenzreihe
a
x
i
P∞
P∞
i
i
i=0 ai x zu studieren. Im Gegensatz zu Polynomen braucht aber
i=0 ai x nicht für alle x ∈
zu existieren (d.h. zu konvergieren). Um eine Abbildung zu erhalten, muß ein Definitionsbereich
festgelegt werden.
R
Beispiele:
P
n
1. Die geometrische Reihe ∞
n=0 x (an = 1 für alle n), konvergiert für x aus (−1, +1).
P
xn
(wie wir mit dem Quotientenkriteriumbereits
2. die Reihe ∞
n=0 n! konvergiert für alle x ∈
gesehen haben).
P∞
n n
3.
n=0 n x konvergiert nur für x = 0.
R
Die Konvergenz der Reihe
P∞
xn
n=0 n!
nutzen wir für folgende Definition:
Definition 3.18 (Exponentialfunktion):
R
P∞ xn
Für x ∈
heißt die Funktion ex = exp(x) :=
n=0 n! Exponentialfunktion oder
e-Funktion. Die Zuordnung x 7→ exp(x) definiert die Funktion exp : → .
3.3.1
R R
Konvergenzradius
Eine wichtige Entdeckung war, daß der Konvergenzbereich einer Potenzreihe immer ein (möglicherweise entartetes) Intervall und nicht eine beliebige Teilmenge von
ist. Man hat einen
sogenannten Konvergenzradius r (Radius: im Komplexen ist der Konvergenzbereich das Innere
eines Kreises) Dazu zeigt man
R
Satz 3.39:
Konvergiert eine Potenzreihe
sogar absolut.
∞
X
ai xi für ein x1 , so konvergiert sie für jedes x mit |x| < |x1 |
P
an xn1 konvergent ⇒ (an xn1 ) ist Nullfolge ⇒ (an xn1 ) ist beschränkt,
n d.h. es gibt ein
x n
n
n
n
M mit |an x1 | ≤ M für alle n. Dann gilt |an x | = |an x1 | · x1 ≤ M · xx1 für alle n. Setzt
P
M q n eine konvergente
man jetzt q := xx1 < 1 (für |x| < |x1 |), so ist die geometrische Reihe
P
Majorante für
|an xn |.
Beweis:
Es sei K := {x1 ∈
1. Ist K =
R | P∞n=0 anxn1 konvergiert} (6= ∅, da 0 ∈ K).
R so setzen wir r := ∞ (Konvention, ∞ ist keine Zahl).
2. Ist K = {0} so setzen wir r := 0.
60
3 Der Grenzwertbegriff: Folgen und Reihen
3. sonst r := sup(K).
r heißt Konvergenzradius von
Satz 3.40:
Die Potenzreihe
∞
P
P
an xn
an xn mit dem Konvergenzradius r ist
1. für alle x mit |x| < r absolut konvergent.
2. für alle x mit |x| > r divergent.
3. für x = +r, −r lassen sich keine allgemeinen Aussagen machen.
Beweis: Für r = 0 und r = ∞ ist der Satz klar. Ansonsten gilt:
1. |x| < r gegeben. Dann gibt es nach der DefinitionP
vom Supremum ein x1 mit |x| < |x1 | < r
(sonst wäre nicht r, sondern |x| Supremum) und an xn1 konvergiert. Nach Satz 3.39 folgt
Behauptung.
2. |x| > r. Dann ist x ∈
/ K,Pda |x| > sup{|y| | y ∈ K} (r = sup{y | y ∈ K} = sup{|y| | P
y ∈ K}
n
nach Satz 3.39). Wäre
an x konvergent, dann wäre x ∈ K, da K := {x1 ∈ |
an xn1
konvergiert}. Widerspruch!
R
Berechnung des Konvergenzradius
Satz 3.41 (Cauchy-Hadamard):
P
Es sei
an xn eine Potenzreihe mit Konvergenzradius r.
p
1. Ist A := { k |ak | | k ∈ } unbeschränkt, so ist r = 0
p
2. Ist A beschränkt, so existiert s = lim sup k |ak |. Dann ist r =
für s = 0
N
1
s
für s 6= 0 und r = ∞
Beweis:
p
1. A unbeschränkt
für x 6= 0 ist (|x| · k |ak |)k∈N unbeschränkt ⇒ (|x|k |ak |)k∈N unbe
P ⇒
schränkt ⇒ xk |ak | divergent. Es folgt r = 0
2. Verwende 2-te Form des Wurzelkriteriums: Zuerst s 6= 0:
(
q
p
<1
|x|
k
k
k
lim sup |ak | |x| = (lim sup |ak |) |x| =
=
r
>1
für |x| < r ⇒ Konvergenz
für |x| > r ⇒ Divergenz
p
k
|ak |) |x| = |x| · 0 < 1 für alle x. Daraus folgt: r = ∞.
√
P
n
xn
Beispiele: Der Konvergenzradius von
n! ist unbeschränkt steigende Folge
n∈N n! ist ∞.
1
√
⇒ n n! Nullfolge ⇒ lim sup = 0 ⇒ s = 0 ⇒ r = ∞
△
Für s = 0: (lim sup
Korollar 3.42:
Die Reihen
∞
P
n=1
nan xn−1 und
∞
P
n=0
an xn haben den gleichen Konvergenzradius.
61
3.3 Potenzreihen
P
P
√
n−1 konvergieren
Beweis: Wir wissen lim n n = 1 und die Reihen ∞
nan xn und ∞
n=0
n=1 nan x
n→∞
für die gleichen x.
p
p
1. { n n |an | | n ∈ } beschränkt ⇔ { n |an | | n ∈ } beschränkt
p
p
2. lim sup n n |an | = lim sup n |an | denn die Häufungswerte beider Folgen sind gleich.
q
q
√
c = lim nk nk |ank | = lim nk |ank | · (lim nk nk )
(nach Grenzwertsatz)
|
{z
}
k→∞
k→∞
N
N
=1
Aus 1. und 2. ergibt sich mit Satz 3.41 die Behauptung.
P∞ n P∞ xn
P∞ xn
Beispiel:
n=1 x ,
n=1 n und
n=1 n2 haben alle den Konvergenzradius 1. Für x = +1, −1
eribt sich jedoch verschiedenes Verhalten. (Welches?)
△
3.3.2
Rechnen mit Potenzreihen
Satz 3.43:
P
f1 (x) = Pn∈N an xn sei eine Potenzreihe mit Konvergenzradius r1 .
f2 (x) = n∈N bn xn sei eine Potenzreihe mit Konvergenzradius r2 .
Setze r3 = min{r1 , r2 }. Für |x| < r3 gilt dann:
f3 (x) =
und f4 (x) =
∞
X
(ai + bi )xi
i=0
∞ X
k
X
(ai bk−i )xk
(Cauchy Produkt)
k=0 i=0
konvergieren absolut und es ist f3 (x) = f1 (x) + f2 (x) und f4 (x) = f1 (x) · f2 (x).
Bemerkung: Die Konvergenzradien von f3 , f4 können natürlich größer als r3 sein.
Beweis: Die Behauptungen folgen direkt aus den entsprechenden Sätzen über Reihen indem
man x festhält.
Beispiel:
1
=
(1 − x)2
1
1−x
2
=
∞
X
i=0
xi
!2
=
∞
X
i=0


i
X
j=0

1j · 1i−j  xi =
∞
X
(i + 1)xi
i=0
für |x| < 1.
△
Polynome kennt man genau, wenn man ihre Koeffizienten oder gnügend viele Funktionswerte
kennt (siehe elementare Funktionen). Analoges gilt auch für Potenzreihen:
Satz* 3.44 (Identitätssatz für Potenzreihen):
∞
∞
P
P
Es seien A(x) =
ai xi und B(x) = bi xi Potenzreihen mit positiven Konvergenzradien.
1. gilt für alle x mit |x| < r A(x) = B(x), so folgt für alle i: ai = bi .
2. Es sei (xn )n∈N eine Folge mit xn 6= 0 für alle n und lim xn = 0 und |xn | < r für
n→∞
alle n. Gilt A(xn ) = B(xn ) für alle n, so folgt ai = bi für alle i.
Elementarer Beweis: Übung. Später Beweis mit Ableiten und x = 0 einsetzen (wie bei Polynomen).
4
Die elementaren Funktionen
4.1
Abbildungen
Was eine Abbildung oder Funktion f : A → B ist, wissen wir bereits, nämlich eine Vorschrift,
die jedem a ∈ A genau ein b ∈ B zuordnet. Wir werden als nächstes Funktionen f : D →
systematisch untersuchen. Dabei ist der Definitionsbereich D eine Teilmenge von .
f :D→
R
mit
f : x 7→ f (x)
für x ∈ D
(D ⊂
R)
R
R
heißt reellwertige Funktion einer reellen Variablen. Veranschaulichen kann man sich eine solche
Funktion f durch ihren Graphen
R | y = f (x), x ∈ D}.
Bemerkung zur traditionellen Sprechweise: D ⊂ R sei eine feste Grundmenge. Ein beliebiges
Γf = {(x, y) ∈ D ×
Element x ∈ D nennt man oft auch Variable oder Veränderliche. Beim Beweisen beispielsweise
einer All-Aussage muß man eine Aussage für alle α ∈ D herleiten und das tut man, indem man
mit einem variablen, d.h. nicht näher festgelegten Element rechnet. Daraus resultiert auch die
alte Schreibweise einer Funktion
y = f (x)
(4.1)
z.B.
y = x2 + x
Dabei heißt x unabhängige und y abhängige Variable. Das Symbol x ist in (4.1) nicht als festes
Element aus D, sondern als Variable gedacht, d.h. als beliebiges Element. In diesem Sinne beschreibt (4.1) dann auch die durch f gegebene Zuordnung. Mit y = f (x) meint man also manchmal die Funktion selbst, manchmal aber auch nur eine Gleichung zwischen festen Elementen —
dies führt daher leicht zu Mißverständnissen — insbesondere wenn der Defninitionsbereich und
Wertebereich der Funktion nicht angegeben werden.
Als Definitionsbereiche kommen sehr oft Intervalle vor.
Definition 4.1:
^
I ⊂ heißt Intervall :⇔
R
^
R
a,b∈I c∈
(a ≤ c ≤ b ⇒ c ∈ I) D.h. mit je zwei Punkten a und
b enthält ein Intervall I auch alle Punkte zwischen a und b.
Man kann folgende Intervalltypen unterscheiden: (a, b aus
[a, b]
(a, b)
[a, b)
(a, b]
(−∞, a]
(−∞, a)
(a, ∞)
[a, ∞)
(−∞, +∞)
:=
:=
:=
:=
:=
:=
:=
:=
:=
{t ∈
{t ∈
{t ∈
{t ∈
{t ∈
{t ∈
{t ∈
{t ∈
R
R | a ≤ x ≤ b}
R | a < b < b}
R | a ≤ c < b}
R | a < x ≤ b}
R | t ≤ a}
R | t < a}
R | t > a}
R | t ≥ a}
R mit a ≤ b)
abgeschlossenes Intervall
offenes Intervall
halboffenes Intervall
halboffenes Intervall
(∞ ∈
/
R, ∞ ist nur ein Symbol)
63
4.2 Polynome und rationale Funktionen
R+ ist eine Abkürzung für (0, ∞). Speziell nennt man für ε > 0 das offene Intervall Uε(a) :=
{x ∈ R | |x − a| < ε} = (a − ε, a + ε) eine ε-Umgebung des Punktes a. Also:
z ∈ Uε (a) ⇔ |z − a| < ε ⇔ a − ε < z < a + ε
Als erstes sollen einige einfache Funktionsklassen der Reihe nach besprochen werden. Dazu
benötigt man folgende Konstruktionen mit reellwertigen Funktionen:
Es seien zwei reelle Funktionen f : D →
R, g : D → R gegeben.
1. Die Summenfunktion (f + g) : D →
alle x ∈ D.
2. Für eine Konstante c ∈
3. (f · g) : D →
R wird definiert durch (f + g)(x) := f (x) + g(x) für
R erklärt man c · f : D → R durch (c · f )(x) := c · f (x)
R ist durch (f · g)(x) = f (x) · g(x) definiert.
4. Gilt g(x) 6= 0 für alle x ∈ D, dann definiert man 1/g : D →
R durch (1/g)(x) = 1/g(x).
Damit ist auch f /g als f · (1/g) erklärt.
Ähnliche Definitionen gelten auch für |f | und max{f, g}.
Beachte:
Die Summe zweier Funktionen f + g ist streng zu unterscheiden von der Summe zweier reeller Zahlen, obwohl man das gleiche Symbol + benutzt. Man sagt auch f + g ist
punktweise oder werteweise erklärt.
An allgemeinen Konstruktionen mit Abbildungen haben wir noch
5. Komposition: f : D1 → D2 , g : D2 →
erklärt.
Bemerkung: Hat man f : D1 →
D1 → genauso definieren.
R
R
R, dann ist g◦f : D1 → R durch (g◦f )(x) := g(f (x))
g : D2 →
R mit f (D1) ⊂ D2 so kann man g ◦ f :
6. Umkehrabbildung: Ist f : D1 → D2 bijektiv, dann ist die Umkehrabbildung f −1 : D2 → D1
durch f −1 (y) = x ⇔ f (x) = y definiert.
R
R
7. Einschränkung: Ist f : D →
eine Funktion und A ⊂ D, so ist f|A : A →
durch
f|A (x) = f (x) für alle x ∈ A erklärt (Man betrachtet die gleiche Zuordnungsvorschrift nur
für x ∈ A).
R
R
Für jedes c ∈ bezeichne c̃ : D → die konstante Funktion mit Wert c, d.h. c̃(x) = c für alle
x ∈ D. Mit I : D → oder id bezeichnen wir die Einschränkung der identischen Funktion auf
D, d.h. I(x) = x für alle x ∈ D.
R
Die Konstruktionen unter 1.–4. bezeichnet man auch als rationale Operationen.
4.2
Polynome und rationale Funktionen
Mit Hilfe der rationalen Operationen kann man aus zwei Funktionen — nämlich I und 1̃ — eine
ganze Menge Funktionen herstellen:
64
4 Die elementaren Funktionen
Indem man I n-mal mit sich selbst multipliziert erhält man ein sogenanntes Monom: Für n ∈
haben wir
In : D →
I n (x) = (I(x))n = xn für x ∈ D
(I 0 = 1̃).
R
R
R
N
Ein solches Monom kann man mit einer Konstanten c ∈
multiplizieren: c · I n : D →
ist
n
die Funktion xP7→ cx . Solche Funktionen kann man addieren.
P Es seien a0 , a1 , . . . , an aus .
Die Funktion ni=0 ai I i : D →
ordnet jedem b die Zahl ni=0 ai bi zu. Eine solche Funktion
heißt Polynomfunktion (oder kurz Polynom, obwohl das etwas anderes ist) und wird traditionell
P
n
i
[x] bezeichnet man die Menge aller Polynome mit Definitionsbei=0 ai x geschrieben. Mit
reich . Dies ist ein reeller Vektorraum und da das Produkt zweier Polynome wieder ein Polynom
ist, sogar ein Ring, der sogenannte Polynomring.
R
R
R
R
Beispiel: 2 − 3x und x2 ergibt addiert x2 − 3x + 2. Multipliziert man diese Funktion mit x − 3,
erhält man (x2 − 3x + 2)(x − 3). Die Graphen der verschiedenen Polynome sid in Abbildung 4.1
zu sehen.
△
7
4
6
3
5
2
4
1
3
−2
2
−2
−1
1
2
3
4
−1
−2
1
−3
−1
1
2
3
−3
Abbildung 4.1: Links: Die Graphen Γ2−3x , Γx2 und Γx2 −3x+2 . Rechts: Der Graph Γ(x2 −3x+2)(x−3)
Definition 4.2:
f : D → sei eine Funktion. Eine Zahl α ∈ D heißt Nullstelle von f :⇔ f (α) = 0.
R
Um Polynomfunktionen genauer zu verstehen, untersuchen wir zunächst die Nullstellen eines
Polynoms:
Lemma 4.1:
α sei eine Nullstelle des Polynoms f . Dann gibt es ein Polynom g mit f (x) = (x − α) · g(x).
D.h. jedes Polynom f mit α als Nullstelle kann durch das einfachste Polynom mit α als Nullstelle,
nämlich (x − α) (ein sogenannter Linearfaktor) geteilt werden.
65
4.2 Polynome und rationale Funktionen
Beweis: Zunächst ist für jedes p ∈
N das Polynom xp − αp durch (x − α) teilbar:
xp − αp = (x − α) · (xp−1 + α · xp−2 + α2 xp−3 + · · · + αp−1 ),
wie man durch Ausmultiplizieren einsieht. Man schreibt f (x) = f (x) − 0 = f (x) − f (α) wie
folgt:
f (x) − f (α) = (a0 + a1 x + a2 x2 + · · · + am xm ) − (a0 + a1 α + a2 α2 + · · · + am αm )
= a0 − a0 + a1 (x − α) + a2 (x2 − α2 ) + a3 (x3 − α3 ) + · · · + am (xm − αm )
Also ist f (x) durch x − α teilbar, da jeder Summand rechts durch x − α teilbar ist. Man kann
g auch direkt angeben:
g(x) =
m−1
X
k
bk x
wobei
bk :=
k=0
m
X
j=k+1
aj · αj−k−1
Eine Folgerung:
Satz 4.2:
P
k
Es sei f (x) = m
k=0 ak x ein Polynom und am 6= 0. Dann hat f höchstens m verschiedene
Nullstellen.
Beweis (Induktion über m): Induktionsanfang: m = 0. Dann ist f (x) = a0 für alle x. Da a0 6= 0,
hat f keine Nullstelle.
P
k
Induktionsschluß: m ≥ 0 und α sei eine Nullstelle von f (x) = m+1
k=0 ak x mit am+1 6= 0. Dann
gibt es nach dem letzten Lemma ein Polynom g
g(x) =
m
X
bi xi
f (x) = (x − α) · g(x)
mit
i=0
Der Beweis des Lemmas zeigt bm = am+1 . Also hat nach Induktionsvoraussetzung g höchstens
m Nullstellen, und damit f höchstens m + 1 verschiedene Nullstellen.
Eine weitere Folgerung:
Satz 4.3:
P
Pn
i
i
Es seien f : D → , g : D → , f (x) = m
i=0 ai x , g(x) =
i=0 bi x zwei Polynomfunktionen. Es gelte f (x) = g(x) für alle x ∈ D, und D habe unendlich viele Elemente. Dann
folgen n = m und ai = bi für alle i.
P
Beweis: f − g ist ein Polynom: (f − g)(x) = ki=0 ci xi mit k ≤ max(n, m) und ci = ai − bi
für i ≤ min(n, m) und ci = ai bzw. ci = −bi für i > min(n, m), je nach dem ob n > m oder
n < m. Also hat f − g höchstens k verschiedene Nullstellen, oder es gibt kein i mit ci 6= 0. Da D
unendlich viele Elemente enthält, hat f − g aber unendlich viele Nullstellen, also kann es kein i
mit ci 6= 0 geben, d.h. c0 = c1 = · · · = ck = 0 und damit ai = bi und n = m.
R
R
Eine Polynomfunktion bestimmt also in eindeutiger Weise die Zahlen ai — die Koeffizienten des
Polynoms — in der Darstellung
n
X
f (x) =
ai xi
i=0
Deshalb ist folgende Definition sinnvoll:
66
4 Die elementaren Funktionen
Definition 4.3:
P
f (x) = ni=0 ai xi sei ein Polynom. Der größte Index m mit am 6= 0 heißt Polynomgrad
von f . Also grad(I n ) = n. Das Nullpolynom 0 hat keinen Grad.
Übung:
f, g Polynome ⇒ grad(f + g) ≤ max{grad(f ), grad(g)}
grad(f · g) = grad(f ) · grad(g)
Ein Polynom p vom Grad n ist durch einen Satz von (n + 1) Daten vollständig bestimmt:
1. Die (n + 1)-Koeffizienten a0 , . . . , an bestimmen p.
2. Hat p die n reellen Nullstellen α1 , . . . , αn , dann gilt p(x) = c · (x − α1 )(x − α2 ) · · · (x − αn )
und die Zahlen (c, α1 , . . . , αn ) bestimmen p.
Allgemeiner gilt:
Satz 4.4:
Es seien (n + 1) paarweise verschiedene Zahlen x0 , x1 , . . . , xn (Stützstellen) und (n + 1)
beliebige Zahlen y0 , y1 , . . . , yn (Stützwerte) gegeben. Dann gibt es genau ein Polynom p
vom Grad n mit
p(xi ) = yi
für
i = 0, . . . , n.
Beweis: Eindeutigkeit: Sind p und q zwei solche Polynome, dann hat das Polynom p − q einen
Grad ≤ n aber (n + 1) Nullstellen, nämlich x0 , x1 , . . . , xn , ist also das Nullpolynom.
Existenz (Lagrange-Polynome): Setze
p(x) :=
n
X
i=0
yi · Li (x)
und
Li (x) :=
n
Y
x − xk
xi − xk
k=0
k6=i
(
0
Klar: grad(Li ) ≤ n also auch grad(p) ≤ n. Es gilt: p(xk ) = yk , da Li (xk ) =
1
i 6= k
i=k
R
Bemerkung: Man kann zwei Polynome f, g immer mit Rest dividieren, d.h. zu f, g ∈ [x] mit
g 6= 0 gibt es eindeutig bestimmte Polynome q, r mit f = g ·q + r und grad(r) < grad(g) (Beweis:
siehe Lineare Algebra).
Beispiel: f (x) = x3 − 2 und g(x) = x − 1:
(x3 + 0x2 + 0x − 2) : (x − 1) = x2 + x + 1 + Rest
−(x3 − 1x2 )
x2 + 0x − 2
−(x2 − 1x)
x−2
−(x − 1)
−1 (= Rest)
Also q(x) = x2 + x + 1 und r(x) = −1.
△
67
4.3 Die Klasse der elementaren Funktionen
Sind f und g Polynome, so kann man f /g bilden und dies als Funktion auffassen, sofern man aus
dem Definitionsbereich alle Nullstellen von g — also höchstens endlich viele Punkte — entfernt:
Also: Der Definitionsbereich von f /g wird festgesetzt als
Solche Funktionen heißen rationale Funktionen.
R−{a | g(a) = 0} = {a ∈ R | g(a) 6= 0}.
Beispiele: 1/x, 1/(1 + x2 ), 1/(1 − x2 ), x2 /(x2 + 1), (x2 − 1)/(x − 1). Beachte jedoch, daß man
bei Verwendung der obigen Definition von rationaler Funktion in der Darstellung F = f /g nicht
ohne weiteres einen gemeinsamen Faktor im Zähler und Nenner — falls ein solcher vorhanden
ist — herauskürzen darf, ohne die Funktion zu verändern, denn es kann sich dabei ein anderer
Definitionsbereich ergeben.
△
R+ → R+ mit f (x) = x2 ist bijektiv. Die Umkehrfunktion
Beispiele (Umkehrfunktionen): 1. f :
√
heißt Wurzelfunktion
: + → +.
R
R
3
3
2
2
1
1
1
2
3
4
1
2
3
4
5
6
7
Abbildung 4.2: Die Graphen Γx2 und Γ√x
Beachte: Γf −1 erhält man, indem man Γf an der Geraden D = {(x, x) | x ∈
x2 ).
R} spiegelt.
2. f : [0, ∞) → (0, 1] mit f (x) = 1/(1 +
Um eine Formel für die Umkehrfunktion zu
1
bestimmen, versucht man die Gleichung y = 1+x2 nach x aufzulösen (dies geht nicht immer).
Man erhält hier:
r
1−y
x=
y
q
g(z) = 1−z
z ist die Umkehrfunktion von f , denn es gilt f ◦ g = id und g ◦ f = id. Daraus ergibt
sich auch ein Beweis für die Bijektivität von f .
△
4.3
Die Klasse der elementaren Funktionen
Die Funktionen exp, ln, sin, cos, tan und cot sind ebenfalls aus der Schule bekannt und sollen
im nächsten Abschnitt noch einmal besprochen werden. Die sogenannte Klasse der elementaren
Funktionen erhält man nun, indem man die Operationen 1. bis 7. — soweit das sinnvoll möglich
ist — auf Polynome exp, ln, sin und cos anwendet. Diese Funktionsklasse ist in ihrem Umfang
in der Literatur im Allgemeinen aber nicht so genau festgelegt. Ein typisches Beispiel ist
√
f (x) = exp(sin(x2 )) · x5 + 5x − 3x.
68
4.3.1
4 Die elementaren Funktionen
Beispiele für Kompositionen
Zu x 7→ x2 und y 7→ sin y kann man die beiden Kompositionen x 7→ sin(x2 ) und x 7→ sin2 (x)
bilden, oder zu x 7→ 2x und x 7→ sin x erhält man x 7→ 2 sin x und x 7→ sin(2x). Für x 6= 0 kann
man x 7→ sin( x1 ) und x 7→ sinx x bilden. Die angegebenen Beispiele werden oft verwechselt!
4.4
4.4.1
Die Exponentialfunktion, der Logarithmus und die trigonometrischen Funktionen
Die Exponentialfunktion
Zur Exponentialfunktion wird man durch Wachstumsphänomene geführt, deren Beschreibung
durch einfache algebraische Ausdrücke, wie etwa Polynome, nicht möglich ist:
Zerfalls- und Wachstumsprozesse in der Natur (z.B. radioaktiver Zerfall) oder der Wirtschaft
(z.B. Verzinsung) führen häufig auf die Bedingung, daß eine betrachtete Größe in gleichen Zeitabschnitten um denselben Prozentsatz zu- oder abnimmt. Bezeichnet f (t) den Wert der betrachteten Größe zum Zeitpunkt t, so bedeutet Zu- oder Abnahme um denselben Prozentsatz:
f (t0 + t2 )
f (t1 + t2 )
=
f (t0 )
f (t1 )
oder wenn man f (0) = 1 annimmt (das kann man durch Normieren immer erreichen) und t0 = 0
setzt:
f (t1 ) · f (t2 ) = f (t1 + t2 )
(4.2)
Eine Gleichung dieser Form heißt Funktionalgleichung und jede Funktion, die einer solchen Funktionalgleichung genügt, heißt Lösung dieser Funktionalgleichung. Hat man eine solche Gleichung,
so ist zunächst noch völlig unklar, ob es überhaupt Lösungen gibt, wenn ja, wie viele und wie
man solche konstruiert.
Es gibt eine Reihe von Möglichkeiten, die Exponentialfunktion einzuführen. Hat man zu a > 0
und t ∈ die allgemeine Potenz t 7→ at zur Verfügung, so setzt man
R
exp(x) = ex
mit der Eulerschen Zahl e = limn→∞ (1 + 1/n)n als Basis. Hierbei ist dann noch die Wahl von e
zu begründen. So geschieht dies meist an der Schule. Weitere Möglichkeiten sind:
Direkt als Grenzwert
x n
n→∞
n
oder als Umkehrfunktion des zuvor eingeführten Logarithmus. Der hier am günstigsten erscheinende Weg ist wohl die Wahl der Potenzreihendefinition. Man geht von der Funktionalgleichung
(4.2) aus. Aus Gradgründen kommen Polynome als Lösungen nicht in Frage (die allgemeinen
Potenzfunktionen sind
Lösungen von (4.2)). Man macht deshalb den Ansatz, daß die
P natürlich
k mit zunächst unbekannten Koeffizienten die Funktionalgleichung
Potenzreihe f (x) = ∞
a
x
k=0 k
(4.2) löst. Dies ergibt Bedingungen, die die Koeffizienten ak (mehr oder weniger) festlegen. Am
Ende verwendet man diese dann für eine Definition.
exp(x) = lim
1+
69
4.4 Die Exponentialfunktion, der Logarithmus und die trigonometrischen Funktionen
1
−2π
−3
2 π
−1π
−1
2 π
−1
π
2
π
3
2π
2π
3
2π
2π
3
2π
2π
3
2π
2π
3
2π
2π
Abbildung 4.3: Der Graph von sin x
2
1
−2π
−3
2 π
−1π
−1
2 π
−1
π
2
π
−2
Abbildung 4.4: Der Graph von 2 sin(x)
1
−2π
−3
2 π
−1π
−1
2 π
−1
π
2
π
Abbildung 4.5: Der Graph von sin(2x)
1
−2π
−3
2 π
−1π
−1
2 π
−1
π
2
π
Abbildung 4.6: Der Graph von sin2 (x)
1
−2π
−3
2 π
−1π
−1
2 π
−1
π
2
π
Abbildung 4.7: Der Graph von sin(x2 )
70
4 Die elementaren Funktionen
Aus (4.2) folgt mit t1 = t2 = x die einfachere Gleichung
f (x)2 = f (2x)
Ist f (x) =
P∞
k
k=0 ak x
(4.3)
eine Lösung dieser Gleichung, so findet man:
∞
X
∞
X
k
ak (2x) =
k=0
k=0
also
∞
X
k=0
ak · 2k · xk =
∞
X
k=0
und damit durch Koeffizientenvergleich:
k
ak · 2 =
k
X
j=0


k
X
j=0
aj · ak−j
k
ak x
!2

aj · ak−j  · xk
k = 0, 1, 2, ....
Wegen f (0) = 1 ist a0 = 1 (es kommt sonst nur noch a0 = 0 in Frage). Weiter ergibt sich
2a1 = 2a0 · a1
4a2 = 2a0 · a2 + a21
8a3 = 2a0 · a3 + 2a1 · a2
k=1
k=2
k=3
usw.
Damit
a0 = 1
a2 = 12 a21
a3 = 13 a1 · a2 =
1 3
3! a1
usw.
Mit Induktion zeigt man (Übung):
1 k
a
k! 1
Bezeichnet man a1 mit c, so findet man als Lösungen von (4.3) die Potenzreihen
ak =
∞ k
X
c
k=0
k!
· xk .
Nach dem Quotientenkriterium konvergiert die Potenzreihe
und durch
∞
X
1
· xk
exp(x) :=
k!
P∞
1
k=0 k!
· xk für alle x ∈
R absolut
k=0
wird eine Funktion exp :
R → R — die Exponentialfunktion — definiert.
Die oben gefundenen Lösungen von (4.3) werden dann durch x 7→ exp(c · x) beschrieben. Diese
Potenzreihen erfüllen auch die Funktionalgleichung (4.2), dies rechnet man jetzt einfach nach:
Satz 4.5:
Für alle x, y ∈
R gilt: exp(x) · exp(y) = exp(x + y) (Funktionalgleichung für exp).
4.4 Die Exponentialfunktion, der Logarithmus und die trigonometrischen Funktionen
71
5
4
3
2
1
−5
−4
−3
−2
−1
1
Beweis: Man verwendet den Produktsatz für Potenzreihen. Dann gilt für das Cauchy-Produkt:
!
!
!
∞
∞
∞
n
X
X
X
X
xn
yn
1
1
k
n−k
·
=
x ·y
Erweitern mit n!
n!
n!
k! (n − k)!
n=0
n=0
n=0 k=0
!
∞
n
X
1 X
n!
=
xk · y n−k
Definition von nk
n!
k!(n − k)!
n=0
k=0
!
∞
n
X
1 X n k n−k
=
x ·y
Binomischer Lehrsatz
n!
k
=
n=0
∞
X
n=0
k=0
1
(x + y)n
n!
Aus der Funktionalgleichung für exp ergeben sich auch leicht die anderen Eigenschaften der
Exponentialfunktion:
Korollar 4.6:
1. x ≥ 0 ⇒ exp(x) ≥ 1
2. exp(x) > 0 für alle x ∈
R
3. x < y ⇒ exp(x) < exp(y)
Die letzte Eigenschaft besagt, daß exp streng monoton wachsend, also insbesondere injektiv ist.
Im Vorgriff auf einen später zu beweisenden Satz halten wir hier bereits fest, daß die Exponentialfunktion jede positive reelle Zahl auch als Wert annimmt, d.h. daß exp :
→ + bijektiv
ist.
P
P∞ xn
xn
Beweis: 1. Ist x ≥ 0, dann ist ∞
n=0 n! = 1 +
n=1 n! ≥ 1.
R R
2. Wegen exp(0) = 1 gilt auch exp(x) · exp(−x) = exp(x − x) = exp(0) = 1. Damit ergibt sich
exp(−x) = 1/ exp(x) und es folgt für negative x: exp(x) = 1/ exp(−x) ≥ 0.
3. Wegen exp(y) = exp(x) · exp(y − x) und exp(y − x) > 1 für y > x folgt exp(y) > exp(x). 72
4 Die elementaren Funktionen
Die Eulersche Zahl e war erklärt worden als Grenzwert der Folge (1 + n1 )n n≥1 . Über den
Binomischen Lehrsatz folgt
n n
X
1 n X n 1
n(n − 1)(n − 2) · · · (n − k + 1) 1
=
· k
1+
=
k
n
k n
k!
n
k=0
=
n
X
k=0
k=0
1 · (1 −
2
3
k−1 1
1
) · (1 − ) · (1 − ) · · · · · (1 −
)
n
n
n
n k!
P
1
2
k−1 1
Für m ≤ n ist deshalb (1 + n1 )n ≥ m
k=0 (1 − n ) · (1 − n ) · · · · · (1 − n ) k! da alle weggelassenen
Summanden
sind. Hält man jetzt m fest und bildet den Grenzwert für n → ∞ erhält
P positiv
1
.
Da
dies für jedes m gilt, folgt
man e ≥ m
k=0 k!
∞
X
1
e≥
= exp(1).
k!
k=0
Wieder von (1 + n1 )n =
(1 − ni ) ≤ 1
Pn
k=0 (1
− n1 ) · (1 − n2 ) · · · · · (1 −
1
1+
n
n
k−1 1
n ) k!
ausgehend, erhält man mit
n
∞
X
X
1
1
≤
≤
= exp(1)
k!
k!
k=0
k=0
und damit die umgekehrte Ungleichung e ≤ exp(1). Es gilt also
e = lim
n→∞
1
1+
n
n
= exp(1) =
∞
X
1
.
k!
k=0
Z gilt exp(m) = em.
Da dies auch für m ∈ Q gilt und, wie wir später noch sehen werden, wenn die allgemeine Potenz
definiert ist, auch für m ∈ R, schreibt man oft auch ex anstelle von exp(x). Allgemein gilt für
jedes x ∈ R (für x ≥ 0 mit dem gleichen Beweis wie oben) die Beziehung
Übung: Für m ∈
x n
1+
= exp(x).
n→∞
n
lim
Wie Euler diese Beziehung herleitete, zeigt folgender Auszug aus Eulers gesammelten Werken:
a ∈ sei gegeben und ε eine unendlich kleine Zahl“. Dann schreibt Euler
”
R
R
aε = 1 + k · ε
mit k ∈ . Gegeben sei weiter eine (endliche) Zahl x. Euler betrachtet dann die unendlich große
Zahl N = x/ε und schreibt:
x N
ax = aN ·ε = (aε )N = (1 + k · ε)N = 1 + k ·
binomischer Lehrsatz
N
kx N · (N − 1) kx 2
=1+N ·
+
+ ···
N
2!
N
1 N (N − 1) 2 2
1 N (N − 1)(N − 2) 3 3
= 1 + kx +
·k x +
· k x + ···
2
2!
3!
N
N3
73
4.4 Die Exponentialfunktion, der Logarithmus und die trigonometrischen Funktionen
Γcosh
−3
−2
3
3
2
2
1
1
−1
1
2
−3
3
−1
Γsinh
−2
−1
1
2
3
−1
−2
−2
−3
−3
Abbildung 4.9: Hyperbel
Abbildung 4.8: sinh und cosh
Da N unendlich groß ist, gilt N (N − 1)/N 2 = 1 usw., also
ax = 1 +
kx k2 x2
+
+ ···
1
2!
Für x = 1 erhält er
k k2 k3
+
+
+ ···
1
2!
3!
und definiert e als diejenige Zahl, für die k = 1 ist, also
a=1+
∞
x N X xn
ex = 1 +
=
.
N
n!
n=0
4.4.2
Die Hyperbelfunktionen
Mit der Exponentialfunktion eng verknüpft sind die Hyperbelfunktionen: sinh, cosh, tanh, coth:
Definition 4.4:
∞
X x2n
1
cosh(x) := (ex + e−x ) =
2
(2n)!
n=0
∞
X
1
x2n+1
sinh(x) := (ex − e−x ) =
2
(2n + 1)!
n=0
Dies sind Funktionen von
Cosinus hyperbolicus
Sinus hyperbolicus
R nach R.
Der Graph von cosh heißt auch Kettenlinie, da eine Kette unter dem Einfluß der Schwerkraft in
einer solchen Kurve durchhängt.
Eigenschaften der Hyperbelfunktionen:
74
4 Die elementaren Funktionen
Satz 4.7 (Additionstheorem):
Für alle x, y aus
gilt
R
cosh(x + y) = cosh(x) · cosh(y) + sinh(x) · sinh(y)
sinh(x + y) = sinh(x) · cosh(y) + cosh(x) · sinh(y)
Beweis: Definition und exp(x + y) = exp(x) · exp(y).
R
R R
Ordnet man jetzt jedem t aus das Paar (x, y) = (cosh(t), sinh(t)) ∈ × zu, und läßt t aus
laufen, erhält man als Bild eine Kurve in 2 . Wie sieht diese aus? Man hat nach Definition
R
R
x + y = exp(t) > 0
x − y = exp(−t) > 0
x2 − y 2 = 1
also
R
Die Punkte (x, y) ∈ 2 mit x2 − y 2 = 1 beschreiben eine Hyperbel — daher der Name Hyperbelfunktionen.
Beachte, dies ist nicht der Graph von sinh oder cosh, sondern das Bild von unter der Abbildung
ψ:
R
R → R2
ψ : t 7→ (cosh(t), sinh(t))
Man nennt dies Parameterdarstellung der Hyperbel.
Bemerkung: Durch eine Koordinatentransformation kann man aus x2 − y 2 = 1 die übliche
Gleichung der Hyperbel, nämlich ξ · η = 1, erhalten.
4.4.3
Die Logarithmusfunktion
Zur Logarithmusfunktion wird — und wurde man auch historisch — geführt, wenn man versucht, die Multiplikation reeller Zahlen auf eine Addition zurückzuführen. Dies entspricht der
Funktionalgleichung
ln(x · y) = ln(x) + ln(y)
x, y > 0
Auch für die Einführung des Logarithmus bieten sich mehrere Möglichkeiten an: Man kann ln(x)
direkt als Grenzwert
√
x>0
ln(x) = lim (n · ( n x − 1))
n→∞
oder als Integral
ln(x) =
Zx
1
dt
t
1
einführen. Der Potenzreihenansatz ist ungünstig, da der Konvergenzradius, wie wir noch sehen
werden, im Allgemeinen zu klein ausfällt. Hauptsächlich aus Zeitgründen definieren wir hier ln als
Umkehrfunktion der Exponentialfunktion, obwohl die Grenzwertdefinition sich gut eignen würde
um mit den Mitteln, die bis jetzt bereit stehen, die Eigenschaften des Logarithmus herzuleiten
(vergl. Literatur). Wir verwenden, daß exp : → + bijektiv ist und definieren ln : + →
als ln := exp−1 , d.h. es ist
R R
x = ln(y)
genau dann, wenn
R
exp(x) = y
Die Funktionalgleichung von ln folgt dann einfach aus (4.2).
gilt.
R
75
4.4 Die Exponentialfunktion, der Logarithmus und die trigonometrischen Funktionen
2
1
1
2
3
4
5
6
7
8
9
10
11
12
−1
−2
Abbildung 4.10: Der Graph der Natürlichen Logarithmusfunktion
4.4.4
Die trigonometrischen Funktionen
Periodische Phänomene führen zur Einführung der Funktionen Sinus und Cosinus. Diese werden
in der Schule als Funktionen einen Winkels α erklärt. Was ist ein Winkel? Gegeben sei ein Punkt
in der Ebene 2 — etwa der 0-Punkt und zwei davon ausgehende Strahlen S1 und S2 . Dann
bilden diese einen Winkel α.
R
S2
sin(t) t
α
S1
cos(t)
R
Wie mißt an einen Winkel? Statt den Einheitskreis S 1 = {(x, y) ∈ 2 | x2 + y 2 = 1} in 360 Grad
und Winkel in Teilen davon — also in Grad — zu messen, kann man einen Winkel durch die
Länge t des Bogenstücks von (1, 0) nach A auf dem Einheitskreis durch sein Bogenmaß messen.
Ist der Winkel α durch sein Bogenmaß t ∈ gegeben, dann ergeben sich die Schuldefinitionen
für sin und cos aus obiger Skizze.
√
Es bezeichne t = l(x) die Länge des Kreisbogens von (0, 1) nach A = (x, 1 − x2 ) für x ∈ [−1, 1].
Man erhält die Funktion, die in Abbildung 4.11 zu sehen ist.
Aus dem Bild, ebenso wie aus den Gleichungen x = cos(t) und t = l(x) also x = cos(l(x)),
entnimmt man, daß cos die Umkehrfunktion von x 7→ l(x) auf dem Intervall [−1, 1] ist. Wir
R
76
4 Die elementaren Funktionen
b
π
π
2
b
−1
1
Abbildung 4.11: Der Graph von l(x)
haben bis jetzt keine Möglichkeit, die Funktion x 7→ l(x), das Bogenmaß, exakt zu definieren
— das können wir erst später mit Hilfe der Integralrechnung. Die Zurückführung von Sinus und
Cosinus auf die Verhältnisse am Einheitskreis ist der natürliche Zugang zu diesen Funktionen.
Aus systematischer Sicht wird man dagegen einwenden, daß Anleihen aus der Elementargeometrie und ein Rückgriff auf die Bogenlänge für diesen Zugang nötig sind. Wir wollen diesen Weg
deshalb hier nicht einschlagen. Um die Funktionen Sinus und Cosinus trotzdem zum jetzigen
Zeitpunkt zur Verfügung zu haben, werden wir diese durch ihre Potenzreihen definieren. Um
diese Definitionen wenigstens etwas zu motivieren, machen wir folgenden Ausflug ins Komplexe.
R2 , den wir uns als Ebene vorstellen:
S 1 = {(x, y) ∈ R2 | x2 + y 2 = 1}
Der Kreis S 1 ist folgende Teilmenge des
Will man den Kreis ähnlich wie die Hyperbel parametrisieren (siehe oben), stößt man auf die
Frage: Wie kann man von x2 − y 2 = 1 nach x2 + y 2 = 1 kommen? Folgende Überlegungen
sind für uns eigentlich verboten, da wir bis jetzt noch keine komplexen Zahlen betrachtet haben
und insbesondere keine Potenzreihen mit komplexen Argumenten eingeführt haben. Sie dienen
deshalb auch nur zur Motivation: Ersetzt man in x2 − y 2 = 1 die Variable y durch 1i y, wobei
i2 = −1, so wird aus der Gleichung x2 − ( ii y)2 = 1 die Gleichung x2 + ( 1i y)2 = 1 oder cosh(t)2 +
( 1i sinh(t))2 = 1. Ersetzen wir jetzt auch noch t durch i · t, so gilt immer noch cosh(i · t)2 +
( 1i sinh(i · t))2 = 1. Nun sind aber glücklicherweise
x2 x4 x6
+
−
+ ···
2!
4!
6!
x3 x5 x7
1
sinh(i · x) = x −
+
−
+ ···
i
3!
5!
7!
cosh(i · x) = 1 −
R
R
aus . Beide rechtsstehenden Reihen konvergieren absolut für jedes x ∈
(exp(x) ist eine
Majorante). Deshalb definieren wir einfach — und jetzt kommen gar keine komplexen Zahlen
mehr vor:
cos(x) :=
sin(x) :=
∞
X
(−1)n
n=0
∞
X
(−1)n
n=0
x2n
x2 x4 x6
=1−
+
−
+ ···
(2n)!
2!
4!
6!
x2n+1
x3 x5 x7
=x−
+
−
+ ···
(2n + 1)!
3!
5!
7!
4.4 Die Exponentialfunktion, der Logarithmus und die trigonometrischen Funktionen
als Funktionen von
77
R nach R. Man sieht sofort an den Definitionen
cos(−x) = cos(x)
sin(−x) = − sin(x)
Satz 4.8 (Additionstheorem):
Für alle x, y aus
R gilt
sin(x + y) = sin(x) · cos(y) + cos(x) · sin(y)
cos(x + y) = cos(x) · cos(y) − sin(x) · sin(y)
Beweis: Wie bei exp(x + y) = exp(x) · exp(y) rechnet man dies einfach mittels Definition und
dem Produktsatz für Potenzreihen stur nach.
Indem man cos(x − y) über das Additionstheorem ausrechnet und x = y setzt folgt sofort:
Korollar 4.9:
cos(x)2 + sin(x)2 = 1
R
R R
D.h. die Abbildung x 7→ (cos(x), sin(x)) von nach × parametrisiert tatsächlich den Kreis
(es fehlt allerdings noch die Surjektivität auf S 1 , diese wird sich später ergeben).
Bemerkung: Die obigen, eigentlich verbotenen“ Überlegungen, kann man natürlich auch exakt
”
durchführen: Man betrachtet
komplexe Folgen, Konvergenz in
und komplexe Potenzreihen,
P∞
j
d.h. Reihen der Form j=0 aj · z wo aj und z aus sind. Dann ist auch die Exponentialreihe
P
j
für komplexe Argumente erklärt, und zwar wieder durch exp(z) = ∞
j=0 z /j!. Man hat ganz
analog zu den Hyperbelfunktionen
C
C
cos(x) = (eix + e−ix )/2
sin(x) = (eix − e−ix )/2i
und auch das Additionstheorem für Sinus und Cosinus folgt aus der Funktionalgleichung der Exponentialfunktion. Exakt durchgeführt ist dies z.B. im Buch von Forster — dieses Kapitel sollten
Sie durcharbeiten; alle Voraussetzungen dazu haben Sie bereits gelernt. Ein tieferes Verständnis
von Sinus und Cosinus wird erst über diesen Zugang ermöglicht. Für uns sind Sinus und Cosinus
als Potenzreihen erklärt worden. Dieser Definition sieht man allerdings in keiner Weise etwa an,
wo die Nullstellen von Sinus und Cosinus liegen oder gar, daß diese Funktionen periodisch sind.
Auch hat diese Definition zunächst nichts mit der üblichen Schuldefinition zu tun.
Die Funktionen tan und cot werden wie üblich als Quotienten von sin und cos definiert.
5
Stetige Funktionen
5.1
Einleitung, Definition, lokale Eigenschaften
Bei den elementaren Funktionen wie Polynomen, sin, cos, exp usw., so wie bei Funktionen, die
in den Naturwissenschaften auftreten, findet man oft folgendes Verhalten:
1. Ändert man das Argument nur wenig, so ändert sich auch am Funktionswert wenig.
2. Wenn wir uns einem Argument x0 beliebig nähern, etwa durch Durchlaufen einer konvergenten Folge mit Grenzwert x0 , so sollen die zugehörigen Funktionswerte sich dem Wert
f (x0 ) beliebig nähern, d.h. f (x0 ) soll nicht irgendwo anders liegen!
3. Man kann Γf ohne abzusetzen zeichnen.
f (x0 )
f (x0 )
x0
Abbildung 5.1: Die stetige Funktion f :
x0
R → R, f : x 7→ 4.599625 − (x − 4.25)2 /2
Diese zugrunde liegende Eigenschaft heißt Stetigkeit.
Wir halten fest:
• Durch die Stetigkeit einer Funktion f an der Stelle x0 sind die Funktionswerte f (x) für
nahe bei x0 gelegene Argumente x an den Wert f (x0 ) in gewisser Weise gebunden.
• Stetigkeit beschreibt ein gewisses Wohlverhalten“ von f (analog wie später Differenzier”
barkeit die Glattheit“ von f beschreibt), nämlich, daß die Funktionswerte irgendwie zu”
sammenhängen.
Physikalisch: Stetige Veränderungen oder Abläufe sind keinen abrupten, jähen Schwankungen
oder Sprüngen unterworfen. Erst bei stetigen Funktionen wird das Vorgehen in der Naturwissenschaft, das Verhalten einer Funktion durch Meßreihen zu ermitteln/approximieren überhaupt sinnvoll.
79
5.1 Einleitung, Definition, lokale Eigenschaften
b
b
b b b
b
b b b
b b
b b b
b




?
b
b



b
b
|
{z
Meßpunkte xi
Meßpunkte yi
}
Erst wenn man weiß, f ist stetig, kann man eine Kurve als Graphen Γf durch die yi legen (es
gibt keine Ausreißer“).
”
Beispiel (Dirichlet Funktion):
(
0 für x ∈
f (x) =
1 für x ∈
R−Q
Q
1
b
b
b
b
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
b
b
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
√
1 2 2
3π
4
Q
Eine Meßreihe ergibt bei x ∈ nur f (x) = 1. Das Argument, diese Funktion sei zu künstlich, ist
nicht stichhaltig, denn man kann f durch Grenzprozesse aus elementaren Funktionen gewinnen:
n
o
f (x) = lim
lim (cos(n! πx))2m
n→∞
m→∞
△
5.1.1
Definition der Stetigkeit mit Folgen
Wir nehmen 2 als erste Definition:
Definition 5.1:
R
R
D⊂ ,f :D→
Funktion, a ∈ D. f heißt stetig in a :⇔ Für jede konvergente Folge
(xn )n∈N mit xn ∈ D für alle n und lim xn = a gilt
n→∞
lim f (xn ) = f (a)
n→∞
oder kurz
f
lim xn = lim f (xn )
n→∞
n→∞
Bemerkung: Wichtig ist, daß man jede konvergente Folge mit den beiden Nebenbedingungen
zuläßt. Das ist zwar kompliziert, aber nur dies beschreibt genau das sich beliebig an a annähern“
”
auf der x-Achse (siehe z.B. die Dirichlet Funktion).
Definition 5.2:
f :D→
R heißt stetig :⇔ f ist für alle a ∈ D in a stetig.
80
5 Stetige Funktionen
Bemerkung: Stetigkeit ist eine sogenannte lokale“ Eigenschaft der Funktion f , nur das Verhal”
ten von f in der Nähe“ eines jeden Punktes spielt eine Rolle.
”
R R, f : x 7→ x2 ist überall stetig. Sei a ∈ R gegeben. Es sei eine beliebige Folge
R und n→∞
lim xn = a vorgegeben. Dann muß man zeigen: lim f (xn ) = f (a).
n→∞
Beispiel: f : →
(xn )n∈N mit xn ∈
Das ist hier ganz leicht: f (xn ) = x2n und aus dem Grenzwertsatz folgt: (xn )n∈N konvergiert gegen
a ⇒ (x2n )n∈N konvergent gegen a2 = f (a).
△
△
Beispiel (Dirichlet Funktion): Die Dirichlet Funktion (s.o.) ist nirgends stetig.
Beispiel: Sprungstelle: f (x) =
(
1 für x > 0
. f ist unstetig bei 0.
−1 für x ≤ 0
Es ist zu zeigen: Es gibt eine Folge (xn )n∈N mit xn ∈ D =
R und n→∞
lim xn = a (hier: a = 0), so
daß (f (xn ))n∈N nicht gegen f (a) (hier: f (a) = f (0) = −1) konvergiert.
Das heißt: Entweder konvergiert (f (xn ))n∈N überhaupt nicht, oder gegen eine Zahl b 6= f (a).
Beides kann man leicht finden, es gibt auch Folgen mit lim f (xn ) = f (a)!
(a)
(b)
(c)
1
n
x2n = n1 ,
xn = − n1
xn =
x2n+1 = − n1 , f (xn ) = (−1)n
lim f ( n1 ) = 1 6= f (0) = −1.
n→∞
lim f (xn ) existiert nicht.
△
n→∞
lim f (− n1 )
n→∞
= −1 = f (0)!
Beispiele:
2
f (x) =
1/x für x > 0
−1 für x ≤ 0
Sprung nach ∞“ bei x = 0.
”
f (x) =
(
1
−2
−1
b
x2 −1
x+1
1
für x 6= −1
für x = −1
f ist unstetig bei −1 ( Lücke“ mit falschem“
”
”
Funktionswert).
−2
b
2
1
2
−1
1
−1
−1
c
b
1
−2
81
5.1 Einleitung, Definition, lokale Eigenschaften
1
(
sin
f (x) =
0
lim f ( n1 )
n→∞
1
x
für x 6= 0
für x = 0
−2π
existiert nicht.
− 32 π
− π2
−π
π
2
π
3
2π
−1
f (x) =
∞
X
n=1
△
sin(nx)
sin x sin(2x) sin(3x)
=
+
+
+ ···
n
1
2
3
π
2
b
−π
b
− π2
π
2
3
2π
π
b
5
2π
2π
7
2π
3π
4π
− π2
(
0
f (x) =
1/q
R Q
Q gekürzt, q > 0
falls x ∈ −
falls x = p/q ∈
Diese Funktion — auch Popcorn-Funktion“ genannt — ist in Abbildung 5.2 zu sehen.
”
b
1.0
b
b
0.5
b
b
b
b
b
b
b
0.5
b
b
b
1.0
b
b
b
b
b
b
b
b
b
b b
b
bb
b
b b
b
bb
bb
b bb
bb
b bb
b
b
b
b
b
b
b
b
b
bb
b
b b b b
bb
bbb
b
b b b b
bb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b bbb bbb bbb bbbbbb bbbb bbb bb bb bbb bbbb bbbbbb bbb bbb bbb bbbb
b bbb bbb bb b bbbbbb bbbb bbb bb bb bbb b bbb bbbbbb b bb bbbbbbbbbbbbbb
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbbbbbbbbbbbbbbbbbbbbb
bbbbbbbbbbbb
bbbbbbb
b
b
b
b
b
b
bb
b
b
bb
b
b
bb
bb
b
b
bb
bb
b
b
bb
bb
b
bb
b
b
b
bb
bb
b
bb
b
b
bb
bb
b
b
bb
b
bb
bb
b
bb
b
b
b
bb
b
b
bb
bb
b
bb
bb
b
bb
b
b
bb
bb
b
b
bb
bb
b
bb
bb
b
bb
b
bb
bb
bbb
b
bbbbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
b
bbbbbb
b
b
bbbbbb
b
bbbbbb
b
b
bbbbbb
b
b
bbbbbb
b
b
bbbbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
b
b
b
b
bbbbbb
b
b
b
bbbbbb
b
bbbbbb
b
b
bbbbbb
b
b
b
bbbbbb
b
b
b
b
bbbbbb
bbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bb
bbb
bb
bb
bbbbbbbbbb
bbbbb
bb
bb
bbbbbb
bb bb
bb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbb
bbb
bb
bb
bbbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbb
bbbbb
bbb
bb
bbbbbbbb
bbbb
bbbb
bbbb
bbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bb
bb
bbb
bbbb
bbbb
bbbbbbbbb
bb
bbbb
bbbb
bb
bbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbb
bbbb
bbbb
bbbb
bb
bbbbbb
bbbb
bbbb
bbbbbbb
bbbb
bbbbb
bbbb
bbb
bbbb
bb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbbbb
bbbbb
bb
bbbb
bbbbbb
bbbbb
bbb
bbbb
bbbb
bb
bb
bbbbbbb
bbbb
bbbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbb
bbb
bbbbb
bbbb
bbbb
bbbbbbb
bbbbb
bbb
bbb
bbb
bbbb
bbb
bbbb
bbb
bbb
bbb
bbb
bbbbb
bbbbb
bb
bbb
bbb
bbbbb
bbbbb
bbbb
bbbb
bbbbb
bbb
bbbbbb
bb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbb
bbbb
bbbbb
bb
bbb
bbbbb
bbbbb
bbbb
bbb
bbb
bbb
bbb
bb
bbbbb
bbbb
bbbbb
bbbbb
bb
bbb
bbb
bbbbbb
bbbbb
bbbbb
bbbbb
bb
bbbbbbbb
bbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbbbb
bb
bbbbbb
bbb
bbb
bbbb
bbbb
bbb
bbbb
bbbbbbb
bbb
bbbb
bbb
bbbbb
bb
bbbbbb
bbbbbbbb
bbbb
bbbbb
bbbb
bbb
bbbb
bbb
bbbbbbbbb
bbbb
bbbbb
bbb
bb
bbbb
bbbbb
bbb
bbb
bbbbb
bbb
bbbbb
bbbb
bbbb
bbb
bbb
bbb
bbbbbb
bbb
bbbbbbb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
bbbbb
bb
bbb
bbbb
bbb
bbbbbb
bbbb
bbb
bbbbbbb
bbb
bbb
bbbbbb
bb
bbbbbb
bbb
bbbb
bbbb
bbbb
bbbb
bbb
bbbb
bbbbbbbbb
bbbbb
bbb
bbbb
bbbbb
bbbb
bbbbb
bbbbbbb
bbb
bbbbbb
bbbbb
bbbb
bbbbb
bbbb
bbbb
bbb
bbb
bbbbb
bbb
bbbbbb
bbb
bb
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
b
b
b
1.5
Abbildung 5.2: Die Popcorn“ Funktion auf [0, 2]
”
2.0
82
5.1.2
5 Stetige Funktionen
ε-δ-Definition der Stetigkeit
Bevor wir stetige Funktionen weiter untersuchen, besprechen wir noch die zweite Definition für
stetig, die aus 1. durch Präzisierung entsteht:
1. Ändert man x0 wenig, so ändert sich auch f (x0 ) wenig. Wenig ändern bedeutet |x − x0 | < δ
und |f (x) − f (x0 )| < ε. δ und ε sind Schwankungsbreiten, diese müssen irgendwie zusammenhängen. Wie bei Grenzwertdefinitionen stößt man auf das Problem: Erst δ klein, dann ε oder
umgekehrt.
Das Beispiel einer Sprungstelle zeigt uns: Man muß zuerst die Schwankungsbreite der Funktionswerte — gegeben durch ε — vorschreiben und dann dazu eine Schwankungsbreite für
die Argumente — gegeben durch δ — finden können, so daß gilt: |x − x0 | < δ, dann folgt
|f (x) − f (x0 )| < ε.
Definition 5.3 (ε-δ Definition der Stetigkeit):
R
R
Seien D ⊂ , f : D →
Funktion, x0 ∈ D gegeben. f ist stetig in x0 :⇔ Zu jedem
ε > 0 gibt es ein δ = δ(ε, x0 ) > 0, so daß gilt: |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε, kurz
^ _ ^
ε>0 δ>0 x∈D
|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε.
Diskussion: Es sind auch gerade die Erfordernisse der Praxis, die zu dieser logischen Reihenfolge
führen: Wollen wir etwa f (x0 ) (etwa für eine Funktion wie sin) wirklich berechnen, so können wir
das — wenn f (x0 ) nicht gerade rational ist — im Allgemeinen nur näherungsweise (durch einen
abgebrochener Dezimalbruch), d.h. wir haben von vorneherein eine Schwankungsbreite beim
Funktionswert. Gibt es dazu eine “passende“ Toleranzgrenze für die Argumente, so kann man
sicher sein, bei jeder noch so kleinen Toleranzgrenze doch stets genügend gute Näherungswerte
f (x1 ) berechnen zu können, wenn nur x1 genügend nahe bei x0 bleibt (→ praktische Bedeutung
des Begriffs).
Beispielrechnungen
Beispiel: f : [0, ∞) →
R, f : x 7→ √x mit [0, ∞) := {x ∈ R | x ≥ 0} (siehe Abbildung 5.3).
3
2
1
1
2
3
4
5
Abbildung 5.3: f : [0, ∞) →
6
7
8
R, f : x 7→ √x
9
83
5.1 Einleitung, Definition, lokale Eigenschaften
(a) Stetigkeitsnachweis bei a = 0: Sei ε > 0 vorgegeben. Ist |x − 0| < δ, so ist |f (x) − f (0)| =
√
| x| < ε, setze also δ = ε2 .
√
√
(b) a 6= 0, ε > 0 seien vorgegeben. Gesucht ist δ mit |x − a| < δ ⇒ | x − a| < ε.
√
√
√ .
Trick: Erweitern: x − a = √x−a
x+ a
√
Setze δ = aε. Dann gilt:
√
√
√
√
√
√ ≤ √ aε
√ ≤ √aε = ε, da
|x − a| < δ ⇒ | x − a| = √x−a
x > 0.
△
x+ a
a+ x
a
R
Beispiel: Stetigkeit von f mit f (x) = x2 mit ε-δ-Definition bei x0 ∈ : Zu einem
beliebig
vorgegebenen ε > 0 müssen wir ein δ > 0 finden, so daß gilt: |x − x0 | < δ ⇒ x2 − x20 < ε
Da man meist ein solches δ nicht auf Anhieb hinschreiben kann, versucht man aus der Ungleichung |f (x) − f (x0 )| < ε durch Umformung und Abschätzungen eine Bedingung für δ herauszudestillieren und es dann festzulegen.
x20 − ε < x2 < x20 + ε ist äquivalent zu x2 − x20 < ε.
√
Versuch mit δ = ε: |x − x0 | < δ ist äquivalent zu x0 − δ < x < x0 + δ, also folgt (solange
x − δ > 0): (x0 − δ)2 < x2 < (x0 + δ)2 ,d.h. x20 − 2δx0 + δ2 < x2 < x20 + 2δx0 + δ2 . Dies klappt
√
nur für x0 = 0, dann haben wir x2 − 0 < ε, wenn δ = ε und |x − 0| < δ.
Für x0 6= 0 müssen wir δ anders wählen — δ hängt auch von x0 ab!
Es sei x0 > 0 und |x − x0 | < δ. Dann ist x20 − x2 = |x0 − x| |x0 + x| ≤ δ |x0 + x|. Aber aus
|x − x0 | < δ, d.h. x0 − δ < x < x0 + δ folgt 2x0 − δ < x0 + x < 2x0 + δ, und da x0 > 0 folgt:
−2x0 − δ < x0 + x < 2x0 + δ, d.h. |x0 + x| < 2x0 + δ.
√
Zusammen: x20 − x2 ≤ δ |x0 + x| ≤ δ(2x0 + δ) = 2x0 δ + δ2 . Setzen wir jetzt δ < 2ε und δ < 2xε 0 ,
so gilt 2x0 δ + δ2 < ε. Also folgt: |x0 − x| < δ ⇒ x2 − x2 < ε.
△
0
Beispiel:
R Q
Q gekürzt, q > 0
f ist für x irrational stetig, für x ∈ Q unstetig, denn: Seien ξ ∈
/ Q, ε = n1 gegeben. Dann liegen
p
f (x) =
(
falls x ∈ −
falls x = p/q ∈
0
1/q
nur endlich viele Zahlen q mit q < n in (ξ − 1, ξ + 1). Es gibt also δ > 0 mit (ξ − δ, ξ + δ) ist frei
von solchen, d.h. es gibt nur pq ∈ (ξ − δ, ξ + δ) mit q > n, d.h. 1q < n1 = ε.
△
Beispiel: Zur Dirichlet Funktion
(
0 für x ∈
f (x) =
1 für x ∈
Behauptung: f ist an keiner Stelle a ∈
_ ^ _
R
ε>0 δ>0 x∈
R−Q
Q
R stetig. Zu zeigen ist:
|x − a| < δ ∧ |f (x) − f (a)| ≥ ε
Fallunterscheidung:
a ∈ : Setze ε = 1. δ und a = p/q seien vorgegeben. Gesucht ist x mit |x − p/q| < δ und
|f (x) − 1| ≥ 1. Für jedes δ > 0 gibt es eine irrationale Zahl x mit |x − p/q| < δ (Übung:
Widerspruchsbeweis), also gilt für dieses x: |x − p/q| < δ und |f (x) − 1| = |0 − 1| ≥ 1.
a∈
/ : ähnlich.
△
Q
Q
84
5 Stetige Funktionen
Satz 5.1:
Die beiden Definitionen für Stetigkeit sind äquivalent.
Beweis: f : D →
R sei gegeben, a ∈ D. Annahme: Es gelte die ε − δ-Definition, d.h.:
^ _ ^
ε>0 δ>0 x∈D
|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε
Herleitung der Stetigkeit nach der ersten Definition: Es sei eine konvergente Folge (xm )n∈N aus
D mit lim xn = a vorgegeben. Zu zeigen ist lim f (xn ) = f (a), d.h.
^ _ ^
ε>0 Nε n≥Nε
|f (xn ) − f (a)| < ε
Sei ε > 0 vorgegeben, dann gibt es nach Voraussetzung ein δε mit: |x − a| < δ ⇒ |f (x) − f (a)| <
ε. Zu diesem δε gibt es ein Nε mit |xn − a| < δ, sobald n ≥ Nε , (da lim xn = a). Für n > Nε gilt
dann: |f (xn ) − f (a)| < ε.
Umgekehrt: Indirekter Beweis, wir zeigen:
_ ^ _
|x − a| < δ ∧ |f (x) − f (a)| ≥ ε ⇒ f nicht stetig bei a nach Folgendefinition
ε>0 δ>0 x∈D
Wir nehmen das existierende ε > 0. Zu jedem δ > 0, also auch zu δ = n1 gibt es ein x —
das wir xn nennen — mit |xn − a| < n1 und |f (xn ) − f (a)| ≥ ε. Dies definiert eine Folge in D
mit lim xn = a. Die Bildfolge (f (xn ))n∈N kann aber nicht gegen f (a) konvergieren, da zu dem
n→∞
festen ε > 0 gilt: |f (xn ) − f (a)| ≥ ε.
5.2
Eigenschaften stetiger Funktionen
Satz 5.2:
R
R R
Die Funktionen f : D → , g : → seien in a ∈ D stetig. Dann sind auch f + g, f − g,
f · g, λ · g (λ ∈ ) und falls g(x) 6= 0 in D auch f /g stetig in a.
R
Beweis: Es sei eine konvergente Folge (xn )n∈N aus D mit lim xn = a vorgegeben. Der Hauptsatz
über konvergente Folgen zeigt dann: lim (f (xn ) + g(xn )) existiert und ist gleich lim f (xn ) +
n→∞
lim g(xn ) = f (a) + g(a) = (f + g)(a). Gleiches gilt für −, ·, λ· und /.
R
R
Bemerkung: Die Identität id : D → , id(x) = x und die konstante Funktion c : D → ,
c(x) = c sind trivialerweise stetig. Durch Produkte und Linearkombinationen erhält man hieraus
die Polynome.
Korollar 5.3:
1. Jede Polynomfunktion x 7→ a0 + a1 x + · · · + an xn mit ai ∈
2. Jede rationale Funktion f /g : D →
D, ist stetig.
R ist auf ganz R stetig.
R, wo f und g Polynome sind und g(x) 6= 0 auf
85
5.2 Eigenschaften stetiger Funktionen
Satz 5.4:
Seien f : D1 → D2 stetig bei a und g : D2 →
R stetig bei f (a), dann ist g ◦ f stetig bei a.
Beweis: Sei (xn )n∈N aus D1 mit lim xn = a vorgegeben. f ist stetig bei a ⇒ lim f (xn ) = f (a).
yn = f (xn ) definiert eine Folge in D2 mit lim yn = f (a). g ist stetig bei f (a) ⇒ lim g(yn ) =
g(f (a)), d.h. lim(g ◦ f )(xn ) = (g ◦ f )(a).
Übung: f , g stetig ⇒ max(f, g), min(f, g), |f | stetig.
Bemerkung: Wir haben gesehen:
Durch die Stetigkeit einer Funktion f bei x0 sind die Funktionswerte f (x) für x nahe bei x0
in gewisser Weise an den Wert f (x0 ) gebunden. Dies wird nocheinmal durch folgenden Satz
besonders prägnant hervorgehoben:
Satz 5.5:
Sei f : D → stetig an der Stelle x0 ∈ D und f (x0 ) > 0. Dann gibt es ein δ > 0, so daß
f noch auf (x0 − δ, x0 + δ) ∩ D positiv ist (d.h. x ∈ D und |x − x0 | < δ ⇒ f (x) > 0).
R
Beweis: Wähle ε = f (x0 ). Da f bei x0 stetig ist, gibt es zu diesem ε ein δ > 0 mit
|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε = f (x0 ).
Die Ungleichung |f (x) − f (x0 )| < f (x0 ) ist äquivalent zu: 0 = f (x0 ) − f (x0 ) < f (x) < f (x0 ) +
f (x0 ), d.h. f (x) > 0. Eine entsprechende Eigenschaft läßt sich mit < 0 beweisen.
Polynome sind überall stetig, wie sieht es bei Potenzreihen aus?
Satz 5.6:
P
i
Es sei f (x) = ∞
R) absolut konvergente Potenzreihe. Dann
i=0 ai x eine im Intervall (−R,P
i
ist die Funktion f : (−R, R) → mit f (x) = ∞
i=0 ai x stetig.
R
Zum Beweis verwenden
Korollar:
P∞ wiri das schon
P∞ bewiesene
i−1
Die Potenzreihen i=0 ai x und i=1 iai x
haben den gleichen Konvergenzradius.
Beweis: Es sei a ∈ (−R, R). Wähle r mit |a| < r < R und betrachte f (x) − f (y) mit |x| , |y| ≤ r:
X
X
X
f (x) − f (y) =
ai xi −
ai y i =
ai (xi − y i )
X
=
ai (x − y)(xi−1 + xi−2 y + · · · + xy i−2 + y i−1 )
Die Summen xi−1 + xi−2 y + · · · + xy i−2 + y i−1 schätzen wir ab durch
i i
i
i−1
X
i−k k−1 X i−k k−1 X i−k k−1
x
+ xi−2 y + · · · + y i−1 ≤
|x|
|y|
≤
r r
= ir i−1 .
x y
=
k=1
k=1
k=1
P
Nach dem oben erwähnten
ist die Reihe
|ai | ir i−1 konvergent, also eine konvergente
P Korollar
i−1
i−1
Majorante für die Reihe
ai (x
+ · · · + y ). Damit folgt:
X
i−1
i−1 |f (x) − f (y)| = (x − y)
ai (x
+ · · · + y )
X
i−1
i−1 = |x − y| · ai (x
+ · · · + y )
X
≤ M := |x − y| ·
|ai | ir i−1
Also |f (x) − f (a)| ≤ |x − a| · M , solange |x| , |a| ≤ r. Sei ε > 0 vorgegeben, wähle δ = ε/M ,
ε
dann folgt sofort |x − a| < ε/M ⇒ |f (x) − f (a)| < M
M = ε.
86
5 Stetige Funktionen
Lemma 5.7 (Lipschitzstetig):
R
Gilt für die Funktion f : D → die Ungleichung |f (x) − f (y)| ≤ L |x − y| für alle x, y ∈ D
und eine Konstante L > 0, so ist f auf D stetig (Lipschitzstetig).
Beweis: Zu ε > 0 vorgegeben wähle δ < ε/L. Dann gilt: |x − y| < δ ⇒ |f (x) − f (y)| ≤
L |x − y| < L · δ < ε.
Also: auf [−r, r] ⊂ (−R, R) ist die Potenzreihe f sogar Lipschitzstetig.
Bemerkung: Auf [−r, r] hängt das zu ε > 0 zu wählende δ (hier δ = ε/M ) nicht von a ab. Solche
Funktionen heißen gleichmäßig stetig.
R
Eine Funktion f : D → ist nur vollständig definiert, wenn man ihren Definitionsbereich D mit
angibt. Erst dann kann man von Stetigkeit usw. reden. Ist nun D1 ⊂ D, so ist die Einschränkung
von f auf D1 erklärt: f|D1 : D1 → , mit f|D1 (x) = f (x), für x ∈ D1 . Manchmal läßt man das
|D1 auch weg. Bei Stetigkeit ist das nicht weiter schlimm:
R
Satz 5.8:
f|D1 : D1 →
auch f|D1 .
R sei die Einschränkung von f : D → R und a ∈ D1. Ist f bei a stetig, so
Beweis: Jede konvergente Folge (xn )n∈N mit lim xn = a aus D1 ist auch eine solche in D. Also
n→∞
folgt aus der Stetigkeit von f : lim f (xn ) = f (a) und daher lim f|D1 (xn ) = f|D1 (a).
n→∞
n→∞
Bemerkung: Die Umkehrung ist im Allgemeinen falsch: Jede Funktion f ist auf D = {a} stetig,
da es in D nur die konstante Folge mit xn = a gibt. Damit die Umkehrung richtig wird, braucht
man ein kleines offenes Intervall um a, genauer:
Satz 5.9:
R
Für ein µ > 0 gelte: (a − µ, a + µ) ∩ D ⊂ D1 . Dann gilt: f : D → ist genau dann bei a
stetig, wenn f|D1 bei a stetig ist.
(Dies ist die Präzisierung der Aussage: Stetigkeit ist eine lokale Eigenschaft.)
Beweis: ⇒“ erledigt.
”
⇐“ Es sei (xn )n∈N eine Folge aus D mit Grenzwert a. Zu µ gibt es nµ mit n ≥ nµ ⇒ |xn − a| <
”
µ, d.h. xn ∈ (a − µ, a + µ). Also ab dem Index nµ ist (xn ) eine Folge in (a − µ, a + µ) ∩ D ⊂ D1 .
Da f|D1 bei a stetig ist, gilt: lim f|D1 (xn ) = f|D1 (a), (n > nµ ) also auch lim f (xn ) = f (a). n→∞
n→∞
Übung (Zusammensetzen stetiger Funktionen): Gegeben seien Funktionen f1 und f2 mit
f1 : [a, b] → und f2 : [b, c] → stetig und f1 (b) = f2 (b). Definiere f : [a, c] → durch
R
R
(
f1 (x)
f (x) =
f2 (x)
Behauptung: f ist stetig auf [a, c].
R
für x ∈ [a, b]
für x ∈ [b, c]
87
5.3 Grenzwerte von Funktionen
5.3
Grenzwerte von Funktionen
R
R
Gegeben seien D ⊂
und a ∈ , wobei a nicht unbedingt in D liegt. Wie könnte man
präzisieren, daß wir uns mit x auf D der Zahl a beliebig nähern (x → a)?
Ist D = {an | lim an = a} so ist dies kein Problem: Man geht von an nach an+1 über. Will man
dies diskrete Springen kontinuierlich machen, so bietet sich an: Wir durchlaufen alle konvergenten
Folgen (xn )n∈N mit lim xn = a. Dies geht nicht einfacher, da es in
zu einem c ∈ nicht wie
in
den nächst grösseren Wert gibt.
R
N
R
Es gibt hierbei jedoch noch eine kleine Falle: Es kann passieren, daß es in D gar keine konvergente
Folge (xn )n∈N mit lim xn = a gibt:
Beispiel:
a) D = [0, 1]
a = 2 keine Folge
b) D = [0, 1)
a = 1 hier gibt es genügend Folgen
Im Fall a) heißt 2 ein isolierter Punkt von D und im Fall b) ein Häufungspunkt.
Definition 5.4:
R
△
R
Gegeben sei eine Teilmenge D ⊂ der reellen Zahlen und ein Punkt a ∈ , der nicht zu
D gehören muß. a heißt Häufungspunkt von D :⇔ Für jedes ε > 0 gibt es in (a−ε, a+ε)
Punkte aus D − {a}.
Ist a kein Häufungspunkt, so nennt man a einen isolierten Punkt..
Klar: Ist a Häufungspunkt von D, dann gibt es eine Folge (xn )n∈N mit xn ∈ D, xn 6= a und
lim xn = a (nehme ε = n1 und xn ∈ (a − ε, a + ε) ∩ (D − {a})).
Beachte den Unterschied zwischen einem Häufungswert einer Folge und einem Häufungspunkt
der Menge {an }. Nach dieser Vorbereitung können wir definieren:
Definition 5.5:
R
R
Gegeben seien eine Teilmenge D ⊂ , ein Häufungspunkt a ∈
von D, eine Funktion
f : D → und ein A ∈ . Es gilt genau dann lim f (x) = A, wenn für jede Folge (xn )n∈N
R
R
x→a
mit xn ∈ D − {a} und lim xn = a die Folge f (xn ) konvergiert und A als Grenzwert hat.
n→∞
Bemerkung:
1. Ist a kein Häufungspunkt von D — gibt es also keine konvergente Folge (xn )n∈N mit
xn ∈ D − {a} und lim xn = a so gilt lim f (xn ) = C für jedes C! Damit dieser Unsinn“
”
n→∞
nicht passiert setzt man besser voraus, daß a ein Häufungspunkt ist.
2. a braucht nicht in D zu liegen. Falls a ∈ D gilt wird a herausgenommen. Dadurch erreicht
man, daß lim f (x) von f (a) verschieden sein kann:
x→a
Beispiel: f (x) =
(
ln(1 + |x|) für x 6= 0
. Es gilt f (0) = 1 aber auch lim f (x) = 0.
x→0
1
für x = 0
88
5 Stetige Funktionen
1
b
c
b
−4
−3
−2
−1
1
2
3
4
Abbildung 5.4: Beispiel einer Funktion mit lim f (x) 6= f (a).
x→a
Hätte man den Punkt a hier nicht herausgenommen, so hätte man auch die konstante
Folge (xn )n∈N = (a)n∈N berücksichtigen müssen, mit der Konsequenz, daß der Grenzwert
nicht existieren würde.
△
R
3. Obwohl ∞ keine Zahl, d.h. kein Element in
ist, sondern nur ein Symbol, führt man
üblicherweise die Bezeichnung lim f (x) ein (falls D nicht nach oben beschränkt ist)
x→∞
Definition 5.6:
lim f (x) = A :⇔ Für all Folgen (xn )n∈N in D, die unbeschränkt wachsen (d.h. (1/xn )n∈N
V
W V
ist Nullfolge (xn 6= 0) oder M >0 N n>N xn ≥ M ) gilt lim f (xn ) = A.
x→∞
n→∞
Beispiel: f :
R → (0, 1], f : x 7→ 1/(1 + x2 ). x→∞
lim f (x) = 0, denn 1/(1 + x2 ) = ( x1 )/(1 + x1 ).
2
Durchläuft nun xn eine unbeschränkte Folge, so ist 1/xn eine Nullfolge, d.h.
gegen 0. Damit konvergiert auch der ganze Term gegen 0.
1/x2n
2
konvergiert
1
−4
−3
−2
−1
Abbildung 5.5: Der Funktionsgraph zu f :
1
2
3
4
R → (0, 1], f : x 7→ 1/(1 + x2 )
△
Bei der Definition von lim f (x) = A ist folgende Forderung hinreichend: Für alle Folgen (xn )n∈N
x→a
aus D − {a} mit lim xn = a existiert lim f (xn ). Diese Grenzwerte sind dann notwendigerweise
n→∞
n→∞
gleich, wie man sofort durch das Mischen zweier Folgen einsieht.
Beispiele:
R
1. f (x) = (x2 − 1)/(x − 1) auf D =
− {1}. 1 ist Häufungspunkt von D. Behauptung:
lim f (x) = 2. Beweis: Gegeben sei eine beliebige Folge (xn )n∈N aus D−{1} = D = −{1}
x→1
R
mit lim xn = 1. Dann ist (x2n − 1)/(xn − 1) = ((xn − 1)(xn + 1))/(xn − 1). xn ist aus
n→∞
D und 1 ∈
/ D, d.h. xn 6= 1. Deswegen darf man kürzen und erhält: xn + 1. Also gilt:
lim f (xn ) = lim (xn + 1) = 2.
n→∞
n→∞
89
5.3 Grenzwerte von Funktionen
4
3
c
b
2
1
−3
−2
−1
−1
1
2
3
−2
Abbildung 5.6: Der Funktionsgraph von f : D →
2. f : (0, ∞) →
R, f : x 7→ (x2 − 1)/(x − 1) mit D = R − {1}.
R mit f : x 7→ √x + 4. 0 ist Häufungspunkt von (0, ∞).
Behauptung: lim f (x) = 2.
x→0
Beweis:
√
√
√
( 4 + x − 2)( 4 + x + 2) 4 + x − 4 = √ |x|
√
|f (x) − 2| = 4 + x − 2 = = √
( 4 + x + 2)
4 + x + 2 4 + x + 2
√
Für x ∈ (0, ∞) ist 4 + x + 2 > 2. Also gilt 0 ≤ |f (x) − 2| ≤ |x|
2 . Konvergiert jetzt eine
beliebige Folge (xn )n∈N mit xn 6= 0 gegen 0, so folgt nach dem Einschließungssatz aus
dieser Ungleichung,
lim f (xn ) = 2 und
√ daß |f (xn ) − 2| gegen 0 konvergiert, d.h. es gilt n→∞
damit auch lim x + 4 = 2.
x→0
xn
3. exp(x) wächst schneller“ als jedes Monom xn , d.h. lim
= 0.
”
x→∞ exp(x)
Beweis: Für x > 0 gilt
exp(x) =
∞
X
xk
k=0
k!
xn+1
(n + 1)!
≥
also
Wächst die Folge (xm )m∈N unbeschränkt, so ist
mit festem n auch (n+1)!
.
xm
N
m∈
xn
≤
exp(x)
1
xm m∈
N
xn
xn+1
(n+1)!
=
(n + 1)!
x
(xm 6= 0) eine Nullfolge, also
Die Verbindung zur Stetigkeit von Funktionen ist nur eine Umformulierung:
Satz 5.10:
f :D→
R Funktion, a ∈ D Häufungspunkt von D. f stetig in a ⇔ x→a
lim f (x) = f (a)
Beweis: Die Folgendefinition der Stetigkeit und die Definition von lim f (x) = f (a) einsetzen. x→a
90
5 Stetige Funktionen
Bemerkung: Ist a ∈ D isolierter Punkt von D, so ist f dort automatisch stetig (nur konstante
Folge möglich). Stetigkeit hilft of Grenzwerte auszurechnen:
Muster: f stetig bei a: lim f (x) = f (a).
x→a
Beispiel: f (x) =
sin x
x .
sin x =
∞
X
(−1)k
k=0
x3 x5 x7
x2k+1
=x−
+
−
+ ···
(2k + 1)!
3!
5!
7!
Für x 6= 0 ist dann
∞
∞
k=0
k=0
X
sin x
1X
x2k+1
x2k
x2 x4 x6
=
(−1)k
=
(−1)k
=1−
+
−
+ ···
x
x
(2k + 1)!
(2k + 1)!
3!
5!
7!
Betrachte die Potenzreihe g(x) =
P∞
k x2k
k=0 (−1) (2k+1)! .
Aus dem Quotientenkriterium folgt, daß g
für alle x konvergiert. Nach Satz 5.6 ist g(x) stetig bei 0 und für x 6= 0 gilt g(x) =
gilt lim sinx x = lim g(x) = g(0) = 1.
x→0
sin x
x .
x→0
Also
△
1
−7
−6
−5
−4
−3
−2
−1
−1
1
2
Abbildung 5.7: Die Funktionsgraphen von
3
sin x
x
4
5
6
7
und sin x.
Satz 5.11:
lim
x→0
Aus lim
x→0
sin x
x
sin x
=1
x
erhält man leicht die Grenzwerte von
cos x−1 sin2 x tan x sin ax 1
, x , x , x ,x
x
− tan1 x für x → 0.
Wie bei der Stetigkeit hat man auch für lim f (x) = A eine ε-δ Definition:
x→a
Satz 5.12:
R
R
Gegeben sei die Funktion f : D → und a ∈ Häufungspunkt von D. Dann gilt:
^ _
^
lim f (x) = A ⇔
|x − a| < δ ⇒ |f (x) − A| < ε
x→a
ε>0 δ>0 x∈D−{a}
Beweis: Genau wie bei Satz 5.10.
Bemerkung: Die Grenzwertsätze für Folgen (H.S.) ergeben leicht entsprechende Sätze für
lim f (x). Z.B. gilt lim f (x) = A und lim g(x) = B so ist lim (f (x) + g(x)) = A + B
x→a
x→a
x→a
x→a
91
5.3 Grenzwerte von Funktionen
5.3.1
Rechts- und Linksseitige Grenzwerte
R
f : D → gegeben, a ∈
a (bzw. D a ).
von D−
+
R Setze D−a = D∩(−∞, a) und D+a = D∩(a, +∞). a sei Häufungspunkt
Definition 5.7:
Der Grenzwert lim − f (x) = A :⇔ lim f|Da = A heißt linksseitiger Grenzwert.
x→a
x→a
−
Entsprechend: lim + f (x) (rechtsseitiger Grenzwert)
x→a
Übung: f : D →
R gegeben a sei Häufungspunkt von D−a und D+a
lim f (x) = A
x→a
⇔
lim f (x) = A und
x→a−
lim f (x) = A
x→a+
genauso mit Stetigkeit.
Definition 5.8:
c heißt Sprungstelle von f :⇔ lim − f (x) und lim + f (x) existieren und sind verschieden.
x→c
x→c
Anwendung auf monotone Funktionen:
Satz 5.13:
Es sei f : [a, b] →
R eine monotone Funktion. Dann existieren x→a
lim
+
f (x), lim − f (x) und
x→b
zu c ∈ (a, b) existieren lim − f (x) und lim + f (x).
x→c
x→c
Beweis: f sei monoton steigend und a < c ≤ b. Setze A = sup{f (x) | x ∈ [a, c)}. Zu jedem ε > 0
gibt es nach Definition von sup ein x0 aus [a, c) mit A − ε ≤ f (x0 ) ≤ A. Da f monoton wächst,
gilt dies für alle x ∈ [x0 , c). Setze δ = c − x0 . Dann besagt |x − c| < δ gerade daß x ∈ [x0 , c),
denn x ∈ [a, b] ∩ (−∞, c) = [a, c). Also gilt |f (x) − A| < ε d.h. lim − f (x) = A.
x→c
Analog für lim + f (x) mit c ∈ [a, b) und für monoton fallend.
x→c
Aus g stetig in c ⇔ lim + g(x) = lim − g(x) = g(c) und obigem Resultat folgt
x→c
x→c
Satz 5.14:
Eine monotone Funktion f : [a, b] →
ist genau dann stetig, wenn die Grenzwerte
lim − f (x) und lim + f (x) für alle c ∈ (a, b) übereinstimmen und an den Randpunkten
R
x→c
x→c
lim f (x) = f (a) und lim − f (x) = f (b) gilt.
x→a+
x→b
Korollar 5.15:
Eine monotone Funktion kann nur Sprungstellen als Unstetigkeitsstellen haben.
Korollar 5.16:
Eine auf [a, b] monotone Funktion besitzt höchstens abzählbar viele Unstetigkeitsstellen
Beweis: f sei monoton steigend und U = Menge der Unstetigkeitsstellen in (a, b). Nach dem
letzten Korollar ist U = {c ∈ (a, b) | limx→c− f (x) < limx→c+ f (x)}. Zu jedem c ∈ U können wir
eine rationale Zahl r(c) ∈ finden mit
Q
Q
lim f (x) < r(c) < lim + f (x)
x→c−
x→c
Diese Abbildung r : U → ist offenbar injektiv, da f monoton steigend. Also kann U höchstens
abzählbar sein, denn die rationalen Zahlen sind abzählbar. Analog für monoton fallend.
92
5 Stetige Funktionen
5.4
Globale Eigenschaften stetiger Funktionen
Globale Eigenschaften sind solche, die nicht für eine Stelle, sondern nur für f als Ganzes formuauf ganz D stetig (d.h. für alle x0 ∈ D) dann hat dies
liert sind. Ist eine Funktion f : D →
oft Konsequenzen für das globale Verhalten von f . Im folgenden sei stets a < b für a, b ∈ .
R
R
Satz 5.17:
f : [a, b] → sei stetig, dann ist f beschränkt auf [a, b], d.h. es gibt ein K mit |f (x)| < K
für alle x ∈ [a, b]
R
6
K
b
5
Γf
4
[
a
]
b
Γf
f : (0, 5) → (1/5, ∞)
f : x 7→ 1/x
3
b
2
1
c
b
−K
1
2
3
4
5
Bemerkung:
1. Wie das Beispiel f (x) = x1 und D = (0, 5) zeigt ist dieser Satz für andere Definitionsbereiche nicht immer richtig.
2. Man mache sich klar, daß die Beschränktheit von f auf D eine globale Eigenschaft ist.
Beweis: Widerspruchsbeweis: Angenommen f sei nicht beschränkt, etwa nach oben. Dann gibt
es zu jedem n ∈ ein xn ∈ [a, b] mit f (xn ) ≥ n (sonst wäre n eine Schranke). Die so definierte
Folge (xn )n∈N ist beschränkt, denn es gilt ja xn ∈ [a, b], d.h. a ≤ xn ≤ b für alle n. Nach dem
Satz von Bolzano-Weierstraß besitzt sie eine konvergente Teilfolge (xnk )k∈N mit limk→∞ xnk = c.
Wegen a ≤ xn ≤ b gilt auch a ≤ c = limk→∞ xnk ≤ b (Hier geht die Abgeschlossenheit des
Definitionsbereichs ein). Da f stetig ist, folgt lim f (xnk ) = f (c). Andererseits ist f (xnk ) ≥ nk
N
k→∞
und (nk )k∈N ist eine unbeschränkt wachsende Folge, damit kann (f (xnk ))k∈N nicht konvergieren.
Dies ist ein Widerspruch!
Frage: Wo geht der Beweis bei D = (a, b) schief?
Wir haben bewiesen: Ist f : [a, b] → stetig, dann ist f ([a, b]) = Bild f = {f (x) | x ∈ [a, b]} eine
beschränkte Teilmenge von . Nach dem Vollständigkeitsaxiom besitzt diese Teilmenge von
ein Supremum und ein Infimum:
R
R
s := sup{f (x) | x ∈ [a, b]}
Kommen s und i als Funktionswerte vor?
R
i := inf{f (x) | x ∈ [a, b]}
93
5.4 Globale Eigenschaften stetiger Funktionen
Satz 5.18:
R
f : [a, b] →
sei stetig. Dann gibt es x0 und x1 ∈ [a, b] mit f (x0 ) = sup f ([a, b]) und
f (x1 ) = inf f ([a, b]).
R stetig ⇒ f besitzt ein Maximum und ein Minimum.
Beweis: s := sup(Bild(f )) ist die kleinste obere Schranke von Bild(f ) und deshalb ist für n ∈ N
Mit anderen Worten: f : [a, b] →
s − 1/n keine obere Schranke mehr. Es gibt also yn ∈ Bild(f ) mit s − 1/n < yn ≤ s. Da yn ∈
Bild(f ) können wir ein Urbild xn ∈ [a, b] wählen: f (xn ) = yn . Die so erhaltene Folge (xn )n∈N liegt
in [a, b], ist also beschränkt und wie oben können wir folgern: Es gibt eine konvergente Teilfolge
(xnk )k∈N mit c := lim xnk (c ∈ [a, b]). f stetig impliziert lim f (xnk ) = f (c). Andererseits gilt
k→∞
k→∞
nach Konstruktion s − 1/nk < f (xnk ) ≤ s also |f (xnk ) − s| ≤ 1/nk , woraus lim f (xnk ) = s
k→∞
folgt. Also s = lim f (xnk ) = f (c) liegt im Bild von f . Genauso für i := inf(Bild(f )).
k→∞
Bemerkung:
1. Für nicht abgeschlossene Intervalle als Definition-Bereich ist der Satz im Allgemeinen
falsch. Beispiel: f (x) = x auf D = (0, 1). sup(Bild(f )) = 1 ∈
/ Bild(f ).
2. Ist f nicht stetig, so ist der Satz im Allgemeinen falsch.
5.4.1
Der Zwischenwertsatz
Das Intervall I = [a, b] hat keine Lücke, jeder Punkt zwischen a und b liegt in ihm. Dies hat
etwas mit der Eigenschaft, daß man I ohne abzusetzen zeichnen kann, zu tun: Man sagt: I ist
zusammenhängend (genaue Definition später). Die Stetigkeit einer Funktion f hat anschaulich
ebenfalls etwas mit dieser Eigenschaft zu tun: Man kann Γf ohne abzusetzen“ zeichnen, Γf hat
”
keine Lücke. Falls Γf keine Lücke hat, dann trifft dies auch für Bild(f ) zu. Wir sagen:
Definition 5.9:
R
Eine Funktion f : [a, b] →
hat die Zwischenwerteigenschaft, wenn jeder Wert zwischen f (a) und f (b) als Funktionswert angenommen wird.
γ = f (c)
b
b
a
c
b
b
γ
b
b
c
b
a
c
b
b
Abbildung 5.8: Die Funktionsgraphen einer Funktion mit der Zwischenwerteigenschaft (links)
und einer Funktion ohne Zwischenwerteigenschaft (recht)
Bemerkung: c liegt zwischen x0 und x1 ist Abkürzung für:
1. c = x1 falls x0 = x1
94
5 Stetige Funktionen
2. c ∈ [x0 , x1 ] falls x0 < x1
3. c ∈ [x1 , x0 ] falls x0 > x1
Den Zusammenhang zwischen Stetigkeit und Zwischenwerteigenschaft liefert folgender Satz:
Satz 5.19 (Zwischenwertsatz):
f : [a, b] → sei stetig. Dann wird jedes γ zwischen f (a) und f (b) als Wert angenommen.
D.h. es gibt ein c ∈ [a, b] mit f (c) = γ.
R
Wir beweisen zuerst den Sonderfall (Nullstellensatz).
Satz 5.20 (Nullstellensatz):
f : [a, b] → sei stetig mit f (a) < 0 und f (b) > 0. Dann gibt es eine Nullstelle c ∈ [a, b]
von f , d.h. es gibt ein c ∈ [a, b] mit f (c) = 0.
R
Der Nullstellensatz ist anschaulich so evident,
daß selbst Gauß noch keinen Beweis für nötig
hielt. Der erste Beweis stammt von Bolzano
(1817).
a c
b
Abbildung 5.9: Skizze zum Nullstellensatz
Beweis (Nullstellensatz): Wir suchen uns eine Nullstelle durch Intervallschachtelung. Dazu setze
x1 = a und y1 = b. Betrachte z1 = (a + b)/2 = (x1 + y1 )/2. Gilt nun
f (z1 ) = 0
f (z1 ) > 0
f (z1 ) < 0
dann sind wir fertig.
dann setzen wir x2 = x1 und y2 = z1 .
dann setzen wir x2 = z1 und y2 = y1 .
Wir haben nun entweder eine Nullstelle gefunden, oder auf dem neuen Intervall [x2 , y2 ] gelten
wieder die Voraussetzungen des Satzes (f (x2 ) < 0 und f (y2 ) > 0), aber die Länge des Intervalls
wurde halbiert. Wir wiederholen das Verfahren und erhalten zwei Folgen (xn )n∈N und (yn )n∈N
mit
1. f (xn ) < 0 und f (yn ) > 0 (oder wir haben abgebrochen, da wir eine Nullstelle getroffen
haben).
2. (xn )n∈N ist monoton steigend, (yn )n∈N ist monoton fallend und beide sind beschränkt.
3. |xn − yn | = |xn−1 − yn−1 | /2 = · · · = |b − a| /2(n−1) liefert eine Nullfolge.
Aus Beschränktheit und Monotonie folgt: Beide Folgen konvergieren und wegen 3. besitzen sie
den gleichen Grenzwert c := lim xn = lim yn . Aus der Stetigkeit von f folgt:
lim f (xn ) = f (c) = lim f (yn )
n→∞
V
V
Aber n f (xn ) < 0 impliziert lim f (xn ) ≤ 0 und n f (yn ) > 0 impliziert lim f (yn ) ≥ 0, also
n→∞
n→∞
f (c) = 0.
n→∞
95
5.4 Globale Eigenschaften stetiger Funktionen
Beweis (Zwischenwertsatz): Der Fall f (a) = f (b) ist trivial. Für f (a) < f (b) wende man den
Nullstellensatz auf die Hilfsfunktion g(x) = f (x) − γ an. f (a) < γ < f (b) ergibt g(a) < 0 und
g(b) > 0. Also gibt es c ∈ [a, b] mit g(c) = 0, d.h. f (c) − γ = 0 oder f (c) = γ Für f (a) > f (b)
ist der Beweis analog.
Korollar 5.21:
R
f : [a, b] →
sei stetig, m := min{f (x) | x ∈ [a, b]} und M := max{f (x) | x ∈ [a, b]}.
Dann gilt Bild(f ) = {f (x) | x ∈ [a, b]} = [m, M ], insbesondere ist Bild(f ) ein Intervall.
Beweis: Nach Satz 5.18 existieren m und M und sind im Bild von f . Es sei m = f (x0 ) und
M = f (x1 ). t sei zwischen m und M . Dann gibt es nach dem Zwischenwertsatz ein c ∈ [x0 , x1 ]
mit f (c) = t.
γ
b
a
b
b
c
b
x0
c
x1
b
Abbildung 5.10: Beispiel einer unstetigen Funktion mit Zwischenwerteigenschaft
Abbildung 5.10 zeigt, daß man von der Zwischenwerteigenschaft nicht auf Stetigkeit schließen
kann. Eine Verbesserung liefert folgende Idee: Für f die Zwischenwerteigenschaft für alle Teilintervalle [x0 , x1 ] ⊂ [a, b] fordern. Das Beispiel wird damit ausgeschlossen. Trotzdem gilt: Die
Zischenwerteigenschaft für alle Teilintervalle impliziert nicht Stetigkeit (aber fast). Problem:
Gegeben f : [a, b] → und f habe für alle Teilintervalle [x0 , x1 ] ⊂ [a, b] die Zwischenwerteigenschaft. Ist f dann stetig? Antwort: Nein. Gegenbeispiel als Übung.
R
Setze f (x) = sin(1/x) für x 6= 0 und f (0) = 0 auf [−1, +1]. Ist f stetig auf [−1, +1]?
Hat f die Zwischenwerteigenschaft für alle [x0 , x1 ] ⊂ [−1, +1]?
Die Zwischenwerteigenschaft ist aber nahe an der Stetigkeitseigenschaft (Übung: Barner-Flohr
Seite 238): f : [a, b] →
sei beschränkt und habe für alle Teilintervalle [x0 , x1 ] ⊂ [a, b] die
Zwischenwerteigenschaft. Wenn zusätzlich jeder Wert von f nur endlich viele Urbilder hat, so
folgt: f ist stetig.
R
Später: Ableitungen differenzierbarer Funktionen sind nicht immer stetig, haben aber die Zwischenwerteigenschaft.
Anwendungen des Zwischenwertsatzes
Satz 5.22 (Existenz von Nullstellen):
Es sei f (x) = a0 + a1 x + · · · + an xn ein reelles Polynom ungeraden Grades. Dann hat f
eine Nullstelle in .
R
96
5 Stetige Funktionen
2
4
1
3
2
−2
−1
1
−1
2
Γg
1
Γf
−2
−2
−1
1
2
Abbildung 5.11: Die Graphen der Funktionen f (x) = x3 − 2x und g(x) = x2 + 0.5
Beweis: o.B.d.A. an > 0. Für x 6= 0 ist
a
an−1
a1
0
+
·
·
·
+
+
+
a
f (x) = xn ·
n
xn xn−1
x
(∗)
Für sehr große x werden die Terme ai /xn−i beliebig klein und (∗) nähert sich immer mehr dem
Wert an . Also gilt:
a
an−1
a1
0
+
·
·
·
+
lim
+
+
a
= an
n
x→∞ xn
x
xn−1
Es gibt also M > 0 mit
|x| ≥ M ⇒
a
0
xn
+
a1
+
·
·
·
+
a
∈ (an − ε, an + ε)
n
xn−1
Mit geeignetem ε, etwa ε = an /2, ist an − ε > 0, d.h.
x ≥ +M ⇒ f (x) > 0
x < −M ⇒ f (x) < 0 (da n ungerade)
Also hat f im Intervall [−M, +M ] ein Nullstelle.
5.4.2
Der Umkehrsatz
Eine wichtige Folgerung aus dem Zwischenwertsatz ist der
Satz 5.23 (Umkehrsatz):
f : [a, b] →
R sei stetig und streng monoton steigend. Dann gilt:
1. f bildet [a, b] bijektiv auf [f (a), f (b)] ab
2. die Umkehrfunktion g := f −1 : [f (a), f (b)] → [a, b] ist stetig
V
Beweis: Zu 1.: f streng monoton steigend ⇔ x,y x < y ⇒ f (x) < f (y). Dies impliziert die
Injektivität von f . Nach Korollar 5.21 ist klar: f (a) = min{f (x) | x ∈ [a, b]} und f (b) =
97
5.4 Globale Eigenschaften stetiger Funktionen
max{f (x) | x ∈ [a, b]}. Nach dem Zwischenwertsatz ist damit f : [a, b] → [f (a), f (b)] surjektiv.
Also ist f bijektiv.
Zu 2.: y ∈ [f (a), f (b)] und eine beliebige Folge (yn )n∈N aus [f (a), f (b)] mit lim yn = y sei
n→∞
vorgegeben. Zu zeigen ist lim f −1 (yn ) = f −1 (y).
n→∞
Angenommen dies wäre falsch: Da die Folge (f −1 (yn ))n∈N in [a, b] liegt, also beschränkt ist, muß
es dann eine konvergente Teilfolge (ynk )k∈N mit lim f −1 (ynk ) = z 6= f −1 (y) geben. Da f stetig
k→∞
und injektiv ist, gilt aber
(∗)
lim f (f −1 (ynk )) = f ( lim f −1 (ynk )) = f (z) 6= f (f −1 (y)) = y
k→∞
k→∞
Da (yn )n∈N gegen y konvergiert, gilt auch
y = lim (ynk ) = lim f (f −1 ((ynk )))
k→∞
k→∞
Dies ist aber ein Widerspruch zu (∗)!
Bemerkung:
1. Der Umkehrsatz gilt analog für streng monoton fallende Funktionen (Man geht zu −f
über).
2. Der Umkehrsatz gilt auch für andere Intervalle, wird aber falsch auf nichtzusammenhängenden Definitionsbereichen.
Anwendungen des Umkehrsatzes
N
R
R
Wurzeln Es sei k ∈ mit k ≥ 2 und a ∈ mit a > 0. Dann ist die Funktion fk : [0, a] →
mit fk (x) = xk stetig und streng monoton steigend, bildet also das Intervall [0, a] bijektiv auf
[0, ak ] ab. Die Umkehrfunktion — die auch stetig ist — heißt k-te Wurzel.
√
√
k
Also: Für x ∈ [0, ak ] definiere k x := fk−1 (x) (Existenzbeweis für
x, leichter als mit Folgen
p
k
oder sup). Wenn nun a immer größer gewählt wird, erhält man
: [0, ∞) → [0, ∞).
R
R
Natürlicher Logarithmus Die Funktion exp :
→
ist streng monoton steigend und
stetig. Wir wissen exp( ) ⊂ (0, ∞) und nach dem Umkehrsatz bildet exp das Intervall [−n, +n]
bijektiv auf [e−n , e+n ] ab. Da e−n mit n wachsend beliebig klein wird (e−n = e1n und en > 2n )
folgt exp( ) = (0, ∞). Die Einschränkung von exp zu exp :
→ (0, ∞) ist damit zusätzlich
zu stetig und monoton auch surjektiv, also bijektiv, und hat damit eine Umkehrfunktion die
natürlicher Logarithmus heißt:
R
R
R
ln : (0, ∞) →
ln : (0, ∞) →
R
ln := exp−1
R ist stetig, denn dies gilt mit Umkehrsatz auf [e−n , e+n] → R.
Satz 5.24:
Für x, y > 0 gilt: ln(x · y) = ln(x) + ln(y).
Beweis: Da exp injektiv ist, gilt ln(x · y) = ln(x) + ln(y) genau dann, wenn gilt:
exp(ln(x · y)) = exp(ln(x) + ln(y)) ⇔ x · y = exp(ln(x)) · exp(ln(y)) ⇔ x · y = x · y
Da dies offensichtlich gilt, gilt die Behauptung.
√
n
Der natürliche Logarithmus kann auch direkt definiert werden: ln(x) = lim n( x − 1).
n→∞
98
5 Stetige Funktionen
R
Allgemeine Potenzen und Exponentialfunktionen a > 0 aus sei gegeben. Dann ist die
Funktion x 7→ ax , definiert durch ax := ex·ln(a) von
nach (0, ∞) stetig, denn sie ist die Komposition der stetigen Abbildungen x 7→ x · ln(a) und y 7→ ey . x 7→ ax heißt Exponentialfunktion
zur Basis a. Es gilt:
R
1. ax+y = ax · ay
2. an = a
| · a ·{z· · · · a} für n ∈
N
n-mal
Beweis zu 1. folgt aus der Definition und ex+y = ex · ey . 2. folgt mit Induktion aus 1.
Es gelten weiterhin folgende Rechenregeln:
(ax )y = ax·y
ax bx = (ab)x
(1/a)x = a−x
√
a1/n = n a
(für n ∈
N − {0})
R
Beachte: Wir können ax auch als Funktion von a ∈ (0, ∞) auffassen: Dazu sei r ∈
fest.
x 7→ xr = eln(x)·r ist (Beweis wie oben) stetige Funktion von (0, ∞) →
und heißt allgemeine
Potenz.
Direkte Definition von ab für a > 0: Men erklärt zuerst ab für b ∈ , dann approximiert man
b ∈ durch monoton steigende Folge bn ∈ mit lim bn = b und setzt ab := lim (abn ).
R
R
Q
Q
n→∞
Allgemeine Logarithmusfunktionen Wie bei der Exponentialfunktion zeigt man: für a > 1
bijektiv auf (0, ∞)
(etwa a = 10) ist x 7→ ax stetig und streng monoton steigend und bildet
ab. Die Umkehrfunktion dazu heißt loga : (0, ∞) → (Logarithmus zur Basis a).
R
Übung: loga (x) =
5.4.3
ln x
ln a
R
für x > 0.
Injektivität und Monotonie für stetige Funktionen
Klar ist: Ist eine Funktion f streng monoton, dann ist sie auch injektiv. Für stetige Funktionen
gilt aber auch die Umkehrung:
Satz 5.25:
f : [a, b] → sei eine stetige Funktion. Dann gilt: Ist f injektiv, dann muß f auch streng
monoton sein.
R
Beweis: Es sei f (a) < f (b) (der Beweis für f (a) > f (b) ist analog). Zu zeigen ist, daß f streng
monoton steigt. Behauptung: f (a) = min{f (x) | x ∈ [a, b]}. Annnahme: Es gibt c ∈ (a, b)
mit f (c) = min{f (x) | x ∈ [a, b]}. Nach dem Zwischenwertsatz gibt es dann ein ξ ∈ [c, b] mit
f (ξ) = f (a). Widerspruch zur Injektivität! D.h. die Behauptung stimmt. Analog zeigt man:
f (b) = max{f (x) | x ∈ [a, b]}.
Annahme: f ist nicht streng monoton steigend. Dann gibt es x1 , x2 ∈ [a, b] mit x1 < x2 aber
f (x1 ) ≥ f (x2 ). Nach obiger Überlegung also f (a) ≤ f (x2 ) ≤ f (x1 ). Nach dem Zwischenwertsatz
gibt es dann ein c ∈ [a, x1 ] mit f (c) = f (x2 ). Dies ist ein Widerspruch zur Injektivität, da
x2 > x1 ≥ c.
99
5.4 Globale Eigenschaften stetiger Funktionen
5.4.4
Gleichmäßige Stetigkeit
R
Es sei f : [a, b] →
eine Funktion. Wir wissen: f ist stetig bei x0 ⇔ zu jedem ε > 0 gibt
es ein δ > 0 mit |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε. Hierbei hängt das zu ε zu findende δ
im Allgemeinen von der Stelle x0 ab — je nachdem wie steil die Funktion bei x0 steigt oder
schwankt. Kann man zu ε > 0 das δ aber immer unabhängig von x0 finden — d.h. gleichmäßig
im ganzen Definitionsbereich — so nennt man f gleichmäßig stetig.
Definition 5.10:
f :D→
R heißt gleichmäßig stetig:
:⇔
^ _ ^
^
ε>0 δ>0 x∈D x0 ∈D
|x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε
Beachte die Stellung der Quantoren! gleichmäßig stetig ist eine globale Eigenschaft, keine lokale
wie stetig. Klar ist: Wenn f gleichmäßig stetig ist, dann ist f auch stetig, im Allgemeinen aber
nicht umgekehrt. Beispiel: f (x) = 1/x auf (0, ∞). Es gilt aber für bestimmte Definitionbereiche
die Umkehrung.
Satz 5.26:
Es sei D = [a, b] ein Intervall, a < b und f : [a, b] →
stetig.
R stetig, dann ist f
gleichmäßig
Beweis: Wir zeigen: f nicht gleichmäßig stetig ⇒ f nicht stetig. f nicht gleichmäßig stetig heißt:
_ ^ _
_
|x − y| < δ ∧ |f (x) − f (y)| ≥ ε
ε>0 δ>0 x∈[a,b] y∈[a,b]
Behauptung: Es gibt ein c, wo f nicht stetig ist. Zu dem festgelegten ε > 0 gibt es zu jedem
δ = n1 Punkte xn und yn in [a, b] mit (|xn − yn | < n1 ) ∧ (|f (xn ) − f (yn )| ≥ ε). Die Folgen
(xn )n∈N und (yn )n∈N sind beschränkt, da aus [a, b]. Nach dem Satz von Bolzano-Weierstraß gibt
es konvergente Teilfolgen (xnk ) und (ynk ) mit Grenzwert c := lim xnk . Es gilt auch c = lim ynk ,
da |xnk − ynk | < n1k . c ∈ [a, b], da a ≤ xn ≤ b und a ≤ yn ≤ b.
Behauptung: f ist bei c unstetig. Anderenfalls wäre limk→∞ f (xnk ) = limk→∞ f (ynk ) = f (c),
d.h. |f (xnk ) − f (ynk )| wäre eine Nullfolge im Widerspruch zu |f (xnk ) − f (ynk )| ≥ ε.
6
Differentialrechnung
6.1
Ableitung
Die Differentialrechnung hat sich historisch aus folgenden Problemstellungen entwickelt
R2 (etwa Funktionsgraph Γf ), bestimme eine
a) Tangentenproblem: Gegeben Kurve C in
Tangente an C in einem Punkt (x, y) auf C
b) Geschwindigkeitsproblem: Bestimme die Momentangeschwindigkeit eines ungleichförmig
bewegten Teilchens
c) Approximationsproblem: Wie gut kann man durch eine einfachere Funktion etwa einer
linearen die Änderung einer Funktion approximieren?
c) ist ein eher modernerer Gesichtspunkt, a) beschäftigte bereits die Griechen, b) Newton,
Leibnitz
6.1.1
Tangentenproblem
Beispiele C:
r
1
a
−1
1
−1
Abbildung 6.1: C Kreis: Tangente senkrecht
auf Radius r.
−1
Abbildung 6.2: C Gerade: Tangente in a Gerade selbst.
2
2
1
1
1
Abbildung 6.3: C Parabel: elementargeometrisch in a = (x0 , x20 ) Steigung 2x0
−2
−1
Γf
f (x) = |x|
1
2
Abbildung 6.4: C = Γf im Nullpunkt gibt es
keine Tangente (bestenfalls 2 verschiedene)
101
6.1 Ableitung
Problem:
1. Was ist eine Tangente überhaupt?
2. Welche Funktionsgraphen besitzen Tangenten?
m
3. Wie bezeichnet man diese?
1
Die Tangente ist ein Gerade. Eine Gerade ist (für uns) der
Graph einer affinen Funktion x 7→ a+mx. m heißt Steigung.
Elementar geometrisch:
Durch zwei verschiedene Punkte a = (x1 , y1 ), b = (x2 , y2 )
der Ebene geht genau eine Gerade nämlich der Graph von
y2 − y1
g(x) := y1 + (x− x1 )
. Wegen g(x1 ) = y1 und g(x2 ) =
x2 − x1
y2 − y1
.
y2 liegen a und b auf Γg . Die Steigung beträgt
x2 − x1
a
Abbildung 6.5: Der Graph einer affinen Funktion.
R
Gegeben sei Funktion f : I → mit I = (c, d). Wähle zwei Punkte x0 und x0 +h aus I mit h 6= 0
(h gnügend klein ⇒ x0 + h ∈ I falls x0 ∈ I). Die Gerade durch (x0 , f (x0 )) und (x0 + h, f (x0 + h))
f (x0 + h) − f (x0 )
heißt Sekante und ist der Graph von Sn (x) = f (x0 ) + (x − x0 ) ·
. Die Steigung
h
f (x0 + h) − f (x0 )
von Sn ist M (h) =
. h 7→ M (h) ist für alle genügend kleinen h 6= 0 erklärt, aber
h
sinnlos für h = 0 (dann ist nur ein Punkt vorhanden, und somit keine Sekante mehr definiert).
Lassen wir jetzt h gegen 0 gehen“, so approximiert die Sekante Sn immer besser die Tangente
”
(falls vorhanden). Anschaulich: Was fehlt ist M (0) - dies wäre genau die Tangentensteigung.
Γ Sn
b
f (x0 + h) − f (x0 )
b
h
x0
x0 + h
Abbildung 6.6: Beispiel einer Sekante.
Beispiele: Betrachten wir die Graphen von h 7→ M (h) an Beispielen.
1.
f (x) = x2
M (h) =
(x0 + h)2 − x20
2x0 h + h2
=
= 2x0 + h für h 6= 0
h
h
102
6 Differentialrechnung
2.
f (x) = sin x
x0 = 0
M (h) =
sin(0 + h) − sin(0)
sin h
=
h
h
3. f (x) = |x|, x0 = 0
+1
−1
Wir sehen: Manchmal kann man h 7→ M (h) bei h = 0 stetig ergänzen (Wie in den ersten beiden
Beispielen) — manchmal ist dies unmöglich. Der fehlende Wert ist lim M (h)
h→0
Definition 6.1:
f :I →
sei eine Funktion, I ein offenes Intervall und x0 ∈ I. Γf besitzt in (x0 , f (x0 ))
genau dann eine Tangente, wenn
R
f (x0 + h) − f (x0 )
h→0
h
M = lim M (h) = lim
h→0
existiert. Die Tangente durch (x0 , f (x0 )) ist dann definiert als die Gerade mit M als
Steigung.
Funktionen, deren Graph in (x0 , f (x0 )) eine Tangente besitzen heißen in x0 differenzierbar :
Definition 6.2:
f : I → sei eine Funktion, I ein offenes Intervall und x0 ∈ I. f heißt genau dann in x0
differenzierbar, wenn
f (x0 + h) − f (x0 )
lim
h→0
h
R
df
existiert. Dieser Grenzwert wird dann mit f ′ (x0 ) oder dx
(x0 ) bezeichnet und heißt Ableif (x0 +h)−f (x0 )
heißt Differenzenquotitung oder Differentialquotient. Der Ausdruck
h
df
ent. (Beachte: dx (x0 ) ist kein wirklicher Quotient!)
Umformulierung mit Folgen:
Definition 6.3:
f :I →
sei eine Funktion, I ein offenes Intervall und x0 ∈ I. f heißt genau dann in
x0 differenzierbar, wenn für alle Nullfolgen (hn )n∈N mit hn 6= 0 und x0 + hn ∈ I der
Grenzwert
f (x0 + hn ) − f (x0 )
f ′ (x0 ) := lim
n→∞
hn
existiert.
R
Die Steigung der Sekanten Sn — also M (h) — ist für h = 0 nicht erklärt. Legt
durch irgendeinen Wert M willkürlich fest M (0) := M , so gilt dann offensichtlich:
ist im 0-Punkt stetig (d.h. durch M stetig ergänzt worden) ⇔ limh→0 M (h) = M
x0 differenzierbar. Also: Sekantensteigungsfunktion für h = 0 stetig ergänzbar ⇔
differenzierbar.
man M (0)
h 7→ M (h)
⇔ f ist in
f ist in x0
103
6.1 Ableitung
6.1.2
Geschwindigkeitsproblem
Man kann die Sekantensteigung M (h) als durchschnittliche Steigung von Γf zwischen x0 und
x0 + h interpretieren. f ′ (x0 ) = lim M (h) ist dann die momentane Steigung von Γf in x0 . Dies
h→0
zeigt, daß das Geschwindigkeitsproblem analog zu behandeln ist. Ein Teilchen bewege sich auf
einer festen Achse und die Funktion t 7→ s(t) — wo t die Zeit ist — gebe den Abstand zu einem
festen Punkt an
s(t0 + h) − s(t0 )
= Durchschnittsgeschwindigkeit
h
s(t0 + h) − s(t0 )
s(t0 ) := lim
= Momentangeschwindigkeit in t0
h→0
h
= Ableitung der Wegefunktion
6.1.3
Approximationsproblem
R
Dritter Gesichtspunkt: Approximation von Funktionen. Gegeben sei f : D → , D ein offenes
Intervall in . Oft kennt man von f — wie etwa in der Physik bei Meßreihen — nur eine
Wertetabelle von f für endlich viele Argumente x1 , . . . , xn .
R
3
3
b
b
b
b
2
b
b
b
b
b
b
2
b
b
b
1
b
1
b
b
1
2
3
b
4
b
1
2
3
4
Abbildung 6.7: Skizze zum Approximationsproblem
Welche Eigenschaften von Γf garantieren es, daß eine durch diese Punkte gezogene Linie Γf
gut approximiert. Eine solche Eigenschaft ist z.B. Stetigkeit. Stetigkeit ist aber ein ziemlich
schwacher Begriff so könnte z.B. die Funktion f bei Vergrößerung“ noch wie in Abbildung 6.7
”
aussehen. Wie schließt man aber solche Ausreißer aus? Welche Eigenschaft muß f haben, damit
es erlaubt ist, daß man ein Stück weit inter- oder extrapolieren kann. Wie approximiert man?
a) linear: durch eine Gerade durch a und b
b) quadratisch: durch eine Parabel durch a und b
usw.
Hier zuerst die lineare Approximation:
Wir verwenden den Ansatz f (x0 + h) ≈ konstante Abbildung + lineare Abbildung, oder exakt:
|
{z
}
f (x0 )
lineare Abbildung
z }| {
f (x0 + h) = f (x0 ) + h · A + r(h)
| {z }
|{z}
konstante Abbildung Approximations Fehler,
Restfunktion
104
6 Differentialrechnung
Γf
f (x0 + h)
b
R(h) · h
f (x0 )
b
h
x0
A·h
x0 + h
Abbildung 6.8: Anschauliche Bedeutung von R(h)
r(h) ist damit durch f (x0 +h)−f (x0 )−h·A erklärt. Dies kann man natürlich immer machen, wir
müssen jetzt sagen, was es heißt daß die lineare Funktion h 7→ h · A besonders gut approximiert.
Dazu muß die Restfunktion r(h) mit h → 0 offenbar schneller gegen 0 gehen als jede lineare
Funktion, d.h. der Fehler soll schneller gegen 0 gehen als unsere Approximation. Verlangt man
nur lim r(h) = 0 so ist dies äquivalent zu f ist in x0 stetig.
h→0
Nebenbemerkung: f geht mit h → 0 schneller gegen 0 als g ⇔
(Es muß natürlich g(h) 6= 0 für alle h gefordert werden).
f (h)
g(h)
Beispiel: f (h) = h2 geht schneller als h mit h → 0 gegen g(h) = h:
Also: Für h 6= 0 setze R(h) =
r(h)
h
hat 0 als Grenzwert bei 0
h2
h
=h
△
und verlange lim R(h) = 0. Der Steigungsfaktor A bei der
h→0
linearen Abbildung h 7→ h · A spielt hierbei offensichtlich keine Rolle.
Definition 6.4:
R
f ist in x0 linear approximierbar :⇔ Es gibt ein A ∈ , so daß die für h 6= 0 durch
die Gleichung f (x0 + h) = f (x0 ) + h · A + h · R(h)1 definierte Funktion h 7→ R(h) die
Eigenschaft hat lim R(h) = 0.
h→0
Anschauliche Bedeutung von R(h):
Es gilt R(h) · h = f (x0 + h) − f (x0 ) − A · h, A ist die Steigung der linearen Abbildung h 7→ A · h,
f (x0 +h)−f (x0 )
ist die Steigung der Sekante und R(h) ist der Unterschied zwischen Sekantensteih
gung und A. A muß die Tangentensteigung sein:
Es gibt A mit lim R(h) = 0 ⇔
h→0
_
A
1
f (x0 + h) − f (x0 ) − h · A = 0
h→0 h
lim
⇔ lim
h→0
1
f (x0 + h) − f (x0 )
existiert und ist gleich A
h
Klar: R(h) kann man immer so definieren, aber es muß lim R(h) nicht existieren oder wenn er existiert 0 sein.
h→0
105
6.1 Ableitung
Also: f in x0 linear approximierbar ⇔ f ist in x0 differenzierbar (⇔ Γf besitzt in (x0 , f (x0 ))
eine Tangente). und R(h) = Unterschied zwischen Sekanten und Tangentensteigung.
Wir halten dies fest als
Satz 6.1 (Zerlegungssatz):
R
R
R
f : I → sei Funktion, I ⊂ ein offenes Intervall, M ∈ und x0 ∈ I. Für jedes h 6= 0
mit x0 + h ∈ I zerlege man f (x0 + h) − f (x0 ) (=Zuwachs von f ) als M · h + h · R(h) in
die Summe eines linearen Anteils und eines Restes. Dann gilt:
f ist in x0 differenzierbar mit f ′ (x0 ) = M ⇔ Es gibt Wahl von M mit lim R(h) = 0, d.h.
h→0
f ist in x0 linear approximierbar.
Beweis: ⇒“: Setze A = f ′ (x0 ). Dann ist R(h) = (f (x0 +h)−f (x0 )−h·f ′ (x0 ))/h. Grenzwertsätze
”
liefern lim R(h) = 0.
h→0
⇐“: R(h) = (f (x0 + h) − f (x0 ) − h · A)/h = (f (x0 + h) − f (x0 ))/h − A. Grenzwerte für h → 0:
”
0 = lim R(h) = lim (f (x0 + h) − f (x0 ))/h − A. Also existiert lim (f (x0 + h) − f (x0 ))/h und hat
h→0
h→0
h→0
den Wert A, d.h. f ′ (x0 ) = A.
Lineare Approximierbarkeit schränkt das Verhalten von Funktionen ein: Ausreißer werden ausgeschlossen, differenzierbare Funktionen sind glätter als stetige.
Satz 6.2 (Einschließungssatz):
R
f : I → sei Funktion, I ein offenes Intervall, x0 ∈ I, x0 +h ∈ I, f sei in x0 differenzierbar.
Dann gilt:
Zu ε > 0 gibt es ein δ > 0, so daß für alle h mit |h| < δ die Abschätzung
|f (x0 + h) − f (x0 )| ≤ M · |h|
oder
f (x0 ) − M · |h| ≤ f (x0 + h) ≤ f (x0 ) + |h| · M
gilt (M = ε + |f ′ (x0 )|).
Beweis: f (x0 + h) − f (x0 ) = h · f ′ (x0 ) + R(h) . Da f differenzierbar ist, ist f auch linear
approximierbar und es gilt limh→0 R(h) = 0. Setze R(0) = 0, dann ist R in 0 stetig. Nach
der ε-δ-Definition von Stetigkeit gibt es zu ε > 0 ein δ > 0 mit |h| < δ ⇒ |R(h)| < ε. Also
|f ′ (x0 ) + R(h)| ≤ |f ′ (x0 )| + ε =: M , d.h. |f (x0 + h) − f (x0 )| ≤ |h| · M .
In Abbildung 6.9 ist gut zu sehen: Γf muß über [x0 − δ, x0 + δ] im schraffierten Bereich liegen:
1. Ausreißer werden begrenzt
2. Γf kann sich von (x0 , f (x0 )) aus nur in bestimmter Weise fortsetzen, ist eingefangen.
3. Stetigkeit besagt nur: nicht ruckartig
Korollar 6.3:
f in x0 differenzierbar ⇒ f ist in x0 stetig
Beweis:
1. Wegen |f (x0 + h) − f (x0 )| ≤ E · |h| ist f sogar Lipschitzstetig“
”
106
6 Differentialrechnung
f (x0 ) + |h| · M
f (x0 )
Γf
f (x0 ) − |h| · M
x0
x0 − δ
x0 + δ
Abbildung 6.9: Skizze zum Einschließungssatz am Beispiel f (x) = 0.5(x − 4) sin(4(x − 4)) + 2.9
2. direkt mit Zerlegungsgleichung: f ist differenzierbar, also gilt R(h) → 0 mit h → 0:
lim h · R(h) = 0 ⇔ lim (h · f ′ (x0 ) + h · R(h)) = 0
h→0
h→0
⇔ lim (f (x0 + h) − f (x0 )) = 0
h→0
⇔ lim f (x0 + h) = f (x0 )
h→0
⇔ f stetig in x0
Bemerkung:
1. Die Definition der Differenzierbarkeit durch lineare Approximierbarkeit läßt sich leicht auf
den Fall von Funktionen f : n → m übertragen. In dieser Situation kann man nicht
mehr durch h teilen, da dann h ein Vektor ist. Der Differenzenquotient macht also direkt
übertragen keinen Sinn mehr, wohl aber die Zerlegungsgleichung mit r(h). Es muß nur
erklärt werden, daß r(h) mit h → 0 schneller als jede lineare Abbildung gegen 0 geht.
R
R
2. Später werden wir auch nicht linear — etwa durch Polynomfunktionen — approximieren.
Dies führt zur Taylorformel.
3. An Graphen läßt sich oft anschaulich übersehen ob f in x0 differenzierbar ist, Γf muß
ja in (x0 , f (x0 )) eine Tangente besitzen. Knick, Sprung, ∞-oft hinundherschwirren usw.
verhindert Tangente.
Lemma 6.4:
f : I → gegeben, x0 ∈ I. I enthalte eine ε-Umgebung (x0 − ε, x0 + ε) von x0 . η > 0 sei
so gewählt, daß 0 ≤ η ≤ ε. Dann gilt:
f ist in x0 differenzierbar ⇔ f|(x −η,x +η) ist in x0 differenzierbar
R
0
0
Beweis: wie bei Stetigkeit, Ausführung Übung.
Bemerkung: Differenzierbarkeit ist — genau wie Stetigkeit — eine lokale Eigenschaft der Funktion denn es kommt nur auf das Verhalten von f in einer beliebig kleinen Umgebung von x0
an.
107
6.1 Ableitung
4
7
3
6
2
5
1
4
−2
3
−1
−1
2
−1
2
−2
1
−2
1
−3
1
−4
2
Abbildung 6.10: Die Graphen von f (x) = xn für n = 2, . . . , 7
Beispielrechnungen mit der Definition.
1. I =
R, f : R → R mit f (x) = xn, n ∈ N, n ≥ 1, x0 ∈ I (siehe Abbildung 6.10).
f (x0 + h) − f (x0 ) = (x0 + h)n − xn0
n
n 2 n−2
n n
n
n
n−1
= x0 − x0 +
h · x0 +
h x0 + · · · +
h
1
2
n
n
n−1
n−2
n−1
= h · n · x0
+h ·
hx0 + · · · + h
2
| {z }
|
{z
}
= M = f ′ (x )
0
R(h)
Offensichtlich gilt: lim R(h) = 0 da R(h) durch h teilbar. Also ist f differenzierbar in x0
h→0
mit Ableitung f ′ (x0 ) = nxn−1
(n ≥ 1).
0
(
x
x≥0
2. I = , f (x) = |x| =
(Siehe Abbildung 6.11).
−x x ≤ 0
R
Außerhalb des Nullpunktes bestehen keine Probleme. Man muß sich nur überlegen, daß
für x 6= 0 x 7→ |x| entweder gleich der Funktion x 7→ x oder gleich der Funktion x 7→ −x
ist. Beide können wie Monome abgeleitet werden.
Für x0 = 0 gilt: Da es im Nullpunkt anschaulich keine Tangente gibt, vermutet man, daß
f für x0 = 0 nicht differenzierbar ist. Dazu zeigt man: lim f (0+hhnn)−f (0) existiert nicht. Wir
h→0
108
6 Differentialrechnung
1
−1
1
Abbildung 6.11: Der Graph zu f (x) = |x|
wählen die Möglichkeit, zwei Folgen, nämlich − n1 n∈N und + n1 n∈N anzugeben, so daß
lim f (0+hhnn)−f (0) für (hn )n = − n1 n∈N bzw. + n1 n∈N verschiedene Werte hat:
h→0
lim
n→∞
Also kann lim
h→0
0 + 1 − |0|
n
1
n
f (0+h)−f (0)
h
= +1
0 − 1 − |0|
n
lim
= −1
n→∞
− n1
bzw.
nicht existieren (Man mische etwa beide Folgen).
3. Aus Monomen zusammengestze Funktionen (Siehe Abbildung 6.12). Einfachste Möglichkeit: Man untersucht die links und rechtseitigen Grenzwerte für x0 = 0:
h2n
n→∞ hn
Zu f : Alle hn > 0: lim
hn
h→∞ hn
= 0. Alle hn < 0: lim
überein.
= 1. Stimmt mit Anschauung
Zu g und h: Wie im nächsten Beispiel.
x2
x2
x
(
x
f (x) =
x2
x≤0
x≥0
+x2
x3
(
x2
g(x) =
x3
−x2
x≤0
x≥0
(
−x2
h(x) = x · |x| =
+x2
x≤0
x≥0
Abbildung 6.12: Aus Monomen zusammengesetzte Funktionen
4. Daß differenzierbare Funktion noch relativ ungewöhlich aussehen können und daß man
deshalb mit der Anschauung glatt“ vorsichtig umgehen muß zeigt das Beispiel aus Ab”
bildung 6.13.
Für x0 6= 0 ist f nicht stetig also auch nicht differenzierbar. Für x0 = 0 ist f im Nullpunkt
differenzierbar mit Ableitungswert 0. Dazu sei (hn )n∈N eine beliebige Nullfolge mit hn 6= 0.
(
0
für hn rational
f (hn ) − f (0)
= h2 −0
n
hn
= hn für hn irrational
h
n
109
6.1 Ableitung
In der Nullfolge (hn )n∈N wird also hn durch 0 ersetzt, wenn hn rational ist. Die resultie(0)
für
rende Folge ist natürlich eine Nullfolge. Also exisitiert der Grenzwert lim f (hnh)−f
n
h→∞
alle Nullfolgen (hn )n∈N mit hn 6= 0. Also existiert auch der Grenzwert lim
h→0
f ist in 0 differenzierbar.
b
f (h)−f (0)
,
h
d.h.
b
b
b
b
b
b
b
b
b
b
f:
b
b
b
b
b
b
b
b
f : x 7→
b
b
b
b
b
b
b
b
R → R(
b
b
b
b
0
x2
für x ∈
für x ∈
Q
R−Q
b
b
b
b
b
b
b
b
b
b
b
b b b b b b b b b b b b b b b b b b b b b b bb bb bb b b b b b b b b b b b b b b b b b b b b b b
b
b
b
b
Abbildung 6.13: Ein ungewöhnliches Beispiel einer bei x = 0 differenzierbaren Funktion
5. x 7→
√
x für x0 6= 0:
p
x0 + h −
h
p
x0
=
p
h
lim
h→0
x0 + h −
h
p
x0 + h − x0
x0 + h +
p
p h
x0 + h + x0
p
=p
p
p
p
x0
h
=
Also:
p
x0
x0 + h +
1
x0 + h +
1
= √
2 x0
p
p
x0
x0
(nach Grenzwertsätzen)
Die sogenannten elementaren Funktionen sind aus den Monomen x 7→ xn , exp, sin, cos usw.
aufgebaut. Den Baustein“ x 7→ xn hatten wir bereits differenziert. Versuchen wir es mit exp:
”
∞ n
P
x
6. exp : → exp : x 7→
n! (Potenzreihe, überall konvergent).
R R
n=0
(a) Ableitung im Nullpunkt:
h 6= 0
eh − e0
eh − 1
h
h2
=
=1+ +
+ · · · =: G(h)
h
h
2!
3!
Die Potenzreihe G(h) ist für alle h konvergent (Quotienten Kriterium) und daher
stetig — auch im Nullpunkt — also lim G(h) = G(0) = 1, also exp′ (0) = 1.
h→0
110
6 Differentialrechnung
(b) x0 ∈
R, x0 6= 0
ex0 +h − ex0
ex0 · eh − ex0
=
= ex0
h
h
eh − 1
h
hat Grenzwert ex0 (s.o.)
Die Differenzenquotientenfunktion ist also für h = 0 stetig ergänzbar. Also gilt
x +h
x
lim e 0 h−e 0 = ex0 und exp′ (x0 ) = exp(x0 ).
h→0
7. sin :
R → R. Behauptung: sin′(x0 ) = cos(x0 ). Für h 6= 0 gilt für den Differenzenquotienten
sin(h) − sin(0)
sin(h)
h2 h4
=
=1−
+
· · · = H(h)
h
h
3!
4!
Es gilt lim
h→0
sin(h)
h
= 1, denn die rechte Seite H(h) ist eine konvergente Potenzreihe also
stetig — auch bei 0 — also folgt lim H(h) = H(0) = 1. ⇒ sin′ (0) = 1.
h→0
Genauso für cos:
cos(h) − cos(0)
cos(h) − 1
h
h3
= lim
= lim − +
− ··· = 0
h→0
h→0
h→0 2!
h
h
4!
lim
Daraus ergibt sich: cos′ (0) = 0.
Nun differenzieren wir an einer beliebigen Stelle x0 und verwenden das Additiontheorem
sin(x0 + h) = sin x0 · cos h + cos x0 · sin h. Damit ergibt sich
sin(x0 + h) − sin(x0 )
cos h − 1
sin h
= sin x0
+ cos x0
h
h
h
Es folgt lim
h→0
sin(x0 +h)−sin(x0 )
h
= cos x0 , also sin′ (x0 ) = cos(x0 ).
Ebenso für cos:
cos(x0 + h) − cos(x0 )
= cos x0
h
cos h − 1
h
− sin x0
sin h
h
⇒ cos′ (x0 ) = − sin(x0 ).
Definition 6.5 (Differenzierbar):
R
R
I ⊂
offen und f : I →
Funktion. Ist f für alle x0 ∈ I differenzierbar, so sagt man
f ist auf I differenzierbar. Die dann definierte Funktion f ′ : I →
x 7→ f ′ (x) heißt
′
Ableitungsfunktion von f (oder kurz Ableitung). f ist also die Zuordnung, die zu
jedem x0 ∈ I die Tangentensteigung von Γf in (x0 , f (x0 )) (oder die Änderungsrate von f
bei x0 ) angibt.
R
Beispiel: f = s Wegefunktion in der Physik, f ′ = v: Geschwindigkeitsfunktion.
Bemerkung: Statt f ′ schreibt man auch oft
wird bezeichnet werden soll. Wir wissen:
1. f : I →
df
dx
△
— besonders wenn die Variable nach der abgeleitet
R sei auf I differenzierbar ⇒ f ist auf I stetig.
111
6.1 Ableitung
2. Es gibt stetige Funktionen, die an einzelnen Stellen nicht differenzierbar sind z.B. f (x) =
|x|
aber es gibt auch:
3. Es gibt überall stetige Funktionen, die nirgends differenzierbar sind:
∞
X
Weierstraß Beisp: f (x) =
bk ·cos(ak ·πx), a ∈ ungerade, b ∈ , 0 < b < 1, a·b > 1+ 3π
2
N
R
k=0
Ein einfacheres Beispiel stammt von 1903 vom japanischen Mathematiker Takagi (Barner
Flohr/Königsberger
S.177 in der dritten Auflage): Definiere fn stückweise linear mit
PS.153,
∞
−n
Periode 4 . f := n=1 fn f ist überall stetig, aber nirgendwo differenzierbar.
0.125
−0.250
−0.125
0.125
0.250
Abbildung 6.14: Einige der fn , der Takagi-Funktion
0.125
−0.250
−0.125
0.125
0.250
Abbildung 6.15: f1 + f2 + f3 + f4 als Approximation der Takagi-Funktion
Interpretiert man eine stetige nirgends differenzierbare Funktion f als Bewegung eines Teilchens, dann hätte dieses zu keinem Zeitpunkt eine eindeutig bestimmte Geschwindigkeit Eine etwas ungewöhnlich Vorstellung.
6.1.4
Ableitungsregeln
Die Berechnung von f ′ (x) über die Definitionen ist oft mühsam. Ist f aus bestimmten Grundfunktionen aufgebaut, so helfen die sogenannten Ableitungsregeln.
s
sin(x) + xn
etwa bei
f (x) =
· ln(x)
cos2 (x) + 1
112
6 Differentialrechnung
Γf
Γg
Γf +g
Γf ′
Γg ′
Γ(f +g)′
Abbildung 6.16: Veranschaulichung der Addition der Tangentensteigung bei Addition der Funktionen.
I⊂
R sei ein offenes Intervall, x0 ∈ I
Satz 6.5 (Summenregel):
Es seien f : I →
und g : I →
in x0 differenzierbar. Dann ist auch f + g in x0
′
differenzierbar und es ist (f + g) (x0 ) = f ′ (x0 ) + g′ (x0 ).
R
R
Beweis: h 6= 0:
(f + g)(x0 + h) − (f + g)(x0 )
h→0
h
f (x0 + h) − f (x0 ) + g(x0 + h) − g(x0 )
= lim
h→0
h
f (x0 + h) − f (x0 )
g(x0 + h) − g(x0 )
= lim
+ lim
h→0
h→0
h
h
′
′
= f (x0 ) + g (x0 )
(f + g)′ (x0 ) = lim
Satz 6.6:
Es sei f : I →
R differenzierbar und a ∈ R. Dann ist (a · f )′(x) = a · f ′(x).
Korollar 6.7:
Sind alle fi für i = 1, . . . , n in x0 differenzierbar, dann sind auch alle Linearkombinationen
n
X
ai ∈
ai fi (x)
i=1
in x0 differenzierbar:
n
X
i=1
!′
ai fi (x0 )
=
n
X
R
ai fi′ (x0 )
i=1
(Die in x0 differenzierbaren Funktionen bilden einen reelen Vektorraum und die Ableitung
ist linear).
113
6.1 Ableitung
Satz 6.8 (Produktregel):
R
R
Es seien f : I →
und g : I →
in x0 differenzierbar. Dann ist auch f · g in x0
differenzierbar und es ist (f · g)′ (x0 ) = f ′ (x0 ) · g(x0 ) + f (x0 ) · g′ (x0 ).
Beweis: h 6= 0:
(f · g)(x0 + h) − (f · g)(x0 )
h
f (x0 + h) · g(x0 + h) − f (x0 ) · g(x0 )
= lim
h→0
h
f (x0 + h) · g(x0 + h) − f (x0 ) · g(x0 + h) + f (x0 ) · g(x0 + h) − f (x0 ) · g(x0 )
= lim
h→0
h
f (x0 + h) − f (x0 )
g(x0 + h) − g(x0 )
= lim
· g(x0 + h) + lim f (x0 ) ·
h→0
h→0
h
h
(f · g)′ (x0 ) = lim
h→0
Da g in x0 stetig ist, existiert lim g(x0 + h) und ist gleich g(x0 ):
h→0
g(x0 + h) − g(x0 )
f (x0 + h) − f (x0 )
+ f (x0 ) · lim
h→0
h→0
h
h
= g(x0 ) · f ′ (x0 ) + f (x0 ) · g′ (x0 )
(f · g)′ (x0 ) = g(x0 ) · lim
Korollar 6.9:
Alle Polynome sind (überall) differenzierbar mit
n
X
i=0
i
ai x
!′
=
n
X
iai xi−1
i=1
Satz 6.10 (Kehrwertregel):
R
Es sei f : I →
differenzierbar in x0 ∈ I und es gelte f (x0 ) 6= 0. Dann ist die in einer
Umgebung von x0 erklärte Funktion 1/f in x0 differenzierbar und es gilt:
′
1
f ′ (x0 )
(x0 ) = −
f
(f (x0 ))2
Beweis: Da f (x0 ) 6= 0 und f stetig in x0 (siehe Satz 6.3) gibt es ein ε > 0, so daß f (x) 6= 0 für
alle x ∈ (x0 − ε, x0 + ε). D.h. 1/f ist auf (x0 − ε, x0 + ε) erklärt. Nach Lemma 6.4 genügt es, die
Differenzierbarkeit von (1/f )|(x −ε,x +ε) zu untersuchen. h 6= 0 mit x0 + h ∈ (x0 − ε, x0 + ε):
0
0
′
1
(1/f )(x0 + h) − (1/f )(x0 )
(x0 ) = lim
h→0
f
h
1
1
f (x0 +h) − f (x0 )
= lim
h→0
h
1
f (x0 + h) − f (x0 )
= lim −
·
h→0 f (x0 + h)f (x0 )
h
114
6 Differentialrechnung
Da f in x0 stetig ist, existiert lim f (x0 + h) und ist gleich f (x0 ):
h→0
′
f (x0 + h) − f (x0 )
1
1
(x0 ) = −
· lim
2
f
h
(f (x0 )) h→0
=−
f ′ (x0 )
(f (x0 ))2
Satz 6.11 (Quotientenregel):
Es seien f : I → und g : I → in x0 differenzierbar und g(x0 ) 6= 0. Dann ist auch f /g
in x0 differenzierbar und es ist
′
f
f ′ (x0 ) · g(x0 ) − f (x0 ) · g′ (x0 )
(x0 ) =
g
(g(x0 ))2
R
R
Beweis: Satz 6.10 und Produktregel.
Korollar 6.12:
Jede rationale Funktion f /g ist in ihrem Definitionsbereich differenzierbar.
Beispiel: tan x :=
sin x
für x mit cos x 6= 0. tan′ =Übung.
cos x
△
Satz 6.13 (Kettenregel):
I, J offene Intervalle. Die Funktion f : I → J sei in x0 und die Funktion g : J → sei in
in x0 differenzierbar
y0 = f (x0 ) differenzierbar. Dann ist die Komposition g ◦ f : I →
mit (g ◦ f )′ (x0 ) = g′ (f (x0 )) · f ′ (x0 ).
R
R
Beweis: Wir verwenden die Tangentenzerlegung: Nach Voraussetzung gilt
1. f (x0 + h) = f (x0 ) + h · f ′ (x0 ) + h · R(h)
2. g(y0 + k) = g(y0 ) + k
· g′ (x0 )
+ k · S(k)
mit lim R(h) = 0
h→0
mit lim S(k) = 0
k→0
Daraus ergibt sich:
g(f (x0 + h)) = g(f (x0 ) + h · f ′ (x0 ) + h · R(h))
= g(y0 + k)
mit y0 = f (x0 ) und k := h · (f ′ (x0 ) + R(h))
= g(y0 ) + k · g′ (y0 ) + k · S(k)
= g(y0 ) + h · f ′ (x0 ) · g′ (x0 ) + h · R(h) · g′ (y0 ) + h · f ′ (x0 ) + R(h) · S(k)
= g(f (x0 ) + h · f ′ (x0 ) · g′ (f (x0 )) + h · T (h)
wo T (h) := R(h) · g′ (f (x0 )) + (f ′ (x0 ) + R(h)) · S h · f ′ (x0 ) + R(h)
′
Da l7→ S(l) im 0-Punkt durch
0 stetig ergänzbar ist, ist auch die Komposition h 7→ h · f (x0 ) +
′
R(h) 7→ S h· f (x0 )+R(h) im 0-Punkt durch 0 stetig ergänzbar, damit aber auch h 7→ T (h),
mit anderen Worten lim T (h) = 0 und dies zeigt
h→0
(g ◦ f )(x0 + h) = g ◦ f (x0 ) + h · g′ (f (x0 ) · f ′ (x0 ) + h · T (h)
mit lim T (h) = 0
h→0
115
6.1 Ableitung
Beispiel: F : x 7→ sin(2x3 + 5x) soll differenziert werden. F (x) = (g ◦ f )(x), g(x) = sin(x) und
f (x) = 2x3 + 5x. g′ (x) = cos(x) unf f ′ (x) = 6x2 + 5.
F ′ (x) = (g ◦ f )′ (x)
= g′ (f (x)) · f ′ (x)
= cos(f (x)) · f ′ (x)
= cos(2x3 + 5x) · (6x2 + 5)
△
Übung: x 7→ sin(sin(sin(sin(sin(sin x))))).
Satz 6.14 (Ableitung der Umkehrfunktion):
Vor.: f : (a, b) → (c, d) sei stetig, monoton steigend und bijektiv. f sei in x0 ∈ (a, b)
differenzierbar und f ′ (x0 ) 6= 0 Dann ist f −1 : (c, d) → (a, b) in y0 = f (x0 ) differenzierbar
mit Ableitung
1
1
= ′ −1
(f −1 )′ (y0 ) = ′
f (x0 )
f (f (y0 ))
(genauso für fallend)
Bemerkung: Wenn wir die Differenzierbarkeit von f −1 schon wüßten, dann folgt die Formel aus
der Kettenregel: denn f −1 ◦ f = id und id′ = 1 (=konstante Funktion x 7→ 1) ergeben nach
Kettenregel (f −1 )′ (f (x0 ) · f ′ (x0 )) = 1 also obige Formel. Man sieht: die Bedingung f ′ (x0 ) 6= 0
ist notwendig.
∆x
Γf −1
∆y
b
Γf
(0.693, 2)
(2, 0.693)
∆y
b
∆x
Abbildung 6.17: f (x) = ln x und f −1 (x) = exp x
Umkehrabbildung bilden: Man vertauscht die Rollen von x und y. Meist spiegelt man einfach
an der Diagonalen, damit die Achsen wie üblich liegen (Sie Abbildung 6.17).
116
6 Differentialrechnung
Beweis: Es sei y0 := f (x0 ) und y ∈ (c, d) − {y0 }. Da f −1 injektiv ist, gilt f −1 (y) 6= f −1 (y0 ) und
wir können schreiben:
f −1 (y) − f −1 (y0 )
=
y − y0
1
y − y0
f −1 (y) − f −1 (y0 )
=
(f
1
− (f ◦ f −1 )(y0 )
f −1 (y) − x0
◦ f −1 )(y)
(∗)
Lassen wir jetzt y eine beliebige Folge (yn )n∈N mit lim yn = y0 und yn 6= y0 durchlaufen,
n→∞
dann ist die Folge (xn )n∈N := (f −1 (yn ))n∈N wegen der Stetigkeit von f −1 konvergent mit Limes
lim xn = x0 . In (∗) einsetzen ergibt:
n→∞
1
(f
◦ f −1 )(y
n ) − f (x0 )
f −1 (yn ) − x0
=
1
f (xn ) − f (x0 )
xn − x0
Da f in x0 differenzierbar ist, existiert dieser Grenzwert für alle Folgen (yn )n∈N mit lim yn = y0 ,
n→∞
yn 6= y0 und es folgt
lim
y→y0
f −1 (y) − f −1 (y0 )
= lim
x→x0
y − y0
1
f (x) − f (x0 )
x − x0
=
1
f ′ (x0 )
Die Voraussetzung monoton und stetig wurden für f −1 stetig verwendet.
Der natürliche Logarithmus ln : (0, ∞) →
erklärt worden. Damit ergibt sich dann:
Satz 6.15:
ln : (0, ∞) →
R war als Umkehrfunktion von exp : R → (0, ∞)
R ist auf (0, ∞) differenzierbar mit Ableitung ln′(x) = 1/x.
Beweis: y = ex : ln(y) =
1
1
1
= x = .
x
′
(e )
e
y
Daraus ergibt sich:
Satz 6.16:
Für r ∈
ist x 7→ xr als Funktion von (0, ∞) nach
r
′
r−1
(x ) = r · x
R
R differenzierbar mit Ableitung
Beweis: nach Definition gilt xr = er·ln x . nach Kettenregel ergibt sich:
(xr )′ = (er·ln x )′ = er·ln x · (r ln x)′ = xr ·
r
= xr−1 · r
x
R
√
Dazu gehört z.B. auch die Funktion
: [0, ∞) → (deren Ableitung wurde schon direkt mit
der Definition bestimmt).
Was ist los für x = 0? Beispiel: Die Funktion x 7→ x3 zeigt: Diese Funktion ist überall differenzierbar, streng monoton steigend also bijektiv und doch ist die Umkehrfunktion nicht überall
differenzierbar! wo?
117
6.1 Ableitung
Klassische Notation
In der klasischen Notation schreibt man für die Abbildung x 7→ f (x) den Ausdruck y = f (x).
Dabei nennt man x die unabhängige und y die abhängige Variable.
statt
f (x0 + h) − f (x0 )
h→0
h
f ′ (x0 ) = lim
dy
∆y
= lim
dx ∆x→0 ∆x
mit ∆y = f (x1 ) − f (x0 ),
schreibt man
∆x = x1 − x0 ,
x1 6= x0
dy
tatsächlich als Quotient
In den Geburtsjahren der Differential- und Integralrechnung wurde dx
— nämlich unendlich kleiner — infinitesimaler — Größen aufgefaßt. dx“ und dy“ heißen Diffe”
”
rentiale — diese sind als unendlich kleine“ Zahlen für uns selbständig nich existent, sondern nur
”
∆y
der Grenzwert f ′ (x0 ) = lim ∆x
. Das Hantieren mit dx und dy ist jedoch unheimlich praktisch
∆x→0
denn man darf — wie die Regeln der Differentialrechnung zeigen — mit ihnen rechnen“ wie in
”
der Bruchrechnung.
Beispiel: Umkehrsatz: y = f (x), x = f −1 (y):
dx
1
= dy
dy
dx
Kettenregel: y = f (x), z = g(y):
dz
dz dy
=
·
dx
dy dx
Ableitung von Potenzreihen
Beispiele hierzu hatten wir bereits
cos. Bewiesen hatten wir ausserdem
P∞kennengelernt:
P∞exp, sin,
i
i−1
das Korollar Die Potenzreihen i=0 ai x und i=1 iai x
haben den gleichen Konvergenzradius, d.h. sie konvergieren für die gleichen Argumente - bis auf möglicherweise die Intervallendpunkte.
P
P∞
P∞
i−1 ist aber die gliedweise abgeleitete Reihe
i
n
Die Reihe ∞
i=1 iai x
i=0 ai x . Da aber
n=0 an x
im Allgemeinen keine endliche Summe, sondern ein Grenzwert ist, und das Differenzieren ebenfalls das Bilden eines Grenzwertes ist, liegt eine Vertauschung von Grenzwerten vor:
!′
∞
∞
X
X
?
n
an x
=
(an xn )′
Es gilt tatsächlich
Satz 6.17:
P∞
n
Es sei f (x) =
n=0 an x eine konvergente Potenzreihe. Dann ist f differenzierbar und es
P
∞
n−1
′
für x ∈ (−r, +r)
gilt f (x) = n=1 nan x
Beweis: Der Beweis wird später nachgetragen (siehe z.B. Satz 8.38).
Anwendung:
118
6 Differentialrechnung
1. Identitätssatz für Potenzreihen: Man kann wie bei Polynomen vorgehen.
2. P
Potenzreihenentwicklung: Wir wissen: für |x| < 1 konvergiert die geometrische
Reihe
P∞
∞
1
i
i
i−1 x ,
i=0 (−1) x mit Limes 1+x . Diese Reihe ist also die Ableitung der Reihe
i=1 (−1)
i
P
′
∞
xi
1
1
i−1
′
= 1+x . Andererseits gilt ln(1 + x) = 1+x . Für |x| < 1 haben
d.h.
i=1 (−1)
i
P∞
i
also ln(1 + x) und i=1 (−1)i−1 xi die gleiche Ableitung. Wir werden später beweisen:
Gilt f ′ = g′ auf
I, dann ist f = g + c mit einer Konstanten c. Also
P einem Intervall
i−1 xi . x = 0 einsetzen zeigt c = 0. Also:
ln(1 + x) = c + ∞
(−1)
i=1
i
ln(1 + x) =
∞
X
xi
(−1)i−1
i
i=1
für |x| < 1
√
√
Genauso: arcsin′ (x) = 1/ 1 − x2 . Aus der Reihe für 1/ 1 − x2 erhält man die Reihe für
arcsin:
∞
X
1 · 3 · 5 · · · · · (2k − 1) x2k+1
·
für |x| < 1
arcsin(x) =
2 · 4 · 6 · . . . · 2k
2k + 1
k=1
6.2
Der Mittelwertsatz
Vorbemerkung: Was ein (absolutes) Maximum oder Minimum ist, wurde bereits definiert.
Definition 6.6:
f :D→
R sei eine Funktion,x0 ∈ D, D ⊂ R.
1. f hat ein lokales Maximum an der Stelle x0 :⇔ Es gibt ein δ > 0, so daß für alle
x ∈ (x0 − δ, x0 + δ) ∩ D gilt: f (x) ≤ f (x0 )
2. f hat ein striktes lokales Maximum an x0 :⇔ Es gibt ein δ > 0, so daß für alle
x ∈ (x0 − δ, x0 + δ) ∩ D gilt: f (x) < f (x0 ) und x 6= x0 . Analog: Minimum
Die beiden Fälle Minimum bzw. Maximum werden unter dem Begriff Extremwert zusammengefaßt.
lokales und absolutes
Maximum.
Aber f ′ (b) 6= 0.
a
b
Abbildung 6.18: Lokales und Absolutes Maximum bei einem Randpunkt
119
6.2 Der Mittelwertsatz
R
Betrachten wir jetzt eine differenzierbare Funktion f : (a, b) →
mit lokalem Extremwert x0
im Inneren. Dann ist in diesem Punkt die Tangente offensichtlich waagrecht, also f ′ (x0 ) = 0
(Steigung = 0) oder: Ist s(t) die Entfernung eines Teilchens auf einer Geraden von einem festen
Punkt und erreicht dieses Teilchen bei x0 einen Extremwert an Entfernung, so kehrt es dort um
— zumindest lokal, seine Geschwindigkeit muß also einmal verschwinden (da beim Umkehren
ein momentaner Stillstand erforderlich ist).
Satz 6.18:
R
Die Funktion f : (a, b) →
sei in x0 ∈ (a, b) differenzierbar und besitze bei x0 einen
lokalen Extremwert. Dann gilt f ′ (x0 ) = 0.
Beweis (Für den Fall eines lokalen Maximums): Nach Voraussetzung gibt es ein δ > 0 mit
f (x) ≤ f (x0 ) für x ∈ (x0 − δ, x0 + δ) ∩ (a, b). Für h mit |h| < δ und x0 + h ∈ (a, b) ist
f (x0 + h) − f (x0 )
≤0
h
f (x0 + h) − f (x0 )
≥0
h
Da der Grenzwert lim
n→∞
eine Nullfolge mit hn >
ist f ′ (x0 ) = 0.
für h positiv (Zähler ≤ 0 da f (x) ≤ f (x0 ))
für h negativ
f (x0 +hn )−f (x0 )
nach Voraussetzung für alle Nullfolgen gleich ist,
hn
0, daß f ′ (x0 ) ≤ 0, und eine Nullfolge mit hn < 0, daß f ′ (x0 ) ≥ 0.
zeigt
Also
Beachte: Wichtig ist hier, daß um den Punkt x0 — wo f seinen lokalen Extremwert annimmt —
noch eine ganze δ-Umgebung (x0 − δ, x0 + δ) im Definitionsbereich von f liegt! bei I = (a, b) ist
dies automatisch der Fall. Das Beispiel aus Abbildung 6.18 zeigt, was passiert, wenn dies nicht
so ist, wie z.B. bei den Randpunkten eines abgeschlossenen Intervalls.
Nützt man jetzt aus, daß auf einem abgeschlossenen Intervall jede stetige Funktion ein absolutes
Maximum und Minimum annimmt, so erhält man
Satz 6.19 (Satz von Rolle):
R
R
Die Funktion f : [a, b] →
sei stetig, die eingeschränkte Funktion f : (a, b) →
sei
′
differrenzierbar und es gelte f (a) = f (b). Dann gilt: Es gibt ein x0 ∈ (a, b) mit f (x0 ) = 0.
b
f (a) = f (b)
b
b
b
b
a
x0 mit f ′ (x0 ) = 0
b
Abbildung 6.19: Skizze zum Satz von Rolle
Beweis:
1. f konstant: f ′ (x) = 0 für alle x. Also ist jedes x0 erlaubt.
b
120
6 Differentialrechnung
2. f nicht konstant: M := max{f (x) | x ∈ [a, b]} und m := min{f (x) | x ∈ [a, b]} sind
ungleich (M 6= m). Wegen f (a) = f (b) werden nicht beide am Rand angenommen und es
muß im Inneren von [a, b], d.h. in (a, b), einen lokalen Extremwert geben. Nach Satz 6.18
gilt dort f ′ (x0 ) = 0.
Damit folgt leicht
Satz 6.20 (Mittelwertsatz der Differentialrechnung, MWS):
R
Es sei f : [a, b] → stetig und f auf (a, b) differenzierbar. Dann gibt es ein ξ ∈ (a, b) mit
f (b) − f (a)
f ′ (ξ) =
.
b−a
Beweis: Man verwende den Satz von Rolle auf folgende Hilfsfunktion an:
g(x) = f (x) − f (a) −
|
f (b) − f (a)
(x − a)
b {z
−a
}
Gerade“
”
g erfüllt alle Voraussetzungen von Satz 6.19. Also gibt es ein ξ ∈ (a, b) mit g′ (ξ) = 0, d.h.
(a)
g′ (ξ) = f ′ (ξ) − 0 − f (b)−f
= 0.
b−a
b
b
b
b
a
ξ
ξ
b
Abbildung 6.20: Zur geometrischen Bedeutung des Mittelwertsatzes
(a)
Geometrische Bedeutung: f (b)−f
ist die Sekantensteigung und f ′ (ξ) die Tangentensteigung
b−a
im Punkt ξ. Der Mittelwertsatz sagt: Es gibt zur Sekanten eine parallele Tangente, oder: Die
Durchschnittsänderungsrate von f wird an einer Stelle als Momentanänderungsrate angenommen.
Oder: Die Durchschnittsgeschwindigkeit wird an einer Stelle als Momentangeschwindigkeit angenommen (anschaulich klar).
Andere Schreibweise: f (x + h) = f (x) + h · f ′ (ξ) mit ξ zwischen x und x + h.
Interpretation: Änderungsrate von f — nämlich f (x+h)−f (x) — läßt sich durch f ′ — allerdings
an einer meist unbekannten Stelle ξ — beschreiben.
Bemerkung: Der Mittelwertsatz ist ein wichtiges Hilfsmittel bei Beweisen, um von Kenntnis
von f ′ auf das Verhalten von f zu schließen, d.h. um von lokalen auf globale Eigenschaften zu
schließen.
121
6.2 Der Mittelwertsatz
Anwendungsbeispiele für diese Schlußweise (von lokal zu global):
Satz 6.21:
f : (a, b) →
R sei differenzierbar und f ′(x) = 0 für alle x ∈ (a, b). Dann ist f konstant.
Beweis: x1 , x2 ∈ (a, b) vorgegeben. Es sei x1 < x2 . Wir können den Mittelwertsatz auf [x1 , x2 ]
anwenden und erhalten f (x2 ) − f (x1 ) = (x2 − x1 ) · f ′ (ξ) = 0 mit ξ ∈ (x1 , x2 ), denn f ′ (ξ) = 0.
Also f (x2 ) = f (x1 ).
Ganz ähnlich folgt:
Satz 6.22:
R
f : (a, b) →
sei differenzierbar und f ′ (x) > 0 für alle x ∈ (a, b). Dann ist f streng
monoton steigend.
Beweis: x1 , x2 ∈ (a, b) mit x1 < x2 seien vorgegeben. Wir müssen f (x1 ) < f (x2 ) zeigen. Wir
können den Mittelwertsatz [x1 , x2 ] anwenden:
f (x2 ) − f (x1 ) = (x2 − x1 ) · f ′ (ξ)
| {z } | {z }
>0
für ein ξ ∈ (x1 , x2 )
>0
Also gilt f (x2 ) > f (x1 ).
Analog mit f ′ (x) < 0 und monoton fallend.
Jeder kennt aus der Schule das Beispiel x 7→ x3 mit Ableitung 0 im Nullpunkt — ohne daß dort
ein Extremwert vorliegt. Die Bedingung f ′ (x0 ) = 0 ist also nur notwendig, nicht aber hinreichend
für das Vorliegen eines lokalen Extremwertes. Eine hinreichende Bedingung liefert
Satz 6.23:
R
sei differenzierbar, x0 ∈ (a, b) mit f ′ (x0 ) = 0. Es gebe ein δ > 0, so daß
f : (a, b) →
(x0 − δ, x0 + δ) ⊂ (a, b) und f ′ auf (x0 − δ, x0 + δ) von positiven zu negativen Werten
übergeht (genauer: Für alle x ∈ (x0 − δ, x0 + δ) − {x0 } gilt x < x0 ⇒ f ′ (x) > 0 und
x > x0 ⇒ f ′ (x) < 0).
Dann gilt: f hat in x0 ein striktes lokales Maximum.
Beweis: Es sei x aus der genannten δ-Umgebung von x0 . Für ein passendes ξ zwischen x und
x0 gilt nach dem Mittelwertsatz
f (x) − f (x0 ) = (x − x0 ) · f ′ (ξ)
Ist x < x0 , dann ist f ′ (ξ) > 0 (da auch ξ < x0 ) also f (x) < f (x0 ).
Ist x > x0 , dann ist f ′ (ξ) < 0 (da auch ξ > x0 ) also f (x) < f (x0 ).
Nimmt man an, daß die zu untersuchende Funktion weitere Differenzierbarkeitseigenschaften
hat, dann kann man den letzten Satz wie folgt umformulieren.
Satz 6.24:
R
Es sei f : (a, b) → differenzierbar und die Ableitungsfunktion sei ebenfalls differenzierbar
in x0 ∈ (a, b) mit Ableitung f ′′ (x0 ). Es gelte f ′ (x0 ) = 0. Dann gilt:
122
6 Differentialrechnung
Minimum
Maximum
b
x0
b
x0
b
x0
b
x0
Abbildung 6.21: Nullstellen der Ableitung und Extremwerte
1. Aus f ′′ (x0 ) < 0 folgt: f hat ein lokales Maximum bei x0 .
2. Aus f ′′ (x0 ) > 0 folgt: f hat ein lokales Minimum bei x0 .
Bemerkung: Mit f ′′ = (f ′ )′ wird die Ableitung von f ′ bezeichnet. Beachte, daß zur Bildung von
f ′′ (x0 ), die Differenzierbarkeit von f — d.h. die Existenz von f ′ — in einer ganzen Umgebung
von x0 gefordert werden muß!
Beweis: f ′ in x0 differenzierbar ⇒ f ′ in x0 stetig. f ′′ (x0 ) < 0 ⇒ Es gibt eine ε-Umgebung von
′
′ (x )
′
′ (x )
0
0
x0 auf der f (x)−f
< 0 gilt (Satz 5.5, Seite 85: x 7→ f (x)−f
ist in 0 Stetig, mit Wert
x−x0
x−x0
′′
′
′
f (x0 )). Für x < x0 ist dann f (x) > f (x0 ) = 0, für x > x0 ist dann f ′ (x) < f ′ (x0 ) = 0. Aus
Satz 6.23 folgt dann die Behauptung.
Bemerkung: Dieser Satz ist natürlich auch nur hinreichend, nicht notwendig, wie das Beispiel
x 7→ x4 im Nullpunkt zeigt.
Um den Mittelwertsatz auf die Berechnung von Grenzwerten anwenden zu können, benötigen
wir eine einfache Umformulierung
Satz 6.25 (2-ter Mittelwertsatz der Differentialrechnung):
Die Funktionen f und g seien in [a, b] stetig und in (a, b) differenzierbar. Dann gibt es ein
ξ ∈ (a, b) mit
g′ (ξ) · f (b) − f (a) = f ′ (ξ) · g(b) − g(a)
Beweis: Wie verwenden die Hilfsfunktion
h(x) := f (b) − f (a) g(x) − g(a) − g(b) − g(a) f (x) − f (a)
Da h(a) = h(b) = 0 gilt, können wir auf h den Satz von Rolle anwenden: Es gibt ein ξ ∈ (a, b)
mit h′ (ξ) = 0. D.h.
h′ (ξ) = (f (b) − f (a)) · g′ (ξ) − (g(b) − g(a)) · f ′ (ξ) = 0
Daraus folgt dann die Behauptung.
Bemerkung:
1. Mit g(x) = x erhält man den alten Mittelwertsatz.
123
6.3 Untersuchung von Funktionen (Kurvendiskussion)
2. Mann kann den 2-ten Mittelwertsatz nicht einfach durch zweimaliges Anwenden des Mittelwertsatzes auf beide Funktionen f und g beweisen, da die Zwischenstellen dann verschieden
sein können.
3. Ist g′ (x) 6= 0 für alle x ∈ (a, b), dann muß auch g(b) − g(a) 6= 0 gelten (Mittelwertsatz)
und man kann schreiben
f (b) − f (a)
f ′ (ξ)
= ′
für ein ξ ∈ (a, b)
g(b) − g(a)
g (ξ)
6.2.1
Regel von L’Hospital
Wir können mit den Grenzwertsätzen nur dann
lim f (x)
f (x)
x→a g(x)
in
lim
x→a
lim g(x)
x→a
umformen, wenn lim g(x) 6= 0 gilt. Was passiert wenn lim f (x) = lim g(x) = 0 gilt? Aus dem
x→a
x→a
x→a
2-ten Mittelwertsatz erhält man
Satz 6.26 (Regel von L’Hospital):
Für ein ε > 0 seien die Funktionen f und g auf D = (a − ε, a + ε) − {a} differenzierbar.
Es gelte lim f (x) = 0, lim g(x) = 0, g(x) 6= 0 und g′ (x) 6= 0 für alle x ∈ D. Dann gilt:
Wenn
x→a
′ (x)
lim fg′ (x)
x→a
x→a
f (x)
x→a g(x)
existiert, dann auch lim
und beide Grenzwerte sind gleich.
Beweis: Die Funktionen f und g brauchen für a nicht definiert zu sein. Falls nötig ändern wir
ihre Definition dort in f (a) = 0 und g(a) = 0 ab. Dann besagt ein Teil der Voraussetzung,
daß f und g stetig auf (a − ε, a + ε) sind. Die Voraussetzung g(x) 6= 0 für alle x 6= a folgt
automatisch mit dem Mittelwertsatz aus g′ (x) 6= 0 für x 6= a (ist also immer erfüllt). Mit
′ (ξ )
(x)
x
dem 2-ten Mittelwertsatz gibt es zu x ∈ D ein ξx zwischen x und a mit fg(x)
= fg′ (ξ
(2-ten
x)
ε
ε
Mittelwertsatz auf (a − 2 , a) bzw. (a, a + 2 ) anwenden). Lassen wir jetzt x gegen a streben, dann
geht ξx auch gegen a, denn es liegt ja zwischen a und x. Hieraus folgt die Behauptung.
Beispiel: f (x) = sin x, g(x) = x, f (0) = 0, g(0) = 0, f ′ (x) = cos x, g′ (x) = 1 also existiert
′ (x)
lim fg′ (x)
= 11 da x 7→ cos(x) stetig ist. Damit folgt — was wir schon wissen — lim sinx x = 1 △
x→0
x→0
f (x)
x→∞ g(x)
Bemerkung: Durch Umformulierung kann man analoge Regeln für Grenzwerte der Art lim
f (x)
x→a g(x)
und lim
6.3
wenn f und g für x gegen a (oder gegen ∞) unbeschränkt wachsen, aufstellen.
Untersuchung von Funktionen (Kurvendiskussion)
Um zu zeigen, daß man mit den bisher bereitgestellten Methoden tatsächlich recht gut Funktionen untersuchen kann, betrachten wir die trigonometrischen Funktionen. Für uns sind Sinus
und Cosinus durch Potenzreihen definiert:
∞
X
x2 x4 x6 x8
x2k
cos(x) = 1 −
+
−
+
− ··· =
(−1)k
2!
4!
6!
8!
(2k)!
k=0
sin(x) = x −
x3
3!
+
x5
5!
−
x7
7!
+ ··· =
∞
X
k=0
(−1)k
x2k+1
(2k + 1)!
124
6 Differentialrechnung
Exkurs: Der Satz von Darboux
R
R
Es sei h : (a, b) → eine differenzierbare Funktion. Beispiele zeigen, daß h′ : (a, b) → nicht
stetig zu sein braucht. Trotzdem ist h′ nicht willkürlich sondern schon recht nahe an einer
stetigen Funktion: h′ hat keine Sprungstellen, es gilt nämlich:
Satz 6.27 (Satz von Darboux):
f :I →
sei differenzierbar, [a, b] ⊂ I mit I ⊂
offenes Intervall. Dann nimmt die
′
′
Funktion f|[a,b] : [a, b] →
jeden Wert zwischen f (a) und f ′ (b) an, d.h. f ′ ist nicht
unbedingt stetig, hat aber Zwischenwerteigenschaft auf jedem Teilintervall (und damit
keine Sprungstellen, wie leicht folgt).
R
R
R
Beweis:
1. Vorüberlegung: Es sei f ′ (a) > 0 unf f ′ (b) < 0. Behauptung: Es gibt ein ξ ∈ (a, b) mit
f ′ (ξ) = 0.
Aus f ′ (a) > 0 und f ′ (b) < 0 folgt: Für alle hinreichend dicht bei a liegenden x > a gilt
f (x) > f (a) und für gewisse x < b auch f (x) > f (b).
Das Maximum M von f auf [a, b] (existiert da f stetig ist) ist also größer als f (a) und f (b),
liegt also in (a, b). ξ sei eine Stelle wo M angenommen wird. Dort gilt aber f ′ (ξ) = 0 nach
Satz 6.18 denn es liegt ein lokaler Extremwert vor.
2. Vorüberlegung: Es sei f ′ (a) < 0 und f ′ (b) > 0. Analog zur ersten Überlegung wird gezeigt:
Es gibt ein ξ ∈ (a, b) mit f ′ (ξ) = 0.
Es sei f ′ (a) 6= f ′ (b) und λ ein Zwischenwert zwischen f ′ (a) und f ′ (b). Betrachte die Hilfsfunktion g(x) := f (x) − λx und wende Überlegung 1 oder Überlegung 2 an.
b
?
?
b
b
a
ξ
Abbildung 6.23: Skizze zum Satz von Darboux
b
125
6.3 Untersuchung von Funktionen (Kurvendiskussion)
1
−1
π
2
3
2π
π
2π
Abbildung 6.22: Die Graphen von Sinus (durchgezogen) und Cosinus (gestrichelt)
Es ist
x2
x2
x6
x2
1−
−
1−
− ···
cos(x) = 1 −
2!
3·4
6!
7·8
Wir sehen, daß sofern die Klammern positiv sind, von 1 immer nur etwas positives abgezogen
2
x2
4
wird. Für 0 < x < 7 gilt also cos(x) < 1− x2! (1− 3·4
). Insbesondere cos(2) ≤ 1− 42 1 − 3·4
= − 13 .
Wegen cos(0) = 1 und cos(2) < 0 liegt also im Intervall (0, 2) mindestens eine Nullstelle von cos.
Dort liegt aber auch nur eine Nullstelle von cos, denn
x2
x5
x2
sin(x) = x 1 −
+
1−
+ ···
3!
5!
6·7
√
impliziert sin(x) > 0 für 0 < x < 6 also cos′ (x) = − sin(x) < 0 in diesem Bereich. D.h. cos ist
streng monoton fallen auf (0, 2) und kann deshalb nur eine Nullstelle haben.
Definition 6.7:
π/2 := Nullstelle von cos in (0, 2) = kleinste positive Nullstelle von cos.
Damit wissen wir, daß cos : [0, π2 ] → [0, 1] bijektiv ist und wir können wir definieren:
Definition 6.8:
arccos : [0, 1] → [0, π2 ] ist die Umkehrfunktion von cos.
Wegen sin′ (x) = cos(x) > 0 für x ∈ (0, π2 ) ist Sinus dort streng monoton wachsend und daher
ist sin : [0, π2 ] → [0, 1] bijektiv.
Definition 6.9:
arcsin : [0, 1] → [0, π2 ] ist die Umkehrfunktion von sin.
R
Mit den Additionstheoremen erhält man die Graphen von Sinus und Cosinus auf ganz . Insbesondere: Nullstellen von cos := {π/2 + nπ | n ∈ } Nulstellen von sin := {nπ | n ∈ }. Damit
können wir definieren:
Z
Z
Definition 6.10:
Für x ∈ − {π/2 + nπ | n ∈ } definieren wir den Tangens (kurz: tan als
R
Z
tan(x) :=
Für x ∈
sin(x)
cos(x)
R − {nπ | n ∈ Z} definieren wir den Cotangens (kurz: cot) als
cot(x) :=
cos(x)
sin(x)
126
6 Differentialrechnung
π
2
b
b
−1
π
π
2
1
− π2
b
b
−1
1
Abbildung 6.24: Die Graphen von Arcussinus (links) und Arcuscosinus (rechts) im erweiterten
Definitionsbereich (siehe Bemerkung auf Seite 128)
Die Ableitung vom Tangens ist
tan′ x =
cos2 x − (− sin x) sin x
1
sin2 x
=
=1+
= 1 + tan2 x
2
2
cos x
cos x
cos2 x
R
streng monoton steigt, also bijektiv
Daraus können wir folgern, daß tan : (−π/2, +π/2) →
ist. tan :
− {π/2 + nπ | n ∈ } ist periodisch mit Periode π. Um die Umkehrfunktion des
Tangens“ einführen zu können muß man sich auf einen Zweig“ beschränken. So z.B.:
”
”
Definition 6.11:
Der Arcustangens (kurz: arctan : → (−π/2, +π/2)) sei die Umkehrfunktion des Tangens (tan : (−π/2, +π/2) → ).
R
Z
R
R
Ebenso:
Definition 6.12:
Der Arcuscotangens (kurz: arccot :
(cot : (0, π) → ).
R
6.3.1
R → (0, π)) sei die Umkehrfunktion des Cotangens
Ableitung der Arcus-Funktionen
Die Ableitungsfunktionen von Arcussinus und Arcuscosinus
Es sei x = arcsin y, bzw. y = sin x. Dann gilt:
p
p
dy
= cos x = 1 − sin2 x = 1 − y 2
dx
also
Das heißt, es gilt:
Satz 6.28:
1
arcsin′ (y) = p
1 − y2
Ebenso ergibt sich für den Arcuscosinus:
Satz 6.29:
arccos′ (y) = − p
1
1 − y2
dx
1
=p
dy
1 − y2
127
6.3 Untersuchung von Funktionen (Kurvendiskussion)
−π
− π2
9
9
8
8
7
7
6
6
5
5
4
4
3
3
2
2
1
1
π
2
−1
π
−π
− π2
π
2
−1
−2
−2
−3
−3
−4
−4
−5
−5
−6
−6
−7
−7
−8
−8
−9
−9
Abbildung 6.25: Die Graphen von Tangens (links) und Cotangens (rechts)
π
128
6 Differentialrechnung
Die Ableitungsfunktionen von Arcustangens und Arcuscotangens
Es sei x = arctan y, bzw. y = tan x. Dann gilt
dy
dx
= 1 + y 2 . Also:
Satz 6.30:
arctan′ (y) =
1
1 + y2
und ebenso für den Arcuscotangens:
Satz 6.31:
arccot′ (y) = −
1
1 + y2
Bemerkung: Wegen sin(−x) = − sin(x) kann man leicht sehen, daß der Sinus auch als bijektive
Abbildung von [− π2 , π2 ] nach [−1, +1] aufgefaßt werden kann. Auch die Umkehrfunktion dieser
Abbildung heißt dann Arcussinus. Genauso beim Cosinus: cos : [0, π] → [−1, +1].
π
2
−6
−5
−4
−3
−2
−1
1
2
3
− π2
Abbildung 6.26: Der Graph von Arcustangens
4
5
6
7
Taylor-Entwicklung
7.1
Taylorpolynome und Restterme
Frage: Kann man einen gegebene Funktion f : (a, b) →
?
f (x) =
∞
X
i=0
ai (x − x0 )i
R in eine Potenzreihe ”entwickeln“
x0 wird Entwicklungspunkt genannt.
Eng damit zusammen hängt die Frage, ob man f nicht nur linear sondern polynominal approximieren kann, d.h.
f (x + h) − f (x) = Polynom in h + Rest
Da Potenzreihen beliebig oft differenzierbar sind, muß gleiches für f vorausgesetzt werden.
Definition 7.1:
f : (a, b) →
heißt auf (a, b) k-mal differenzierbar (k ∈ ) :⇔ f ′ , f ′′ , . . . , f (k)
existieren.
Hierbei ist f (k) rekursiv als Ableitung von f (k−1) mit f (1) = f ′ erklärt.
f ist beliebig oft differenzierbar, wenn f für jedes k ∈ k-mal differenzierbar ist.
R
N
N
P
Erstes Ziel: Wie erhält man (Kandidaten für) die ai in
ai (x − x0 )i ? Dazu untersuchen wir
n
P
zuerst einmal Polynome: f (x) =
ai xi sei Polynom in x. t ∈ fest. Wir wollen f als Polynom
R
i=0
in (x − t) schreiben:
f (x) =
?
X
i=0
bi (x − t)i = b0 + b1 (x − t) + b2 (x − t)2 + · · ·
Wie berechnet man die bi ? Setzt man x = t, so folgt durch Einsetzen b0 = f (t). Dann bildet
man für beide Darstellungen die Ableitung.
f ′ (x) =
n
X
ai ixi−1 =
i=1
?
X
j=0
bj j(x − t)j−1 = b1 + 2b2 (x − t) + 3b3 (x − t)2 + · · ·
x = t liefert f ′ (t) = 1 · b2 . Genauso f ′′ (t) = 2 · b2 . Allgemein gilt:
bi =
f (i) (t)
i!
Damit folgt für Polynome:
f (x) =
n
X
i=0
ai xi =
n
X
f (j) (t)
j=0
j!
(x − t)j
(Beachte: f (k) = 0 für k > n)
130
7 Taylor-Entwicklung
Beispiele:
1.
f (x) = x2 + 3x + 4
= (t2 + 3t + 4) · 1 +
(2t + 3)
2
(x − t) + (x − t)2
1!
2!
2.
n
x
=
n
X
n(n − 1)(n − 2) · · · (n − γ + 1)
γ!
γ=0
=
n X
n
γ=0
′
γ
tn−γ (x − t)γ
tn−γ (x − t)γ
′′
△
Das Polynom f (t) + f 1(t) (x − t) + f 2!(t) (x − 2)2 + · · · +
differenzierbaren Funktion f bilden.
f (n) (t)
n! (x
− t)n kann man für jede n-mal
Definition 7.2:
sei n-mal differenzierbar, t ∈ (a, b). Das n-te Taylorpolynom von f ist
f : (a, b) →
per Definition das folgende Polynom in x (t heißt Entwicklungspunkt):
R
n
X
f (γ) (t)
γ=0
γ!
(x − t)γ
Also: Ist f selbst ein Polynom in x von Grad ≤ n, so sind nach obiger Überlegung f und sein
n-tes Taylorpolynom gleich.
Um zu sehen, wie gut bei einer beliebigen Funktion f das Taylorpolynom die Funktion approximiert definiert man:
Rn (x, t) := f (x) −
n−1
X
ν=0
|
f (ν) (t)
(x − t)ν
ν!
{z
}
(Restterm)
(n − 1)-tes Taylorpolynom
Man zieht von f das (n − 1)-te Taylorpolynom ab. Dazu muß f (n − 1)-mal differenzierbar sein.
Dieser Restterm muß jetzt näher untersucht werden. Betrachte n = 1
R1 (x, t) = f (x) − f (t)
= f ′ (ξ)(x − t)
(nach Mittelwertsatz)
Wir suchen nach einer Verallgemeinerung dieser Gleichung:
In der Gleichung
f (x) = f (t) +
f ′ (t)
f ′′ (t)
f (n−1) (t)
(x − t) +
(x − t)2 + · · · +
(x − t)n−1 + Rn (x, t)
1!
2!
(n − 1)!
(∗)
131
7.1 Taylorpolynome und Restterme
kommen zwei Variablen vor, nämlich x und t. Wir halten x fest und betrachten t als unabhängige
Variable.
Unter der Voraussetzung, daß f : (a, b) →
n-mal differenzierbar sei, ist Rn (x, t) auch nach t
differenzierbar (denn f (x) ist in t konstant und f (i) (t) ist jeweils nochmal differenzierbar).
Wir leiten (∗) nach t ab und erhalten:
′′
′′′
f (t)
f ′ (t)
f (t)
f ′′ (t)
2
′
(x − t) −
+
(x − t) − 2
(x − t) + · · ·
0 = f (t) +
1!
1!
2!
2!
R
Man sieht die Terme heben sich wechselseitig auf und es bleibt:
0=
d
f (n) (t)
(x − t)n−1 + Rn (x, t)
(n − 1)!
dt
(∗∗)
Auf t 7→ Rn (x, t) wenden wir den Mittelwertsatz an (für x 6= t). Dann gilt
Rn (x, x) − Rn (x, t)
f (n) (ξ)
(∗∗)
= R′n (x, ξ) = −
(x − ξ)n−1
x−t
(n − 1)!
für ein ξ zwischen x und t. Wegen Rn (x, x) = 0 heißt dies
f (n) (ξ)
(x − ξ)n−1 (x − t)
(n − 1)!
Rn (x, t) =
Umformulierung: Jedes ξ zwischen x und t läßt sich als ξ = t + ϑ(x − t) mit ϑ ∈ (0, 1) schreiben,
d.h. x − ξ = x − t − ϑ(x − t) = (x − t)(1 − ϑ). Damit haben wir bewiesen:
Satz 7.1 (Restglied von Cauchy):
Rn (x, t) =
f (n) (t + ϑ(x − t))
(x − t)n (1 − ϑ)n−1
(n − 1)!
Man kann auch den 2.-ten Mittelwertsatz anwenden und zwar auf die Funktionen h(u) =
Rn (x, u) und g(u) = (x − u)n und das Intervall mit x und t als Randpunkten.
Rn (x, x) − Rn (x, t)
g(x) − g(t)
=
−Rn (x, t)
R′n (x, ξ)
=
↑
−g(t)
−n(x − ξ)n−1
2.-ter
MWS
(∗∗)
=
−
f (n) (ξ)
1
f (n) (ξ)
(x − ξ)n−1 ·
=
n−1
(n − 1)!
n!
−n(x − ξ)
Daraus folgt:
Satz 7.2 (Restglied von Lagrange):
Rn (x, t) =
Zusammengefaßt:
f (n) (ξ)
(x − t)n
n!
132
7 Taylor-Entwicklung
Satz 7.3 (Taylor’sche Formel):
f : (a, b) →
R sei n-mal differenzierbar und x, t ∈ (a, b)
1. Dann gibt es ein ϑ1 ∈ (0, 1) mit
f (x) = f (t) +
f (n−1) (t)
f ′ (t)
(x − t) + · · · +
(x − t)n−1
1
(n − 1)!
+
f (n) (t + ϑ1 (x − t))
(x − t)n (1 − ϑ1 )n−1
(n − 1)!
|
{z
}
(Cauchy Restglied)
2. Dann gibt es ein ϑ2 ∈ (0, 1) mit
f (x) = f (t) +
f ′ (t)
f (n−1) (t)
f (n) (t + ϑ2 (x − t))
(x − t) + · · · +
(x − t)n−1 +
(x − t)n
1
(n − 1)!
n!
{z
}
|
(Lagrange Restglied)
Weitere Restglieder finden sich in der Literatur. Später kommt noch das Integralrestglied hinzu.
Satz 7.4:
R
f : (a, b) → sei n-mal stetig differenzerbar (d.h. f (n) ist zusätzlich stetig).
Es gelte für ein x0 ∈ (a, b):
f (1) (x0 ) = f (2) (x0 ) = f (3) (x0 ) = · · · = f (n−1) (x0 ) = 0
und
f (n) (x0 ) 6= 0
Ist n ungerade, so ist f (x0 ) kein Extremwert. Ist n gerade, so gilt:
1. f (n) (x0 ) > 0 ⇒ f (x0 ) ist lokales Minimum;
2. f (n) (x0 ) < 0 ⇒ f (x0 ) ist lokales Maximum.
(n)
Beweis: Taylorformel in x0 liefert f (x) = f (x0 ) + 0 + · · · + 0 + f n!(ξ) (x − x0 )n für ein ξ zwischen
x und x0 . f (n) stetig ⇒ Es gibt ε, so daß f (n) (x) 6= 0 auf (x0 − ε, x0 + ε) ⇒ f (n) (x) > 0 oder
f (n) (x) < 0 auf (x0 − ε, x0 + ε).
Ist n ungerade, so wechselt (x − x0 )n beim Durchlaufen von x0 das Vorzeichen. In der Nähe von
f (x0 ) liegen also Werte, die größer und solche die kleiner als f (x0 ) sind. ⇒ erste Behauptung.
Ist n gerade, so ist
f (n) (ξ)
n! (x
f (n) (ξ)
n
n! (x − x0 ) < 0
(n)
f (ξ)
n
n! (x − x0 ) > 0 und
Aus
− x0 )n auf dem Intervall (x0 − ε, x0 + ε) entweder > 0 oder < 0.
folgt: f (x) ≤ f (x0 ), d.h. f (x0 ) ist lokales Maximum. Analoges gilt für
lokales Minimum.
grob: f (x) − f (x0 ) verhält sich ungefähr wie
f (n) (x0 )
(x − x0 )n . Satz 7.4 liefert nur ein hinn!
| {z }
M
reichendes Kriterium. Es gibt Funktionen mit lokalem Extremwert bei x0 und für alle n gilt
f (n) (x0 ) = 0
133
7.1 Taylorpolynome und Restterme
7.1.1
Näherungsweise Berechnung von Funktionswerten
R
R
Die Exponentialfunktion exp :
→
ist beliebig oft differenzierbar. Für x0 = t = 0 können
wir exp durch das (n − 1)-te Taylorpolynom und das Restglied von Lagrange angeben:
exp(x) =
n−1
X
i=0
f (i) (0) f (n) (ϑx) n
+
x
i!
n!
Für x = 1 ergibt sich dann
e=1+1+
1
1
1
eϑ
+ + ··· +
+
2! 3!
(n − 1)! n!
Der Witz hierbei ist: Wir können das Restglied abschätzen, ohne daß wir e und ϑ genau kennen:
ϑ
3
.
exp ist momoton: ϑ < 1 ⇒ eϑ < e1 . D.h. e ≤ 3 ⇒ eϑ < 3. Also ist en! < n!
Satz 7.5:
e∈
/
Q
Beweis: Angenommen e ∈
Q. Dann ist e = np mit n ≥ 2 und p, n ∈ N. D.h.
e=
1
1
1
eϑ
p
= 1 + 1 + + + ··· +
+
n
2! 3!
n! (n + 1)!
Multiplizieren mit n! ergibt:
e · n! = p(n − 1)! = n! + n! +
n! n!
eϑ
+
+ ··· + 1 +
2!
3!
(n + 1)
| {z }
muß ganzzahlig sein
Wegen eϑ < e ≤ 3 und n ≥ 2 folgt
eϑ
n+1
<
3
3
= 1, im Widerspruch zu
eϑ
n+1
ist ganz.
Berechnung von π: Für x ∈ (−1, 1) gilt für arctan x die folgende Taylorformel:
x3 x5 x7
+
−
+ ···
3
5
7
π
1
1
Zusätzlicher Trick: = 4 · arctan
− arctan
4
5
239
arctan(x) = x −
134
7.2
7 Taylor-Entwicklung
Taylorreihen
Definition 7.3:
1. f : (a, b) →
heißt C ∞ -Funktion :⇔ Für alle k ∈
f (k) (d.h. f ist beliebig oft auf (a, b) differenzierbar).
R
N existiert die k-te Ableitung
Die Menge der C ∞ -Funktionen auf (a, b) bezeichnen wir mit C ∞ ((a, b)) bezeichnet
werden.
2. C n ((a, b)) := {f : (a, b) →
R | f ist n-mal stetig differenzierbar.}
Zu einer C ∞ -Funktion f kann man — da für jedes n das n-te Taylorpolynom existiert — die
sogenannte Taylorreihe bilden:
Definition 7.4 (Taylorreihe):
Es sei f ∈ C ∞ ((a, b)). Die Potenzreihe
∞
X
f (n) (x0 )
n!
n=0
(x − x0 )n
heißt Taylorreihe von f mit Entwicklungspunkt x0 .
Es stellen sich 2 Fragen:
1. Konvergiert diese Reihe überhaupt — wenn ja wo?
2. Wenn ja, konvergiert sie obendrein gegen f ?
Im Allgemeinen ist die Antwort auf beide Fragen nicht immer ja:
Es gibt eine C ∞ -Funktion (f1 ), wo die Taylorreihe nur für x = x0 konvergiert. Es gibt eine
C ∞ -Funktion (f2 ), wo die Taylorreihe konvergiert und eine andere Funktion als f darstellt.
Beispiele:
1. f1 (x) =
∞
X
1
sin(n2 x) ist C ∞ -Funktion auf
2n
R; Taylorreihe für x0 konvergiert nur im
n=0
0-Punkt.
(
exp − x12
für x 6= 0
2. f2 (x) =
0
für x = 0
R
(n)
f2 ∈ C ∞ ( ) und f2 (0) = 0 für alle n. Die Taylorreihe von f2 ist 0.
1
−6
−5
−4
−3
−2
−1
1
2
Abbildung 7.1: Der Graph zu f2
3
4
5
6
△
135
7.2 Taylorreihen
Für Polynome und Potenzreihen erhält man nichts Neues:
Satz 7.6:
Es sei f : (a, b) →
R Funktion, die durch die Potenzreihe
f (x) =
∞
X
n=0
an (x − x0 )n
x0 ∈ (a, b)
für alle x ∈ (a, b) dargestellt wird. Dann ist die Taylorreihe (mit Entwicklungspunkt x0 )
von f , gleich dieser Potenzreihe und konvergiert gegen f .
Beweis: f (n) (x0 ) = n! an Man erhält die Ausgangsreihe zurück. Der Rest ist trivial.
Bemerkung: Da wir exp, sin, cos durch Potenzreihen definiert haben, kennen wir automatisch
deren Taylorreihe. (ebenso ln(1 + x))
Problem: Wie kann man beweisen, daß eine Taylorreihe konvergiert und die Ausgangsfunktion
darstellt? Nach Definition ist zu beweisen:
Für alle x gilt: lim Rn (x, x0 ) = 0
n→∞
(denn Rn (x, x0 ) = f (x) −
Pn−1
ν=0
f (ν) (x0 )
(x
ν!
Ein hinreichendes Kriterium liefert:
− x0 )i ).
Satz 7.7:
N
f ∈ C ∞ ((a,
b)), x0 ∈ (a, b). Gibt es ein M ≥ 0, so daß für alle x ∈ (a, b) und alle k ∈ gilt:
f (k)(x) ≤ M (die Ableitungen sind gleichmäßig beschränkt). Dann folgt: Die Taylorreihe
von f konvergiert auf (a, b) und zwar gegen f (x) ( lim Rn (x0 ) = 0), d.h. sie stellt sie
n→∞
Funktion f dar.
Beweis:
M
f (n) (ξ)
|Rn (x, x0 )| = (x − x0 )n ≤
|x − x0 |n
n!
n!
Die Exponentialreihe M ·
M
n!
∞
P
n=0
(x−x0 )n
n!
konvergiert absolut, also ist ihre Reihengliedfolge mit
|x − x0 |n als n-tem Glied eine Nullfolge.
Bemerkung: Es reicht zu fordern:
^
^ f (k) (x) ≤ M · C k (M und C Konstanten aus
R).
x∈(a,b) k≥k0
Beispiel: Schwingungsvorgänge liefern Funktionen mit f ′′ = −f auf
Satz 7.8:
Ist f eine Funktion mit f ′′ = −f auf
R. Dies führt zu:
△
R, dann ist f Linearkombination von sin und cos.
136
7 Taylor-Entwicklung
R
Beweis: Wegen f ′′ = −f ist f aus C ∞ ( ). Die Ableitungen nehmen nur zwei Werte an:
f (2n) (x0 ) = ±f (x0 ) =: ±a
′
(2n+1)
(2n)
f
(x0 ) = f
(x0 ) = ±f ′ (x0 ) =: ±b
Also ergibt sich folgende Taylorreihe:
∞
X
f (k) (x0 )
k!
k=0
(x − x0 )k = a + b(x − x0 ) −
a
b
a
(x − x0 )2 − (x − x0 )3 + (x − x0 )4 − · · ·
2!
3!
4!
Frage: Konvergiert diese Reihe? Ja, denn auf [a, b] sind f und f ′ als stetige Funktionen beschränkt und damit konvergiert nach Satz 7.7 die Taylorreihe gegen f . Also dürfen wir umordnen
(absolute konvergenz). Man findet f (x) = a cos(x − x0 ) + b sin(x − x0 )
R
R
Bemerkung: {f ∈ C ∞ ( ) | f ′′ = −f } ist ein 2-dimensionaler -Vektorraum mit Basis sin, cos.
Frage: Wie sieht sin(x + c) als Linearkombination der Basis aus?
R
N
Beispiel (Binomische Reihe): Für a > 0 und b ∈ war ab := exp(b·ln(a)). Betrachte für x > −1
und µ ∈ die Funktion x 7→ (1 + x)µ . Für µ ∈ wissen wir:
µ X
µ k
µ
(1 + x) =
x
(Binomischer Lehrsatz)
k
R
k=0
Frage: Was passiert für µ ∈
R − N? Für die Taylorreihe ergibt sich:
f (x) = (1 + x)µ
f ′ (x) = µ(1 + x)µ−1
f ′′ (x) = µ(µ − 1)(1 + x)µ−2
..
.
f (n) (x)
µ(µ − 1)(µ − 2) · · · (µ − n + 1)
=
(1 + x)µ−n
n!
n!
m(m−1)(m−2)···(m−n+1)
m!
Die Definition von m
läßt sich auf µ ∈
n = n!(m−n)! =
n!
meinern:
µ
µ(µ − 1)(µ − 2) · · · (µ − k + 1)
:=
für k > 0
k
1 · 2 · 3 · ··· · k
µ
:= 1
0
Dann haben wir
f (n) (x)
n!
=
µ
n (1
R, k ∈ N verallge-
+ x)µ−n und erhalten als Taylorreihe mit x0 = 0:
Binomische Reihe :=
∞ X
µ
n=0
n
xn
Restglied nach Cauchy mit ϑ ∈ (0, 1), abhängig von x und n:
µ
µ
(1 − ϑ)n−1
µ−n
n
n−1
Rn = n ·
(1 + ϑx)
· x (1 − ϑ)
=n·
(1 + ϑx)µ−1 · xn ·
n
n
(1 + ϑx)n−1
137
7.2 Taylorreihen
1−ϑ Es sei |x| < 1. Dann ist (1 + ϑx)µ−1 ≤ 2µ−1 (=Konstante) und wegen 1+ϑx
≤ 1 (Übung) gibt
µ
n
es eine Konstante A mit |Rn | ≤ A · n · n · |x |.
P µ
Untersuchung der konvergenz von
n · n · |x|n mit Hilfe des Quotientenkriteriums:
n+1
·
n
n+1
µ n+1 |x|
n
µ
n |x|
=
µ−n
|x| → − |x|
n
mit n → ∞
D.h. die Reihenglieder n · µn · |x|n n∈N bilden eine Nullfolge. Also gilt: lim |Rn | = 0
n→∞
Satz 7.9:
Es sei µ ∈
△
R − N. Für |x| < 1 gilt:
µ
(1 + x) =
∞ X
µ
k=0
1
Beispiel: (1 + x)− 2 =
∞
P
k=0
− 12 k
x
k
für |x| < 1. Für
k
−1/2
k
xk
gilt:
1
(− 12 )(− 12 − 1) · · · (− 12 − k + 1)
−2
1 · 3 · 5 · · · · · (2k − 1)
=
= (−1)k
k
k!
2 · 4 · 6 · 8 · · · · · (2k)
2
Für |x| < 1 ist auch −x < 1, und wir erhalten durch Einsetzen:
1
(1 − x2 )− 2 =
∞
X
1 · 3 · 5 · · · · · (2k − 1) 2k
·x
2 · 4 · 6 · · · · · (2k)
k=0
1
1
Wir hatten arcsin : (−1, 1) → (− π2 , π2 ) definiert und arcsin′ (x) = √1−x
= (1 − x2 )− 2 berechnet.
2
Definiere:
∞
X
1 · 3 · 5 · · · · · (2k − 1) x2k+1
g(x) :=
·
2 · 4 · 6 · · · · · (2k)
2k + 1
k=0
1
Dann haben g(x) und (1 − x2 )− 2 gleichen Konvergenzradius und wir wissen, daß g′ (x) =
√ 1
= arcsin′ (x) ist. D.h. g = arcsin +Konstante (x = 0 einsetzen zeigt: Konstante=0).
1−x2
∞
X
1 · 3 · 5 · · · · · (2k − 1) x2k+1
arcsin(x) =
·
2 · 4 · 6 · · · · · (2k)
2k + 1
k=0
Analog: arctan mit
1
.
1+x2
für
|x| < 1
Dies liefert auch:
π
1 1 1
= 1 − + − + ···
4
3 5 7
△
8
Integration
Die Integralrechnung hat zwei Hauptwurzeln:
1. Umkehrung der Differentialrechnung: Gegeben sei eine Funktion
f , gesucht wird F mit F ′ = f ,
= Rekonstruktion der Funktion
aus ihrem Änderungsverhalten.
Beispiel: Eine Geschwindigkeitsfunktion ist bekannt. Es wird die
dazugehörige Wegefunktion gesucht.
F heißt Stammfunktion von
R f
oder unbestimmtes Integral f .
2. Bestimmung des Flächeninhalts der von der x-Achse
und einem Graphen Γf begrenzten Figur Mab (f ).
b
Mab (f )
b
a
b
Inhalt von Mab (f ) = bestimmtes Integral
Rb
a
f (x) dx.
Die Verbindung zwischen beiden zunächst so verschieden aussehenden Problemen stellt der sogenannte Hauptsatz der Differential- und Integralrechnung her.
8.1
Stammfunktionen und die Technik des unbestimmten Integrierens
Definition 8.1 (Stammfunktion):
R
R
Es sei f : (a, b) →
eine Funktion und F : (a, b) →
differenzierbar auf (a, b) mit
F ′ = f . DannR heißt F Stammfunktion
(oder
unbestimmtes
Integral) von f . Man
R
schreibt: F = f oder F = f (x) dx.
Das Suchen der Stammfunktion ist die Umkehrung des Differenzierens.
Beispiel: Zu f (x) = 3x2 ist F (x) = x3 aber auch F̃ (x) = x3 + 10 eine Stammfunktion.
△
Wir wissen aus Kapitel 6:
Satz 8.1:
Sind F und G zwei Stammfunktionen für f : (a, b) →
höchstens um eine Konstante.
R, so unterscheiden sich F und G
Beweis: F − G hat als Ableitung die 0-Funktion, ist also konstant.
R
Achtung: Die Zuordnung f 7→ f = F = Stammfunktion von f ist keine wohldefinierte
Abbildung, da F nur bis auf eine Konstante durch f bestimmt ist. Aber: Ist eine Stammfunktion
bekannt, so sind alle bekannt.
139
8.1 Stammfunktionen und die Technik des unbestimmten Integrierens
ΓF
ΓF
4
3
2
ΓF
1
−4
−3
Γf
−2
−1
−1
Abbildung 8.1: Die Graphen zu f (x) =
√ x
1+x2
1
2
und F (x) =
3
√
4
1 + x2 + C mit C = 0, −2, 2
Zwei Probleme:
1. Welche Funktionen besitzen überhaupt eine Stammfunktion, bzw. wie kann man dies einer
gegebenen Funktion ansehen?
2. Wenn ja, wie berechnet man diese Stammfunktion?
Durch Umkehren“ einer Differentationstabelle erhält man eine Tabelle von Stammfunktionen
”
(Siehe Tabelle 8.1, Seite 140).
8.1.1
Integrationsregeln
Umkehrung der Ableitungsregeln
1. F Stammfunktion von f , G Stammfunktion von g und α, β ∈
eine Stammfunktion von αf + βg. Symbolisch:
Z
Z
Z
(αf + βg) = α f + β g
R. Dann ist α · F + β · G
2. Aus der Produktregel (u · v)′ = u′ · v + u · v ′ erhält man die sogenannte Produkt oder
Teilintegration. u · v ist (nur) Stammfunktion von u′ · v + u · v ′ (und nicht von u′ · v ′ ).
Umschreiben liefert:
Z
Z
Z
Z
′
′
′
u · v = (u · v) − u · v = u · v − u · v ′
Achtung: Es gibt keine Regel, um die Stammfunktion eines Produktes zu berechnen,
wenn man die Stammfunktion der Faktoren kennt.
3. Substitutionsregel (Umkehrung der Kettenregel)
Z
Z
′
f (g(t))g (t) dt = F ◦ g, wobei F = f
140
8 Integration
Funktion f
c
xα
z.B.:
xn
1
x2
√
1
x = x2
1
x
ex
sin x
cos x
1
cos2 x
tan x
sinh x
cosh x
1
1 + x2
1
√
1 − x2
1
√
1 + x2
1
√
2
x −1
1
1 − x2
Stammfunktion F
Bemerkung
cx
c∈
1
· xα+1 auf
F (x) =
für α ∈
α+1
auf (−∞, 0) und (0, ∞) für α = −2, −3, . . .
auf (0, ∞) falls α ∈ und α 6= −1
R
R
N
R
1
xn+1
n+1
1
−
x
2 3
2√ 3
x
x2 =
3
3
ln |x|
ex
− cos x
sin x
n∈
auf
N
R − {0}
tan x
− ln |cos x|
cosh x
sinh x
arctan x
arcsin x
arcsinh x
arccosh x
auf (1, ∞)
− arccosh(−x)
1 1 + x ln
2 1 − x
auf (−∞, −1)
auf (−∞, −1), (−1, 1) und (1, ∞)
Tabelle 8.1: Beispiele einiger Stammfunktionen
141
8.1 Stammfunktionen und die Technik des unbestimmten Integrierens
Die symbolische Schreibweise
Beispiel:
Z
tan =
Z
R
f für Stammfunktionen von f ist mit Vorsicht zu behandeln.
1
1
= − cos ·
−
sin
cos
cos
Z
sin
− cos
= −1 +
cos2
Z
tan
⇒
0 = −1
△
R
1
Da wir zu x 7→ xn (n ∈ ) die Stammfunktion x 7→ n+1
xn+1 haben, kennt man mit der
Summenregel zu jeden Polynom eine Stammfunktion:
Z X
n
x3
an xn+1
x2
ai xi dx = a0 x + a1 + a2 + · · · +
2
3
n+1
i=0
Beispiele:
R
R
R
1. xex dx = x · ex − ex · 1 dx = (x − 1)ex . Genauso: xn ex (wiederholtes Anwenden der
v u′
v
u
u
v′
Produktregel).
R
R
R
R
2. cos2 = cos · cos = sin · cos − sin ·(− sin) = sin · cos + (1 − cos2 )
R
sin(x) · cos(x) + x
⇒ cos2 (x) dx =
.
2
R
R
R
3. ln x dx = 1 · ln x dx = x · ln x − x · x1 dx = x · ln x − x
R
R
R
4. x sin x dx = x(− cos x) − − cos x dx = sin x − x cos x. Genauso: xn sin x dx usw.
△
Zur Substitutionsregel
R
Aus F = f folgt: F ◦ g ist Stammfunktion von t 7→ f (g(t))g′ (t) (nach der Substitutionsregel).
Daraus ergibt sich:
Z
Z
′
f (g(t)) · g (t) dt =
f (x) dx
1. Form
x=g(t)
Ist g : I → J bijektiv, so kann man die Umkehrfunktion g−1 : J → I bilden, d.h. t = g−1 (x)
schreiben.
Z
Z
′
f (x) dx =
f (g(t)) · g (t) dt
2. Form
t=g −1 (x)
Voraussetzung: g′ (t) 6= 0 auf I. Dann ist g streng monoton, also bijektiv, und wir können den
Satz von der Ableitung der Unkehrfunktion anwenden.
Beweis: Φ sei Stammfunktion von f (g(t))g′ (t), F ′ = f . Aus der 1. Form folgt: Φ(g−1 (x)) = F (x).
Ableiten:
Φ′ (g−1 (x)) · (g−1 (x))′ = f (g(g−1 (x)))g′ (g−1 (x))(g−1 (x))′
= f (x)g′ (g−1 (x))(g−1 (x))′ = f (x)g′ (g−1 (x))
= f (x) = F ′ (x)
1
g′ (g−1 (x))
142
8 Integration
R
Beispiele: 1. sin5 (x) cos(x) dx =? Verwende: f : y 7→ y 5 und g : x 7→ sin x. Dann
ergibt sich:
1 6
5
′
f (g(x))g (x) = sin (x) cos(x). Also Stammfunktion hiervon ist: (F ◦ g)(x) = 6 y y=sin(x) .
R√
R
2.
1 − x2 dx = f (x) dx. Man sucht g und faßt x = g(t) als Substitution auf. Versuch:
x = g(t) = sin(t), t = arcsin(x).
Z
Z p
Z
′
2
1 − x dx = f (x) dx =
f (g(t)) · g (t) dt
t=g −1 (x)
=
=
Z q
Z
2
1 − sin (t) · cos(t) dt
cos2 (t) dt
=
t=arcsin(x)
=
t=arcsin(x)
Z
p
cos2 (t)
· cos(t) dt
t=arcsin(x)
1
1
sin(arcsin(x)) · cos(arcsin(x)) + arcsin(x)
2
2
1 p
=
x 1 − x2 + arcsin(x)
2
△
Wichtige und oft vorkommende Spezialfälle:
Z
1
f (ax + b) dx = · F (ax + b)
a
Z
und
g′ (x)
dx = ln |g(x)|
g(x)
Schema zur Substitutionsregel
Ziel: Die Stammfunktion von h, also
R
h
1. Setze y = g(x) für geeignete Wahl von g (=Substitution; Raten, Probieren)
[x = Φ(t) für Φ mit Φ′ (t) > 0 für alle t]
2. Setze formal dy = g′ (x) dx
[dx = Φ′ (t) dt]
3. In das gesuchte unbestimmte Integral werden y und dy eingesetzt, wo immer das geht.
Danach darf kein x oder dx mehr auftauchen. (geht nicht immer)
[dx und x = Φ(t) einsetzen]
4. Stammfunktion für neue Funktion in y suchen.
[Stammfunktion in t]
R
5. Man setzt für y wieder g(x) ein und erhält h.
[t = Φ−1 (x) einsetzen]
6. Ableiten als Kontrolle.
Partialbruchzerlegung (Integration/Stammfunktionen rationaler Funkutionen)
Beispiel: f (x) =
1
a2 −x2
Trick (für a 6= 0):
Stammfunktion.
F (x) =?
1
a2 −x2
=
1
(a−x)(a+x)
=
1
2a
1
a−x
+
1
a+x
. Dazu finden wir sehr leicht eine
△
143
8.1 Stammfunktionen und die Technik des unbestimmten Integrierens
Diese Umrechnung heißt Partialbruchzerlegung. Allgemein kann man jetzt rationale Funktionen
Z(x)
x → N
(x) , wobei Z und N Polynome mit grad Z < grad N sind, ähnlich umformen. Nach
dem Fundamentalsatz der Algebra kann man schreiben (ai ∈
reelle Nullstellen, ki , li ∈ ,
αi , βi ∈ ):
R
R
N
N (x) = (x − a1 )k1 (x − a2 )k2 · · · (x − an )kn (x2 + α1 x + β1 )l1 · · · (x2 + αs + βs )ls
|
{z
}
sollen keine reellen Nullstellen besitzen
Hier nur der einfachste Fall: Alle ki = 1 und alle li = 0. Es gilt dann:
Z(x)
A1
A2
An
=
+
+ ··· +
N (X)
x − a1 x − a2
x − an
(x)
i)
mit Ai = NZ(a
, wobei Ni = N
x−ai (Beweis durch ausmultiplizieren).
i (ai )
Allgemeiner Fall: siehe Literatur.
8.1.2
Zur Existenz von Stammfunktionen
Satz 8.2:
Z(x)
besitzt eine elementare Stammfunktion, die
N (x)
sich durch die elementaren Funktionen ausdrücken läßt.
(kein Beweis)
Jede gebrochen rationale Funktion x 7→
Bemerkung: Grundlegender Unterschied zwischen der Technik des Differenzierens und des unbestimmten Integrierens: Es gibt kein Verfahren das eine Stammfunktion für ein Produkt f · g
liefert, wenn man die Stammfunktionen von f und g kennt.
√
Beispiel: Elementare Funktion: x, sin, cos, ex ,
, . . . , +, ·, −, :, Komposition und Umkehrung.
Ableiten führt elementare Funktion in elementare Funktion über. Nicht so beim Stammfunktion
suchen.
△
x
Beispiel: ex hat keine elementare Stammfunktion (obwohl ex und x1 elementare Stammfunktionen haben). Durch den Prozeß des unbestimmten Integrierens stößt man auf neue“ Funktionen,
R
”2
2
z.B. x1 = ln |x|. Weitere
Beispiele mit
nichtelementaren Stammfunktionen: ex , e−x , sin(x)
und
x
√
√
√
1
d
x
x
= dx 2( x − 1)e
.
△
ln(x) . Aber: e
Also: Man sieht einer elementaren Funktion nicht leicht an, ob sie eine elementare Stammfunktion besitzt.
Frage: Wann hat eine Funktion f eine Stammfunktion F ?
Beispiel:
1
(
+1 x > 0
f (x) =
−1 x ≤ 0
−4
−3
−2
Diese Funktion hat keine Stammfunktion. Warum?
Annahme: F sei Stammfunktion, d.h. F ′ = f .
−1
c
b
1
b
−1
2
3
4
144
8 Integration
Auf (0, 1] muß gelten: F (x) = +x + c1
Auf [−1, 0] muß gelten: F (x) = −x + c2 (mit ci ∈
R).
F ist stetig, da differenzierbar, also lim F (x) = c2 und lim F (x) = c1 , d.h. c1 = c2 . Also
x→0−
x→0+
F (x) = |x| + c1 , aber x 7→ |x| ist in 0 nicht differentierbar. Widerspruch!
Der Grund liegt darin, daß Ableitungen bestimmte Eigenschaften haben, die die vorliegende
Funktion nicht hat.
Vermutung: Jede stetige Funktion f : (a, b) →
R hat eine Stammfunktion.
Wie könnte man das beweisen? 1. Idee: Man approximiert f durch Funktionen fn , die alle eine
Stammfunktion besitzen: f (x) = lim fn (x). Gilt nun fn = Fn′ ? Existiert F (x) := lim Fn (x) und
gilt F ′ = f ?
n→∞
Die Antwort ist nicht klar und erfolgt erst später. Hier nur noch eine Warnung: Jede stetige
Funktion ist Grenzwert von Polynomen (Satz von Weierstraß).
△
145
8.2 Das Riemannintegral
8.2
Das Riemannintegral
Diskurs: Gegeben sei eine Funktion f [a, b] →
R (zunächst sei f (x) ≥ 0).
b
Mab (f )
b
a
b
Wir definieren dabei Mab (f ) durch
Mab := {(x, y) ∈
R × R | a ≤ x ≤ b und 0 ≤ y ≤ f (x)}
R R
Welchen Flächeninhalt hat diese Teilmenge von × ?
Die so gestellte Frage setzt bereits die Existenz einer Zahl vorraus, die wir sinnvoll und eindeutig
der Fläche als Inhalt zuordnen können. Wir haben zwar eine intuitive Vorstellung dieses Inhalts,
aber keine mathematische Definition. Es stellt sich heraus, daß dieses Problem nicht für alle f
sinnvoll gelöst werden kann.
Das Problem der Flächeninhaltsberechnung hat eine lange Geschichte. Klar ist der Flächeninhalt
folgender Figuren:
Für die Griechen war aber evident, daß auch krummlinig begrenzten Figuren eine Fläche zukommt.
Archimedes: (ungefähr 250 v.Chr.) Kreisflächenapproximation durch in den Kreis eingechlossene Vielecke. In Abbildungen 8.2 sind die 3 · 2n−1 -Ecke für n = 1, . . . , 4 eingezeichnet.
Abbildung 8.2: Kreisflächenapproximation nach Archmiedes
146
8 Integration
Erst um 1600 gab es wieder Fortschritte. Cavalieri: Grob: Man teilte die Figur in lauter
kleine Streifen der Breite ∆x auf und multipliziertPdie Breite mit der Höhe und summiert
die jeweiligen Ergebnisse der einzelnen Streifen auf:
f (xi ) ∆xi . Durch Grenzübergang wurde
Rb
daraus: a f (x) dx.
D.h. man bildete eine unendliche Summe unendlich kleiner Größen. Zunächst schien es nicht
weiter nötig dieses Vorgehen weiter zu begründen, d.h. die Existenz des Integrals zu beweisen.
Erst durch Cauchy und Riemann begann die exakte Begründung des Integralbegriffs. Je nach
Vorgehensweise erhält man verschiedene Integralkonstruktionen. Hauptsächlicher Unterschied:
verschieden große Mengen integrierbarer Funktionen
Cauchy
8.2.1
Lesbeque
Riemann
Perron/Eich
Definition des Riemann Integrals
Im folgenden sei a < b, I = [a, b] ⊂
R und die Funktion f : [a, b] → R sei beschränkt.
b
b
a = x0
x1
x2
x3
x4
x5
x6
x7
···
xn−1 xn = b
Definition 8.2:
1. Eine Zerlegung ζ des abgeschlossenen Intervalls I = [a, b] ist durch endlich viele
Punkte ζ = {x0 , x1 , . . . , xn } mit a = x0 < x1 < x2 < x3 < · · · < xn−1 < xn = b
gegeben. Setze Ij = [xj−1 , xj ] mit j ∈ [1, . . . , n]. Schreibe ζ = (Ij )j≤n .
2. Die Länge eines Intervalls J = [c, d] bezeichnen wir mit λ(J) := d − c.
3. die Feinheit einer Zerlegung ζ = (Ij )j≤n ist definiert durch |ζ| = max λ(Ij )
1≤j≤n
4. Eine bewertete Zerlegung ζ = (Ij , ξj ) besteht aus einer Zerlegung (Ij )j≤n und
Zwischenpunkten ξj ∈ Ij .
147
8.2 Das Riemannintegral
5. Setze
mk (f ) := Infimum von f auf [xk−1 , xk ] = inf{f (x) | x ∈ Ik }
Mk (f ) := Supremum von f auf [xk−1 , xk ] = sup{f (x) | x ∈ Ik }
Diese existieren, da f beschränkt ist.
Zu jeder Zerlegung ζ = (Ij )1≤n definieren wir:
Definition 8.3:
1. Untersumme
u(f, ζ) :=
n
X
mk λ(Ik )
n
X
Mk λ(Ik )
k=1
2. Obersumme
o(f, ζ) :=
k=1
Zu einer bewerteten Zerlegung ζ = (Ij , ξj ) definieren wir:
Definition 8.4:
Riemannsumme
R(f, ζ, ξj ) :=
n
X
j=1
f (ξj ) · λ(Ij )
Unmittelbar klar ist: u(f, ζ) ≤ R(f, ζ, ξj ) ≤ o(f, ζ). Der zu definierende Flächeninhalt liegt
zwischen Ober- und Untersumme.
Wir untersuchen jetzt, was beim Unterteilen passiert. Im folgenden seien ζ1 , ζ2 und ζ3 Zerlegungen.
Definition 8.5:
1. ζ2 heißt genau dann Verfeinerung von ζ1 , wenn ζ2 alle Teilpunkte von ζ1 enthält
(symbolisch: ζ1 ≤ ζ2 ).
2. ζ3 heißt gemeinsame Verfeinerung von ζ1 und ζ2 , wenn ζ3 alle Teilpunkte von ζ1
und ζ2 enthält (symbolisch: ζ3 = ζ1 ∪ ζ2 ).
Lemma 8.3:
Die Zerlegung ζ ′ von I = [a, b] sei durch m + 1 Punkte a = y0 ≤ y2 ≤ · · · ≤ ym = b
gegeben. Dann gilt für jede Zerlegung ζ von I:
1. u(ζ) ≤ u(ζ ∪ ζ ′ ) ≤ u(ζ) + 2(m − 1) · sup{|f (x)| | x ∈ I} · |ζ|
2. o(ζ) ≥ o(ζ ∪ ζ ′ ) ≥ o(ζ) − 2(m − 1) · sup{|f (x)| | x ∈ I} · |ζ|
148
8 Integration
Beweis: Wir beweisen hier nur den ersten Fall. Der zweite wird entsprechend bewiesen. ζ sei
durch a = x0 < x1 < · · · < xn = b gegeben. ζ ′ bestehe zunächst nur aus zwei Intervalen mit
a = y0 < y1 < y2 = b. Ist y1 = xk für ein k, so sind alle Behauptungen wegen ζ ∪ ζ ′ = ζ trivial.
Ist xk−1 < y1 < xk so gilt:
λ([xk−1 , xk ]) = λ([xk−1 , y1 ]) + λ([y1 , xk ])
Setze
m = inf{f (x) | x ∈ [xk−1 , xk ]}
m1 = inf{f (x) | x ∈ [xk−1 , y1 ]}
m2 = inf{f (x) | x ∈ [y1 , xk ]}
m1
m
m2
xk−1
y1
xk
Abbildung 8.3: Skizze zum Lemma 8.3
Dann gilt:
u(ζ ∪ ζ ′ ) − u(ζ) = m1 · λ([xk−1 , y1 ]) + m2 · λ([y1 , xk ]) − m · λ([xk−1 , xk ])
= m1 (y1 − xk−1 ) + m2 (xk − y1 ) − m(y1 − xk−1 ) − m(xk − y1 )
= (m1 − m)(y1 − xk−1 ) + (m2 − m)(xk − y1 )
Wegen m1 ≥ m und m2 ≥ m folgt (m1 − m)(y1 − xk−1 ) + (m2 − m)(xk − y1 ) ≥ 0 und damit
auch u(ζ ∪ ζ ′ ) ≥ u(ζ). Setze c = sup{|f (x)| | x ∈ I}. Damit gilt
|m1 − m| ≤ 2c
und
|m2 − m| ≤ 2c
Daraus folgt:
u(ζ ∪ ζ ′ ) − u(ζ) = (m1 − m)(y1 − xk−1 ) + (m2 − m)(xk − y1 )
≤ 2c(y1 − xk−1 ) + 2c(xk − y1 )
= 2c(xk − xk−1 )
= 2c · |ζ|
Dies beweist die Behauptung für m = 2. Mit Wiederholter Anwendung der benutzten Argumente
zeigt man den allgemeinen Fall.
149
8.2 Das Riemannintegral
a = x0
x1
x2
x3
x4
x5 = b
a = x0
x1
x2
x3
x4
x5 = b
Verfeinerung: Einfügen des neuen Zwischenpunktes y1 zwischen x2 und x3 :
kommt hinzu
a = x0
x1
x2 y1 x3
x4 x5 = b
fällt weg
a = x0
x1
x2 y1 x3
x4
x5 = b
Schwankungssumme vor (links) und nach der Verfeinerung (rechts):
150
8 Integration
Folgerung: Beim Unterteilen nehmen Obersummen ab und Untersummen zu. Dies führt zu
Korollar 8.4:
Jede Untersumme ist kleiner oder gleich jeder Obersumme. D.h. für beliebige Zerlegungen
ζ1 und ζ2 gilt:
u(f, ζ1 ) ≤ o(f, ζ2 )
Beweis: Wegen u(f, ζ) ≤ o(f, ζ) folgt: u(ζ1 ) ≤ u(ζ1 ∪ ζ2 ) ≤ o(ζ1 ∪ ζ2 ) ≤ o(ζ2 )
Damit sind die Mengen {u(ζ) | ζ Zerlegung} und {o(ζ) | ζ Zerlegung} beschränkt und wir
können definieren:
Definition 8.6:
Zb
a
∗
f (x) dx := sup{u(f, ζ) | ζ Zerlegung von [a, b]} = Unterintegral von f auf [a, b]
Zb ∗
f (x) dx := inf{o(f, ζ) | ζ Zerlegung von [a, b]} = Oberintegral von f auf [a, b]
a
Korollar 8.5:
Zb
a
∗
Zb ∗
f (x) dx ≤ f (x) dx
a
Beweis: Jede Untersumme u(ζ) ist kleiner gleich jeder festen Obersumme o(ζ̄), also gilt:
Rb
sup(u(ζ)) ≤ o(ζ̄). Also ist ∗ a f (x) dx untere Schranke für alle Obersummen. Daraus folgt:
Rb
R ∗b
∗ a f (x) dx ≤ inf(o(ζ̄)) = a f (x) dx
Definition 8.7:
Eine beschränkte Funktion f : [a, b] →
:⇔
Zb
a
∗
R heißt Riemannintegrierbar
Zb ∗
f (x) dx = f (x) dx
a
Der gemeinsame Wert wird mit
Zb
a
f (x) dx :=
Zb
a
∗
Zb ∗
f (x) dx = f (x) dx
a
bezeichnet und heißt Riemannintegral oder auch bestimmtes Integral von f über [a, b].
Notation:
151
8.2 Das Riemannintegral
obere Integrationsgrenze
Zb
f (x) dx =
a
Zb
f (t) dt =
a
Zb
f
a
untere Integrationsgrenze
Integrand
a ist die untere und b ist die obere Integrationsgrenze. f (x), f (t) bzw. einfach nur f ist der
Integrand. dx oder dt ist nur ein Symbol, daß die Integrationsvariable anzeigt. Es hat keine
selbständige Bedeutung.
Definition 8.8:
R
R([a, b]) := {f : [a, b] → | f ist Riemannintegrierbar}
Rb
R ∗b
Bemerkung: Gilt ∗ a f (x) dx = a f (x) dx, so erhält man bei Approximation von unten (innen) und oben (außen) das Gleiche und man kann daher den gemeinsamen Wert mit Recht als
Flächeninhalt von Mab (f ) definieren.
Vereinfachung: Wir betrachten Zerlegungsfolgen (ζn )n∈N mit lim |ζn | = 0.
n→∞
Satz 8.6:
f : [a, b] →
R sei beschränkt und (ζn)n∈N sei Zerlegungsfolge mit n→∞
lim |ζn | = 0. Dann gilt:
Zb ∗
lim o(f, ζn ) = f (x) dx
n→∞
a
lim u(f, ζn ) =
n→∞
Zb
a
f (x) dx
∗
Beweis: ζ sei eine beliebige Zerlegung, gegeben durch a = x0 < x1 < · · · < xp+1 = b. Diese
halten wir fest. Nach Voraussetzung ist eine Zerlegungsfolge (ζn )n∈N mit lim |ζ| = 0 gegeben.
n→∞
Die Folge (u(f, ζn ))n∈N ist beschränkt, hat also konvergente Teilfolgen. Es sei (u(f, ζni )i∈N eine
konvergente Teilfolge mit Grenzwert α.
Nach Lemma 8.3 gilt u(ζni ) ≤ u(ζni ∪ ζ) ≤ u(ζni ) + 2 · p · sup{|f (x)| | x ∈ [a, b]} · |ζni |. Da
(u(ζni ))i∈N konvergiert, konvergiert auch u(ζni ∪ ζ))i∈N , denn der Unterschied ist kleiner als
eine Nullfolge.
Rb
Aus lim u(ζni ∪ ζ) = α und den Ungleichungen u(ζ) ≤ u(ζni ∪ ζ) und u(ζni ∪ ζ) ≤ ∗ a f (x) dx
n→∞
folgt:
Zb
u(ζ) ≤ α ≤ f (x) dx
a
∗
Da ζ beliebig gewählt werden darf, gilt auch:
sup{u(ζ) | ζ Zerlegung von [a, b]} ≤ α ≤
|
{z
}
Rb
= ∗f (x) dx
a
Zb
a
∗
f (x) dx
152
8 Integration
Rb
D.h. es gilt α = ∗ a f (x) dx. Damit ist gezeigt, daß jede konvergente Teilfolge der UntersummenRb
Rb
folge, gegen ∗ a f (x) dx konvergiert, also konvergiert auch (u(ζn ))n∈N selbst gegen ∗ a f (x) dx.
Analog für Obersummen.
Korollar 8.7:
f sei Riemannintegrierbar und (ζn )n∈N sei Zerlegungsfolge mit lim |ζn | = 0. Dann gilt:
n→∞
Zb
f (x) dx = lim o(f, ζn ) = lim u(f, ζn )
n→∞
n→∞
a
Beispiele:
1. f (x) = c konstant. ⇒ o(ζn ) = u(ζn ) = c(b − a) =
Rb
a
f (x) dx.
2. f (x) = x2 auf [0, b]. Wähle ζn als: 0 = x0 < x1 = h < x2 = 2h < · · · xn = n · h = b mit
h = nb .
2
2
2
2
3
o(f, ζn ) = (1h) · h + (2h) · h + · · · + ((n − 1)h) · h + (nh) · h = h ·
u(f, ζn ) = (0h)2 · h + (1h)2 · h + (2h)2 · h + · · · + ((n − 1)h)2 · h = h3 ·
Wegen
Pm
i=0 k
2
= 13 m3 + 12 m2 + 16 m und h =
b
n
n
X
k=1
n−1
X
k2
k2
k=0
erhält man:
b3 1 1 2 1
( + n + n)
6
n3 3 2
1 3 1 b3 1 b3
= b +
+
= An
3
2n
6 n2
o(f, ζn ) =
Daraus folgt: lim An = 31 b3 . Für die Untersummen gilt:
n→∞
b3 1
1
1
( (n − 1)3 + (n − 1)2 + (n − 1))
2
6
n3 3
3
3
3
2
1 b (n − 1)
1 b (n − 1)
1 b3 (n − 1)
=
+
+
3
2
6
n3
n3
n3
u(f, ζn ) =
Damit ergibt sich lim u(f, ζn ) = 31 b3 . Damit idt f nach Satz 8.6 integrierbar und es ist
n→∞
Rb
1 3
f
(x)
dx
=
b
.
0
3
R
3. Dirichlet-Funktion auf [0, 1]: f : [0, 1] → mit f (x) = 1, wenn x rational ist und f (x) = 0,
wenn x irrational ist. Behauptung: Die Dirichlet-Funktion ist nicht Riemannintegrierbar.
ζ = (Ij )j≤n sei eine beliebige Zerlegung von [a, b]. Dann sind mj = 0 und Mj = 1, da in
Ij rationale und irrationale Zahlen vorkommen. D.h. es gilt o(ζ) = 1 und u(ζ) = 0. Also
R ∗b
Rb
gilt a f (x) dx = 1 und ∗ a f (x) dx = 0. Daraus folgt die Behauptung.
△
153
8.2 Das Riemannintegral
Definition 8.9:
ζ = (Ii ) sei eine Zerlegung von [a, b]. Die Differenz von Ober- und Untersumme
o(f, ζ) − u(f, ζ) =
n
X
(Mk − mk ) · λ(Ik )
k=1
heißt Schwankungssumme von f .
a = x0
x1
x2
x3
x4
x5 = b
Klar: Je weniger die Funktion schwankt/oszilliert, desto kleiner ist diese Schwankungssumme.
Satz 8.8:
Eine beschränkte funktion f : [a, b] →
Zerlegung ζ mit o(f, ζ) − u(f, ζ) < ε.
R ist Riemannintegriebar ⇔ Zu jedem ε gibt es
Rb
Rb ∗
Beweis: ⇐“: Aus o(f, ζ) − u(f, ζ) < ε folgt (wegen u(f, ζ) ≤ ∗f (x) dx ≤ f (x) dx ≤ o(f, ζ)):
”
a
a
 b

Z ∗
Zb
 f (x) dx − f (x) dx < ε
für alle ε > 0
a
Also ist
Rb
a
∗f (x) dx =
a
∗
Rb ∗
f (x) dx. Daraus folgt: f ∈ R([a, b]).
a
Rb
⇒“: Für eine Zerlegungsfolge (ζn )n∈N mit lim |ζn | = 0 gilt: lim u(f, ζn ) = ∗ a f (x) dx und
”
n→∞
n→∞
R ∗b
lim o(f, ζn ) = a f (x) dx. Ist f integrierbar, so ist (o(f, ζn ) − u(f, ζn ))n∈N eine Nullfolge. n→∞
Satz 8.9:
f : [a, b] →
R stetig ⇒ f ist integrierbar.
Satz 8.10:
f : [a, b] →
R monoton ⇒ f ist integrierbar.
Satz 8.11:
f : [a, b] →
R beschränkt und stetig bis auf endlich viele Stellen ⇒ f ist integrierbar
154
8 Integration
Beweis (Zu Satz 8.9): f ist beschränkt und gleichmäßig stetig, d.h. zu ε > 0 gibt es γ > 0
mit |x − y| < γ ⇒ |f (x) − f (y)| < ε für alle x, y. ε sei vorgegeben. Wählt man γ mit obiger
Eigenschaft
und eine Zerlegung
ζ = (Ij ) mit |ζ| < γ,
so gilt: |f (x) − f (y)| < ε für x, y ∈ Ij . Also
auch sup f (x)− inf f (x) = max f (x)−min f (x) < ε. Damit gilt für die Schwankungssumme:
x∈Ij
x∈Ij
x∈Ij
x∈Ij
n
n
n
X
X
X
o(f,
ζ)
−
u(f
ζ)
=
(M
−
m
)
·
λ(I
)
≤
(M
−
m
)
·λ(I
)
<
ε
λ(Ij ) = ε(b − a)
j
j
j j
j
j
| {z }
j=1
j=1
j=1
<ε
Nach Satz 8.8 ist also f intergrierbar.
Beweis (Zu Satz 8.10): Sei etwa f monoton wachsend und f (a) ≤ f (b). D.h. f ist beschränkt.
ζ = (Ii )i≤n sei durch a = x0 < x1 < · · · < xn = b gegeben. Mi = sup{f (x) | x ∈ Ii } = f (xi ) und
mi = inf{f (x) | x ∈ Ii } = f (xi−1 ). Die Schwankungssumme beträgt dann:
n
X
o(f, ζ) − u(f, ζ) =
(f (xi ) − f (xi−1 ))(xi − xi−1 )
i=1
n
X
≤
(f (xi ) − f (xi−1 )) · max (xi − xi−1 )
1≤i≤n
i=1
= |ζ| ·
n
X
(f (xi ) − f (xi−1 ))
(Teleskopsumme!)
i=1
= |ζ| · f (b) − f (a)
Mit |ζ| → 0 geht auch die Differenz o(f, ζ) − u(f, ζ) gegen 0.
Beweis (Zu Satz 8.11): Zuerst schließt man die Unstetigkeitsstellen durch Intervalle ein, deren
Gesamtlänge kleiner als ε ist. Auf dem Rest ist f gleichmäßig stetig.
Satz 8.12:
Es sei f eine riemannintegrierbare Funktion und (ζn )n∈N eine bewertete Zerlegungsfolge
mit lim |ζn | = 0. Dann gilt:
n→∞
lim R(f, ζn , ξjn ) =
n→∞
Zb
f (x) dx
a
Beweis: Es sei ζn = (Iin , ξin )n∈N eine bewertete Zerlegungsfolge mit lim |ζn | = 0 (nach Vorn→∞
Rb
aussetzung). Es gilt: lim u(f, ζn ) = a f (x) dx = lim o(f, ζn ), da f Riemannintegrierbar ist.
n→∞
n→∞
Es gilt aber auch: u(f, ζn ) ≤ R(f, ζn , ξin ) ≤ o(f, ζn ). Mit dem Einschließungssatz folgt dann
Rb
lim R(f, ζn , ξin ) = a f (x) dx.
n→∞
Lemma 8.13:
Es sei ζ = (Ii )i≤n Zerlegung und ε > 0 gegeben. Dann kann man Zwischenpunkte ξi und
νi so wählen, daß gilt:
155
8.2 Das Riemannintegral
1. u(f, ζ) ≤ R(f, ζ, ξi ) ≤ u(f, ζ) + ε
2. o(f, ζ) − ε ≤ R(f, ζ, νi ) ≤ o(f, ζ)
Mit anderen Worten: Bei geeigneter Wahl der Zwischenstellen kommt die Riemannsumme
den Ober- bzw. Untersummen beliebig nahe.
Beweis: Eine Zerlegung ζ = (Ii )i≤n sei vorgegeben. Wähle ξi , so daß f (ξi ) genügend nahe bei
mi = inf{f (x) | x ∈ Ii } liegt: mi ≤ f (ξi ) ≤ mi +ε/(b−a). Multipliziert mit λ(Ii ) und aufaddieren
ergibt: u(f, ζ) ≤ R(f, ζ, ξi ) ≤ u(f, ζ) + ε. Genauso für Obersummen.
Satz 8.14:
R
Eine beschränkte Funktion f : [a, b] →
ist Riemannintegrierbar :⇔ Jede Folge von
Riemannsummen (R, ζn , ξin )n∈N mit |ζn | → 0 konvergiert.
Rb
Ist dies der Fall, so haben alle dieser Folgen den gleichen Grenzwert, nämlich a f (x) dx.
Beweis: ⇒“: erledigt.
”
⇐“ Es sei eine Zerlegungsfolge (ζn )n∈N mit |ζn | → 0 und konvergenter Riemannsummenfolge
”
gegeben, so daß für jede Auswahl der ξin die Folge R(f, ζn , ξin ) konvergiert. Nach Lemma 8.13
gibt es Zwischenpunkte αin und βin mit
u(f, ζn ) ≤ R(f, ζn , αin ) ≤ u(f, ζn ) +
o(f, ζn ) −
1
n
1
≤ R(f, ζn , βin ) ≤ o(f, ζn )
n
Hieraus folgt
lim R(f, ζn , αin ) =
n→∞
Zb
a
f (x) dx
∗
Zb ∗
lim R(f, ζn , βin ) = f (x) dx
n→∞
a
Jetzt mischen wir beide Folgen, d.h. wir betrachten R(f, ζ1 , αi1 ), R(f, ζ1 , βi1 ), R(f, ζ2 , αi2 ), . . . .
Nach Voraussetzung konvergiert diese Folge, da die Feinheit gegen Null
Die
R b geht. Daraus
R ∗ folgt:
b
Grenzwerte der beiden konvergenten Teilfolgen stimmen überein, d.h. ∗ a f (x) dx = a f (x) dx,
d.h. f ∈ R([a, b]).
Bemerkung:
1. Satz 8.14 liefert eine äquivalente Definition für Riemannintegrierbarkeit. Unsere Definition
stammt von Darboux.
2. Vorteil der Riemannsummendefinition: unabhängig von Ordnungsrelationen, kein Supremum und Infimum, leichter Verallgemeinerbar (z.B. auf -wertige Funktionen). Nachteil:
logisch kompliziert.
C
156
8 Integration
Satz 8.15:
f und g seien auf [a, b] Riemannintegrierbar, α, β ∈ . Dann ist auch α·f +β ·g ∈ R([a, b])
und es gilt:
Zb
Zb
Zb
α · f (x) + β · g(x) dx = α · f (x) dx + β · g(x) dx
R
a
Bemerkung: R[a, b] ist ein
a
R-Vektorraum und
Rb
a
a
: R[a, b] →
R ist linear.
Beweis: (ζn )n∈N sei bewertete Zerlegungsfolge mit |ζn | → 0. Es gilt
(∗)
R(α · f + β · g, ζn , ξin ) = α · R(f, ζn , ξin ) + β(f, ζn , ξin )
Für n → ∞ existiert rechts der Grenzwert, also auch links. Also ist α · f + β · g ∈ R([a, b]) nach
Rb
Satz 8.14. Aus (∗) folgt auch die Gleichheit der Grenzwerte (links: a αf (x) + βg(x) dx, rechts:
Rb
Rb
α a f + β a g).
Satz 8.16:
W V
Ist f ∈ R([a, b]) und Φ auf f ([a, b]) Lipschitzstetig, d.h. L x,y |Φ(x) − Φ(y)| ≤ L·|x − y|,
so ist auch Φ ◦ f aus R([a, b]).
Beweis: Aus |Φ(f (x)) − Φ(f (y))| ≤ L·|f (x) − f (y)| folgt, daß die Schwankungssumme von Φ◦f
höchstens L-mal so groß sind wie die von f , d.h. o(Φ ◦ f, ζ) − u(Φ ◦ f, ζ) ≤ L |o(f, ζ) − u(f, ζ)|
(Beweis: Übung). Aus Satz 8.8 folgt die Behauptung.
Satz 8.17:
f und g seien auf [a, b] Riemannintegrierbar. Dann gilt:
1. |f | ist Riemannintegrierbar.
2. f + = max{f, 0} und f − = min{f, 0} sind Riemannintegrierbar.
3. f 2 = f · f ist Riemannintegrierbar.
4. Ist |f (x)| ≥ γ > 0 für alle x ∈ [a, b], so ist
1
f
Riemannintegrierbar.
5. f · g ist Riemannintegrierbar.
Beweis: Mit Satz 8.16 und Φ(y) = |y|, Φ(y) = y + , Φ(y) = y − , Φ(y) = y 2 und Φ(y) =
1.–4. Mit 4 · f · g = (f + g)2 − (f − g)2 folgt 5. aus 3. und Satz 8.15.
Beziehungen zur Ordungsrelation:
Satz 8.18:
Es seien f, g ∈ R[a, b] mit f ≤ g auf [a, b]. Dann gilt:
Zb
a
f (t) dt ≤
Zb
g(t) dt
a
(Ungleichungen zweier Funktionen darf man integrieren)
1
y
gelten
157
8.2 Das Riemannintegral
Spezialfall:
V
x f (x)
≥0⇒
Rb
a
f (x) dx ≥ 0.
Beweis: Ist (ζn , ξin ) eine Zerlegungsfolge mit |ζn | → 0 so gilt:
R(f, ζn , ξin ) ≤ R(g, ζn , ξin )
Und daher im Limes:
Satz 8.19:
Rb
a
f (x) dx ≤
Für f ∈ R([a, b]) gilt
Rb
a
g(x) dx.
b
Z
Zb
f (x) dx ≤ |f (x)| dx
a
a
Beweis: −f ≤ |f | und f ≤ |f | integrieren liefert mit Satz 8.18 die Behauptung oder man wendet
direkt die Dreiecksungleichung auf Riemannsummen an.
Korollar 8.20:
f sei Riemannintegrierbar. Dann gilt:
b
Z
f (x) dx ≤ sup |f (x)| x ∈ [a, b] · (b − a)
a
Beweis: |f (x)| ≤ sup |f (x)| mit Satz 8.18 und Satz 8.19 folgt:
R
R
b
b
a f (x) dx ≤ a |f (x)| dx ≤ sup{|f (x)|} · (b − a)
Integriert man die Ungleichung
m := inf{f (x) | x ∈ [a, b]} ≤ f ≤ M := sup{f (x) | x ∈ [a, b]}
dann erhält man:
Satz 8.21:
f sei Riemannintegrierbar. Dann gilt:
m(b − a) ≤
Zb
a
f (x) dx ≤ M (b − a)
Umschreiben liefert:
1
m ≤ W :=
b−a
Zb
a
f (x) dx ≤ M
Ist jetzt f zusätzlich stetig, so ist m = min f (x), M = max f (x) und W wird Zwischenwert.
Dieser wird nach dem Zwischenwertsatz für stetige Funktionen angenommen. Damit:
158
8 Integration
M
b
f (ξ)
b
b
b
ξ
ξ
m
a
b
Abbildung 8.4: Skizze zum Mittelwertsatz der Integralrechnung
Satz 8.22 (Mittelwertsatz der Integralrechnung):
f : [a, b] → stetig. Dann gibt es ξ ∈ [a, b] mit
R
1
f (ξ) =
b−a
Zb
f (x) dx
a
diese Zahl heißt auch Integralmittelwert.
Der Integralmittelwert ist gleich der Höhe eines flächengleichen Rechtecks (Siehe auch Abbildung 8.4).
Additivität im Intervall
R
f : [a, b] →
Funktion. Es sei c ein Punkt zwischen a und b, a ≤ c ≤ b. Durch Einschränken
erhält man zwei neue Funktionen f : [a, c] →
und f : [c, b] → , die wir aber mit dem
gleichen Symbol wie die ursprüngliche Funktion bezeichnen. Die geometrische
evidente Tatsache
Rb
der Additivität des Flächeninhalts, d.h. Fläche A + Fläche B = a f ist Inhalt von:
R
R
Satz 8.23:
f : [a, b] →
sei beschränkt, c mit a ≤ c ≤ b, gegeben. Dann ist f genau dann auf [a, b]
integriebar, wenn f über [a, c] und [c, b] integrierbar ist, und in diesem Fall gilt:
R
Zb
f (x) dx =
a
Zc
f (x) dx +
a
Zb
f (x) dx
c
Beweis: ζn sei eine Zerlegungsfolge von [a, b] mit |ζn | → 0, wobei jedes ζn den Punkt c enthält.
ζn liefert Zerlegung ζn′ und ζn′′ von [a, c] und [c, b], wobei die Feinheit gegen 0 geht. Dann liefert
die Aufteilung der Summe in zwei Summanden u(f, ζ) = u(f, ζn′ ) + u(f, ζn′′ ). Mit n → ∞ wird
daraus
Zb
Zc
Zb
f (x) dx = f (x) dx + f (x) dx
a
∗
a
∗
c
∗
159
8.3 Hauptsatz
Genauso für Oberintegrale
Zb ∗
Zc ∗
Zb ∗
f (x) dx = f (x) dx + f (x) dx
a
a
c
Betrachten wir nun die Differenz:
 c
  b

Zb ∗
Zb
Z ∗
Zc
Z ∗
Zb
f (x) dx − f (x) dx =  f (x) dx − f (x) dx +  f (x) dx − f (x) dx
|a
{z a
∗
}
=α
|
a
{z a
∗
}
=β
|
c
{z c
∗
=γ
Wobei α, β und γ größer oder gleich 0 sind. D.h. es gilt: α = 0 ⇔ β = 0 ∧ γ = 0.
}
Bisher war immer a ≤ b angenommen. Zur Vermeidung von Fallunterscheidungen (und weiterer
Gründe: Siehe Analysis 3) macht man für b ≤ a die folgende Definition:
Definition 8.10:
Für b ≤ a gelte:
Zb
a
f (x) dx := −
Za
f (x) dx
b
Übung: Satz 8.23 gilt für beliebige reelle a, b und c.
8.3
Hauptsatz
R
Zu gegebener differenzierbarer Funktion F : [a, b] → versuchen wir F aus ihrer Änderungsrate
f = F ′ zurückzugewinnen. Genauer: F (b) aus F (a) und f mit Hilfe des Mittelwertsatzes zu
berechnen.
F (b) = F (a) + f (ξ)(b − a)
ξ ∈ [a, b] geeignet
Aber: ξ ist im Allgemeinen nicht bekannt. Ausweg: Unterteilen und den Mittelwertsatz auf
Teilintervalle anwenden.
a = x0 < x1 < x2 < · · · < xn = b sei Zerlegung von [a, b]
Dann gilt auf jedem Teilintervall:
F (xi ) = F (xi−1 ) + f (ξi )(xi − xi−1 )
⇔F (xi ) − F (xi−1 ) = f (ξi )λ([xi−1 , xi ])
ξi ∈ (xi−1 , xi )
Aufsummieren:
n
X
i=1
n
X
F (xi ) − F (xi−1 ) =
f (ξi )λ([xi−1 , xi ])
i=1
F (b) − F (a) = R(f, ζ, ξii )
160
8 Integration
Wegen u(f, ζ) ≤ R(f, ζ, ξii ) ≤ o(f, ζ) gilt also u(f, ζ) ≤ F (b) − F (a) ≤ o(f, ζ).
(ζn )n∈N sei jetzt Zerlegungsfolge mit |ζn | → 0 und f Riemannintegrierbar, dann folgt
Zb
a
∗
Zb ∗
f (x) dx = lim u(f, ζn ) ≤ F (b) − F (a) ≤ lim o(f, ζn ) = f (x) dx
n→∞
n→∞
a
Damit haben wir bewiesen:
Satz 8.24 (Hauptsatz der Differntial- und Integralrechnung, 1. Form):
F : [a, b] →
R sei differenzierbar und f = F ′ . Ist f Riemannintegrierbar, so gilt
F (b) − F (a) =
Zb
f (x) dx
a
Genauere Fassung der Voraussetungen: F sei stetig auf [a, b]. F sei differenzierbar auf (a, b)
mit F ′ (x) = f (x) auf (a, b). f : [a, b] → sei Riemannintegrierbar.
R
Bemerkung: Nicht jede Ableitung ist Riemannintegrierbar!
R
Herleitung der 2. Form des Hauptsatzes: f : [a, b] →
sei integrierbar. Das Integral Zahl
Rb
a f (t) dt ist für uns eine Zahl gewesen, nämlich der Flächeninhalt unter der Kurve des Graphen.
Da — wenn f ∈ R[a, b] und z ∈ (a, b) auch f|[a,z] ∈ R[a, z] — können wir auch bis z integrieren,
Rz
d.h. wir betrachten die Funktion z 7→ a f (t) dt von [a, b] nach , d.h. wir betrachten das Integral
als Funktion seiner oberen Grenze (als unbestimmtes Integral). Diese Funktion bezeichnen wir
zunächst einmal mit F .
Zz
F (z) := f (t) dt
R
a
b
b
a
z
b
Beobachtung: Auch wenn f bei c eine Sprungstelle hat, ändert sich dort F (z) nicht sprunghaft.
Satz 8.25:
Es sei f ∈ R([a, b]). Dann ist die Funktion F : [a, b] →
R mit F (z) = Raz f (t) dt stetig.
161
8.3 Hauptsatz
c
b
1
c
b
1
2
c
b
c
b
2
1
c
b
3
4
b
3
c
b
2
5
6
7
b
c
b
−1
1
2
3
Abbildung 8.5: Graphen der Funktionen x 7→ f (x) und x 7→
Beweis: F (x) − F (y) =
Rx
a
f (t) dt −
Ry
a
f (t) dt = −
Ry
x
4
Rx
0
5
7
f (t) dt
f (t) dt. Damit folgt:
y Z Zy
|F (x) − F (y)| = f ≤ |f | ≤ L := sup |f (z)| z ∈ [a, b] · (b − a)
x
6
x
D.h.: |F (x) − F (y)| ≤ L · |x − y|. F ist sogar Lipschitz stetig!
Wie sieht es mit der Differenzierbarkeit der Flächeninhaltsfunktion aus? Abbildung 8.5 zeigt:
Besitzt f eine Sprungstellen, dann ist F dort nicht differenzierbar. Vermutung: f stetig impliziert,
daß F differenzierbar ist.
Satz 8.26 (Hauptsatz der Differential- und Integralrechnung, 2. Form):
R
f : [a, b]R →
sei Riemannintegrierbar und bei x0 ∈ [a, b] stetig. Dann ist die Funktion
x
F (x) = a f (t) dt in x0 differenzierbar, und es ist F ′ (x0 ) = f (x0 ).
Ist also: f auf [a, b] stetig. Dann gilt: F ist auf [a, b] differenzierbar mit F ′ = f . Dies liefert
sofort eine Stammfunktion für eine stetige Funktion. Stetigkeit in x0 ist hinreichend aber nicht
notwendig.
Beweis:
F (x0 + h) − F (x0 ) =
Für h 6= 0:
F (x0 +h)−F (x0 )
h
=
1
h
x0R+h
x0
xZ0 +h
f (t) dt
(wie oben)
x0
f (t) dt
|{z}
stetig
Nach dem Mittelwertsatz der Integralrechnung ist dies gleich f (ξn ) für ein ξn zwischen x0
und x0 + h. Durchläuft h eine bliebige Nullfolge (hn )n∈N , hn 6= 0, so durchläuft (ξhn )n∈N eine konvergierende Folge mit lim ξn = x0 (denn |ξn − x0 | ≤ |hn |). Da f stetig bei x0 folgt:
n→∞
lim f (ξhn ) = f ( lim ξhn ) = f (x0 ). ⇒ lim
n→∞
n→∞
h→0
F (x0 +h)−F (x0 )
h
= f (x0 ).
Dieser Beweis gilt für: f ist auf [a, b] stetig. Wie ist der Beweis für f stetig in x0 zu modifizieren?
Damit gezeigt:
162
8 Integration
Korollar 8.27:
Jede stetige Funktion f : [a, b] →
Beispiel:
f (x) =
R
R Q
(
0
1
q
R besitzt eine Stammfunktion (nämlich z 7→ Raz f (t) dt)
x irrational
x = pq ∈
gekürzt,
Q
q>0
Q
ist bei −
stetig, bei x ∈
unstetig, f ist Riemannintegrierbar und es ist
f : [0, 1]R→
x
F (x) = 0 f (t) dt = 0. F ist offensichtlich überall differenzierbar mit F ′ = 0. Für x ∈ −
gilt also F ′ (x) = f (x), für x ∈ ist f (x) 6= F ′ (x).
△
R Q
Q
Diskurs: f integrierbar und f hat Stammfunktion sind verschiedene Begriffe:
1. Man Rkann mehr Funktionen integrieren als nur die stetigen. Die resultierende Funktion
z
z 7→ a f (t) dt ist nicht immer differenzierbar, oder: Es gibt integrierbare Funktionen ohne
Stammfunktion.
2. Es gibt Funktionen die eine Stammfunktion haben und trotzdem nicht Riemannintegrierbar
sind. (Defekt des Riemannintegrals, es gibt Integralbegriffe, wo alle Ableitungen integrierbar sind.)
Hier gilt der Hauptsatz (1. Form)
f ist Riemannintegrierbar
stetige
Funktionen
f hat eine Stammfunktion
Beispiel:
(
x1/3 · sin(1/x) x 6= 0
F (x) =
0
x=0
(
4 1/3
x sin(1/x) − x−2/3 cos(1/x)
F ′ (x) = 3
0
x 6= 0
x=0
F’ ist nicht beschränkt, deshalb nicht Riemannintegrierbar. Es gibt auch Beispiele von Funktionen F mit F ′ beschränkt und F ′ ∈
/ R([a, b]).
△
163
8.3 Hauptsatz
R
Beweis (von Satz 8.24 aus Satz 8.26, wenn f stetig): Satz 8.24 für stetig: F : [a, b] →
diffeRb
′
renzierbar, f = F sei stetig. ⇒ F (b) − F (a) = a f (t) dt
Rz
Beweis: Die Funktion G(z) = a f (t) dt ist nach Satz 8.26 differenzierbar mit Ableitung G′ = f .
Also haben wir zwei Funktionen, F und G, mit gleicher Ableitung. D.h.: die Differenz von F und
G ist konstant (denn (F − G)′ = F ′ − G′ = f − f = 0). Also F (x) = G(x) + c, mit c Konstante.
Rb
x = a einsetzen F (a) = G(a) + c = c, d.h. F (x) = G(x) + F (a) oder F (b) − F (a) = a f (t) dt. Dieser Beweis zeigt sehr schön, wie man jetzt umgekehrt — das ist die praktische Seite des Hauptsatzes, die theoretische ist der Existenzbeweis für Stammfunktionen, etwa für stetige Funktionen
— den Hauptsatz zur Integralrechnung ausnutzen kann, und damit Grenzprozesse über Unterbzw. Obersummen vermeiden kann:
Annahme: Man kennt eine Stammfunktion F für die Funktion f ∈ R[a, b] (etwa durch Raten,
Anwendung der Regeln für unbestimmtes Integrieren). Dann gilt (Satz 8.24):
Zb
f (t) dt = F (b) − F (a)
a
R
Notation: Bezeichnet F = f (t) dt das unbestimmte Integral, d.h. eine Stammfunktion von
R
b
f ∈ R[a, b], so schreibt man:
f (t) dt a für F (b) − F (a). D.h.:
Z
f (t) dt
b
a
=
Zb
F (b) − F (a) =
f (t) dt
a
Zb
F ′ (t) dt
a
Also: Kennt man eine Stammfunktion einer Riemannintegrierbaren Funktion, so wird das Integrieren trivial.
√
Beispiel: Flächeninhalt“ des Kreises: f (t) = 1 − t2 auf [0, 1].
”
Γf
1
−1
1
−1
√
2
Wir wissen F (x) = x 1−x −arcsin(x)
ist Stammfunktion für f . F (1) − F (0) =
2
Kreisfläche = π (vier Viertelkreise).
arcsin 1−arcsin 0
2
= π4 .
△
Umformulierung des partiellen Integrierens und der Substitutionsregel für betimmte Integrale.
Satz 8.28:
164
8 Integration
Es sei f stetig mit Stammfunktion F , g stetig differenzierbar. Dann gilt:
"
# b Zb
Zb
f (x) · g(x) dx = F (x) · g(x) − F (x) · g′ (x) dx
a
a
Beweis: F (x) · g(x) −
Mit Satz 8.26 folgt:
Rx
a
a
F (t) · g′ (t) dt ist Stammfunktion von (f · g)(x).
Satz 8.29:
Es sei f stetig und g : [α, β] → [a, b] stetig differenzierbar mit g(α) = a und g(β) = b.
Dann gilt:
Zb
Zβ
f (x) dx = f (g(t)) · g′ (t) dt
a
α
Mekre: Läuft t von α nach β, so läuft x = g(t) von a = g(α) nach b = g(β).
d
Beweis: F sei Stammfunktion von f , dann ist dt
F (g(t)) = F ′ (g(t)) · g′ (t) = f (g(t)) · g′ (t).
Rβ
Also ist F ◦ g Stammfunktion von f (g(t)) · g′ (t). Demnach α f (g(t)) · g′ (t)dt = [F ◦ g]βα =
Rb
F (g(β)) − F (g(α)) = F (b) − F (a) = a f (t) dt.
Anwendung der partiellen Integration auf die Taylorformel:
Voraussetzung: I sei offenes Intervall, f : I → sei n-mal stetig differenzierbar, a, b ∈ I, n ≥ 1.
Rb
Nach dem Hauptsatz gilt dann: f (b) = f (a) + a f ′ (x) dx.
Dies sieht wie die Taylorformel aus, wenn a der Entwicklungspunkt und b = a + h ist. Das
Restglied ist hier das Integral. Setze u = f ′ , v = b − x und v ′ = −1. Dann ist
"
#b Zb
Zb
R
a
f ′ (x) · (−1) dx = f ′ (x) · (b − x)
| {z } | {z }
| {z } | {z }
u
u
v′
v
′
a
= −f (a) · (b − a) −
Einsetzen: f (b) = f (a) + f ′ (a)(b − a) +
Satz 8.30:
f :I →
Rb
a
−
Zb
a
a
f ′′ (x) · (b − x) dx
f ′′ (x) · (b − x) dx
f ′′ (x) · (b − x) dx. Iterieren liefert
R sei n-mal stetig differenzierbar, a, b ∈ I, n ≥ 1. Dann ist:
f (b) =
n−1
X
|ν=0
f
(ν)
Zb
(b − x)n−1
(b − a)ν
+ f (n) (x)
(a)
dx
ν!
(n − 1)!
{z
} |a
{z
}
n − 1-tes Taylorpolynom
Restglied in Integralform
Beweis: Induktion über n: Induktionsanfang: oben.
n
Induktionsschluß: von n zu n + 1: u = f (n) (x), v = − (b−x)
und v ′ =
n!
Zb
a
(b−x)n−1
(n−1)! .
"
# b Zb
n−1
n
(b
−
x)
(b
−
x)
(b − x)n
f (n) (x)
dx = f (n) (x)
(−1) + f (n+1) (x)
(−1) dx
(n − 1)!
n!
n!
Einsetzen ergibt die Behauptung.
a
a
165
8.4 Funktionenfolgen und Grenzwertsätze
8.4
Funktionenfolgen und Grenzwertsätze
Genau wie man Folgen reeeller Zahlen studieren kann, kann man auch Folgen von Funktionen
betrachten. Es sei M eine Menge von Funktionen, D eine Menge und für jedes n ∈
sei
gegeben. (fn )n∈N heißt dann Funktionenfolge (Eine
eine Funktion fn ∈ M mit fn : D →
Funktionenfolge ist also nichts anderes als eine Abbildung von in eine Menge von Funktionen).
N
R
N
Beispiele:
1. x 7→
n
P
ai xi = fn (x) (=n-te Partialsumme einer Potenzreihe)
i=0
2. x 7→ xn (siehe auch Abbildung 8.6)
3. x 7→ sinn (x)
4. x 7→ fn (x) = n-tes Taylorpolynom einer beliebig oft differenzierbaren Funktion
5. x 7→
n
P
m=1
sin(m·x)
m
△
(Patialsumme einer Fourrierreihe)
P
Genau wie bei Zahlen betrachtet man auch Funktionenreihen ( ∞ fn ) – das Verhältnis von
Funktionenfolgen zu Funktionenreihen ist dasselbe.
Durch Einsetzen von a ∈ D in fn entsteht aus einer Funktionenfolge (fn )n∈N eine Zahlenfolge
(fn (a))n∈N . Man sagt, man betrachte die Funktionenfoge punktweise. Dies war genau unser
Standpunkt bei Potenzreihen. Dadurch kann man den Konvergenzbegriff für Zahlenfolgen auf
Funktionenfolgen übertragen:
Definition 8.11:
Eine Funktionenfolge (fn )n∈N heißt punktweise konvergent gegen die Funktion f , wenn
für alle a ∈ D die Zahlenfolge (fn (a))n∈N gegen f (a) konvergiert. Die durch f (a) :=
lim fn (a) definierte Funktion f = lim fn heißt dann Grenzfunktion. Kurz:
n→∞
f = lim fn ⇔
n→∞
^
x∈D
f (x) = lim fn (x) ⇔
n→∞
^ ^ _ ^
x∈D ε>0 Nε n≥Nε
|fn (x) − f (x)| ≤ ε
Beispiele:
1. fn mit fn (x) = xn auf D = [0, 1] ⊂
(
0 für x 6= 1
Also: lim fn (x) =
n→∞
1 für x = 1
R. Für a ∈ [0, 1) gilt n→∞
lim an = 0.

2

für x ∈ [0, 1/n]
n x
2
2. fn (x) = 2n − n x für x ∈ [1/n, 2/n]


0
für x ∈ [2/n, 2]
166
8 Integration
n
Γ fn
4
3
2
1
Γ f1
1
n
2
n
1
2
1
3
1
△
2
Klar: lim fn = 0
n→∞
3. D =
R, fn(x) = k→∞
lim cos(n! · π · x)2k .
(
1 für x ∈
lim fn (x) = Dirichlet Funktion =
n→∞
0 für x ∈
/
b
1
b
Q
Q
b
1
b
c
b
1
1
Abbildung 8.6: Links: Graphische Veranschaulichung der Funktionenfolge (fn )n∈N mit x 7→ xn .
Rechts: Die Grenzfunktion f = lim fn
n→∞
Diese Beispiele belegen, daß bei Grenzwerten von Funktionenfolgen überraschende Dinge passieren können. Aus stetigen Funktionen werden unstetige, (aus integrierbaren nicht integrierbare).
Man sucht daher nach einem Grenzwertbegriff, der stärkere Vorraussetzungen macht und dafür
angenehmere Konsequenzen hat.
Auf einer Menge von Funktionen, z.B. F = {f | f : D → Funktion}, B = {f : D → | f beschränkt}, C 0 (D) = {f : D → | f stetig}, C k = {f : D → | f k-mal stetig differenzierbar},
gibt es — ganz anders als bei — viel mehr sinnvolle Möglichkeiten Konvergenz zu definieren
(dies führt zur Funktionalanalysis). Hier nur ein neuer Konvergenzbegriff: gleichmäßige Konvergenz.
R
R
R
R
R
Bemerkung: Das pathologische“ Ergebnis, daß eine punktweise konvergente Funktionenfolge
”
stetiger Funktionen keine stetige Grenzfunktion zu haben braucht, beruht offenbar darauf, daß
die Stetigkeit einer Funktion von den Funktionswerten einer ganzen Umgebung jeder Punkte
abhängt, während die punktweise Konvergenz darauf keine Rücksicht nimmt. Siehe fn (x) = xn .
167
8.4 Funktionenfolgen und Grenzwertsätze
Grob: fn (a) soll an allen Stellen a gleich schnell oder gleichmäßig konvergieren.
Definition 8.12 (Gleichmäßige Konvergenz):
R
R
(fn )n∈N sei eine Funktionenfolge auf D ⊂ , f : D → Funktion. (fn )n∈N konvergiert
gleichmäßig gegen f
^ _ ^ ^
:⇔
|fn (x) − f (x)| < ε
ε>0 Nε n≥Nε x∈D
Wir schreiben: gllim fn = f
n→∞
Frage: Was ist der Unterschied zur punktweisen Konvergenz?
rechts gerückt worden.
V
x∈D
ist von der Spitze nach
Das bedeutet: Das zu ε zu findende Nε ist unabhängig von x ∈ D zu finden, während es
bei punktweise Konvergenz ruhig von x abhängig sein kann — deshalb ist die Konvergenz
gleichmäßig/gleichschnell für alle x ∈ D
f (x) + ε
b
f (x)
b
f (x) − ε
b
a
x
Γf
Γ fn
b
Abbildung 8.7: Gleichmäßige Konvergenz
Anschaulich: f = gllim fn . Zu ε > 0 gibt es ein Nε , so daß für n ≥ Nε gilt:
n→∞
fn (x) ∈ (f (x) − ε, f (x) + ε) = Uxε
(⇔ |f (x) − fn (x)| < ε).
S
ε-Schlauch um f := x∈D {x} × Uxε . Γfn muß für n ≥ Nε im ε-Schlauch um Γf liegen. Abbildung 8.7 zeigt einen ε-Schlauch um f und eine Funktion fn mit n ≥ Nε (Γfn liegt im ε-Schlauch).
Klar: Wenn (fn )n gleichmäßig gegen f konvergiert, dann konvergiert (fn )n auch punktweise (mit
gleicher Grenzfunktion). Im Allgemeinen gilt dies aber nicht umgekehrt: Gleichmäßige Konvergenz ist eine viel stärkere Vorraussetzung als punktweise Konvergenz. Es gibt viel mehr punktweise konvergierende Funktionenfolgen als etwa gleichmäßig konvergierende. Zum Ausgleich erhält
die gleichmäßige Konvergenz viele Eigenschaften, eine ist die Stetigkeit. Konvergenzkriterium
für gleichmäßige Konvergenz siehe Literatur.
Satz 8.31:
R
R
konvergiere gleichmäßig gegen f : D →
und alle
(fn )n∈N Funktionenfolge auf d ⊂
fn : D → seien in x0 ∈ D stetig. Dann ist auch die Grenzfunktion f stetig in x0 .
R
168
8 Integration
Beweis: ε > 0 vorgegeben, gesucht δ > 0 mit |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε. Vorbereitende
Abschätzung
|f (x) − f (x0 )| = |f (x) − fn (x) + fn (x) − fn (x0 ) + fn (x0 ) − f (x0 )|
≤ |f (x) − fn (x)| + |fn (x) − fn (x0 )| + |fn (x0 ) − f (x0 )|
|
{z
} |
{z
} |
{z
}
A
B
C
N
V
Nach Voraussetzung gibt es zu ε > 0 ein Nε ∈
mit: n ≥ Nε ⇒ y∈D |fn (y) − f (y)| < ε/3.
Dies liefert A < ε/3 und C < ε/3 für n ≥ Nε und zwar bei A für alle x ∈ D. Wähle jetzt
ein festes n ≥ Nε etwa n = Nε . Dann ist fn bei x0 stetig, d.h. zu ε/3 gibt es δ(n) > 0 mit
|x − x0 | < δ(n) ⇒ |fn (x) − fn (x0 )| < ε/3. Für unser festes n und alle x mit |x − x0 | < δ(n)
gelten die drei Ungleichungen:
A < ε/3, B < ε/3 und C < ε/3. Setze δ = δ(n) . Dann gilt |x − x0 | < δ ⇒ |f (x) − f (x0 )| < ε,
d.h. f ist stetig in x0 .
Bemerkung: Beliebter Schluß: alle fn stetig und f = lim fn (z.B. Punktweise). Wenn f nicht
stetig ist, dann folgt: Die Konvergenz ist nicht gleichmäßig (z.B. x 7→ xn ).
Wenn (fn ) gleichmäßig konvergiert, dann gilt:
lim lim fn (x) = lim lim fn (x)
n→∞ x→x0
x→x0 n→∞
Übung: f = gllim fn , alle fn beschränkt ⇒ f beschränkt.
Beispiel: Potenzreihen:
Satz 8.32:
P
i
Ist R > 0 der Konvergenzradius einer Potenzreihe, f (x) = ∞
i=0 ai x . Dann konvergiert
auf jedem abgeschlossenen
Intervall [a, b] ⊂ (−R, +R) die Partialsummenfolge (fn )n∈N
P
mit fn (x) = ni=0 ai xi gleichmäßig gegen f .
Beweis: Es reicht die Konvergenz P
auf [a, b] ⊂ [−r, +r] mit r > 0 zu zeigen.PEs sei q mit 0 < q ≤
n
r < R gewählt. Dann konvergiert ∞
|an | q n . Es ist
n=0 an q absolut, d.h. es konvergiert
∞
∞
∞
X
X
X
|f (x) − fm (x)| = an xn ≤
|an | · |xn | ≤
|an | q n
falls |x| ≤ q.
n=m+1
n=m+1
n=m+1
P∞
P∞
n konvergiert wird der Reihenrest
n beliebig klein, also auch
Da
n=0 |an | q
n=m+1 |an | q
|f (x) − fn (x)| und zwar für alle x mit |x| ≤ q
Bemerkung: zum Problem, welche Funktionen lassen sich als gleichmäßige Grenzwerte von
schönen Funktionen etwa Polynomen darstellen? Dazu:
Weierstraßscher Approximationssatz : Zu jeder auf [a, b] stetigen Funktion f gibt es eine Folge
(Pn )n∈N von Polynomen die gleichmäßig gegen f konvergiert. Beweis: siehe Literatur.
Beachte: Ist f stetig mit f = gllimn→∞ Pn , so sind alle Pn beliebig oft differenzierbar. f braucht
aber nicht differenzierbar zu sein. Es gilt also sicher nicht: (fn )n∈N Folge differenzierbarer Funktionen und f = gllim fn ⇒ f differenzierbar. Richtiger Satz später.
n→∞
169
8.4 Funktionenfolgen und Grenzwertsätze
Einen anderen Zugang zur gleichmäßigen Konvergenz liefert folgende Überlegung:
In der Definition von Konvergenz für Zahlenfolgen taucht der Absolutbetrag auf, d.h. eine Abbildung | | :
→ + . Die Zahl |a − an | mißt den Abstand bzw. |a| die Größe/Länge der Zahl
a. Könnte man Länge einer Funktion bzw. den Abstand zweier Funktionen messen, so könnte
man ganz analog vorgehen: Dies leistet der Begriff Norm.
R R
Definition 8.13 (Norm):
V sei ein reeller Vektorraum. Eine Funktion k k : V →
die Axiome (N1)–(N3) gelten:
^
(N1)
kvk = 0 ⇒ v = 0
R heißt genau dann Norm, wenn
v∈V
(N2)
^ ^
R
λ∈
^
(N3)
v∈V
v,w∈V
kλ · vk = |λ| · kvk
kv + wk ≤ kvk + kwk
R
Setze V = B = {f : D → | f beschränkte Funktion}. Beachte: Mit f und g sind auch f + g,
λ · f für λ ∈
und f · g beschränkt. D.h. B ist ein Untervektorraum des Vektorraums aller
Funktionen.
R
Definition 8.14:
Für f ∈ B (d.h. f beschränkt) definiere kf k := sup |f (x)| = Supremum Norm von f .
x∈D
Satz 8.33:
Für f, g ∈ B, λ ∈
R gilt:
1. kf k = 0 ⇔ f = 0-Funktion
2. kλf k = |λ| · kf k
3. kf + gk ≤ kf k + kgk
4. kf · gk ≤ kf k · kgk
Beweis: 1., 2. und 4. sind trivial. Zu 3.: |f (x) + g(x)| ≤ |f (x)| + |g(x)| (nach Dreiecksungleichung). Weiterhin gilt |f (x)| + |g(x)| ≤ sup |f (x)| + sup |g(x)| = kf k + kgk. Dies gilt für jedes
x∈D
x∈D
x ∈ D, also auch für sup |f (x) + g(x)| = kf + gk.
x∈D
Durch k k : B →
R erhält man eine zu | | : R → R analoge Funktion. Man definiert deshalb:
Definition 8.15:
Die Folge (fn )n∈N mit fn ∈ B konvergiert in der sup-Norm gegen f ∈ B
^ _ ^
⇔
kfn − f k < ε
N
ε>0 Nε ∈
D.h. lim kfn − f k = 0.
n→∞
n≥Nε
170
8 Integration
Beachte: lim kfn − f k = 0 bedeutet etwas ganz anderes als lim kfn k = kf k.
n→∞
n→∞
Leicht zu zeigen ist jetzt:
Satz 8.34:
Sind f und fn ∈ B, dann ist äquivalent:
1. (fn )n∈N konvergiert gleichmäßig gegen f .
2. lim kfn − f k = 0, d.h. (fn )n∈N konvergiert in der sup-Norm gegen f .
n→∞
Einziger Unterschied: Gleichmäßige Konvergenz ist auch bei unbeschränkten Funktionen noch
erklärt.
N
Beweis: ⇒“ ε > 0 vorgegeben. Gesucht Nε ∈ mit n ≥ Nε ⇒ kfn − f k < ε. Nach Vorausset”
zung gibt es zu ε > 0 gibt es Nε ∈ mit n ≥ Nε ⇒ |fn (x) − f (x)| < ε für alle x ∈ D. Also gilt
auch sup |fn (x) − f (x)| = kfn − f k < ε
N
x∈D
⇐“ genauso.
”
Wichtig für das Arbeiten mit Integralen ist die Frage der Vertauschbarkeit mit anderen Grenzprozessen. Gegeben: f = lim fn mit fn ∈ R([a, b]) für alle n. Frage: Gilt dann: f ∈ R([a, b])?
Rb
Rb
Wenn ja, ist a f (x) dx = lim a fn (x) dx?
n→∞
Im Allgemeinen ist die Antwort zu beiden Fragen nein (bessere Eigenschaften hat das LebesqueIntegral). Situation ähnlich wie bei / : Durch Grenzprozesse verläßt man leicht die Funktionenmenge R([a, b]).
Unproblematisch ist die gleichmäßige Konvergenz (starker Konvergenzbegriff, nur wenige Funktionenfolgen konvergieren gleichmäßig):
QR
Satz 8.35:
Es sei (fn )n∈N eine Funktionenfolge Riemannintegrierbarer Funktionen und es gelte:
f = gllim fn auf [a, b]. Dann ist f integrierbar und es gilt
n→∞
Zb
f (x)dx = lim
n→∞
a
Zb
fn (x) dx =
a
Beweis: Wir verwenden: f ∈ R([a, b]) ⇔
Dazu: ε > 0 vorgegeben. f = gllim fn ⇒
n→∞
V
Zb
lim fn (x) dx
n→∞
a
W
Zerlegung ζ o(f, ζ) − u(f, ζ) < ε.
V
V
Nε ∈N n≥Nε x |f (x) − fn (x)| < ε, d.h.
ε>0
W
fn (x) − ε ≤ f (x) ≤ fn (x) + ε
(für alle x ∈ [a, b], n ≥ Nε ).
(∗)
Es sei ζ eine Zerlegung von [a, b]. Daraus folgt für Untersummen:
u(fn , ζ) − ε · (b − a) ≤ u(f, ζ) ≤ u(fn , ζ) + ε · (b − a)
Multiplizieren mit −1 ergibt −u(f, ζ) ≤ −u(fn , ζ) + ε · (b − a). Die Gleichung (∗) liefert für
Obersummen o(f, ζ) ≤ o(fn , ζ) + ε · (b − a). Durch Addition ergibt sich dann
o(f, ζ) − u(f, ζ) ≤ o(fn , ζ) − u(fn , ζ) + 2ε · (b − a).
171
8.4 Funktionenfolgen und Grenzwertsätze
W
fn Riemannintegrierbar: ζ o(fn , ζ)−u(fn , ζ) < ε(b−a). Zusammen: o(f, ζ)−u(f, ζ) < 3ε(b−a).
Daraus folgt: f ∈ R([a, b]). Damit gilt:
b
b
Z
Z
Zb
f (x) dx − fn (x) dx = (fn (x) − f (x)) dx
a
a
a
≤ sup |fn (x) − f (x)| · (b − a)
x∈D
= kfn − f k · (b − a)
Rb
fn (x) dx
n→∞ a
Aus f = gllim fn folgt: (kfn − f k)n ist Nullfolge, also gilt lim
n→∞
Korollar 8.36:
Für fn ∈ R([a, b]) sei die Reihe F (x) =
ist F ∈ R([a, b]) und es gilt:
Zb
F (x) dx =
∞
P
Rb
a
f (x) dx.
fn (x) gleichmäßig konvergent auf [a, b]. Dann
n=0
Zb X
∞
fn (x) dx =
a n=0
a
=
∞ Z
X
b
fn (x) dx
n=0 a
Beispiel:
Zb
x
e dx =
a
=
Zb X
∞
∞
X
xn
dx =
n!
a n=0
∞
X
bn+1
(n + 1)!
n=0
Zb
b
∞
X
xn
xn+1 dx =
n!
(n + 1)! a
n=0 a
∞
X
an+1
−
n=0
(n + 1)!
n=0
= eb − ea
= (eb − 1) − (ea − 1)
△
Korollar 8.37:
∞
P
f (x) =
an xn sei Potenzreihe mit Konvergenzradius R > 0. Für [a, b] ⊂ (−R, +R) gilt:
n=0
Zb
f (t) dt =
∞ Z
X
b
an tn dt =
n=0 a
a
∞
X
an
(bn+1 − an+1 )
n+1
n=0
Spezialfall: Ist |x| < R, dann gilt:
Zx
0
x
f (t) dt =
∞ Z
X
n=0 0
an tn dt =
∞
X
an n+1
x
n+1
n=0
Rx
Die Funktion F (x) = 0 f (t) dt ist Stammfunktion von f , da f stetig ist. Kurz: Man darf auf
[a, b] ⊂ (−R, +R) eine Potenzreihe gliedweise integrieren.
2
Beispiel: ex , sinx x . Man erhält so Potenzreihendarstellungen für die nicht elementare Stammfunktionen dieser Funktionen.
△
172
8 Integration
Bemerkung: Dieser Korollar liefert einen (neuen) Beweis für den Satz von der gliedweisen Differentiation:
Satz 8.38:
P
n
F (x) = ∞
mit Konvergenzradius R > 0. Dann ist F diffen=0 an x sei eine
P Potenzreihe
′
n−1 .
renzierbar und F (x) = ∞
a
nx
n=1 n
P∞
n−1 hat den gleichen Konvergenzradius
Beweis: Wir verwenden: Die Reihe f (x)
=
n=1 nan x
P∞
wie
Korollar 8.37 ist f (x) = n=1 nan xn−1 gliedweise integrierbar, stetig und es gilt
R x F . Nach P
∞
n
n=1 an x = F (x) − a0 . Nach dem 2. Hauptsatz ist also F differenzierbar mit
0 f (t) dt =
F′ = f.
Genauso kann man über die Integralrechnung folgenden Satz über Differenzierbarkeit von Funktionenfolgen herleiten (direkter Beweis → Barner Flohr, Heuser)
Satz 8.39:
(fn )n∈N sei Funktionenfolge auf (a, b) mit:
V
1. n fn ist stetig differenzierbar auf (a, b).
2. (fn′ )n∈N konvergiere gleichmäßig.
3. (fn (x0 ))n∈N konvergiere für wenigstens einen Punkt x0 ∈ (a, b).
Dann gilt: (fn (x))n∈N konvergiert für alle x und die Grenzfunktion f ist differenzierbar
mit f ′ (x) = lim fn′ (x)
n→∞
Beweis: fn′ stetig und g = gllim fn′ ⇒ g stetig. Daraus folgt:
n→∞
lim
n→∞
Zx
fn′ (t) dt
=
x0
Zx
lim f ′ (t) dt
n→∞ n
=
x0
Zx
(∗)
g(t) dt
x0
Rx
Mit dem Hauptsatz und der Stetigkeit von g ergibt sich: Die Funktion x 7→ x0 g(t) dt ist diffeRx
renzierbar mit Ableitung g(x). Da fn Stammfunktion von fn′ gilt: fn (x) − fn (x0 ) = x0 fn′ (t) dt.
Rx
∗ Rx
Also lim (fn (x) − fn (x0 )) = lim x0 fn′ (t) dt = x0 g(t) dt, d.h. lim fn (x) existiert für alle x.
n→∞
n→∞
n→∞
Rx
Damit f (x) − f (x0 ) = lim fn (x) − lim fn (x0 ) = lim (fn (x) − fn (x0 )) = x0 g(t) dt. Hieraus
n→∞
n→∞
n→∞
folgt x 7→ f (x) ist differenzierbar mit Ableitung g(x) = lim fn′ (x), d.h. f ′ (x) = lim fn′ (x). n→∞
n→∞
Die Vertauschbarkeit zwischen Integral und Limes besteht nur bei gleichmäßiger Konvergenz.
Wie die nachfolgenden Beispiele zeigen, kann alles mögliche passieren, wenn nur punktweise
Konvergenz vorliegt.
Beispiele: Siehe Abbildung 8.8 für eine Zeichnung der Funktionen. Die einzelnen Funktionen
sind ähnlich wie bei der Funktion auf Seite 165 definiert. In allen Fällen gilt: Die Konvergenz
lim fn (x) = 0 ist punktweise und nicht gleichmäßig.
n→∞
R1
R1
1. Höhe des Dreiecks ist 1. 0 fn (x) dx = n1 , d.h. lim 0 fn (x) dx = 0. Es gilt lim fn ist
n→∞
n→∞
R1
R1
integrierbar und lim 0 fn = 0 lim fn .
n→∞
n→∞
173
8.4 Funktionenfolgen und Grenzwertsätze
2. Höhe des Dreiecks: n. Klar: kfn k = n.
R1
0 lim fn (x) dx = 0.
n→∞
R1
0
fn (x) dx = 1 also lim
R1
n→∞ 0
fn (x) dx = 1 aber
Hier: Grenzfuktion ist integrierbar aber es liegt keine Vertauschbarkeit von Integral und
Grenzwert vor.
R1
3. Höhe des Dreiecks: n2 . 0 fn (x) dx = n.
Hier konvergiert fn punktweise gegen die 0-Funktion, die integrierbar ist (wie bei den
anderen Beispielen). Aber die Integralfolge konvergiert nicht!
△
n2
n
1
1/n
2/n
1/n
2/n
1/n
Abbildung 8.8: Dreiecke verschiedener Höhe (hier für n = 2)
2/n
Hinweis auf ausgelassene Begriffe
1. Großer Umordungssatz für Reihen (→ Literatur)
2. Einseitige Differenzierbarkeit (→ Literatur)
3. Konvexität
4. Numerische Lösungen von Gleichungen, insbesondere das Newton-Verfahren (→ numerische Mathematik)
5. Parameterabhängige Integrale
6. Uneigentliche Integration
7. Bogenlänge
8. Fourierreihen
9. Anwendung des Integrals auf Reihenberechnung
Empfohlene Literatur
1. Vorbereitende Literatur:
H. D. Ebbinghaus u.a.: Zahlen, Springer Grundwissen Mathematik 1
H. B. Griffiths, P. J. Hilton: Klassische Mathematik in zeitgemässer Darstellung, 1, 2,
Vandenh.+Rup.
G. Richter (Herausgeber): Mathematisches Vorsemester, Springeer
H. Scheid: Abiturwissen Analysis, Klett
2. Lehrbücher für Lehramtsstudenten:
H. Kütting: Elementare Analysis, 1, 2, B.I: Wissenschaftsverlag
E. Wittman: Infitinitesimalrechnung in genetischer Darstellung, I, II, Henn Verlag
H. Scheid, K. Endl: Mathematik für Lehramtskandidaten, IV Analysis, Akad. Verlagsgesellschaft
H. Hischer, H.Scheid: Grundbegriffe der Analysis. Genese und Beispiele aus didaktischer
Sicht, Spektrum Verlag
H. Scheid: Folgen und Funktionen, Spektrum Verlag
S. Sonar: Einführung in die Analysis, Vieweg
3. Ergänzungen
P. Furlan: Das gelbe Rechenbuch 1, Furlan
W. Strampp: Höhere Mathematik mit Mathematika, Vieweg
R. Braun, R. Meise: Analysis mit Maple, Vieweg
H. Fischer, H. Kaul: Mathematik für Physiker 1, Teubner
4. Analysis Bücher:
O. Forster: Analysis I, Vieweg
T. Bröcker: Analysis I, B-I Wissenschaftsverlag
K. Königsberger: Analysis I, Springer
J. Cigler: Einführung in die Differential- und Integralrechnung, Vorlesung über Math.,
Manz
Fischer Gamst, Horneffer: Skript zur Analysis, Band 1, FB Math, Bremen
M. Barner, F. Flohr: Analysis I, de Gruyter
U. Storch, H. Wiebe: Lehrbuch der Mathematik I, B-I Wissenschaftsverlag
H. Heuser, Lehrbuch der Analysis, Teil 1, Teubner
W. Walter: Analysis I, Springer Grundwissen
S. Lang: Analysis I, Addison Wesley (Englisch)
176
8 Integration
M. Spivak: Calculus, Benjamin (Englisch)
H. Holdgrün: Analysis, Band 1, Leins Verlag
E. Behrends: Analysis, Band 1+2, Vieweg
W. Kaballo: Einführung in die Analysis I, Spektrum Verlag
S. Hildebrandt: Analysis 1, Springer
A
Symbole
A.1
Griechische Buchstaben
Buchstabe
A, α
B, β
Γ, γ
∆, δ
E, ε (ǫ)
Z, ζ
H, η
Θ, ϑ (θ)
I, ι
K, κ
Λ, λ
M, µ
A.2
Name
Alpha
Beta
Gamma
Delta
Epsilon
Zeta
Eta
Theta
Iota
Kappa
Lambda
My
Buchstabe
N, ν
Ξ, ξ
O, o
Π, π
P, ρ (̺)
Σ, σ
T, τ
Υ, υ
Φ, ϕ (φ)
X, χ
Ψ, ψ
Ω ω
Name
Ny
Xi
Omikron
Pi
Rho
Sigma
Tau
Ypsilon
Phi
Chi
Psi
Omega
Unterschiedliche Schreibweisen
Wenn Formeln im laufenden Text auftauchen wird bei einigen Symbolen teilweise eine andere
Schreibweise verwandt, bei der Angaben, wie z.B. Integralgrenzen, neben dem Symbol anstatt
über und unter dem Symbol gesetzt werden. Dies kommt z.B. bei folgenden Symbolen vor:
•
W
x
statt
_
V
und
x
x
statt
^
.
x
• limn→∞ statt lim . Ebenso bei lim inf, lim sup, lim− , lim+ und gllim.
n→∞
•
Pn
•
Rb
i=1 ai
a
statt
n
P
ai . Ebenso bei
i=1
f (x) dx statt
Rb
a
Q
.
f (x) dx. Ebenso bei
R
∗
und
R∗
• supi≤n statt sup. Ebenso bei inf, max und min.
i≤n
.
Index
Abbildung
Identische Abbildung, 14
Abbildungen, 9
Ableitung, 111, 120
Ableitung der Umkehrfunktion, 125
Ableitungsfunktion, 120
Ableitungsregeln, 121
absolut konvergent, 58
Absolutbetrag, 28
abzählbar unendlich, 16
Allgemeine Exponentialfunktionen,
106
Allgemeine Logarithmusfunktionen,
107
Allgemeine Potenzen, 106
Allquantor, 5
Approximationsproblem, 112
arccot, 138
arctan, 138
Arcuscotangens, 138
Arcustangens, 138
Assoziativgesetz, 19
Axiom von Archimedes, 31
Axiome, 19
algebraische Axiome, 19
Axiome bzgl. Multiplikation, 20
Axiome der reellen Zahlen, 19
bedingt konvergent, 58
beliebig oft differenzierbar, 140
Bernoulli’sche Ungleichung, 27
beschränkte Folge, 38
bewertete Zerlegung, 158
bijektiv, 13
Bildbereich, 10
Bildmenge, 11
Binomialkoeffizienten, 22
Binomische Reihe, 147
Binomischer Lehrsatz, 23
Differentialrechnung
Klassische Notation, 127
Differenzenquotient, 111
Differenzierbar, 140
differenzierbar, 111, 120
Differntialquotient, 111
Dirichlet Funktion, 86
Distributivgesetz, 20
divergent, 38
Dreiecksungleichung, 28
e-Funktion, 63
eindeutig, 12
Eindeutigkeit, 20
eineindeutig, 13
Einschließungssatz, 115
Einschließungssatz, 39
Elementare Funktion, 154
Elementare Funktionen, 73
Entwicklungspunkt, 63
Eulersche Zahl, 44
Existenzquantor, 5
exp(x), 63
Exponentialfunktion, 63
Extremwert, 128
Feinheit, 157
Folge, 34
Folge der Partialsummen, 51
Folgen, 34
Funktionen, 9
f −1 , 13
Definition 1, 10
Definition 2, 11
Graph einer Funktion, 10
Funktionswert, 10
C ∞ , 145
Cauchy’sches Konvergenzkriterium,
49
Cauchy’sches Konvergenzkriterium
für Reihen, 52
Cauchyfolge, 49
Cauchyprodukt, 61
cot, 138
Cotangens, 138
geometrische Reihe, 22, 53
geordnetes Paar, 9
Geschwindigkeitsproblem, 112
Gleichmäßige Konvergenz, 179
gleichmäßig stetig, 107
Graph, 10
Grenzfunktion, 177
Grenzwert, 38
Grenzwertbegriff, 34
Grenzwertbildung, 34
Grenzwertsatz, 40
größte untere Schranke, 30
Darboux, 167
Definitionsbereich, 10
Diagonalprodukt, 61
Häufungspunkt, 95
Häufungswert, 45
Hauptsatz, 171
Differentialrechnung, 172
Hauptsatz über konvergente Folgen,
40
Haupzsatz
Integralrechnung, 172
Hintereinanderschaltung, 14
Hyperbelfunktionen, 79
Identität, 14
Induktion, 15
Induktionsanfang, 16
Induktionsprinzip, 16
Erweiterte Fassung, 17
Induktionsschluß, 16
Induktionsschritt, 16
Induktionsvoraussetzung, 17
induktiv, 24
Infimum, 30
injektiv, 12
Inklusion, 8
Integral
Riemann, 156
Integration, 149
Integrationsmethoden, 153
integrierbar
nach Riemann, 160
Intervall, 67
Intervall
Länge, 157
Intervallschachtelung, 46
inverses Element, 19
irrationale Zahlen, 15
isolierter Punkt, 95
k-mal differenzierbar, 140
Kastenprodukt, 61
Kettenregel, 124
kleiner Umordnungssatz, 60
kleinste obere Schranke, 29
Koeffizient, 63
Körperaxiome, 21
Kommutativgesetz, 19
Komposition, 14
konvergente Majorante, 54
Konvergenz der geometrischen Reihe, 53
Konvergenz von Reihen mit nichtnegativen Gliedern, 54
Konvergenzkriterien für Folgen, 50
Konvergenzradius, 63, 64
Kreuzprodukt, 10
Länge, 157
179
INDEX
Leibnitzsches Konvergenz Kriterium, 57
lim− , 99
lim+ , 99
Limes, 38
Limes inferior, 47
Limes superior, 47
lim inf, 47
lim sup, 47
linear approximierbar, 113
Linearkombination von Folgen, 40
linksseitiger Grenzwert, 99
Lipschitzstetig, 93
lokales Maximum, 128
Majorantenkriterium, 54
Maximum, 29
Menge
der positiven Zahlen, 26
Mengen
Cantor’s Definition, 7
de Morgansche Regeln, 8
Differenz, 8
Durchschnitt, 8
endliche, 16
leere Menge, 8
∅, 8
Teilmenge, 8
unendliche, 16
Vereinigung, 8
Mittelwertsatz
Integralrechnung, 169
Mittelwertsatz der Differentialrechnung, 130
Zweiter Mittelwertsatz der Differentialrechnung, 133
monoton fallend, 37
monoton steigend, 37
n-Fakultät, 18
n-Tupel, 10
nach oben beschränkt, 28
Natürlicher Logarithmus, 106
negativ, 26
Negative, 20
neutrales Element, 19
Norm, 181
Nullfolge, 36
Nullstelle, 69
Nullstellensatz, 102
obere Schranke, 28
Obersumme, 158
Operationen, 19
Ordnungsaxiome, 26
Ordnungsrelationen, 26
Paradoxon von Zenon, 35
Partialsummen, 51
Peano-Axiome, 16
Polynomgrad, 71
positiv, 26
Potenzmenge, 8
℘, 8
Potenzreihen, 63
Potenzschreibweise, 22
Produktfolge, 40
Produktsymbol, 17
, 17
punktweise konvergent, 177
Q
Quotientenfolge, 40
Quotientenkriterium, 55
Quotientenregel, 124
rechtsseitiger Grenzwert, 99
Regel von L’Hospital, 133
Reihe
binomische, 147
Reihen, 51
rekursive Definitionen, 18
Restglied von Cauchy, 142
Restglied von Lagrange, 143
Riemannintegral, 156
Riemannintegrierbar, 160, 166
Riemannsumme, 158
Satz von Bolzano-Weierstraß, 46
Satz von Cauchy-Hadamard, 64
Satz von Rolle, 129
Schwankungssumme, 164
Sekante, 110
Stammfunktion, 149
Steigung, 110
Summenfolge, 40
Summenregel, 122
Summensymbol, 17
, 17
Supremum, 29
surjektiv, 12
P
tan, 136
Tangens, 136
Tangentenproblem, 109
Taylorreihe, 145
Teilfolgen, 45
Teilmenge, 8
Trigonometrische Funktionen, 81
überabzählbar unendlich, 16
Umkehrabbildung, 13
Umkehrsatz, 105
Umordnung, 59
unbestimmtes Integral, 149
unendliche Reihe, 51
Ungleichung, 26
untere Schranke, 30
Untersumme, 158
Urbildbereich, 10
Urbildmenge, 12
Verfeinerung, 158
gemeinsame, 158
Verknüpfung, 19
Vollständige Induktion, 15
Vollständigkeitsaxiom, 29
Wertebereich, 10
Widerspruchsbeweis, 15
√
2, 15
Wurzelkriterium, 54
2-te Form, 55
Wurzeln, 105
Zahlen, 14
algebraische Zahlen, 15
die reellen Zahlen, 15
irrationale Zahlen, 15
komplexe Zahlen, 15
Menge der ganzen Zahlen, 14
Menge der natürlichen Zahlen,
14
rationale Zahlen, 14
Zahlengerade, 15
Zerlegung, 157
bewertet, 158
Feinheit, 157
Zerlegungssatz, 114
Zwischenwerteigenschaft, 101
Zwischenwertsatz, 101
Herunterladen