Mathematik für ChemikerInnen I

Werbung
Mathematik für ChemikerInnen I
Prof. Dr. Ansgar Jüngel
Institut für Mathematik
Johannes Gutenberg-Universität Mainz
Winter 2006
unkorrigiertes Vorlesungsskript
Inhaltsverzeichnis
1 Motivation
2 Grundbegriffe
2.1 Mengen . . . . . . .
2.2 Reelle Zahlen . . . .
2.3 Binomialkoeffizienten
2.4 Komplexe Zahlen . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
6
8
10
3 Funktionen
15
3.1 Funktionen und ihre Inverse . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.3 Elementare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4 Vektoren und Matrizen
4.1 Vektoren . . . . . . . . . . . . . . . . . . .
4.2 Matrizen . . . . . . . . . . . . . . . . . . .
4.3 Der Gauß-Algorithmus . . . . . . . . . . .
4.4 Determinanten . . . . . . . . . . . . . . .
4.5 Lineare Unabhängigkeit . . . . . . . . . .
4.6 Lösungstheorie linearer Gleichungssysteme
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
22
22
25
30
33
36
38
5 Folgen und Reihen
41
5.1 Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.2 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1
6 Differentiation
6.1 Stetigkeit . . . . .
6.2 Die Ableitung . . .
6.3 Rechenregeln . . .
6.4 Kurvendiskussion .
6.5 Satz von Taylor . .
6.6 Lineare Regression
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
50
50
51
53
59
63
67
7 Integration
71
7.1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.2 Zusammenhang zwischen Differentiation und Integration . . . . . . . . . . 74
7.3 Integrationsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2
1
Motivation
In diesem Kapitel verdeutlichen wir anhand von Beispielen, daß die Sprache und die
Methoden der Mathematik für das Studium chemischer Prozesse und Fragestellungen ein
unentbehrliches Handwerkszeug darstellen.
Beispiel 1.1 (Zerfall von Kaliumdichromat)
Wird Kaliumdichromat K2 Cr2 O7 auf über 500◦ C erhitzt, zerfällt es in Kaliumchromat
K2 CrO4 , Chromoxid Cr2 O3 und Sauerstoff O2 . Die Reaktionsgleichung lautet
x1 K2 Cr2 O7 → x2 K2 CrO4 + x3 Cr2 O3 + x4 O2 .
Wir suchen Zahlen x1 , x2 , x3 , x4 , die diese Gleichung erfüllen. Natürlich sollte die Lösung
ganzzahlig (und positiv) sein. Die linke Seite benötigt 2 · x1 Kaliumatome (x1 K2 ), die
rechte Seite 2 · x2 Kaliumatome (x2 K2 ), d.h. 2x1 = 2x2 . Analog gilt 2x1 = x2 + 2x3 für
die Bilanz der Chromatome und 7x1 = 4x2 + 3x3 + 2x4 für die der Sauerstoffatome. Die
Zahlen x1 , x2 , x3 , x4 erfüllen also das Gleichungssystem
2x1 − 2x2
= 0,
2x1 − x2 − 2x3
= 0,
7x1 − 4x2 − 3x3 − 2x4 = 0.
(1.1)
Man kann dieses System auch abkürzend durch Auflistung der Koeffizienten der linken
Seit und der Komponenten der rechten Seite durch


 
2 −2 0
0
0


 
und
(1.2)
2 −1 −2 0 
0
7 −4 −3 −2
0
formulieren. Wir nennen das erste Objekt Matrix und das zweite Objekt Vektor. In Kapitel
4 werden wir uns mit der Matrizen- und Vektorrechnung befassen und den Gaußschen
Algorithmus zum Lösen linearer Gleichungssysteme kennenlernen.
Beispiel 1.2 (Radioaktiver Zerfall)
Eine radioaktive Substanz zerfalle im Laufe der Zeit. Wieviel Substanz ist zur Zeit t
vorhanden?
Sei N (t) die Menge der radioaktiven Substanz zur Zeit t. Aus der Physik ist bekannt,
daß die Änderung 4N der Stoffmenge proportional ist zur Stoffmenge N (t) und zur
zeitspanne 4t. Nennen wir die Proportionalitätskonstante −α < 0 (sie ist negativ, da die
Substanz zerfällt), so folgt
4N = −αN (t)4t.
(1.3)
3
Schreiben wir 4N = N (t + 4t) − N (t), erhalten wir
N (t + 4t) = (1 − α4t)N (t)
für alle t.
Für t = 0 ist
N (4t) = (1 − α4t)N (0),
für t = 4t
N (24t) = (1 − α4t)N (4t) = (1 − α4t)2 N (0),
und allgemein für t = n4t (n ∈ N)
n
N (n4t) = (1 − α4t) N (0) =
αt
1−
n
n
N (0).
Was geschieht nun, wenn n immer größer wird? Für größer werdendes n nähert sich
die Differenz 1 − αt
immer mehr der Zahl Eins an, und man könnte wegen 1n = 1 denken,
n
n
sich ebenfalls immer mehr der Eins nähert. Dies ist jedoch falsch! Es gilt
daß 1 − αt
n
n
αt
1−
nähert sich für großes n e−αt ,
(1.4)
n
wobei e = 2.7182818 . . . die Eulersche Zahl ist. Mathematisch formulieren wir die Aussage
(1.4) als
n
αt
strebt für n → ∞ gegen e−αt
1−
n
oder in Zeichen
lim
n→∞
αt
1−
n
n
= e−αt .
Diesen Grenzwert (“limes”) definieren wir in Kapitel 5. In Kapitel 3 untersuchen wir die
Exponentialfunktion ex . Die Stoffmenge zur Zeit t lautet also
N (t) = e−αt N (0).
In diesem Beispiel sind verschiedene mathematische Begriffe aufgetreten, die wir in
den folgenden Kapiteln genauer definieren und erläutern werden, nämlich Grenzwerte
und Funktionen. Außerdem werden wir Funktionen differenzieren und integrieren (siehe
Kapitel 6 und 7).
4
2
2.1
Grundbegriffe
Mengen
Die Gesamtheit von Objekten heißt Menge. Die einzelnen Objekte heißen Elemente der
Menge. Beispiele von Mengen sind
M1 = {1, 2, 3, 4}
M2 = {Kohlenstoff, Wasserstoff, Sauerstoff},
M1 = {5, 6, 7, . . . } = {x : x ist natürliche Zahl und x ≥ 5.}
Die Reihenfolge der Elemente spielt bei Mengen keine Rolle, d.h.
{1, 2, 3, 4} = {3, 2, 4, 1}.
Die leere Menge wird mit { } oder ∅ bezeichnet.
Es gibt die folgenden Mengenoperationen.
Definition 2.1 Seien A, B Mengen.
(1) A heißt Teilmenge von B, kurz A ⊂ B, wenn für alle x ∈ A auch x ∈ B folgt.
(2) Gleichheit: A = B bedeutet A ⊂ B und B ⊂ A.
(3) Vereinigung: A ∪ B = {x : x ∈ A oder x ∈ B}.
(4) Durchschnitt: A ∩ B = {x : x ∈ A und x ∈ B}.
(5) Differenz: A\B = {x : x ∈ A und x 6∈ B}. Man sagt “A ohne B”.
(6) Kartesisches Produkt: A × B = {(x, y), x ∈ A, y ∈ B}. Beachten Sie, daß (x, y)
ein geordnetes Paar ist, d.h., die Reihenfolge ist wichtig. Beispielsweise gilt (1, 2) 6=
(2, 1) (Aber {1, 2} = {2, 1}!)
Beispiel 2.2 Seien A = {1, 2, 3}, B = {3, 4}. Dann folgt
A ∩ B = {3},
A ∪ B = {1, 2, 3, 4}
(Elemente werden nur einmal aufgezählt),
A\B = {1, 2}.
A × B = {(1, 3), (1, 4), (2, 3), (2, 4), (3, 3), (3, 4)}.
5
(a)
(b)
B
A
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
B
A
111
000
000
111
000
111
(c)
A
A∪B
(d)
B
A
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
B
1111
0000
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
A∩B
(e)
00
11
00
00
00
0011
11
0011
11
1111
00
00
11
B 11
0011
11
0011
00
00
0011
11
0011
11
00
00
0011
11
0011
0011
00
| {z }
A
A\B
A×B
Abbildung 2.1: (a) Teilmenge; (b) Vereinigung; (c) Durchschnitt; (d) Differenz; (e) kartesisches Produkt.
2.2
Reelle Zahlen
Die wichtigsten Mengen sind Zahlenmengen.
Definition 2.3 (1) Menge der natürlichen Zahlen:
N = {1, 2, 3, . . . }.
Die Menge der natürlichen Zahlen mit Null wird geschrieben als:
N0 = N ∪ {0} = {0, 1, 2, 3, . . . }.
(2) Menge der ganzen Zahlen:
Z = {0, 1, −1, 2, −2, 3, −3 . . . }.
(3) Menge der rationalen Zahlen:
Q = { pq : p, q ∈ Z, q 6= 0}.
Die Brüche p0 und 00 sind also nicht definiert.
(4) Menge der reellen Zahlen:
a1 a2
a3
+
+
+. . . , a1 , a2 , a3 , · · · ∈ {0, 1, . . . , 9}}.
10 100 1000
Reelle Zahlen sind also Zahlen mit unendlicher Dezimalentwicklung.
R = {g+r : g ∈ Z, r = 0, a1 a2 a3 · · · =
Beispiel 2.4 (1) Sei x = 0, 101010 . . . ∈ R. Wir wollen x als Bruch schreiben. Dafür
schreiben wir
100 · x = 10, 101010 . . . ,
x = 0, 101010 . . .
6
Die Differenz lautet
10
∈ Q.
99
(2) Es gibt auch Zahlen, die nicht als Bruch geschrieben werden können. Derartige
Zahlen werden irrational genannt. Beispiele sind π und e (die Eulersche Zahl). Eine reelle
Zahl ist also entweder rational oder irrational.
99 · x = 10,
also x =
Es gelten die folgenden Inklusionen: N ⊂ N0 ⊂ Z ⊂ Q ⊂ R.
Definition 2.5 Seien a, b ∈ R. Die folgenden Mengen werden Intervalle genannt:
(1) Abgeschlossenes Intervall: [a, b] = {x ∈ R : a ≤ x ≤ b}.
(2) Rechts halboffenes Intervall: [a, b) = {x ∈ R : a ≤ x < b}.
(3) Links halboffenes Intervall: (a, b] = {x ∈ R : a < x ≤ b}.
(4) Offenes Intervall: (a, b) = {x ∈ R : a < x < b}.
Man schreibt auch
[a, ∞) = {x ∈ R : x ≥ a},
(−∞, b) = {x ∈ R : x < b},
(−∞, ∞) = R.
Definiert man den Betrag |x| einer reellen Zahl durch
(
x für x ≥ 0
|x| =
−x für x < 0,
so ist
[−a, a] = {x ∈ R : −a ≤ x ≤ a} = {x ∈ R : |x| ≤ a}.
Wir benötigen noch folgende Notationen:
• Das Zeichen “∀” bedeutet “für alle”.
• Das Zeichen “∃” bedeutet “es existiert”.
• Summe:
n
X
k=1
• Produkt:
n
Y
k=1
ak = a1 + a2 + · · · + an .
ak = a1 · a2 · . . . · an = a1 a2 . . . an .
7
Beispiel 2.6 Die Schreibweise
∀n∈N:
n
X
k=
k=1
n(n + 1)
2
bedeutet ausgeschrieben:
n(n + 1)
.
2
Daß die Summe der ersten n natürlichen Zahlen gleich n(n + 1)/2 ist, können wir übrigens
einfach einsehen, indem wir die beiden Zeilen
Für alle n ∈ N gilt: 1 + 2 + 3 + · · · + n =
a =1+
a
2
+
3
+ · · · + n,
= n + (n − 1) + (n − 2) + · · · + 1
addieren, denn dies ergibt
2a = (n + 1) + (n + 1) + (n + 1) + · · · + (n + 1) = n · (n + 1),
also a = n(n + 1)/2.
2.3
Binomialkoeffizienten
In diesem Abschnitt beantworten wir die Frage: Wieviel Möglichkeiten gibt es, k Elemente
von insgesamt n Elementen als Mengen zu schreiben? Sei etwa n = 5 und k = 2. Die
Elemente seien die Ziffern 1, 2, 3, 4, 5. Dann gibt es 20 Möglichkeiten:
12 13 14 15 23 24 25 34 35 45
21 31 41 51 32 42 52 43 53 54
Allgemein: Wir haben n Möglichkeiten, ein 1. Element zu wählen. Greifen wir das 1. Element heraus, verbleiben n − 1 Möglichkeiten, ein 2. Element auszuwählen, n − 2 Möglichkeiten für das 3. Element usw.:
Anzahl: = n · (n − 1) · (n − 2) · . . . · (n − (k − 1)).
Definieren wir die Fakultät:
n! = n(n − 1)(n − 2) · . . . · 3 · 2 · 1
für n ∈ N und 0! = 1,
so können wir schreiben:
n(n − 1)(n − 2) · . . . · (n − (k − 1))(n − k)(n − (k + 1)) · . . . · 3 · 2 · 1
(n − k)(n − (k + 1)) · · · 3 · 2 · 1
n!
=
.
(n − k)!
Anzahl =
8
Nun wird die Reihenfolge der Elemente in einer Menge nicht unterschieden, d.h. {1, 2} =
{2, 1}. Die obigen 20 Möglichkeiten reduzieren sich auf die 10 Möglichkeiten
{1, 2}, {1, 3}, {1, 4}, {1, 5}, {2, 3}, {2, 4}, {2, 5}, {3, 4}, {3, 5}, {4, 5}.
Allgemein: Die k! Möglichkeiten, k Elemente in einer Liste zu schreiben, müssen herausdividiert werden. Wir erhalten:
Anzahl =
n!
.
(n − k)!k!
Man nennt diesen Quotienten Binomialkoeffizienten und definiert
n!
n
:=
für n, k ∈ N0 , n ≥ k.
k
(n − k)!k!
In unserem Beispiel gilt etwa
5·4·3·2·1
5!
5
=
= 10.
=
3!2!
3·2·1·2·1
2
Die Binomialkoeffizienten können übrigens rekursiv über das sogenannte Pascalsche Dreieck berechnet werden (siehe Abb. 2.2).
k
0
1
2
3
4
n 0
1
1
1
1
2
1
2
1
3
1
3
3
1
4
1
4
6
4
5
1
5 10 10 5
5
1
1
Abbildung 2.2: Pascalsches Dreieck.
Die Zahlen in der Tabelle erhält man durch Addition der direkt und links darüber
liegenden Zahlen. Beispielsweise ist
5
= 10 = 4 + 6.
3
9
Interessanterweise sind die Binomialkoeffizienten gerade die Koeffizienten nach Ausmultiplizieren des Produktes (a + b)n :
(a + b)1 = 1 · a + 1 · b,
(a + b)2 = 1 · a2 + 2 · ab + 1 · b2 ,
(a + b)3 = 1 · a3 + 3 · a2 b + 3 · ab2 + 1 · b3 ,
usw.
Dies motiviert das folgende Resultat.
Satz 2.7 (Binomialsatz)
Für a, b ∈ R und n ∈ N0 gilt:
n X
n n
n
n n−1
n n
n n−k k
n−1
n
b .
ab
+
a b + ··· +
a +
a b =
(a + b) =
n
n
−
1
1
0
k
k=0
2.4
Komplexe Zahlen
Die Gleichung
x2 + 1 = 0
besitzt keine reelle Lösung. Um diesem Umstand Abhilfe zu schaffen, erweitert man den
Zahlenbegriff. Wir definieren eine neue Zahl i mit der Eigenschaft i2 = −1 (auch geschrie√
ben als i = −1).
Definition 2.8 Die Zahl i mit i2 = −1 heißt komplexe Einheit. Die Menge der komplexen Zahlen ist definiert durch
C = {z : z = a + ib, a, b ∈ R}.
Wir definieren weiter für eine Zahl z = a + ib ∈ C:
• Realteil von z: Re (z) = a,
• Imaginärteil von z: Im (z) = b,
• konjugiert komplexe Zahl von z: z = a − ib,
√
• Betrag von z: |z| = a2 + b2 .
Diese Definitionen können mit Hilfe der Gaußschen Zahlenebene veranschaulicht werden (Abbbildung 2.3). Die komplexe Zahl z wird als ein Ortsvektor dargestellt. Die konjugiert komplexe Zahl z ist der an der x-Achse (oder Re -Achse) gespiegelte Vektor; der
Betrag |z| ist die Länge des Vektors z.
Benutzt man die Beziehung i2 = −1, so kann man mit komplexen Zahlen so rechnen,
wie man es von den reellen Zahlen gewohnt ist.
10
Im
b
11
00
z = a + ib
r
r sin α
α
0
Re
a
r cos α
−b
11
00
z = a − ib
Abbildung 2.3: Gaußsche Zahlenebene.
Beispiel 2.9 Seien z1 = 2 + 3i, z2 = 1 − 2i ∈ C. Dann ist
• Addition: z1 + z2 = 2 + 3i + 1 − 2i = 3 + i,
• Subtraktion: z1 − z2 = 2 + 3i − 1 + 2i = 1 + 5i,
• Multiplikation: z1 · z2 = (2 + 3i)(1 − 2i) = 2 + 3i − 4i − 6i2 = 8 − i,
• Division:
2 + 3i
(2 + 3i)(1 + 2i)
2 + 3i + 4i + 6i2
−4 + 7i
4 7
z1
=
=
=
=
=
−
+ i.
z2
1 − 2i
(1 − 2i)(1 + 2i)
1 − 4i2
1+4
5 5
So wie man zweidimensionale Vektoren durch Angabe der Länge und des Winkels
in Polarkoordinaten darstellen kann, ist dies auch für komplexe Zahlen möglich (Abbildung 2.3). Man schreibt für z = a + ib ∈ C
a = r cos α,
wobei r = |z| =
√
b = r sin α,
a2 + b2 , also
z = a + ib = r(cos α + i sin α),
r > 0,
α ∈ R.
Eine dritte Darstellungsform komplexer Zahlen erhält man durch die Eulersche Formel
eiα := cos α + i sin α.
11
Dann können wir für z ∈ C schreiben
z = r(cos α + i sin α) = reiα .
Der Vorteil dieser Formulierung ist, daß komplexe Zahlen einfach potenziert werden
können:
n
iα n
n iαn
n
z = (re ) = r e = r cos(nα) + i sin(nα) .
Die drei Darstellungsformen sind in Abbildung 2.4 zusammengefaßt.
Komplexe Zahl
z
Kartesische Form
a + ib
Polarkoordinaten
r(cos α + i sin α)
Eulersche Form
reiα
Abbildung 2.4: Darstellung komplexer Zahlen.
Die trigonometrischen Funktionen sind periodisch; daher ist
1 = ei·0 = cos 0 + i sin 0 = cos 2π + i sin 2π = e2πi .
(2.1)
Diese Beobachtung motiviert das Wurzelziehen komplexer Zahlen, denn
√
√
w1 = z = (reiα )1/2 = reiα/2 .
√
Allerdings gibt es noch eine zweite Wurzel w2 = rei(α+2π)/2 , da aus (2.1) folgt
√ i(α+2π)/2 2
w22 =
re
= rei(α+2π) = reiα e2πi = reiα .
Allgemein gilt:
Satz 2.10 Sei z = reiα ∈ C, z 6= 0. Dann existieren genau n verschiedene komplexe
Zahlen w0 , . . . , wn−1 ∈ C, die die Gleichung wn = z lösen. Sie lauten
√
k = 0, . . . , n − 1.
wk = n rei(α+2πk)/n ,
Beispiel 2.11 (1) Sei z = −1 = e−iπ . Dann lauten die beiden Quadratwurzeln
w1 = e−iπ/2 = −i
und
w2 = ei(−π+2π)/2 = eiπ/2 = i.
√
√
Die Bezeichnung −1 = z = i ist also etwas mißverständlich, da es ja zwei Wurzeln
gibt. In beiden Fällen gilt i2 = w12 = −1, (−i)2 = w22 = −1.
(2) Wir suchen alle komplexen Wurzeln von z 3 = 1 = ei·0 . Sie lauten nach Satz 2.10
(siehe Abbildung 2.5)
w1 = e0·πi/3 = 1,
w2 = e2πi/3 ,
12
w3 = e4πi/3 .
Im
i
w2
w1
1
Re
w3
Abbildung 2.5: Die dritten Einheitswurzeln.
Wofür braucht man komplexe Zahlen? Wir geben zwei Antworten. Zum einen erlauben
komplexe Zahlen die Lösung von Gleichungen der Form
f (x) := an xn + an−1 xn−1 + · · · + a1 x + a0 = 0.
(2.2)
Satz 2.12 (Fundamentalsatz der Algebra)
Seien n ∈ N und a0 , . . . , an ∈ C mit an 6= 0. Dann existieren k ∈ N, n1 , . . . , nk ∈ N mit
n1 + · · · + nk = n und paarweise verschiedene Zahlen x1 , . . . , xk ∈ C, so daß
f (x) = (x − x1 )n1 (x − x2 )n2 · . . . · (x − xk )nk .
Die Zahlen x1 , . . . , xk sind also Lösungen von (2.2). Die Zahl nj heißt Vielfachheit der
Lösung xj (j = 1, . . . , k).
Die zweite Antwort geben wir im nächsten Beispiel.
Beispiel 2.13 (Freies Elektron)
Der Zustand eines freien Elektrons wird durch die sogenannte Wellenfunktion ψ(x) ∈
C beschrieben. In der Darstellung ψ(x) = reiα wird das Elektron als eine Welle mit
Amplitude r und Phase α interpretiert. Außerdem interpretiert man das Betragsquadrat
|ψ(x)|2 als die Wahrscheinlichkeitsdichte, das Elektron “in der Nähe” des Ortes x zu
finden.
Ein freies Teilchen im Raum mit maximaler Aufenthaltswahrscheinlichkeit an der Stelle x = 0 wird z.B. dargestellt durch den stationären Zustand
ψ(x) = eikx e−x
13
2 /2
.
Hierbei ist k die Wellenzahl des Teilchens, die ein Maß für dessen Energie ist. Wegen
2
2
|ψ(x)| = |eikx | · |e−x /2 | = e−x /2 ist tatsächlich die Wahrscheinlichkeitsdichte an x = 0
maximal. Für x → ±∞ wird |ψ(x)| immer kleiner; dies bedeutet, daß die Wahrscheinlichkeit, das Teilchen weit weg von x = 0 zu finden, sehr klein ist.
14
3
Funktionen
Eine Abbildung ist eine Vorschrift, die jedem Element x aus einer (nichtleeren) Menge M
genau ein Element f (x) aus einer Menge N zuordnet; kurz:
f : M → N,
x 7→ f (x).
Die Menge M heißt Definitionsbereich von f , N heißt Wertebereich (Abbildung 3.1). Wir
schreiben meist Df für den Definitionsbereich von f .
M
N
Abbildung 3.1: Zur Definition einer Abbildung.
Ist M = Rn und N = R, so nennen wir eine Abbildung eine Funktion. In diesem
Kapitel untersuchen wir einige elementare Funktionen wie Polynome, exp, ln, sin, cos
usw.
3.1
Funktionen und ihre Inverse
Wir definieren zunächst die Inverse einer Funktion.
Definition 3.1 Sei f : Df → R eine Funktion. Man nennt die Funktion g : Dg → R mit
der Eigenschaft
g(f (x)) = x
f (g(y)) = y
für alle x ∈ Df bzw.
für alle y ∈ Dg
die Inverse von f und schreibt g = f −1 .
Beispiel 3.2 Sei f (x) = x2 + 1, x ∈ Df = R. Wir setzen y = x2 + 1 und lösen nach x
auf:
p
x = ± y − 1.
√
Setzen wir g(y) = ± y − 1, so ist g ein Kandidat für die Inverse von f (siehe Abbildung 3.2), denn
p
f (g(y)) = (± y − 1)2 + 1 = (y − 1) + 1 = y.
Es stellen sich jedoch zwei Fragen:
15
y
f
g
1
x
1
Abbildung 3.2: Die Funktion f (x) = x2 +1 und deren Spiegelung an der Diagonalen x = y.
• Wie lautet der Definitionsbereich von g?
√
√
• Warum gibt es zwei Funktionen g(y) = y − 1 und g(y) = − y − 1?
Die erste Frage kann leicht beantwortet werden: Damit es eine reelle Wurzel gibt, sollte
y ≥ 1 sein, also Dg = [1, ∞). Dies ist übrigens gerade das Bild von f :
f (R) = {f (x) : x ∈ Df } = [1, ∞) = Dg .
Die Antwort der zweiten Frage basiert auf der Feststellung, daß zu jedem x 6= 0 die beiden
Werte f (x) und f (−x) übereinstimmen. Daher gibt es zu jedem y > 1 zwei Werte für
die “Inverse”. Damit die Inverse eindeutig bestimmt ist, sollte zu jedem y ∈ f (R) genau
ein x ∈ Df existieren, so daß f (x) = y. Eine Funktion f : Df → f (R) (beachte den
Wertebereich!) mit dieser Eigenschaft heißt bijektiv.
Definition 3.3 Sei f : Df → Wf eine Funktion. Dann heißt f bijektiv genau dann,
wenn für alle y ∈ Wf genau ein x ∈ Df existiert mit f (x) = y.
Bijektive Funktionen sind invertierbar. Beispielsweise ist für f : [0, ∞) → [1, ∞),
√
f (x) = x2 + 1, die Inverse gegeben durch f −1 : [1, ∞) → [0, ∞), f −1 (y) = y − 1. Hätten
wir f : (−∞, 0] → [1, ∞), f (x) = x2 + 1, definiert, so würde die Inverse f −1 : [1, ∞) →
√
(−∞, 0], f −1 (y) = − y − 1, lauten.
3.2
Rationale Funktionen
Definition 3.4 Sei n ∈ N und a0 , . . . , an ∈ R, an 6= 0. Dann heißt die Funktion p : R →
R, definiert durch
n
X
p(x) =
ak x k = a0 + a1 x + · · · + an x n ,
k=0
16
Polynom vom Grade n.
Definition 3.5 Seien pm (x) bzw. qn (x) Polynome vom Grade m bzw. n. Dann heißt
R(x) =
pm (x)
qn (x)
rationale Funktion. Sie ist für alle x ∈ R definiert, die keine Nullstellen von qn sind.
Ist m < n, so heißt R echt gebrochene rationale Funktion, anderenfalls heißt sie unecht
gebrochen.
Beispiel 3.6 (1) Die Funktion
R(x) =
(x − 1)(x + 3)
x2 + 2x − 3
=
=x−1
x+3
x+3
ist eigentlich keine rationale Funktion, sondern ein Polynom vom Grade 1 und damit
definiert für alle x ∈ R.
(2) Die Funktion
x2 + 2x − 3
R(x) =
x+4
ist eine unecht gebrochene rationale Funktion, definiert für alle x ∈ R, x 6= −4. Sie kann
allerdings mit Hilfe der Polynomdivison geschrieben werden als die Summe eines Polynoms
und einer echt gebrochenen rationalen Funktion:
5
(x2 + 2x − 3) : (x + 4) = x − 2 +
x+4
−(x2 + 4x)
−2x − 3
−(−2x − 8)
5
Wir erhalten:
R(x) = x − 2 +
5
.
x+4
Beispiel 3.7 Für ideale Gase gilt die Zustandsgleichung
p · V = R · T,
wobei p der Druck, V das Volumen, T die Temperatur des Gases und R die sogenannte
Gaskonstante sind. Die Aussage dieser Gleichung ist, daß das Produkt von Druck und Volumen eines Gases bei gleich gehaltener Temperatur konstant ist. Dies gilt nur annähernd.
Eine bessere Approximation liefert die Van-der-Waals-Gleichung
a p + 2 (V − b) = RT,
V
17
wobei a die intermolekularen Kräfte und b die Größe der Gasmoleküle modelliert. Bei
konstanter Temperatur ist der Druck eine Funktion des Volumens:
p(V ) = p =
a
RT V 2 − aV + ab
RT
− 2 =
.
V −b V
V 2 (V − b)
Der Druck p(V ) ist also eine echt gebrochene rationale Funktion.
In Kapitel 7 benötigen wir eine Formulierung rationaler Funktion als Summe einfacher
rationaler Funktionen, etwa von der Art
1
1
2x
+
= 2
.
x+1 x−1
x −1
Dies führt auf das Konzept der Partialbruchzerlegung.
Beispiel 3.8 (1) Sei
R(x) =
x2 + 1
.
x3 − 2x2 − x + 2
Wir suchen zuerst alle Nullstellen des Nenners. Wir raten die Nullstelle x1 = 1. Mit Polynomdivision erhalten wir:
(x3 − 2x2 − x + 2) : (x − 1) = x2 − x − 2
−(x3 − x2 )
−x2 − x
−(−x2 + x)
−2x + 2
−(−2x + 2)
0
Die Nullstellen von x2 − x − 2 ergeben sich aus der p-q-Formel:
r
1
1
1 3
x2/3 = ±
+2= ± ,
also x2 = 2, x3 = −1.
2
4
2 2
Daher ist
R(x) =
x2 + 1
,
(x + 1)(x − 2)(x − 1)
x ∈ R\{1, 2, −1}.
Wir machen nun den Ansatz
R(x) =
A
B
C
+
+
x+1 x−2 x−1
(3.1)
und wollen die Konstanten A, B und C bestimmen. Wir multiplizieren (3.1) mit dem
Nenner:
x2 + 1 = A(x − 2)(x − 1) + B(x + 1)(x − 1) + C(x + 1)(x − 2).
18
Eigentlich gilt diese Gleichung nur für x ∈
/ {1, 2, −1}. Es ist dennoch möglich, diese Werte
einzusetzen (dies folgt aus der Stetigkeit, die wir erst in Kapitel 6 einführen):
x=1:
2 = −2C
x=2:
5 = 3B
x = −1 : 2 = 6A
=⇒
=⇒
=⇒
C = −1,
B = 35 ,
A = 31 .
Wir folgern aus (3.1):
R(x) =
(2) Sei
5
1
1
+
+
.
3(x + 1) 3(x − 2) x − 1
x3
.
x3 + x2 + x + 1
Diese Funktion ist unecht gebrochen rational, so daß wir zuerst Polynomdivision durchführen:
R(x) =
x3 : (x3 + x2 + x + 1) = 1 −
−(x3 + x2 + x + 1)
−x2 − x − 1
x2 + x + 1
.
x3 + x2 + x + 1
Eine Nullstelle erraten wir: x1 = −1. Eine weitere Polynomdivision führt auf
(x3 + x2 + x + 1) : (x + 1) = x2 + 1
−(x2 + x2 )
0+x+1
−(x + 1)
0
Es gibt keine weiteren Nullstellen. Wir erweitern daher unseren Ansatz der Partialbruchzerlegung zu
A
Bx + C
x2 + x + 1
=
+ 2
.
3
2
x +x +x+1
x+1
x +1
Wir multiplizieren mit dem Nenner
x2 + x + 1 = A(x2 + 1) + (Bx + C)(x + 1)
und setzen spezielle Werte ein:
x = −1 :
1
1 = 2A =⇒ A = ,
2
1
1 = A + C =⇒ C = 1 − A = ,
2
3
1
x=1:
3 = 2A + 2(B + C) =⇒ B = − A − C = .
2
2
Damit erhalten wir die Zerlegung
x=0:
R(x) = 1 −
1
x+1
x2 + x + 1
=1−
−
.
3
2
x +x +x+1
2(x + 1) 2(x2 + 1)
19
3.3
Elementare Funktionen
Exponentialfunktionen. Betrachte für a ∈ (1, ∞) die Funktion
f (x) = ax ,
x ∈ R.
Sie hat die Eigenschaften
a0 = 1,
ax1 +x2 = ax1 · ax2 .
a1 = a,
Die Inverse von f ist der Logarithmus zur Basis a:
f −1 : (0, ∞) → R,
f −1 (x) = loga x.
Die Inverse hat die Eigenschaften
loga 1 = 0,
loga (x1 · x2 ) = loga x1 + loga x2 .
loga a = 1,
Im Falle a = e (Eulersche Zahl) nennt man loge = ln den natürlichen Logarithmus; im Falle
a = 10 wird log10 = log dekadischer Logarithmus genannt. Falls a = e, heißt f (x) = ex
Exponentialfunktion.
Trigonometrische Funktionen. Sinus und Cosinus sind Funktionen
sin : R → R,
cos : R → R
mit den Eigenschaften
cos2 x + sin2 x = 1,
sin(πk) = 0,
x ∈ R,
cos(πk) = (−1)k ,
sin
+ 1)
= (−1)k ,
cos π2 (2k + 1) = 0, k ∈ N0 .
π
(2k
2
Insbesondere sind sin und cos 2π-periodisch, d.h.
sin(x + 2π) = sin x,
cos(x + 2π) = cos x,
x ∈ R.
Daher sind sin und cos auf R nicht invertierbar, sehr wohl aber die eingeschränkten
Funktionen
h π πi
→ [−1, 1],
cos : [0, π] → [−1, 1].
sin : − ,
2 2
Die Inversen heißen Arcussinus und Arcuscosinus:
h π πi
arcsin : [−1, 1] → − ,
,
arccos : [−1, 1] → [0, π].
2 2
20
Der Tangens
h π πi
sin x
tan : − ,
,
→ R,
tan x =
2 2
cos x
ist invertierbar; die Inverse heißt Arcustangens:
h π πi
.
arctan : R → − ,
2 2
Hyperbolische Funktionen. Sinus und Cosinus hyperbolicus sind definiert durch
1
sinh x = (ex − e−x ),
2
1
cosh x = (ex + e−x ),
2
x ∈ R,
x ∈ R.
Der Name rührt daher, daß
cosh2 x − sinh2 x = 1
gilt und y 2 − x2 = 1 die Gleichung einer Hyperbel ist. Analog zum Tangens gibt es einen
Tangens hyperbolicus:
tanh x =
sinh x
ex − e−x
= x
,
cosh x
e + e−x
x ∈ R.
Die Inversen werden auch Area-Funktionen genannt:
arsinh : R → R,
arcosh : [1, ∞) → [0, ∞),
artanh : (−1, 1) → R,
√
arsinh x = ln(x + x2 + 1),
√
arcosh x = ln(x + x2 − 1),
1+x
artanh x = 12 ln 1−x
.
Übrigens kann man in diese Funktionen auch komplexe Argumente einsetzen und
erhält damit einen Zusammenhang zwischen den trigonometrischen und den hyperbolischen Funktionen. Benutzen wir nämlich die Eigenschaft, daß sin(−x) = − sin x und
cos(−x) = cos x, so folgt aus der Eulerschen Formel
eiz = cos z + i sin z,
z ∈ C,
für z = −ix und z = ix, x ∈ R:
ex = cos(ix) − i sin(ix),
e−x = cos(ix) + i sin(ix).
Addition und Subtraktion der beiden Gleichungen ergibt
1
cosh x = (ex + e−x ) = cos(ix),
2
1 x
sinh x = (e − e−x ) = −i sin(ix).
2
21
4
4.1
Vektoren und Matrizen
Vektoren
Definition 4.1 Der Raum Rn ist das n-fache kartesische Produkt R × R × · · · × R oder
 
x1

n
o


x
2
n


R =  .  : x1 , . . . , xn ∈ R .
 .. 
xn
Die Elemente des Rn heißen Vektoren.
Definition 4.2 (1) Sei x ∈ Rn . Der transponierte Vektor x> ist definiert durch
x> = (x1 , x2 , . . . , xn ),
d.h., x> ist ein Zeilenvektor, während x ein Spaltenvektor ist.
(2) Seien x = (x1 , . . . , xn )> , y = (y1 , . . . , yn )> ∈ Rn und λ ∈ R. Die Addition bzw.
Subtraktion von Vektoren und die Multiplikation mit dem Skalar sind definiert durch
x + y = (x1 + y1 , x2 + y2 , . . . , xn + yn )> ,
x − y = (x1 − y1 , x2 − y2 , . . . , xn − yn )> ,
λx = (λx1 , λx2 , . . . , λxn )> .
Die Operationen mit Vektoren sind in Abbildung 4.1 veranschaulicht.
(a)
(b)
x−y
x+y
x
0
y
(c)
−y
0
x
λ=2
y
0
y
λy
Abbildung 4.1: (a) Addition, (b) Subtraktion von Vektoren und (c) Multiplikation mit
dem Skalar λ.
Definition 4.3 Das Skalarprodukt im Rn lautet
x·y =
n
X
i=1
xi yi
für x = (x1 , . . . , xn )> , y = (y1 , . . . , yn )> ∈ Rn .
22
2
y
x
1
−2
−1
0
1
2
Abbildung 4.2: Die Vektoren x und y stehen senkrecht aufeinander.
Beispiel 4.4 Seien x = (2, 1)> , y = (−1, 2)> ∈ R2 . Dann folgt x · y = 2 · (−1) + 1 · 2 = 0.
Nun steht x senkrecht auf y (siehe Abbildung 4.2); man erhält allgemein x · y = 0 genau
dann, wenn x senkrecht auf y steht.
Das Skalarprodukt hat die folgenden Eigenschaften. Für alle x, y, z ∈ Rn gilt:
(1) (x + y) · z = x · z + y · z,
(2) x · (y + z) = x · y + x · z,
(3) x · y = y · x,
(4) x · x ≥ 0 und x · x = 0 ⇐⇒ x = 0.
Definition 4.5 Die Länge oder Norm eines Vektors x = (x1 , . . . , xn )> ∈ Rn ist definiert
als
v
u n
uX
√
x2i .
kxk = x · x = t
i=1
Diese Definition ist in Abbildung 4.3 veranschaulicht. Die Norm hat die folgenden
Eigenschaften. Für alle x ∈ Rn und λ ∈ R gilt:
(1) kxk ≥ 0 und kxk = 0 ⇐⇒ x = 0 (Positivität),
(2) kλxk = |λ| · kxk (Homogenität),
(3) kx + yk ≤ kxk + kyk (Dreiecksungleichung).
23
x2
p
x21 + x22
x
)
1111111111111111
0000000000000000
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
|
{z
x1
x2
}
Abbildung 4.3: Zur Definition der Norm eines Vektors im R2 .
Definition 4.6 Der Winkel α ∈ [0, π] zwischen zwei Vektoren x, y ∈ Rn ist definiert
durch
x·y
cos α =
.
kxk · kyk
Wir sagen, x steht senkrecht auf y bzw. x ist orthogonal zu y (kurz x ⊥ y) genau dann,
wenn x · y = 0 oder α = π2 .
Beispiel 4.7 Seien x = (2, 1)> , y = (−1, 2)> , z ∈ (0, 2)> ∈ R2 (siehe Abbildung 4.2).
Dann ist
π
x·y
= 0,
also αxy = ,
kxk · kyk
2
1
2
x·z
also αxz ≈ 1.1071 = 63.43◦ ,
= √ √ = √ ,
=
kxk · kzk
5· 4
5
z·y
2
4
=
also αzy ≈ 0.4636 = 26.57◦ .
= √ √ = √ ,
kzk · kyk
4· 5
5
cos αxy =
cos αxz
cos αzy
Es gilt klarerweise αxz + αzy = 90◦ oder αxz + αzy ≈ 1.5707 ≈ π2 .
Satz 4.8 (Pythagoras)
Seien x, y ∈ Rn mit x ⊥ y. Dann ist
kxk2 + kyk2 = kx + yk2 .
Beweis: Wegen x · y = 0 nach Definition 4.6 folgt
kx + yk2 = (x + y) · (x + y) = x · x + x · y + y · x + y · y
= kxk2 + 2x · y + kyk2 = kxk2 + kyk2 .
Zwischen Vektoren im R3 (und nur im R3 !) gibt es noch eine andere “Multiplikation”.
24
Definition 4.9 Seien x = (x1 , x2 , x3 )> , y = (y1 , y2 , y3 )> ∈ R3 . Dann lautet das Kreuzprodukt (auch Vektorprodukt genannt)


x2 y3 − x3 y2


x × y =  x3 y1 − x1 y3  .
x1 y2 − x2 y1
Beispiel 4.10 Seien
Dann ist



1
 
x =  0 ,
2

−2


y =  1 .
3

 

0·3−2·1
−2

 

x × y =  2 · (−2) − 1 · 3  =  −7  .
1 · 1 − 0 · (−2)
1
Es gilt interessanterweise
  

1
−2
  

x · (x × y) =  0  ·  −7  = 0,
2
1

 

−2
−2

 

y · (x × y) =  1  ·  −7  = 0,
3
1
d.h., sowohl x als auch y sind orthogonal zu x × y. Diese Eigenschaft gilt allgemein.
Das Kreuzprodukt hat die folgenden Eigenschaften. Seien x, y ∈ R3 .
(1) x × y steht senkrecht auf x und y,
(2) kx × yk2 = kxk2 kyk2 − (x, y)2 ,
(3) x × y = 0 =⇒ ∃c ∈ R : x = cy.
Diese Eigenschaften können durch Nachrechnen bestätigt werden (für den Beweis von (3)
verwendet man (2) und die sogenannte Cauchy-Schwarz-Ungleichung |x · y| ≤ kxk · kyk).
4.2
Matrizen
Definition 4.11 Seien n, m ∈ N. Ein rechteckiges Zahlenschema der Form


a11 a12 . . . a1n


 a21 a22 . . . a2n 
A=
.. 
 ..

. 
 .
am1 am2 . . . amn
mit Elementen aij ∈ R heißt (m × n)-Matrix. Wir schreiben kurz: A ∈ Rm×n .
25
Es gibt einige spezielle Matrizen. Eine (n × 1)-Matrix können wir als Vektor interpretieren.
Definition 4.12 (1) Eine Matrix A ∈ Rm×n heißt quadratisch, wenn m = n.
(2) Eine Diagonalmatrix ist eine quadratische Matrix mit verschwindenden Nichtdiagonalelementen:


d1
0




d2

 ∈ Rn×n .
D=
...



0
dn
(3) Die Einheitsmatrix ist eine Diagonalmatrix, deren Diagonalelemente alle Eins
sind:


1
0


 1

 ∈ Rn×n .
E=
...




0
1
Definition 4.13 (1) Zwei Matrizen A = (aij ), B = (bij ) ∈ Rm×n sind gleich, wenn alle
Elemente übereinstimmen:
A=B
⇐⇒
∀ i = 1, . . . , m, j = 1, . . . , n :
aij = bij .
(2) Die transponierte Matrix A> = (e
aij ) für A = (aij ) ∈ Rn×n ist definiert durch
e
aij = aji ,
d.h., man erhält A> durch Vertauschen der Zeilen und Spalten von A.
(3) Eine quadratische Matrix A ∈ Rn×n heißt symmetrisch, wenn A> = A.
Beispiel 4.14 Seien


1 2 0


A = 0 1 0 ,
0 0 1


1 2 0


B = 2 1 0 .
0 0 1
Dann ist A quadratisch, aber nicht symmetrisch; B ist dagegen symmetrisch.
Matrizen werden elementweise addiert, subtrahiert bzw. mit Skalaren multipliziert.
Seien A = (aij ), B = (bij ) ∈ Rn×m und λ ∈ R. Dann ist
(A + B)ij = aij + bij ,
(A − B)ij = aij − bij ,
(λA)ij = λaij .
Die Multiplikation von Matrizen ist dagegen etwas aufwendiger.
26
Definition 4.15 Seien A ∈ Rm×n und B ∈ Rn×` . Das Matrixprodukt C = AB ∈ Rm×`
ist definiert durch
n
X
cij =
aik bkj ,
k=1
wobei C = (cij ).
Beispiel 4.16 (1) Seien
!
1 2
,
3 0
A=
B=
!
3 2
.
0 1
Man kann sich die Matrixmultiplikation durch das Schema “Zeile × Spalte” merken:
3
0
1 2 1·3+2·0=3
3 0 3·3+0·0=9
2
1
1·2+2·1=4
3·2+0·1=6
AB
Daher ist
AB =
!
3 4
6=
9 6
1
3
3 2 9
0 1 3
BA
2
0
6
0
!
9 6
= BA.
3 0
(2) Seien
A=
!
2 −1 2
,
4 −2 4
Dann ist


−1 0


B =  2 2 ,
2 1
−1
2
AB
2
2 −1 2 0
4 −2 4 0
also
AB =
0
2
1
0
0
!
0 0
,
0 0
C = B> =
!
−1 2 2
.
0 2 1
−1 2 2
0 2 1
,
2 −1 2
nicht
4 −2 4 definiert
AC
AC ist nicht definiert.
Die Matrixmultiplikation hat also einige Besonderheiten:
(1) Das Produkt AB existiert nur, wenn die Spaltenzahl von A gleich der Zeilenzahl
von B ist.
27
(2) Falls AB und BA definiert sind, gilt im allgemeinen AB 6= BA.
(3) Falls AB = 0, muß nicht A = 0 oder B = 0 folgen.
Die Gleichung ab = 1 für gegebenes a ∈ R, a 6= 0, besitzt die eindeutige Lösung
b = 1/a, und man nennt b die Inverse von a. Wir wollen dieses Konzept auf Matrizen
erweitern.
Definition 4.17 Eine Matrix A ∈ Rn×n heißt invertierbar, wenn eine Matrix B ∈ Rn×n
existiert, so daß
AB = E
oder
BA = E,
wobei E ∈ Rn×n die Einheitsmatrix sei (siehe Definition 4.12). Wir schreiben B = A−1
und nennen A−1 die Inverse von A. Nicht invertierbare Matrizen heißen singulär.
Beispiel 4.18 (1) Sei
!
1 2
.
3 4
A=
Dann ist A invertierbar und
A−1 =
!
−2
1
,
3/2 −1/2
denn
AA−1 =
(2) Die Matrix
A=
!
1 0
= E.
0 1
!
1 1
2 2
ist nicht invertierbar. Angenommen, es gäbe eine Matrix
!
a b
B=
c d
mit AB = E. Dann folgt aus
!
1 0
=A=B=
0 1
!
1 1
2 2
a b
c d
!
=
!
a+c
b+d
2(a + c) 2(b + d)
die Gleichungen
1 = a + c,
0 = 2(a + c),
also 0 = a + c = 1 und damit ein Widerspruch. Solch eine Matrix B kann also nicht
existieren, d.h., A ist singulär.
28
Für (2 × 2)-Matrizen gibt es eine Formel für die Inverse. Für (n × n)-Matrizen ist die
Invertierung komplizierter und wird erst in Abschnitt 4.6 behandelt.
Satz 4.19 (Cramersche Regel)
Sei
A=
a b
c d
!
∈ R2×2 .
(4.1)
Dann ist A invertierbar genau dann, wenn ad − bc 6= 0. In diesem Fall gilt
!
d
−b
1
.
A−1 =
ad − bc −c a
Beweis: Nachrechnen.
Satz 4.20 Seien A, B ∈ Rn×n invertierbar. Dann ist auch AB invertierbar und
(AB)−1 = B −1 A−1 .
Beweis: (AB)(B −1 A−1 ) = A(BB −1 )A−1 = AEA−1 = AA−1 = E.
Wofür braucht man die Inverse einer Matrix? Betrachte das Gleichungssystem
x1 + 2x2 = −1,
3x1 + 4x2 = 3.
Schreiben wir
A=
!
1 2
,
3 4
x=
x1
x2
!
,
(4.2)
b=
!
−1
,
3
so können wir (4.2) kompakt als
Ax = b
formulieren. Multiplizieren wir A−1 von links auf beiden Seiten, so folgt
x = Ex = A−1 Ax = A−1 b
und wegen Beispiel 4.18 (1)
!
x1
x=
= A−1 b =
x2
−2
1
3/2 −1/2
!
−1
3
!
=
!
5
.
−3
Die Lösung von (4.2) lautet folglich x1 = 5 und x2 = −3. Mittels der Inversen kann
also ein lineares Gleichungssystem bequem gelöst werden, sofern die Koeffizientenmatrix
invertierbar ist (anderenfalls siehe Abschnitt 4.6).
29
4.3
Der Gauß-Algorithmus
In der Chemie tritt vielfach das Problem auf, unbekannte Größen x1 , x2 , . . . , xn aus einem System linearer Gleichungen zu bestimmen. In Kapitel 1 haben wir gezeigt, daß die
Bestimmung der Reaktionsgleichung für den Zerfall von Kaliumdichromat auf das lineare
Gleichungssystem
2x1 − 2x2 = 0,
2x1 − x2 − 2x3 = 0,
(4.3)
7x1 − 4x2 − 3x3 − 2x4 = 0
führt. Um dieses System von Gleichungen zu lösen, könnte man zuerst die erste Gleichung
nach x2 auflösen; dies führt auf x2 = x1 . Setzen wir dieses Ergebnis in die zweite Gleichung ein, erhalten wir die Gleichung x1 − 2x3 = 0, also x3 = x1 /2. Dies können wir in
die letzte Gleichung einsetzen usw. Obwohl diese Einsetzmethode zum Ziel führt, wird sie
bei großen Gleichungssystemen mit zehn oder mehr Gleichungen sehr umständlich. Es ist
zweckmäßiger, einen Algorithmus zu entwickeln, mit dem Gleichungssysteme allgemein
aufgelöst werden können. Der Vorteil eines Algorithmus ist, daß die Lösung von Gleichungssystemen mit Hilfe eines Computers ermöglicht wird. Ein solches Verfahren ist der
Gauß-Algorithmus (auch Gaußsches Eliminationsverfahren genannt), den wir in diesem
Abschnitt betrachten wollen.
Allgemein schreiben wir ein lineares Gleichungssystemmit n Variablen x1 , x2 , . . . , xn
und m Gleichungen als
a11 x1 + a12 x2 + · · · + a1n xn = b1 ,
a21 x1 + a22 x2 + · · · + a2n xn = b2 ,
..
.
(4.4)
am1 x1 + am2 x2 + · · · + amn xn = bm .
Die obige Schreibweise kann vereinfacht werden. Dazu schreiben wir die Koeffizienten als
die Koeffizientenmatrix


a11 a12 · · · a1n


 a21 a22 · · · a2n 

A= .
..
.. 

.
.
. 
 .
am1 am2 · · · amn
30
und die Variablen x1 , . . . , xn und die Werte b1 , . . . , bm auf den rechten Seiten von (4.4) als
 
 
x1
b1
 
 
 x2 
 b2 

 
x=
 ..  und b =  ..  .
.
 . 
xn
bm
Damit können wir (4.4) kompakt formulieren als
Ax = b.
Die Matrix, die dadurch entsteht, wenn zur Matrix A die Spalte b hinzugefügt wird,
nennen wir die erweiterte Koeffizientenmatrix und bezeichnen sie mit (A|b). Sie besitzt m
Zeilen und n + 1 Spalten.
Die Idee des Gauß-Algorithmus ist es, durch geschicktes Kombinieren von Gleichungen
eine Matrix zu erhalten, deren Elemente unterhalb der Hauptdiagonalen alle gleich null
sind. Dann kann das Gleichungssystem einfach rekursiv aufgelöst werden. Das Verfahren
wird anhand der folgenden Beispiele deutlich.
Beispiel 4.21 (1) Löse Ax = b mit


2 1 −4


A= 6 0 2 
−2 3 4
Wir schreiben

I
2 1

II  6 0
−2 3
III

2 1

 0 −3
0 4

2 1

 0 −3
0 0
Aus der dritten Gleichung folgt
56
x
3 3
−3x2 + 14x3
2x1 + x2 − 4x3
= − 92
3
= −21
= 7
und


7
 
b= 0 
−7

−4 7

2
0  −3 · I
4 −7
+I

−4 7

14 −21 
0
0
+ 43 · II

−4 7

14 −21 
56
− 84
3
3
=⇒
=⇒
=⇒
31
x3 = − 23 ,
x2 = − 13 (−21 + 14 · 32 ) = 0,
x1 = 12 (7 − 4 · 23 ) = 12 .
Die Lösung lautet x = ( 12 , 0, − 23 ).
(2) Wir haben in Kapitel 1 gezeigt, daß die (ganzzahligen) Werte x1 ,k x2 , x3 , x4 der
Reaktionsgleichung
x1 K2 Cr2 O7 → x2 K2 CrO4 + x3 Cr2 O3 + x4 O2
das lineare Gleichungssystem

2

A = 2
7
Ax = b mit

−2 0
0

−1 −2 0 
−4 −3 −2
und
 
0
 
b = 0
0
lösen müssen (siehe (1.2)). Wir schreiben


2 −2 0
0 0


 2 −1 −2 0 0  −II
7 −4 −3 −2 0
− 72 · II

2 −2 0
0 0


 0 1 −2 0 0 
−3 · II
0 3 −3 −2 0



2 −2 0
0 0


 0 1 −2 0 0  .
0 0
3 −2 0
Wir erhalten drei Gleichungen für vier Variable, also einen freien Parameter. Wir setzen
x4 = λ und
3x3 = 2x4 = 2λ =⇒ x3 = 32 λ,
x2 = 2x3 = 34 λ =⇒ x2 = 43 λ,
2x1 = 2x2 = 38 λ =⇒ x1 = 43 λ.
Die Lösungen lauten also
 
4

λ 4

 ,
3 2
λ ∈ R.
3
Wir suchen nur ganzzahlige Lösungen und wählen daher (zum Beispiel) λ = 3. Damit
lautet die obige Reaktionsgleichung
4K2 Cr2 O7 → 4K2 CrO4 + 2Cr2 O3 + 3O2 .
32
(3) Löse das lineare Gleichungssystem Ax = b mit


 
1
2
3
4
1


 
A= 2
2
1
1 , b = 1 .
−1 −2 −3 −4
1
Wir wenden den Gauß-Algorithmus an:


I
1
2
3
4 1


2
1
1 1  −2 · I
II  2
+I
III −1 −2 −3 −4 1


1
I
1
2
3
4


II  0 −2 −5 −7 −1  .
2
0
0
0
III 0
Die letzte Gleichung lautet 0 · x1 + 0 · x2 + 0 · x3 + 0 · x4 = 2 bzw. 0 = 2. Diese Gleichung ist
sinnlos. Was ist schiefgegangen? Das Resultat zeigt, daß das lineare Gleichungssystem
keine Lösung besitzt, da die Umformungen des Gauß-Algorithmus auf eine unsinnige
Gleichung führen.
Die obigen Beispiele zeigen, daß ein lineares Gleichungssystem entweder keine, genau
eine oder unendlich viele Lösungen besitzt. Welche Eigenschaften der Matrix bzw. der
rechten Seite legen fest, wie viele Lösungen ein Gleichungssystem besitzt? Um diese Frage
beantworten zu können, benötigen wir die Begriffe der Determinante und des Rangs einer
Matrix.
4.4
Determinanten
Wir haben in Satz 4.19 gesehen, daß die (2 × 2)-Matrix (4.1) genau dann invertierbar ist,
wenn ad − bc 6= 0. Gibt es ein ähnliches Kriterium für allgemeine (n × n)-Matrizen? Die
Antwort lautet Ja und führt auf das Konzept der Determinante einer Matrix.
Definition 4.22 Die Determinante einer Matrix A ∈ Rn×n ist rekursiv definiert durch
det A = a11
für n = 1,
n
X
det A =
(−1)i+j aij det Aij
für n > 1,
i=1
wobei j ∈ {1, . . . , n} beliebig ist und Aij diejenige Matrix ist, die aus A durch Streichen
der i-ten Zeile und j-ten Spalte entsteht. In der obigen Formel können i und j vertauscht
werden:
n
X
det A =
(−1)j+i aji det Aji .
i=1
33
Beispiel 4.23 (1) Für (2 × 2)-Matrizen gilt
!
a b
det
= (−1)1+1 · a · det(d) + (−1)2+1 · b · det(c) = ad − bc.
c d
(2) Sei


3 0
2


A = 1 −1 3  .
2 4 −2
Dann folgt
!
!
−1
3
1
3
det A = (−1)1+1 · 3 · det
+ (−1)2+1 · 0 · det
4 −2
2 −2
!
1 −1
+(−1)3+1 · 2 · det
2 4
= 3(2 − 12) + 2(4 + 2) = −18.
Es ist also sinnvoll, nach einer Zeile oder Spalte zu entwickeln, die möglichst viele Nullen
enthält.
(3) Sei wie ein Beispiel 4.18 (1)
!
1 1
A=
.
2 2
Dann ist det A = 1 · 2 − 1 · 2 = 0. Wir wissen, daß A nicht invertierbar ist. Gibt es einen
Zusammenhang? Ja, siehe Satz 4.24 (3) unten.
Auch für (3 × 3)- Matrizen gibt es eine Formel für die Determinante, nämlich die Regel
von Sarrus:


a11 a12 a13
a11 a12 a13 a11 a12


det a21 a22 a23  = a21 a22 a23 a21 a22
a31 a32 a33 a31 a32
a31 a32 a33
= a11 a22 a33 + a12 a23 a31 + a13 a21 a32
−a13 a22 a31 − a11 a23 a32 − a12 a21 a33 .
Die Regel gilt jedoch nicht für (4 × 4)-Matrizen oder höherdimensionale Matrizen!
Satz 4.24 Seien A, b ∈ Rn×n . Dann gilt
(1) det(AB) = det A · det B.
34
(2) det(A> ) = det A.
(3) A ist invertierbar genau dann, wenn det A 6= 0. In diesem Fall gilt det(A−1 ) =
1/ det A.
e die Matrix, die entsteht, wenn man bei der Matrix A zwei Zeilen oder zwei
(4) Ist A
e = − det A.
Spalten miteinander vertauscht, so gilt det A
Beachten Sie jedoch, daß im allgemeinen
det(A + B) 6= det A + det B,
denn beispielsweise
"
!
!#
!
!
!
1 0
1 0
2 0
1 0
1 0
det
+
= det
= 4 6= 1 + 1 = det
+ det
.
0 1
0 1
0 2
0 1
0 1
Die Entwicklung nach einer Zeile oder Spalte erlaubt eine sehr einfache Berechnung
von Matrizen, deren Elemente unterhalb der Hauptdiagonalen alle gleich null sind:


a11 a12 · · · a1n


 0 a22 · · · a2n 

det  .
.. 
...
 = a11 a22 · · · ann .
.
. 
0
 .
0
0
ann
Solche Matrizen werden gerade beim Gauß-Algorithmus erzeugt! Daher kann die Determinante einer Matrix grundsätzlich mit dem Gauß-Algorithmus berechnet werden.
Beispiel 4.25 Sei wie in Beispiel 4.23 die Matrix


3 0
2


A = 1 −1 3 
2 4 −2
gegeben. Der Gauß-Algorithmus


3
0
2


3  − 13 · I
 1 −1
2
4 −2 − 32 · I
ergibt:


3
0
2


7/3 
 0 −1
0
4 −10/3 +4 · II


3
0
2


 0 −1 7/3  .
0
0
6
Die Determinante ist dann das Produkt der Hauptdiagonalelemente: det A = 3 · (−1) · 6 =
−18 in Übereinstimmung mit dem obigen Ergebnis.
35
4.5
Lineare Unabhängigkeit
Kann man einer Matrix “ansehen”, ob sie invertierbar ist bzw. (nach Satz 4.24 (3)) eine
verschwindende Determinante hat? In einem gewissen Sinne gibt das Konzept der linearen
Unabhängigkeit eine Antwort.
Definition 4.26 Die Vektoren a1 , . . . , ak ∈ Rn heißen linear unabhängig, wenn aus dem
Ansatz
k
X
λ i ai = 0
mit λi ∈ R
i=1
folgt, daß λ1 = . . . = λk = 0. Anderenfalls heißen sie linear abhängig.
Beispiel 4.27 (1) Seien
!
1
,
1
a1 =
Dann folgt aus
λ1
1
1
!
+ λ2
a2 =
!
2
.
2
!
2
=
2
!
0
0
nicht λ1 = λ2 = 0, denn λ1 = 2, λ2 = −1 ist auch eine Lösung. Es folgt also 2a1 − a2 = 0
oder a2 = 2a1 . Die Vektoren a1 und a2 sind linear abhängig. Dies können wir auch sehen,
indem wir den Gauß-Algorithmus für das lineare Gleichungssystem
!
!
1 2
x1
=0
1 2
x2
durchführen:
1 2 0
1 2 0
!
1 2 0
0 0 0
−I
Wir erhalten eine Gleichung 1 · λ1 + 2 · λ2 =
gibt unendlich viele Lösungen.
(2) Seien

 
1

2

 
a2 = 
a1 =   ,

0
−1
Aus dem Ansatz
!
.
0 für zwei Unbekannte λ1 und λ2 , d.h., es

2
1

,
0
−1

1
2
 
a3 =  
−1

0.
   
 

0
1
2
1
 2  0
1
2
   
 
 
λ1   + λ2   + λ3   =  
−1 0
0
0
0
0
−1
−1

36
ergibt sich das folgende Gleichungssystem, das wir mit dem Gauß-Algorithmus lösen:






1
2
1 0
1
2
1 0
1
2
1 0
 0 −3
 2
 0 −3
1
2 0 
0 0 
0 0 


 −2 · I







.


 0



0 −1 0
0
0 −1 0
0
0 −1 0 
+I
−1 −1
0 0
0
1
1 0 + 13 · II
0
0
1 0
Es folgt aus der dritten und vierten Gleichung, daß λ3 = 0, aus der zweiten Gleichung,
daß λ2 = 0, und schließlich aus der ersten Gleichung, daß λ1 = 0. Die Vektoren sind
folglich linear unabhängig.
Definition 4.28 Der Rang einer Matrix A ∈ Rm×n ist die (maximale) Anzahl der linear
unabhängigen Zeilen oder Spalten. Wir schreiben rg A für den Rang von A.
Beispiel 4.29 (1) Sei wie in Beispiel 4.18 (2)
!
1 1
.
2 2
A=
Wir haben in Beispiel 4.27 (1) gezeigt, daß
rg A = 1 (eine linear unabhängige Zeile).
(2) Sei

1
2

A=
0
−1
die Zeilen von A linear abhängig sind, d.h.

2
1
1
2

.
−1 −1
0
0
Wir haben in Beispiel 4.27 (2) gezeigt, daß alle Spalten von A linear unabhängig sind,
d.h. rg A = 3.
Es gibt folgenden Zusammenhang zwischen Invertierbarkeit, Determinante und Rang
einer Matrix.
Satz 4.30 Sei A ∈ Rn×n . Dann gilt
A invertierbar
⇐⇒
det A 6= 0
⇐⇒
rg A = n.
Der Rang einer Matrix gibt Informationen über die Lösbarkeit von linearen Gleichungssystemen. Betrachte
a11 x1 + a12 x2 + . . . + a1n xn
a21 x1 + a22 x2 + . . . + a2n xn
..
.
= 0,
= 0,
..
.
am1 x1 + am2 x2 + . . . + amn xn = 0.
37
Schreiben wir λi anstatt xi , so können wir dies auch formulieren als





  
a11
a12
a1n
0





  
 a21 
 a22 
 a2n  0




  
λ1 
 ..  + λ2  ..  + · · · + λn  ..  =  ..  .
 . 
 . 
 .  .
am1
am2
amn
0
Sind die Spalten von A = (aij ) linear unabhängig (bzw. gilt det A 6= 0), so folgt λ1 =
. . . = λn = 0. Das Gleichungssystem Ax = 0 besitzt also nur die Lösung x = 0. Das ist
eigentlich klar, denn in diesem Fall ist A invertierbar und
x = A−1 Ax = A−1 0 = 0.
Wir können also Satz 4.30 erweitern zu:
Ax = 0 besitzt die eindeutige Lösung x = 0
4.6
⇐⇒
det A 6= 0.
Lösungstheorie linearer Gleichungssysteme
In diesem Abschnitt wollen wir mittels des Rangbegriffes die Lösbarkeit linearer Gleichungssysteme Ax = b genauer charakterisieren. Ein lineares Gleichungssystem hat keine,
genau eine oder unendlich viele Lösungen. Genauer gilt:
Satz 4.31 Seien A ∈ Rm×n und b ∈ Rn . Dann folgt
(1) rg A 6= rg (A|b) =⇒ Ax = b hat keine Lösung.
(2) rg A = rg (A|b) = n =⇒ Ax = b hat genau eine Lösung.
(3) rg A = rg (A|b) < n =⇒ Ax = b hat n − rg A linear unabhängige Lösungen.
Beispiel 4.32 (1) Seien


1 0


a = 1 1 ,
0 1
 
1
 
b1 = 1 ,
0
 
1
 
b2 = 0 .
0
Dann gilt rg A = 2, rg (A|b1 ) = 2 (die erste und dritte Spalte sind gleich, also linear
abhängig) und rg (A|b2 ) = 3. Daher besitzt
• Ax = b1 wegen n = 2 = rg A = rg (A|b) genau eine Lösung;
• Ax = b2 keine Lösung.
38
Wir überprüfen diese Aussagen; Ax = b2 bedeutet ausgeschrieben
1 · x1 + 0 · x2 = 1,
1 · x1 + 1 · x2 = 0,
0 · x1 + 1 · x2 = 0.
Die erste und dritte Gleichung implizieren x1 = 1 und x2 = 0. Die zweite Gleichung ergibt
0 = x1 + x2 = 1,
also einen Widerspruch. Das Gleichungssystem kann keine Lösung besitzen. Das System
Ax = b1 bedeutet
x1 = 1,
x1 + x2 = 1,
x2 = 0.
Die eindeutig bestimmte Lösung lautet x = (1, 0)> .
(2) Seien
!
1 1 0
A=
,
b=
0 1 1
!
0
.
0
Dann existiert wegen rg A = 2 = rg (A|b) < 3 eine linear unabhängige Lösung. Wir
können sie aus
x1 + x2 = 0,
x2 + x3 = 0
berechnen, indem wir x2 als Parameter betrachten:
x1 = −λ,
d.h., alle Vektoren
x3 = −λ,
x2 = λ,
 
 
x1
−1
 
 
x = x2  = λ  1 
x3
−1
sind Lösungen von Ax = b. Die linear unabhängige Lösung lautet (−1, 1, −1)> .
Der Gauß-Algorithmus erlaubt auch die Bestimmung der Inverse einer Matrix. Das
geht wie folgt.
Beispiel 4.33 Sei


1 −2 2


A = 1 1 −1 .
2 3
1
Wir schreiben für den Gauß-Algorithmus
(A|E),
39
wobei E die (3 × 3)-Einheitsmatrix ist. Das Ziel lautet, die linke Seite so umzuformen,
daß wir die Einheitsmatrix erhalten. Dann erhalten wir rechts die Inverse:
(E|A−1 ).
Genauer ist:
Wir erhalten daher


1 −2 2 1 0 0


 1 1 −1 0 1 0 
2 3
1 0 0 1


1 0 0
1 −2 2


 0 3 −3 −1 1 0 
0 7 −3 −2 0 1


1
2
0
1 0 0
3
3


1
1
−
0
1
−1
0 

3
3
1
− 37 1
0 0 4
3


2
0
1 0 0 13
3


 0 1 0 − 41 − 41 14 
1
7
1
0 0 1 12
− 12
4
A−1

−I
−2 · I
+ 32 · II
:3
− 37 · II
+ 14 · III
:4

4
8 0
1 

=
−3 −3 3 .
12
1 −7 3
40
5
Folgen und Reihen
5.1
Folgen
Definition 5.1 Wir nennen die Abfolge von (reellen oder komplexen) Zahlen a1 , a2 , a3 , . . .
eine Folge. Die Elemente an heißen Folgenglieder, und wir schreiben kurz (an ) für die
Folge.∗
Beispiel 5.2 (1) Die Vermehrung von Kaninchen wird häufig durch die Fibonacci-Folge
beschrieben. Ein Kaninchenpaar werfe von jedem zweiten Monat an ein junges Paar und
in jedem weiteren Monat ein weiteres Paar. Ist an die Anzahl der Kaninchenpaare im
Monat n, so wird an+1 rekursiv definiert durch
an+1 = an + an−1 ,
n ∈ N,
a0 = 1,
a1 = 1.
Die ersten Folgenglieder sind
a2 = 2,
a3 = 3,
a4 = 5,
a5 = 8,
a6 = 13,
a7 = 21,
usw.
Fibonacci-Zahlen treten in einer Vielzahl von Anwendungen auf. Einige Beispiele sind:
• Für immer größere n ∈ N nähert sich das Verhältnis an+1 /an dem Goldenen Schnitt
√
an, nämlich der Zahl (1+ 5)/2 ≈ 1.6180. Der Name rührt daher, daß das Verhältnis
√
1 zu (1 + 5)/2 als besonders ästhetisch empfunden wird.
• Die Summen der Diagonalelemente des Pascalschen Dreiecks (siehe Abbildung 5.1)
sind Fibonacci-Zahlen.
(2) Wir haben in Kapitel 1 die Menge Nn einer radioaktiven Substanz zur Zeit n · 4t
bestimmt:
n
1
,
n≥2
Nn = 1 −
n
(Falls αt = 1; siehe Kapitel 1). Dann ist N2 , N3 , N4 , . . . eine Folge. Die ersten Folgenglieder
lauten
4
3
1
3
2
N2 = = 0.25,
= 0.2963 . . . ,
N4 =
= 0.3164 . . . ,
N3 =
4
3
4
und weiter
10
9
= 0.3487 . . . ,
N10 =
10
N100 =
99
100
100
= 0.3660 . . . ,
N1000 = 0.3677 . . .
Wir können Folgen mit dem Funktionenbegriff aus Kapitel 3 genauer als Funktionen f : N → R mit
f (n) = an definieren.
∗
41
Es scheint, daß sich Nn für immer größeres n einem Wert nähert.
(3) Definiere die Folge
1
2
an+1 =
an +
,
n ∈ N, a1 = 1.
2
an
Die ersten Folgenglieder lauten
a2 = 1.5,
a3 = 1.4166 . . . ,
1
1
1
1
1
1
1
1
1
2
3
4
5
6
7
a10 = 1.4142 . . . ,
1
3
6
10
15
21
a100 = 1.4142 . . .
1
4 1
10 5 1
20 15 6 1
35 35 21 7 1
Abbildung 5.1: Die Summe der Diagonalelemente im Pascalschen Dreieck ergibt die
Fibonacci-Zahlen, z.B. 1 + 4 + 3 = 0, 1 + 5 + 6 + 1 = 13,1 + 6 + 10 + 4 = 21 usw.
Es scheint, als strebe die Folge an für große n gegen den Wert 1.4121 . . . . Wir vermuten,
daß an den Wert
√
2 = 1.4142 . . .
annähert.
Die obigen Beispiele legen nahe, daß es Folgen gibt, die für immer größere n einen
Grenzwert besitzen. Dieser Begriff wird in der folgenden Definition präzisiert.
Definition 5.3 (1) Eine Folge (an ) besitzt den Grenzwert (oder Limes) a ∈ R genau
dann, wenn
∀ ε > 0 : ∃ n0 ∈ N : ∀ n ≥ n0 : |an − a| ≤ ε.
Wir schreiben in diesem Fall
lim an = a
n→∞
an → a (n → ∞).
oder
42
Eine nicht konvergente Folge heißt divergent. Eine konvergente Folge mit Grenzwert a = 0
heißt Nullfolge.
(2) Die Folge (an ) heißt beschränkt genau dann, wenn
∃M >0:∀n∈N:
|an | ≤ M.
Beispiel 5.4 Sei an = 1/n, n ∈ N. Wir vermuten, daß (an ) eine Nullfolge ist. Sei dazu
ε > 0. Wir wählen ein n0 ∈ N, so daß n0 ≥ 1/ε. Dann folgt für beliebiges n ≥ n0
|an − 0| = |an | =
1
1
≤
≤ ε.
n
n0
Also ist limn→∞ (1/n) = 0.
Satz 5.5 Konvergente Folgen sind beschränkt.
Beispiel 5.6 Klarerweise ist an = 1/n beschränkt mit Schranke M = 1, denn an =
1/n ≤ 1. Die Folge der Fibonacci-Zahlen ist unbeschränkt und muß daher divergent sein,
denn wäre sie konvergent, wäre sie ja nach Stz 5.5 beschränkt, was nicht zutrifft.
Wichtig sind die folgenden Grenzwertsätze.
Satz 5.7 (Grenzwertsätze)
Seien (an ), (bn ) konvergente Folgen mit Grenzwerten a bzw. b. Dann gilt:
(1) limn→∞ (an ± bn ) = a ± b;
(2) limn→∞ (an · bn ) = a · b;
(3) limn→∞ (an /bn ) = a/b, falls bn 6= 0 und b 6= 0;
(4) ∀ n ∈ N : an ≤ bn =⇒ a ≤ b.
Beachte, daß aus an < bn für alle n ∈ N nicht a < b folgt. Ein Gegenbeispiel ist
an = 1/(n + 1) und bn = 1/n (denn a = b = 0).
Beispiel 5.8 (1) Sei
n2 − n
,
n ∈ N.
3n2 + 1
Aus limn→∞ (1/n) = 0 und limn→∞ (1/n2 ) = 0 folgt mit Satz 5.7
an =
1 − limn→∞ n1
1 − n1
1
=
lim an = lim
1 = .
n→∞
n→∞ 3 + 12
3
3 + limn→∞ n2
n
43
(2) Sei bn = an+1 /an der Verhältnis zweier aufeinander folgender Fibonacci-Zahlen.
Aus an+1 = an + an−1 folgt dann
bn =
1
an + an−1
=1+
.
an
bn−1
Angenommen, (bn ) konvergiere gegen b. Dann ergibt Satz 5.7
1
b = lim bn = 1 +
limn→∞ bn−1
n→∞
oder b2 − b − 1 = 0. Diese Gleichung hat die zwei
r
1
1
+1=
b1/2 = ±
2
4
=1+
1
b
Lösungen
√
1
(1 + 5),
2
√
von denen aber nur eine positiv (und damit für uns relevant ist), nämlich b1 = (1 + 5)/2.
Dieses ist gerade der Goldene Schnitt, d.h.
√
1
an+1
= (1 + 5).
n→∞ an
2
lim
(3) Sei (an ) rekursiv definiert durch
an+1 =
1
+ a2n ,
4
n ∈ N,
a1 = 1.
Angenommen, (an ) konvergiere gegen a. Wir erhalten dann mit Satz 5.7
a = lim an+1 =
n→∞
oder a2 − a +
1
4
1
1
+ lim a2n = + a2
n→∞
4
4
= 0. Diese Gleichung besitzt genau eine Lösung: a = 12 . Wir schließen
1
lim an = .
2
n→∞
Die ersten Folgen von (an ) sind
a1 = 1,
a2 =
5
> 1,
4
a3 =
29
> 1,
16
a4 =
84100
> 1,
256
usw.
Man kann zeigen, daß an > 1 für alle n ≥ 2. Aus Satz 5.7 (4) folgt dann
1
= a = lim an ≥ 1,
n→∞
2
Widerspruch!
Was ist schiefgelaufen? Die Folge (an ) ist divergent! Bevor man die Grenzwertsätze anwendet, muß man also prüfen, ob die entsprechenden Folgen wirklich konvergieren.
44
Beispiel 5.9 Ein wichtiges Beispiel ist die Folge an = (1 + 1/n)n , n ∈ N. Eine naive
Anwendung der Grenzwertsätze würde auf
lim an =
n→∞
1
1 + lim
n→∞ n
limn→∞ n
= (1 + 0)∞ = 1∞ = 1
führen. Diese Argumentation ist jedoch falsch, denn der Grenzwert n → ∞ muß simultan
für den Quotienten 1/n und den Exponenten n durchgeführt werden und nicht separat.
Einige Folgenglieder lauten
a1 = 1,
a10 = 2.5937 . . . ,
a100 = 2.7048 . . . ,
a1000 = 2.7169 . . . ,
a10000 = 2.7181 . . .
Es scheint also, daß die Folge (an ) gegen einen Wert 2.718 . . . konvergiert. Tatsächlich
kann man zeigen, daß (an ) gegen die Eulersche Zahl e konvergiert:
1 n
1+
= 2.7182818 . . . = e.
n→∞
n
lim
5.2
Reihen
Definition 5.10 (1) Sei (an ) eine Folge. Man nennt die Folge (sn ) der Partialsummen,
sn =
n
X
ak ,
k=1
P
eine (unendliche) Reihe und schreibt kurz ∞
k=1 ak .
P∞
(2) Die Reihe
k=1 ak heißt konvergent genau dann, wenn (sn ) konvergiert. Man
schreibt s = limn→∞ sn und schreibt kurz
s=
∞
X
ak .
k=1
Das Symbol
P∞
k=1
ak hat also eine Doppelbedeutung:
• Es bezeichnet die Folge der Partialsummen (sn ) und
• es bezeichnet den Grenzwert von (sn ), falls er existiert.
Beispiel 5.11 (1) Reihen treten in zahlreichen physikalischen und chemischen Anwendungen auf. Ein Beispiel ist die Gesamtanzahl entstandener Moleküle in einer chemischen
Reaktion. Wir nehmen an, daß im Zeitraum [n, n + 1] etwa an = e−n (n ∈ N0 ) Moleküle
45
erzeugt werden. Dann liefert die Reaktion nach einiger Zeit zwar nur sehr wenige Moleküle, aber theoretisch läuft die Reaktion im Zeitintervall [0, ∞) ab. Die Anzahl aller
erzeugten Moleküle lautet also
∞
∞
X
X
an =
e−n .
n=0
n=0
(2) Reihen werden auch benötigt, um einige elementare Funktionen zu definieren. So
ist die Exponentialfunktion ex etwa definiert durch die Reihe
ex =
∞
X
xn
n=0
n!
,
x ∈ R.
Man kann zeigen, daß diese Reihe für alle x ∈ R konvergiert. Auch die trigonometrischen
Funktionen sin und cos sind als Reihen definiert, etwa
∞
X
(−1)n 2n+1
sin x =
x
,
(2n + 1)!
n=0
x ∈ R.
Beispiel 5.12 (1) Man nennt
∞
X
qk
k=1
mit q ∈ R
die geometrische Reihe. Wegen
(1 − q)
n
X
k=0
q k = (1 + q + . . . + q n ) − (q + q 2 + . . . + q n+1 ) = 1 − q n+1
lauten die Partialsummen
n
X
k=0
qk =
1 − q n+1
,
1−q
falls q 6= 1.
Aus Satz 5.7 ergibt sich
∞
X
q k = lim
k=0
n→∞
n
X
qk =
k=0
1 − limn→∞ q n+1
.
1−q
Der Grenzwert auf der rechten Seite existiert genau dann, wenn |q| < 1, nämlich limn→∞ q n+1 =
0. Folglich ist
∞
X
1
qk =
für |q| < 1.
1−q
k=1
(2) Die harmonische Reihe
∞
X
1
k=1
46
k
ist divergent. Der Beweis ist nicht einfach, folgt aber aus der Ungleichung
m
2
X
1
k=1
k
≥1+
m
.
2
(3) Betrachte die Reihe
s=
∞
X
k=0
(−1)k 2k = 1 − 2 + 4 − 8 ± . . .
Dann erhalten wir
1 − 2s = 1 −
∞
X
(−1)k 2k+1 = 1 +
k=0
∞
X
(−1)k+1 2k+1 = 1 +
∞
X
j=1
k=0
(−1)j 2j =
∞
X
(−1)j 2j = s
j=0
und damit s = 1/3. Da die Reihenglieder alles natürliche Zahlen sind, sollte auch der
Grenzwert eine natürliche Zahl sein. Was ist schiefgelaufen? Ganz einfach: Die Reihe
konvergiert nicht, d.h., s existiert nicht!
Aus den Sätzen 5.5 und 5.7 erhalten wir sofort die Grenzwertsätze für Reihen.
Satz 5.13 Seien
(1)
(2)
(3)
P∞
k=1 (ak
P∞
k=1
P∞
k=1
P∞
k=1
± bk ) =
λak = λ
ak und
P∞
k=1
P∞
k=1
P∞
k=1 bk
ak ±
ak ;
P∞
konvergente Reihen und sei λ ∈ R. Dann gilt:
k=1 bk ;
ak ist konvergent ⇐⇒ (sn ) ist beschränkt.
Beispiel 5.14 Wir zeigen, daß die Reihe
sn =
n
X
k=1
=1−
n
X
1
=
k(k + 1) k=1
1
≤ 1,
n+1
1
1
−
k k+1
P∞
1
k=1 k(k+1)
konvergiert. Es gilt nämlich
1
1
1
1
1
+ ... + +
= 1 + + ... +
−
2
n
2
n n+1
d.h., (sn ) ist beschränkt. Aus Satz 5.13 (3) folgt die Behauptung. Beachte, daß wir den
Wert der Reihe nicht bestimmt haben!
Folgende Kriterien sind nützlich, um eine Reihe auf Konvergenz zu testen.
Satz 5.15 Seien (an ) und (bn ) Folgen.
(1) Notwendiges Kriterium:
P∞
k=1
ak ist konvergent =⇒ (an ) ist eine Nullfolge.
47
(2) Leibnizkriterium: Wenn (an ) eine monoton fallende Nullfolge ist, d.h.
dann ist
P∞
an+1 ≤ an
k
k=1 (−1) ak
für alle n ∈ N,
lim an = 0,
n→∞
konvergent.
(3) Majorantenkriterium: Gilt |ak | ≤ bk für alle k und ist
P
vergiert auch ∞
k=1 ak .
P∞
k=1 bk
konvergent, so kon-
P
(4) Minorantenkriterium: Gilt |ak | ≥ bk für alle k und ist ∞
k=1 bk divergent, so auch
P∞
k=1 ak .
p
P
(5) Wurzelkriterium: Wenn limk→∞ k |ak | ≤ q < 1, so ist ∞
k=1 ak konvergent.
P
(6) Quotientenkriterium: Wenn limk→∞ |ak+1 /ak | ≤ q < 1, so ist ∞
k=1 ak konvergent.
P
n!
Beispiel 5.16 (1) Betrachte die Reihe ∞
n=0 nn . Um zu prüfen, ob diese Reihe konvergiert
oder nicht, müssen wir eines der obigen Konvergenzkritierien anwenden. Einen schnellen
Nachweis erlauben meist das Wurzel- oder Quotientenkriterium (falls ansonsten nicht
klar ist, welches Kriterium angewendet werden sollte). Das Wurzelkriterium führt mit
ak = k!/k k auf
√
√
k
k
p
k!
k!
k
|ak | = √
=
.
k
k
k
k
√
Die Schwierigkeit ist hier die Berechnung von k k!, die nicht ohne weiteres möglich ist.
Daher versuchen wir das Quotientenkriterium:
k
ak+1 (k + 1)k k
kk
1
= (k + 1)! k =
=
=
.
ak (k + 1)k+1 k!
k
k
(k + 1) · (k + 1)
(k + 1)
(1 + 1/k)k
Die Folge (1 + 1/k)k haben wir bereits im vorigen Abschnitt kennengelernt. Es gilt:
limk→∞ (1 + 1/k)k = e. Damit ist
ak+1 1
= < 1.
lim
k→∞ ak e
Also ist die Reihe nach dem Quotientenkriterium konvergent.
P
n1
(2) Die Folge ∞
n=1 (−1) n ist nach dem Leibniz-Kriterium konvergent, aber nicht
X
∞
∞ X
1
1
n
(−1) =
,
n
n
n=1
n=1
denn dies ist die harmonische Reihe, die divergiert (siehe Beispiel 5.12 (2)).
P
1
(3) Die Reihe ∞
k=1 k2 ist konvergent, denn
|ak | =
1
1
2
≤
·
2
k
k
k+1
48
für k ≥ 1
und die Reihe
∞
X
k=1
∞
X
1
2
=2
k(k + 1)
k(k + 1)
k=1
ist nach Beispiel 5.14 konvergent. Die Behauptung folgt also aus dem Majorantenkriterium.
P
1
(4) Die Reihe ∞
n=0 n! ist konvergent nach dem Quotientenkriterium, denn mit an =
1/n! folgt
an+1 1
1
n!
für alle n ≥ 1.
an = (n + 1)n! = n + 1 ≤ 2
P
1
Übrigens ist ∞
n=0 n! = e.
Es ist wichtig, für das Wurzel- und Quotientenkriterium eine Zahl q < 1 und nicht nur
q ≤ 1 zu finden, da sonst die Aussage nicht gilt. Ein Beispiel ist die harmonische Reihe,
für die zwar gilt
an+1 n
an = n + 1 < 1,
aber man kann kein q < 1 finden, so daß n/(n + 1) ≤ q für alle n ≥ 1 erfüllt ist!
Beachte außerdem, daß die Umkehrung des notwendigen Kriteriums i.a. nicht gilt:
P
Ist die Folge (an ) konvergent, so folgt daraus nicht unbedingt, daß die Reihe ∞
an
P∞ k=1
ebenfalls konvergent ist. Ein Gegenbeispiel ist wieder die harmonische Reihe k=1 1/k,
denn die Folge (1/n) konvergiert (gegen null), aber die Reihe ist divergent.
49
6
Differentiation
6.1
Stetigkeit
Aus den Grenzwertsätzen folgt für eine gegen x ∈ R konvergierende Folge (xn ), daß auch
lim x2n =
n→∞
gilt. Folgt dann auch allgemein
lim f (xn ) = f
n→∞
lim xn
n→∞
2
= x2
lim xn = f (x)?
n→∞
Die Frage kann bejaht werden, sofern f stetig ist. Dieser Begriff wird im folgenden definiert.
Definition 6.1 (1) Sei f : Df ⊂ R → R eine Funktion. Sie konvergiert gegen a ∈ R für
x → x0 genau dann, wenn für alle Folgen (xn ) ⊂ Df \{x0 } mit xn → x0 (n → ∞) gilt
f (xn ) → a (n → ∞). In diesem Fall schreibt man
lim f (x) = a.
x→x0
(2) Die Funktion f : Df ⊂ R → R heißt stetig in x0 ∈ Df genau dann, wenn
lim f (x) = f ( lim x) = f (x0 )
x→x0
x→x0
(6.1)
gilt. Sie heißt stetig, falls sie in jedem x0 ∈ Df stetig ist.
Beispiel 6.2 (1) Sei f (x) = x3 +2x2 , x ∈ R. Ist f stetig in x0 ∈ R? Sei (xn ) eine beliebige
Folge mit xn → x0 (n → ∞). Aus den Grenzwertsätzen folgt
lim f (xn ) = lim (x3n + 2x2n ) = ( lim xn )3 + 2( lim xn )2 = x30 + 2x20 = f (x0 ).
n→∞
n→∞
n→∞
n→∞
Da x0 und (xn ) beliebig war, ist f stetig in jedem x0 ∈ R, also ist f stetig.
(2) Sei
(
−2x − 2 für x ≤ 0,
f (x) =
2 + 2x für x > 0.
Ist f stetig in x0 = 0? Sei xn = 1/n, n ∈ N. Dann folgt
f (xn ) = 2 − 2xn = 2 −
2
→2
n
(n → ∞),
also ist
lim f (xn ) = 2 6= −2 = f (0).
n→∞
Die Funktion ist nicht stetig in x0 = 0 (Abbildung 6.1).
50
y
f (x)
2
x
−2
Abbildung 6.1: Graph der Funktion f aus Beispiel 6.2 (2).
Der folgende Satz erweitert die Grenzwertsätze.
Satz 6.3 Seien f , g und h Funktionen, so daß f und g stetig in x0 (mit g(x0 ) 6= 0) und
h stetig in y0 = f (x0 ) sind. Dann gilt:
(1) f ± g, f · g und f /g sind stetig in x0 ;
(2) die Verkettung h ◦ f , definiert durch (h ◦ f )(x) = h(f (x)), ist stetig in x0 .
Satz 6.3 zeigt, daß alle betrachteten elementaren Funktionen stetig sind, beispielsweise
alle Polynome, exp, ln, sin, cos, sinh, cosh, usw.
6.2
Die Ableitung
Die Ableitung einer Funktion in einem Punkt ist die Steigung der Tangente in diesem
Punkte (siehe Abbildung 6.2). Diese Konstruktion ist möglich, wenn der Graph der Funktion “glatt” ist. Schwierigkeiten gibt es etwa bei der Funktion in Abbildung 6.1: Die
Tangente an x0 = 0 hat die Steigung −2 (am Kurventeil für x < 0) bzw. die Steigung +2
(am Kurventeil für x > 0). Für die Ableitung ist die Stetigkeit ein notwendiges Kriterium.
Sie ist nicht ausreichend, wie Abbildung 6.2 rechts zeigt: An der Stelle x0 = 0 gibt es keine
eindeutige Tangente.
Die Gleichung der Tangente t(x) lautet
t(x) = f (x0 ) + α(x − x0 ),
wobei α die Tangentensteigung ist. Falls x ≈ x0 , gilt f (x) ≈ t(x) und
α≈
f (x) − f (x0 )
.
x − x0
51
y
y
Tangente an x0
f (x)
f (x)
t(x)
0
x
x0
x
Abbildung 6.2: Illustration der Tangente am Punkt x0 (links). Die rechte Funktion besitzt
an x0 = 0 keine eindeutige Tangente.
Die Tangentensteigung ist also näherungsweise gleich der Sekantensteigung. Wir definieren
sie als den Grenzwert der Sekantensteigungen.
Definition 6.4 Sei I ⊂ R ein Intervall und f : I → R eine Funktion. Dann heißt f
differenzierbar in x0 ∈ I, falls der Grenzwert
lim
x→x0
f (x) − f (x0 )
x − x0
df
(x0 ) für diesen Grenzwert und nennt
existiert. In diesem Fall schreibt man f 0 (x0 ) oder dx
ihn die Ableitung von f an x0 . Eine Funktion heißt differenzierbar, wenn sie in allen
x0 ∈ I differenzierbar ist. Sie heißt stetig differenzierbar, wenn sie differenzierbar und die
Ableitung stetig ist.
Bemerkung 6.5 (1) Schreibt man x0 + h = x, so kann die Definition der Ableitung auch
formuliert werden als
f (x0 + h) − f (x0 )
.
f 0 (x0 ) = lim
h→0
h
df
wird auch Differentialquotient genannt; es ist allerdings kein Quo(2) Das Symbol dx
tient!
(3) Wir können x 7→ f 0 (x) wieder als Funktion interpretieren. Analog können höhere
Ableitungen definiert werden:
f 00 (x0 ) = lim
x→x0
f 0 (x) − f 0 (x0 )
x − x0
52
usw.
Beispiel 6.6 (1) Sei f (x) = x2 , x ∈ R. Sei x0 ∈ R. Dann gilt
f (x0 + h) − f (x0 )
(x0 + h)2 − x20
=
= 2x0 + h
h
h
und daher
f (x0 + h) − f (x0 )
= lim (2x0 + h) = 2x0 .
h→0
h→0
h
Die Funktion f ist also an jeder Stelle differenzierbar und f 0 (x) = 2x. Allgemein gilt:
lim
f (x) = xα
⇒
f 0 (x) = αxα−1 ,
α ∈ R.
(6.2)
(2) Sei f (x) = |x|, x ∈ R (siehe Abbildung 6.2 rechts). Sei x0 = 0. Wegen
f (x0 + h) − f (x0 )
|x0 + h| − |x0 |
|h|
=
=
h
h
h
unterscheiden wir zwei Fälle:
• h>0:
1
(f (x0
h
+ h) − f (x0 )) = 1;
• h<0:
1
(f (x0
h
+ h) − f (x0 )) = −1.
Dies bedeutet, daß f 0 (x0 ) nicht existiert. Übrigens ist f (x) an jeder anderen Stelle differenzierbar mit
(
1 für x > 0,
f 0 (x) =
−1 für x < 0.
Die Ableitung f 0 ist nur für alle x ∈ R, x 6= 0, definiert.
Die elementaren Funktionen aus Abschnitt 3.3 sind differenzierbar; ihre Ableitungen
lauten:
f (x)
xα
ex ln x sin x cos x tan x sinh cosh
f 0 (x) αxα−1 ex x1 cos x − sin x cos12 x cosh sinh
6.3
Rechenregeln
Satz 6.7 Seien f und g differenzierbare Funktionen und a, b ∈ R. Dann sind auch af +bg,
f · g und f /g (falls g(x) 6= 0) differenzierbar, und es gilt:
(1) Linearität: (af + bg)0 = af 0 + bg 0 ,
(2) Produktregel: (f · g)0 = f 0 · g + f · g 0 ;
0
f
f 0 · g − f · g0
.
(3) Quotientenregel:
=
g
g2
53
Beispiel 6.8 (1) Sei
P (x) =
n
X
ak x k
k=0
mit n ∈ N, ak ∈ R,
ein Polynom. Dann ist P differenzierbar, und es gilt nach (6.2):
P 0 (x) =
n
X
ak kxk−1 .
k=1
(2) Sei f (x) = tan x, −π/2 < x < π/2. Dann ist nach der Quotientenregel
0
sin0 x cos x − sin x cos0 x
cos2 x + sin2 x
1
sin x
0
=
f (x) =
=
=
.
2
2
cos x
cos x
cos x
cos2 x
Die Produktregel kann für höhere Ableitungen verallgemeinert werden. Für genügend
oft differenzierbare Funktionen f und g folgt
(f · g)00 = (f 0 g + f g 0 )0 = (f 00 g + f 0 g 0 ) + (f 0 g 0 + f g 00 )
= f 00 g + 2f 0 g 0 + f g 00 ,
(f · g)000 = (f 000 g + f 00 g 0 ) + 2(f 00 g 0 + f 0 g 00 ) + (f 0 g 00 + f g 000 )
= f 000 g + 3f 00 g 0 + 3f 0 g 00 + f g 000
usw.
Die Koeffizienten lauten also:
1 Ableitung: 1, 1;
2 Ableitungen: 1, 2, 1;
3 Ableitungen: 1, 3, 3, 1.
Diese Folge kommt uns bekannt vor: siehe das Pascalsche Dreieck aus Abschnitt 2.3!
Wir schließen, daß der Koeffizient vor dem Produkt f (k) , g (n−k) (d.h. k-te Ableitung von
f und (n − k)-te Ableitung von g) gerade der Binomialkoeffizient nk ist. Dies motiviert
den folgenden Satz.
Satz 6.9 (Leibniz-Formel)
Seien f und g n-mal differenzierbar. Dann ist auch f · g n-mal differenzierbar, und es gilt
n X
n (k) (n−k)
(n)
f g
.
(f · g) =
k
k=0
Satz 6.10 (Kettenregel)
Seien f eine in x0 differenzierbare Funktion und g eine in f (x0 ) differenzierbare Funktion.
Dann ist h(x) = (g ◦ f )(x) = g(f (x)) in x0 differenzierbar, und es gilt:
h0 (x0 ) = (g ◦ f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ).
Man nennt g 0 (f (x0 )) die äußere Ableitung und f 0 (x0 ) die innere Ableitung.
54
Wir können die Kettenregel mit Hilfe des Differentialquotienten auch einprägsam wie
folgt formulieren. Seien g(y) und y(x) differenzierbar. Dann ist
dg dy
dg
=
.
dx
dy dx
Die linke Seite entspricht der Ableitung
d
g(y(x)),
dx
die rechte g 0 (y(x)) · y 0 (x).
Beispiel 6.11 (1) Sei h(x) = sin(x2 ), x ∈ R. Definiere f (x) = x2 und g(y) = sin y. Dann
ist h = g ◦ f , f 0 (x) = 2x, g 0 (y) = cos y, also
h0 (x) = g 0 (f (x))f 0 (x) = 2x cos(x2 ).
(2) Die Menge einer radioaktiven Substanz sei gegeben durch
N (t) = N0 e−αt ,
t > 0,
α > 0.
Definiere f (t) = −αt und g(x) = N0 ex . Dann ist N = g ◦ f , und aus f 0 (t) = −α und
g 0 (x) = N0 ex folgt:
N 0 (t) = g 0 (f (t))f 0 (t) = −αN0−αt = −αN (t).
Dies ist die Differentialgleichung aus Beispiel 1.2.
(3) Sei h(x) = ax mit a > 0. Man ist vielleicht versucht, für die Ableitung h0 (x) =
x
xax−1 zu schreiben; dies ist jedoch falsch! Schreiben wir nämlich ax = eln(a ) = ex ln a und
definieren f (x) = x ln a, g(y) = ey , so folgt h = g ◦ f und f 0 (x) = ln a, g 0 (y) = ey , also
h0 (x) = g 0 (f (x)) · f 0 (x) = ex ln a · ln a = ln a · ax .
(4) Die Ableitungen von sinh und cosh lauten
sinh0 = cosh,
cosh0 = sinh,
denn
1
1
1
sinh0 (x) = (ex − e−x )0 = [(ex )0 − (e−x )0 ] = [ex − (−e−x )] = cosh x,
2
2
2
1
1
cosh0 (x) = (ex + e−x )0 = (ex − e−x ) = sinh x.
2
2
Die Ableitungen von arcsin, arsinh usw. können wir mit Hilfe des folgenden Satzes
berechnen.
Satz 6.12 (Ableitung der Umkehrfunktion)
Sei f : Df → Wf mit Df , Wf ⊂ R eine invertierbare und differenzierbare Funktion mit
f 0 (x) 6= 0 für alle x ∈ Df . Dann ist die Inverse f −1 auch differenzierbar, und es gilt für
alle y = f (x) ∈ Wf :
1
1
= 0 −1
.
(f −1 )0 (y) = 0
f (x)
f (f (y))
55
Wir können diese Regel wieder symbolisch für eine differenzierbare Funktion y = y(x)
mit Inverse x = x(y) formulieren:
1
dx
= dy .
dy
dx
Die linke Seite entspricht x0 (y), die rechte 1/y 0 (x).
Beispiel 6.13 (1) Sei f (x) = ex , x ∈ R. Dann ist Df = R, Wf = (0, ∞). Die Inverse
lautet f −1 (y) = ln y, y ∈ (0, ∞), und
ln0 (y) =
1
1
1
=
=
.
f 0 (ln y)
eln y
y
(2) Sei f (x) = sin x, x ∈ Df = (−π/2, π/2). Dann ist Wf = (−1, 1) und f −1 (y) =
arcsin y, y ∈ Wf . Aus Satz 6.12 folgt
arcsin0 (y) =
1
f 0 (arcsin y)
für alle y ∈ (−1, 1).
=
1
1
1
=p
=p
cos(arcsin y)
1 − sin(arcsin y)2
1 − y2
Wir fassen die Ableitungen einiger Umkehrfunktionen (Inversen) zusammen:
f (x)
arcsin x
arccos x arctan x arsinh x
1
1
1
1
√
−√
f 0 (x) √
2
1 − x2
1 − x2 1 + x
x2 + 1
arcosh x artanh x
1
1
√
x2 − 1 1 − x2
Die Ableitung hilft bei der Bestimmung von Grenzwerten der Form
”0 ”
0
oder
”∞ ”
,
∞
nämlich beispielsweise bei limx→0 (sin x)/x.
Satz 6.14 (Regel von de l’Hospital)
Seien f, g : (a, b) → R differenzierbar und g 0 (x) 6= 0 für alle x ∈ (a, b). Es gelte
lim f (x) = lim g(x) = 0
x→a
und der Grenzwert
x→a
oder
f 0 (x)
x→a g 0 (x)
lim
Dann folgt
lim f (x) = lim g(x) = +∞
x→a
existiert.
f (x)
f 0 (x)
lim
= lim 0
.
x→a g(x)
x→a g (x)
56
x→a
Beispiel 6.15 (1) Der Grenzwert
sin x
x
0
ist vom Typ ” 0 ”, da limx→0 sin x = limx→0 x = 0. Der Grenzwert
lim
x→0
cos x
sin0 x
=1
= lim
lim
x→0
x→0 (x)0
1
existiert, und daher ist
lim
x→0
sin x
cos x
= lim
= 1.
x→0
x
1
(2) Der Grenzwert
sin x − x
x→0
x3
ist wieder vom Typ “ 00 ”. Existiert der Grenzwert
lim
(sin x − x)0
cos x − 1
= lim
?
3
0
x→0
x→0
(x )
3x2
lim
Er ist wieder vom Typ “ 00 ”. Wir wenden die Regel von de l’Hospital auf den letzten
Grenzwert an, und untersuchen
− sin x
sin x
1
1
(cos x − 1)0
= lim
= − lim
=−
2
0
x→0
x→0
x→0
(3x )
6x
6
x
6
lim
nach (1). Wir erhalten also
sin x − x
cos x − 1
− sin x
1
= lim
= lim
=− .
3
2
x→0
x→0
x→0
x
3x
6x
6
lim
(3) Der Grenzwert
lim x ln x
x→0
ist vom Typ “0 · ∞”, so daß die Regel von de l’Hospital nicht unmittelbar anwendbar ist.
Wir schreiben daher
lim x ln x = lim
x→0
x→0
ln x
1
x
= lim
x→0
1
x
− x12
= − lim x = 0.
x→0
(4) Der Grenzwert
lim xx
x→0
ist vom Typ “00 ”, und die Regel von de l’Hospital ist wieder nicht anwendbar. Wir schreiben
x
lim xx = lim eln(x ) = lim xx ln x .
x→0
x→0
x→0
57
Vertauschen wir den Grenzwert und die Funktionsauswertung ey , so folgt nach (3)
lim ex ln x = elimx→0 x ln x = e0 = 1.
x→0
Dürfen wir den Grenzwert und ey vertauschen? Ja, denn die e-Funktion ist stetig, und für
solche Funktionen ist die Vertauschung möglich (siehe (6.1)).
(5) Die Regel von de l’Hospital führt auf
− sin x
cos x
= lim
= 0,
x→0
x→0
x
1
lim
wobei der Grenzwert vom Typ “ 01 ” ist. Die folgende Tabelle gibt einige Werte des Quotienten (cos x)/x an.
x
cos x
x
0.1
0.01
0.001
−0.1
−0.01
−0.001
9.95 99.995 999.9995 −9.95 −99.995 −999.9995
Die Tabelle läßt vermuten, daß der Grenzwert gar nicht existiert! Tatsächlich gilt
lim
x→0,x>0
cos x
= +∞,
x
lim
x→0,x<0
cos x
= −∞.
x
Im vorliegenden Fall sind die Voraussetzungen von Satz 6.14 nicht erfüllt. Die unkritische
Anwendung der Regel von de l’Hospital kann also zu falschen Resultaten führen.
Wir können die folgenden Fälle mit der Regel von de l’Hospital untersuchen:
• “∞ − ∞”: Schreibe
f (x) − g(x) =
1
g(x)
−
1
f (x)
1
f (x)g(x)
.
Der Quotient ist von der Form “ 00 ”.
• “0 · ∞”: Schreibe
f (x) · g(x) =
f (x)
1
g(x)
.
Der Quotient ist wieder von der Form “ 00 ”.
• “00 ”: Schreibe f (x)g(x) = eg(x)·ln f (x) . Der Exponent ist vom Typ “0 · ∞”.
• “1∞ ”: Schreibe f (x)g(x) = eg(x)·ln f (x) , und der Exponent hat die Form “∞ · 0”.
• “∞0 ”: Schreibe wieder f (x)g(x) = eg(x)·ln f (x) und erhalte den Typ “0 · ∞”.
58
y
f (x)
a
x1
x2
x3 b
x
y
f 0 (x)
a
x1
x4
x2
x5
x3
b
x
y
f 00 (x)
a
x4
x5
b
x
Abbildung 6.3: Die Funktion f besitzt ein lokales Maximum in x1 und ein lokales Minimum
in x2 . Das globale Maximum wird dagegen in x3 erreicht. Die Stellen x4 und x5 sind
kritische Punkte von f 0 .
6.4
Kurvendiskussion
Ist die Steigung der Tangente an den Graphen einer Funktion stets positiv (bzw. negativ),
so ist die Funktion monoton wachsend (bzw. fallend). Ist die Tangentensteigung zunächst
positiv (bzw. negativ) und dann negativ (bzw. positiv), so erwarten wir, daß ein lokales
Maximum (bzw. Minimum) vorliegt (siehe Abbildung 6.3).
Definition 6.16 Sei f : [a, b] → R eine Funktion.
(1) f heißt monoton wachsend auf [a, b], wenn
f (x1 ) ≤ f (x2 )
für alle
59
x1 ≤ x2 .
(2) f heißt monoton fallend auf [a, b], wenn
f (x1 ) ≥ f (x2 )
für alle
x1 ≤ x2 .
(3) f besitzt in x0 ∈ (a, b) ein lokales Maximum, wenn
∃ε>0:
∀ x ∈ (x0 − ε, x0 + ε) :
f (x) ≤ f (x0 ).
(6.3)
f (x) ≥ f (x0 ).
(6.4)
(4) f besitzt in x0 ∈ (a, b) ein lokales Minimum, wenn
∃ε>0:
∀ x ∈ (x0 − ε, x0 + ε) :
(5) Ein Extremum ist ein Minimum oder Maximum. Ein Minimum oder Maximum wird
global genannt, wenn die Ungleichung (6.3) bzw. (6.4) für alle x ∈ [a, b] gilt.
(6) Ist f differenzierbar, so heißt ein Punkt x0 ∈ (a, b) mit f 0 (x0 ) = 0 kritischer Punkt.
Satz 6.17 Sei f (a, b) → R zweimal differenzierbar und x0 ∈ (a, b).
(1) Gilt f 0 (x) ≥ 0 (bzw. f 0 (x) ≤ 0) für alle x ∈ (a, b), so ist f monoton wachsend (bzw.
monoton fallend).
(2) Gilt f 0 (x0 ) = 0 und f 00 (x0 ) < 0 (oder f 00 (x0 ) > 0), so hat f in x0 ein lokales
Maximum (bzw. lokales Minimum).
(3) Die Funktion f sei n-mal differenzierbar, und es gelte f (i) (x0 ) = 0 für alle i =
1, . . . , n − 1 und f (n) (x0 ) 6= 0. Dann gilt:
• n gerade: f hat in x0 ein Extremum, und zwar ein lokales Maximum, wenn
f (n) (x0 ) < 0, bzw. ein lokales Minimum, wenn f (n) (x0 ) > 0;
• n ungerade: f hat in x0 kein Extremum.
Beispiel 6.18 Sei f (x) = x4 − 2x2 + 1 = (x2 − 1)2 , x ∈ R (siehe Abbildung 6.4 links).
Wir bestimmen alle Extrema von f . Aus
0 = f 0 (x) = 4x3 − 4x = 4x(x2 − 1) = 4x(x − 1)(x + 1)
folgt, daß x1 = 0, x2 = 1 und x3 = −1 Kandidaten für Extrema sind. Wir untersuchen
diese Punkte einzeln:
• x1 = 0: f 00 (x1 ) = 12x21 − 4 = −4 < 0 =⇒ f hat an x1 = 0 ein lokales Maximum.
• x2/3 = ±1: f 00 (x2/3 ) = 12x22/3 − 4 = 8 > 0 =⇒ f hat an x2/3 = ±1 ein lokales
Minimum.
60
replacemen
y
y
f (x)
−1
0
−1 − 4
x
1
5
f2 (x)
0
x
Abbildung 6.4: Graph der Funktion f (x) = x4 − 2x2 + 1 (links) und Graph der Funktion
f2 (x) = x5 + x4 (rechts).
(2) Sei f (x) = x−12 − ax−6 mit a > 0, x > 0. Die Funktion f ist ein Modell für das
Potential von Teilchen in der Nähe des Atomkerns mit Abstand x; sie wird auch LenardJones-Potential genannt. Der erste Summand x−12 beschreibt eine extrem kurzreichweitige
Abstoßung, während der zweite Summand ax−6 eine langreichweitige Anziehung modelliert. Alle kritischen Punkte von f sind gegeben durch
r
2
6a
6
12
6 2
0
.
0 = f (x) = − 13 + 7 = 7 − 6 + a =⇒ x = ±
x
x
x
x
a
p
Da der Abstand x positiv sein soll, kommt nur x0 = 6 2/a in Betracht. Wegen
6 2 · 13
6 a
12 · 13 6 · 7a
00
−
7a
>0
−
=
−
7a
=
26
f (x0 ) =
x14
x80
x80
x60
x80
2
0
liegt an der Stelle x0 ein lokales Minimum vor. Es folgt außerdem, daß f für x < x0
monoton fallend und für x > x0 monoton wachsend ist (siehe Abbildung 6.5).
(4) Die Van-der-Waals-Gleichung aus Beispiel 3.7 für den Druck p(V ) in Abhängigkeit
des Volumens V
a V > b und a, b > 0,
p(V ) + 2 (V − b) = RT,
V
kann nach p(V ) aufgelöst werden:
p(V ) =
a
RT
− 2,
V −b V
V > b.
Kritische Punkte erhalten wir aus der Gleichung
0 = p0 (V ) = −
RT
2a
+ 3
2
(V − b)
V
Abbildung 6.6 zeigt, daß diese Gleichung
61
⇐⇒
2a(V − b)2 = RT V 3 .
y
f (x)
x0
0
x
Abbildung 6.5: Graph der Funktion f (x) = x−12 − ax−6 , x > 0.
• keine Lösung besitzt, wenn T > Tkrit ;
• genau eine Lösung V0 besitzt, wenn T = Tkrit ;
• genau zwei Lösungen V1 und V2 besitzt, wenn T < Tkrit .
20
2
15
2a(V−b)
3
RTV mit T < Tkrit
3
RTV mit T > Tkrit
10
5
0
1
1.5
2
2.5
3
3.5
4
Abbildung 6.6: Graphische Lösung der Gleichung 2a(V − b)2 = RT V 3 für den Fall a =
b = R = 1. Man kann berechnen, daß hier Tkrit ≈ 0.29606.
Diese Beobachtung erlaubt es, das Monotonieverhalten von p(V ) zu beschreiben:
• T ≥ Tkrit : p0 (V ) ≤ 0 für alle V > b =⇒ p monoton fallend in (b, ∞);
62
• T < Tkrit : p ist monoton fallend in (b, V1 ) und (V2 , ∞) und monoton wachsend in
(V1 , V2 ).
Der Graph von p(V ) ist in Abbildung 6.7 skizziert. Es gibt eine Region, in der für
gegebenen Druck p drei verschiedene Volumina existieren, so daß die Van-der-WaalsGleichung erfült ist. Diese Region beschreibt die Koexistenz der flüssigen und gasförmigen
Phase.
p
T > Tkrit
Koexistenz
T = Tkrit
T < Tkrit
0
V
Abbildung 6.7: Graphen der Funktion p(V ) für verschiedene Temperaturen.
Eine Kurvendiskussion einer Funktion f sollte typischerweise die folgenden Punkte
enthalten:
(1) Bestimmung der Nullstellen von f ,
(2) Bestimmung der Monotonie von f ,
(3) Bestimmung der lokalen Minima und Maxima von f ,
(4) Bestimmung des Verhaltens für x → +∞ bzw. x → −∞, falls zutreffend,
(5) eine Skizze des Graphen von f .
6.5
Satz von Taylor
Differenzierbare Funktionen können oft durch Polynome angenähert werden. Diese Aussage wird im Satz von Taylor präzisiert.
Definition 6.19 Sei f : (a, b) → R (n + 1)-mal differenzierbar, und sei x0 ∈ (a, b). Dann
heißt das Polynom
n
X
f (k) (x0 )
(x − x0 )k ,
x ∈ R,
Tn (x) =
k!
k=0
das Taylor-Polynom n-ten Grades von f um x0 .
63
Satz 6.20 (Taylor)
Sei f : (a, b) → R (n + 1)-mal stetig differenzierbar (d.h., f ist (n + 1)-mal differenzierbar
und f (n+1) ist stetig) und seien x0 , x ∈ (a, b). Dann existiert ein ξ zwischen x0 und x, so
daß
f (x) = Tn (x) + Rn+1 (x),
(6.5)
wobei
Rn+1 (x) =
f (n+1) (ξ)
(x − x0 )n+1 .
(n + 1)!
(6.6)
Man nennt (6.5) die Taylor-Formel und (6.6) das Lagrange-Restglied. Der Punkt x0
wird auch Entwicklungspunkt genannt. Im Falle n = 0 erhalten wir:
f (x) = T0 (x) + R1 (x) = f (x0 ) + f 0 (ξ)(x − x0 ).
(6.7)
Man nennt diese Beziehung Mittelwertsatz. Er hat eine einfache geometrische Interpretation (siehe Abbildung 6.8). Schreiben wir (6.7) als
f (x) − f (x0 )
= f 0 (ξ)
x − x0
für x 6= x0 , so lautet die Aussage des Mittelwertsatzes, daß es einen Punkt ξ gibt, an dem
die Steigung der Tangente an den Graphen von f (nämlich f 0 (ξ)) gleich der Steigung der
Sekante durch x und x0 ist.
y
Sekante
Tangente
x
x0
ξ
x
Abbildung 6.8: Geometrische Veranschaulichung des Mittelwertsatzes (6.7).
Beispiel 6.21 Sei f (x) = ex , x ∈ R. Wir wählen den Entwicklungspunkt x0 = 0. Die
Funktion f ist unendlich oft differenzierbar mit
f (0) = 1,
f 0 (0) = 1,
64
f 00 (0) = 1
usw.
Aus dem Satz 6.20 von Taylor folgt, daß es zu x ∈ R ein ξ zwischen 0 und x gibt, so daß
f (x) = ex =
n
X
1 k
eξ
x +
xn+1 .
k!
(n
+
1)!
k=0
Die Exponentialfunktion wird also durch das Polynom
n
X
1
1
1
1 k
x = 1 + x + x2 + x3 + . . . + xn
k!
2
6
n!
k=0
approximiert. Der Fehler der Approximation wird gerade durch das Lagrange-Restglied
gegeben. Für |x| ≤ 1 erhalten wir wegen |ξ| ≤ |x| ≤ 1
|Rn+1 (x)| =
eξ
e
|x|n+1 ≤
.
(n + 1)!
(n + 1)!
Wollen wir ex auf dem Intervall [−1, 1] durch das Polynom bis auf einen Fehler von 10−3
approximieren, so muß n ∈ N so groß gewählt werden, daß
e
≤ 10−3 .
(n + 1)!
Wir erhalten n = 6, denn e/7! ≈ 5 · 10−4 , aber e/6! ≈ 4 · 10−3 . Wir haben gezeigt:
6
x X 1 k
x ≤ 10−3
für alle |x| ≤ 1.
e −
k! k=0
Die obigen Beispiele legen nahe, den Grenzwert n → ∞ zu versuchen und die Gleichung
f (x) =
∞
X
f (k) (x0 )
k=0
k!
(x − x0 )k
(6.8)
für eine unendlich oft differenzierbare Funktion zu folgern. Gilt die Formel (6.8)?
2
Im allgemeinen nein! Sei beispielsweise f (x) = e−1/x für x 6= 0 und f (x) = 0 für
x = 0. Die Funktion f ist für x 6= 0 unendlich oft differenzierbar:
2 −1/x2
e
,
x3
4
6
2
00
f (x) =
− 4 + 6 e−1/x
x
x
24 24 12
8
2
000
f (x) =
− 7 − 7 + 9 e−1/x
5
x
x
x
x
f 0 (x) =
65
usw.
Man kann allgemein zeigen, daß
1 −1/x2
(k)
f (x) = p
e
x
für ein geeignetes Polynom p und x 6= 0
gilt. Es gilt nach der Regel von de l’Hospital für alle Polynome p:
1 −1/x2
lim p
e
= 0.
x→0
x
Wir können also die k-te Ableitung von f in x = 0 fortsetzen, so da f (k) stetig ist:
(
2
p( x1 )e−1/x : x 6= 0
(k)
f (x) =
0
: x = 0.
Aus dem Satz von Taylor folgt
f (x) = Tn (x) + Rn+1 (x)
mit Tn (x) =
n
X
f (k) (0)
k=0
Also ist
f (x) 6=
∞
X
f (k) (0)
k=0
k!
=0
k!
xk = 0.
für alle x 6= 0.
Unter welchen Bedingungen gilt nun die Formel (6.8) dennoch? Wir vermuten wegen (6.5):
wenn Rn+1 (x) → 0 für n → ∞. Die Vermutung ist richtig, wie der folgende Satz zeigt.
Satz 6.22 Sei f : (a, b) → R unendlich oft differenzierbar und sei x0 ∈ (a, b). Dann gilt
f (x) =
∞
X
f (k) (x0 )
k=0
k!
(x − x0 )k
für alle
x ∈ (a, b)
genau dann, wenn Rn (x) → 0 (n → ∞). Dies ist der Fall, wenn
∃ α, C > 0 :
∀ x ∈ (a, b), k ∈ N :
|f (k) (x)| ≤ αC k .
Man nennt die unendliche Reihe aus Satz 6.22 die Taylor-Reihe von f . Beachten Sie:
• Die Taylor-Reihe muß im allgemeinen nicht konvergieren!
• Falls die Taylor-Reihe von f konvergiert, so konvergiert sie nicht immer gegen f !
Unter den Voraussetzungen von Satz 6.22 konvergiert natürlich die Taylor-Reihe von f ,
und zwar gegen f .
66
Beispiel 6.23 Sei wie in Beispiel 6.21 (1) f (x) = ex , x ∈ R, und x0 = 0. Dann gilt
|Rn+1 (x)| =
eξ
|x|n+1 → 0
(n + 1)!
d.h.
ex =
∞
X
1 k
x ,
k!
k=0
für n → ∞,
x ∈ R.
Insbesondere erhalten wir die Formel
∞
X
1
1
1
1
e=
= 1 + 1 + + + + ...,
k!
2! 3! 4!
k=0
(6.9)
die schneller konvergiert als die Folge (1 + 1/n)n mit
n
1
.
e = lim 1 +
n→∞
n
Eine andere interessante Folgerung aus (6.9) ist
!α
∞
∞
X
X
1
1 k
α
=e =
α
k!
k!
k=0
k=0
6.6
für α ∈ R.
Lineare Regression
In diesem Abschnitt präsentieren wir eine Anwendung der Differentiation, nämlich die
lineare Regression oder Methode der kleinsten Quadrate.
Der Druck p eines in einem Behälter mit Volumen V befindlichen Gases werde für
verschiedene Temperaturen gemessen. Nach dem idealen Gasgesetz pV = nRT (n Zahl
an Molen eines Gases) erwarten wir einen linearen Zusammenhang zwischen Druck und
Temperatur. Die Berechnung der Steigung der Geraden p = p(T ) erlaubt die Bestimmung der Gaskonstanten R. Allerdings werden die Meßwerte nicht alle auf einer Geraden
liegen; das Problem lautet, die mit Fehlern behafteten Meßdaten durch eine Gerade zu
approximieren. Eine Idee ist durch die Methode der kleinsten Quadrate gegeben.
Seien
(x1 , y1 ), . . . , (xm , ym )
m Meßwertpaare (z.B. xi = Temperatur, yi = Druck) gegeben. Wir suchen die Koeffizienten a0 und a1 der Geraden
g(x) = a0 + a1 x,
so daß der quadratische Abstand zwischen den Meßwerten yi und den Punkten g(xi ) auf
der Geraden minimiert wird (siehe Abbildung 6.9): Minimiere
F (a0 , a1 ) =
m
X
i=1
(g(xi ) − yi )2 =
67
m
X
i=1
(a0 + a1 xi − yi )2 .
y
Meßwerte
(xi , yi )
Ausgleichsgerade g(x)
x1 x2
x3
x
x4
Abbildung 6.9: Meßwertpaare und Ausgleichsgerade.
Zur Minimierung von F : R2 → R bestimmen wir gemäß Abschnitt 6.4 die kritischen
Punkte, d.h., wir differenzieren F nach a0 und nach a1 und setzen die Ableitungen gleich
Null. Wir führen hierfür die Funktionen
F1 (a0 ) = F (a0 , a1 )
(a1 fest gehalten) und
F2 (a1 ) = F (a0 , a1 )
(a0 fest gehalten)
ein. Wir erhalten:
0 = F10 (a0 ) = 2
m
X
i=1
0 = F20 (aa ) = 2
m
X
i=1
also
ma0 +
m
X
i=1
m
X
xi
i=1
!
x i a0 +
(a0 + a1 xi − yi ),
m
X
x2i
i=1
(a0 + a1 xi − yi )xi ,
!
!
m
X
a1 =
yi ,
i=1
m
X
a1 =
xi yi .
i=1
Dies ist ein lineares Gleichungssystem für die beiden Variablen a0 und a1 mit Lösung
P
P P
P P 2 P P
m xi yi − xi yi
yi xi − xi xi yi
P
P
P
P
,
a1 =
.
(6.10)
a0 =
m x2i − ( xi )2
m x2i − ( xi )2
Die Lösung existiert genau dann, wenn
m
m
X
i=1
x2i 6=
68
m
X
i=1
xi
!2
.
Dies ist der Fall, wenn m ≥ 2 (mindestens zwei Meßwerte) und es mindestens zwei Werte
xi 6= xj gibt.
Beispiel 6.24 Der Druck eines idealen Gases in einem Behälter mit festem Volumen
werde für verschiedene Temperaturen gemessen. Die m = 5 Meßwerte lauten:
Temperatur xi in K
Druck yi in N/m2
300
235
350
290
400
335
450
360
500
415
Wir nehmen weiter an, daß der Behälter n = 10−4 mol des Gases enthalte und daß das
Volumen V = 10−3 m3 betrage. Dann ist nach dem idealen Gasgesetz
mol
nR
T = 0.1R 3 T.
p(T ) =
V
m
Der Achsenabschnitt a0 und die Steigung der Ausgleichsgeraden lauten gemäß (6.10)
a0 = −17 [N/m2 ],
a1 = 0.860 [N/m2 K]
(siehe Abbildung 6.10). Damit erhalten wir aus
p(300 K) = 30R
mol K
N
N
N
≈ 0, 86 · 300 2 − 17 2 = 241 2
3
m
m
m
m
eine Approximation der Gaskonstanten
R≈
241 Nm
Nm
≈ 8, 03
.
30 mol K
mol K
Der Literaturwert lautet R = 8, 314 Nm/(mol K). Die Abweichung liegt mit einem relativen Fehler von (8, 03 − 8, 314)/8, 314 ≈ 3, 4% innerhalb der zu erwartenden Meßgenauigkeit.
69
450
Druck in N/m2
400
Steigung der
Ausgleichsgeraden = 0.860
350
300
250
200
300
350
400
450
500
Temperatur in K
Abbildung 6.10: Meßwerte aus Beispiel 6.24 und zugehörige Ausgleichswerte.
70
7
7.1
Integration
Das bestimmte Integral
In Beispiel 1.2 haben wir gesehen, daß die Menge N (t) einer radioaktiven Substanz die
Gleichung
N 0 (t) = −αN (t)
mit α > 0, t > 0
erfüllt. Um derartige Differentialgleichungen nach N (t) “auflösen” zu können, benötigen
wir die “Umkehroperation” zur Differentiation. Interessanterweise wird diese durch das
Integral gegeben, das mit der Fläche unter einer Kurve zusammenhängt.
Wir wollen also die Fläche zwischen einer Kurve y = f (x) und der x-Achse in [a, b]
berechnen. Dazu approximieren wir die Fläche durch Rechtecke (siehe Abbildung 7.1).
Wir zerlegen das Intervall [a, b] in n Teilintervalle, indem wir die Punkte a = x0 < x1 <
. . . < xn = b bzw. die Zerlegung Z = {x0 , x1 , . . . , xn } einführen, und wählen in jedem
Teilintervall eine Zwischenstelle ξi ∈ [xi−1 , xi ], i = 1, . . . , n. Die Riemann-Summe
S(Z) =
n
X
i=1
f (ξi )(xi − xi−i )
ist dann eine Näherung an die Fläche zwischen der Kurve und der x-Achse. Wir erwarten,
daß die Näherung umso besser wird, je feiner die Zerlegung gewählt wird.
f (x)
y
111111
000000
000000
111111
000000
111111
000000
111111
0000
1111
000000
111111
0000
1111
000000
111111
0000
1111
000000
111111
0000
1111
00000
11111
000000
0000
1111
00000111111
11111
000000
111111
0000
1111
00000
11111
000000
111111
0000
1111
00000
11111
0000
1111
000000
111111
0000
1111
00000
11111
0000
1111
000000
111111
0000
1111
00000
11111
0000
1111
000000
111111
0000
1111
00000111111
11111
0000
1111
000000
0000
1111
00000
11111
0000
1111
000000
111111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000111111
11111
0000
1111
000000
111111
000000
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
00000
11111
0000
1111
00000111111
11111
0000
1111
000000
111111
a
ξ1
x1
ξ2
x2
ξ3
x3
ξ4
x4
x5
b
ξ5 ξ6
Abbildung 7.1: Zur Definition der Riemann-Summe.
Definition 7.1 Sei f : [a, b] → R eine Funktion. Wenn
71
x
(1) für jede Zerlegung Z von [a, b] mit max{xi − xi−1 : i = 1, . . . , n} → 0 (n → ∞) und
(2) für jede Wahl von Zwischenstellen ξi ∈ [xi−1 , xi ], i = 1, . . . , n,
der Grenzwert F = limn→∞ S(Z) existiert und stets denselben Wert liefert, so heißt f
(Riemann-)integrierbar in [a, b] und F heißt das bestimmte Integral von f in [a, b]. Wir
schreiben kurz:
Z b
n
X
f (x) dx.
f (ξi )(xi − xi−1 ) =
lim
n→∞
a
i=1
Satz 7.2 (1) Sei f : [a, b] → R stetig. Dann ist f integrierbar.
(2) Sei f : [a, b] → R integrierbar. Dann ist
Z
b
f (x) dx = (Fläche oberhalb x-Achse)−(Fläche unterhalb x-Achse),
a
siehe Abbildung 7.2.
y
+
0
+
a
−
b
x
Abbildung 7.2: Veranschaulichung von Satz 7.2 (2).
Beispiel 7.3 (1) Die Funktion f (x) = 1/x ist für x > 0 stetig, also insbesondere auf
[1, 2] integrierbar. Um das Integral
Z 2
dx
x
1
zu berechnen, wählen wir
• Zerlegung Z: xi = 2i/n , i = 0, . . . , n,
72
• Zwischenstellen: ξi = xi−1 = 2(i−1)/n , i = 1, . . . , n.
Die Riemann-Summe lautet
n
n
n
X
X
X
S(Z) =
f (ξi )(xi −xi−1 ) =
2−(i−1)/n 2i/n − 2(i−1)/n =
21/n − 1 = n(21/n −1).
i=1
i=1
i=1
Wir erhalten mit der Regel von de l’Hospital
2x − 1
ex ln 2 − 1
ln 2 · ex ln 2
21/n − 1
= lim
= lim
= lim
= ln 2.
x→0
x→0
x→0
n→∞
1/n
x
x
1
lim S(Z) = lim
n→∞
Man kann zeigen, daß man diesen Grenzwert für jede Zerlegung und jede Wahl von Zwischenstellen erhält. Daher gilt
Z 2
dx
= ln 2.
x
1
(2) Wir behaupten, daß die Funktion
(
1 : x ∈ Q ∩ [0, 1]
f (x) =
0 : x ∈ (R\Q) ∩ [0, 1]
nicht integrierbar ist. Sei Z = {x0 , . . . , xn } eine beliebige Zerlegung und wähle
• ξi ∈ [xi−1 , xi ] mit ξi ∈ Q (i = 1, . . . , n),
• ηi ∈ [xi−1 , xi ] mit ξi ∈ R\Q (i = 1, . . . , n).
Wir erhalten
Sξ (Z) =
Sη (Z) =
n
X
i=1
n
X
i=1
f (ξi )(xi − xi−1 ) =
n
X
i=1
(xi − xi−1 ) = 1,
f (ηi )(xi − xi−1 ) = 0.
Wählen wir die Zerlegung immer feiner und die Zwischenwerte wie oben, so folgt
lim Sξ (Z) = 1 6= 0 = lim Sη (Z),
n→∞
n→∞
d.h., f ist nicht integrierbar.
Es gelten die folgenden Rechenregeln.
Satz 7.4 Seien f und g auf [a, b] integrierbar. Dann gilt:
Rb
Rb
Rb
(1) a (αf (x) + βg(x)) dx = α a f (x) dx + β a g(x) dx für alle α, β ∈ R.
Rb
Rc
Rb
(2) a f (x) dx = a f (x) dx + c f (x) dx für alle c ∈ [a, b].
Ra
Rb
Ra
(3) a f (x) dx = 0 und a f (x) dx = − b f (x) dx.
Rb
Rb
(4) | a f (x) dx| ≤ a |f (x)| dx.
73
7.2
Zusammenhang zwischen Differentiation und Integration
Definition 7.5 Sei f : [a, b] → R eine Funktion. Eine Funktion F : [a, b] → R heißt
Stammfunktion von f genau dann, wenn F differenzierbar ist und
F 0 (x) = f (x)
für alle x ∈ [a, b]
gilt. Man nennt F auch ein unbestimmtes Integral von f und schreibt
Z
F (x) = f (x) dx.
(7.1)
Die Notation (7.1) ist etwas mißverständlich: Sind nämlich F und G zwei Stammfunktionen von f , so folgt aus (F − G)0 = F 0 − G0 = f − f = 0 in [a, b], daß F − G =
const. in [a, b] gelten muß. In der Notation (7.1) ist also die Integrationskonstante stets
mit aufgeführt!
Einige Stammfunktionen lauten (mit c ∈ R):
R
f (x)
xα (α 6= −1)
f (x) dx
1
xα+1
α+1
1
x
ex
sin x
cos x
+ c ln |x| + c ex + c − cos x + c sin x + c
Ist f : [a, b] → R eine stetige Funktion, so können wir für beliebiges x0 ∈ [a, b] mit
Z x
F (x) =
f (t) dt,
x ∈ [a, b],
(7.2)
x0
eine Stammfunktion konstruieren, was den Zusammenhang zwischen bestimmten und
unbestimmten Integralen aufweist. Es gilt:
Satz 7.6 Sei f : [a, b] → R stetig, x0 ∈ [a, b]. Dann ist F , definiert in (7.2), differenzierbar und F 0 = f , d.h., F ist eine Stammfunktion von f .
Den Zusammenhang zwischen der Differentiation und Integration stellt der folgende
Satz her:
Satz 7.7 (Hauptsatz der Differential- und Integralrechnung)
Sei f : [a, b] → R stetig und F eine Stammfunktion von f . Dann gilt
Z b
f (x) dx = [F (x)]ba = F (b) − F (a).
a
Der Hauptsatz zeigt, daß Differentiation und Integration sich im folgenden Sinne wie
“Operation” und “Umkehroperation” verhalten. Sei f : [a, b] → R stetig und F eine
(differenzierbare) Stammfunktion von f . Dann gilt nach Satz 7.6
Z
Z x
d
dF
dF
d
(x) = f (x)
oder
(x) = f (x)
f (x) dx =
f (t) dt =
dx
dx
dx x0
dx
74
und nach Satz 7.7
Z
a
b
dF
(x) = F (b) − F (a).
dx
Beispiel 7.8 Die Fläche zwischen der Sinuskurve und der x-Achse in [0, π] lautet
Z π
sin x dx = − cos π − (− cos 0) = 1 + 1 = 2,
0
denn − cos x ist eine Stammfunktion zu sin x. Das Integral
Z 2π
sin x dx = − cos(2π) − (− cos 0) = −1 + 1 = 0
0
verschwindet dagegen, da die Fläche unterhalb der x-Achse mit negativem Vorzeichen
versehen wird (siehe Abbildung 7.2).
Beispiel 7.9 Mit Hilfe von Satz 7.7 können wir auch Werte von unendlichen Reihen
berechnen. Wir zeigen, daß
∞
X
αn
n=1
n
= − ln(1 − α)
gilt. Definiere dazu
f (x) =
für alle |α| < 1
(7.3)
∞
X
xk+1
=
.
n
k+1
k=0
∞
X
xn
n=1
Man kann zeigen, daß f für |x| < 1 differenzierbar ist und daß folgt
∞
∞
X
X
d xk+1
f (x) =
=
xk ,
dx
k
+
1
k=0
k=0
0
|x| < 1.
Das ist aber gerade die geometrische Reihe, so daß f 0 (x) = 1/(1−x). Aus Satz 7.7 erhalten
wir
Z x
Z x
h
ix
dt
0
= − ln(1 − t) = − ln(1 − x).
f (x) = f (x) − f (0) =
f (t) dt =
0
0
0 1−t
Setzen wir x = α, so ist (7.3) bewiesen.
7.3
Integrationsmethoden
Wir stellen zwei Integrationsmethoden vor:
• Partielle Integration: Seien f, g : [a, b] → R stetig differenzierbar. Dann ist
Z b
Z b
b
0
f 0 (x)g(x) dx.
f (x)g (x) dx = f (x)g(x) a −
a
a
75
• Substitution: Sei f : [a, b] → R stetig und g : [c, d] → [a, b] stetig differenzierbar.
Dann ist
Z d
Z g(d)
0
f (g(t))g (t) dt =
f (x) dx.
c
g(c)
Beispiel 7.10 (Partielle Integration)
R
(1) Berechne x sin x dx. Wir setzen f (x) = x und g 0 (x) = sin x. Dann ist f 0 (x) = 1,
g(x) = − cos x und
Z
Z
x sin x dx = x · (− cos x) − 1 · (− cos x) dx = −x cos x + sin x + c.
Rπ
(2) Berechne 0 sin2 x dx. Wir setzen f (x) = sin x und g 0 (x) = sin x, also
Z π
Z π
h
iπ Z π
2
sin x dx = sin x(− cos x) −
cos2 x dx.
cos x(− cos x) dx =
0
0
0
0
Wir könnten noch einmal partiell integrieren:
Z π
Z π
h
iπ Z
2
2
cos x dx = cos x · sin x +
sin x dx =
0
0
0
π
2
sin x dx =
0
Z
π
sin2 x dx,
0
doch dies führt nicht weiter. Wir benutzen anstelle dessen die Relation cos2 x = 1 − sin2 x.
Dann folgt
Z
Z
Z
π
π
π
sin2 x dx =
dx −
0
0
und daher
Z
π
sin2 x dx =
0
sin2 x dx
0
π
.
2
R
(3) Wie in (2) können wir das unbestimmte Integral sin2 x dx berechnen:
Z
Z
Z
2
2
sin x dx = − sin x cos x + cos x dx = − sin x cos x + (1 − sin2 x) dx
Z
= − sin x cos x + x − sin2 x dx,
also
Z
1
sin2 x dx = (x − sin x cos x).
2
(7.4)
Die Substitutionsregel kann in der Praxis folgendermaßen verwendet werden. In dem
Rb
= x0 (t), also kann man “dx”
Integral a f (x) dx substituiert man x = x(t). Dann ist dx
dt
durch “x0 (t)dt” beim Übergang von der x- zur t-Variablen ersetzen. Falls x(α) = a und
x(β) = b, so erhält man
Z b
Z β
f (x) dx =
f (x(t))x0 (t) dt.
a
α
76
Beispiel 7.11 (Substitution)
R1
(1) Berechne 0 (1 + 2x)10 dx. Wir setzen t = 1 + 2x. Dann ist x(t) = x = 12 (t − 1), also
dx
= 12 , und aus 0 ≤ x ≤ 1 folgt 1 ≤ t ≤ 3. Damit ergibt sich
dt
Z
1
10
(1 + 2x) dx =
Z
1
0
R√
3
1
1 1 11 3
177146
1
t 1 = (311 − 1) =
.
t10 dt =
2
2 11
22
22
(2) Berechne
1 − x2 dx. Wir substituieren x = cos t. Dann erhalten wir dx
= − sin t
dt
und wegen (7.4)
Z √
Z √
Z
1
2
2
1 − x dx =
1 − cos t (− sin t) dt = − sin2 t dt = − (t − sin t cos t) + c.
2
√
√
Rücksubstitution t = arccos x und sin t = 1 − cos2 t = 1 − x2 ergeben
Z √
1 √
2
2
x 1 − x − arccos x + c.
1 − x dx =
2
Das bestimmte Integral
Z
0
1
√
1 − x2 dx
ist gerade der Flächeninhalt des Viertelkreises mit Radius r = 1. Wir erhalten
Z 1√
1
1
1
1 √
2
2
x 1 − x − arccos x
1 − x dx =
= − arccos 1 + arccos 0
2
2
2
0
0
1
1 π
π
= − ·0+ · = .
2
2 2
4
Dies stimmt mit der Formel für den Flächeninhalt πr2 /4 = π/4 überein.
Für einige Integrale gibt es Standardsubstitutionen, die zuweilen auf einfachere Integrale führen. Im folgenden geben wir einige Beispiele. Sei hierfür R(α, v, w, . . .) eine
rationale Funktion in den angegebenen Variablen.
R
• Typ R(cos x) sin x dx. Substituiere t = cos x;
R
• Typ R(sin x) cos x dx. Substituiere t = sin x;
R
• Typ R(sin x, cos x) dx. Substituiere t = tan x2 ;
√
R
• Typ R(x, x2 + a2 ) dx. Substituiere x = a sinh t;
√
R
• Typ R(x, x2 − a2 ) dx. Substituiere x = a cosh t;
√
R
• Typ R(x, a2 − x2 ) dx. Substituiere x = a sin t;
77
Beispiel 7.12 (Standardsubstitutionen)
R π/2 cos3 x
(1) Berechne 0 1−sin
dx. Wegen
x
Z π/2
1 − sin2 x
cos3 x
dx =
cos x dx
1 − sin x
1 − sin x
0
0
R
2
. Wir substituieren also
ist das Integral vom Typ R(sin x) cos x dx mit R(u) = 1−u
1−u
π
dt
t = sin x, Dann ist dx = cos x, und 0 ≤ x ≤ 2 impliziert 0 ≤ t ≤ 1:
Z
Z
π/2
0
π/2
cos3 x
dx =
1 − sin x
Z
1
0
1 − t2
dt =
1−t
(2) Das Integral
Z
Z
1
0
(1 − t)(1 + t)
dt =
1−t
Z
0
1
3
(1 + t) dt = .
2
sin2 x
dx
(1 + sin x + cos x)3
R
ist vom Typ R(sin x, cos x) dx, so daß wir t = tan(x/2) substituieren. Dann folgt aus x =
2
2
2
= 1+t
2 arctan t zum einen dx
2 und mit den Additionstheoremen cos(2α) = cos α − sin α
dt
und sin(2α) = 2 sin α cos α zum anderen
1−
1 − t2
=
1 + t2
1+
sin2 (x/2)
cos2 (x/2)
sin2 (x/2)
cos2 (x/2)
cos2 (x/2) − sin2 (x/2)
=
= cos x,
cos2 (x/2) + sin2 (x/2)
sin(x/2)
2 cos(x/2)
2 cos(x/2) sin(x/2)
2t
= sin x
=
2 (x/2) =
2
sin
1+t
cos2 (x/2) + sin2 (x/2)
1 + cos2 (x/2)
Wir erhalten
1 + sin x + cos x =
und daher
Z
sin2 x
dx =
(1 + sin x + cos x)3
Z 1 + t2 + 2t + 1 − t2
2(1 + t)
=
2
1+t
1 + t2
2t
1 + t2
2 1 + t2
2(1 + t)
3
2dt
=
1 + t2
Z
t2
dt.
(1 + t)3
(7.5)
Wie kann man nun das Integral über eine rationale Funktion berechnen? Wir verschieben
die Integration von (7.5) auf Beispiel 7.13 und betrachten allgemein Integrale rationaler
Funktionen.
Die Aufgabe lautet, für gegebene Polynome P (x) und Q(x) das Integral
Z
P (x)
dx
Q(x)
zu berechnen. Dabei gehen wir wie folgt vor:
78
• 1. Schritt: Führe Polynomdivision durch, falls Grad P ≥ Grad Q (“Grad” sei der
Grad eines Polynoms):
R(x)
P (x)
= P1 (x) +
,
Q(x)
Q(x)
wobei P1 und R Polynome sind mit Grad R < Grad Q. Das Integral über P1 ist
leicht zu berechnen.
• 2. Schritt: Bestimme alle Nullstellen von Q und zerlege Q in Faktoren der Form
(x − a)m und ((x − a)2 + b2 )n .
• 3. Schritt: Führe Partialbruchzerlegung durch. Verwende dazu für den Faktor in Q:
(x − a)m
den Ansatz
A1
Am
+ ··· +
x−a
(x − a)m
und für
((x − a)2 + b2 )n
den Ansatz
An x + Bn
A1 x + B1
+ ··· +
.
2
2
(x − a) + b
((x − a)2 + b2 )n
Die Koeffizienten Ai und Bi werden wie in Abschnitt 3.2 durch Koeffizientenvergleich
bestimmt.
• 4. Schritt: Schließlich können
die Formeln
Z
dx
=
x−a
Z
dx
=
(x − a)m
Z
Ax + B
dx =
(x − a)2 + b2
die Partialbrüche integriert werden. Verwende hierzu
ln |x − a| + c,
1
1
+c
(m ≥ 2),
m − 1 (x − a)m−1
Aa + b
x−a
A
ln |(x − a)2 + b2 | +
arctan
+ c.
2
2
b
−
Für Integrale mit dem Nenner ((x − a2 ) + b2 )n mit n ≥ 2 kann man mit partieller
Integration eine Rekursionsformel herleiten, die wir hier jedoch nicht angeben.
Beispiel 7.13 (Partialbruchzerlegung)
Wir setzen Beispiel 7.12 (2) fort und berechnen
Z
t2
dt.
(1 + t)3
Der erste Schritt entfällt, da Grad (t2 ) = 2 < 3 = Grad ((1 + t)3 ). Das Nennerpolynom
ist bereits in Faktoren aufgelöst. Wir führen nun eine Partialbruchzerlegung (3. Schritt)
durch und machen den Ansatz
A1
A2
A3
t2
=
+
+
.
(1 + t)3
1 + t (1 + t)2 (1 + t)3
79
Multiplikation mit (1 + t)3 führt auf
t2 = (1 + t)2 A1 + (1 + t)A2 + A3 = A1 t2 + (2A1 + A2 )t + (A1 + A2 + A3 ).
Koeffizientenvergleich ergibt
A1 = 1,
2A1 + A2 = 0,
A1 + A2 + A3 = 0,
Also A2 = −2, A3 = 1. Folglich ist
1
2
1
t2
=
−
+
.
3
2
(1 + t)
1 + t (1 + t)
(1 + t)3
Damit ist (4. Schritt)
Z
Z
Z
Z
t2
dt
dt
dt
2
1
dt
=
−
2
+
=
ln
|1
+
t|
+
−
(1 + t)3
1+t
(1 + t)2
(1 + t)3
1 + t 2(1 + t)2
4t + 3
= ln |1 + t| +
.
2(1 + t)2
Das Integral aus Beispiel 7.12 (2) ist also gelöst:
Z
4t + 3
x
4 tan(x/2) + 3
sin2 x
dx = ln |1 + t| +
= ln |1 + tan | +
.
3
2
(1 + sin x + cos x)
2(1 + t)
2
2(1 + tan(x/2))2
Das Integral
Z
e−x
2 /2
dx
besitzt keine durch elementare Funktionen ausdrückbare Stammfunktion. Das bestimmte
Integral
Z
∞
e−x
2 /2
dx
−∞
muß also numerisch bestimmt werden. Doch was bedeutet der unbeschränkte Integrationsbereich? Wir definieren einfach
Z ∞
Z R
2
−x2 /2
e
dx = lim
e−x /2 dx
−∞
R→∞
−R
und betrachten zunächst das Integral über [−R, R]. Eine Möglichkeit ist es, das Integral
wie in Abbildung 7.3 durch die eingezeichneten Trapeze zu approximieren. Sei dafür −R =
x−n < x−n+1 < . . . < xn = R eine Zerlegung des Intervalls [−R, R]. Dann ist
Z R
n
X
1 −x2k /2
2
−x2 /2
+ e−xk−1 /2 (xk − xk−1 ).
e
e
dx ≈
2
−R
k=−n+1
Man nennt dies die Trapezregel. Wir wählen nun speziell xk = k und bezeichnen mit
an die obige Summe. Dann erhalten wir die folgende Tabelle:
80
y
0
xk−1
Abbildung 7.3: Zur Approximation von
n
3
5
7
9
11
Wir vermuten, daß
Z
xk
R∞
−∞
x
e−x
2 /2
dx.
an
2.49484088243673
2.50662453088395
2.50662828801998
2.50662828804291
2.50662828804291
∞
e−x
−∞
2 /2
dx ≈ 2.50662828804291.
Wie genau ist dieser Wert? Wir haben zwei Arten von Fehlern zu berücksichtigen. Zum
einen haben wir das Integral über (−∞, −n) und (n, ∞) vernachlässigt; dieser Fehler wird
immer kleiner, wenn wir n groß genug wählen. Allerdings approximieren die Trapeze über
(−1, 0) und (0, 1) das Integral mit einem Fehler, der nicht kleiner wird, wenn n → ∞.
Tatsächlich ist der oben gerechnete Wert nur bis auf sechs Nachkommastellen genau; man
kann nämlich zeigen, daß
Z
∞
−∞
e−x
2 /2
dx =
√
2π ≈ 2.50662827463100.
81
Herunterladen