Mathematik für ChemikerInnen I

Mathematik für ChemikerInnen I
Prof. Dr. Ansgar Jüngel
Institut für Mathematik
Johannes Gutenberg-Universität Mainz
Winter 2006
unkorrigiertes Vorlesungsskript
Inhaltsverzeichnis
1 Motivation
2 Grundbegriffe
2.1 Mengen . . . . . . .
2.2 Reelle Zahlen . . . .
2.3 Binomialkoeffizienten
2.4 Komplexe Zahlen . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
6
8
10
3 Funktionen
15
3.1 Funktionen und ihre Inverse . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 Rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.3 Elementare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4 Vektoren und Matrizen
4.1 Vektoren . . . . . . . . . . . . . . . . . . .
4.2 Matrizen . . . . . . . . . . . . . . . . . . .
4.3 Der Gauß-Algorithmus . . . . . . . . . . .
4.4 Determinanten . . . . . . . . . . . . . . .
4.5 Lineare Unabhängigkeit . . . . . . . . . .
4.6 Lösungstheorie linearer Gleichungssysteme
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
22
22
25
30
33
36
38
5 Folgen und Reihen
41
5.1 Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.2 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1
6 Differentiation
6.1 Stetigkeit . . . . .
6.2 Die Ableitung . . .
6.3 Rechenregeln . . .
6.4 Kurvendiskussion .
6.5 Satz von Taylor . .
6.6 Lineare Regression
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
50
50
51
53
59
63
67
7 Integration
71
7.1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
7.2 Zusammenhang zwischen Differentiation und Integration . . . . . . . . . . 74
7.3 Integrationsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2
1
Motivation
In diesem Kapitel verdeutlichen wir anhand von Beispielen, daß die Sprache und die
Methoden der Mathematik für das Studium chemischer Prozesse und Fragestellungen ein
unentbehrliches Handwerkszeug darstellen.
Beispiel 1.1 (Zerfall von Kaliumdichromat)
Wird Kaliumdichromat K2 Cr2 O7 auf über 500◦ C erhitzt, zerfällt es in Kaliumchromat
K2 CrO4 , Chromoxid Cr2 O3 und Sauerstoff O2 . Die Reaktionsgleichung lautet
x1 K2 Cr2 O7 → x2 K2 CrO4 + x3 Cr2 O3 + x4 O2 .
Wir suchen Zahlen x1 , x2 , x3 , x4 , die diese Gleichung erfüllen. Natürlich sollte die Lösung
ganzzahlig (und positiv) sein. Die linke Seite benötigt 2 · x1 Kaliumatome (x1 K2 ), die
rechte Seite 2 · x2 Kaliumatome (x2 K2 ), d.h. 2x1 = 2x2 . Analog gilt 2x1 = x2 + 2x3 für
die Bilanz der Chromatome und 7x1 = 4x2 + 3x3 + 2x4 für die der Sauerstoffatome. Die
Zahlen x1 , x2 , x3 , x4 erfüllen also das Gleichungssystem
2x1 − 2x2
= 0,
2x1 − x2 − 2x3
= 0,
7x1 − 4x2 − 3x3 − 2x4 = 0.
(1.1)
Man kann dieses System auch abkürzend durch Auflistung der Koeffizienten der linken
Seite und der Komponenten der rechten Seite durch


 
2 −2 0
0
0


 
und
(1.2)
2 −1 −2 0 
0
7 −4 −3 −2
0
formulieren. Wir nennen das erste Objekt Matrix und das zweite Objekt Vektor. In Kapitel
4 werden wir uns mit der Matrizen- und Vektorrechnung befassen und den Gaußschen
Algorithmus zum Lösen linearer Gleichungssysteme kennenlernen.
Beispiel 1.2 (Radioaktiver Zerfall)
Eine radioaktive Substanz zerfalle im Laufe der Zeit. Wieviel Substanz ist zur Zeit t
vorhanden?
Sei N (t) die Menge der radioaktiven Substanz zur Zeit t. Aus der Physik ist bekannt,
daß die Änderung △N der Stoffmenge proportional ist zur Stoffmenge N (t) und zur
Zeitspanne △t. Nennen wir die Proportionalitätskonstante −α < 0 (sie ist negativ, da die
Substanz zerfällt), so folgt
△N = −αN (t)△t.
(1.3)
3
Schreiben wir △N = N (t + △t) − N (t), erhalten wir
N (t + △t) = (1 − α△t)N (t)
für alle t.
Für t = 0 ist
N (△t) = (1 − α△t)N (0),
für t = △t
N (2△t) = (1 − α△t)N (△t) = (1 − α△t)2 N (0),
und allgemein für t = n△t (n ∈ N)
n
N (n△t) = (1 − α△t) N (0) =
αt
1−
n
n
N (0).
Was geschieht nun, wenn n immer größer wird? Für größer werdendes n nähert sich
die Differenz 1 − αt
immer mehr der Zahl Eins an, und man könnte wegen 1n = 1 denken,
n
n
sich ebenfalls immer mehr der Eins nähert. Dies ist jedoch falsch! Es gilt
daß 1 − αt
n
n
αt
1−
nähert sich für großes n e−αt ,
(1.4)
n
wobei e = 2.7182818 . . . die Eulersche Zahl ist. Mathematisch formulieren wir die Aussage
(1.4) als
n
αt
strebt für n → ∞ gegen e−αt
1−
n
oder in Zeichen
lim
n→∞
αt
1−
n
n
= e−αt .
Diesen Grenzwert (“limes”) definieren wir in Kapitel 5. In Kapitel 3 untersuchen wir die
Exponentialfunktion ex . Die Stoffmenge zur Zeit t lautet also
N (t) = e−αt N (0).
In diesem Beispiel sind verschiedene mathematische Begriffe aufgetreten, die wir in
den folgenden Kapiteln genauer definieren und erläutern werden, nämlich Grenzwerte
und Funktionen. Außerdem werden wir Funktionen differenzieren und integrieren (siehe
Kapitel 6 und 7).
4
2
2.1
Grundbegriffe
Mengen
Die Gesamtheit von Objekten heißt Menge. Die einzelnen Objekte heißen Elemente der
Menge. Beispiele von Mengen sind
M1 = {1, 2, 3, 4}
M2 = {Kohlenstoff, Wasserstoff, Sauerstoff},
M1 = {5, 6, 7, . . . } = {x : x ist natürliche Zahl und x ≥ 5.}
Die Reihenfolge der Elemente spielt bei Mengen keine Rolle, d.h.
{1, 2, 3, 4} = {3, 2, 4, 1}.
Die leere Menge wird mit { } oder ∅ bezeichnet.
Es gibt die folgenden Mengenoperationen.
Definition 2.1 Seien A, B Mengen.
(1) A heißt Teilmenge von B, kurz A ⊂ B, wenn für alle x ∈ A auch x ∈ B folgt.
(2) Gleichheit: A = B bedeutet A ⊂ B und B ⊂ A.
(3) Vereinigung: A ∪ B = {x : x ∈ A oder x ∈ B}.
(4) Durchschnitt: A ∩ B = {x : x ∈ A und x ∈ B}.
(5) Differenz: A\B = {x : x ∈ A und x 6∈ B}. Man sagt “A ohne B”.
(6) Kartesisches Produkt: A × B = {(x, y), x ∈ A, y ∈ B}. Beachten Sie, daß (x, y)
ein geordnetes Paar ist, d.h., die Reihenfolge ist wichtig. Beispielsweise gilt (1, 2) 6=
(2, 1). (Aber {1, 2} = {2, 1}!)
Beispiel 2.2 Seien A = {1, 2, 3}, B = {3, 4}. Dann folgt
A ∩ B = {3},
A ∪ B = {1, 2, 3, 4}
(Elemente werden nur einmal aufgezählt),
A\B = {1, 2}.
A × B = {(1, 3), (1, 4), (2, 3), (2, 4), (3, 3), (3, 4)}.
5
(a)
(b)
B
A
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
00000000000
11111111111
000000000000
111111111111
B
A
111
000
000
111
000
111
(c)
A
A∪B
(d)
B
A
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
00000000000
11111111111
B
1111
0000
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
A∩B
(e)
00
11
00
00
00
0011
11
0011
11
1111
00
00
11
B 11
0011
11
0011
00
00
0011
11
0011
11
00
00
0011
11
0011
0011
00
| {z }
A
A\B
A×B
Abbildung 2.1: (a) Teilmenge; (b) Vereinigung; (c) Durchschnitt; (d) Differenz; (e) kartesisches Produkt.
2.2
Reelle Zahlen
Die wichtigsten Mengen sind Zahlenmengen.
Definition 2.3 (1) Menge der natürlichen Zahlen:
N = {1, 2, 3, . . . }.
Die Menge der natürlichen Zahlen mit Null wird geschrieben als:
N0 = N ∪ {0} = {0, 1, 2, 3, . . . }.
(2) Menge der ganzen Zahlen:
Z = {0, 1, −1, 2, −2, 3, −3 . . . }.
(3) Menge der rationalen Zahlen:
Q = { pq : p, q ∈ Z, q 6= 0}.
Die Brüche p0 und 00 sind also nicht definiert.
(4) Menge der reellen Zahlen:
a1 a2
a3
+
+
+. . . , a1 , a2 , a3 , · · · ∈ {0, 1, . . . , 9}}.
10 100 1000
Reelle Zahlen sind also Zahlen mit unendlicher Dezimalentwicklung.
R = {g+r : g ∈ Z, r = 0, a1 a2 a3 · · · =
Beispiel 2.4 (1) Sei x = 0, 101010 . . . ∈ R. Wir wollen x als Bruch schreiben. Dafür
schreiben wir
100 · x = 10, 101010 . . . ,
x = 0, 101010 . . .
6
Die Differenz lautet
10
∈ Q.
99
(2) Es gibt auch Zahlen, die nicht als Bruch geschrieben werden können. Derartige
Zahlen werden irrational genannt. Beispiele sind π und e (die Eulersche Zahl). Eine reelle
Zahl ist also entweder rational oder irrational.
99 · x = 10,
also x =
Es gelten die folgenden Inklusionen: N ⊂ N0 ⊂ Z ⊂ Q ⊂ R.
Definition 2.5 Seien a, b ∈ R. Die folgenden Mengen werden Intervalle genannt:
(1) Abgeschlossenes Intervall: [a, b] = {x ∈ R : a ≤ x ≤ b}.
(2) Rechts halboffenes Intervall: [a, b) = {x ∈ R : a ≤ x < b}.
(3) Links halboffenes Intervall: (a, b] = {x ∈ R : a < x ≤ b}.
(4) Offenes Intervall: (a, b) = {x ∈ R : a < x < b}.
Man schreibt auch
[a, ∞) = {x ∈ R : x ≥ a},
(−∞, b) = {x ∈ R : x < b},
(−∞, ∞) = R.
Definiert man den Betrag |x| einer reellen Zahl durch
(
x für x ≥ 0
|x| =
−x für x < 0,
so ist
[−a, a] = {x ∈ R : −a ≤ x ≤ a} = {x ∈ R : |x| ≤ a}.
Wir benötigen noch folgende Notationen:
• Das Zeichen “∀” bedeutet “für alle”.
• Das Zeichen “∃” bedeutet “es existiert”.
• Summe:
n
X
k=1
• Produkt:
n
Y
k=1
ak = a1 + a2 + · · · + an .
ak = a1 · a2 · . . . · an = a1 a2 . . . an .
7
Beispiel 2.6 Die Schreibweise
∀n∈N:
n
X
k=
k=1
n(n + 1)
2
bedeutet ausgeschrieben:
n(n + 1)
.
2
Daß die Summe der ersten n natürlichen Zahlen gleich n(n + 1)/2 ist, können wir übrigens
einfach einsehen, indem wir die beiden Zeilen
Für alle n ∈ N gilt: 1 + 2 + 3 + · · · + n =
a =1+
a
2
+
3
+ · · · + n,
= n + (n − 1) + (n − 2) + · · · + 1
addieren, denn dies ergibt
2a = (n + 1) + (n + 1) + (n + 1) + · · · + (n + 1) = n · (n + 1),
also a = n(n + 1)/2.
2.3
Binomialkoeffizienten
In diesem Abschnitt beantworten wir die Frage: Wieviel Möglichkeiten gibt es, k Elemente
von insgesamt n Elementen als Mengen zu schreiben? Sei etwa n = 5 und k = 2. Die
Elemente seien die Ziffern 1, 2, 3, 4, 5. Dann gibt es 20 Möglichkeiten:
12 13 14 15 23 24 25 34 35 45
21 31 41 51 32 42 52 43 53 54
Allgemein: Wir haben n Möglichkeiten, ein 1. Element zu wählen. Greifen wir das 1. Element heraus, verbleiben n − 1 Möglichkeiten, ein 2. Element auszuwählen, n − 2 Möglichkeiten für das 3. Element usw.:
Anzahl: = n · (n − 1) · (n − 2) · . . . · (n − (k − 1)).
Definieren wir die Fakultät:
n! = n(n − 1)(n − 2) · . . . · 3 · 2 · 1
für n ∈ N und 0! = 1,
so können wir schreiben:
n(n − 1)(n − 2) · . . . · (n − (k − 1))(n − k)(n − (k + 1)) · . . . · 3 · 2 · 1
(n − k)(n − (k + 1)) · · · 3 · 2 · 1
n!
=
.
(n − k)!
Anzahl =
8
Nun wird die Reihenfolge der Elemente in einer Menge nicht unterschieden, d.h. {1, 2} =
{2, 1}. Die obigen 20 Möglichkeiten reduzieren sich auf die 10 Möglichkeiten
{1, 2}, {1, 3}, {1, 4}, {1, 5}, {2, 3}, {2, 4}, {2, 5}, {3, 4}, {3, 5}, {4, 5}.
Allgemein: Die k! Möglichkeiten, k Elemente in einer Liste zu schreiben, müssen herausdividiert werden. Wir erhalten:
Anzahl =
n!
.
(n − k)!k!
Man nennt diesen Quotienten Binomialkoeffizienten und definiert
n!
n
:=
für n, k ∈ N0 , n ≥ k.
k
(n − k)!k!
In unserem Beispiel gilt etwa
5·4·3·2·1
5!
5
=
= 10.
=
3!2!
3·2·1·2·1
2
Die Binomialkoeffizienten können übrigens rekursiv über das sogenannte Pascalsche Dreieck berechnet werden (siehe Abb. 2.2).
k
0
1
2
3
4
n 0
1
1
1
1
2
1
2
1
3
1
3
3
1
4
1
4
6
4
5
1
5 10 10 5
5
1
1
Abbildung 2.2: Pascalsches Dreieck.
Die Zahlen in der Tabelle erhält man durch Addition der direkt und links darüber
liegenden Zahlen. Beispielsweise ist
5
= 10 = 4 + 6.
3
9
Interessanterweise sind die Binomialkoeffizienten gerade die Koeffizienten nach Ausmultiplizieren des Produktes (a + b)n :
(a + b)1 = 1 · a + 1 · b,
(a + b)2 = 1 · a2 + 2 · ab + 1 · b2 ,
(a + b)3 = 1 · a3 + 3 · a2 b + 3 · ab2 + 1 · b3 ,
usw.
Dies motiviert das folgende Resultat.
Satz 2.7 (Binomialsatz)
Für a, b ∈ R und n ∈ N0 gilt:
n X
n n
n
n n−1
n n
n n−k k
n−1
n
b .
ab
+
a b + ··· +
a +
a b =
(a + b) =
n
n
−
1
1
0
k
k=0
2.4
Komplexe Zahlen
Die Gleichung
x2 + 1 = 0
besitzt keine reelle Lösung. Um diesem Umstand Abhilfe zu schaffen, erweitert man den
Zahlenbegriff. Wir definieren eine neue Zahl i mit der Eigenschaft i2 = −1 (auch geschrie√
ben als i = −1).
Definition 2.8 Die Zahl i mit i2 = −1 heißt komplexe Einheit. Die Menge der komplexen Zahlen ist definiert durch
C = {z : z = a + ib, a, b ∈ R}.
Wir definieren weiter für eine Zahl z = a + ib ∈ C:
• Realteil von z: Re (z) = a,
• Imaginärteil von z: Im (z) = b,
• konjugiert komplexe Zahl von z: z = a − ib,
√
• Betrag von z: |z| = a2 + b2 .
Diese Definitionen können mit Hilfe der Gaußschen Zahlenebene veranschaulicht werden (Abbbildung 2.3). Die komplexe Zahl z wird als ein Ortsvektor dargestellt. Die konjugiert komplexe Zahl z ist der an der x-Achse (oder Re -Achse) gespiegelte Vektor; der
Betrag |z| ist die Länge des Vektors z.
Benutzt man die Beziehung i2 = −1, so kann man mit komplexen Zahlen so rechnen,
wie man es von den reellen Zahlen gewohnt ist.
10
Im
b
11
00
z = a + ib
r
r sin α
α
0
Re
a
r cos α
−b
11
00
z = a − ib
Abbildung 2.3: Gaußsche Zahlenebene.
Beispiel 2.9 Seien z1 = 2 + 3i, z2 = 1 − 2i ∈ C. Dann ist
• Addition: z1 + z2 = 2 + 3i + 1 − 2i = 3 + i,
• Subtraktion: z1 − z2 = 2 + 3i − 1 + 2i = 1 + 5i,
• Multiplikation: z1 · z2 = (2 + 3i)(1 − 2i) = 2 + 3i − 4i − 6i2 = 8 − i,
• Division:
2 + 3i
(2 + 3i)(1 + 2i)
2 + 3i + 4i + 6i2
−4 + 7i
4 7
z1
=
=
=
=
=
−
+ i.
z2
1 − 2i
(1 − 2i)(1 + 2i)
1 − 4i2
1+4
5 5
So wie man zweidimensionale Vektoren durch Angabe der Länge und des Winkels
in Polarkoordinaten darstellen kann, ist dies auch für komplexe Zahlen möglich (Abbildung 2.3). Man schreibt für z = a + ib ∈ C
a = r cos α,
wobei r = |z| =
√
b = r sin α,
a2 + b2 , also
z = a + ib = r(cos α + i sin α),
r > 0,
α ∈ R.
Eine dritte Darstellungsform komplexer Zahlen erhält man durch die Eulersche Formel
eiα := cos α + i sin α.
11
Dann können wir für z ∈ C schreiben
z = r(cos α + i sin α) = reiα .
Der Vorteil dieser Formulierung ist, daß komplexe Zahlen einfach potenziert werden
können:
n
iα n
n iαn
n
z = (re ) = r e = r cos(nα) + i sin(nα) .
Die drei Darstellungsformen sind in Abbildung 2.4 zusammengefaßt.
Komplexe Zahl
z
Kartesische Form
a + ib
Polarkoordinaten
r(cos α + i sin α)
Eulersche Form
reiα
Abbildung 2.4: Darstellung komplexer Zahlen.
Die trigonometrischen Funktionen sind periodisch; daher ist
1 = ei·0 = cos 0 + i sin 0 = cos 2π + i sin 2π = e2πi .
(2.1)
Diese Beobachtung motiviert das Wurzelziehen komplexer Zahlen, denn
√
√
w1 = z = (reiα )1/2 = reiα/2 .
√
Allerdings gibt es noch eine zweite Wurzel w2 = rei(α+2π)/2 , da aus (2.1) folgt
√ i(α+2π)/2 2
w22 =
re
= rei(α+2π) = reiα e2πi = reiα .
Allgemein gilt:
Satz 2.10 Sei z = reiα ∈ C, z 6= 0. Dann existieren genau n verschiedene komplexe
Zahlen w0 , . . . , wn−1 ∈ C, die die Gleichung wn = z lösen. Sie lauten
√
k = 0, . . . , n − 1.
wk = n rei(α+2πk)/n ,
Beispiel 2.11 (1) Sei z = −1 = e−iπ . Dann lauten die beiden Quadratwurzeln
w1 = e−iπ/2 = −i
und
w2 = ei(−π+2π)/2 = eiπ/2 = i.
√
√
Die Bezeichnung −1 = z = i ist also etwas mißverständlich, da es ja zwei Wurzeln
gibt. In beiden Fällen gilt i2 = w12 = −1, (−i)2 = w22 = −1.
(2) Wir suchen alle komplexen Wurzeln von z 3 = 1 = ei·0 . Sie lauten nach Satz 2.10
(siehe Abbildung 2.5)
w1 = e0·πi/3 = 1,
w2 = e2πi/3 ,
12
w3 = e4πi/3 .
Im
i
w2
w1
1
Re
w3
Abbildung 2.5: Die dritten Einheitswurzeln.
Wofür braucht man komplexe Zahlen? Wir geben zwei Antworten. Zum einen erlauben
komplexe Zahlen die Lösung von Gleichungen der Form
f (x) := an xn + an−1 xn−1 + · · · + a1 x + a0 = 0.
(2.2)
Satz 2.12 (Fundamentalsatz der Algebra)
Seien n ∈ N und a0 , . . . , an ∈ C mit an 6= 0. Dann existieren k ∈ N, n1 , . . . , nk ∈ N mit
n1 + · · · + nk = n und paarweise verschiedene Zahlen x1 , . . . , xk ∈ C, so daß
f (x) = (x − x1 )n1 (x − x2 )n2 · . . . · (x − xk )nk .
Die Zahlen x1 , . . . , xk sind also Lösungen von (2.2). Die Zahl nj heißt Vielfachheit der
Lösung xj (j = 1, . . . , k).
Die zweite Antwort geben wir im nächsten Beispiel.
Beispiel 2.13 (Freies Elektron)
Der Zustand eines freien Elektrons wird durch die sogenannte Wellenfunktion ψ(x) ∈
C beschrieben. In der Darstellung ψ(x) = reiα wird das Elektron als eine Welle mit
Amplitude r und Phase α interpretiert. Außerdem interpretiert man das Betragsquadrat
|ψ(x)|2 als die Wahrscheinlichkeitsdichte, das Elektron “in der Nähe” des Ortes x zu
finden.
Ein freies Teilchen im Raum mit maximaler Aufenthaltswahrscheinlichkeit an der Stelle x = 0 wird z.B. dargestellt durch den stationären Zustand
ψ(x) = eikx e−x
13
2 /2
.
Hierbei ist k die Wellenzahl des Teilchens, die ein Maß für dessen Energie ist. Wegen
2
2
|ψ(x)| = |eikx | · |e−x /2 | = e−x /2 ist tatsächlich die Wahrscheinlichkeitsdichte an x = 0
maximal. Für x → ±∞ wird |ψ(x)| immer kleiner; dies bedeutet, daß die Wahrscheinlichkeit, das Teilchen weit weg von x = 0 zu finden, sehr klein ist.
14
3
Funktionen
Eine Abbildung ist eine Vorschrift, die jedem Element x aus einer (nichtleeren) Menge M
genau ein Element f (x) aus einer Menge N zuordnet; kurz:
f : M → N,
x 7→ f (x).
Die Menge M heißt Definitionsbereich von f , N heißt Wertebereich (Abbildung 3.1). Wir
schreiben meist Df für den Definitionsbereich von f .
M
N
Abbildung 3.1: Zur Definition einer Abbildung.
Ist M = Rn und N = R, so nennen wir eine Abbildung eine Funktion. In diesem
Kapitel untersuchen wir einige elementare Funktionen wie Polynome, exp, ln, sin, cos
usw.
3.1
Funktionen und ihre Inverse
Wir definieren zunächst die Inverse einer Funktion.
Definition 3.1 Sei f : Df → R eine Funktion. Man nennt die Funktion g : Dg → R mit
der Eigenschaft
g(f (x)) = x
f (g(y)) = y
für alle x ∈ Df bzw.
für alle y ∈ Dg
die Inverse von f und schreibt g = f −1 .
Beispiel 3.2 Sei f (x) = x2 + 1, x ∈ Df = R. Wir setzen y = x2 + 1 und lösen nach x
auf:
p
x = ± y − 1.
√
Setzen wir g(y) = ± y − 1, so ist g ein Kandidat für die Inverse von f (siehe Abbildung 3.2), denn
p
f (g(y)) = (± y − 1)2 + 1 = (y − 1) + 1 = y.
Es stellen sich jedoch zwei Fragen:
15
y
f
g
1
x
1
Abbildung 3.2: Die Funktion f (x) = x2 +1 und deren Spiegelung an der Diagonalen x = y.
• Wie lautet der Definitionsbereich von g?
√
√
• Warum gibt es zwei Funktionen g(y) = y − 1 und g(y) = − y − 1?
Die erste Frage kann leicht beantwortet werden: Damit es eine reelle Wurzel gibt, sollte
y ≥ 1 sein, also Dg = [1, ∞). Dies ist übrigens gerade das Bild von f :
f (R) = {f (x) : x ∈ Df } = [1, ∞) = Dg .
Die Antwort der zweiten Frage basiert auf der Feststellung, daß zu jedem x 6= 0 die beiden
Werte f (x) und f (−x) übereinstimmen. Daher gibt es zu jedem y > 1 zwei Werte für
die “Inverse”. Damit die Inverse eindeutig bestimmt ist, sollte zu jedem y ∈ f (R) genau
ein x ∈ Df existieren, so daß f (x) = y. Eine Funktion f : Df → f (R) (beachte den
Wertebereich!) mit dieser Eigenschaft heißt bijektiv.
Definition 3.3 Sei f : Df → Wf eine Funktion. Dann heißt f bijektiv genau dann,
wenn für alle y ∈ Wf genau ein x ∈ Df existiert mit f (x) = y.
Bijektive Funktionen sind invertierbar. Beispielsweise ist für f : [0, ∞) → [1, ∞),
√
f (x) = x2 + 1, die Inverse gegeben durch f −1 : [1, ∞) → [0, ∞), f −1 (y) = y − 1. Hätten
wir f : (−∞, 0] → [1, ∞), f (x) = x2 + 1, definiert, so würde die Inverse f −1 : [1, ∞) →
√
(−∞, 0], f −1 (y) = − y − 1, lauten.
3.2
Rationale Funktionen
Definition 3.4 Sei n ∈ N und a0 , . . . , an ∈ R, an 6= 0. Dann heißt die Funktion p : R →
R, definiert durch
n
X
p(x) =
ak x k = a0 + a1 x + · · · + an x n ,
k=0
16
Polynom vom Grade n.
Definition 3.5 Seien pm (x) bzw. qn (x) Polynome vom Grade m bzw. n. Dann heißt
R(x) =
pm (x)
qn (x)
rationale Funktion. Sie ist für alle x ∈ R definiert, die keine Nullstellen von qn sind.
Ist m < n, so heißt R echt gebrochene rationale Funktion, anderenfalls heißt sie unecht
gebrochen.
Beispiel 3.6 (1) Die Funktion
R(x) =
(x − 1)(x + 3)
x2 + 2x − 3
=
=x−1
x+3
x+3
ist eigentlich keine rationale Funktion, sondern ein Polynom vom Grade 1 und damit
definiert für alle x ∈ R.
(2) Die Funktion
x2 + 2x − 3
R(x) =
x+4
ist eine unecht gebrochene rationale Funktion, definiert für alle x ∈ R, x 6= −4. Sie kann
allerdings mit Hilfe der Polynomdivison geschrieben werden als die Summe eines Polynoms
und einer echt gebrochenen rationalen Funktion:
5
(x2 + 2x − 3) : (x + 4) = x − 2 +
x+4
−(x2 + 4x)
−2x − 3
−(−2x − 8)
5
Wir erhalten:
R(x) = x − 2 +
5
.
x+4
Beispiel 3.7 Für ideale Gase gilt die Zustandsgleichung
p · V = R · T,
wobei p der Druck, V das Volumen, T die Temperatur des Gases und R die sogenannte
Gaskonstante sind. Die Aussage dieser Gleichung ist, daß das Produkt von Druck und Volumen eines Gases bei gleich gehaltener Temperatur konstant ist. Dies gilt nur annähernd.
Eine bessere Approximation liefert die Van-der-Waals-Gleichung
a p + 2 (V − b) = RT,
V
17
wobei a die intermolekularen Kräfte und b die Größe der Gasmoleküle modelliert. Bei
konstanter Temperatur ist der Druck eine Funktion des Volumens:
p(V ) = p =
a
RT V 2 − aV + ab
RT
− 2 =
.
V −b V
V 2 (V − b)
Der Druck p(V ) ist also eine echt gebrochene rationale Funktion.
In Kapitel 7 benötigen wir eine Formulierung rationaler Funktion als Summe einfacher
rationaler Funktionen, etwa von der Art
1
1
2x
+
= 2
.
x+1 x−1
x −1
Dies führt auf das Konzept der Partialbruchzerlegung.
Beispiel 3.8 (1) Sei
R(x) =
x2 + 1
.
x3 − 2x2 − x + 2
Wir suchen zuerst alle Nullstellen des Nenners. Wir raten die Nullstelle x1 = 1. Mit Polynomdivision erhalten wir:
(x3 − 2x2 − x + 2) : (x − 1) = x2 − x − 2
−(x3 − x2 )
−x2 − x
−(−x2 + x)
−2x + 2
−(−2x + 2)
0
Die Nullstellen von x2 − x − 2 ergeben sich aus der p-q-Formel:
r
1
1
1 3
x2/3 = ±
+2= ± ,
also x2 = 2, x3 = −1.
2
4
2 2
Daher ist
R(x) =
x2 + 1
,
(x + 1)(x − 2)(x − 1)
x ∈ R\{1, 2, −1}.
Wir machen nun den Ansatz
R(x) =
A
B
C
+
+
x+1 x−2 x−1
(3.1)
und wollen die Konstanten A, B und C bestimmen. Wir multiplizieren (3.1) mit dem
Nenner:
x2 + 1 = A(x − 2)(x − 1) + B(x + 1)(x − 1) + C(x + 1)(x − 2).
18
Eigentlich gilt diese Gleichung nur für x ∈
/ {1, 2, −1}. Es ist dennoch möglich, diese Werte
einzusetzen (dies folgt aus der Stetigkeit, die wir erst in Kapitel 6 einführen):
x=1:
2 = −2C
x=2:
5 = 3B
x = −1 : 2 = 6A
=⇒
=⇒
=⇒
C = −1,
B = 35 ,
A = 31 .
Wir folgern aus (3.1):
R(x) =
(2) Sei
5
1
1
+
−
.
3(x + 1) 3(x − 2) x − 1
x3
.
x3 + x2 + x + 1
Diese Funktion ist unecht gebrochen rational, so daß wir zuerst Polynomdivision durchführen:
R(x) =
x3 : (x3 + x2 + x + 1) = 1 −
−(x3 + x2 + x + 1)
−x2 − x − 1
x2 + x + 1
.
x3 + x2 + x + 1
Eine Nullstelle erraten wir: x1 = −1. Eine weitere Polynomdivision führt auf
(x3 + x2 + x + 1) : (x + 1) = x2 + 1
−(x3 + x2 )
0+x+1
−(x + 1)
0
Es gibt keine weiteren Nullstellen. Wir erweitern daher unseren Ansatz der Partialbruchzerlegung zu
A
Bx + C
x2 + x + 1
=
+ 2
.
3
2
x +x +x+1
x+1
x +1
Wir multiplizieren mit dem Nenner
x2 + x + 1 = A(x2 + 1) + (Bx + C)(x + 1)
und setzen spezielle Werte ein:
x = −1 :
1
1 = 2A =⇒ A = ,
2
1
1 = A + C =⇒ C = 1 − A = ,
2
3
1
x=1:
3 = 2A + 2(B + C) =⇒ B = − A − C = .
2
2
Damit erhalten wir die Zerlegung
x=0:
R(x) = 1 −
1
x+1
x2 + x + 1
=1−
−
.
3
2
x +x +x+1
2(x + 1) 2(x2 + 1)
19
3.3
Elementare Funktionen
Exponentialfunktionen. Betrachte für a ∈ (1, ∞) die Funktion
f (x) = ax ,
x ∈ R.
Sie hat die Eigenschaften
a0 = 1,
ax1 +x2 = ax1 · ax2 .
a1 = a,
Die Inverse von f ist der Logarithmus zur Basis a:
f −1 : (0, ∞) → R,
f −1 (x) = loga x.
Die Inverse hat die Eigenschaften
loga 1 = 0,
loga (x1 · x2 ) = loga x1 + loga x2 .
loga a = 1,
Im Falle a = e (Eulersche Zahl) nennt man loge = ln den natürlichen Logarithmus; im Falle
a = 10 wird log10 = log dekadischer Logarithmus genannt. Falls a = e, heißt f (x) = ex
Exponentialfunktion.
Trigonometrische Funktionen. Sinus und Cosinus sind Funktionen
sin : R → R,
cos : R → R
mit den Eigenschaften
cos2 x + sin2 x = 1,
sin(πk) = 0,
x ∈ R,
cos(πk) = (−1)k ,
sin
+ 1)
= (−1)k ,
cos π2 (2k + 1) = 0, k ∈ N0 .
π
(2k
2
Insbesondere sind sin und cos 2π-periodisch, d.h.
sin(x + 2π) = sin x,
cos(x + 2π) = cos x,
x ∈ R.
Daher sind sin und cos auf R nicht invertierbar, sehr wohl aber die eingeschränkten
Funktionen
h π πi
→ [−1, 1],
cos : [0, π] → [−1, 1].
sin : − ,
2 2
Die Inversen heißen Arcussinus und Arcuscosinus:
h π πi
arcsin : [−1, 1] → − ,
,
arccos : [−1, 1] → [0, π].
2 2
20
Der Tangens
h π πi
sin x
tan : − ,
,
→ R,
tan x =
2 2
cos x
ist invertierbar; die Inverse heißt Arcustangens:
h π πi
.
arctan : R → − ,
2 2
Hyperbolische Funktionen. Sinus und Cosinus hyperbolicus sind definiert durch
1
sinh x = (ex − e−x ),
2
1
cosh x = (ex + e−x ),
2
x ∈ R,
x ∈ R.
Der Name rührt daher, daß
cosh2 x − sinh2 x = 1
gilt und y 2 − x2 = 1 die Gleichung einer Hyperbel ist. Analog zum Tangens gibt es einen
Tangens hyperbolicus:
tanh x =
sinh x
ex − e−x
= x
,
cosh x
e + e−x
x ∈ R.
Die Inversen werden auch Area-Funktionen genannt:
arsinh : R → R,
arcosh : [1, ∞) → [0, ∞),
artanh : (−1, 1) → R,
√
arsinh x = ln(x + x2 + 1),
√
arcosh x = ln(x + x2 − 1),
1+x
artanh x = 12 ln 1−x
.
Übrigens kann man in diese Funktionen auch komplexe Argumente einsetzen und
erhält damit einen Zusammenhang zwischen den trigonometrischen und den hyperbolischen Funktionen. Benutzen wir nämlich die Eigenschaft, daß sin(−x) = − sin x und
cos(−x) = cos x, so folgt aus der Eulerschen Formel
eiz = cos z + i sin z,
z ∈ C,
für z = −ix und z = ix, x ∈ R:
ex = cos(ix) − i sin(ix),
e−x = cos(ix) + i sin(ix).
Addition und Subtraktion der beiden Gleichungen ergibt
1
cosh x = (ex + e−x ) = cos(ix),
2
1 x
sinh x = (e − e−x ) = −i sin(ix).
2
21
4
4.1
Vektoren und Matrizen
Vektoren
Definition 4.1 Der Raum Rn ist das n-fache kartesische Produkt R × R × · · · × R oder
 
x1

n
o
 x2 
n

R = 
:
x
,
.
.
.
,
x
∈
R
.
n
 ..  1
.
xn
Die Elemente des Rn heißen Vektoren.
Definition 4.2 (1) Sei x ∈ Rn . Der transponierte Vektor x⊤ ist definiert durch
x⊤ = (x1 , x2 , . . . , xn ),
d.h., x⊤ ist ein Zeilenvektor, während x ein Spaltenvektor ist. Es gilt umgekehrt x =
(x1 , x2 , . . . , xn )⊤ .
(2) Seien x = (x1 , . . . , xn )⊤ , y = (y1 , . . . , yn )⊤ ∈ Rn und λ ∈ R. Die Addition bzw.
Subtraktion von Vektoren und die Multiplikation mit dem Skalar sind definiert durch
x + y = (x1 + y1 , x2 + y2 , . . . , xn + yn )⊤ ,
x − y = (x1 − y1 , x2 − y2 , . . . , xn − yn )⊤ ,
λx = (λx1 , λx2 , . . . , λxn )⊤ .
Die Operationen mit Vektoren sind in Abbildung 4.1 veranschaulicht.
(a)
(b)
x−y
x+y
x
0
y
(c)
−y
0
x
λ=2
y
0
y
λy
Abbildung 4.1: (a) Addition, (b) Subtraktion von Vektoren und (c) Multiplikation mit
dem Skalar λ.
Definition 4.3 Das Skalarprodukt im Rn lautet
x·y =
n
X
i=1
xi yi
für x = (x1 , . . . , xn )⊤ , y = (y1 , . . . , yn )⊤ ∈ Rn .
22
Beispiel 4.4 Seien x = (2, 1)⊤ , y = (−1, 2)⊤ ∈ R2 . Dann folgt x · y = 2 · (−1) + 1 · 2 = 0.
Nun steht x senkrecht auf y (siehe Abbildung 4.2); man erhält allgemein x · y = 0 genau
dann, wenn x senkrecht auf y steht.
2
y
x
1
−2
−1
0
1
2
Abbildung 4.2: Die Vektoren x und y stehen senkrecht aufeinander.
Das Skalarprodukt hat die folgenden Eigenschaften. Für alle x, y, z ∈ Rn gilt:
(1) (x + y) · z = x · z + y · z,
(2) x · (y + z) = x · y + x · z,
(3) x · y = y · x,
(4) x · x ≥ 0 und x · x = 0 ⇐⇒ x = 0.
Definition 4.5 Die Länge oder Norm eines Vektors x = (x1 , . . . , xn )⊤ ∈ Rn ist definiert
als
v
u n
uX
√
x2i .
kxk = x · x = t
i=1
Diese Definition ist in Abbildung 4.3 veranschaulicht. Die Norm hat die folgenden
Eigenschaften. Für alle x ∈ Rn und λ ∈ R gilt:
(1) kxk ≥ 0 und kxk = 0 ⇐⇒ x = 0 (Positivität),
(2) kλxk = |λ| · kxk (Homogenität),
(3) kx + yk ≤ kxk + kyk (Dreiecksungleichung).
23
x2
p
x21 + x22
x
)
1111111111111111
0000000000000000
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
0000000000000000
1111111111111111
|
{z
x1
x2
}
Abbildung 4.3: Zur Definition der Norm eines Vektors im R2 .
Definition 4.6 Der Winkel α ∈ [0, π] zwischen zwei Vektoren x, y ∈ Rn ist definiert
durch
x·y
cos α =
.
kxk · kyk
Wir sagen, x steht senkrecht auf y bzw. x ist orthogonal zu y (kurz x ⊥ y) genau dann,
wenn x · y = 0 oder α = π2 .
Beispiel 4.7 Seien x = (2, 1)⊤ , y = (−1, 2)⊤ , z ∈ (0, 2)⊤ ∈ R2 (siehe Abbildung 4.2).
Dann ist
π
x·y
= 0,
also αxy = ,
kxk · kyk
2
1
2
x·z
also αxz ≈ 1.1071 = 63.43◦ ,
= √ √ = √ ,
=
kxk · kzk
5· 4
5
z·y
2
4
=
also αzy ≈ 0.4636 = 26.57◦ .
= √ √ = √ ,
kzk · kyk
4· 5
5
cos αxy =
cos αxz
cos αzy
Es gilt klarerweise αxz + αzy = 90◦ oder αxz + αzy ≈ 1.5707 ≈ π2 .
Satz 4.8 (Pythagoras)
Seien x, y ∈ Rn mit x ⊥ y. Dann ist
kxk2 + kyk2 = kx + yk2 .
Beweis: Wegen x · y = 0 nach Definition 4.6 folgt
kx + yk2 = (x + y) · (x + y) = x · x + x · y + y · x + y · y
= kxk2 + 2x · y + kyk2 = kxk2 + kyk2 .
Zwischen Vektoren im R3 (und nur im R3 !) gibt es noch eine andere “Multiplikation”.
24
Definition 4.9 Seien x = (x1 , x2 , x3 )⊤ , y = (y1 , y2 , y3 )⊤ ∈ R3 . Dann lautet das Kreuzprodukt (auch Vektorprodukt genannt)


x2 y3 − x3 y2


x × y =  x3 y1 − x1 y3  .
x1 y2 − x2 y1
Beispiel 4.10 Seien
Dann ist



1
 
x =  0 ,
2

−2


y =  1 .
3

 

0·3−2·1
−2

 

x × y =  2 · (−2) − 1 · 3  =  −7  .
1 · 1 − 0 · (−2)
1
Es gilt interessanterweise
  

1
−2
  

x · (x × y) =  0  ·  −7  = 0,
2
1

 

−2
−2

 

y · (x × y) =  1  ·  −7  = 0,
3
1
d.h., sowohl x als auch y sind orthogonal zu x × y. Diese Eigenschaft gilt allgemein.
Das Kreuzprodukt hat die folgenden Eigenschaften. Seien x, y ∈ R3 .
(1) x × y steht senkrecht auf x und y,
(2) kx × yk2 = kxk2 kyk2 − (x, y)2 ,
(3) x × y = 0 =⇒ ∃c ∈ R : x = cy.
Diese Eigenschaften können durch Nachrechnen bestätigt werden (für den Beweis von (3)
verwendet man (2) und die sogenannte Cauchy-Schwarz-Ungleichung |x · y| ≤ kxk · kyk).
4.2
Matrizen
Definition 4.11 Seien n, m ∈ N. Ein rechteckiges Zahlenschema der Form


a11 a12 . . . a1n


 a21 a22 . . . a2n 
A=
..
.. 
 ..

.
. 
 .
am1 am2 . . . amn
mit Elementen aij ∈ R heißt (m × n)-Matrix. Wir schreiben kurz: A ∈ Rm×n .
25
Es gibt einige spezielle Matrizen. Eine (n × 1)-Matrix können wir als Vektor interpretieren.
Definition 4.12 (1) Eine Matrix A ∈ Rm×n heißt quadratisch, wenn m = n.
(2) Eine Diagonalmatrix ist eine quadratische Matrix mit verschwindenden Nichtdiagonalelementen:


d1
0




d2

 ∈ Rn×n .
D=
...



0
dn
(3) Die Einheitsmatrix ist eine Diagonalmatrix, deren Diagonalelemente alle Eins
sind:


1
0


 1

 ∈ Rn×n .
E=
...




0
1
Definition 4.13 (1) Zwei Matrizen A = (aij ), B = (bij ) ∈ Rm×n sind gleich, wenn alle
Elemente übereinstimmen:
A=B
⇐⇒
∀ i = 1, . . . , m, j = 1, . . . , n :
aij = bij .
(2) Die transponierte Matrix A⊤ = (e
aij ) für A = (aij ) ∈ Rn×n ist definiert durch
e
aij = aji ,
d.h., man erhält A⊤ durch Vertauschen der Zeilen und Spalten von A.
(3) Eine quadratische Matrix A ∈ Rn×n heißt symmetrisch, wenn A⊤ = A.
Beispiel 4.14 Seien


1 2 0


A = 0 1 0 ,
0 0 1


1 2 0


B = 2 1 0 .
0 0 1
Dann ist A quadratisch, aber nicht symmetrisch; B ist dagegen symmetrisch.
Matrizen werden elementweise addiert, subtrahiert bzw. mit Skalaren multipliziert.
Seien A = (aij ), B = (bij ) ∈ Rn×m und λ ∈ R. Dann ist
(A + B)ij = aij + bij ,
(A − B)ij = aij − bij ,
(λA)ij = λaij .
Die Multiplikation von Matrizen ist dagegen etwas aufwendiger.
26
Definition 4.15 Seien A ∈ Rm×n und B ∈ Rn×ℓ . Das Matrixprodukt C = AB ∈ Rm×ℓ
ist definiert durch
n
X
cij =
aik bkj ,
k=1
wobei C = (cij ).
Beispiel 4.16 (1) Seien
!
1 2
,
3 0
A=
B=
!
3 2
.
0 1
Man kann sich die Matrixmultiplikation durch das Schema “Zeile × Spalte” merken:
3
0
1 2 1·3+2·0=3
3 0 3·3+0·0=9
2
1
1·2+2·1=4
3·2+0·1=6
AB
Daher ist
AB =
!
3 4
6=
9 6
1
3
3 2 9
0 1 3
BA
2
0
6
0
!
9 6
= BA.
3 0
(2) Seien
A=
!
2 −1 2
,
4 −2 4
Dann ist


−1 0


B =  2 2 ,
2 1
−1
2
AB
2
2 −1 2 0
4 −2 4 0
also
AB =
0
2
1
0
0
!
0 0
,
0 0
C = B⊤ =
!
−1 2 2
.
0 2 1
−1 2 2
0 2 1
,
2 −1 2
nicht
4 −2 4 definiert
AC
AC ist nicht definiert.
Die Matrixmultiplikation hat also einige Besonderheiten:
(1) Das Produkt AB existiert nur, wenn die Spaltenzahl von A gleich der Zeilenzahl
von B ist.
27
(2) Falls AB und BA definiert sind, gilt im allgemeinen AB 6= BA.
(3) Falls AB = 0, muß nicht A = 0 oder B = 0 folgen.
Die Gleichung ab = 1 für gegebenes a ∈ R, a 6= 0, besitzt die eindeutige Lösung
b = 1/a, und man nennt b die Inverse von a. Wir wollen dieses Konzept auf Matrizen
erweitern.
Definition 4.17 Eine Matrix A ∈ Rn×n heißt invertierbar, wenn eine Matrix B ∈ Rn×n
existiert, so daß
AB = E
oder
BA = E,
wobei E ∈ Rn×n die Einheitsmatrix sei (siehe Definition 4.12). Wir schreiben B = A−1
und nennen A−1 die Inverse von A. Nicht invertierbare Matrizen heißen singulär.
Beispiel 4.18 (1) Sei
!
1 2
.
3 4
A=
Dann ist A invertierbar und
A−1 =
!
−2
1
,
3/2 −1/2
denn
AA−1 =
(2) Die Matrix
A=
!
1 0
= E.
0 1
!
1 1
2 2
ist nicht invertierbar. Angenommen, es gäbe eine Matrix
!
a b
B=
c d
mit AB = E. Dann folgt aus
!
1 0
=A·B =
0 1
!
1 1
2 2
!
a b
=
c d
!
a+c
b+d
2(a + c) 2(b + d)
die Gleichungen
1 = a + c,
0 = 2(a + c),
also 0 = a + c = 1 und damit ein Widerspruch. Solch eine Matrix B kann also nicht
existieren, d.h., A ist singulär.
28
Für (2 × 2)-Matrizen gibt es eine Formel für die Inverse. Für (n × n)-Matrizen ist die
Invertierung komplizierter und wird erst in Abschnitt 4.6 behandelt.
Satz 4.19 (Cramersche Regel)
Sei
A=
a b
c d
!
∈ R2×2 .
(4.1)
Dann ist A invertierbar genau dann, wenn ad − bc 6= 0. In diesem Fall gilt
!
d
−b
1
.
A−1 =
ad − bc −c a
Beweis: Nachrechnen.
Satz 4.20 Seien A, B ∈ Rn×n invertierbar. Dann ist auch AB invertierbar und
(AB)−1 = B −1 A−1 .
Beweis: (AB)(B −1 A−1 ) = A(BB −1 )A−1 = AEA−1 = AA−1 = E.
Wofür braucht man die Inverse einer Matrix? Betrachte das Gleichungssystem
x1 + 2x2 = −1,
3x1 + 4x2 = 3.
Schreiben wir
A=
!
1 2
,
3 4
x=
x1
x2
!
,
(4.2)
b=
!
−1
,
3
so können wir (4.2) kompakt als
Ax = b
formulieren. Multiplizieren wir A−1 von links auf beiden Seiten, so folgt
x = Ex = A−1 Ax = A−1 b
und wegen Beispiel 4.18 (1)
!
x1
x=
= A−1 b =
x2
−2
1
3/2 −1/2
!
−1
3
!
=
!
5
.
−3
Die Lösung von (4.2) lautet folglich x1 = 5 und x2 = −3. Mittels der Inversen kann
also ein lineares Gleichungssystem bequem gelöst werden, sofern die Koeffizientenmatrix
invertierbar ist (anderenfalls siehe Abschnitt 4.6).
29
4.3
Der Gauß-Algorithmus
In der Chemie tritt vielfach das Problem auf, unbekannte Größen x1 , x2 , . . . , xn aus einem System linearer Gleichungen zu bestimmen. In Kapitel 1 haben wir gezeigt, daß die
Bestimmung der Reaktionsgleichung für den Zerfall von Kaliumdichromat auf das lineare
Gleichungssystem
2x1 − 2x2 = 0,
2x1 − x2 − 2x3 = 0,
(4.3)
7x1 − 4x2 − 3x3 − 2x4 = 0
führt. Um dieses System von Gleichungen zu lösen, könnte man zuerst die erste Gleichung
nach x2 auflösen; dies führt auf x2 = x1 . Setzen wir dieses Ergebnis in die zweite Gleichung ein, erhalten wir die Gleichung x1 − 2x3 = 0, also x3 = x1 /2. Dies können wir in
die letzte Gleichung einsetzen usw. Obwohl diese Einsetzmethode zum Ziel führt, wird sie
bei großen Gleichungssystemen mit zehn oder mehr Gleichungen sehr umständlich. Es ist
zweckmäßiger, einen Algorithmus zu entwickeln, mit dem Gleichungssysteme allgemein
aufgelöst werden können. Der Vorteil eines Algorithmus ist, daß die Lösung von Gleichungssystemen mit Hilfe eines Computers ermöglicht wird. Ein solches Verfahren ist der
Gauß-Algorithmus (auch Gaußsches Eliminationsverfahren genannt), den wir in diesem
Abschnitt betrachten wollen.
Allgemein schreiben wir ein lineares Gleichungssystem mit n Variablen x1 , x2 , . . . , xn
und m Gleichungen als
a11 x1 + a12 x2 + · · · + a1n xn = b1 ,
a21 x1 + a22 x2 + · · · + a2n xn = b2 ,
..
.
(4.4)
am1 x1 + am2 x2 + · · · + amn xn = bm .
Die obige Schreibweise kann vereinfacht werden. Dazu schreiben wir die Koeffizienten als
die Koeffizientenmatrix


a11 a12 · · · a1n


 a21 a22 · · · a2n 

A= .
..
.. 

.
.
. 
 .
am1 am2 · · · amn
30
und die Variablen x1 , . . . , xn und die Werte b1 , . . . , bm auf den rechten Seiten von (4.4) als
 
 
x1
b1
 
 
 x2 
 b2 

 
x=
 ..  und b =  ..  .
.
 . 
xn
bm
Damit können wir (4.4) kompakt formulieren als
Ax = b.
Die Matrix, die dadurch entsteht, wenn zur Matrix A die Spalte b hinzugefügt wird,
nennen wir die erweiterte Koeffizientenmatrix und bezeichnen sie mit (A|b). Sie besitzt m
Zeilen und n + 1 Spalten.
Die Idee des Gauß-Algorithmus ist es, durch geschicktes Kombinieren von Gleichungen
eine Matrix zu erhalten, deren Elemente unterhalb der Hauptdiagonalen alle gleich null
sind. Dann kann das Gleichungssystem einfach rekursiv aufgelöst werden. Das Verfahren
wird anhand der folgenden Beispiele deutlich.
Beispiel 4.21 (1) Löse Ax = b mit


2 1 −4


A= 6 0 2 
−2 3 4
Wir schreiben

I
2 1

II  6 0
−2 3
III

2 1

 0 −3
0 4

2 1

 0 −3
0 0
Aus der dritten Gleichung folgt
56
x
3 3
−3x2 + 14x3
2x1 + x2 − 4x3
= − 92
3
= −21
= 7
und


7
 
b= 0 
−7

−4 7

2
0  −3 · I
4 −7
+I

−4 7

14 −21 
0
0
+ 43 · II

−4 7

14 −21 
56
− 84
3
3
=⇒
=⇒
=⇒
31
x3 = − 23 ,
x2 = − 13 (−21 + 14 · 32 ) = 0,
x1 = 12 (7 − 4 · 23 ) = 12 .
Die Lösung lautet x = ( 12 , 0, − 23 ).
(2) Wir haben in Kapitel 1 gezeigt, daß die (ganzzahligen) Werte x1 ,k x2 , x3 , x4 der
Reaktionsgleichung
x1 K2 Cr2 O7 → x2 K2 CrO4 + x3 Cr2 O3 + x4 O2
das lineare Gleichungssystem

2

A = 2
7
Ax = b mit

−2 0
0

−1 −2 0 
−4 −3 −2
und
 
0
 
b = 0
0
lösen müssen (siehe (1.2)). Wir schreiben


2 −2 0
0 0


 2 −1 −2 0 0  −II
7 −4 −3 −2 0
− 72 · II

2 −2 0
0 0


 0 1 −2 0 0 
−3 · II
0 3 −3 −2 0



2 −2 0
0 0


 0 1 −2 0 0  .
0 0
3 −2 0
Wir erhalten drei Gleichungen für vier Variable, also einen freien Parameter. Wir setzen
x4 = λ und
3x3 = 2x4 = 2λ =⇒ x3 = 32 λ,
x2 = 2x3 = 34 λ =⇒ x2 = 43 λ,
2x1 = 2x2 = 38 λ =⇒ x1 = 43 λ.
Die Lösungen lauten also
 
4

λ 4

 ,
3 2
λ ∈ R.
3
Wir suchen nur ganzzahlige Lösungen und wählen daher (zum Beispiel) λ = 3. Damit
lautet die obige Reaktionsgleichung
4K2 Cr2 O7 → 4K2 CrO4 + 2Cr2 O3 + 3O2 .
32
(3) Löse das lineare Gleichungssystem Ax = b mit


 
1
2
3
4
1


 
A= 2
2
1
1 , b = 1 .
−1 −2 −3 −4
1
Wir wenden den Gauß-Algorithmus an:


I
1
2
3
4 1


2
1
1 1  −2 · I
II  2
+I
III −1 −2 −3 −4 1


1
I
1
2
3
4


II  0 −2 −5 −7 −1  .
2
0
0
0
III 0
Die letzte Gleichung lautet 0 · x1 + 0 · x2 + 0 · x3 + 0 · x4 = 2 bzw. 0 = 2. Diese Gleichung ist widersprüchlich. Was ist schiefgegangen? Das Resultat zeigt, daß das lineare
Gleichungssystem keine Lösung besitzt, da die Umformungen des Gauß-Algorithmus auf
eine widersprüchliche Gleichung führen.
Die obigen Beispiele zeigen, daß ein lineares Gleichungssystem entweder keine, genau
eine oder unendlich viele Lösungen besitzt. Welche Eigenschaften der Matrix bzw. der
rechten Seite legen fest, wie viele Lösungen ein Gleichungssystem besitzt? Um diese Frage
beantworten zu können, benötigen wir die Begriffe der Determinante und des Rangs einer
Matrix.
4.4
Determinanten
Wir haben in Satz 4.19 gesehen, daß die (2 × 2)-Matrix (4.1) genau dann invertierbar ist,
wenn ad − bc 6= 0. Gibt es ein ähnliches Kriterium für allgemeine (n × n)-Matrizen? Die
Antwort lautet Ja und führt auf das Konzept der Determinante einer Matrix.
Definition 4.22 Die Determinante einer Matrix A ∈ Rn×n ist rekursiv definiert durch
det A = a11
für n = 1,
n
X
det A =
(−1)i+j aij det Aij
für n > 1,
i=1
wobei j ∈ {1, . . . , n} beliebig ist und Aij diejenige Matrix ist, die aus A durch Streichen
der i-ten Zeile und j-ten Spalte entsteht. In der obigen Formel können i und j vertauscht
werden:
n
X
det A =
(−1)j+i aji det Aji .
i=1
33
Beispiel 4.23 (1) Für (2 × 2)-Matrizen gilt
!
a b
det
= (−1)1+1 · a · det(d) + (−1)1+2 · b · det(c) = ad − bc.
c d
(2) Sei


3 0
2


A = 1 −1 3  .
2 4 −2
Dann folgt
!
!
−1
3
1
3
det A = (−1)1+1 · 3 · det
+ (−1)1+2 · 0 · det
4 −2
2 −2
!
1 −1
+(−1)1+3 · 2 · det
2 4
= 3(2 − 12) + 2(4 + 2) = −18.
Es ist also sinnvoll, nach einer Zeile oder Spalte zu entwickeln, die möglichst viele Nullen
enthält.
(3) Sei wie ein Beispiel 4.18 (1)
!
1 1
A=
.
2 2
Dann ist det A = 1 · 2 − 1 · 2 = 0. Wir wissen, daß A nicht invertierbar ist. Gibt es einen
Zusammenhang? Ja, siehe Satz 4.24 (3) unten.
Auch für (3 × 3)- Matrizen gibt es eine Formel für die Determinante, nämlich die Regel
von Sarrus:


a11 a12 a13
a11 a12 a13 a11 a12


det a21 a22 a23  = a21 a22 a23 a21 a22
a31 a32 a33 a31 a32
a31 a32 a33
= a11 a22 a33 + a12 a23 a31 + a13 a21 a32
−a13 a22 a31 − a11 a23 a32 − a12 a21 a33 .
Die Regel gilt jedoch nicht für (4 × 4)-Matrizen oder höherdimensionale Matrizen!
Satz 4.24 Seien A, b ∈ Rn×n . Dann gilt
(1) det(AB) = det A · det B.
34
(2) det(A⊤ ) = det A.
(3) A ist invertierbar genau dann, wenn det A 6= 0. In diesem Fall gilt det(A−1 ) =
1/ det A.
e die Matrix, die entsteht, wenn man bei der Matrix A zwei Zeilen oder zwei
(4) Ist A
e = − det A.
Spalten miteinander vertauscht, so gilt det A
Beachten Sie jedoch, daß im allgemeinen
det(A + B) 6= det A + det B,
denn beispielsweise
"
!
!#
!
!
!
1 0
1 0
2 0
1 0
1 0
det
+
= det
= 4 6= 1 + 1 = det
+ det
.
0 1
0 1
0 2
0 1
0 1
Die Entwicklung nach einer Zeile oder Spalte erlaubt eine sehr einfache Berechnung
von Matrizen, deren Elemente unterhalb der Hauptdiagonalen alle gleich null sind:


a11 a12 · · · a1n


 0 a22 · · · a2n 

det  .
.. 
...
 = a11 a22 · · · ann .
.
. 
0
 .
0
0
ann
Solche Matrizen werden gerade beim Gauß-Algorithmus erzeugt! Da der Gauß-Algorithmus
den Wert der Determinante einer Matrix nicht ändert, kann die Determinante grundsätzlich mit diesem Algorithmus berechnet werden.
Beispiel 4.25 Sei wie in Beispiel 4.23 die Matrix


3 0
2


A = 1 −1 3 
2 4 −2
gegeben. Der Gauß-Algorithmus


3
0
2


3  − 13 · I
 1 −1
2
4 −2 − 32 · I
ergibt:


3
0
2


7/3 
 0 −1
0
4 −10/3 +4 · II


3
0
2


 0 −1 7/3  .
0
0
6
Die Determinante ist dann das Produkt der Hauptdiagonalelemente: det A = 3 · (−1) · 6 =
−18 in Übereinstimmung mit dem obigen Ergebnis.
35
4.5
Lineare Unabhängigkeit
Kann man einer Matrix “ansehen”, ob sie invertierbar ist bzw. (nach Satz 4.24 (3)) eine
verschwindende Determinante hat? In einem gewissen Sinne gibt das Konzept der linearen
Unabhängigkeit eine Antwort.
Definition 4.26 Die Vektoren a1 , . . . , ak ∈ Rn heißen linear unabhängig, wenn aus dem
Ansatz
k
X
λ i ai = 0
mit λi ∈ R
i=1
folgt, daß λ1 = . . . = λk = 0. Anderenfalls heißen sie linear abhängig.
Beispiel 4.27 (1) Seien
!
1
,
1
a1 =
Dann folgt aus
λ1
1
1
!
+ λ2
a2 =
!
2
.
2
!
2
=
2
!
0
0
nicht λ1 = λ2 = 0, denn λ1 = 2, λ2 = −1 ist auch eine Lösung. Es folgt also 2a1 − a2 = 0
oder a2 = 2a1 . Die Vektoren a1 und a2 sind linear abhängig. Dies können wir auch sehen,
indem wir den Gauß-Algorithmus für das lineare Gleichungssystem
!
!
1 2
λ1
=0
1 2
λ2
durchführen:
1 2 0
1 2 0
!
1 2 0
0 0 0
−I
Wir erhalten eine Gleichung 1 · λ1 + 2 · λ2 =
gibt unendlich viele Lösungen.
(2) Seien

 
1

2

 
a2 = 
a1 =   ,

0
−1
Aus dem Ansatz
!
.
0 für zwei Unbekannte λ1 und λ2 , d.h., es

2
1

,
0
−1

1
2
 
a3 =  
−1

0.
   
 

0
1
2
1
 2  0
1
2
   
 
 
λ1   + λ2   + λ3   =  
−1 0
0
0
0
0
−1
−1

36
ergibt sich das folgende Gleichungssystem, das wir mit dem Gauß-Algorithmus lösen:






1
2
1 0
1
2
1 0
1
2
1 0
 0 −3
 2
 0 −3
1
2 0 
0 0 
0 0 


 −2 · I







.


 0



0 −1 0
0
0 −1 0
0
0 −1 0 
+I
−1 −1
0 0
0
1
1 0 + 13 · II
0
0
1 0
Es folgt aus der dritten und vierten Gleichung, daß λ3 = 0, aus der zweiten Gleichung,
daß λ2 = 0, und schließlich aus der ersten Gleichung, daß λ1 = 0. Die Vektoren sind
folglich linear unabhängig.
Definition 4.28 Der Rang einer Matrix A ∈ Rm×n ist die (maximale) Anzahl der linear
unabhängigen Zeilen oder Spalten. Wir schreiben rg A für den Rang von A.
Beispiel 4.29 (1) Sei wie in Beispiel 4.18 (2)
!
1 1
.
2 2
A=
Wir haben in Beispiel 4.27 (1) gezeigt, daß
rg A = 1 (eine linear unabhängige Zeile).
(2) Sei

1
2

A=
0
−1
die Zeilen von A linear abhängig sind, d.h.

2
1
1
2

.
0 −1
−1 0
Wir haben in Beispiel 4.27 (2) gezeigt, daß alle Spalten von A linear unabhängig sind,
d.h. rg A = 3.
Es gibt folgenden Zusammenhang zwischen Invertierbarkeit, Determinante und Rang
einer Matrix.
Satz 4.30 Sei A ∈ Rn×n . Dann gilt
A invertierbar
⇐⇒
det A 6= 0
⇐⇒
rg A = n.
Der Rang einer Matrix gibt Informationen über die Lösbarkeit von linearen Gleichungssystemen. Betrachte
a11 x1 + a12 x2 + . . . + a1n xn
a21 x1 + a22 x2 + . . . + a2n xn
..
.
= 0,
= 0,
..
.
am1 x1 + am2 x2 + . . . + amn xn = 0.
37
Schreiben wir λi anstatt xi , so können wir dies auch formulieren als
  





0
a1n
a12
a11
  





 a2n  0
 a22 
 a21 
 .  = . .



+
·
·
·
+
λ
+
λ
λ1 
n
2
 .  .
 .. 
 .. 
 .  .
 . 
 . 
amn
am2
am1
0
Sind die Spalten von A = (aij ) linear unabhängig (bzw. gilt det A 6= 0), so folgt λ1 =
. . . = λn = 0. Das Gleichungssystem Ax = 0 besitzt also nur die Lösung x = 0. Das ist
eigentlich klar, denn in diesem Fall ist A invertierbar und
x = A−1 Ax = A−1 0 = 0.
Wir können also Satz 4.30 erweitern zu:
Ax = 0 besitzt die eindeutige Lösung x = 0
4.6
⇐⇒
det A 6= 0.
Lösungstheorie linearer Gleichungssysteme
In diesem Abschnitt wollen wir mittels des Rangbegriffes die Lösbarkeit linearer Gleichungssysteme Ax = b genauer charakterisieren. Ein lineares Gleichungssystem hat keine,
genau eine oder unendlich viele Lösungen. Genauer gilt:
Satz 4.31 Seien A ∈ Rm×n und b ∈ Rm . Dann folgt
(1) rg A 6= rg (A|b) =⇒ Ax = b hat keine Lösung.
(2) rg A = rg (A|b) = n =⇒ Ax = b hat genau eine Lösung.
(3) rg A = rg (A|b) < n =⇒ Ax = b besitzt eine unendliche Schar von Lösungen, die
durch n − rg A Parameter beschrieben wird.
Beispiel 4.32 (1) Seien


1 0


A = 1 1 ,
0 1
 
1
 
b1 = 1 ,
0
 
1
 
b2 = 0 .
0
Dann gilt rg A = 2, rg (A|b1 ) = 2 (die erste und dritte Spalte sind gleich, also linear
abhängig) und rg (A|b2 ) = 3. Daher besitzt
• Ax = b1 wegen n = 2 = rg A = rg (A|b) genau eine Lösung;
• Ax = b2 keine Lösung.
38
Wir überprüfen diese Aussagen; Ax = b2 bedeutet ausgeschrieben
1 · x1 + 0 · x2 = 1,
1 · x1 + 1 · x2 = 0,
0 · x1 + 1 · x2 = 0.
Die erste und dritte Gleichung implizieren x1 = 1 und x2 = 0. Die zweite Gleichung ergibt
0 = x1 + x2 = 1,
also einen Widerspruch. Das Gleichungssystem kann keine Lösung besitzen. Das System
Ax = b1 bedeutet
x1 = 1,
x1 + x2 = 1,
x2 = 0.
Die eindeutig bestimmte Lösung lautet x = (1, 0)⊤ .
(2) Seien
!
1 1 0
A=
,
b=
0 1 1
!
0
.
0
Dann existiert wegen rg A = 2 = rg (A|b) < 3 eine linear unabhängige Lösung. Wir
können sie aus
x1 + x2 = 0,
x2 + x3 = 0
berechnen, indem wir x2 als Parameter betrachten:
x1 = −λ,
d.h., alle Vektoren
x3 = −λ,
x2 = λ,
 
 
x1
−1
 
 
x = x2  = λ  1 
x3
−1
sind Lösungen von Ax = b. Eine linear unabhängige Lösung lautet (−1, 1, −1)⊤ .
Der Gauß-Algorithmus erlaubt auch die Bestimmung der Inverse einer Matrix. Das
geht wie folgt.
Beispiel 4.33 Sei


1 −2 2


A = 1 1 −1 .
2 3
1
Wir schreiben für den Gauß-Algorithmus
(A|E),
39
wobei E die (3 × 3)-Einheitsmatrix ist. Das Ziel lautet, die linke Seite so umzuformen,
daß wir die Einheitsmatrix erhalten. Dann erhalten wir rechts die Inverse:
(E|A−1 ).
Genauer ist:
Wir erhalten daher


1 −2 2 1 0 0


 1 1 −1 0 1 0 
2 3
1 0 0 1


1 0 0
1 −2 2


 0 3 −3 −1 1 0 
0 7 −3 −2 0 1


1
2
0
1 0 0
3
3


1
1
−
0
1
−1
0 

3
3
1
− 37 1
0 0 4
3


2
0
1 0 0 13
3


 0 1 0 − 41 − 41 14 
1
7
1
0 0 1 12
− 12
4
A−1

−I
−2 · I
+ 32 · II
:3
− 37 · II
+ 14 · III
:4

4
8 0
1 

=
−3 −3 3 .
12
1 −7 3
40
5
Folgen und Reihen
5.1
Folgen
Definition 5.1 Wir nennen die Abfolge von (reellen oder komplexen) Zahlen a1 , a2 , a3 , . . .
eine Folge. Die Elemente an heißen Folgenglieder, und wir schreiben kurz (an ) für die
Folge.∗
Beispiel 5.2 (1) Die Vermehrung von Kaninchen wird häufig durch die Fibonacci-Folge
beschrieben. Ein Kaninchenpaar werfe von jedem zweiten Monat an ein junges Paar und
in jedem weiteren Monat ein weiteres Paar. Ist an die Anzahl der Kaninchenpaare im
Monat n, so wird an+1 rekursiv definiert durch
an+1 = an + an−1 ,
n ∈ N,
a0 = 1,
a1 = 1.
Die ersten Folgenglieder sind
a2 = 2,
a3 = 3,
a4 = 5,
a5 = 8,
a6 = 13,
a7 = 21,
usw.
Fibonacci-Zahlen treten in einer Vielzahl von Anwendungen auf. Einige Beispiele sind:
• Für immer größere n ∈ N nähert sich das Verhältnis an+1 /an dem Goldenen Schnitt
√
an, nämlich der Zahl (1+ 5)/2 ≈ 1.6180. Der Name rührt daher, daß das Verhältnis
√
1 zu (1 + 5)/2 als besonders ästhetisch empfunden wird.
• Die Summen der Diagonalelemente des Pascalschen Dreiecks (siehe Abbildung 5.1)
sind Fibonacci-Zahlen.
(2) Wir haben in Kapitel 1 die Menge Nn einer radioaktiven Substanz zur Zeit n · △t
bestimmt:
n
1
,
n≥2
Nn = 1 −
n
(Falls αt = 1; siehe Kapitel 1). Dann ist N2 , N3 , N4 , . . . eine Folge. Die ersten Folgenglieder
lauten
4
3
1
3
2
N2 = = 0.25,
= 0.2963 . . . ,
N4 =
= 0.3164 . . . ,
N3 =
4
3
4
und weiter
10
9
= 0.3487 . . . ,
N10 =
10
N100 =
99
100
100
= 0.3660 . . . ,
N1000 = 0.3677 . . .
Wir können Folgen mit dem Funktionenbegriff aus Kapitel 3 genauer als Funktionen f : N → R mit
f (n) = an definieren.
∗
41
Es scheint, daß sich Nn für immer größeres n einem Wert nähert.
(3) Definiere die Folge
1
2
an+1 =
an +
,
n ∈ N, a1 = 1.
2
an
Die ersten Folgenglieder lauten
a2 = 1.5,
a3 = 1.4166 . . . ,
1
1
1
1
1
1
1
1
1
2
3
4
5
6
7
a10 = 1.4142 . . . ,
1
3
6
10
15
21
a100 = 1.4142 . . .
1
4 1
10 5 1
20 15 6 1
35 35 21 7 1
Abbildung 5.1: Die Summe der Diagonalelemente im Pascalschen Dreieck ergibt die
Fibonacci-Zahlen, z.B. 1 + 4 + 3 = 0, 1 + 5 + 6 + 1 = 13,1 + 6 + 10 + 4 = 21 usw.
Es scheint, als strebe die Folge an für große n gegen den Wert 1.4142 . . . . Wir vermuten,
daß an den Wert
√
2 = 1.4142 . . .
annähert.
Die obigen Beispiele legen nahe, daß es Folgen gibt, die für immer größere n einen
Grenzwert besitzen. Dieser Begriff wird in der folgenden Definition präzisiert.
Definition 5.3 (1) Eine Folge (an ) besitzt den Grenzwert (oder Limes) a ∈ R genau
dann, wenn
∀ ε > 0 : ∃ n0 ∈ N : ∀ n ≥ n0 : |an − a| ≤ ε.
Wir schreiben in diesem Fall
lim an = a
n→∞
an → a (n → ∞).
oder
42
Eine nicht konvergente Folge heißt divergent. Eine konvergente Folge mit Grenzwert a = 0
heißt Nullfolge.
(2) Die Folge (an ) heißt beschränkt genau dann, wenn
∃M >0:∀n∈N:
|an | ≤ M.
Beispiel 5.4 Sei an = 1/n, n ∈ N. Wir vermuten, daß (an ) eine Nullfolge ist. Sei dazu
ε > 0. Wir wählen ein n0 ∈ N, so daß n0 ≥ 1/ε. Dann folgt für beliebiges n ≥ n0
|an − 0| = |an | =
1
1
≤
≤ ε.
n
n0
Also ist limn→∞ (1/n) = 0.
Satz 5.5 Konvergente Folgen sind beschränkt.
Beispiel 5.6 Klarerweise ist an = 1/n beschränkt mit Schranke M = 1, denn an =
1/n ≤ 1. Die Folge der Fibonacci-Zahlen ist unbeschränkt und muß daher divergent sein,
denn wäre sie konvergent, wäre sie ja nach Stz 5.5 beschränkt, was nicht zutrifft.
Wichtig sind die folgenden Grenzwertsätze.
Satz 5.7 (Grenzwertsätze)
Seien (an ), (bn ) konvergente Folgen mit Grenzwerten a bzw. b. Dann gilt:
(1) limn→∞ (an ± bn ) = a ± b;
(2) limn→∞ (an · bn ) = a · b;
(3) limn→∞ (an /bn ) = a/b, falls bn 6= 0 und b 6= 0;
(4) ∀ n ∈ N : an ≤ bn =⇒ a ≤ b.
Beachte, daß aus an < bn für alle n ∈ N nicht a < b folgt. Ein Gegenbeispiel ist
an = 1/(n + 1) und bn = 1/n (denn a = b = 0).
Beispiel 5.8 (1) Sei
n2 − n
,
n ∈ N.
3n2 + 1
Aus limn→∞ (1/n) = 0 und limn→∞ (1/n2 ) = 0 folgt mit Satz 5.7
an =
1 − limn→∞ n1
1 − n1
1
=
lim an = lim
1 = .
n→∞
n→∞ 3 + 12
3
3 + limn→∞ n2
n
43
(2) Sei bn = an+1 /an der Verhältnis zweier aufeinander folgender Fibonacci-Zahlen.
Aus an+1 = an + an−1 folgt dann
bn =
1
an + an−1
=1+
.
an
bn−1
Angenommen, (bn ) konvergiere gegen b. Dann ergibt Satz 5.7
1
b = lim bn = 1 +
limn→∞ bn−1
n→∞
oder b2 − b − 1 = 0. Diese Gleichung hat die zwei
r
1
1
+1=
b1/2 = ±
2
4
=1+
1
b
Lösungen
√
1
(1 + 5),
2
√
von denen aber nur eine positiv (und damit für uns relevant ist), nämlich b1 = (1 + 5)/2.
Dieses ist gerade der Goldene Schnitt, d.h.
√
1
an+1
= (1 + 5).
n→∞ an
2
lim
(3) Sei (an ) rekursiv definiert durch
an+1 =
1
+ a2n ,
4
n ∈ N,
a1 = 1.
Angenommen, (an ) konvergiere gegen a. Wir erhalten dann mit Satz 5.7
a = lim an+1 =
n→∞
oder a2 − a +
1
4
1
1
+ lim a2n = + a2
n→∞
4
4
= 0. Diese Gleichung besitzt genau eine Lösung: a = 12 . Wir schließen
1
lim an = .
2
n→∞
Die ersten Folgenglieder von (an ) sind
a1 = 1,
a2 =
5
> 1,
4
a3 =
29
> 1,
16
a4 =
84100
> 1,
256
usw.
Man kann zeigen, daß an > 1 für alle n ≥ 2. Aus Satz 5.7 (4) folgt dann
1
= a = lim an ≥ 1,
n→∞
2
Widerspruch!
Was ist schiefgelaufen? Die Folge (an ) ist divergent! Bevor man die Grenzwertsätze anwendet, muß man also prüfen, ob die entsprechenden Folgen wirklich konvergieren.
44
Beispiel 5.9 Ein wichtiges Beispiel ist die Folge an = (1 + 1/n)n , n ∈ N. Eine naive
Anwendung der Grenzwertsätze würde auf
lim an =
n→∞
1
1 + lim
n→∞ n
limn→∞ n
= (1 + 0)∞ = 1∞ = 1
führen. Diese Argumentation ist jedoch falsch, denn der Grenzwert n → ∞ muß simultan
für den Quotienten 1/n und den Exponenten n durchgeführt werden und nicht separat.
Einige Folgenglieder lauten
a1 = 1,
a10 = 2.5937 . . . ,
a100 = 2.7048 . . . ,
a1000 = 2.7169 . . . ,
a10000 = 2.7181 . . .
Es scheint also, daß die Folge (an ) gegen einen Wert 2.718 . . . konvergiert. Tatsächlich
kann man zeigen, daß (an ) gegen die Eulersche Zahl e konvergiert:
1 n
1+
= 2.7182818 . . . = e.
n→∞
n
lim
5.2
Reihen
Definition 5.10 (1) Sei (an ) eine Folge. Man nennt die Folge (sn ) der Partialsummen,
sn =
n
X
ak ,
k=1
P
eine (unendliche) Reihe und schreibt kurz ∞
k=1 ak .
P∞
(2) Die Reihe
k=1 ak heißt konvergent genau dann, wenn (sn ) konvergiert. Man
schreibt s = limn→∞ sn und schreibt kurz
s=
∞
X
ak .
k=1
Das Symbol
P∞
k=1
ak hat also eine Doppelbedeutung:
• Es bezeichnet die Folge der Partialsummen (sn ) und
• es bezeichnet den Grenzwert von (sn ), falls er existiert.
Beispiel 5.11 (1) Reihen treten in zahlreichen physikalischen und chemischen Anwendungen auf. Ein Beispiel ist die Gesamtanzahl entstandener Moleküle in einer chemischen
Reaktion. Wir nehmen an, daß im Zeitraum [n, n + 1] etwa an = e−n (n ∈ N0 ) Moleküle
45
erzeugt werden. Dann liefert die Reaktion nach einiger Zeit zwar nur sehr wenige Moleküle, aber theoretisch läuft die Reaktion im Zeitintervall [0, ∞) ab. Die Anzahl aller
erzeugten Moleküle lautet also
∞
∞
X
X
an =
e−n .
n=0
n=0
(2) Reihen werden auch benötigt, um einige elementare Funktionen zu definieren. So
ist die Exponentialfunktion ex etwa definiert durch die Reihe
ex =
∞
X
xn
n=0
n!
,
x ∈ R.
Man kann zeigen, daß diese Reihe für alle x ∈ R konvergiert. Auch die trigonometrischen
Funktionen sin und cos sind als Reihen definiert, etwa
∞
X
(−1)n 2n+1
sin x =
x
,
(2n + 1)!
n=0
x ∈ R.
Beispiel 5.12 (1) Man nennt
∞
X
qk
k=1
mit q ∈ R
die geometrische Reihe. Wegen
(1 − q)
n
X
k=0
q k = (1 + q + . . . + q n ) − (q + q 2 + . . . + q n+1 ) = 1 − q n+1
lauten die Partialsummen
n
X
k=0
qk =
1 − q n+1
,
1−q
falls q 6= 1.
Aus Satz 5.7 ergibt sich
∞
X
q k = lim
k=0
n→∞
n
X
qk =
k=0
1 − limn→∞ q n+1
.
1−q
Der Grenzwert auf der rechten Seite existiert genau dann, wenn |q| < 1, nämlich limn→∞ q n+1 =
0. Folglich ist
∞
X
1
qk =
für |q| < 1.
1−q
k=1
(2) Die harmonische Reihe
∞
X
1
k=1
46
k
ist divergent. Der Beweis ist nicht einfach, folgt aber aus der Ungleichung
m
2
X
1
k=1
k
≥1+
m
.
2
(3) Betrachte die Reihe
s=
∞
X
k=0
(−1)k 2k = 1 − 2 + 4 − 8 ± . . .
Dann erhalten wir
1 − 2s = 1 −
∞
X
(−1)k 2k+1 = 1 +
k=0
∞
X
(−1)k+1 2k+1 = 1 +
∞
X
j=1
k=0
(−1)j 2j =
∞
X
(−1)j 2j = s
j=0
und damit s = 1/3. Da die Reihenglieder alles natürliche Zahlen sind, sollte auch der
Grenzwert eine natürliche Zahl sein. Was ist schiefgelaufen? Ganz einfach: Die Reihe
konvergiert nicht, d.h., s existiert nicht!
Aus den Sätzen 5.5 und 5.7 erhalten wir sofort die Grenzwertsätze für Reihen.
Satz 5.13 Seien
(1)
(2)
(3)
P∞
k=1 (ak
P∞
k=1
P∞
k=1
P∞
k=1
± bk ) =
λak = λ
ak und
P∞
k=1
P∞
k=1
P∞
k=1 bk
ak ±
ak ;
P∞
konvergente Reihen und sei λ ∈ R. Dann gilt:
k=1 bk ;
ak ist konvergent ⇐⇒ (sn ) ist beschränkt.
Beispiel 5.14 Wir zeigen, daß die Reihe
sn =
n
X
k=1
=1−
n
X
1
=
k(k + 1) k=1
1
≤ 1,
n+1
1
1
−
k k+1
P∞
1
k=1 k(k+1)
konvergiert. Es gilt nämlich
1
1
1
1
1
+ ... + +
= 1 + + ... +
−
2
n
2
n n+1
d.h., (sn ) ist beschränkt. Aus Satz 5.13 (3) folgt die Behauptung. Beachte, daß wir den
Wert der Reihe nicht bestimmt haben!
Folgende Kriterien sind nützlich, um eine Reihe auf Konvergenz zu testen.
Satz 5.15 Seien (an ) und (bn ) Folgen.
(1) Notwendiges Kriterium:
P∞
k=1
ak ist konvergent =⇒ (an ) ist eine Nullfolge.
47
(2) Leibnizkriterium: Wenn (an ) eine monoton fallende Nullfolge ist, d.h.
dann ist
P∞
an+1 ≤ an
k
k=1 (−1) ak
für alle n ∈ N,
lim an = 0,
n→∞
konvergent.
(3) Majorantenkriterium: Gilt |ak | ≤ bk für alle k und ist
P
vergiert auch ∞
k=1 ak .
P∞
k=1 bk
konvergent, so kon-
P
(4) Minorantenkriterium: Gilt |ak | ≥ bk für alle k und ist ∞
k=1 bk divergent, so auch
P∞
k=1 ak .
p
P
(5) Wurzelkriterium: Wenn limk→∞ k |ak | ≤ q < 1, so ist ∞
k=1 ak konvergent.
P
(6) Quotientenkriterium: Wenn limk→∞ |ak+1 /ak | ≤ q < 1, so ist ∞
k=1 ak konvergent.
P
n!
Beispiel 5.16 (1) Betrachte die Reihe ∞
n=0 nn . Um zu prüfen, ob diese Reihe konvergiert
oder nicht, müssen wir eines der obigen Konvergenzkritierien anwenden. Einen schnellen
Nachweis erlauben meist das Wurzel- oder Quotientenkriterium (falls ansonsten nicht
klar ist, welches Kriterium angewendet werden sollte). Das Wurzelkriterium führt mit
ak = k!/k k auf
√
√
k
k
p
k!
k!
k
|ak | = √
=
.
k
k
k
k
√
Die Schwierigkeit ist hier die Berechnung von k k!, die nicht ohne weiteres möglich ist.
Daher versuchen wir das Quotientenkriterium:
k
ak+1 (k + 1)k k
kk
1
= (k + 1)! k =
=
=
.
ak (k + 1)k+1 k!
k
k
(k + 1) · (k + 1)
(k + 1)
(1 + 1/k)k
Die Folge (1 + 1/k)k haben wir bereits im vorigen Abschnitt kennengelernt. Es gilt:
limk→∞ (1 + 1/k)k = e. Damit ist
ak+1 1
= < 1.
lim
k→∞ ak e
Also ist die Reihe nach dem Quotientenkriterium konvergent.
P
n1
(2) Die Folge ∞
n=1 (−1) n ist nach dem Leibniz-Kriterium konvergent, aber nicht
X
∞
∞ X
1
1
n
(−1) =
,
n
n
n=1
n=1
denn dies ist die harmonische Reihe, die divergiert (siehe Beispiel 5.12 (2)).
P
1
(3) Die Reihe ∞
k=1 k2 ist konvergent, denn
|ak | =
1
1
2
≤
·
2
k
k
k+1
48
für k ≥ 1
und die Reihe
∞
X
k=1
∞
X
1
2
=2
k(k + 1)
k(k + 1)
k=1
ist nach Beispiel 5.14 konvergent. Die Behauptung folgt also aus dem Majorantenkriterium.
P
1
(4) Die Reihe ∞
n=0 n! ist konvergent nach dem Quotientenkriterium, denn mit an =
1/n! folgt
an+1 1
1
n!
für alle n ≥ 1.
an = (n + 1)n! = n + 1 ≤ 2
P
1
Übrigens ist ∞
n=0 n! = e.
Es ist wichtig, für das Wurzel- und Quotientenkriterium eine Zahl q < 1 und nicht nur
q ≤ 1 zu finden, da sonst die Aussage nicht gilt. Ein Beispiel ist die harmonische Reihe,
für die zwar gilt
an+1 n
an = n + 1 < 1,
aber man kann kein q < 1 finden, so daß n/(n + 1) ≤ q für alle n ≥ 1 erfüllt ist!
Beachte außerdem, daß die Umkehrung des notwendigen Kriteriums i.a. nicht gilt:
P
Ist die Folge (an ) konvergent, so folgt daraus nicht unbedingt, daß die Reihe ∞
an
P∞ k=1
ebenfalls konvergent ist. Ein Gegenbeispiel ist wieder die harmonische Reihe k=1 1/k,
denn die Folge (1/n) konvergiert (gegen null), aber die Reihe ist divergent.
49
6
Differentiation
6.1
Stetigkeit
Aus den Grenzwertsätzen folgt für eine gegen x ∈ R konvergierende Folge (xn ), daß auch
lim x2n =
n→∞
gilt. Folgt dann auch allgemein
lim f (xn ) = f
n→∞
lim xn
n→∞
2
= x2
lim xn = f (x)?
n→∞
Die Frage kann bejaht werden, sofern f stetig ist. Dieser Begriff wird im folgenden definiert.
Definition 6.1 (1) Sei f : Df ⊂ R → R eine Funktion. Sie konvergiert gegen a ∈ R für
x → x0 genau dann, wenn für alle Folgen (xn ) ⊂ Df \{x0 } mit xn → x0 (n → ∞) gilt
f (xn ) → a (n → ∞). In diesem Fall schreibt man
lim f (x) = a.
x→x0
(2) Die Funktion f : Df ⊂ R → R heißt stetig in x0 ∈ Df genau dann, wenn
lim f (x) = f ( lim x) = f (x0 )
x→x0
x→x0
(6.1)
gilt. Sie heißt stetig, falls sie in jedem x0 ∈ Df stetig ist.
Beispiel 6.2 (1) Sei f (x) = x3 +2x2 , x ∈ R. Ist f stetig in x0 ∈ R? Sei (xn ) eine beliebige
Folge mit xn → x0 (n → ∞). Aus den Grenzwertsätzen folgt
lim f (xn ) = lim (x3n + 2x2n ) = ( lim xn )3 + 2( lim xn )2 = x30 + 2x20 = f (x0 ).
n→∞
n→∞
n→∞
n→∞
Da x0 und (xn ) beliebig war, ist f stetig in jedem x0 ∈ R, also ist f stetig.
(2) Sei
(
−2x − 2 für x ≤ 0,
f (x) =
2 + 2x für x > 0.
Ist f stetig in x0 = 0? Sei xn = 1/n, n ∈ N. Dann folgt
f (xn ) = 2 − 2xn = 2 −
2
→2
n
(n → ∞),
also ist
lim f (xn ) = 2 6= −2 = f (0).
n→∞
Die Funktion ist nicht stetig in x0 = 0 (Abbildung 6.1).
50
y
f (x)
2
x
−2
Abbildung 6.1: Graph der Funktion f aus Beispiel 6.2 (2).
Der folgende Satz erweitert die Grenzwertsätze.
Satz 6.3 Seien f , g und h Funktionen, so daß f und g stetig in x0 (mit g(x0 ) 6= 0) und
h stetig in y0 = f (x0 ) sind. Dann gilt:
(1) f ± g, f · g und f /g sind stetig in x0 ;
(2) die Verkettung h ◦ f , definiert durch (h ◦ f )(x) = h(f (x)), ist stetig in x0 .
Satz 6.3 zeigt, daß alle betrachteten elementaren Funktionen stetig sind, beispielsweise
alle Polynome, exp, ln, sin, cos, sinh, cosh, usw.
6.2
Die Ableitung
Die Ableitung einer Funktion in einem Punkt ist die Steigung der Tangente in diesem
Punkte (siehe Abbildung 6.2). Diese Konstruktion ist möglich, wenn der Graph der Funktion “glatt” ist. Schwierigkeiten gibt es etwa bei der Funktion in Abbildung 6.1: Die
Tangente an x0 = 0 hat die Steigung −2 (am Kurventeil für x < 0) bzw. die Steigung +2
(am Kurventeil für x > 0). Für die Ableitung ist die Stetigkeit ein notwendiges Kriterium.
Sie ist nicht ausreichend, wie Abbildung 6.2 rechts zeigt: An der Stelle x0 = 0 gibt es keine
eindeutige Tangente.
Die Gleichung der Tangente t(x) lautet
t(x) = f (x0 ) + α(x − x0 ),
wobei α die Tangentensteigung ist. Falls x ≈ x0 , gilt f (x) ≈ t(x) und
α≈
f (x) − f (x0 )
.
x − x0
51
y
y
Tangente an x0
f (x)
f (x)
t(x)
0
x
x0
x
Abbildung 6.2: Illustration der Tangente am Punkt x0 (links). Die rechte Funktion besitzt
an x0 = 0 keine eindeutige Tangente.
Die Tangentensteigung ist also näherungsweise gleich der Sekantensteigung. Wir definieren
sie als den Grenzwert der Sekantensteigungen.
Definition 6.4 Sei I ⊂ R ein Intervall und f : I → R eine Funktion. Dann heißt f
differenzierbar in x0 ∈ I, falls der Grenzwert
lim
x→x0
f (x) − f (x0 )
x − x0
df
(x0 ) für diesen Grenzwert und nennt
existiert. In diesem Fall schreibt man f ′ (x0 ) oder dx
ihn die Ableitung von f an x0 . Eine Funktion heißt differenzierbar, wenn sie in allen
x0 ∈ I differenzierbar ist. Sie heißt stetig differenzierbar, wenn sie differenzierbar und die
Ableitung stetig ist.
Bemerkung 6.5 (1) Schreibt man x0 + h = x, so kann die Definition der Ableitung auch
formuliert werden als
f (x0 + h) − f (x0 )
.
f ′ (x0 ) = lim
h→0
h
df
wird auch Differentialquotient genannt; es ist allerdings kein Quo(2) Das Symbol dx
tient!
(3) Wir können x 7→ f ′ (x) wieder als Funktion interpretieren. Analog können höhere
Ableitungen definiert werden:
f ′′ (x0 ) = lim
x→x0
f ′ (x) − f ′ (x0 )
x − x0
52
usw.
Beispiel 6.6 (1) Sei f (x) = x2 , x ∈ R. Sei x0 ∈ R. Dann gilt
f (x0 + h) − f (x0 )
(x0 + h)2 − x20
=
= 2x0 + h
h
h
und daher
f (x0 + h) − f (x0 )
= lim (2x0 + h) = 2x0 .
h→0
h→0
h
Die Funktion f ist also an jeder Stelle differenzierbar und f ′ (x) = 2x. Allgemein gilt:
lim
f (x) = xα
⇒
f ′ (x) = αxα−1 ,
α ∈ R.
(6.2)
(2) Sei f (x) = |x|, x ∈ R (siehe Abbildung 6.2 rechts). Sei x0 = 0. Wegen
f (x0 + h) − f (x0 )
|x0 + h| − |x0 |
|h|
=
=
h
h
h
unterscheiden wir zwei Fälle:
• h>0:
1
(f (x0
h
+ h) − f (x0 )) = 1;
• h<0:
1
(f (x0
h
+ h) − f (x0 )) = −1.
Dies bedeutet, daß f ′ (x0 ) nicht existiert. Übrigens ist f (x) an jeder anderen Stelle differenzierbar mit
(
1 für x > 0,
f ′ (x) =
−1 für x < 0.
Die Ableitung f ′ ist nur für alle x ∈ R, x 6= 0, definiert.
Die elementaren Funktionen aus Abschnitt 3.3 sind differenzierbar; ihre Ableitungen
lauten:
f (x)
xα
ex ln x sin x cos x tan x sinh cosh
f ′ (x) αxα−1 ex x1 cos x − sin x cos12 x cosh sinh
6.3
Rechenregeln
Satz 6.7 Seien f und g differenzierbare Funktionen und a, b ∈ R. Dann sind auch af +bg,
f · g und f /g (falls g(x) 6= 0) differenzierbar, und es gilt:
(1) Linearität: (af + bg)′ = af ′ + bg ′ ,
(2) Produktregel: (f · g)′ = f ′ · g + f · g ′ ;
′
f
f ′ · g − f · g′
.
(3) Quotientenregel:
=
g
g2
53
Beispiel 6.8 (1) Sei
P (x) =
n
X
ak x k
k=0
mit n ∈ N, ak ∈ R,
ein Polynom. Dann ist P differenzierbar, und es gilt nach (6.2):
P ′ (x) =
n
X
ak kxk−1 .
k=1
(2) Sei f (x) = tan x, −π/2 < x < π/2. Dann ist nach der Quotientenregel
′
sin′ x cos x − sin x cos′ x
cos2 x + sin2 x
1
sin x
′
=
f (x) =
=
=
.
2
2
cos x
cos x
cos x
cos2 x
Die Produktregel kann für höhere Ableitungen verallgemeinert werden. Für genügend
oft differenzierbare Funktionen f und g folgt
(f · g)′′ = (f ′ g + f g ′ )′ = (f ′′ g + f ′ g ′ ) + (f ′ g ′ + f g ′′ )
= f ′′ g + 2f ′ g ′ + f g ′′ ,
(f · g)′′′ = (f ′′′ g + f ′′ g ′ ) + 2(f ′′ g ′ + f ′ g ′′ ) + (f ′ g ′′ + f g ′′′ )
= f ′′′ g + 3f ′′ g ′ + 3f ′ g ′′ + f g ′′′
usw.
Die Koeffizienten lauten also:
1 Ableitung: 1, 1;
2 Ableitungen: 1, 2, 1;
3 Ableitungen: 1, 3, 3, 1.
Diese Folge kommt uns bekannt vor: siehe das Pascalsche Dreieck aus Abschnitt 2.3!
Wir schließen, daß der Koeffizient vor dem Produkt f (k) , g (n−k) (d.h. k-te Ableitung von
f und (n − k)-te Ableitung von g) gerade der Binomialkoeffizient nk ist. Dies motiviert
den folgenden Satz.
Satz 6.9 (Leibniz-Formel)
Seien f und g n-mal differenzierbar. Dann ist auch f · g n-mal differenzierbar, und es gilt
n X
n (k) (n−k)
(n)
f g
.
(f · g) =
k
k=0
Satz 6.10 (Kettenregel)
Seien f eine in x0 differenzierbare Funktion und g eine in f (x0 ) differenzierbare Funktion.
Dann ist h(x) = (g ◦ f )(x) = g(f (x)) in x0 differenzierbar, und es gilt:
h′ (x0 ) = (g ◦ f )′ (x0 ) = g ′ (f (x0 )) · f ′ (x0 ).
Man nennt g ′ (f (x0 )) die äußere Ableitung und f ′ (x0 ) die innere Ableitung.
54
Wir können die Kettenregel mit Hilfe des Differentialquotienten auch einprägsam wie
folgt formulieren. Seien g(y) und y(x) differenzierbar. Dann ist
dg dy
dg
=
.
dx
dy dx
Die linke Seite entspricht der Ableitung
d
g(y(x)),
dx
die rechte g ′ (y(x)) · y ′ (x).
Beispiel 6.11 (1) Sei h(x) = sin(x2 ), x ∈ R. Definiere f (x) = x2 und g(y) = sin y. Dann
ist h = g ◦ f , f ′ (x) = 2x, g ′ (y) = cos y, also
h′ (x) = g ′ (f (x))f ′ (x) = 2x cos(x2 ).
(2) Die Menge einer radioaktiven Substanz sei gegeben durch
N (t) = N0 e−αt ,
t > 0,
α > 0.
Definiere f (t) = −αt und g(x) = N0 ex . Dann ist N = g ◦ f , und aus f ′ (t) = −α und
g ′ (x) = N0 ex folgt:
N ′ (t) = g ′ (f (t))f ′ (t) = −αN0−αt = −αN (t).
Dies ist die Differentialgleichung aus Beispiel 1.2.
(3) Sei h(x) = ax mit a > 0. Man ist vielleicht versucht, für die Ableitung h′ (x) =
x
xax−1 zu schreiben; dies ist jedoch falsch! Schreiben wir nämlich ax = eln(a ) = ex ln a und
definieren f (x) = x ln a, g(y) = ey , so folgt h = g ◦ f und f ′ (x) = ln a, g ′ (y) = ey , also
h′ (x) = g ′ (f (x)) · f ′ (x) = ex ln a · ln a = ln a · ax .
(4) Die Ableitungen von sinh und cosh lauten
sinh′ = cosh,
cosh′ = sinh,
denn
1
1
1
sinh′ (x) = (ex − e−x )′ = [(ex )′ − (e−x )′ ] = [ex − (−e−x )] = cosh x,
2
2
2
1
1
cosh′ (x) = (ex + e−x )′ = (ex − e−x ) = sinh x.
2
2
Die Ableitungen von arcsin, arsinh usw. können wir mit Hilfe des folgenden Satzes
berechnen.
Satz 6.12 (Ableitung der Umkehrfunktion)
Sei f : Df → Wf mit Df , Wf ⊂ R eine invertierbare und differenzierbare Funktion mit
f ′ (x) 6= 0 für alle x ∈ Df . Dann ist die Inverse f −1 auch differenzierbar, und es gilt für
alle y = f (x) ∈ Wf :
1
1
= ′ −1
.
(f −1 )′ (y) = ′
f (x)
f (f (y))
55
Wir können diese Regel wieder symbolisch für eine differenzierbare Funktion y = y(x)
mit Inverse x = x(y) formulieren:
1
dx
= dy .
dy
dx
Die linke Seite entspricht x′ (y), die rechte 1/y ′ (x).
Beispiel 6.13 (1) Sei f (x) = ex , x ∈ R. Dann ist Df = R, Wf = (0, ∞). Die Inverse
lautet f −1 (y) = ln y, y ∈ (0, ∞), und
ln′ (y) =
1
1
1
=
=
.
f ′ (ln y)
eln y
y
(2) Sei f (x) = sin x, x ∈ Df = (−π/2, π/2). Dann ist Wf = (−1, 1) und f −1 (y) =
arcsin y, y ∈ Wf . Aus Satz 6.12 folgt
arcsin′ (y) =
1
f ′ (arcsin y)
für alle y ∈ (−1, 1).
=
1
1
1
=p
=p
cos(arcsin y)
1 − sin(arcsin y)2
1 − y2
Wir fassen die Ableitungen einiger Umkehrfunktionen (Inversen) zusammen:
f (x)
arcsin x
arccos x arctan x arsinh x
1
1
1
1
√
−√
f ′ (x) √
2
1 − x2
1 − x2 1 + x
x2 + 1
arcosh x artanh x
1
1
√
x2 − 1 1 − x2
Die Ableitung hilft bei der Bestimmung von Grenzwerten der Form
”0 ”
0
oder
”∞ ”
,
∞
nämlich beispielsweise bei limx→0 (sin x)/x.
Satz 6.14 (Regel von de l’Hospital)
Seien f, g : (a, b) → R differenzierbar und g ′ (x) 6= 0 für alle x ∈ (a, b). Es gelte
lim f (x) = lim g(x) = 0
x→a
und der Grenzwert
x→a
oder
f ′ (x)
x→a g ′ (x)
lim
Dann folgt
lim f (x) = lim g(x) = +∞
x→a
existiert.
f (x)
f ′ (x)
lim
= lim ′
.
x→a g(x)
x→a g (x)
56
x→a
Beispiel 6.15 (1) Der Grenzwert
sin x
x
0
ist vom Typ ” 0 ”, da limx→0 sin x = limx→0 x = 0. Der Grenzwert
lim
x→0
cos x
sin′ x
=1
= lim
lim
x→0
x→0 (x)′
1
existiert, und daher ist
lim
x→0
sin x
cos x
= lim
= 1.
x→0
x
1
(2) Der Grenzwert
sin x − x
x→0
x3
ist wieder vom Typ “ 00 ”. Existiert der Grenzwert
lim
(sin x − x)′
cos x − 1
= lim
?
3
′
x→0
x→0
(x )
3x2
lim
Er ist wieder vom Typ “ 00 ”. Wir wenden die Regel von de l’Hospital auf den letzten
Grenzwert an, und untersuchen
− sin x
sin x
1
1
(cos x − 1)′
= lim
= − lim
=−
2
′
x→0
x→0
x→0
(3x )
6x
6
x
6
lim
nach (1). Wir erhalten also
sin x − x
cos x − 1
− sin x
1
= lim
= lim
=− .
3
2
x→0
x→0
x→0
x
3x
6x
6
lim
(3) Der Grenzwert
lim x ln x
x→0
ist vom Typ “0 · ∞”, so daß die Regel von de l’Hospital nicht unmittelbar anwendbar ist.
Wir schreiben daher
lim x ln x = lim
x→0
x→0
ln x
= lim
1
x
x→0
1
x
− x12
= − lim x = 0.
x→0
(4) Der Grenzwert
lim xx
x→0
ist vom Typ “00 ”, und die Regel von de l’Hospital ist wieder nicht anwendbar. Wir schreiben
x
lim xx = lim eln(x ) = lim ex ln x .
x→0
x→0
x→0
57
Vertauschen wir den Grenzwert und die Funktionsauswertung ey , so folgt nach (3)
lim ex ln x = elimx→0 x ln x = e0 = 1.
x→0
Dürfen wir den Grenzwert und ey vertauschen? Ja, denn die e-Funktion ist stetig, und für
solche Funktionen ist die Vertauschung möglich (siehe (6.1)).
(5) Die Regel von de l’Hospital führt auf
− sin x
cos x
= lim
= 0,
x→0
x→0
x
1
lim
wobei der Grenzwert vom Typ “ 01 ” ist. Die folgende Tabelle gibt einige Werte des Quotienten (cos x)/x an.
x
cos x
x
0.1
0.01
0.001
−0.1
−0.01
−0.001
9.95 99.995 999.9995 −9.95 −99.995 −999.9995
Die Tabelle läßt vermuten, daß der Grenzwert gar nicht existiert! Tatsächlich gilt
lim
x→0,x>0
cos x
= +∞,
x
lim
x→0,x<0
cos x
= −∞.
x
Im vorliegenden Fall sind die Voraussetzungen von Satz 6.14 nicht erfüllt. Die unkritische
Anwendung der Regel von de l’Hospital kann also zu falschen Resultaten führen.
Wir können die folgenden Fälle mit der Regel von de l’Hospital untersuchen:
• “∞ − ∞”: Schreibe
f (x) − g(x) =
1
g(x)
−
1
f (x)
1
f (x)g(x)
.
Der Quotient ist von der Form “ 00 ”.
• “0 · ∞”: Schreibe
f (x) · g(x) =
f (x)
1
g(x)
.
Der Quotient ist wieder von der Form “ 00 ”.
• “00 ”: Schreibe f (x)g(x) = eg(x)·ln f (x) . Der Exponent ist vom Typ “0 · ∞”.
• “1∞ ”: Schreibe f (x)g(x) = eg(x)·ln f (x) , und der Exponent hat die Form “∞ · 0”.
• “∞0 ”: Schreibe wieder f (x)g(x) = eg(x)·ln f (x) und erhalte den Typ “0 · ∞”.
58
y
f (x)
a
x1
x2
x3 b
x
y
f ′ (x)
a
x1
x4
x2
x5
x3
b
x
y
f ′′ (x)
a
x4
x5
b
x
Abbildung 6.3: Die Funktion f besitzt ein lokales Maximum in x1 und ein lokales Minimum
in x2 . Das globale Maximum wird dagegen in x3 erreicht. Die Stellen x4 und x5 sind
kritische Punkte von f ′ .
6.4
Kurvendiskussion
Ist die Steigung der Tangente an den Graphen einer Funktion stets positiv (bzw. negativ),
so ist die Funktion monoton wachsend (bzw. fallend). Ist die Tangentensteigung zunächst
positiv (bzw. negativ) und dann negativ (bzw. positiv), so erwarten wir, daß ein lokales
Maximum (bzw. Minimum) vorliegt (siehe Abbildung 6.3).
Definition 6.16 Sei f : [a, b] → R eine Funktion.
(1) f heißt monoton wachsend auf [a, b], wenn
f (x1 ) ≤ f (x2 )
für alle
59
x1 ≤ x2 .
(2) f heißt monoton fallend auf [a, b], wenn
f (x1 ) ≥ f (x2 )
für alle
x1 ≤ x2 .
(3) f besitzt in x0 ∈ (a, b) ein lokales Maximum, wenn
∃ε>0:
∀ x ∈ (x0 − ε, x0 + ε) :
f (x) ≤ f (x0 ).
(6.3)
f (x) ≥ f (x0 ).
(6.4)
(4) f besitzt in x0 ∈ (a, b) ein lokales Minimum, wenn
∃ε>0:
∀ x ∈ (x0 − ε, x0 + ε) :
(5) Ein Extremum ist ein Minimum oder Maximum. Ein Minimum oder Maximum wird
global genannt, wenn die Ungleichung (6.3) bzw. (6.4) für alle x ∈ [a, b] gilt.
(6) Ist f differenzierbar, so heißt ein Punkt x0 ∈ (a, b) mit f ′ (x0 ) = 0 kritischer Punkt.
Satz 6.17 Sei f (a, b) → R zweimal differenzierbar und x0 ∈ (a, b).
(1) Gilt f ′ (x) ≥ 0 (bzw. f ′ (x) ≤ 0) für alle x ∈ (a, b), so ist f monoton wachsend (bzw.
monoton fallend).
(2) Gilt f ′ (x0 ) = 0 und f ′′ (x0 ) < 0 (oder f ′′ (x0 ) > 0), so hat f in x0 ein lokales
Maximum (bzw. lokales Minimum).
(3) Die Funktion f sei n-mal differenzierbar, und es gelte f (i) (x0 ) = 0 für alle i =
1, . . . , n − 1 und f (n) (x0 ) 6= 0. Dann gilt:
• n gerade: f hat in x0 ein Extremum, und zwar ein lokales Maximum, wenn
f (n) (x0 ) < 0, bzw. ein lokales Minimum, wenn f (n) (x0 ) > 0;
• n ungerade: f hat in x0 kein Extremum.
Beispiel 6.18 Sei f (x) = x4 − 2x2 + 1 = (x2 − 1)2 , x ∈ R (siehe Abbildung 6.4 links).
Wir bestimmen alle Extrema von f . Aus
0 = f ′ (x) = 4x3 − 4x = 4x(x2 − 1) = 4x(x − 1)(x + 1)
folgt, daß x1 = 0, x2 = 1 und x3 = −1 Kandidaten für Extrema sind. Wir untersuchen
diese Punkte einzeln:
• x1 = 0: f ′′ (x1 ) = 12x21 − 4 = −4 < 0 =⇒ f hat an x1 = 0 ein lokales Maximum.
• x2/3 = ±1: f ′′ (x2/3 ) = 12x22/3 − 4 = 8 > 0 =⇒ f hat an x2/3 = ±1 ein lokales
Minimum.
60
replacemen
y
y
f (x)
−1
0
−1 − 4
x
1
5
f2 (x)
0
x
Abbildung 6.4: Graph der Funktion f (x) = x4 − 2x2 + 1 (links) und Graph der Funktion
f2 (x) = x5 + x4 (rechts).
(2) Sei f (x) = x−12 − ax−6 mit a > 0, x > 0. Die Funktion f ist ein Modell für das
Potential von Teilchen in der Nähe des Atomkerns mit Abstand x; sie wird auch LenardJones-Potential genannt. Der erste Summand x−12 beschreibt eine extrem kurzreichweitige
Abstoßung, während der zweite Summand ax−6 eine langreichweitige Anziehung modelliert. Alle kritischen Punkte von f sind gegeben durch
r
2
6a
6
12
6 2
′
.
0 = f (x) = − 13 + 7 = 7 − 6 + a =⇒ x = ±
x
x
x
x
a
p
Da der Abstand x positiv sein soll, kommt nur x0 = 6 2/a in Betracht. Wegen
6 2 · 13
6
12 · 13 6 · 7a
′′
−
= 8
− 7a = 8 (13a − 7a) > 0
f (x0 ) =
14
8
6
x0
x0
x0
x0
x0
liegt an der Stelle x0 ein lokales Minimum vor. Es folgt außerdem, daß f für x < x0
monoton fallend und für x > x0 monoton wachsend ist (siehe Abbildung 6.5).
(4) Die Van-der-Waals-Gleichung aus Beispiel 3.7 für den Druck p(V ) in Abhängigkeit
des Volumens V
a V > b und a, b > 0,
p(V ) + 2 (V − b) = RT,
V
kann nach p(V ) aufgelöst werden:
p(V ) =
a
RT
− 2,
V −b V
V > b.
Kritische Punkte erhalten wir aus der Gleichung
0 = p′ (V ) = −
RT
2a
+ 3
2
(V − b)
V
Abbildung 6.6 zeigt, daß diese Gleichung
61
⇐⇒
2a(V − b)2 = RT V 3 .
y
f (x)
x0
0
x
Abbildung 6.5: Graph der Funktion f (x) = x−12 − ax−6 , x > 0.
• keine Lösung besitzt, wenn T > Tkrit ;
• genau eine Lösung V0 besitzt, wenn T = Tkrit ;
• genau zwei Lösungen V1 und V2 besitzt, wenn T < Tkrit .
20
2
15
2a(V−b)
3
RTV mit T < Tkrit
3
RTV mit T > Tkrit
10
5
0
1
1.5
2
2.5
3
3.5
4
Abbildung 6.6: Graphische Lösung der Gleichung 2a(V − b)2 = RT V 3 für den Fall a =
b = R = 1. Man kann berechnen, daß hier Tkrit ≈ 0.29606.
Diese Beobachtung erlaubt es, das Monotonieverhalten von p(V ) zu beschreiben:
• T ≥ Tkrit : p′ (V ) ≤ 0 für alle V > b =⇒ p monoton fallend in (b, ∞);
62
• T < Tkrit : p ist monoton fallend in (b, V1 ) und (V2 , ∞) und monoton wachsend in
(V1 , V2 ).
Der Graph von p(V ) ist in Abbildung 6.7 skizziert. Es gibt eine Region, in der für
gegebenen Druck p drei verschiedene Volumina existieren, so daß die Van-der-WaalsGleichung erfüllt ist. Diese Region beschreibt die Koexistenz der flüssigen und gasförmigen
Phase.
p
T > Tkrit
Koexistenz
T = Tkrit
T < Tkrit
0
V
Abbildung 6.7: Graphen der Funktion p(V ) für verschiedene Temperaturen.
Eine Kurvendiskussion einer Funktion f sollte typischerweise die folgenden Punkte
enthalten:
(1) Bestimmung der Nullstellen von f ,
(2) Bestimmung der Monotonie von f ,
(3) Bestimmung der lokalen Minima und Maxima von f ,
(4) Bestimmung des Verhaltens für x → +∞ bzw. x → −∞, falls zutreffend,
(5) eine Skizze des Graphen von f .
6.5
Satz von Taylor
Differenzierbare Funktionen können oft durch Polynome angenähert werden. Diese Aussage wird im Satz von Taylor präzisiert.
Definition 6.19 Sei f : (a, b) → R (n + 1)-mal differenzierbar, und sei x0 ∈ (a, b). Dann
heißt das Polynom
n
X
f (k) (x0 )
(x − x0 )k ,
x ∈ R,
Tn (x) =
k!
k=0
das Taylor-Polynom n-ten Grades von f um x0 .
63
Satz 6.20 (Taylor)
Sei f : (a, b) → R (n + 1)-mal stetig differenzierbar (d.h., f ist (n + 1)-mal differenzierbar
und f (n+1) ist stetig) und seien x0 , x ∈ (a, b). Dann existiert ein ξ zwischen x0 und x, so
daß
f (x) = Tn (x) + Rn+1 (x),
(6.5)
wobei
Rn+1 (x) =
f (n+1) (ξ)
(x − x0 )n+1 .
(n + 1)!
(6.6)
Man nennt (6.5) die Taylor-Formel und (6.6) das Lagrange-Restglied. Der Punkt x0
wird auch Entwicklungspunkt genannt. Im Falle n = 0 erhalten wir:
f (x) = T0 (x) + R1 (x) = f (x0 ) + f ′ (ξ)(x − x0 ).
(6.7)
Man nennt diese Beziehung Mittelwertsatz. Er hat eine einfache geometrische Interpretation (siehe Abbildung 6.8). Schreiben wir (6.7) als
f (x) − f (x0 )
= f ′ (ξ)
x − x0
für x 6= x0 , so lautet die Aussage des Mittelwertsatzes, daß es einen Punkt ξ gibt, an dem
die Steigung der Tangente an den Graphen von f (nämlich f ′ (ξ)) gleich der Steigung der
Sekante durch x und x0 ist.
y
Sekante
Tangente
x
x0
ξ
x
Abbildung 6.8: Geometrische Veranschaulichung des Mittelwertsatzes (6.7).
Beispiel 6.21 Sei f (x) = ex , x ∈ R. Wir wählen den Entwicklungspunkt x0 = 0. Die
Funktion f ist unendlich oft differenzierbar mit
f (0) = 1,
f ′ (0) = 1,
64
f ′′ (0) = 1
usw.
Aus dem Satz 6.20 von Taylor folgt, daß es zu x ∈ R ein ξ zwischen 0 und x gibt, so daß
f (x) = ex =
n
X
1 k
eξ
x +
xn+1 .
k!
(n
+
1)!
k=0
Die Exponentialfunktion wird also durch das Polynom
n
X
1
1
1
1 k
x = 1 + x + x2 + x3 + . . . + xn
k!
2
6
n!
k=0
approximiert. Der Fehler der Approximation wird gerade durch das Lagrange-Restglied
gegeben. Für |x| ≤ 1 erhalten wir wegen |ξ| ≤ |x| ≤ 1
|Rn+1 (x)| =
eξ
e
|x|n+1 ≤
.
(n + 1)!
(n + 1)!
Wollen wir ex auf dem Intervall [−1, 1] durch das Polynom bis auf einen Fehler von 10−3
approximieren, so muß n ∈ N so groß gewählt werden, daß
e
≤ 10−3 .
(n + 1)!
Wir erhalten n = 6, denn e/7! ≈ 5 · 10−4 , aber e/6! ≈ 4 · 10−3 . Wir haben gezeigt:
6
x X 1 k
x ≤ 10−3
für alle |x| ≤ 1.
e −
k! k=0
Die obigen Beispiele legen nahe, den Grenzwert n → ∞ zu versuchen und die Gleichung
f (x) =
∞
X
f (k) (x0 )
k=0
k!
(x − x0 )k
(6.8)
für eine unendlich oft differenzierbare Funktion zu folgern. Gilt die Formel (6.8)?
2
Im allgemeinen nein! Sei beispielsweise f (x) = e−1/x für x 6= 0 und f (x) = 0 für
x = 0. Die Funktion f ist für x 6= 0 unendlich oft differenzierbar:
2 −1/x2
e
,
x3
4
6
2
′′
f (x) =
− 4 + 6 e−1/x
x
x
24 24 12
8
2
′′′
f (x) =
− 7 − 7 + 9 e−1/x
5
x
x
x
x
f ′ (x) =
65
usw.
Man kann allgemein zeigen, daß
1 −1/x2
(k)
f (x) = p
e
x
für ein geeignetes Polynom p und x 6= 0
gilt. Es gilt nach der Regel von de l’Hospital für alle Polynome p:
1 −1/x2
lim p
e
= 0.
x→0
x
Wir können also die k-te Ableitung von f in x = 0 fortsetzen, so daß f (k) stetig ist:
(
2
p( x1 )e−1/x : x 6= 0
(k)
f (x) =
0
: x = 0.
Aus dem Satz von Taylor folgt
f (x) = Tn (x) + Rn+1 (x)
mit Tn (x) =
n
X
f (k) (0)
k=0
Also ist
f (x) 6=
∞
X
f (k) (0)
k=0
k!
=0
k!
xk = 0.
für alle x 6= 0.
Unter welchen Bedingungen gilt nun die Formel (6.8) dennoch? Wir vermuten wegen (6.5):
wenn Rn+1 (x) → 0 für n → ∞. Die Vermutung ist richtig, wie der folgende Satz zeigt.
Satz 6.22 Sei f : (a, b) → R unendlich oft differenzierbar und sei x0 ∈ (a, b). Dann gilt
f (x) =
∞
X
f (k) (x0 )
k=0
k!
(x − x0 )k
für alle
x ∈ (a, b)
genau dann, wenn Rn (x) → 0 (n → ∞). Dies ist der Fall, wenn
∃ α, C > 0 :
∀ x ∈ (a, b), k ∈ N :
|f (k) (x)| ≤ αC k .
Man nennt die unendliche Reihe aus Satz 6.22 die Taylor-Reihe von f . Beachten Sie:
• Die Taylor-Reihe muß im allgemeinen nicht konvergieren!
• Falls die Taylor-Reihe von f konvergiert, so konvergiert sie nicht immer gegen f !
Unter den Voraussetzungen von Satz 6.22 konvergiert natürlich die Taylor-Reihe von f ,
und zwar gegen f .
66
Beispiel 6.23 Sei wie in Beispiel 6.21 (1) f (x) = ex , x ∈ R, und x0 = 0. Dann gilt
|Rn+1 (x)| =
eξ
|x|n+1 → 0
(n + 1)!
d.h.
ex =
∞
X
1 k
x ,
k!
k=0
für n → ∞,
x ∈ R.
Insbesondere erhalten wir die Formel
∞
X
1
1
1
1
e=
= 1 + 1 + + + + ...,
k!
2! 3! 4!
k=0
(6.9)
die schneller konvergiert als die Folge (1 + 1/n)n mit
n
1
.
e = lim 1 +
n→∞
n
Eine andere interessante Folgerung aus (6.9) ist
!α
∞
∞
X
X
1
1 k
α
=e =
α
k!
k!
k=0
k=0
6.6
für α ∈ R.
Lineare Regression
In diesem Abschnitt präsentieren wir eine Anwendung der Differentiation, nämlich die
lineare Regression oder Methode der kleinsten Quadrate.
Der Druck p eines in einem Behälter mit Volumen V befindlichen Gases werde für
verschiedene Temperaturen gemessen. Nach dem idealen Gasgesetz pV = nRT (n Zahl
an Molen eines Gases) erwarten wir einen linearen Zusammenhang zwischen Druck und
Temperatur. Die Berechnung der Steigung der Geraden p = p(T ) erlaubt die Bestimmung der Gaskonstanten R. Allerdings werden die Meßwerte nicht alle auf einer Geraden
liegen; das Problem lautet, die mit Fehlern behafteten Meßdaten durch eine Gerade zu
approximieren. Eine Idee ist durch die Methode der kleinsten Quadrate gegeben.
Seien
(x1 , y1 ), . . . , (xm , ym )
m Meßwertpaare (z.B. xi = Temperatur, yi = Druck) gegeben. Wir suchen die Koeffizienten a0 und a1 der Geraden
g(x) = a0 + a1 x,
so daß der quadratische Abstand zwischen den Meßwerten yi und den Punkten g(xi ) auf
der Geraden minimiert wird (siehe Abbildung 6.9): Minimiere
F (a0 , a1 ) =
m
X
i=1
(g(xi ) − yi )2 =
67
m
X
i=1
(a0 + a1 xi − yi )2 .
y
Meßwerte
(xi , yi )
Ausgleichsgerade g(x)
x1 x2
x3
x
x4
Abbildung 6.9: Meßwertpaare und Ausgleichsgerade.
Zur Minimierung von F : R2 → R bestimmen wir gemäß Abschnitt 6.4 die kritischen
Punkte, d.h., wir differenzieren F nach a0 und nach a1 und setzen die Ableitungen gleich
Null. Wir führen hierfür die Funktionen
F1 (a0 ) = F (a0 , a1 )
(a1 fest gehalten) und
F2 (a1 ) = F (a0 , a1 )
(a0 fest gehalten)
ein. Wir erhalten:
0 = F1′ (a0 ) = 2
m
X
i=1
0 = F2′ (a1 ) = 2
m
X
i=1
also
ma0 +
m
X
i=1
m
X
xi
i=1
!
x i a0 +
m
X
x2i
i=1
(a0 + a1 xi − yi ),
(a0 + a1 xi − yi )xi ,
!
!
m
X
a1 =
yi ,
i=1
m
X
a1 =
xi yi .
i=1
Dies ist ein lineares Gleichungssystem für die beiden Variablen a0 und a1 mit Lösung
P
P P
P P 2 P P
m xi yi − xi yi
yi xi − xi xi yi
P
P
P
P
,
a1 =
.
(6.10)
a0 =
m x2i − ( xi )2
m x2i − ( xi )2
Die Lösung existiert genau dann, wenn
m
m
X
i=1
x2i 6=
68
m
X
i=1
xi
!2
.
Dies ist der Fall, wenn m ≥ 2 (mindestens zwei Meßwerte) und es mindestens zwei Werte
xi 6= xj gibt.
Beispiel 6.24 Der Druck eines idealen Gases in einem Behälter mit festem Volumen
werde für verschiedene Temperaturen gemessen. Die m = 5 Meßwerte lauten:
Temperatur xi in K
Druck yi in N/m2
300
235
350
290
400
335
450
360
500
415
Wir nehmen weiter an, daß der Behälter n = 10−4 mol des Gases enthalte und daß das
Volumen V = 10−3 m3 betrage. Dann ist nach dem idealen Gasgesetz
mol
nR
T = 0.1R 3 T.
p(T ) =
V
m
Der Achsenabschnitt a0 und die Steigung der Ausgleichsgeraden lauten gemäß (6.10)
a0 = −17 [N/m2 ],
a1 = 0.860 [N/m2 K]
(siehe Abbildung 6.10). Damit erhalten wir aus
p(300 K) = 30R
mol K
N
N
N
≈ 0, 86 · 300 2 − 17 2 = 241 2
3
m
m
m
m
eine Approximation der Gaskonstanten
R≈
241 Nm
Nm
≈ 8, 03
.
30 mol K
mol K
Der Literaturwert lautet R = 8, 314 Nm/(mol K). Die Abweichung liegt mit einem relativen Fehler von (8, 03 − 8, 314)/8, 314 ≈ 3, 4% innerhalb der zu erwartenden Meßgenauigkeit.
69
450
Druck in N/m2
400
Steigung der
Ausgleichsgeraden = 0.860
350
300
250
200
300
350
400
450
500
Temperatur in K
Abbildung 6.10: Meßwerte aus Beispiel 6.24 und zugehörige Ausgleichswerte.
70
7
7.1
Integration
Das bestimmte Integral
In Beispiel 1.2 haben wir gesehen, daß die Menge N (t) einer radioaktiven Substanz die
Gleichung
N ′ (t) = −αN (t)
mit α > 0, t > 0
erfüllt. Um derartige Differentialgleichungen nach N (t) “auflösen” zu können, benötigen
wir die “Umkehroperation” zur Differentiation. Interessanterweise wird diese durch das
Integral gegeben, das mit der Fläche unter einer Kurve zusammenhängt.
Wir wollen also die Fläche zwischen einer Kurve y = f (x) und der x-Achse in [a, b]
berechnen. Dazu approximieren wir die Fläche durch Rechtecke (siehe Abbildung 7.1).
Wir zerlegen das Intervall [a, b] in n Teilintervalle, indem wir die Punkte a = x0 < x1 <
. . . < xn = b bzw. die Zerlegung Z = {x0 , x1 , . . . , xn } einführen, und wählen in jedem
Teilintervall eine Zwischenstelle ξi ∈ [xi−1 , xi ], i = 1, . . . , n. Die Riemann-Summe
S(Z) =
n
X
i=1
f (ξi )(xi − xi−i )
ist dann eine Näherung an die Fläche zwischen der Kurve und der x-Achse. Wir erwarten,
daß die Näherung umso besser wird, je feiner die Zerlegung gewählt wird.
f (x)
y
111111
000000
000000
111111
000000
111111
000000
111111
0000
1111
000000
111111
0000
1111
000000
111111
0000
1111
000000
111111
0000
1111
00000
11111
000000
0000
1111
00000111111
11111
000000
111111
0000
1111
00000
11111
000000
111111
0000
1111
00000
11111
0000
1111
000000
111111
0000
1111
00000
11111
0000
1111
000000
111111
0000
1111
00000
11111
0000
1111
000000
111111
0000
1111
00000111111
11111
0000
1111
000000
0000
1111
00000
11111
0000
1111
000000
111111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000111111
11111
0000
1111
000000
111111
000000
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
111111
00000
11111
0000
1111
00000
11111
0000
1111
000000
111111
000000
00000
11111
0000
1111
00000111111
11111
0000
1111
000000
111111
a
ξ1
x1
ξ2
x2
ξ3
x3
ξ4
x4
x5
b
ξ5 ξ6
Abbildung 7.1: Zur Definition der Riemann-Summe.
Definition 7.1 Sei f : [a, b] → R eine Funktion. Wenn
71
x
(1) für jede Zerlegung Z von [a, b] mit max{xi − xi−1 : i = 1, . . . , n} → 0 (n → ∞) und
(2) für jede Wahl von Zwischenstellen ξi ∈ [xi−1 , xi ], i = 1, . . . , n,
der Grenzwert F = limn→∞ S(Z) existiert und stets denselben Wert liefert, so heißt f
(Riemann-)integrierbar in [a, b] und F heißt das bestimmte Integral von f in [a, b]. Wir
schreiben kurz:
Z b
n
X
f (x) dx.
f (ξi )(xi − xi−1 ) =
lim
n→∞
a
i=1
Satz 7.2 (1) Sei f : [a, b] → R stetig. Dann ist f integrierbar.
(2) Sei f : [a, b] → R integrierbar. Dann ist
Z
b
f (x) dx = (Fläche oberhalb x-Achse)−(Fläche unterhalb x-Achse),
a
siehe Abbildung 7.2.
y
+
0
+
a
−
b
x
Abbildung 7.2: Veranschaulichung von Satz 7.2 (2).
Beispiel 7.3 (1) Die Funktion f (x) = 1/x ist für x > 0 stetig, also insbesondere auf
[1, 2] integrierbar. Um das Integral
Z 2
dx
x
1
zu berechnen, wählen wir
• Zerlegung Z: xi = 2i/n , i = 0, . . . , n,
72
• Zwischenstellen: ξi = xi−1 = 2(i−1)/n , i = 1, . . . , n.
Die Riemann-Summe lautet
n
n
n
X
X
X
S(Z) =
f (ξi )(xi −xi−1 ) =
2−(i−1)/n 2i/n − 2(i−1)/n =
21/n − 1 = n(21/n −1).
i=1
i=1
i=1
Wir erhalten mit der Regel von de l’Hospital
2x − 1
ex ln 2 − 1
ln 2 · ex ln 2
21/n − 1
= lim
= lim
= lim
= ln 2.
x→0
x→0
x→0
n→∞
1/n
x
x
1
lim S(Z) = lim
n→∞
Man kann zeigen, daß man diesen Grenzwert für jede Zerlegung und jede Wahl von Zwischenstellen erhält. Daher gilt
Z 2
dx
= ln 2.
x
1
(2) Wir behaupten, daß die Funktion
(
1 : x ∈ Q ∩ [0, 1]
f (x) =
0 : x ∈ (R\Q) ∩ [0, 1]
nicht integrierbar ist. Sei Z = {x0 , . . . , xn } eine beliebige Zerlegung und wähle
• ξi ∈ [xi−1 , xi ] mit ξi ∈ Q (i = 1, . . . , n),
• ηi ∈ [xi−1 , xi ] mit ηi ∈ R\Q (i = 1, . . . , n).
Wir erhalten
Sξ (Z) =
Sη (Z) =
n
X
i=1
n
X
i=1
f (ξi )(xi − xi−1 ) =
n
X
i=1
(xi − xi−1 ) = 1,
f (ηi )(xi − xi−1 ) = 0.
Wählen wir die Zerlegung immer feiner und die Zwischenwerte wie oben, so folgt
lim Sξ (Z) = 1 6= 0 = lim Sη (Z),
n→∞
n→∞
d.h., f ist nicht integrierbar.
Es gelten die folgenden Rechenregeln.
Satz 7.4 Seien f und g auf [a, b] integrierbar. Dann gilt:
Rb
Rb
Rb
(1) a (αf (x) + βg(x)) dx = α a f (x) dx + β a g(x) dx für alle α, β ∈ R.
Rb
Rc
Rb
(2) a f (x) dx = a f (x) dx + c f (x) dx für alle c ∈ [a, b].
Ra
Rb
Ra
(3) a f (x) dx = 0 und a f (x) dx = − b f (x) dx.
Rb
Rb
(4) | a f (x) dx| ≤ a |f (x)| dx.
73
7.2
Zusammenhang zwischen Differentiation und Integration
Definition 7.5 Sei f : [a, b] → R eine Funktion. Eine Funktion F : [a, b] → R heißt
Stammfunktion von f genau dann, wenn F differenzierbar ist und
F ′ (x) = f (x)
für alle x ∈ [a, b]
gilt. Man nennt F auch ein unbestimmtes Integral von f und schreibt
Z
F (x) = f (x) dx.
(7.1)
Die Notation (7.1) ist etwas mißverständlich: Sind nämlich F und G zwei Stammfunktionen von f , so folgt aus (F − G)′ = F ′ − G′ = f − f = 0 in [a, b], daß F − G =
const. in [a, b] gelten muß. In der Notation (7.1) ist also die Integrationskonstante stets
mit aufgeführt!
Einige Stammfunktionen lauten (mit c ∈ R):
R
f (x)
xα (α 6= −1)
f (x) dx
1
xα+1
α+1
1
x
ex
sin x
cos x
+ c ln |x| + c ex + c − cos x + c sin x + c
Ist f : [a, b] → R eine stetige Funktion, so können wir für beliebiges x0 ∈ [a, b] mit
Z x
F (x) =
f (t) dt,
x ∈ [a, b],
(7.2)
x0
eine Stammfunktion konstruieren, was den Zusammenhang zwischen bestimmten und
unbestimmten Integralen aufweist. Es gilt:
Satz 7.6 Sei f : [a, b] → R stetig, x0 ∈ [a, b]. Dann ist F , definiert in (7.2), differenzierbar und F ′ = f , d.h., F ist eine Stammfunktion von f .
Den Zusammenhang zwischen der Differentiation und Integration stellt der folgende
Satz her:
Satz 7.7 (Hauptsatz der Differential- und Integralrechnung)
Sei f : [a, b] → R stetig und F eine Stammfunktion von f . Dann gilt
Z b
f (x) dx = [F (x)]ba = F (b) − F (a).
a
Der Hauptsatz zeigt, daß Differentiation und Integration sich im folgenden Sinne wie
“Operation” und “Umkehroperation” verhalten. Sei f : [a, b] → R stetig und F eine
(differenzierbare) Stammfunktion von f . Dann gilt nach Satz 7.6
Z
Z x
d
dF
dF
d
(x) = f (x)
oder
(x) = f (x)
f (x) dx =
f (t) dt =
dx
dx
dx x0
dx
74
und nach Satz 7.7
Z
a
b
dF
(x) = F (b) − F (a).
dx
Beispiel 7.8 Die Fläche zwischen der Sinuskurve und der x-Achse in [0, π] lautet
Z π
sin x dx = − cos π − (− cos 0) = 1 + 1 = 2,
0
denn − cos x ist eine Stammfunktion zu sin x. Das Integral
Z 2π
sin x dx = − cos(2π) − (− cos 0) = −1 + 1 = 0
0
verschwindet dagegen, da die Fläche unterhalb der x-Achse mit negativem Vorzeichen
versehen wird (siehe Abbildung 7.2).
Beispiel 7.9 Mit Hilfe von Satz 7.7 können wir auch Werte von unendlichen Reihen
berechnen. Wir zeigen, daß
∞
X
αn
n=1
n
= − ln(1 − α)
gilt. Definiere dazu
f (x) =
für alle |α| < 1
(7.3)
∞
X
xk+1
=
.
n
k+1
k=0
∞
X
xn
n=1
Man kann zeigen, daß f für |x| < 1 differenzierbar ist und daß folgt
∞
∞
X
X
d xk+1
f (x) =
=
xk ,
dx
k
+
1
k=0
k=0
′
|x| < 1.
Das ist aber gerade die geometrische Reihe, so daß f ′ (x) = 1/(1−x). Aus Satz 7.7 erhalten
wir
Z x
Z x
h
ix
dt
′
= − ln(1 − t) = − ln(1 − x).
f (x) = f (x) − f (0) =
f (t) dt =
0
0
0 1−t
Setzen wir x = α, so ist (7.3) bewiesen.
7.3
Integrationsmethoden
Wir stellen zwei Integrationsmethoden vor:
• Partielle Integration: Seien f, g : [a, b] → R stetig differenzierbar. Dann ist
Z b
Z b
b
′
f ′ (x)g(x) dx.
f (x)g (x) dx = f (x)g(x) a −
a
a
75
• Substitution: Sei f : [a, b] → R stetig und g : [c, d] → [a, b] stetig differenzierbar.
Dann ist
Z d
Z g(d)
′
f (g(t))g (t) dt =
f (x) dx.
c
g(c)
Beispiel 7.10 (Partielle Integration)
R
(1) Berechne x sin x dx. Wir setzen f (x) = x und g ′ (x) = sin x. Dann ist f ′ (x) = 1,
g(x) = − cos x und
Z
Z
x sin x dx = x · (− cos x) − 1 · (− cos x) dx = −x cos x + sin x + c.
Rπ
(2) Berechne 0 sin2 x dx. Wir setzen f (x) = sin x und g ′ (x) = sin x, also
Z π
Z π
h
iπ Z π
2
sin x dx = sin x(− cos x) −
cos2 x dx.
cos x(− cos x) dx =
0
0
0
0
Wir könnten noch einmal partiell integrieren:
Z π
Z π
h
iπ Z
2
2
cos x dx = cos x · sin x +
sin x dx =
0
0
0
π
2
sin x dx =
0
Z
π
sin2 x dx,
0
doch dies führt nicht weiter. Wir benutzen anstelle dessen die Relation cos2 x = 1 − sin2 x.
Dann folgt
Z
Z
Z
π
π
π
sin2 x dx =
dx −
0
0
und daher
Z
π
sin2 x dx =
0
sin2 x dx
0
π
.
2
R
(3) Wie in (2) können wir das unbestimmte Integral sin2 x dx berechnen:
Z
Z
Z
2
2
sin x dx = − sin x cos x + cos x dx = − sin x cos x + (1 − sin2 x) dx
Z
= − sin x cos x + x − sin2 x dx,
also
Z
1
sin2 x dx = (x − sin x cos x).
2
(7.4)
Die Substitutionsregel kann in der Praxis folgendermaßen verwendet werden. In dem
Rb
= x′ (t), also kann man “dx”
Integral a f (x) dx substituiert man x = x(t). Dann ist dx
dt
durch “x′ (t)dt” beim Übergang von der x- zur t-Variablen ersetzen. Falls x(α) = a und
x(β) = b, so erhält man
Z b
Z β
f (x) dx =
f (x(t))x′ (t) dt.
a
α
76
Beispiel 7.11 (Substitution)
R1
(1) Berechne 0 (1 + 2x)10 dx. Wir setzen t = 1 + 2x. Dann ist x(t) = x = 12 (t − 1), also
dx
= 12 , und aus 0 ≤ x ≤ 1 folgt 1 ≤ t ≤ 3. Damit ergibt sich
dt
Z
1
10
(1 + 2x) dx =
Z
1
0
R√
3
1
1 1 11 3
177146
1
t 1 = (311 − 1) =
.
t10 dt =
2
2 11
22
22
(2) Berechne
1 − x2 dx. Wir substituieren x = cos t. Dann erhalten wir dx
= − sin t
dt
und wegen (7.4)
Z √
Z √
Z
1
2
2
1 − x dx =
1 − cos t (− sin t) dt = − sin2 t dt = − (t − sin t cos t) + c.
2
√
√
Rücksubstitution t = arccos x und sin t = 1 − cos2 t = 1 − x2 ergeben
Z √
1 √
2
2
x 1 − x − arccos x + c.
1 − x dx =
2
Das bestimmte Integral
Z
0
1
√
1 − x2 dx
ist gerade der Flächeninhalt des Viertelkreises mit Radius r = 1. Wir erhalten
Z 1√
1
1
1
1 √
2
2
x 1 − x − arccos x
1 − x dx =
= − arccos 1 + arccos 0
2
2
2
0
0
1
1 π
π
= − ·0+ · = .
2
2 2
4
Dies stimmt mit der Formel für den Flächeninhalt πr2 /4 = π/4 überein.
Für einige Integrale gibt es Standardsubstitutionen, die zuweilen auf einfachere Integrale führen. Im folgenden geben wir einige Beispiele. Sei hierfür R(α, v, w, . . .) eine
rationale Funktion in den angegebenen Variablen.
R
• Typ R(cos x) sin x dx. Substituiere t = cos x;
R
• Typ R(sin x) cos x dx. Substituiere t = sin x;
R
• Typ R(sin x, cos x) dx. Substituiere t = tan x2 ;
√
R
• Typ R(x, x2 + a2 ) dx. Substituiere x = a sinh t;
√
R
• Typ R(x, x2 − a2 ) dx. Substituiere x = a cosh t;
√
R
• Typ R(x, a2 − x2 ) dx. Substituiere x = a sin t;
77
Beispiel 7.12 (Standardsubstitutionen)
R π/2 cos3 x
(1) Berechne 0 1−sin
dx. Wegen
x
Z π/2
1 − sin2 x
cos3 x
dx =
cos x dx
1 − sin x
1 − sin x
0
0
R
2
. Wir substituieren also
ist das Integral vom Typ R(sin x) cos x dx mit R(u) = 1−u
1−u
π
dt
t = sin x, Dann ist dx = cos x, und 0 ≤ x ≤ 2 impliziert 0 ≤ t ≤ 1:
Z
Z
π/2
0
π/2
cos3 x
dx =
1 − sin x
Z
1
0
1 − t2
dt =
1−t
(2) Das Integral
Z
Z
1
0
(1 − t)(1 + t)
dt =
1−t
Z
0
1
3
(1 + t) dt = .
2
sin2 x
dx
(1 + sin x + cos x)3
R
ist vom Typ R(sin x, cos x) dx, so daß wir t = tan(x/2) substituieren. Dann folgt aus x =
2
2
2
= 1+t
2 arctan t zum einen dx
2 und mit den Additionstheoremen cos(2α) = cos α − sin α
dt
und sin(2α) = 2 sin α cos α zum anderen
1−
1 − t2
=
1 + t2
1+
sin2 (x/2)
cos2 (x/2)
sin2 (x/2)
cos2 (x/2)
cos2 (x/2) − sin2 (x/2)
=
= cos x,
cos2 (x/2) + sin2 (x/2)
sin(x/2)
2 cos(x/2)
2 cos(x/2) sin(x/2)
2t
= sin x
=
2 (x/2) =
2
sin
1+t
cos2 (x/2) + sin2 (x/2)
1 + cos2 (x/2)
Wir erhalten
1 + sin x + cos x =
und daher
Z
sin2 x
dx =
(1 + sin x + cos x)3
Z 1 + t2 + 2t + 1 − t2
2(1 + t)
=
2
1+t
1 + t2
2t
1 + t2
2 1 + t2
2(1 + t)
3
2dt
=
1 + t2
Z
t2
dt.
(1 + t)3
(7.5)
Wie kann man nun das Integral über eine rationale Funktion berechnen? Wir verschieben
die Integration von (7.5) auf Beispiel 7.13 und betrachten allgemein Integrale rationaler
Funktionen.
Die Aufgabe lautet, für gegebene Polynome P (x) und Q(x) das Integral
Z
P (x)
dx
Q(x)
zu berechnen. Dabei gehen wir wie folgt vor:
78
• 1. Schritt: Führe Polynomdivision durch, falls Grad P ≥ Grad Q (“Grad” sei der
Grad eines Polynoms):
R(x)
P (x)
= P1 (x) +
,
Q(x)
Q(x)
wobei P1 und R Polynome sind mit Grad R < Grad Q. Das Integral über P1 ist
leicht zu berechnen.
• 2. Schritt: Bestimme alle Nullstellen von Q und zerlege Q in Faktoren der Form
(x − a)m und ((x − a)2 + b2 )n .
• 3. Schritt: Führe Partialbruchzerlegung durch. Verwende dazu für den Faktor in Q:
(x − a)m
den Ansatz
A1
Am
+ ··· +
x−a
(x − a)m
und für
((x − a)2 + b2 )n
den Ansatz
An x + Bn
A1 x + B1
+ ··· +
.
2
2
(x − a) + b
((x − a)2 + b2 )n
Die Koeffizienten Ai und Bi werden wie in Abschnitt 3.2 durch Koeffizientenvergleich
bestimmt.
• 4. Schritt: Schließlich können
die Formeln
Z
dx
=
x−a
Z
dx
=
(x − a)m
Z
Ax + B
dx =
(x − a)2 + b2
die Partialbrüche integriert werden. Verwende hierzu
ln |x − a| + c,
1
1
+c
(m ≥ 2),
m − 1 (x − a)m−1
Aa + b
x−a
A
ln |(x − a)2 + b2 | +
arctan
+ c.
2
2
b
−
Für Integrale mit dem Nenner ((x − a2 ) + b2 )n mit n ≥ 2 kann man mit partieller
Integration eine Rekursionsformel herleiten, die wir hier jedoch nicht angeben.
Beispiel 7.13 (Partialbruchzerlegung)
Wir setzen Beispiel 7.12 (2) fort und berechnen
Z
t2
dt.
(1 + t)3
Der erste Schritt entfällt, da Grad (t2 ) = 2 < 3 = Grad ((1 + t)3 ). Das Nennerpolynom
ist bereits in Faktoren aufgelöst. Wir führen nun eine Partialbruchzerlegung (3. Schritt)
durch und machen den Ansatz
A1
A2
A3
t2
=
+
+
.
(1 + t)3
1 + t (1 + t)2 (1 + t)3
79
Multiplikation mit (1 + t)3 führt auf
t2 = (1 + t)2 A1 + (1 + t)A2 + A3 = A1 t2 + (2A1 + A2 )t + (A1 + A2 + A3 ).
Koeffizientenvergleich ergibt
A1 = 1,
2A1 + A2 = 0,
A1 + A2 + A3 = 0,
Also A2 = −2, A3 = 1. Folglich ist
1
2
1
t2
=
−
+
.
3
2
(1 + t)
1 + t (1 + t)
(1 + t)3
Damit ist (4. Schritt)
Z
Z
Z
Z
t2
dt
dt
dt
2
1
dt
=
−
2
+
=
ln
|1
+
t|
+
−
(1 + t)3
1+t
(1 + t)2
(1 + t)3
1 + t 2(1 + t)2
4t + 3
= ln |1 + t| +
.
2(1 + t)2
Das Integral aus Beispiel 7.12 (2) ist also gelöst:
Z
4t + 3
x
4 tan(x/2) + 3
sin2 x
dx = ln |1 + t| +
= ln |1 + tan | +
.
3
2
(1 + sin x + cos x)
2(1 + t)
2
2(1 + tan(x/2))2
Das Integral
Z
e−x
2 /2
dx
besitzt keine durch elementare Funktionen ausdrückbare Stammfunktion. Das bestimmte
Integral
Z
∞
e−x
2 /2
dx
−∞
muß also numerisch bestimmt werden. Doch was bedeutet der unbeschränkte Integrationsbereich? Wir definieren einfach
Z ∞
Z R
2
−x2 /2
e
dx = lim
e−x /2 dx
−∞
R→∞
−R
und betrachten zunächst das Integral über [−R, R]. Eine Möglichkeit ist es, das Integral
wie in Abbildung 7.3 durch die eingezeichneten Trapeze zu approximieren. Sei dafür −R =
x−n < x−n+1 < . . . < xn = R eine Zerlegung des Intervalls [−R, R]. Dann ist
Z R
n
X
1 −x2k /2
2
−x2 /2
+ e−xk−1 /2 (xk − xk−1 ).
e
e
dx ≈
2
−R
k=−n+1
Man nennt dies die Trapezregel. Wir wählen nun speziell xk = k und bezeichnen mit
an die obige Summe. Dann erhalten wir die folgende Tabelle:
80
y
0
xk−1
Abbildung 7.3: Zur Approximation von
n
3
5
7
9
11
Wir vermuten, daß
Z
xk
R∞
−∞
x
e−x
2 /2
dx.
an
2.49484088243673
2.50662453088395
2.50662828801998
2.50662828804291
2.50662828804291
∞
e−x
−∞
2 /2
dx ≈ 2.50662828804291.
Wie genau ist dieser Wert? Wir haben zwei Arten von Fehlern zu berücksichtigen. Zum
einen haben wir das Integral über (−∞, −n) und (n, ∞) vernachlässigt; dieser Fehler wird
immer kleiner, wenn wir n groß genug wählen. Allerdings approximieren die Trapeze über
(−1, 0) und (0, 1) das Integral mit einem Fehler, der nicht kleiner wird, wenn n → ∞.
Tatsächlich ist der oben gerechnete Wert nur bis auf sechs Nachkommastellen genau; man
kann nämlich zeigen, daß
Z
∞
−∞
e−x
2 /2
dx =
√
2π ≈ 2.50662827463100.
81