Mathematik für ChemikerInnen I Prof. Dr. Ansgar Jüngel Institut für Mathematik Johannes Gutenberg-Universität Mainz Winter 2006 unkorrigiertes Vorlesungsskript Inhaltsverzeichnis 1 Motivation 2 Grundbegriffe 2.1 Mengen . . . . . . . 2.2 Reelle Zahlen . . . . 2.3 Binomialkoeffizienten 2.4 Komplexe Zahlen . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 8 10 3 Funktionen 15 3.1 Funktionen und ihre Inverse . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.2 Rationale Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.3 Elementare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4 Vektoren und Matrizen 4.1 Vektoren . . . . . . . . . . . . . . . . . . . 4.2 Matrizen . . . . . . . . . . . . . . . . . . . 4.3 Der Gauß-Algorithmus . . . . . . . . . . . 4.4 Determinanten . . . . . . . . . . . . . . . 4.5 Lineare Unabhängigkeit . . . . . . . . . . 4.6 Lösungstheorie linearer Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 22 25 30 33 36 38 5 Folgen und Reihen 41 5.1 Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 5.2 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 1 6 Differentiation 6.1 Stetigkeit . . . . . 6.2 Die Ableitung . . . 6.3 Rechenregeln . . . 6.4 Kurvendiskussion . 6.5 Satz von Taylor . . 6.6 Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 50 51 53 59 63 67 7 Integration 71 7.1 Das bestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 7.2 Zusammenhang zwischen Differentiation und Integration . . . . . . . . . . 74 7.3 Integrationsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 2 1 Motivation In diesem Kapitel verdeutlichen wir anhand von Beispielen, daß die Sprache und die Methoden der Mathematik für das Studium chemischer Prozesse und Fragestellungen ein unentbehrliches Handwerkszeug darstellen. Beispiel 1.1 (Zerfall von Kaliumdichromat) Wird Kaliumdichromat K2 Cr2 O7 auf über 500◦ C erhitzt, zerfällt es in Kaliumchromat K2 CrO4 , Chromoxid Cr2 O3 und Sauerstoff O2 . Die Reaktionsgleichung lautet x1 K2 Cr2 O7 → x2 K2 CrO4 + x3 Cr2 O3 + x4 O2 . Wir suchen Zahlen x1 , x2 , x3 , x4 , die diese Gleichung erfüllen. Natürlich sollte die Lösung ganzzahlig (und positiv) sein. Die linke Seite benötigt 2 · x1 Kaliumatome (x1 K2 ), die rechte Seite 2 · x2 Kaliumatome (x2 K2 ), d.h. 2x1 = 2x2 . Analog gilt 2x1 = x2 + 2x3 für die Bilanz der Chromatome und 7x1 = 4x2 + 3x3 + 2x4 für die der Sauerstoffatome. Die Zahlen x1 , x2 , x3 , x4 erfüllen also das Gleichungssystem 2x1 − 2x2 = 0, 2x1 − x2 − 2x3 = 0, 7x1 − 4x2 − 3x3 − 2x4 = 0. (1.1) Man kann dieses System auch abkürzend durch Auflistung der Koeffizienten der linken Seit und der Komponenten der rechten Seite durch 2 −2 0 0 0 und (1.2) 2 −1 −2 0 0 7 −4 −3 −2 0 formulieren. Wir nennen das erste Objekt Matrix und das zweite Objekt Vektor. In Kapitel 4 werden wir uns mit der Matrizen- und Vektorrechnung befassen und den Gaußschen Algorithmus zum Lösen linearer Gleichungssysteme kennenlernen. Beispiel 1.2 (Radioaktiver Zerfall) Eine radioaktive Substanz zerfalle im Laufe der Zeit. Wieviel Substanz ist zur Zeit t vorhanden? Sei N (t) die Menge der radioaktiven Substanz zur Zeit t. Aus der Physik ist bekannt, daß die Änderung 4N der Stoffmenge proportional ist zur Stoffmenge N (t) und zur zeitspanne 4t. Nennen wir die Proportionalitätskonstante −α < 0 (sie ist negativ, da die Substanz zerfällt), so folgt 4N = −αN (t)4t. (1.3) 3 Schreiben wir 4N = N (t + 4t) − N (t), erhalten wir N (t + 4t) = (1 − α4t)N (t) für alle t. Für t = 0 ist N (4t) = (1 − α4t)N (0), für t = 4t N (24t) = (1 − α4t)N (4t) = (1 − α4t)2 N (0), und allgemein für t = n4t (n ∈ N) n N (n4t) = (1 − α4t) N (0) = αt 1− n n N (0). Was geschieht nun, wenn n immer größer wird? Für größer werdendes n nähert sich die Differenz 1 − αt immer mehr der Zahl Eins an, und man könnte wegen 1n = 1 denken, n n sich ebenfalls immer mehr der Eins nähert. Dies ist jedoch falsch! Es gilt daß 1 − αt n n αt 1− nähert sich für großes n e−αt , (1.4) n wobei e = 2.7182818 . . . die Eulersche Zahl ist. Mathematisch formulieren wir die Aussage (1.4) als n αt strebt für n → ∞ gegen e−αt 1− n oder in Zeichen lim n→∞ αt 1− n n = e−αt . Diesen Grenzwert (“limes”) definieren wir in Kapitel 5. In Kapitel 3 untersuchen wir die Exponentialfunktion ex . Die Stoffmenge zur Zeit t lautet also N (t) = e−αt N (0). In diesem Beispiel sind verschiedene mathematische Begriffe aufgetreten, die wir in den folgenden Kapiteln genauer definieren und erläutern werden, nämlich Grenzwerte und Funktionen. Außerdem werden wir Funktionen differenzieren und integrieren (siehe Kapitel 6 und 7). 4 2 2.1 Grundbegriffe Mengen Die Gesamtheit von Objekten heißt Menge. Die einzelnen Objekte heißen Elemente der Menge. Beispiele von Mengen sind M1 = {1, 2, 3, 4} M2 = {Kohlenstoff, Wasserstoff, Sauerstoff}, M1 = {5, 6, 7, . . . } = {x : x ist natürliche Zahl und x ≥ 5.} Die Reihenfolge der Elemente spielt bei Mengen keine Rolle, d.h. {1, 2, 3, 4} = {3, 2, 4, 1}. Die leere Menge wird mit { } oder ∅ bezeichnet. Es gibt die folgenden Mengenoperationen. Definition 2.1 Seien A, B Mengen. (1) A heißt Teilmenge von B, kurz A ⊂ B, wenn für alle x ∈ A auch x ∈ B folgt. (2) Gleichheit: A = B bedeutet A ⊂ B und B ⊂ A. (3) Vereinigung: A ∪ B = {x : x ∈ A oder x ∈ B}. (4) Durchschnitt: A ∩ B = {x : x ∈ A und x ∈ B}. (5) Differenz: A\B = {x : x ∈ A und x 6∈ B}. Man sagt “A ohne B”. (6) Kartesisches Produkt: A × B = {(x, y), x ∈ A, y ∈ B}. Beachten Sie, daß (x, y) ein geordnetes Paar ist, d.h., die Reihenfolge ist wichtig. Beispielsweise gilt (1, 2) 6= (2, 1) (Aber {1, 2} = {2, 1}!) Beispiel 2.2 Seien A = {1, 2, 3}, B = {3, 4}. Dann folgt A ∩ B = {3}, A ∪ B = {1, 2, 3, 4} (Elemente werden nur einmal aufgezählt), A\B = {1, 2}. A × B = {(1, 3), (1, 4), (2, 3), (2, 4), (3, 3), (3, 4)}. 5 (a) (b) B A 00000000000 11111111111 000000000000 111111111111 00000000000 11111111111 000000000000 111111111111 00000000000 11111111111 000000000000 111111111111 00000000000 11111111111 000000000000 111111111111 00000000000 11111111111 000000000000 111111111111 00000000000 11111111111 000000000000 111111111111 00000000000 11111111111 000000000000 111111111111 00000000000 11111111111 000000000000 111111111111 B A 111 000 000 111 000 111 (c) A A∪B (d) B A 00000000000 11111111111 00000000000 11111111111 00000000000 11111111111 00000000000 11111111111 00000000000 11111111111 00000000000 11111111111 00000000000 11111111111 00000000000 11111111111 B 1111 0000 0000 1111 0000 1111 0000 1111 0000 1111 0000 1111 A∩B (e) 00 11 00 00 00 0011 11 0011 11 1111 00 00 11 B 11 0011 11 0011 00 00 0011 11 0011 11 00 00 0011 11 0011 0011 00 | {z } A A\B A×B Abbildung 2.1: (a) Teilmenge; (b) Vereinigung; (c) Durchschnitt; (d) Differenz; (e) kartesisches Produkt. 2.2 Reelle Zahlen Die wichtigsten Mengen sind Zahlenmengen. Definition 2.3 (1) Menge der natürlichen Zahlen: N = {1, 2, 3, . . . }. Die Menge der natürlichen Zahlen mit Null wird geschrieben als: N0 = N ∪ {0} = {0, 1, 2, 3, . . . }. (2) Menge der ganzen Zahlen: Z = {0, 1, −1, 2, −2, 3, −3 . . . }. (3) Menge der rationalen Zahlen: Q = { pq : p, q ∈ Z, q 6= 0}. Die Brüche p0 und 00 sind also nicht definiert. (4) Menge der reellen Zahlen: a1 a2 a3 + + +. . . , a1 , a2 , a3 , · · · ∈ {0, 1, . . . , 9}}. 10 100 1000 Reelle Zahlen sind also Zahlen mit unendlicher Dezimalentwicklung. R = {g+r : g ∈ Z, r = 0, a1 a2 a3 · · · = Beispiel 2.4 (1) Sei x = 0, 101010 . . . ∈ R. Wir wollen x als Bruch schreiben. Dafür schreiben wir 100 · x = 10, 101010 . . . , x = 0, 101010 . . . 6 Die Differenz lautet 10 ∈ Q. 99 (2) Es gibt auch Zahlen, die nicht als Bruch geschrieben werden können. Derartige Zahlen werden irrational genannt. Beispiele sind π und e (die Eulersche Zahl). Eine reelle Zahl ist also entweder rational oder irrational. 99 · x = 10, also x = Es gelten die folgenden Inklusionen: N ⊂ N0 ⊂ Z ⊂ Q ⊂ R. Definition 2.5 Seien a, b ∈ R. Die folgenden Mengen werden Intervalle genannt: (1) Abgeschlossenes Intervall: [a, b] = {x ∈ R : a ≤ x ≤ b}. (2) Rechts halboffenes Intervall: [a, b) = {x ∈ R : a ≤ x < b}. (3) Links halboffenes Intervall: (a, b] = {x ∈ R : a < x ≤ b}. (4) Offenes Intervall: (a, b) = {x ∈ R : a < x < b}. Man schreibt auch [a, ∞) = {x ∈ R : x ≥ a}, (−∞, b) = {x ∈ R : x < b}, (−∞, ∞) = R. Definiert man den Betrag |x| einer reellen Zahl durch ( x für x ≥ 0 |x| = −x für x < 0, so ist [−a, a] = {x ∈ R : −a ≤ x ≤ a} = {x ∈ R : |x| ≤ a}. Wir benötigen noch folgende Notationen: • Das Zeichen “∀” bedeutet “für alle”. • Das Zeichen “∃” bedeutet “es existiert”. • Summe: n X k=1 • Produkt: n Y k=1 ak = a1 + a2 + · · · + an . ak = a1 · a2 · . . . · an = a1 a2 . . . an . 7 Beispiel 2.6 Die Schreibweise ∀n∈N: n X k= k=1 n(n + 1) 2 bedeutet ausgeschrieben: n(n + 1) . 2 Daß die Summe der ersten n natürlichen Zahlen gleich n(n + 1)/2 ist, können wir übrigens einfach einsehen, indem wir die beiden Zeilen Für alle n ∈ N gilt: 1 + 2 + 3 + · · · + n = a =1+ a 2 + 3 + · · · + n, = n + (n − 1) + (n − 2) + · · · + 1 addieren, denn dies ergibt 2a = (n + 1) + (n + 1) + (n + 1) + · · · + (n + 1) = n · (n + 1), also a = n(n + 1)/2. 2.3 Binomialkoeffizienten In diesem Abschnitt beantworten wir die Frage: Wieviel Möglichkeiten gibt es, k Elemente von insgesamt n Elementen als Mengen zu schreiben? Sei etwa n = 5 und k = 2. Die Elemente seien die Ziffern 1, 2, 3, 4, 5. Dann gibt es 20 Möglichkeiten: 12 13 14 15 23 24 25 34 35 45 21 31 41 51 32 42 52 43 53 54 Allgemein: Wir haben n Möglichkeiten, ein 1. Element zu wählen. Greifen wir das 1. Element heraus, verbleiben n − 1 Möglichkeiten, ein 2. Element auszuwählen, n − 2 Möglichkeiten für das 3. Element usw.: Anzahl: = n · (n − 1) · (n − 2) · . . . · (n − (k − 1)). Definieren wir die Fakultät: n! = n(n − 1)(n − 2) · . . . · 3 · 2 · 1 für n ∈ N und 0! = 1, so können wir schreiben: n(n − 1)(n − 2) · . . . · (n − (k − 1))(n − k)(n − (k + 1)) · . . . · 3 · 2 · 1 (n − k)(n − (k + 1)) · · · 3 · 2 · 1 n! = . (n − k)! Anzahl = 8 Nun wird die Reihenfolge der Elemente in einer Menge nicht unterschieden, d.h. {1, 2} = {2, 1}. Die obigen 20 Möglichkeiten reduzieren sich auf die 10 Möglichkeiten {1, 2}, {1, 3}, {1, 4}, {1, 5}, {2, 3}, {2, 4}, {2, 5}, {3, 4}, {3, 5}, {4, 5}. Allgemein: Die k! Möglichkeiten, k Elemente in einer Liste zu schreiben, müssen herausdividiert werden. Wir erhalten: Anzahl = n! . (n − k)!k! Man nennt diesen Quotienten Binomialkoeffizienten und definiert n! n := für n, k ∈ N0 , n ≥ k. k (n − k)!k! In unserem Beispiel gilt etwa 5·4·3·2·1 5! 5 = = 10. = 3!2! 3·2·1·2·1 2 Die Binomialkoeffizienten können übrigens rekursiv über das sogenannte Pascalsche Dreieck berechnet werden (siehe Abb. 2.2). k 0 1 2 3 4 n 0 1 1 1 1 2 1 2 1 3 1 3 3 1 4 1 4 6 4 5 1 5 10 10 5 5 1 1 Abbildung 2.2: Pascalsches Dreieck. Die Zahlen in der Tabelle erhält man durch Addition der direkt und links darüber liegenden Zahlen. Beispielsweise ist 5 = 10 = 4 + 6. 3 9 Interessanterweise sind die Binomialkoeffizienten gerade die Koeffizienten nach Ausmultiplizieren des Produktes (a + b)n : (a + b)1 = 1 · a + 1 · b, (a + b)2 = 1 · a2 + 2 · ab + 1 · b2 , (a + b)3 = 1 · a3 + 3 · a2 b + 3 · ab2 + 1 · b3 , usw. Dies motiviert das folgende Resultat. Satz 2.7 (Binomialsatz) Für a, b ∈ R und n ∈ N0 gilt: n X n n n n n−1 n n n n−k k n−1 n b . ab + a b + ··· + a + a b = (a + b) = n n − 1 1 0 k k=0 2.4 Komplexe Zahlen Die Gleichung x2 + 1 = 0 besitzt keine reelle Lösung. Um diesem Umstand Abhilfe zu schaffen, erweitert man den Zahlenbegriff. Wir definieren eine neue Zahl i mit der Eigenschaft i2 = −1 (auch geschrie√ ben als i = −1). Definition 2.8 Die Zahl i mit i2 = −1 heißt komplexe Einheit. Die Menge der komplexen Zahlen ist definiert durch C = {z : z = a + ib, a, b ∈ R}. Wir definieren weiter für eine Zahl z = a + ib ∈ C: • Realteil von z: Re (z) = a, • Imaginärteil von z: Im (z) = b, • konjugiert komplexe Zahl von z: z = a − ib, √ • Betrag von z: |z| = a2 + b2 . Diese Definitionen können mit Hilfe der Gaußschen Zahlenebene veranschaulicht werden (Abbbildung 2.3). Die komplexe Zahl z wird als ein Ortsvektor dargestellt. Die konjugiert komplexe Zahl z ist der an der x-Achse (oder Re -Achse) gespiegelte Vektor; der Betrag |z| ist die Länge des Vektors z. Benutzt man die Beziehung i2 = −1, so kann man mit komplexen Zahlen so rechnen, wie man es von den reellen Zahlen gewohnt ist. 10 Im b 11 00 z = a + ib r r sin α α 0 Re a r cos α −b 11 00 z = a − ib Abbildung 2.3: Gaußsche Zahlenebene. Beispiel 2.9 Seien z1 = 2 + 3i, z2 = 1 − 2i ∈ C. Dann ist • Addition: z1 + z2 = 2 + 3i + 1 − 2i = 3 + i, • Subtraktion: z1 − z2 = 2 + 3i − 1 + 2i = 1 + 5i, • Multiplikation: z1 · z2 = (2 + 3i)(1 − 2i) = 2 + 3i − 4i − 6i2 = 8 − i, • Division: 2 + 3i (2 + 3i)(1 + 2i) 2 + 3i + 4i + 6i2 −4 + 7i 4 7 z1 = = = = = − + i. z2 1 − 2i (1 − 2i)(1 + 2i) 1 − 4i2 1+4 5 5 So wie man zweidimensionale Vektoren durch Angabe der Länge und des Winkels in Polarkoordinaten darstellen kann, ist dies auch für komplexe Zahlen möglich (Abbildung 2.3). Man schreibt für z = a + ib ∈ C a = r cos α, wobei r = |z| = √ b = r sin α, a2 + b2 , also z = a + ib = r(cos α + i sin α), r > 0, α ∈ R. Eine dritte Darstellungsform komplexer Zahlen erhält man durch die Eulersche Formel eiα := cos α + i sin α. 11 Dann können wir für z ∈ C schreiben z = r(cos α + i sin α) = reiα . Der Vorteil dieser Formulierung ist, daß komplexe Zahlen einfach potenziert werden können: n iα n n iαn n z = (re ) = r e = r cos(nα) + i sin(nα) . Die drei Darstellungsformen sind in Abbildung 2.4 zusammengefaßt. Komplexe Zahl z Kartesische Form a + ib Polarkoordinaten r(cos α + i sin α) Eulersche Form reiα Abbildung 2.4: Darstellung komplexer Zahlen. Die trigonometrischen Funktionen sind periodisch; daher ist 1 = ei·0 = cos 0 + i sin 0 = cos 2π + i sin 2π = e2πi . (2.1) Diese Beobachtung motiviert das Wurzelziehen komplexer Zahlen, denn √ √ w1 = z = (reiα )1/2 = reiα/2 . √ Allerdings gibt es noch eine zweite Wurzel w2 = rei(α+2π)/2 , da aus (2.1) folgt √ i(α+2π)/2 2 w22 = re = rei(α+2π) = reiα e2πi = reiα . Allgemein gilt: Satz 2.10 Sei z = reiα ∈ C, z 6= 0. Dann existieren genau n verschiedene komplexe Zahlen w0 , . . . , wn−1 ∈ C, die die Gleichung wn = z lösen. Sie lauten √ k = 0, . . . , n − 1. wk = n rei(α+2πk)/n , Beispiel 2.11 (1) Sei z = −1 = e−iπ . Dann lauten die beiden Quadratwurzeln w1 = e−iπ/2 = −i und w2 = ei(−π+2π)/2 = eiπ/2 = i. √ √ Die Bezeichnung −1 = z = i ist also etwas mißverständlich, da es ja zwei Wurzeln gibt. In beiden Fällen gilt i2 = w12 = −1, (−i)2 = w22 = −1. (2) Wir suchen alle komplexen Wurzeln von z 3 = 1 = ei·0 . Sie lauten nach Satz 2.10 (siehe Abbildung 2.5) w1 = e0·πi/3 = 1, w2 = e2πi/3 , 12 w3 = e4πi/3 . Im i w2 w1 1 Re w3 Abbildung 2.5: Die dritten Einheitswurzeln. Wofür braucht man komplexe Zahlen? Wir geben zwei Antworten. Zum einen erlauben komplexe Zahlen die Lösung von Gleichungen der Form f (x) := an xn + an−1 xn−1 + · · · + a1 x + a0 = 0. (2.2) Satz 2.12 (Fundamentalsatz der Algebra) Seien n ∈ N und a0 , . . . , an ∈ C mit an 6= 0. Dann existieren k ∈ N, n1 , . . . , nk ∈ N mit n1 + · · · + nk = n und paarweise verschiedene Zahlen x1 , . . . , xk ∈ C, so daß f (x) = (x − x1 )n1 (x − x2 )n2 · . . . · (x − xk )nk . Die Zahlen x1 , . . . , xk sind also Lösungen von (2.2). Die Zahl nj heißt Vielfachheit der Lösung xj (j = 1, . . . , k). Die zweite Antwort geben wir im nächsten Beispiel. Beispiel 2.13 (Freies Elektron) Der Zustand eines freien Elektrons wird durch die sogenannte Wellenfunktion ψ(x) ∈ C beschrieben. In der Darstellung ψ(x) = reiα wird das Elektron als eine Welle mit Amplitude r und Phase α interpretiert. Außerdem interpretiert man das Betragsquadrat |ψ(x)|2 als die Wahrscheinlichkeitsdichte, das Elektron “in der Nähe” des Ortes x zu finden. Ein freies Teilchen im Raum mit maximaler Aufenthaltswahrscheinlichkeit an der Stelle x = 0 wird z.B. dargestellt durch den stationären Zustand ψ(x) = eikx e−x 13 2 /2 . Hierbei ist k die Wellenzahl des Teilchens, die ein Maß für dessen Energie ist. Wegen 2 2 |ψ(x)| = |eikx | · |e−x /2 | = e−x /2 ist tatsächlich die Wahrscheinlichkeitsdichte an x = 0 maximal. Für x → ±∞ wird |ψ(x)| immer kleiner; dies bedeutet, daß die Wahrscheinlichkeit, das Teilchen weit weg von x = 0 zu finden, sehr klein ist. 14 3 Funktionen Eine Abbildung ist eine Vorschrift, die jedem Element x aus einer (nichtleeren) Menge M genau ein Element f (x) aus einer Menge N zuordnet; kurz: f : M → N, x 7→ f (x). Die Menge M heißt Definitionsbereich von f , N heißt Wertebereich (Abbildung 3.1). Wir schreiben meist Df für den Definitionsbereich von f . M N Abbildung 3.1: Zur Definition einer Abbildung. Ist M = Rn und N = R, so nennen wir eine Abbildung eine Funktion. In diesem Kapitel untersuchen wir einige elementare Funktionen wie Polynome, exp, ln, sin, cos usw. 3.1 Funktionen und ihre Inverse Wir definieren zunächst die Inverse einer Funktion. Definition 3.1 Sei f : Df → R eine Funktion. Man nennt die Funktion g : Dg → R mit der Eigenschaft g(f (x)) = x f (g(y)) = y für alle x ∈ Df bzw. für alle y ∈ Dg die Inverse von f und schreibt g = f −1 . Beispiel 3.2 Sei f (x) = x2 + 1, x ∈ Df = R. Wir setzen y = x2 + 1 und lösen nach x auf: p x = ± y − 1. √ Setzen wir g(y) = ± y − 1, so ist g ein Kandidat für die Inverse von f (siehe Abbildung 3.2), denn p f (g(y)) = (± y − 1)2 + 1 = (y − 1) + 1 = y. Es stellen sich jedoch zwei Fragen: 15 y f g 1 x 1 Abbildung 3.2: Die Funktion f (x) = x2 +1 und deren Spiegelung an der Diagonalen x = y. • Wie lautet der Definitionsbereich von g? √ √ • Warum gibt es zwei Funktionen g(y) = y − 1 und g(y) = − y − 1? Die erste Frage kann leicht beantwortet werden: Damit es eine reelle Wurzel gibt, sollte y ≥ 1 sein, also Dg = [1, ∞). Dies ist übrigens gerade das Bild von f : f (R) = {f (x) : x ∈ Df } = [1, ∞) = Dg . Die Antwort der zweiten Frage basiert auf der Feststellung, daß zu jedem x 6= 0 die beiden Werte f (x) und f (−x) übereinstimmen. Daher gibt es zu jedem y > 1 zwei Werte für die “Inverse”. Damit die Inverse eindeutig bestimmt ist, sollte zu jedem y ∈ f (R) genau ein x ∈ Df existieren, so daß f (x) = y. Eine Funktion f : Df → f (R) (beachte den Wertebereich!) mit dieser Eigenschaft heißt bijektiv. Definition 3.3 Sei f : Df → Wf eine Funktion. Dann heißt f bijektiv genau dann, wenn für alle y ∈ Wf genau ein x ∈ Df existiert mit f (x) = y. Bijektive Funktionen sind invertierbar. Beispielsweise ist für f : [0, ∞) → [1, ∞), √ f (x) = x2 + 1, die Inverse gegeben durch f −1 : [1, ∞) → [0, ∞), f −1 (y) = y − 1. Hätten wir f : (−∞, 0] → [1, ∞), f (x) = x2 + 1, definiert, so würde die Inverse f −1 : [1, ∞) → √ (−∞, 0], f −1 (y) = − y − 1, lauten. 3.2 Rationale Funktionen Definition 3.4 Sei n ∈ N und a0 , . . . , an ∈ R, an 6= 0. Dann heißt die Funktion p : R → R, definiert durch n X p(x) = ak x k = a0 + a1 x + · · · + an x n , k=0 16 Polynom vom Grade n. Definition 3.5 Seien pm (x) bzw. qn (x) Polynome vom Grade m bzw. n. Dann heißt R(x) = pm (x) qn (x) rationale Funktion. Sie ist für alle x ∈ R definiert, die keine Nullstellen von qn sind. Ist m < n, so heißt R echt gebrochene rationale Funktion, anderenfalls heißt sie unecht gebrochen. Beispiel 3.6 (1) Die Funktion R(x) = (x − 1)(x + 3) x2 + 2x − 3 = =x−1 x+3 x+3 ist eigentlich keine rationale Funktion, sondern ein Polynom vom Grade 1 und damit definiert für alle x ∈ R. (2) Die Funktion x2 + 2x − 3 R(x) = x+4 ist eine unecht gebrochene rationale Funktion, definiert für alle x ∈ R, x 6= −4. Sie kann allerdings mit Hilfe der Polynomdivison geschrieben werden als die Summe eines Polynoms und einer echt gebrochenen rationalen Funktion: 5 (x2 + 2x − 3) : (x + 4) = x − 2 + x+4 −(x2 + 4x) −2x − 3 −(−2x − 8) 5 Wir erhalten: R(x) = x − 2 + 5 . x+4 Beispiel 3.7 Für ideale Gase gilt die Zustandsgleichung p · V = R · T, wobei p der Druck, V das Volumen, T die Temperatur des Gases und R die sogenannte Gaskonstante sind. Die Aussage dieser Gleichung ist, daß das Produkt von Druck und Volumen eines Gases bei gleich gehaltener Temperatur konstant ist. Dies gilt nur annähernd. Eine bessere Approximation liefert die Van-der-Waals-Gleichung a p + 2 (V − b) = RT, V 17 wobei a die intermolekularen Kräfte und b die Größe der Gasmoleküle modelliert. Bei konstanter Temperatur ist der Druck eine Funktion des Volumens: p(V ) = p = a RT V 2 − aV + ab RT − 2 = . V −b V V 2 (V − b) Der Druck p(V ) ist also eine echt gebrochene rationale Funktion. In Kapitel 7 benötigen wir eine Formulierung rationaler Funktion als Summe einfacher rationaler Funktionen, etwa von der Art 1 1 2x + = 2 . x+1 x−1 x −1 Dies führt auf das Konzept der Partialbruchzerlegung. Beispiel 3.8 (1) Sei R(x) = x2 + 1 . x3 − 2x2 − x + 2 Wir suchen zuerst alle Nullstellen des Nenners. Wir raten die Nullstelle x1 = 1. Mit Polynomdivision erhalten wir: (x3 − 2x2 − x + 2) : (x − 1) = x2 − x − 2 −(x3 − x2 ) −x2 − x −(−x2 + x) −2x + 2 −(−2x + 2) 0 Die Nullstellen von x2 − x − 2 ergeben sich aus der p-q-Formel: r 1 1 1 3 x2/3 = ± +2= ± , also x2 = 2, x3 = −1. 2 4 2 2 Daher ist R(x) = x2 + 1 , (x + 1)(x − 2)(x − 1) x ∈ R\{1, 2, −1}. Wir machen nun den Ansatz R(x) = A B C + + x+1 x−2 x−1 (3.1) und wollen die Konstanten A, B und C bestimmen. Wir multiplizieren (3.1) mit dem Nenner: x2 + 1 = A(x − 2)(x − 1) + B(x + 1)(x − 1) + C(x + 1)(x − 2). 18 Eigentlich gilt diese Gleichung nur für x ∈ / {1, 2, −1}. Es ist dennoch möglich, diese Werte einzusetzen (dies folgt aus der Stetigkeit, die wir erst in Kapitel 6 einführen): x=1: 2 = −2C x=2: 5 = 3B x = −1 : 2 = 6A =⇒ =⇒ =⇒ C = −1, B = 35 , A = 31 . Wir folgern aus (3.1): R(x) = (2) Sei 5 1 1 + + . 3(x + 1) 3(x − 2) x − 1 x3 . x3 + x2 + x + 1 Diese Funktion ist unecht gebrochen rational, so daß wir zuerst Polynomdivision durchführen: R(x) = x3 : (x3 + x2 + x + 1) = 1 − −(x3 + x2 + x + 1) −x2 − x − 1 x2 + x + 1 . x3 + x2 + x + 1 Eine Nullstelle erraten wir: x1 = −1. Eine weitere Polynomdivision führt auf (x3 + x2 + x + 1) : (x + 1) = x2 + 1 −(x2 + x2 ) 0+x+1 −(x + 1) 0 Es gibt keine weiteren Nullstellen. Wir erweitern daher unseren Ansatz der Partialbruchzerlegung zu A Bx + C x2 + x + 1 = + 2 . 3 2 x +x +x+1 x+1 x +1 Wir multiplizieren mit dem Nenner x2 + x + 1 = A(x2 + 1) + (Bx + C)(x + 1) und setzen spezielle Werte ein: x = −1 : 1 1 = 2A =⇒ A = , 2 1 1 = A + C =⇒ C = 1 − A = , 2 3 1 x=1: 3 = 2A + 2(B + C) =⇒ B = − A − C = . 2 2 Damit erhalten wir die Zerlegung x=0: R(x) = 1 − 1 x+1 x2 + x + 1 =1− − . 3 2 x +x +x+1 2(x + 1) 2(x2 + 1) 19 3.3 Elementare Funktionen Exponentialfunktionen. Betrachte für a ∈ (1, ∞) die Funktion f (x) = ax , x ∈ R. Sie hat die Eigenschaften a0 = 1, ax1 +x2 = ax1 · ax2 . a1 = a, Die Inverse von f ist der Logarithmus zur Basis a: f −1 : (0, ∞) → R, f −1 (x) = loga x. Die Inverse hat die Eigenschaften loga 1 = 0, loga (x1 · x2 ) = loga x1 + loga x2 . loga a = 1, Im Falle a = e (Eulersche Zahl) nennt man loge = ln den natürlichen Logarithmus; im Falle a = 10 wird log10 = log dekadischer Logarithmus genannt. Falls a = e, heißt f (x) = ex Exponentialfunktion. Trigonometrische Funktionen. Sinus und Cosinus sind Funktionen sin : R → R, cos : R → R mit den Eigenschaften cos2 x + sin2 x = 1, sin(πk) = 0, x ∈ R, cos(πk) = (−1)k , sin + 1) = (−1)k , cos π2 (2k + 1) = 0, k ∈ N0 . π (2k 2 Insbesondere sind sin und cos 2π-periodisch, d.h. sin(x + 2π) = sin x, cos(x + 2π) = cos x, x ∈ R. Daher sind sin und cos auf R nicht invertierbar, sehr wohl aber die eingeschränkten Funktionen h π πi → [−1, 1], cos : [0, π] → [−1, 1]. sin : − , 2 2 Die Inversen heißen Arcussinus und Arcuscosinus: h π πi arcsin : [−1, 1] → − , , arccos : [−1, 1] → [0, π]. 2 2 20 Der Tangens h π πi sin x tan : − , , → R, tan x = 2 2 cos x ist invertierbar; die Inverse heißt Arcustangens: h π πi . arctan : R → − , 2 2 Hyperbolische Funktionen. Sinus und Cosinus hyperbolicus sind definiert durch 1 sinh x = (ex − e−x ), 2 1 cosh x = (ex + e−x ), 2 x ∈ R, x ∈ R. Der Name rührt daher, daß cosh2 x − sinh2 x = 1 gilt und y 2 − x2 = 1 die Gleichung einer Hyperbel ist. Analog zum Tangens gibt es einen Tangens hyperbolicus: tanh x = sinh x ex − e−x = x , cosh x e + e−x x ∈ R. Die Inversen werden auch Area-Funktionen genannt: arsinh : R → R, arcosh : [1, ∞) → [0, ∞), artanh : (−1, 1) → R, √ arsinh x = ln(x + x2 + 1), √ arcosh x = ln(x + x2 − 1), 1+x artanh x = 12 ln 1−x . Übrigens kann man in diese Funktionen auch komplexe Argumente einsetzen und erhält damit einen Zusammenhang zwischen den trigonometrischen und den hyperbolischen Funktionen. Benutzen wir nämlich die Eigenschaft, daß sin(−x) = − sin x und cos(−x) = cos x, so folgt aus der Eulerschen Formel eiz = cos z + i sin z, z ∈ C, für z = −ix und z = ix, x ∈ R: ex = cos(ix) − i sin(ix), e−x = cos(ix) + i sin(ix). Addition und Subtraktion der beiden Gleichungen ergibt 1 cosh x = (ex + e−x ) = cos(ix), 2 1 x sinh x = (e − e−x ) = −i sin(ix). 2 21 4 4.1 Vektoren und Matrizen Vektoren Definition 4.1 Der Raum Rn ist das n-fache kartesische Produkt R × R × · · · × R oder x1 n o x 2 n R = . : x1 , . . . , xn ∈ R . .. xn Die Elemente des Rn heißen Vektoren. Definition 4.2 (1) Sei x ∈ Rn . Der transponierte Vektor x> ist definiert durch x> = (x1 , x2 , . . . , xn ), d.h., x> ist ein Zeilenvektor, während x ein Spaltenvektor ist. (2) Seien x = (x1 , . . . , xn )> , y = (y1 , . . . , yn )> ∈ Rn und λ ∈ R. Die Addition bzw. Subtraktion von Vektoren und die Multiplikation mit dem Skalar sind definiert durch x + y = (x1 + y1 , x2 + y2 , . . . , xn + yn )> , x − y = (x1 − y1 , x2 − y2 , . . . , xn − yn )> , λx = (λx1 , λx2 , . . . , λxn )> . Die Operationen mit Vektoren sind in Abbildung 4.1 veranschaulicht. (a) (b) x−y x+y x 0 y (c) −y 0 x λ=2 y 0 y λy Abbildung 4.1: (a) Addition, (b) Subtraktion von Vektoren und (c) Multiplikation mit dem Skalar λ. Definition 4.3 Das Skalarprodukt im Rn lautet x·y = n X i=1 xi yi für x = (x1 , . . . , xn )> , y = (y1 , . . . , yn )> ∈ Rn . 22 2 y x 1 −2 −1 0 1 2 Abbildung 4.2: Die Vektoren x und y stehen senkrecht aufeinander. Beispiel 4.4 Seien x = (2, 1)> , y = (−1, 2)> ∈ R2 . Dann folgt x · y = 2 · (−1) + 1 · 2 = 0. Nun steht x senkrecht auf y (siehe Abbildung 4.2); man erhält allgemein x · y = 0 genau dann, wenn x senkrecht auf y steht. Das Skalarprodukt hat die folgenden Eigenschaften. Für alle x, y, z ∈ Rn gilt: (1) (x + y) · z = x · z + y · z, (2) x · (y + z) = x · y + x · z, (3) x · y = y · x, (4) x · x ≥ 0 und x · x = 0 ⇐⇒ x = 0. Definition 4.5 Die Länge oder Norm eines Vektors x = (x1 , . . . , xn )> ∈ Rn ist definiert als v u n uX √ x2i . kxk = x · x = t i=1 Diese Definition ist in Abbildung 4.3 veranschaulicht. Die Norm hat die folgenden Eigenschaften. Für alle x ∈ Rn und λ ∈ R gilt: (1) kxk ≥ 0 und kxk = 0 ⇐⇒ x = 0 (Positivität), (2) kλxk = |λ| · kxk (Homogenität), (3) kx + yk ≤ kxk + kyk (Dreiecksungleichung). 23 x2 p x21 + x22 x ) 1111111111111111 0000000000000000 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 0000000000000000 1111111111111111 | {z x1 x2 } Abbildung 4.3: Zur Definition der Norm eines Vektors im R2 . Definition 4.6 Der Winkel α ∈ [0, π] zwischen zwei Vektoren x, y ∈ Rn ist definiert durch x·y cos α = . kxk · kyk Wir sagen, x steht senkrecht auf y bzw. x ist orthogonal zu y (kurz x ⊥ y) genau dann, wenn x · y = 0 oder α = π2 . Beispiel 4.7 Seien x = (2, 1)> , y = (−1, 2)> , z ∈ (0, 2)> ∈ R2 (siehe Abbildung 4.2). Dann ist π x·y = 0, also αxy = , kxk · kyk 2 1 2 x·z also αxz ≈ 1.1071 = 63.43◦ , = √ √ = √ , = kxk · kzk 5· 4 5 z·y 2 4 = also αzy ≈ 0.4636 = 26.57◦ . = √ √ = √ , kzk · kyk 4· 5 5 cos αxy = cos αxz cos αzy Es gilt klarerweise αxz + αzy = 90◦ oder αxz + αzy ≈ 1.5707 ≈ π2 . Satz 4.8 (Pythagoras) Seien x, y ∈ Rn mit x ⊥ y. Dann ist kxk2 + kyk2 = kx + yk2 . Beweis: Wegen x · y = 0 nach Definition 4.6 folgt kx + yk2 = (x + y) · (x + y) = x · x + x · y + y · x + y · y = kxk2 + 2x · y + kyk2 = kxk2 + kyk2 . Zwischen Vektoren im R3 (und nur im R3 !) gibt es noch eine andere “Multiplikation”. 24 Definition 4.9 Seien x = (x1 , x2 , x3 )> , y = (y1 , y2 , y3 )> ∈ R3 . Dann lautet das Kreuzprodukt (auch Vektorprodukt genannt) x2 y3 − x3 y2 x × y = x3 y1 − x1 y3 . x1 y2 − x2 y1 Beispiel 4.10 Seien Dann ist 1 x = 0 , 2 −2 y = 1 . 3 0·3−2·1 −2 x × y = 2 · (−2) − 1 · 3 = −7 . 1 · 1 − 0 · (−2) 1 Es gilt interessanterweise 1 −2 x · (x × y) = 0 · −7 = 0, 2 1 −2 −2 y · (x × y) = 1 · −7 = 0, 3 1 d.h., sowohl x als auch y sind orthogonal zu x × y. Diese Eigenschaft gilt allgemein. Das Kreuzprodukt hat die folgenden Eigenschaften. Seien x, y ∈ R3 . (1) x × y steht senkrecht auf x und y, (2) kx × yk2 = kxk2 kyk2 − (x, y)2 , (3) x × y = 0 =⇒ ∃c ∈ R : x = cy. Diese Eigenschaften können durch Nachrechnen bestätigt werden (für den Beweis von (3) verwendet man (2) und die sogenannte Cauchy-Schwarz-Ungleichung |x · y| ≤ kxk · kyk). 4.2 Matrizen Definition 4.11 Seien n, m ∈ N. Ein rechteckiges Zahlenschema der Form a11 a12 . . . a1n a21 a22 . . . a2n A= .. .. . . am1 am2 . . . amn mit Elementen aij ∈ R heißt (m × n)-Matrix. Wir schreiben kurz: A ∈ Rm×n . 25 Es gibt einige spezielle Matrizen. Eine (n × 1)-Matrix können wir als Vektor interpretieren. Definition 4.12 (1) Eine Matrix A ∈ Rm×n heißt quadratisch, wenn m = n. (2) Eine Diagonalmatrix ist eine quadratische Matrix mit verschwindenden Nichtdiagonalelementen: d1 0 d2 ∈ Rn×n . D= ... 0 dn (3) Die Einheitsmatrix ist eine Diagonalmatrix, deren Diagonalelemente alle Eins sind: 1 0 1 ∈ Rn×n . E= ... 0 1 Definition 4.13 (1) Zwei Matrizen A = (aij ), B = (bij ) ∈ Rm×n sind gleich, wenn alle Elemente übereinstimmen: A=B ⇐⇒ ∀ i = 1, . . . , m, j = 1, . . . , n : aij = bij . (2) Die transponierte Matrix A> = (e aij ) für A = (aij ) ∈ Rn×n ist definiert durch e aij = aji , d.h., man erhält A> durch Vertauschen der Zeilen und Spalten von A. (3) Eine quadratische Matrix A ∈ Rn×n heißt symmetrisch, wenn A> = A. Beispiel 4.14 Seien 1 2 0 A = 0 1 0 , 0 0 1 1 2 0 B = 2 1 0 . 0 0 1 Dann ist A quadratisch, aber nicht symmetrisch; B ist dagegen symmetrisch. Matrizen werden elementweise addiert, subtrahiert bzw. mit Skalaren multipliziert. Seien A = (aij ), B = (bij ) ∈ Rn×m und λ ∈ R. Dann ist (A + B)ij = aij + bij , (A − B)ij = aij − bij , (λA)ij = λaij . Die Multiplikation von Matrizen ist dagegen etwas aufwendiger. 26 Definition 4.15 Seien A ∈ Rm×n und B ∈ Rn×` . Das Matrixprodukt C = AB ∈ Rm×` ist definiert durch n X cij = aik bkj , k=1 wobei C = (cij ). Beispiel 4.16 (1) Seien ! 1 2 , 3 0 A= B= ! 3 2 . 0 1 Man kann sich die Matrixmultiplikation durch das Schema “Zeile × Spalte” merken: 3 0 1 2 1·3+2·0=3 3 0 3·3+0·0=9 2 1 1·2+2·1=4 3·2+0·1=6 AB Daher ist AB = ! 3 4 6= 9 6 1 3 3 2 9 0 1 3 BA 2 0 6 0 ! 9 6 = BA. 3 0 (2) Seien A= ! 2 −1 2 , 4 −2 4 Dann ist −1 0 B = 2 2 , 2 1 −1 2 AB 2 2 −1 2 0 4 −2 4 0 also AB = 0 2 1 0 0 ! 0 0 , 0 0 C = B> = ! −1 2 2 . 0 2 1 −1 2 2 0 2 1 , 2 −1 2 nicht 4 −2 4 definiert AC AC ist nicht definiert. Die Matrixmultiplikation hat also einige Besonderheiten: (1) Das Produkt AB existiert nur, wenn die Spaltenzahl von A gleich der Zeilenzahl von B ist. 27 (2) Falls AB und BA definiert sind, gilt im allgemeinen AB 6= BA. (3) Falls AB = 0, muß nicht A = 0 oder B = 0 folgen. Die Gleichung ab = 1 für gegebenes a ∈ R, a 6= 0, besitzt die eindeutige Lösung b = 1/a, und man nennt b die Inverse von a. Wir wollen dieses Konzept auf Matrizen erweitern. Definition 4.17 Eine Matrix A ∈ Rn×n heißt invertierbar, wenn eine Matrix B ∈ Rn×n existiert, so daß AB = E oder BA = E, wobei E ∈ Rn×n die Einheitsmatrix sei (siehe Definition 4.12). Wir schreiben B = A−1 und nennen A−1 die Inverse von A. Nicht invertierbare Matrizen heißen singulär. Beispiel 4.18 (1) Sei ! 1 2 . 3 4 A= Dann ist A invertierbar und A−1 = ! −2 1 , 3/2 −1/2 denn AA−1 = (2) Die Matrix A= ! 1 0 = E. 0 1 ! 1 1 2 2 ist nicht invertierbar. Angenommen, es gäbe eine Matrix ! a b B= c d mit AB = E. Dann folgt aus ! 1 0 =A=B= 0 1 ! 1 1 2 2 a b c d ! = ! a+c b+d 2(a + c) 2(b + d) die Gleichungen 1 = a + c, 0 = 2(a + c), also 0 = a + c = 1 und damit ein Widerspruch. Solch eine Matrix B kann also nicht existieren, d.h., A ist singulär. 28 Für (2 × 2)-Matrizen gibt es eine Formel für die Inverse. Für (n × n)-Matrizen ist die Invertierung komplizierter und wird erst in Abschnitt 4.6 behandelt. Satz 4.19 (Cramersche Regel) Sei A= a b c d ! ∈ R2×2 . (4.1) Dann ist A invertierbar genau dann, wenn ad − bc 6= 0. In diesem Fall gilt ! d −b 1 . A−1 = ad − bc −c a Beweis: Nachrechnen. Satz 4.20 Seien A, B ∈ Rn×n invertierbar. Dann ist auch AB invertierbar und (AB)−1 = B −1 A−1 . Beweis: (AB)(B −1 A−1 ) = A(BB −1 )A−1 = AEA−1 = AA−1 = E. Wofür braucht man die Inverse einer Matrix? Betrachte das Gleichungssystem x1 + 2x2 = −1, 3x1 + 4x2 = 3. Schreiben wir A= ! 1 2 , 3 4 x= x1 x2 ! , (4.2) b= ! −1 , 3 so können wir (4.2) kompakt als Ax = b formulieren. Multiplizieren wir A−1 von links auf beiden Seiten, so folgt x = Ex = A−1 Ax = A−1 b und wegen Beispiel 4.18 (1) ! x1 x= = A−1 b = x2 −2 1 3/2 −1/2 ! −1 3 ! = ! 5 . −3 Die Lösung von (4.2) lautet folglich x1 = 5 und x2 = −3. Mittels der Inversen kann also ein lineares Gleichungssystem bequem gelöst werden, sofern die Koeffizientenmatrix invertierbar ist (anderenfalls siehe Abschnitt 4.6). 29 4.3 Der Gauß-Algorithmus In der Chemie tritt vielfach das Problem auf, unbekannte Größen x1 , x2 , . . . , xn aus einem System linearer Gleichungen zu bestimmen. In Kapitel 1 haben wir gezeigt, daß die Bestimmung der Reaktionsgleichung für den Zerfall von Kaliumdichromat auf das lineare Gleichungssystem 2x1 − 2x2 = 0, 2x1 − x2 − 2x3 = 0, (4.3) 7x1 − 4x2 − 3x3 − 2x4 = 0 führt. Um dieses System von Gleichungen zu lösen, könnte man zuerst die erste Gleichung nach x2 auflösen; dies führt auf x2 = x1 . Setzen wir dieses Ergebnis in die zweite Gleichung ein, erhalten wir die Gleichung x1 − 2x3 = 0, also x3 = x1 /2. Dies können wir in die letzte Gleichung einsetzen usw. Obwohl diese Einsetzmethode zum Ziel führt, wird sie bei großen Gleichungssystemen mit zehn oder mehr Gleichungen sehr umständlich. Es ist zweckmäßiger, einen Algorithmus zu entwickeln, mit dem Gleichungssysteme allgemein aufgelöst werden können. Der Vorteil eines Algorithmus ist, daß die Lösung von Gleichungssystemen mit Hilfe eines Computers ermöglicht wird. Ein solches Verfahren ist der Gauß-Algorithmus (auch Gaußsches Eliminationsverfahren genannt), den wir in diesem Abschnitt betrachten wollen. Allgemein schreiben wir ein lineares Gleichungssystemmit n Variablen x1 , x2 , . . . , xn und m Gleichungen als a11 x1 + a12 x2 + · · · + a1n xn = b1 , a21 x1 + a22 x2 + · · · + a2n xn = b2 , .. . (4.4) am1 x1 + am2 x2 + · · · + amn xn = bm . Die obige Schreibweise kann vereinfacht werden. Dazu schreiben wir die Koeffizienten als die Koeffizientenmatrix a11 a12 · · · a1n a21 a22 · · · a2n A= . .. .. . . . . am1 am2 · · · amn 30 und die Variablen x1 , . . . , xn und die Werte b1 , . . . , bm auf den rechten Seiten von (4.4) als x1 b1 x2 b2 x= .. und b = .. . . . xn bm Damit können wir (4.4) kompakt formulieren als Ax = b. Die Matrix, die dadurch entsteht, wenn zur Matrix A die Spalte b hinzugefügt wird, nennen wir die erweiterte Koeffizientenmatrix und bezeichnen sie mit (A|b). Sie besitzt m Zeilen und n + 1 Spalten. Die Idee des Gauß-Algorithmus ist es, durch geschicktes Kombinieren von Gleichungen eine Matrix zu erhalten, deren Elemente unterhalb der Hauptdiagonalen alle gleich null sind. Dann kann das Gleichungssystem einfach rekursiv aufgelöst werden. Das Verfahren wird anhand der folgenden Beispiele deutlich. Beispiel 4.21 (1) Löse Ax = b mit 2 1 −4 A= 6 0 2 −2 3 4 Wir schreiben I 2 1 II 6 0 −2 3 III 2 1 0 −3 0 4 2 1 0 −3 0 0 Aus der dritten Gleichung folgt 56 x 3 3 −3x2 + 14x3 2x1 + x2 − 4x3 = − 92 3 = −21 = 7 und 7 b= 0 −7 −4 7 2 0 −3 · I 4 −7 +I −4 7 14 −21 0 0 + 43 · II −4 7 14 −21 56 − 84 3 3 =⇒ =⇒ =⇒ 31 x3 = − 23 , x2 = − 13 (−21 + 14 · 32 ) = 0, x1 = 12 (7 − 4 · 23 ) = 12 . Die Lösung lautet x = ( 12 , 0, − 23 ). (2) Wir haben in Kapitel 1 gezeigt, daß die (ganzzahligen) Werte x1 ,k x2 , x3 , x4 der Reaktionsgleichung x1 K2 Cr2 O7 → x2 K2 CrO4 + x3 Cr2 O3 + x4 O2 das lineare Gleichungssystem 2 A = 2 7 Ax = b mit −2 0 0 −1 −2 0 −4 −3 −2 und 0 b = 0 0 lösen müssen (siehe (1.2)). Wir schreiben 2 −2 0 0 0 2 −1 −2 0 0 −II 7 −4 −3 −2 0 − 72 · II 2 −2 0 0 0 0 1 −2 0 0 −3 · II 0 3 −3 −2 0 2 −2 0 0 0 0 1 −2 0 0 . 0 0 3 −2 0 Wir erhalten drei Gleichungen für vier Variable, also einen freien Parameter. Wir setzen x4 = λ und 3x3 = 2x4 = 2λ =⇒ x3 = 32 λ, x2 = 2x3 = 34 λ =⇒ x2 = 43 λ, 2x1 = 2x2 = 38 λ =⇒ x1 = 43 λ. Die Lösungen lauten also 4 λ 4 , 3 2 λ ∈ R. 3 Wir suchen nur ganzzahlige Lösungen und wählen daher (zum Beispiel) λ = 3. Damit lautet die obige Reaktionsgleichung 4K2 Cr2 O7 → 4K2 CrO4 + 2Cr2 O3 + 3O2 . 32 (3) Löse das lineare Gleichungssystem Ax = b mit 1 2 3 4 1 A= 2 2 1 1 , b = 1 . −1 −2 −3 −4 1 Wir wenden den Gauß-Algorithmus an: I 1 2 3 4 1 2 1 1 1 −2 · I II 2 +I III −1 −2 −3 −4 1 1 I 1 2 3 4 II 0 −2 −5 −7 −1 . 2 0 0 0 III 0 Die letzte Gleichung lautet 0 · x1 + 0 · x2 + 0 · x3 + 0 · x4 = 2 bzw. 0 = 2. Diese Gleichung ist sinnlos. Was ist schiefgegangen? Das Resultat zeigt, daß das lineare Gleichungssystem keine Lösung besitzt, da die Umformungen des Gauß-Algorithmus auf eine unsinnige Gleichung führen. Die obigen Beispiele zeigen, daß ein lineares Gleichungssystem entweder keine, genau eine oder unendlich viele Lösungen besitzt. Welche Eigenschaften der Matrix bzw. der rechten Seite legen fest, wie viele Lösungen ein Gleichungssystem besitzt? Um diese Frage beantworten zu können, benötigen wir die Begriffe der Determinante und des Rangs einer Matrix. 4.4 Determinanten Wir haben in Satz 4.19 gesehen, daß die (2 × 2)-Matrix (4.1) genau dann invertierbar ist, wenn ad − bc 6= 0. Gibt es ein ähnliches Kriterium für allgemeine (n × n)-Matrizen? Die Antwort lautet Ja und führt auf das Konzept der Determinante einer Matrix. Definition 4.22 Die Determinante einer Matrix A ∈ Rn×n ist rekursiv definiert durch det A = a11 für n = 1, n X det A = (−1)i+j aij det Aij für n > 1, i=1 wobei j ∈ {1, . . . , n} beliebig ist und Aij diejenige Matrix ist, die aus A durch Streichen der i-ten Zeile und j-ten Spalte entsteht. In der obigen Formel können i und j vertauscht werden: n X det A = (−1)j+i aji det Aji . i=1 33 Beispiel 4.23 (1) Für (2 × 2)-Matrizen gilt ! a b det = (−1)1+1 · a · det(d) + (−1)2+1 · b · det(c) = ad − bc. c d (2) Sei 3 0 2 A = 1 −1 3 . 2 4 −2 Dann folgt ! ! −1 3 1 3 det A = (−1)1+1 · 3 · det + (−1)2+1 · 0 · det 4 −2 2 −2 ! 1 −1 +(−1)3+1 · 2 · det 2 4 = 3(2 − 12) + 2(4 + 2) = −18. Es ist also sinnvoll, nach einer Zeile oder Spalte zu entwickeln, die möglichst viele Nullen enthält. (3) Sei wie ein Beispiel 4.18 (1) ! 1 1 A= . 2 2 Dann ist det A = 1 · 2 − 1 · 2 = 0. Wir wissen, daß A nicht invertierbar ist. Gibt es einen Zusammenhang? Ja, siehe Satz 4.24 (3) unten. Auch für (3 × 3)- Matrizen gibt es eine Formel für die Determinante, nämlich die Regel von Sarrus: a11 a12 a13 a11 a12 a13 a11 a12 det a21 a22 a23 = a21 a22 a23 a21 a22 a31 a32 a33 a31 a32 a31 a32 a33 = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 −a13 a22 a31 − a11 a23 a32 − a12 a21 a33 . Die Regel gilt jedoch nicht für (4 × 4)-Matrizen oder höherdimensionale Matrizen! Satz 4.24 Seien A, b ∈ Rn×n . Dann gilt (1) det(AB) = det A · det B. 34 (2) det(A> ) = det A. (3) A ist invertierbar genau dann, wenn det A 6= 0. In diesem Fall gilt det(A−1 ) = 1/ det A. e die Matrix, die entsteht, wenn man bei der Matrix A zwei Zeilen oder zwei (4) Ist A e = − det A. Spalten miteinander vertauscht, so gilt det A Beachten Sie jedoch, daß im allgemeinen det(A + B) 6= det A + det B, denn beispielsweise " ! !# ! ! ! 1 0 1 0 2 0 1 0 1 0 det + = det = 4 6= 1 + 1 = det + det . 0 1 0 1 0 2 0 1 0 1 Die Entwicklung nach einer Zeile oder Spalte erlaubt eine sehr einfache Berechnung von Matrizen, deren Elemente unterhalb der Hauptdiagonalen alle gleich null sind: a11 a12 · · · a1n 0 a22 · · · a2n det . .. ... = a11 a22 · · · ann . . . 0 . 0 0 ann Solche Matrizen werden gerade beim Gauß-Algorithmus erzeugt! Daher kann die Determinante einer Matrix grundsätzlich mit dem Gauß-Algorithmus berechnet werden. Beispiel 4.25 Sei wie in Beispiel 4.23 die Matrix 3 0 2 A = 1 −1 3 2 4 −2 gegeben. Der Gauß-Algorithmus 3 0 2 3 − 13 · I 1 −1 2 4 −2 − 32 · I ergibt: 3 0 2 7/3 0 −1 0 4 −10/3 +4 · II 3 0 2 0 −1 7/3 . 0 0 6 Die Determinante ist dann das Produkt der Hauptdiagonalelemente: det A = 3 · (−1) · 6 = −18 in Übereinstimmung mit dem obigen Ergebnis. 35 4.5 Lineare Unabhängigkeit Kann man einer Matrix “ansehen”, ob sie invertierbar ist bzw. (nach Satz 4.24 (3)) eine verschwindende Determinante hat? In einem gewissen Sinne gibt das Konzept der linearen Unabhängigkeit eine Antwort. Definition 4.26 Die Vektoren a1 , . . . , ak ∈ Rn heißen linear unabhängig, wenn aus dem Ansatz k X λ i ai = 0 mit λi ∈ R i=1 folgt, daß λ1 = . . . = λk = 0. Anderenfalls heißen sie linear abhängig. Beispiel 4.27 (1) Seien ! 1 , 1 a1 = Dann folgt aus λ1 1 1 ! + λ2 a2 = ! 2 . 2 ! 2 = 2 ! 0 0 nicht λ1 = λ2 = 0, denn λ1 = 2, λ2 = −1 ist auch eine Lösung. Es folgt also 2a1 − a2 = 0 oder a2 = 2a1 . Die Vektoren a1 und a2 sind linear abhängig. Dies können wir auch sehen, indem wir den Gauß-Algorithmus für das lineare Gleichungssystem ! ! 1 2 x1 =0 1 2 x2 durchführen: 1 2 0 1 2 0 ! 1 2 0 0 0 0 −I Wir erhalten eine Gleichung 1 · λ1 + 2 · λ2 = gibt unendlich viele Lösungen. (2) Seien 1 2 a2 = a1 = , 0 −1 Aus dem Ansatz ! . 0 für zwei Unbekannte λ1 und λ2 , d.h., es 2 1 , 0 −1 1 2 a3 = −1 0. 0 1 2 1 2 0 1 2 λ1 + λ2 + λ3 = −1 0 0 0 0 0 −1 −1 36 ergibt sich das folgende Gleichungssystem, das wir mit dem Gauß-Algorithmus lösen: 1 2 1 0 1 2 1 0 1 2 1 0 0 −3 2 0 −3 1 2 0 0 0 0 0 −2 · I . 0 0 −1 0 0 0 −1 0 0 0 −1 0 +I −1 −1 0 0 0 1 1 0 + 13 · II 0 0 1 0 Es folgt aus der dritten und vierten Gleichung, daß λ3 = 0, aus der zweiten Gleichung, daß λ2 = 0, und schließlich aus der ersten Gleichung, daß λ1 = 0. Die Vektoren sind folglich linear unabhängig. Definition 4.28 Der Rang einer Matrix A ∈ Rm×n ist die (maximale) Anzahl der linear unabhängigen Zeilen oder Spalten. Wir schreiben rg A für den Rang von A. Beispiel 4.29 (1) Sei wie in Beispiel 4.18 (2) ! 1 1 . 2 2 A= Wir haben in Beispiel 4.27 (1) gezeigt, daß rg A = 1 (eine linear unabhängige Zeile). (2) Sei 1 2 A= 0 −1 die Zeilen von A linear abhängig sind, d.h. 2 1 1 2 . −1 −1 0 0 Wir haben in Beispiel 4.27 (2) gezeigt, daß alle Spalten von A linear unabhängig sind, d.h. rg A = 3. Es gibt folgenden Zusammenhang zwischen Invertierbarkeit, Determinante und Rang einer Matrix. Satz 4.30 Sei A ∈ Rn×n . Dann gilt A invertierbar ⇐⇒ det A 6= 0 ⇐⇒ rg A = n. Der Rang einer Matrix gibt Informationen über die Lösbarkeit von linearen Gleichungssystemen. Betrachte a11 x1 + a12 x2 + . . . + a1n xn a21 x1 + a22 x2 + . . . + a2n xn .. . = 0, = 0, .. . am1 x1 + am2 x2 + . . . + amn xn = 0. 37 Schreiben wir λi anstatt xi , so können wir dies auch formulieren als a11 a12 a1n 0 a21 a22 a2n 0 λ1 .. + λ2 .. + · · · + λn .. = .. . . . . . am1 am2 amn 0 Sind die Spalten von A = (aij ) linear unabhängig (bzw. gilt det A 6= 0), so folgt λ1 = . . . = λn = 0. Das Gleichungssystem Ax = 0 besitzt also nur die Lösung x = 0. Das ist eigentlich klar, denn in diesem Fall ist A invertierbar und x = A−1 Ax = A−1 0 = 0. Wir können also Satz 4.30 erweitern zu: Ax = 0 besitzt die eindeutige Lösung x = 0 4.6 ⇐⇒ det A 6= 0. Lösungstheorie linearer Gleichungssysteme In diesem Abschnitt wollen wir mittels des Rangbegriffes die Lösbarkeit linearer Gleichungssysteme Ax = b genauer charakterisieren. Ein lineares Gleichungssystem hat keine, genau eine oder unendlich viele Lösungen. Genauer gilt: Satz 4.31 Seien A ∈ Rm×n und b ∈ Rn . Dann folgt (1) rg A 6= rg (A|b) =⇒ Ax = b hat keine Lösung. (2) rg A = rg (A|b) = n =⇒ Ax = b hat genau eine Lösung. (3) rg A = rg (A|b) < n =⇒ Ax = b hat n − rg A linear unabhängige Lösungen. Beispiel 4.32 (1) Seien 1 0 a = 1 1 , 0 1 1 b1 = 1 , 0 1 b2 = 0 . 0 Dann gilt rg A = 2, rg (A|b1 ) = 2 (die erste und dritte Spalte sind gleich, also linear abhängig) und rg (A|b2 ) = 3. Daher besitzt • Ax = b1 wegen n = 2 = rg A = rg (A|b) genau eine Lösung; • Ax = b2 keine Lösung. 38 Wir überprüfen diese Aussagen; Ax = b2 bedeutet ausgeschrieben 1 · x1 + 0 · x2 = 1, 1 · x1 + 1 · x2 = 0, 0 · x1 + 1 · x2 = 0. Die erste und dritte Gleichung implizieren x1 = 1 und x2 = 0. Die zweite Gleichung ergibt 0 = x1 + x2 = 1, also einen Widerspruch. Das Gleichungssystem kann keine Lösung besitzen. Das System Ax = b1 bedeutet x1 = 1, x1 + x2 = 1, x2 = 0. Die eindeutig bestimmte Lösung lautet x = (1, 0)> . (2) Seien ! 1 1 0 A= , b= 0 1 1 ! 0 . 0 Dann existiert wegen rg A = 2 = rg (A|b) < 3 eine linear unabhängige Lösung. Wir können sie aus x1 + x2 = 0, x2 + x3 = 0 berechnen, indem wir x2 als Parameter betrachten: x1 = −λ, d.h., alle Vektoren x3 = −λ, x2 = λ, x1 −1 x = x2 = λ 1 x3 −1 sind Lösungen von Ax = b. Die linear unabhängige Lösung lautet (−1, 1, −1)> . Der Gauß-Algorithmus erlaubt auch die Bestimmung der Inverse einer Matrix. Das geht wie folgt. Beispiel 4.33 Sei 1 −2 2 A = 1 1 −1 . 2 3 1 Wir schreiben für den Gauß-Algorithmus (A|E), 39 wobei E die (3 × 3)-Einheitsmatrix ist. Das Ziel lautet, die linke Seite so umzuformen, daß wir die Einheitsmatrix erhalten. Dann erhalten wir rechts die Inverse: (E|A−1 ). Genauer ist: Wir erhalten daher 1 −2 2 1 0 0 1 1 −1 0 1 0 2 3 1 0 0 1 1 0 0 1 −2 2 0 3 −3 −1 1 0 0 7 −3 −2 0 1 1 2 0 1 0 0 3 3 1 1 − 0 1 −1 0 3 3 1 − 37 1 0 0 4 3 2 0 1 0 0 13 3 0 1 0 − 41 − 41 14 1 7 1 0 0 1 12 − 12 4 A−1 −I −2 · I + 32 · II :3 − 37 · II + 14 · III :4 4 8 0 1 = −3 −3 3 . 12 1 −7 3 40 5 Folgen und Reihen 5.1 Folgen Definition 5.1 Wir nennen die Abfolge von (reellen oder komplexen) Zahlen a1 , a2 , a3 , . . . eine Folge. Die Elemente an heißen Folgenglieder, und wir schreiben kurz (an ) für die Folge.∗ Beispiel 5.2 (1) Die Vermehrung von Kaninchen wird häufig durch die Fibonacci-Folge beschrieben. Ein Kaninchenpaar werfe von jedem zweiten Monat an ein junges Paar und in jedem weiteren Monat ein weiteres Paar. Ist an die Anzahl der Kaninchenpaare im Monat n, so wird an+1 rekursiv definiert durch an+1 = an + an−1 , n ∈ N, a0 = 1, a1 = 1. Die ersten Folgenglieder sind a2 = 2, a3 = 3, a4 = 5, a5 = 8, a6 = 13, a7 = 21, usw. Fibonacci-Zahlen treten in einer Vielzahl von Anwendungen auf. Einige Beispiele sind: • Für immer größere n ∈ N nähert sich das Verhältnis an+1 /an dem Goldenen Schnitt √ an, nämlich der Zahl (1+ 5)/2 ≈ 1.6180. Der Name rührt daher, daß das Verhältnis √ 1 zu (1 + 5)/2 als besonders ästhetisch empfunden wird. • Die Summen der Diagonalelemente des Pascalschen Dreiecks (siehe Abbildung 5.1) sind Fibonacci-Zahlen. (2) Wir haben in Kapitel 1 die Menge Nn einer radioaktiven Substanz zur Zeit n · 4t bestimmt: n 1 , n≥2 Nn = 1 − n (Falls αt = 1; siehe Kapitel 1). Dann ist N2 , N3 , N4 , . . . eine Folge. Die ersten Folgenglieder lauten 4 3 1 3 2 N2 = = 0.25, = 0.2963 . . . , N4 = = 0.3164 . . . , N3 = 4 3 4 und weiter 10 9 = 0.3487 . . . , N10 = 10 N100 = 99 100 100 = 0.3660 . . . , N1000 = 0.3677 . . . Wir können Folgen mit dem Funktionenbegriff aus Kapitel 3 genauer als Funktionen f : N → R mit f (n) = an definieren. ∗ 41 Es scheint, daß sich Nn für immer größeres n einem Wert nähert. (3) Definiere die Folge 1 2 an+1 = an + , n ∈ N, a1 = 1. 2 an Die ersten Folgenglieder lauten a2 = 1.5, a3 = 1.4166 . . . , 1 1 1 1 1 1 1 1 1 2 3 4 5 6 7 a10 = 1.4142 . . . , 1 3 6 10 15 21 a100 = 1.4142 . . . 1 4 1 10 5 1 20 15 6 1 35 35 21 7 1 Abbildung 5.1: Die Summe der Diagonalelemente im Pascalschen Dreieck ergibt die Fibonacci-Zahlen, z.B. 1 + 4 + 3 = 0, 1 + 5 + 6 + 1 = 13,1 + 6 + 10 + 4 = 21 usw. Es scheint, als strebe die Folge an für große n gegen den Wert 1.4121 . . . . Wir vermuten, daß an den Wert √ 2 = 1.4142 . . . annähert. Die obigen Beispiele legen nahe, daß es Folgen gibt, die für immer größere n einen Grenzwert besitzen. Dieser Begriff wird in der folgenden Definition präzisiert. Definition 5.3 (1) Eine Folge (an ) besitzt den Grenzwert (oder Limes) a ∈ R genau dann, wenn ∀ ε > 0 : ∃ n0 ∈ N : ∀ n ≥ n0 : |an − a| ≤ ε. Wir schreiben in diesem Fall lim an = a n→∞ an → a (n → ∞). oder 42 Eine nicht konvergente Folge heißt divergent. Eine konvergente Folge mit Grenzwert a = 0 heißt Nullfolge. (2) Die Folge (an ) heißt beschränkt genau dann, wenn ∃M >0:∀n∈N: |an | ≤ M. Beispiel 5.4 Sei an = 1/n, n ∈ N. Wir vermuten, daß (an ) eine Nullfolge ist. Sei dazu ε > 0. Wir wählen ein n0 ∈ N, so daß n0 ≥ 1/ε. Dann folgt für beliebiges n ≥ n0 |an − 0| = |an | = 1 1 ≤ ≤ ε. n n0 Also ist limn→∞ (1/n) = 0. Satz 5.5 Konvergente Folgen sind beschränkt. Beispiel 5.6 Klarerweise ist an = 1/n beschränkt mit Schranke M = 1, denn an = 1/n ≤ 1. Die Folge der Fibonacci-Zahlen ist unbeschränkt und muß daher divergent sein, denn wäre sie konvergent, wäre sie ja nach Stz 5.5 beschränkt, was nicht zutrifft. Wichtig sind die folgenden Grenzwertsätze. Satz 5.7 (Grenzwertsätze) Seien (an ), (bn ) konvergente Folgen mit Grenzwerten a bzw. b. Dann gilt: (1) limn→∞ (an ± bn ) = a ± b; (2) limn→∞ (an · bn ) = a · b; (3) limn→∞ (an /bn ) = a/b, falls bn 6= 0 und b 6= 0; (4) ∀ n ∈ N : an ≤ bn =⇒ a ≤ b. Beachte, daß aus an < bn für alle n ∈ N nicht a < b folgt. Ein Gegenbeispiel ist an = 1/(n + 1) und bn = 1/n (denn a = b = 0). Beispiel 5.8 (1) Sei n2 − n , n ∈ N. 3n2 + 1 Aus limn→∞ (1/n) = 0 und limn→∞ (1/n2 ) = 0 folgt mit Satz 5.7 an = 1 − limn→∞ n1 1 − n1 1 = lim an = lim 1 = . n→∞ n→∞ 3 + 12 3 3 + limn→∞ n2 n 43 (2) Sei bn = an+1 /an der Verhältnis zweier aufeinander folgender Fibonacci-Zahlen. Aus an+1 = an + an−1 folgt dann bn = 1 an + an−1 =1+ . an bn−1 Angenommen, (bn ) konvergiere gegen b. Dann ergibt Satz 5.7 1 b = lim bn = 1 + limn→∞ bn−1 n→∞ oder b2 − b − 1 = 0. Diese Gleichung hat die zwei r 1 1 +1= b1/2 = ± 2 4 =1+ 1 b Lösungen √ 1 (1 + 5), 2 √ von denen aber nur eine positiv (und damit für uns relevant ist), nämlich b1 = (1 + 5)/2. Dieses ist gerade der Goldene Schnitt, d.h. √ 1 an+1 = (1 + 5). n→∞ an 2 lim (3) Sei (an ) rekursiv definiert durch an+1 = 1 + a2n , 4 n ∈ N, a1 = 1. Angenommen, (an ) konvergiere gegen a. Wir erhalten dann mit Satz 5.7 a = lim an+1 = n→∞ oder a2 − a + 1 4 1 1 + lim a2n = + a2 n→∞ 4 4 = 0. Diese Gleichung besitzt genau eine Lösung: a = 12 . Wir schließen 1 lim an = . 2 n→∞ Die ersten Folgen von (an ) sind a1 = 1, a2 = 5 > 1, 4 a3 = 29 > 1, 16 a4 = 84100 > 1, 256 usw. Man kann zeigen, daß an > 1 für alle n ≥ 2. Aus Satz 5.7 (4) folgt dann 1 = a = lim an ≥ 1, n→∞ 2 Widerspruch! Was ist schiefgelaufen? Die Folge (an ) ist divergent! Bevor man die Grenzwertsätze anwendet, muß man also prüfen, ob die entsprechenden Folgen wirklich konvergieren. 44 Beispiel 5.9 Ein wichtiges Beispiel ist die Folge an = (1 + 1/n)n , n ∈ N. Eine naive Anwendung der Grenzwertsätze würde auf lim an = n→∞ 1 1 + lim n→∞ n limn→∞ n = (1 + 0)∞ = 1∞ = 1 führen. Diese Argumentation ist jedoch falsch, denn der Grenzwert n → ∞ muß simultan für den Quotienten 1/n und den Exponenten n durchgeführt werden und nicht separat. Einige Folgenglieder lauten a1 = 1, a10 = 2.5937 . . . , a100 = 2.7048 . . . , a1000 = 2.7169 . . . , a10000 = 2.7181 . . . Es scheint also, daß die Folge (an ) gegen einen Wert 2.718 . . . konvergiert. Tatsächlich kann man zeigen, daß (an ) gegen die Eulersche Zahl e konvergiert: 1 n 1+ = 2.7182818 . . . = e. n→∞ n lim 5.2 Reihen Definition 5.10 (1) Sei (an ) eine Folge. Man nennt die Folge (sn ) der Partialsummen, sn = n X ak , k=1 P eine (unendliche) Reihe und schreibt kurz ∞ k=1 ak . P∞ (2) Die Reihe k=1 ak heißt konvergent genau dann, wenn (sn ) konvergiert. Man schreibt s = limn→∞ sn und schreibt kurz s= ∞ X ak . k=1 Das Symbol P∞ k=1 ak hat also eine Doppelbedeutung: • Es bezeichnet die Folge der Partialsummen (sn ) und • es bezeichnet den Grenzwert von (sn ), falls er existiert. Beispiel 5.11 (1) Reihen treten in zahlreichen physikalischen und chemischen Anwendungen auf. Ein Beispiel ist die Gesamtanzahl entstandener Moleküle in einer chemischen Reaktion. Wir nehmen an, daß im Zeitraum [n, n + 1] etwa an = e−n (n ∈ N0 ) Moleküle 45 erzeugt werden. Dann liefert die Reaktion nach einiger Zeit zwar nur sehr wenige Moleküle, aber theoretisch läuft die Reaktion im Zeitintervall [0, ∞) ab. Die Anzahl aller erzeugten Moleküle lautet also ∞ ∞ X X an = e−n . n=0 n=0 (2) Reihen werden auch benötigt, um einige elementare Funktionen zu definieren. So ist die Exponentialfunktion ex etwa definiert durch die Reihe ex = ∞ X xn n=0 n! , x ∈ R. Man kann zeigen, daß diese Reihe für alle x ∈ R konvergiert. Auch die trigonometrischen Funktionen sin und cos sind als Reihen definiert, etwa ∞ X (−1)n 2n+1 sin x = x , (2n + 1)! n=0 x ∈ R. Beispiel 5.12 (1) Man nennt ∞ X qk k=1 mit q ∈ R die geometrische Reihe. Wegen (1 − q) n X k=0 q k = (1 + q + . . . + q n ) − (q + q 2 + . . . + q n+1 ) = 1 − q n+1 lauten die Partialsummen n X k=0 qk = 1 − q n+1 , 1−q falls q 6= 1. Aus Satz 5.7 ergibt sich ∞ X q k = lim k=0 n→∞ n X qk = k=0 1 − limn→∞ q n+1 . 1−q Der Grenzwert auf der rechten Seite existiert genau dann, wenn |q| < 1, nämlich limn→∞ q n+1 = 0. Folglich ist ∞ X 1 qk = für |q| < 1. 1−q k=1 (2) Die harmonische Reihe ∞ X 1 k=1 46 k ist divergent. Der Beweis ist nicht einfach, folgt aber aus der Ungleichung m 2 X 1 k=1 k ≥1+ m . 2 (3) Betrachte die Reihe s= ∞ X k=0 (−1)k 2k = 1 − 2 + 4 − 8 ± . . . Dann erhalten wir 1 − 2s = 1 − ∞ X (−1)k 2k+1 = 1 + k=0 ∞ X (−1)k+1 2k+1 = 1 + ∞ X j=1 k=0 (−1)j 2j = ∞ X (−1)j 2j = s j=0 und damit s = 1/3. Da die Reihenglieder alles natürliche Zahlen sind, sollte auch der Grenzwert eine natürliche Zahl sein. Was ist schiefgelaufen? Ganz einfach: Die Reihe konvergiert nicht, d.h., s existiert nicht! Aus den Sätzen 5.5 und 5.7 erhalten wir sofort die Grenzwertsätze für Reihen. Satz 5.13 Seien (1) (2) (3) P∞ k=1 (ak P∞ k=1 P∞ k=1 P∞ k=1 ± bk ) = λak = λ ak und P∞ k=1 P∞ k=1 P∞ k=1 bk ak ± ak ; P∞ konvergente Reihen und sei λ ∈ R. Dann gilt: k=1 bk ; ak ist konvergent ⇐⇒ (sn ) ist beschränkt. Beispiel 5.14 Wir zeigen, daß die Reihe sn = n X k=1 =1− n X 1 = k(k + 1) k=1 1 ≤ 1, n+1 1 1 − k k+1 P∞ 1 k=1 k(k+1) konvergiert. Es gilt nämlich 1 1 1 1 1 + ... + + = 1 + + ... + − 2 n 2 n n+1 d.h., (sn ) ist beschränkt. Aus Satz 5.13 (3) folgt die Behauptung. Beachte, daß wir den Wert der Reihe nicht bestimmt haben! Folgende Kriterien sind nützlich, um eine Reihe auf Konvergenz zu testen. Satz 5.15 Seien (an ) und (bn ) Folgen. (1) Notwendiges Kriterium: P∞ k=1 ak ist konvergent =⇒ (an ) ist eine Nullfolge. 47 (2) Leibnizkriterium: Wenn (an ) eine monoton fallende Nullfolge ist, d.h. dann ist P∞ an+1 ≤ an k k=1 (−1) ak für alle n ∈ N, lim an = 0, n→∞ konvergent. (3) Majorantenkriterium: Gilt |ak | ≤ bk für alle k und ist P vergiert auch ∞ k=1 ak . P∞ k=1 bk konvergent, so kon- P (4) Minorantenkriterium: Gilt |ak | ≥ bk für alle k und ist ∞ k=1 bk divergent, so auch P∞ k=1 ak . p P (5) Wurzelkriterium: Wenn limk→∞ k |ak | ≤ q < 1, so ist ∞ k=1 ak konvergent. P (6) Quotientenkriterium: Wenn limk→∞ |ak+1 /ak | ≤ q < 1, so ist ∞ k=1 ak konvergent. P n! Beispiel 5.16 (1) Betrachte die Reihe ∞ n=0 nn . Um zu prüfen, ob diese Reihe konvergiert oder nicht, müssen wir eines der obigen Konvergenzkritierien anwenden. Einen schnellen Nachweis erlauben meist das Wurzel- oder Quotientenkriterium (falls ansonsten nicht klar ist, welches Kriterium angewendet werden sollte). Das Wurzelkriterium führt mit ak = k!/k k auf √ √ k k p k! k! k |ak | = √ = . k k k k √ Die Schwierigkeit ist hier die Berechnung von k k!, die nicht ohne weiteres möglich ist. Daher versuchen wir das Quotientenkriterium: k ak+1 (k + 1)k k kk 1 = (k + 1)! k = = = . ak (k + 1)k+1 k! k k (k + 1) · (k + 1) (k + 1) (1 + 1/k)k Die Folge (1 + 1/k)k haben wir bereits im vorigen Abschnitt kennengelernt. Es gilt: limk→∞ (1 + 1/k)k = e. Damit ist ak+1 1 = < 1. lim k→∞ ak e Also ist die Reihe nach dem Quotientenkriterium konvergent. P n1 (2) Die Folge ∞ n=1 (−1) n ist nach dem Leibniz-Kriterium konvergent, aber nicht X ∞ ∞ X 1 1 n (−1) = , n n n=1 n=1 denn dies ist die harmonische Reihe, die divergiert (siehe Beispiel 5.12 (2)). P 1 (3) Die Reihe ∞ k=1 k2 ist konvergent, denn |ak | = 1 1 2 ≤ · 2 k k k+1 48 für k ≥ 1 und die Reihe ∞ X k=1 ∞ X 1 2 =2 k(k + 1) k(k + 1) k=1 ist nach Beispiel 5.14 konvergent. Die Behauptung folgt also aus dem Majorantenkriterium. P 1 (4) Die Reihe ∞ n=0 n! ist konvergent nach dem Quotientenkriterium, denn mit an = 1/n! folgt an+1 1 1 n! für alle n ≥ 1. an = (n + 1)n! = n + 1 ≤ 2 P 1 Übrigens ist ∞ n=0 n! = e. Es ist wichtig, für das Wurzel- und Quotientenkriterium eine Zahl q < 1 und nicht nur q ≤ 1 zu finden, da sonst die Aussage nicht gilt. Ein Beispiel ist die harmonische Reihe, für die zwar gilt an+1 n an = n + 1 < 1, aber man kann kein q < 1 finden, so daß n/(n + 1) ≤ q für alle n ≥ 1 erfüllt ist! Beachte außerdem, daß die Umkehrung des notwendigen Kriteriums i.a. nicht gilt: P Ist die Folge (an ) konvergent, so folgt daraus nicht unbedingt, daß die Reihe ∞ an P∞ k=1 ebenfalls konvergent ist. Ein Gegenbeispiel ist wieder die harmonische Reihe k=1 1/k, denn die Folge (1/n) konvergiert (gegen null), aber die Reihe ist divergent. 49 6 Differentiation 6.1 Stetigkeit Aus den Grenzwertsätzen folgt für eine gegen x ∈ R konvergierende Folge (xn ), daß auch lim x2n = n→∞ gilt. Folgt dann auch allgemein lim f (xn ) = f n→∞ lim xn n→∞ 2 = x2 lim xn = f (x)? n→∞ Die Frage kann bejaht werden, sofern f stetig ist. Dieser Begriff wird im folgenden definiert. Definition 6.1 (1) Sei f : Df ⊂ R → R eine Funktion. Sie konvergiert gegen a ∈ R für x → x0 genau dann, wenn für alle Folgen (xn ) ⊂ Df \{x0 } mit xn → x0 (n → ∞) gilt f (xn ) → a (n → ∞). In diesem Fall schreibt man lim f (x) = a. x→x0 (2) Die Funktion f : Df ⊂ R → R heißt stetig in x0 ∈ Df genau dann, wenn lim f (x) = f ( lim x) = f (x0 ) x→x0 x→x0 (6.1) gilt. Sie heißt stetig, falls sie in jedem x0 ∈ Df stetig ist. Beispiel 6.2 (1) Sei f (x) = x3 +2x2 , x ∈ R. Ist f stetig in x0 ∈ R? Sei (xn ) eine beliebige Folge mit xn → x0 (n → ∞). Aus den Grenzwertsätzen folgt lim f (xn ) = lim (x3n + 2x2n ) = ( lim xn )3 + 2( lim xn )2 = x30 + 2x20 = f (x0 ). n→∞ n→∞ n→∞ n→∞ Da x0 und (xn ) beliebig war, ist f stetig in jedem x0 ∈ R, also ist f stetig. (2) Sei ( −2x − 2 für x ≤ 0, f (x) = 2 + 2x für x > 0. Ist f stetig in x0 = 0? Sei xn = 1/n, n ∈ N. Dann folgt f (xn ) = 2 − 2xn = 2 − 2 →2 n (n → ∞), also ist lim f (xn ) = 2 6= −2 = f (0). n→∞ Die Funktion ist nicht stetig in x0 = 0 (Abbildung 6.1). 50 y f (x) 2 x −2 Abbildung 6.1: Graph der Funktion f aus Beispiel 6.2 (2). Der folgende Satz erweitert die Grenzwertsätze. Satz 6.3 Seien f , g und h Funktionen, so daß f und g stetig in x0 (mit g(x0 ) 6= 0) und h stetig in y0 = f (x0 ) sind. Dann gilt: (1) f ± g, f · g und f /g sind stetig in x0 ; (2) die Verkettung h ◦ f , definiert durch (h ◦ f )(x) = h(f (x)), ist stetig in x0 . Satz 6.3 zeigt, daß alle betrachteten elementaren Funktionen stetig sind, beispielsweise alle Polynome, exp, ln, sin, cos, sinh, cosh, usw. 6.2 Die Ableitung Die Ableitung einer Funktion in einem Punkt ist die Steigung der Tangente in diesem Punkte (siehe Abbildung 6.2). Diese Konstruktion ist möglich, wenn der Graph der Funktion “glatt” ist. Schwierigkeiten gibt es etwa bei der Funktion in Abbildung 6.1: Die Tangente an x0 = 0 hat die Steigung −2 (am Kurventeil für x < 0) bzw. die Steigung +2 (am Kurventeil für x > 0). Für die Ableitung ist die Stetigkeit ein notwendiges Kriterium. Sie ist nicht ausreichend, wie Abbildung 6.2 rechts zeigt: An der Stelle x0 = 0 gibt es keine eindeutige Tangente. Die Gleichung der Tangente t(x) lautet t(x) = f (x0 ) + α(x − x0 ), wobei α die Tangentensteigung ist. Falls x ≈ x0 , gilt f (x) ≈ t(x) und α≈ f (x) − f (x0 ) . x − x0 51 y y Tangente an x0 f (x) f (x) t(x) 0 x x0 x Abbildung 6.2: Illustration der Tangente am Punkt x0 (links). Die rechte Funktion besitzt an x0 = 0 keine eindeutige Tangente. Die Tangentensteigung ist also näherungsweise gleich der Sekantensteigung. Wir definieren sie als den Grenzwert der Sekantensteigungen. Definition 6.4 Sei I ⊂ R ein Intervall und f : I → R eine Funktion. Dann heißt f differenzierbar in x0 ∈ I, falls der Grenzwert lim x→x0 f (x) − f (x0 ) x − x0 df (x0 ) für diesen Grenzwert und nennt existiert. In diesem Fall schreibt man f 0 (x0 ) oder dx ihn die Ableitung von f an x0 . Eine Funktion heißt differenzierbar, wenn sie in allen x0 ∈ I differenzierbar ist. Sie heißt stetig differenzierbar, wenn sie differenzierbar und die Ableitung stetig ist. Bemerkung 6.5 (1) Schreibt man x0 + h = x, so kann die Definition der Ableitung auch formuliert werden als f (x0 + h) − f (x0 ) . f 0 (x0 ) = lim h→0 h df wird auch Differentialquotient genannt; es ist allerdings kein Quo(2) Das Symbol dx tient! (3) Wir können x 7→ f 0 (x) wieder als Funktion interpretieren. Analog können höhere Ableitungen definiert werden: f 00 (x0 ) = lim x→x0 f 0 (x) − f 0 (x0 ) x − x0 52 usw. Beispiel 6.6 (1) Sei f (x) = x2 , x ∈ R. Sei x0 ∈ R. Dann gilt f (x0 + h) − f (x0 ) (x0 + h)2 − x20 = = 2x0 + h h h und daher f (x0 + h) − f (x0 ) = lim (2x0 + h) = 2x0 . h→0 h→0 h Die Funktion f ist also an jeder Stelle differenzierbar und f 0 (x) = 2x. Allgemein gilt: lim f (x) = xα ⇒ f 0 (x) = αxα−1 , α ∈ R. (6.2) (2) Sei f (x) = |x|, x ∈ R (siehe Abbildung 6.2 rechts). Sei x0 = 0. Wegen f (x0 + h) − f (x0 ) |x0 + h| − |x0 | |h| = = h h h unterscheiden wir zwei Fälle: • h>0: 1 (f (x0 h + h) − f (x0 )) = 1; • h<0: 1 (f (x0 h + h) − f (x0 )) = −1. Dies bedeutet, daß f 0 (x0 ) nicht existiert. Übrigens ist f (x) an jeder anderen Stelle differenzierbar mit ( 1 für x > 0, f 0 (x) = −1 für x < 0. Die Ableitung f 0 ist nur für alle x ∈ R, x 6= 0, definiert. Die elementaren Funktionen aus Abschnitt 3.3 sind differenzierbar; ihre Ableitungen lauten: f (x) xα ex ln x sin x cos x tan x sinh cosh f 0 (x) αxα−1 ex x1 cos x − sin x cos12 x cosh sinh 6.3 Rechenregeln Satz 6.7 Seien f und g differenzierbare Funktionen und a, b ∈ R. Dann sind auch af +bg, f · g und f /g (falls g(x) 6= 0) differenzierbar, und es gilt: (1) Linearität: (af + bg)0 = af 0 + bg 0 , (2) Produktregel: (f · g)0 = f 0 · g + f · g 0 ; 0 f f 0 · g − f · g0 . (3) Quotientenregel: = g g2 53 Beispiel 6.8 (1) Sei P (x) = n X ak x k k=0 mit n ∈ N, ak ∈ R, ein Polynom. Dann ist P differenzierbar, und es gilt nach (6.2): P 0 (x) = n X ak kxk−1 . k=1 (2) Sei f (x) = tan x, −π/2 < x < π/2. Dann ist nach der Quotientenregel 0 sin0 x cos x − sin x cos0 x cos2 x + sin2 x 1 sin x 0 = f (x) = = = . 2 2 cos x cos x cos x cos2 x Die Produktregel kann für höhere Ableitungen verallgemeinert werden. Für genügend oft differenzierbare Funktionen f und g folgt (f · g)00 = (f 0 g + f g 0 )0 = (f 00 g + f 0 g 0 ) + (f 0 g 0 + f g 00 ) = f 00 g + 2f 0 g 0 + f g 00 , (f · g)000 = (f 000 g + f 00 g 0 ) + 2(f 00 g 0 + f 0 g 00 ) + (f 0 g 00 + f g 000 ) = f 000 g + 3f 00 g 0 + 3f 0 g 00 + f g 000 usw. Die Koeffizienten lauten also: 1 Ableitung: 1, 1; 2 Ableitungen: 1, 2, 1; 3 Ableitungen: 1, 3, 3, 1. Diese Folge kommt uns bekannt vor: siehe das Pascalsche Dreieck aus Abschnitt 2.3! Wir schließen, daß der Koeffizient vor dem Produkt f (k) , g (n−k) (d.h. k-te Ableitung von f und (n − k)-te Ableitung von g) gerade der Binomialkoeffizient nk ist. Dies motiviert den folgenden Satz. Satz 6.9 (Leibniz-Formel) Seien f und g n-mal differenzierbar. Dann ist auch f · g n-mal differenzierbar, und es gilt n X n (k) (n−k) (n) f g . (f · g) = k k=0 Satz 6.10 (Kettenregel) Seien f eine in x0 differenzierbare Funktion und g eine in f (x0 ) differenzierbare Funktion. Dann ist h(x) = (g ◦ f )(x) = g(f (x)) in x0 differenzierbar, und es gilt: h0 (x0 ) = (g ◦ f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ). Man nennt g 0 (f (x0 )) die äußere Ableitung und f 0 (x0 ) die innere Ableitung. 54 Wir können die Kettenregel mit Hilfe des Differentialquotienten auch einprägsam wie folgt formulieren. Seien g(y) und y(x) differenzierbar. Dann ist dg dy dg = . dx dy dx Die linke Seite entspricht der Ableitung d g(y(x)), dx die rechte g 0 (y(x)) · y 0 (x). Beispiel 6.11 (1) Sei h(x) = sin(x2 ), x ∈ R. Definiere f (x) = x2 und g(y) = sin y. Dann ist h = g ◦ f , f 0 (x) = 2x, g 0 (y) = cos y, also h0 (x) = g 0 (f (x))f 0 (x) = 2x cos(x2 ). (2) Die Menge einer radioaktiven Substanz sei gegeben durch N (t) = N0 e−αt , t > 0, α > 0. Definiere f (t) = −αt und g(x) = N0 ex . Dann ist N = g ◦ f , und aus f 0 (t) = −α und g 0 (x) = N0 ex folgt: N 0 (t) = g 0 (f (t))f 0 (t) = −αN0−αt = −αN (t). Dies ist die Differentialgleichung aus Beispiel 1.2. (3) Sei h(x) = ax mit a > 0. Man ist vielleicht versucht, für die Ableitung h0 (x) = x xax−1 zu schreiben; dies ist jedoch falsch! Schreiben wir nämlich ax = eln(a ) = ex ln a und definieren f (x) = x ln a, g(y) = ey , so folgt h = g ◦ f und f 0 (x) = ln a, g 0 (y) = ey , also h0 (x) = g 0 (f (x)) · f 0 (x) = ex ln a · ln a = ln a · ax . (4) Die Ableitungen von sinh und cosh lauten sinh0 = cosh, cosh0 = sinh, denn 1 1 1 sinh0 (x) = (ex − e−x )0 = [(ex )0 − (e−x )0 ] = [ex − (−e−x )] = cosh x, 2 2 2 1 1 cosh0 (x) = (ex + e−x )0 = (ex − e−x ) = sinh x. 2 2 Die Ableitungen von arcsin, arsinh usw. können wir mit Hilfe des folgenden Satzes berechnen. Satz 6.12 (Ableitung der Umkehrfunktion) Sei f : Df → Wf mit Df , Wf ⊂ R eine invertierbare und differenzierbare Funktion mit f 0 (x) 6= 0 für alle x ∈ Df . Dann ist die Inverse f −1 auch differenzierbar, und es gilt für alle y = f (x) ∈ Wf : 1 1 = 0 −1 . (f −1 )0 (y) = 0 f (x) f (f (y)) 55 Wir können diese Regel wieder symbolisch für eine differenzierbare Funktion y = y(x) mit Inverse x = x(y) formulieren: 1 dx = dy . dy dx Die linke Seite entspricht x0 (y), die rechte 1/y 0 (x). Beispiel 6.13 (1) Sei f (x) = ex , x ∈ R. Dann ist Df = R, Wf = (0, ∞). Die Inverse lautet f −1 (y) = ln y, y ∈ (0, ∞), und ln0 (y) = 1 1 1 = = . f 0 (ln y) eln y y (2) Sei f (x) = sin x, x ∈ Df = (−π/2, π/2). Dann ist Wf = (−1, 1) und f −1 (y) = arcsin y, y ∈ Wf . Aus Satz 6.12 folgt arcsin0 (y) = 1 f 0 (arcsin y) für alle y ∈ (−1, 1). = 1 1 1 =p =p cos(arcsin y) 1 − sin(arcsin y)2 1 − y2 Wir fassen die Ableitungen einiger Umkehrfunktionen (Inversen) zusammen: f (x) arcsin x arccos x arctan x arsinh x 1 1 1 1 √ −√ f 0 (x) √ 2 1 − x2 1 − x2 1 + x x2 + 1 arcosh x artanh x 1 1 √ x2 − 1 1 − x2 Die Ableitung hilft bei der Bestimmung von Grenzwerten der Form ”0 ” 0 oder ”∞ ” , ∞ nämlich beispielsweise bei limx→0 (sin x)/x. Satz 6.14 (Regel von de l’Hospital) Seien f, g : (a, b) → R differenzierbar und g 0 (x) 6= 0 für alle x ∈ (a, b). Es gelte lim f (x) = lim g(x) = 0 x→a und der Grenzwert x→a oder f 0 (x) x→a g 0 (x) lim Dann folgt lim f (x) = lim g(x) = +∞ x→a existiert. f (x) f 0 (x) lim = lim 0 . x→a g(x) x→a g (x) 56 x→a Beispiel 6.15 (1) Der Grenzwert sin x x 0 ist vom Typ ” 0 ”, da limx→0 sin x = limx→0 x = 0. Der Grenzwert lim x→0 cos x sin0 x =1 = lim lim x→0 x→0 (x)0 1 existiert, und daher ist lim x→0 sin x cos x = lim = 1. x→0 x 1 (2) Der Grenzwert sin x − x x→0 x3 ist wieder vom Typ “ 00 ”. Existiert der Grenzwert lim (sin x − x)0 cos x − 1 = lim ? 3 0 x→0 x→0 (x ) 3x2 lim Er ist wieder vom Typ “ 00 ”. Wir wenden die Regel von de l’Hospital auf den letzten Grenzwert an, und untersuchen − sin x sin x 1 1 (cos x − 1)0 = lim = − lim =− 2 0 x→0 x→0 x→0 (3x ) 6x 6 x 6 lim nach (1). Wir erhalten also sin x − x cos x − 1 − sin x 1 = lim = lim =− . 3 2 x→0 x→0 x→0 x 3x 6x 6 lim (3) Der Grenzwert lim x ln x x→0 ist vom Typ “0 · ∞”, so daß die Regel von de l’Hospital nicht unmittelbar anwendbar ist. Wir schreiben daher lim x ln x = lim x→0 x→0 ln x 1 x = lim x→0 1 x − x12 = − lim x = 0. x→0 (4) Der Grenzwert lim xx x→0 ist vom Typ “00 ”, und die Regel von de l’Hospital ist wieder nicht anwendbar. Wir schreiben x lim xx = lim eln(x ) = lim xx ln x . x→0 x→0 x→0 57 Vertauschen wir den Grenzwert und die Funktionsauswertung ey , so folgt nach (3) lim ex ln x = elimx→0 x ln x = e0 = 1. x→0 Dürfen wir den Grenzwert und ey vertauschen? Ja, denn die e-Funktion ist stetig, und für solche Funktionen ist die Vertauschung möglich (siehe (6.1)). (5) Die Regel von de l’Hospital führt auf − sin x cos x = lim = 0, x→0 x→0 x 1 lim wobei der Grenzwert vom Typ “ 01 ” ist. Die folgende Tabelle gibt einige Werte des Quotienten (cos x)/x an. x cos x x 0.1 0.01 0.001 −0.1 −0.01 −0.001 9.95 99.995 999.9995 −9.95 −99.995 −999.9995 Die Tabelle läßt vermuten, daß der Grenzwert gar nicht existiert! Tatsächlich gilt lim x→0,x>0 cos x = +∞, x lim x→0,x<0 cos x = −∞. x Im vorliegenden Fall sind die Voraussetzungen von Satz 6.14 nicht erfüllt. Die unkritische Anwendung der Regel von de l’Hospital kann also zu falschen Resultaten führen. Wir können die folgenden Fälle mit der Regel von de l’Hospital untersuchen: • “∞ − ∞”: Schreibe f (x) − g(x) = 1 g(x) − 1 f (x) 1 f (x)g(x) . Der Quotient ist von der Form “ 00 ”. • “0 · ∞”: Schreibe f (x) · g(x) = f (x) 1 g(x) . Der Quotient ist wieder von der Form “ 00 ”. • “00 ”: Schreibe f (x)g(x) = eg(x)·ln f (x) . Der Exponent ist vom Typ “0 · ∞”. • “1∞ ”: Schreibe f (x)g(x) = eg(x)·ln f (x) , und der Exponent hat die Form “∞ · 0”. • “∞0 ”: Schreibe wieder f (x)g(x) = eg(x)·ln f (x) und erhalte den Typ “0 · ∞”. 58 y f (x) a x1 x2 x3 b x y f 0 (x) a x1 x4 x2 x5 x3 b x y f 00 (x) a x4 x5 b x Abbildung 6.3: Die Funktion f besitzt ein lokales Maximum in x1 und ein lokales Minimum in x2 . Das globale Maximum wird dagegen in x3 erreicht. Die Stellen x4 und x5 sind kritische Punkte von f 0 . 6.4 Kurvendiskussion Ist die Steigung der Tangente an den Graphen einer Funktion stets positiv (bzw. negativ), so ist die Funktion monoton wachsend (bzw. fallend). Ist die Tangentensteigung zunächst positiv (bzw. negativ) und dann negativ (bzw. positiv), so erwarten wir, daß ein lokales Maximum (bzw. Minimum) vorliegt (siehe Abbildung 6.3). Definition 6.16 Sei f : [a, b] → R eine Funktion. (1) f heißt monoton wachsend auf [a, b], wenn f (x1 ) ≤ f (x2 ) für alle 59 x1 ≤ x2 . (2) f heißt monoton fallend auf [a, b], wenn f (x1 ) ≥ f (x2 ) für alle x1 ≤ x2 . (3) f besitzt in x0 ∈ (a, b) ein lokales Maximum, wenn ∃ε>0: ∀ x ∈ (x0 − ε, x0 + ε) : f (x) ≤ f (x0 ). (6.3) f (x) ≥ f (x0 ). (6.4) (4) f besitzt in x0 ∈ (a, b) ein lokales Minimum, wenn ∃ε>0: ∀ x ∈ (x0 − ε, x0 + ε) : (5) Ein Extremum ist ein Minimum oder Maximum. Ein Minimum oder Maximum wird global genannt, wenn die Ungleichung (6.3) bzw. (6.4) für alle x ∈ [a, b] gilt. (6) Ist f differenzierbar, so heißt ein Punkt x0 ∈ (a, b) mit f 0 (x0 ) = 0 kritischer Punkt. Satz 6.17 Sei f (a, b) → R zweimal differenzierbar und x0 ∈ (a, b). (1) Gilt f 0 (x) ≥ 0 (bzw. f 0 (x) ≤ 0) für alle x ∈ (a, b), so ist f monoton wachsend (bzw. monoton fallend). (2) Gilt f 0 (x0 ) = 0 und f 00 (x0 ) < 0 (oder f 00 (x0 ) > 0), so hat f in x0 ein lokales Maximum (bzw. lokales Minimum). (3) Die Funktion f sei n-mal differenzierbar, und es gelte f (i) (x0 ) = 0 für alle i = 1, . . . , n − 1 und f (n) (x0 ) 6= 0. Dann gilt: • n gerade: f hat in x0 ein Extremum, und zwar ein lokales Maximum, wenn f (n) (x0 ) < 0, bzw. ein lokales Minimum, wenn f (n) (x0 ) > 0; • n ungerade: f hat in x0 kein Extremum. Beispiel 6.18 Sei f (x) = x4 − 2x2 + 1 = (x2 − 1)2 , x ∈ R (siehe Abbildung 6.4 links). Wir bestimmen alle Extrema von f . Aus 0 = f 0 (x) = 4x3 − 4x = 4x(x2 − 1) = 4x(x − 1)(x + 1) folgt, daß x1 = 0, x2 = 1 und x3 = −1 Kandidaten für Extrema sind. Wir untersuchen diese Punkte einzeln: • x1 = 0: f 00 (x1 ) = 12x21 − 4 = −4 < 0 =⇒ f hat an x1 = 0 ein lokales Maximum. • x2/3 = ±1: f 00 (x2/3 ) = 12x22/3 − 4 = 8 > 0 =⇒ f hat an x2/3 = ±1 ein lokales Minimum. 60 replacemen y y f (x) −1 0 −1 − 4 x 1 5 f2 (x) 0 x Abbildung 6.4: Graph der Funktion f (x) = x4 − 2x2 + 1 (links) und Graph der Funktion f2 (x) = x5 + x4 (rechts). (2) Sei f (x) = x−12 − ax−6 mit a > 0, x > 0. Die Funktion f ist ein Modell für das Potential von Teilchen in der Nähe des Atomkerns mit Abstand x; sie wird auch LenardJones-Potential genannt. Der erste Summand x−12 beschreibt eine extrem kurzreichweitige Abstoßung, während der zweite Summand ax−6 eine langreichweitige Anziehung modelliert. Alle kritischen Punkte von f sind gegeben durch r 2 6a 6 12 6 2 0 . 0 = f (x) = − 13 + 7 = 7 − 6 + a =⇒ x = ± x x x x a p Da der Abstand x positiv sein soll, kommt nur x0 = 6 2/a in Betracht. Wegen 6 2 · 13 6 a 12 · 13 6 · 7a 00 − 7a >0 − = − 7a = 26 f (x0 ) = x14 x80 x80 x60 x80 2 0 liegt an der Stelle x0 ein lokales Minimum vor. Es folgt außerdem, daß f für x < x0 monoton fallend und für x > x0 monoton wachsend ist (siehe Abbildung 6.5). (4) Die Van-der-Waals-Gleichung aus Beispiel 3.7 für den Druck p(V ) in Abhängigkeit des Volumens V a V > b und a, b > 0, p(V ) + 2 (V − b) = RT, V kann nach p(V ) aufgelöst werden: p(V ) = a RT − 2, V −b V V > b. Kritische Punkte erhalten wir aus der Gleichung 0 = p0 (V ) = − RT 2a + 3 2 (V − b) V Abbildung 6.6 zeigt, daß diese Gleichung 61 ⇐⇒ 2a(V − b)2 = RT V 3 . y f (x) x0 0 x Abbildung 6.5: Graph der Funktion f (x) = x−12 − ax−6 , x > 0. • keine Lösung besitzt, wenn T > Tkrit ; • genau eine Lösung V0 besitzt, wenn T = Tkrit ; • genau zwei Lösungen V1 und V2 besitzt, wenn T < Tkrit . 20 2 15 2a(V−b) 3 RTV mit T < Tkrit 3 RTV mit T > Tkrit 10 5 0 1 1.5 2 2.5 3 3.5 4 Abbildung 6.6: Graphische Lösung der Gleichung 2a(V − b)2 = RT V 3 für den Fall a = b = R = 1. Man kann berechnen, daß hier Tkrit ≈ 0.29606. Diese Beobachtung erlaubt es, das Monotonieverhalten von p(V ) zu beschreiben: • T ≥ Tkrit : p0 (V ) ≤ 0 für alle V > b =⇒ p monoton fallend in (b, ∞); 62 • T < Tkrit : p ist monoton fallend in (b, V1 ) und (V2 , ∞) und monoton wachsend in (V1 , V2 ). Der Graph von p(V ) ist in Abbildung 6.7 skizziert. Es gibt eine Region, in der für gegebenen Druck p drei verschiedene Volumina existieren, so daß die Van-der-WaalsGleichung erfült ist. Diese Region beschreibt die Koexistenz der flüssigen und gasförmigen Phase. p T > Tkrit Koexistenz T = Tkrit T < Tkrit 0 V Abbildung 6.7: Graphen der Funktion p(V ) für verschiedene Temperaturen. Eine Kurvendiskussion einer Funktion f sollte typischerweise die folgenden Punkte enthalten: (1) Bestimmung der Nullstellen von f , (2) Bestimmung der Monotonie von f , (3) Bestimmung der lokalen Minima und Maxima von f , (4) Bestimmung des Verhaltens für x → +∞ bzw. x → −∞, falls zutreffend, (5) eine Skizze des Graphen von f . 6.5 Satz von Taylor Differenzierbare Funktionen können oft durch Polynome angenähert werden. Diese Aussage wird im Satz von Taylor präzisiert. Definition 6.19 Sei f : (a, b) → R (n + 1)-mal differenzierbar, und sei x0 ∈ (a, b). Dann heißt das Polynom n X f (k) (x0 ) (x − x0 )k , x ∈ R, Tn (x) = k! k=0 das Taylor-Polynom n-ten Grades von f um x0 . 63 Satz 6.20 (Taylor) Sei f : (a, b) → R (n + 1)-mal stetig differenzierbar (d.h., f ist (n + 1)-mal differenzierbar und f (n+1) ist stetig) und seien x0 , x ∈ (a, b). Dann existiert ein ξ zwischen x0 und x, so daß f (x) = Tn (x) + Rn+1 (x), (6.5) wobei Rn+1 (x) = f (n+1) (ξ) (x − x0 )n+1 . (n + 1)! (6.6) Man nennt (6.5) die Taylor-Formel und (6.6) das Lagrange-Restglied. Der Punkt x0 wird auch Entwicklungspunkt genannt. Im Falle n = 0 erhalten wir: f (x) = T0 (x) + R1 (x) = f (x0 ) + f 0 (ξ)(x − x0 ). (6.7) Man nennt diese Beziehung Mittelwertsatz. Er hat eine einfache geometrische Interpretation (siehe Abbildung 6.8). Schreiben wir (6.7) als f (x) − f (x0 ) = f 0 (ξ) x − x0 für x 6= x0 , so lautet die Aussage des Mittelwertsatzes, daß es einen Punkt ξ gibt, an dem die Steigung der Tangente an den Graphen von f (nämlich f 0 (ξ)) gleich der Steigung der Sekante durch x und x0 ist. y Sekante Tangente x x0 ξ x Abbildung 6.8: Geometrische Veranschaulichung des Mittelwertsatzes (6.7). Beispiel 6.21 Sei f (x) = ex , x ∈ R. Wir wählen den Entwicklungspunkt x0 = 0. Die Funktion f ist unendlich oft differenzierbar mit f (0) = 1, f 0 (0) = 1, 64 f 00 (0) = 1 usw. Aus dem Satz 6.20 von Taylor folgt, daß es zu x ∈ R ein ξ zwischen 0 und x gibt, so daß f (x) = ex = n X 1 k eξ x + xn+1 . k! (n + 1)! k=0 Die Exponentialfunktion wird also durch das Polynom n X 1 1 1 1 k x = 1 + x + x2 + x3 + . . . + xn k! 2 6 n! k=0 approximiert. Der Fehler der Approximation wird gerade durch das Lagrange-Restglied gegeben. Für |x| ≤ 1 erhalten wir wegen |ξ| ≤ |x| ≤ 1 |Rn+1 (x)| = eξ e |x|n+1 ≤ . (n + 1)! (n + 1)! Wollen wir ex auf dem Intervall [−1, 1] durch das Polynom bis auf einen Fehler von 10−3 approximieren, so muß n ∈ N so groß gewählt werden, daß e ≤ 10−3 . (n + 1)! Wir erhalten n = 6, denn e/7! ≈ 5 · 10−4 , aber e/6! ≈ 4 · 10−3 . Wir haben gezeigt: 6 x X 1 k x ≤ 10−3 für alle |x| ≤ 1. e − k! k=0 Die obigen Beispiele legen nahe, den Grenzwert n → ∞ zu versuchen und die Gleichung f (x) = ∞ X f (k) (x0 ) k=0 k! (x − x0 )k (6.8) für eine unendlich oft differenzierbare Funktion zu folgern. Gilt die Formel (6.8)? 2 Im allgemeinen nein! Sei beispielsweise f (x) = e−1/x für x 6= 0 und f (x) = 0 für x = 0. Die Funktion f ist für x 6= 0 unendlich oft differenzierbar: 2 −1/x2 e , x3 4 6 2 00 f (x) = − 4 + 6 e−1/x x x 24 24 12 8 2 000 f (x) = − 7 − 7 + 9 e−1/x 5 x x x x f 0 (x) = 65 usw. Man kann allgemein zeigen, daß 1 −1/x2 (k) f (x) = p e x für ein geeignetes Polynom p und x 6= 0 gilt. Es gilt nach der Regel von de l’Hospital für alle Polynome p: 1 −1/x2 lim p e = 0. x→0 x Wir können also die k-te Ableitung von f in x = 0 fortsetzen, so da f (k) stetig ist: ( 2 p( x1 )e−1/x : x 6= 0 (k) f (x) = 0 : x = 0. Aus dem Satz von Taylor folgt f (x) = Tn (x) + Rn+1 (x) mit Tn (x) = n X f (k) (0) k=0 Also ist f (x) 6= ∞ X f (k) (0) k=0 k! =0 k! xk = 0. für alle x 6= 0. Unter welchen Bedingungen gilt nun die Formel (6.8) dennoch? Wir vermuten wegen (6.5): wenn Rn+1 (x) → 0 für n → ∞. Die Vermutung ist richtig, wie der folgende Satz zeigt. Satz 6.22 Sei f : (a, b) → R unendlich oft differenzierbar und sei x0 ∈ (a, b). Dann gilt f (x) = ∞ X f (k) (x0 ) k=0 k! (x − x0 )k für alle x ∈ (a, b) genau dann, wenn Rn (x) → 0 (n → ∞). Dies ist der Fall, wenn ∃ α, C > 0 : ∀ x ∈ (a, b), k ∈ N : |f (k) (x)| ≤ αC k . Man nennt die unendliche Reihe aus Satz 6.22 die Taylor-Reihe von f . Beachten Sie: • Die Taylor-Reihe muß im allgemeinen nicht konvergieren! • Falls die Taylor-Reihe von f konvergiert, so konvergiert sie nicht immer gegen f ! Unter den Voraussetzungen von Satz 6.22 konvergiert natürlich die Taylor-Reihe von f , und zwar gegen f . 66 Beispiel 6.23 Sei wie in Beispiel 6.21 (1) f (x) = ex , x ∈ R, und x0 = 0. Dann gilt |Rn+1 (x)| = eξ |x|n+1 → 0 (n + 1)! d.h. ex = ∞ X 1 k x , k! k=0 für n → ∞, x ∈ R. Insbesondere erhalten wir die Formel ∞ X 1 1 1 1 e= = 1 + 1 + + + + ..., k! 2! 3! 4! k=0 (6.9) die schneller konvergiert als die Folge (1 + 1/n)n mit n 1 . e = lim 1 + n→∞ n Eine andere interessante Folgerung aus (6.9) ist !α ∞ ∞ X X 1 1 k α =e = α k! k! k=0 k=0 6.6 für α ∈ R. Lineare Regression In diesem Abschnitt präsentieren wir eine Anwendung der Differentiation, nämlich die lineare Regression oder Methode der kleinsten Quadrate. Der Druck p eines in einem Behälter mit Volumen V befindlichen Gases werde für verschiedene Temperaturen gemessen. Nach dem idealen Gasgesetz pV = nRT (n Zahl an Molen eines Gases) erwarten wir einen linearen Zusammenhang zwischen Druck und Temperatur. Die Berechnung der Steigung der Geraden p = p(T ) erlaubt die Bestimmung der Gaskonstanten R. Allerdings werden die Meßwerte nicht alle auf einer Geraden liegen; das Problem lautet, die mit Fehlern behafteten Meßdaten durch eine Gerade zu approximieren. Eine Idee ist durch die Methode der kleinsten Quadrate gegeben. Seien (x1 , y1 ), . . . , (xm , ym ) m Meßwertpaare (z.B. xi = Temperatur, yi = Druck) gegeben. Wir suchen die Koeffizienten a0 und a1 der Geraden g(x) = a0 + a1 x, so daß der quadratische Abstand zwischen den Meßwerten yi und den Punkten g(xi ) auf der Geraden minimiert wird (siehe Abbildung 6.9): Minimiere F (a0 , a1 ) = m X i=1 (g(xi ) − yi )2 = 67 m X i=1 (a0 + a1 xi − yi )2 . y Meßwerte (xi , yi ) Ausgleichsgerade g(x) x1 x2 x3 x x4 Abbildung 6.9: Meßwertpaare und Ausgleichsgerade. Zur Minimierung von F : R2 → R bestimmen wir gemäß Abschnitt 6.4 die kritischen Punkte, d.h., wir differenzieren F nach a0 und nach a1 und setzen die Ableitungen gleich Null. Wir führen hierfür die Funktionen F1 (a0 ) = F (a0 , a1 ) (a1 fest gehalten) und F2 (a1 ) = F (a0 , a1 ) (a0 fest gehalten) ein. Wir erhalten: 0 = F10 (a0 ) = 2 m X i=1 0 = F20 (aa ) = 2 m X i=1 also ma0 + m X i=1 m X xi i=1 ! x i a0 + (a0 + a1 xi − yi ), m X x2i i=1 (a0 + a1 xi − yi )xi , ! ! m X a1 = yi , i=1 m X a1 = xi yi . i=1 Dies ist ein lineares Gleichungssystem für die beiden Variablen a0 und a1 mit Lösung P P P P P 2 P P m xi yi − xi yi yi xi − xi xi yi P P P P , a1 = . (6.10) a0 = m x2i − ( xi )2 m x2i − ( xi )2 Die Lösung existiert genau dann, wenn m m X i=1 x2i 6= 68 m X i=1 xi !2 . Dies ist der Fall, wenn m ≥ 2 (mindestens zwei Meßwerte) und es mindestens zwei Werte xi 6= xj gibt. Beispiel 6.24 Der Druck eines idealen Gases in einem Behälter mit festem Volumen werde für verschiedene Temperaturen gemessen. Die m = 5 Meßwerte lauten: Temperatur xi in K Druck yi in N/m2 300 235 350 290 400 335 450 360 500 415 Wir nehmen weiter an, daß der Behälter n = 10−4 mol des Gases enthalte und daß das Volumen V = 10−3 m3 betrage. Dann ist nach dem idealen Gasgesetz mol nR T = 0.1R 3 T. p(T ) = V m Der Achsenabschnitt a0 und die Steigung der Ausgleichsgeraden lauten gemäß (6.10) a0 = −17 [N/m2 ], a1 = 0.860 [N/m2 K] (siehe Abbildung 6.10). Damit erhalten wir aus p(300 K) = 30R mol K N N N ≈ 0, 86 · 300 2 − 17 2 = 241 2 3 m m m m eine Approximation der Gaskonstanten R≈ 241 Nm Nm ≈ 8, 03 . 30 mol K mol K Der Literaturwert lautet R = 8, 314 Nm/(mol K). Die Abweichung liegt mit einem relativen Fehler von (8, 03 − 8, 314)/8, 314 ≈ 3, 4% innerhalb der zu erwartenden Meßgenauigkeit. 69 450 Druck in N/m2 400 Steigung der Ausgleichsgeraden = 0.860 350 300 250 200 300 350 400 450 500 Temperatur in K Abbildung 6.10: Meßwerte aus Beispiel 6.24 und zugehörige Ausgleichswerte. 70 7 7.1 Integration Das bestimmte Integral In Beispiel 1.2 haben wir gesehen, daß die Menge N (t) einer radioaktiven Substanz die Gleichung N 0 (t) = −αN (t) mit α > 0, t > 0 erfüllt. Um derartige Differentialgleichungen nach N (t) “auflösen” zu können, benötigen wir die “Umkehroperation” zur Differentiation. Interessanterweise wird diese durch das Integral gegeben, das mit der Fläche unter einer Kurve zusammenhängt. Wir wollen also die Fläche zwischen einer Kurve y = f (x) und der x-Achse in [a, b] berechnen. Dazu approximieren wir die Fläche durch Rechtecke (siehe Abbildung 7.1). Wir zerlegen das Intervall [a, b] in n Teilintervalle, indem wir die Punkte a = x0 < x1 < . . . < xn = b bzw. die Zerlegung Z = {x0 , x1 , . . . , xn } einführen, und wählen in jedem Teilintervall eine Zwischenstelle ξi ∈ [xi−1 , xi ], i = 1, . . . , n. Die Riemann-Summe S(Z) = n X i=1 f (ξi )(xi − xi−i ) ist dann eine Näherung an die Fläche zwischen der Kurve und der x-Achse. Wir erwarten, daß die Näherung umso besser wird, je feiner die Zerlegung gewählt wird. f (x) y 111111 000000 000000 111111 000000 111111 000000 111111 0000 1111 000000 111111 0000 1111 000000 111111 0000 1111 000000 111111 0000 1111 00000 11111 000000 0000 1111 00000111111 11111 000000 111111 0000 1111 00000 11111 000000 111111 0000 1111 00000 11111 0000 1111 000000 111111 0000 1111 00000 11111 0000 1111 000000 111111 0000 1111 00000 11111 0000 1111 000000 111111 0000 1111 00000111111 11111 0000 1111 000000 0000 1111 00000 11111 0000 1111 000000 111111 0000 1111 00000 11111 0000 1111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000111111 11111 0000 1111 000000 111111 000000 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 111111 00000 11111 0000 1111 00000 11111 0000 1111 000000 111111 000000 00000 11111 0000 1111 00000111111 11111 0000 1111 000000 111111 a ξ1 x1 ξ2 x2 ξ3 x3 ξ4 x4 x5 b ξ5 ξ6 Abbildung 7.1: Zur Definition der Riemann-Summe. Definition 7.1 Sei f : [a, b] → R eine Funktion. Wenn 71 x (1) für jede Zerlegung Z von [a, b] mit max{xi − xi−1 : i = 1, . . . , n} → 0 (n → ∞) und (2) für jede Wahl von Zwischenstellen ξi ∈ [xi−1 , xi ], i = 1, . . . , n, der Grenzwert F = limn→∞ S(Z) existiert und stets denselben Wert liefert, so heißt f (Riemann-)integrierbar in [a, b] und F heißt das bestimmte Integral von f in [a, b]. Wir schreiben kurz: Z b n X f (x) dx. f (ξi )(xi − xi−1 ) = lim n→∞ a i=1 Satz 7.2 (1) Sei f : [a, b] → R stetig. Dann ist f integrierbar. (2) Sei f : [a, b] → R integrierbar. Dann ist Z b f (x) dx = (Fläche oberhalb x-Achse)−(Fläche unterhalb x-Achse), a siehe Abbildung 7.2. y + 0 + a − b x Abbildung 7.2: Veranschaulichung von Satz 7.2 (2). Beispiel 7.3 (1) Die Funktion f (x) = 1/x ist für x > 0 stetig, also insbesondere auf [1, 2] integrierbar. Um das Integral Z 2 dx x 1 zu berechnen, wählen wir • Zerlegung Z: xi = 2i/n , i = 0, . . . , n, 72 • Zwischenstellen: ξi = xi−1 = 2(i−1)/n , i = 1, . . . , n. Die Riemann-Summe lautet n n n X X X S(Z) = f (ξi )(xi −xi−1 ) = 2−(i−1)/n 2i/n − 2(i−1)/n = 21/n − 1 = n(21/n −1). i=1 i=1 i=1 Wir erhalten mit der Regel von de l’Hospital 2x − 1 ex ln 2 − 1 ln 2 · ex ln 2 21/n − 1 = lim = lim = lim = ln 2. x→0 x→0 x→0 n→∞ 1/n x x 1 lim S(Z) = lim n→∞ Man kann zeigen, daß man diesen Grenzwert für jede Zerlegung und jede Wahl von Zwischenstellen erhält. Daher gilt Z 2 dx = ln 2. x 1 (2) Wir behaupten, daß die Funktion ( 1 : x ∈ Q ∩ [0, 1] f (x) = 0 : x ∈ (R\Q) ∩ [0, 1] nicht integrierbar ist. Sei Z = {x0 , . . . , xn } eine beliebige Zerlegung und wähle • ξi ∈ [xi−1 , xi ] mit ξi ∈ Q (i = 1, . . . , n), • ηi ∈ [xi−1 , xi ] mit ξi ∈ R\Q (i = 1, . . . , n). Wir erhalten Sξ (Z) = Sη (Z) = n X i=1 n X i=1 f (ξi )(xi − xi−1 ) = n X i=1 (xi − xi−1 ) = 1, f (ηi )(xi − xi−1 ) = 0. Wählen wir die Zerlegung immer feiner und die Zwischenwerte wie oben, so folgt lim Sξ (Z) = 1 6= 0 = lim Sη (Z), n→∞ n→∞ d.h., f ist nicht integrierbar. Es gelten die folgenden Rechenregeln. Satz 7.4 Seien f und g auf [a, b] integrierbar. Dann gilt: Rb Rb Rb (1) a (αf (x) + βg(x)) dx = α a f (x) dx + β a g(x) dx für alle α, β ∈ R. Rb Rc Rb (2) a f (x) dx = a f (x) dx + c f (x) dx für alle c ∈ [a, b]. Ra Rb Ra (3) a f (x) dx = 0 und a f (x) dx = − b f (x) dx. Rb Rb (4) | a f (x) dx| ≤ a |f (x)| dx. 73 7.2 Zusammenhang zwischen Differentiation und Integration Definition 7.5 Sei f : [a, b] → R eine Funktion. Eine Funktion F : [a, b] → R heißt Stammfunktion von f genau dann, wenn F differenzierbar ist und F 0 (x) = f (x) für alle x ∈ [a, b] gilt. Man nennt F auch ein unbestimmtes Integral von f und schreibt Z F (x) = f (x) dx. (7.1) Die Notation (7.1) ist etwas mißverständlich: Sind nämlich F und G zwei Stammfunktionen von f , so folgt aus (F − G)0 = F 0 − G0 = f − f = 0 in [a, b], daß F − G = const. in [a, b] gelten muß. In der Notation (7.1) ist also die Integrationskonstante stets mit aufgeführt! Einige Stammfunktionen lauten (mit c ∈ R): R f (x) xα (α 6= −1) f (x) dx 1 xα+1 α+1 1 x ex sin x cos x + c ln |x| + c ex + c − cos x + c sin x + c Ist f : [a, b] → R eine stetige Funktion, so können wir für beliebiges x0 ∈ [a, b] mit Z x F (x) = f (t) dt, x ∈ [a, b], (7.2) x0 eine Stammfunktion konstruieren, was den Zusammenhang zwischen bestimmten und unbestimmten Integralen aufweist. Es gilt: Satz 7.6 Sei f : [a, b] → R stetig, x0 ∈ [a, b]. Dann ist F , definiert in (7.2), differenzierbar und F 0 = f , d.h., F ist eine Stammfunktion von f . Den Zusammenhang zwischen der Differentiation und Integration stellt der folgende Satz her: Satz 7.7 (Hauptsatz der Differential- und Integralrechnung) Sei f : [a, b] → R stetig und F eine Stammfunktion von f . Dann gilt Z b f (x) dx = [F (x)]ba = F (b) − F (a). a Der Hauptsatz zeigt, daß Differentiation und Integration sich im folgenden Sinne wie “Operation” und “Umkehroperation” verhalten. Sei f : [a, b] → R stetig und F eine (differenzierbare) Stammfunktion von f . Dann gilt nach Satz 7.6 Z Z x d dF dF d (x) = f (x) oder (x) = f (x) f (x) dx = f (t) dt = dx dx dx x0 dx 74 und nach Satz 7.7 Z a b dF (x) = F (b) − F (a). dx Beispiel 7.8 Die Fläche zwischen der Sinuskurve und der x-Achse in [0, π] lautet Z π sin x dx = − cos π − (− cos 0) = 1 + 1 = 2, 0 denn − cos x ist eine Stammfunktion zu sin x. Das Integral Z 2π sin x dx = − cos(2π) − (− cos 0) = −1 + 1 = 0 0 verschwindet dagegen, da die Fläche unterhalb der x-Achse mit negativem Vorzeichen versehen wird (siehe Abbildung 7.2). Beispiel 7.9 Mit Hilfe von Satz 7.7 können wir auch Werte von unendlichen Reihen berechnen. Wir zeigen, daß ∞ X αn n=1 n = − ln(1 − α) gilt. Definiere dazu f (x) = für alle |α| < 1 (7.3) ∞ X xk+1 = . n k+1 k=0 ∞ X xn n=1 Man kann zeigen, daß f für |x| < 1 differenzierbar ist und daß folgt ∞ ∞ X X d xk+1 f (x) = = xk , dx k + 1 k=0 k=0 0 |x| < 1. Das ist aber gerade die geometrische Reihe, so daß f 0 (x) = 1/(1−x). Aus Satz 7.7 erhalten wir Z x Z x h ix dt 0 = − ln(1 − t) = − ln(1 − x). f (x) = f (x) − f (0) = f (t) dt = 0 0 0 1−t Setzen wir x = α, so ist (7.3) bewiesen. 7.3 Integrationsmethoden Wir stellen zwei Integrationsmethoden vor: • Partielle Integration: Seien f, g : [a, b] → R stetig differenzierbar. Dann ist Z b Z b b 0 f 0 (x)g(x) dx. f (x)g (x) dx = f (x)g(x) a − a a 75 • Substitution: Sei f : [a, b] → R stetig und g : [c, d] → [a, b] stetig differenzierbar. Dann ist Z d Z g(d) 0 f (g(t))g (t) dt = f (x) dx. c g(c) Beispiel 7.10 (Partielle Integration) R (1) Berechne x sin x dx. Wir setzen f (x) = x und g 0 (x) = sin x. Dann ist f 0 (x) = 1, g(x) = − cos x und Z Z x sin x dx = x · (− cos x) − 1 · (− cos x) dx = −x cos x + sin x + c. Rπ (2) Berechne 0 sin2 x dx. Wir setzen f (x) = sin x und g 0 (x) = sin x, also Z π Z π h iπ Z π 2 sin x dx = sin x(− cos x) − cos2 x dx. cos x(− cos x) dx = 0 0 0 0 Wir könnten noch einmal partiell integrieren: Z π Z π h iπ Z 2 2 cos x dx = cos x · sin x + sin x dx = 0 0 0 π 2 sin x dx = 0 Z π sin2 x dx, 0 doch dies führt nicht weiter. Wir benutzen anstelle dessen die Relation cos2 x = 1 − sin2 x. Dann folgt Z Z Z π π π sin2 x dx = dx − 0 0 und daher Z π sin2 x dx = 0 sin2 x dx 0 π . 2 R (3) Wie in (2) können wir das unbestimmte Integral sin2 x dx berechnen: Z Z Z 2 2 sin x dx = − sin x cos x + cos x dx = − sin x cos x + (1 − sin2 x) dx Z = − sin x cos x + x − sin2 x dx, also Z 1 sin2 x dx = (x − sin x cos x). 2 (7.4) Die Substitutionsregel kann in der Praxis folgendermaßen verwendet werden. In dem Rb = x0 (t), also kann man “dx” Integral a f (x) dx substituiert man x = x(t). Dann ist dx dt durch “x0 (t)dt” beim Übergang von der x- zur t-Variablen ersetzen. Falls x(α) = a und x(β) = b, so erhält man Z b Z β f (x) dx = f (x(t))x0 (t) dt. a α 76 Beispiel 7.11 (Substitution) R1 (1) Berechne 0 (1 + 2x)10 dx. Wir setzen t = 1 + 2x. Dann ist x(t) = x = 12 (t − 1), also dx = 12 , und aus 0 ≤ x ≤ 1 folgt 1 ≤ t ≤ 3. Damit ergibt sich dt Z 1 10 (1 + 2x) dx = Z 1 0 R√ 3 1 1 1 11 3 177146 1 t 1 = (311 − 1) = . t10 dt = 2 2 11 22 22 (2) Berechne 1 − x2 dx. Wir substituieren x = cos t. Dann erhalten wir dx = − sin t dt und wegen (7.4) Z √ Z √ Z 1 2 2 1 − x dx = 1 − cos t (− sin t) dt = − sin2 t dt = − (t − sin t cos t) + c. 2 √ √ Rücksubstitution t = arccos x und sin t = 1 − cos2 t = 1 − x2 ergeben Z √ 1 √ 2 2 x 1 − x − arccos x + c. 1 − x dx = 2 Das bestimmte Integral Z 0 1 √ 1 − x2 dx ist gerade der Flächeninhalt des Viertelkreises mit Radius r = 1. Wir erhalten Z 1√ 1 1 1 1 √ 2 2 x 1 − x − arccos x 1 − x dx = = − arccos 1 + arccos 0 2 2 2 0 0 1 1 π π = − ·0+ · = . 2 2 2 4 Dies stimmt mit der Formel für den Flächeninhalt πr2 /4 = π/4 überein. Für einige Integrale gibt es Standardsubstitutionen, die zuweilen auf einfachere Integrale führen. Im folgenden geben wir einige Beispiele. Sei hierfür R(α, v, w, . . .) eine rationale Funktion in den angegebenen Variablen. R • Typ R(cos x) sin x dx. Substituiere t = cos x; R • Typ R(sin x) cos x dx. Substituiere t = sin x; R • Typ R(sin x, cos x) dx. Substituiere t = tan x2 ; √ R • Typ R(x, x2 + a2 ) dx. Substituiere x = a sinh t; √ R • Typ R(x, x2 − a2 ) dx. Substituiere x = a cosh t; √ R • Typ R(x, a2 − x2 ) dx. Substituiere x = a sin t; 77 Beispiel 7.12 (Standardsubstitutionen) R π/2 cos3 x (1) Berechne 0 1−sin dx. Wegen x Z π/2 1 − sin2 x cos3 x dx = cos x dx 1 − sin x 1 − sin x 0 0 R 2 . Wir substituieren also ist das Integral vom Typ R(sin x) cos x dx mit R(u) = 1−u 1−u π dt t = sin x, Dann ist dx = cos x, und 0 ≤ x ≤ 2 impliziert 0 ≤ t ≤ 1: Z Z π/2 0 π/2 cos3 x dx = 1 − sin x Z 1 0 1 − t2 dt = 1−t (2) Das Integral Z Z 1 0 (1 − t)(1 + t) dt = 1−t Z 0 1 3 (1 + t) dt = . 2 sin2 x dx (1 + sin x + cos x)3 R ist vom Typ R(sin x, cos x) dx, so daß wir t = tan(x/2) substituieren. Dann folgt aus x = 2 2 2 = 1+t 2 arctan t zum einen dx 2 und mit den Additionstheoremen cos(2α) = cos α − sin α dt und sin(2α) = 2 sin α cos α zum anderen 1− 1 − t2 = 1 + t2 1+ sin2 (x/2) cos2 (x/2) sin2 (x/2) cos2 (x/2) cos2 (x/2) − sin2 (x/2) = = cos x, cos2 (x/2) + sin2 (x/2) sin(x/2) 2 cos(x/2) 2 cos(x/2) sin(x/2) 2t = sin x = 2 (x/2) = 2 sin 1+t cos2 (x/2) + sin2 (x/2) 1 + cos2 (x/2) Wir erhalten 1 + sin x + cos x = und daher Z sin2 x dx = (1 + sin x + cos x)3 Z 1 + t2 + 2t + 1 − t2 2(1 + t) = 2 1+t 1 + t2 2t 1 + t2 2 1 + t2 2(1 + t) 3 2dt = 1 + t2 Z t2 dt. (1 + t)3 (7.5) Wie kann man nun das Integral über eine rationale Funktion berechnen? Wir verschieben die Integration von (7.5) auf Beispiel 7.13 und betrachten allgemein Integrale rationaler Funktionen. Die Aufgabe lautet, für gegebene Polynome P (x) und Q(x) das Integral Z P (x) dx Q(x) zu berechnen. Dabei gehen wir wie folgt vor: 78 • 1. Schritt: Führe Polynomdivision durch, falls Grad P ≥ Grad Q (“Grad” sei der Grad eines Polynoms): R(x) P (x) = P1 (x) + , Q(x) Q(x) wobei P1 und R Polynome sind mit Grad R < Grad Q. Das Integral über P1 ist leicht zu berechnen. • 2. Schritt: Bestimme alle Nullstellen von Q und zerlege Q in Faktoren der Form (x − a)m und ((x − a)2 + b2 )n . • 3. Schritt: Führe Partialbruchzerlegung durch. Verwende dazu für den Faktor in Q: (x − a)m den Ansatz A1 Am + ··· + x−a (x − a)m und für ((x − a)2 + b2 )n den Ansatz An x + Bn A1 x + B1 + ··· + . 2 2 (x − a) + b ((x − a)2 + b2 )n Die Koeffizienten Ai und Bi werden wie in Abschnitt 3.2 durch Koeffizientenvergleich bestimmt. • 4. Schritt: Schließlich können die Formeln Z dx = x−a Z dx = (x − a)m Z Ax + B dx = (x − a)2 + b2 die Partialbrüche integriert werden. Verwende hierzu ln |x − a| + c, 1 1 +c (m ≥ 2), m − 1 (x − a)m−1 Aa + b x−a A ln |(x − a)2 + b2 | + arctan + c. 2 2 b − Für Integrale mit dem Nenner ((x − a2 ) + b2 )n mit n ≥ 2 kann man mit partieller Integration eine Rekursionsformel herleiten, die wir hier jedoch nicht angeben. Beispiel 7.13 (Partialbruchzerlegung) Wir setzen Beispiel 7.12 (2) fort und berechnen Z t2 dt. (1 + t)3 Der erste Schritt entfällt, da Grad (t2 ) = 2 < 3 = Grad ((1 + t)3 ). Das Nennerpolynom ist bereits in Faktoren aufgelöst. Wir führen nun eine Partialbruchzerlegung (3. Schritt) durch und machen den Ansatz A1 A2 A3 t2 = + + . (1 + t)3 1 + t (1 + t)2 (1 + t)3 79 Multiplikation mit (1 + t)3 führt auf t2 = (1 + t)2 A1 + (1 + t)A2 + A3 = A1 t2 + (2A1 + A2 )t + (A1 + A2 + A3 ). Koeffizientenvergleich ergibt A1 = 1, 2A1 + A2 = 0, A1 + A2 + A3 = 0, Also A2 = −2, A3 = 1. Folglich ist 1 2 1 t2 = − + . 3 2 (1 + t) 1 + t (1 + t) (1 + t)3 Damit ist (4. Schritt) Z Z Z Z t2 dt dt dt 2 1 dt = − 2 + = ln |1 + t| + − (1 + t)3 1+t (1 + t)2 (1 + t)3 1 + t 2(1 + t)2 4t + 3 = ln |1 + t| + . 2(1 + t)2 Das Integral aus Beispiel 7.12 (2) ist also gelöst: Z 4t + 3 x 4 tan(x/2) + 3 sin2 x dx = ln |1 + t| + = ln |1 + tan | + . 3 2 (1 + sin x + cos x) 2(1 + t) 2 2(1 + tan(x/2))2 Das Integral Z e−x 2 /2 dx besitzt keine durch elementare Funktionen ausdrückbare Stammfunktion. Das bestimmte Integral Z ∞ e−x 2 /2 dx −∞ muß also numerisch bestimmt werden. Doch was bedeutet der unbeschränkte Integrationsbereich? Wir definieren einfach Z ∞ Z R 2 −x2 /2 e dx = lim e−x /2 dx −∞ R→∞ −R und betrachten zunächst das Integral über [−R, R]. Eine Möglichkeit ist es, das Integral wie in Abbildung 7.3 durch die eingezeichneten Trapeze zu approximieren. Sei dafür −R = x−n < x−n+1 < . . . < xn = R eine Zerlegung des Intervalls [−R, R]. Dann ist Z R n X 1 −x2k /2 2 −x2 /2 + e−xk−1 /2 (xk − xk−1 ). e e dx ≈ 2 −R k=−n+1 Man nennt dies die Trapezregel. Wir wählen nun speziell xk = k und bezeichnen mit an die obige Summe. Dann erhalten wir die folgende Tabelle: 80 y 0 xk−1 Abbildung 7.3: Zur Approximation von n 3 5 7 9 11 Wir vermuten, daß Z xk R∞ −∞ x e−x 2 /2 dx. an 2.49484088243673 2.50662453088395 2.50662828801998 2.50662828804291 2.50662828804291 ∞ e−x −∞ 2 /2 dx ≈ 2.50662828804291. Wie genau ist dieser Wert? Wir haben zwei Arten von Fehlern zu berücksichtigen. Zum einen haben wir das Integral über (−∞, −n) und (n, ∞) vernachlässigt; dieser Fehler wird immer kleiner, wenn wir n groß genug wählen. Allerdings approximieren die Trapeze über (−1, 0) und (0, 1) das Integral mit einem Fehler, der nicht kleiner wird, wenn n → ∞. Tatsächlich ist der oben gerechnete Wert nur bis auf sechs Nachkommastellen genau; man kann nämlich zeigen, daß Z ∞ −∞ e−x 2 /2 dx = √ 2π ≈ 2.50662827463100. 81