Skriptum zur Vorlesung Mathematik für Molekulare Biologen Christian Schmeiser1 Contents 1 Einleitung 1 2 Zahlensysteme, Grundrechnungsarten 2 3 Komplexe Zahlen, Polynome 5 4 Die Polardarstellung, Winkelfunktionen 9 5 Reelle Funktionen, Grenzwerte 12 6 Differentialrechnung, die Exponentialfunktion 17 7 Integration 24 8 Kleinste Fehlerquadrate 33 9 Differentialgleichungen – Reaktionskinetik 40 1 Einleitung Es ist das Ziel dieser Vorlesung, mit einigen mathematischen Methoden Bekanntschaft zu machen, die bei quantitativen Zugängen zur Molekularbiologie eingesetzt werden. Dazu sind als Vorbereitung einige mathematische Grundlagen notwendig, deren Behandlung den größeren Teil der Vorlesung (bis einschließlich Kapitel 7) in Anspruch nimmt. Prinzipiell sind keinerlei mathematische Vorkenntnisse notwendig (nicht einmal solche aus der Schule). Allerdings werden HörerInnen, bei denen das wirklich der Fall ist, das Tempo wahrscheinlich als sehr hoch empfinden. Mathematische Theorien bestehen im Wesentlichen aus Axiomen, Definitionen und Sätzen. Axiome sind Annahmen über die Natur mathematischer Objekte, die vorausgesetzt werden und daher nicht weiter diskutiert werden müssen, wenn man sich diesbezüglich geeinigt hat. Definitionen führen (aufbauend auf Bekanntem) neue Begriffe ein. Sätze sind aus Axiomen, Definitionen und schon bewiesenen Sätzen beweisbare Aussagen. In diesem Skriptum wird der Stoff nicht streng nach diesen Gesichtspunkten präsentiert. Allerdings erscheinen bei Farbdruck Teile des Textes in Blau bzw. Rot, was auf ihren logischen Rang als Definitionen bzw. Sätze hinweist. 1 Institut für Mathematik, [email protected] Universität Wien, Nordbergstraße 1 15, 1090 Wien, Austria. chris- Die Standardschreibweise der Mengentheorie wird verwendet wie das aufzählende Verfahren zur Angabe von Mengen, z.B. A = {mein Schlüsselbund, meine Geldbörse, mein Handy, mein Laptop} , sowie das beschreibende Verfahren, z.B. B = {x : x ist in meinem Rucksack} . Die Aussage x gehört zur Menge A bzw. x ist Element der Menge A schreibt man als x ∈ A, ihre Verneinung als x ∈ / A. Die leere Menge {} ist die Menge ohne Elemente. Teilmengen: A⊂B gilt genau dann, wenn jedes Element von A auch Element von B ist. Vereinigungs- und Durchschnittsmengen: A ∪ B = {x : x ∈ A oder x ∈ B} , A ∩ B = {x : x ∈ A und x ∈ B} , wobei das oder in der Definition der Vereinigungsmenge ein inklusives oder ist. Differenzmenge: A \ B = {x : x ∈ A und x ∈ / B} . 2 Zahlensysteme, Grundrechnungsarten Die Menge der natürlichen Zahlen IIN = {1, 2, 3, . . .} ist abgeschlossen bezüglich der Addition, d.h. die Summe zweier beliebiger natürlicher Zahlen ist wieder eine natürliche Zahl. Für die Umkehroperation zur Addition, die Subtraktion, gilt das nicht: 3 − 5 ist keine natürliche Zahl. Um diesem Ausdruck Sinn zu geben, erweitert man auf die Menge der ganzen Zahlen ZZ = {. . . , −2, −1, 0, 1, 2, . . .} , die auch bezüglich der Subtraktion abgeschlossen ist. Die Menge der natürlichen Zahlen ist auch bezüglich der Multiplikation abgeschlossen. Diese lässt sich auch auf die ganzen Zahlen erweitern (und zwar so, dass die wichtigsten Rechenregeln gültig bleiben). Wieder besteht das Problem, dass die Umkehroperation zur Multiplikation, die Division p/q nicht für beliebige p, q ∈ ZZ wieder eine ganze Zahl ergibt. Als Konsequenz führt eine weitere Erweiterung auf die Menge der rationalen Zahlen Q = {p/q : p ∈ ZZ, q ∈ IIN} . Man beachte, dass damit die Abgeschlossenheit nur fast vollständig hergestellt ist: Division durch Null ist auch in Q nicht erlaubt. Die rationalen Zahlen sind den Menschen schon seit langer Zeit bekannt, so bildeten sie z.B. das Zahlensystem der Pythagoräer. So wie man durch fortgesetztes Addieren mit demselben Summanden auf das Multiplizieren kommen kann, führt das fortgesetzte Multiplizieren mit demselben Faktor auf das Potenzieren: xn = xxn−1 für n ≥ 2 , 2 x1 = x . Figure 1: Graphischer Beweis des Pythagoräischen Lehrsatzes Bemerkung 1 Das ist eine sogenannte rekursive Definition. Man beachte, dass auf diese Art xn für alle n ∈ IN I definiert ist. Der Grund ist das, was die natürlichen Zahlen im Kern ausmacht: Sie beginnen bei 1 und man erreicht jede von ihnen, indem man bei 1 zu Zählen beginnt. Hat man das Potenzieren definiert, ist man natürlich wieder an der Umkehroperation, dem Wurzelziehen interessiert. Als Beispiel betrachten√wir die Quadratwurzel: Die Tatsachen, dass √ 2 2 1 = 1 und 2 = 4√gilt, schreibt man auch als 1 = 1 und 2 = 4. Da 2 zwischen 1 und 4 liegt, erwarten wir, dass 2 zwischen 1 und 2 liegt. Mit Hilfe des Pythagoräischen Lehrsatzes (graphischer Beweis siehe Fig. 1, vorpythagoräischer Beweis siehe Fig. √ 2) können wir sogar ein geometrisches Konstruktionsverfahren für eine Strecke mit der Länge 2 (z.B. cm) angeben: Es ist die Länge der Diagonale eines Quadrates mit der Kantenlänge 1. Nach der Logik der pythagoräischen Mathematik muss es also eine rationale Zahl √ p/q = 2 geben. Um p, q ∈ IIN eindeutig festzulegen, nehmen wir an, dass die Darstellung gekürzt ist, d.h. dass p und q keine gemeinsamen Teiler haben. Aus der obigen Gleichung folgt (durch Quadrieren und Multiplizieren mit q 2 ) p2 = 2q 2 . Daraus folgt aber, dass p2 eine gerade Zahl ist, was weiter impliziert, dass p eine gerade Zahl ist. Wir können p daher darstellen als p = 2r mit r ∈ IIN. Setzen wir das in die obige Gleichung ein und dividieren diese durch 2, so ergibt sich 2r2 = q 2 . Daraus folgt aber analog zu oben, dass q 2 und daher auch q eine gerade Zahl ist. Dass p und q beides gerade Zahlen sind, widerspricht aber unserer Annahme, dass die Darstellung p/q gekürzt ist. Dieses Argument zeigt, dass es keine rationale Zahl gibt, deren Quadrat 2 ist. 3 Figure 2: Beweis des ’Satzes von Pythagoras’ aus Zhou Bi Suan Jing (Zhou-Dynastie, 1046–256 B.C., bzw. Han-Dynastie, 256 B.C. – 220 A.D.) Diese katastrophale Erkenntnis des Mitglieds Hippasus der Pythagoräer wird das Dilemma der griechischen Mathematik genannt. Geometrisch gesehen zeigt es, dass das Einzeichnen aller Punkte, die den rationalen Zahlen entsprechen, auf einer Zahlengeraden Lücken hinterlässt. Heute bezeichnen wir diese Lücken als irrationale Zahlen, die wir zusätzlich in unser Zahlensystem aufnehmen, wodurch die Menge IR der reellen Zahlen entsteht. Eine wesentliche Aussage über irrationale Zahlen ist, dass jede irrationale Zahl beliebig gut durch rationale Zahlen approximiert werden kann. Genauer heißt das, dass man eine beliebige irrationale Zahl und einen beliebig kleinen Fehler vorgeben kann, und dann immer eine rationale Zahl findet, deren Abstand zu der gegebenen irrationalen Zahl kleiner als der vorgegebene Fehler √ ist. Am Beispiel der irrationalen Zahl 2 werden wir dieses Resultat demonstrieren. Wir wissen schon, dass √ 1< 2<2 √ gilt, d.h. beide rationalen Zahlen 1 und 2 haben höchstens den Abstand 1 von 2. Wir werden das sogenannte Bisektionsverfahren oder Halbierungsverfahren verwenden, um genauere Approximationen zu finden. In der Mitte zwischen 1 und 2 liegt 3/2, und es gilt (3/2)2 = 9/4 > 8/4 = 2. Daraus folgern wir 2 √ 3 < 2< , 2 2 √ woraus folgt, dass wir 2 schon bis auf einen Fehler 1/2 approximiert haben. In der Mitte zwischen 2/2 und 3/2 liegt (2/2 + 3/2)/2 = 5/4, und es gilt (5/4)2 = 25/16 < 32/16 = 2 und daher 5 √ 6 < 2< . 4 4 4 Einen Schritt machen wir noch: (5/4 + 6/4)/2 = 11/8, (11/8)2 = 121/64 < 128/64 = 2, woraus folgt 11 √ 12 < 2< . 8 8 Damit haben wir gezeigt, dass sowohl 11/8 als auch 12/8 = 3/2 höchstens den Abstand 1/8 von √ 2 haben. Da der Abstand in jedem Schritt halbiert wird, kann er beliebig klein gemacht werden. Die wichtigsten Teilmengen von IR sind Intervalle, die an ihren Enden offen oder abgeschlossen sein können: (a, b) := {x ∈ IR : a < x < b} , [a, b] := {x ∈ IR : a ≤ x ≤ b} , [a, b) := {x ∈ IR : a ≤ x < b} , (a, b] := {x ∈ IR : a < x ≤ b} . Intervalle können auch unbeschränkt sein: (a, ∞) := {x ∈ IR : x > a} , [a, ∞) := {x ∈ IR : x ≥ a} , (−∞, a) := {x ∈ IR : x < a} , (−∞, a] := {x ∈ IR : x ≤ a} . Übungsaufgaben 2.1. Man berechne den Flächeninhalt des gleichschenkeligen Dreiecks mit den Kantenlängen 4, 3, 3. √ 2.2. Man zeige, dass 3 keine rationale Zahl ist. √ 2.3. Man approximiere 5 mithilfe des Bisektionsverfahrens bis auf einen Fehler von maximal 1/8. 2.4. Man approximiere eine positive und eine negative Lösung von x2 + x = 5 jeweils bis auf einen Fehler von maximal 1/4. 3 Komplexe Zahlen, Polynome Leider haben wir mit der Einführung der reellen Zahlen das Problem des Quadratwurzelziehens noch nicht vollständig gelöst, weil das Quadrat einer reellen Zahl nicht negativ sein kann. Es gibt daher keine reelle Zahl x, für die x2 = −1 gilt. Um diesem Problem Herr zu werden, ist eine kühne (aber simple) Idee notwendig: Man postuliert einfach, dass es eine solche Zahl gibt und gibt ihr einen Namen. Der Name i bezeichnet ab nun eine Zahl, für die i2 = −1 (1) gilt. Diese Zahl wird als imaginäre Einheit bezeichnet. Damit diese Erweiterung des Zahlenraumes in unserem Sinne brauchbar wird, ist aber die Abgeschlossenheit bezüglich aller Grundrechnungsarten notwendig. Es müssen also auch Ausdrücke wie 1 + i oder 5i definiert sein. Das führt auf die Definition der Menge der komplexen Zahlen C = {a + ib : a, b ∈ IR} . 5 Für eine komplexe Zahl z = a+ib bezeichnen wir die beiden reellen Zahlen Re(z) = a und Im(z) = b als Realteil und Imaginärteil. Jede relle Zahl z kann auch komplexe Zahl mit Im(z) = 0 angesehen werden. Die Menge aller rein imaginären Zahlen mit Re(z) = 0 liefert √ Quadratwurzeln für alle negativen reellen Zahlen. Sei nämlich x ∈ I R, x < 0. Dann existiert −x ∈ IR und für die rein √ imaginäre Zahl z = i −x gilt √ 2 √ 2 −x = (−1) · (−x) = x . z 2 = i −x = i2 Wie oben erwähnt, können die reellen Zahlen als Punkte auf einer Zahlengeraden geometrisch interpretiert werden. Ähnlich gibt es für die komplexen Zahlen eine geometrische Interpretation als Punkte in einer Ebene, die in diesem Zusammenhang als Gaußsche Zahlenebene bezeichnet wird. Dabei verwendet man ein kartesisches (d.h. rechtwinkeliges) Koordinatensystem und identifiziert die komplexe Zahl z = a+ib mit dem Punkt mit den Koordinaten (a, b). Die a-Achse wird als reelle Achse und die b-Achse als imaginäre Achse bezeichnet. Die reelle Achse repräsentiert die Menge der reellen Zahlen als Teilmenge von C und die imaginäre Achse die Menge der rein imaginären Zahlen. Als Erweiterung für den Begriff des Betrages einer reellen Zahl definieren wir den Betrag einer komplexen Zahl geometrisch als ihren Abstand vom Ursprung in der Gaußschen Zahlenebene, den wir mit Hilfe des Pythagoräischen Lehrsatzes aus Realteil und Imaginärteil berechnen können: |a + ib| = p a2 + b2 ≥ 0 . Beim Rechnen praktisch ist oft die konjugiert komplexe Zahl z zu einer komplexen Zahl z = a + ib, die geometrisch durch Spiegelung an der reellen Achse definiert wird: z := a − ib . Als Beispiel für ihre Verwendung sei die Identität |z|2 = zz angeführt. Wie erhofft, ist die Menge der komplexen Zahlen abgeschlossen bezüglich der Grundrechnungsarten (abgesehen von der Division durch Null, die in den reellen Zahlen auch schon verboten war), wobei diese erst zu definieren sind. Dazu sind aber nur die üblichen Rechengesetze und die Beziehung (1) notwendig: Addition: (a + ib) + (c + id) = (a + c) + i(b + d) , d.h. bei der Addition zweier komplexer Zahlen sind einfach die Realteile und die Imaginärteile zu addieren. Analog: Subtraktion: (a + ib) − (c + id) = (a − c) + i(b − d) . Etwas komplizierter wird es bei der Multiplikation: (a + ib)(c + id) = ac + i2 bd + ibc + iad = (ac − bd) + i(ad + bc) , und noch etwas komplizierter bei der Division, bei der wir mit der konjugiert Komplexen des Nenners erweitern, um diesen reell zu machen: a + ib (a + ib)(c − id) ac + bd + i(bc − ad) ac + bd bc − ad = = = 2 +i 2 . 2 2 2 c + id (c + id)(c − id) c +d c +d c + d2 6 Das funktioniert natürlich nur, wenn zumindest eine der beiden reellen Zahlen c und d verschieden von Null ist, d.h. c + id 6= 0. Offensichtlich sind i und −i zwei verschiedene Lösungen der quadratischen Gleichung z 2 +1 = 0. Für allgemeinere quadratische Gleichungen der Form az 2 + bz + c = 0 (2) mit reellen Koeffizienten a 6= 0, b, c verwendet man zunächst quadratische Ergänzung: b b b2 az + bz + c = a z + z + c = a z 2 + z + 2 a a 4a 2 2 b = a z+ 2a 2 + 4ac − b2 . 4a = b2 − 4ac 4a2 ! +c− b2 4a Die Gleichung (2) kann daher in der Form z+ b 2a 2 geschrieben werden. Wurzelziehen liefert die Lösungsformel √ −b ± b2 − 4ac , z1,2 = 2a und daher zwei reelle Lösungen, wenn b2 − 4ac > 0 gilt. Lassen wir auch komplexe Lösungen zu, dann gibt es auch im Fall b2 − 4ac < 0 zwei Lösungen, nämlich √ −b ± i 4ac − b2 z1,2 = . 2a Man rechnet leicht nach, dass sich in beiden Fällen die linke Seite der Gleichung (2) faktorisieren (d.h. als Produkt schreiben) lässt als az 2 + bz + c = a(z − z1 )(z − z2 ) . Das gilt auch im Grenzfall b2 − 4ac = 0 mit z1 = z2 = −b/(2a). In diesem Fall nennt man −b/(2a) eine doppelte Lösung. Wenn man diese auch doppelt zählt, ergibt sich das Resultat, dass eine quadratische Gleichung mit reellen Koeffizienten immer 2 komplexe Lösungen hat. Das lässt sich in zwei Richtungen verallgemeinern: Auf Gleichungen mit komplexen Koeffizienten und auf Gleichungen höherer Ordnung. Dazu definieren wir zunächst den Begriff des Polynoms: Ein Polynom n-ten Grades mit komplexen Koeffizienten ist ein Ausdruck der Form p(z) = n X ak z k = an z n + an−1 z n−1 + · · · + a1 z + a0 , k=0 mit a0 , . . . , an ∈ C, an 6= 0. Eine Lösung z der Gleichung p(z) = 0 nennt man eine Nullstelle des Polynoms. Das wesentliche Grundresultat (das nicht so leicht zu beweisen ist) ist 7 Satz 1 Jedes Polynom mit komplexen Koeffizienten und mindestens ersten Grades besitzt mindestens eine komplexe Nullstelle. Für das Weitere benötigen wir die (leicht nachzurechnende) Identität z k − z1k = (z − z1 )(z k−1 + z k−2 z1 + · · · + zz1k−2 + z1k−1 ) . Sei nun z1 eine Nullstelle des Polynoms p, d.h. p(z1 ) = 0. Dann gilt wegen der obigen Gleichung p(z) = p(z) − p(z1 ) = n X ak (z k − z1k ) = (z − z1 )q(z) , k=0 wobei q ein Polynom (n − 1)-sten Grades ist. Diese Rechnung und Satz 1 ermöglichen für jedes Polynom p mit Grad n ≥ 1 die folgende Vorgangsweise: Der Satz 1 garantiert, dass p eine Nullstelle z1 ∈ C besitzt. Dasselbe gilt für q(z) = p(z)/(z − z1 ), wenn n ≥ 2 gilt. Nach n Schritten ist ein Polynom mit Grad Null, d.h. eine Konstante, und zwar an , übrig. Diese Ergebnisse kann man zusammenfassen im Fundamentalsatz der Algebra: Satz 2 Jedes Polynom n-ten Grades mit komplexen Koeffizienten besitzt n Nullstellen z1 , . . . , zn (Mehrfachnennungen möglich) und kann in der Form p(z) = an (z − z1 )(z − z2 ) · · · (z − zn ) geschrieben werden. Bei Polynomen zweiten Grades mit reellen Koeffizienten haben wir gesehen, dass im Fall komplexer Nullstellen diese als konjugiert komplexes Paar auftreten. Auch diese Eigenschaft kann verallgemeinert werden. Satz 3 Polynome mit reellen Koeffizienten haben eine gerade Anzahl komplexer (genauer: nicht reeller) Nullstellen, die nur als konjugiert komplexe Paare auftreten. Übungsaufgaben 3.1. Für folgende komplexe Zahlen gebe man Realteil und Imaginärteil an: a) c) (2 + i)(4 − 3i) b) (8 + 3i)(8 − 3i) 3 3 − 2i 2+i d) + 4 − 3i i 4 + 6i 3.2. Man zeichne die komplexen Zahlen 3+5i, −2/3+5i/2 und ein. 3+5i −3+i 3.3. Man berechne den √ Betrag folgender komplexer Zahlen: 2−i i(3 + 2i), 2 − i 5, 3i, 2 + 5i, 5 − 2i, 2+5i , i+ in der Gaußsche Zahlenebene 1+i 7−3i . 3.4. Wo liegen die Punkte z in der Gaußschen Zahlenebene, für die gilt a) |z| = 2, b) Re(z) = −1 (Re bezeichnet den Realteil von z) 8 3.5. Sei z = a + bi eine komplexe Zahl, und z die konjugiert komplexe Zahl zu z. Man bestimme Real- und Imaginärteil von: a) i|z| , b) z , z c) 1 , z d) z z + . z z 3.6. Man bestimme alle Lösungen der Gleichung 2z 2 − 4z + 20 = 0 . 3.7. Man bestimme alle Nullstellen des Polynoms z 2 − 6z + 10 und gebe die entsprechende Faktorisierung an. 3.8. 2i ist eine Lösung der Gleichung 4. Ordnung z 4 + 5z 3 + 11z 2 + 20z + 28 = 0 . Man berechne die restlichen Lösungen. 4 Die Polardarstellung, Winkelfunktionen Das Ziel dieses Abschnittes ist es, manche Rechnungen mit komplexen Zahlen zu erleichtern. Zunächst stellen wir fest, dass ein Punkt in der Gaußschen Zahlenebene auch beschrieben werden kann, indem man einerseits den Abstand r des Punkes vom Ursprung und andererseits den Winkel ϕ zwischen der reellen Achse und der Geraden durch den Punkt und den Ursprung angibt. Man nennt das die Polardarstellung einer komplexen Zahl und das Paar (r, ϕ) die Polarkoordinaten. Dabei verwenden wir als Maß für den Winkel die Bogenlänge auf dem Einheitskreis. Um einen Zusammenhang zu der Darstellung mit Real- und Imaginärteil herzustellen, brauchen wir Winkelfunktionen: Für Punkte mit Abstand r = 1 vom Ursprung (d.h. Punkte auf dem Einheitskreis) und mit Winkel ϕ nennt man den Realteil den Cosinus von ϕ bzw. cos ϕ, und den Imaginärteil den Sinus von ϕ bzw. sin ϕ. Aus dem Pythagoräischen Lehrsatz folgt daher sin2 ϕ + cos2 ϕ = 1 . (3) Weitere Eigenschaften von Sinus und Cosinus, die sich aus der Definition ergeben: Sinus ist ungerade und Cosinus gerade: sin(−ϕ) = − sin ϕ , cos(−ϕ) = cos ϕ . Sinus und Cosinus sind periodisch mit Periode 2π (Umfang des Einheitskreises): sin(ϕ + 2π) = sin ϕ , cos(ϕ + 2π) = cos ϕ . Sinus und Cosinus gehen auseinander durch Verschiebung hervor: sin(ϕ + π/2) = cos ϕ . Spezielle Werte: 9 ϕ 0 π/4 π/2 3π/4 π sin ϕ 0√ 1/ 2 1√ 1/ 2 0 cos ϕ 1√ 1/ 2 0√ −1/ 2 −1 Für die Zahl z mit den Polarkoordinaten (r, ϕ) gilt z = r(cos ϕ + i sin ϕ) bzw. Re(z) = r cos ϕ , Im(z) = r sin ϕ . Kann man umgekehrt auch die Polarkoordinaten aus Real- und Imaginärteil berechnen? Sei z = a + bi. Dann gilt p b sin ϕ r = a2 + b2 und = =: tan ϕ , a cos ϕ wobei die rechte Seite der Tangens von ϕ ist. Bei der Verwendung der zweiten Gleichung ist allerdings Vorsicht geboten. Sie definiert den korrekten Winkel nicht eindeutig. Für die beiden Zahlen z = a + bi und −z = −a − bi ergibt sich derselbe Wert für tan ϕ. Die auf den meisten Taschenrechnern vorhandene Funkton Arcustangens liefert für arctan(b/a) immer Werte zwischen −π/2 und π/2, d.h. im 1. oder 4. Quadranten. Liegt z im 2. (a < 0, b > 0) oder 3. (a, b < 0) Quadranten, dann ist der korrekte Winkel gegeben durch ϕ = arctan b +π. a Beispiel: z = −1 + i im 2. Quadranten, a = −1, b = 1. Es gilt r = ϕ = arctan(−1) + π = − √ 2, tan ϕ = −1 und daher π 3π +π = . 4 4 Wichtige Rechenregeln für die Winkelfunktionen sind die Summensätze: Satz 4 Für alle α, β ∈ IR gilt sin(α + β) = sin α cos β + sin β cos α , (4) cos(α + β) = cos α cos β − sin α sin β . (5) Verwendet man die Summensätze, dann zeigt sich, dass die Polardarstellung die Multiplikation komplexer Zahlen einfach macht: Für z1 = r(cos ϕ + i sin ϕ), z2 = %(cos ψ + i sin ψ) gilt z1 z2 = r%(cos ϕ cos ψ − sin ϕ sin ψ + i(sin ϕ cos ψ + sin ψ cos ϕ)) = r%(cos(ϕ + ψ) + i sin(ϕ + ψ)) . Um 2 komplexe Zahlen zu multiplizieren, muss man also die Beträge multiplizieren und die Winkel addieren. Als Konsequenz ergibt sich für Potenzen von z = r(cos ϕ + i sin ϕ): z n = rn (cos(nϕ) + i sin(nϕ)) . Als Abschluss dieses Kapitels berechnen wir die Nullstellen spezieller Polynome der Form p(z) = z n − w, wobei w 6= 0 eine beliebige gegebene komplexe Zahl ist. Die Nullstellen nennen wir die 10 Figure 3: Graphischer Beweis der trigonometrischen Summensätze für 0 ≤ α, β, α + β ≤ π/2. n-ten Wurzeln von w. Wenn z bzw. w die Polarkoordinaten (r, ϕ) bzw. (%, ψ) besitzen, dann muss also rn (cos(nϕ) + i sin(nϕ)) = %(cos ψ + i sin ψ) √ gelten. Offensichtlich lässt sich diese Gleichung durch die Wahl r = n % und ϕ = ψ/n erfüllen. Der Fundamentalsatz der Algebra sagt allerdings die Existenz von n n-ten Wurzeln voraus. Weitere Wurzeln kann man finden, indem man sich die Periodizität der Winkelfunktionen zunutze macht. Da rn (cos(nϕ) + i sin(nϕ)) = rn (cos(nϕ + 2kπ) + i sin(nϕ + 2kπ)) , für alle k ∈ ZZ, gilt, ergibt jede Wahl √ n ψ + 2kπ n mit k ∈ ZZ eine n-te Wurzel von w. Unter den entsprechenden komplexen Zahlen gibt es allerdings nur n verschiedene, nämlich r= zk = √ n % cos ψ + 2kπ n Diese bilden ein dem Kreis mit Radius %, ϕk = + i sin √ n ψ + 2kπ n , k = 0, . . . , n − 1. % eingeschriebenes regelmäßiges n-Eck. Übungsaufgaben 4.1. Für die folgenden komplexen Zahlen gebe man Real-, Imaginärteil und Polarkoordinaten an, und man skizziere ihre Lage in der Gaußschen Zahlenebene. √ √ a)2i, b) − 2 − 2i, c)1 − i, 1 d) − 5, e) − 3 + 5i f) . i 11 4.2. Man gebe die kartesische Form folgender komplexer Zahlen an: √ b) − 3[cos(−π/2) + i sin(−π/2)] , a) 3[cos(π/6) + i sin(π/6)] , √ c) 2[cos(π/4) − i sin(π/4)] , d) cos(π) + i sin(π) . 4.3 Man berechne (1+i)4 (1−i)8 auf zwei Arten. 4.4. Man bestimme alle Lösungen der Gleichung z 5 = 64(1 + √ 3i) . 4.5. Man berechne alle Lösungen der Gleichung z 4 + i(1 + i) = 0 . 4.6. Man zeige, dass die folgende Gleichung für alle ϕ ∈ IR gilt: cos(3ϕ) = −3 cos(ϕ) + 4 cos3 (ϕ) . 5 Reelle Funktionen, Grenzwerte Eine Funktion f : A → B ist eine Vorschrift, die jedem Element x der Definitionsmenge A eindeutig ein Element y der Wertemenge B zuordnet. Man verwendet die Schreibweise y = f (x). Für relle Funktionen gilt A, B ⊂ IR. Zumeist geht man von der Abbildungsvorschrift aus, also z.B. f (x) = x2 . In diesem Fall kann man A = IR, B = [0, ∞) wählen, wobei die maximale Definitionsmenge und dann die minimale Wertemenge gewählt wurde. Beispiele: 1. f (x) = x1 , A = B = IR \ {0} = (−∞, 0) ∪ (0, ∞). 2. f (x) = tan x, A = IR \ {kπ + π/2 : k ∈ ZZ}, B = IR. Der Graph einer reellen Funktion f : A → B ist die Menge {(x, y) : x ∈ A, y = f (x)} , d.h. eine Menge von Punkten in der (x, y)-Ebene, für die der y-Wert jeweils das Bild des entsprechenden x-Wertes ist. Eine Skizze des Graphen ist zumeist eine gute Illustration der wesentlichen Eigenschaften einer Funktion. Beispiele für Funktionseigenschaften: • Eine Funktion f heißt (streng) monoton wachsend, wenn aus x1 < x2 folgt, dass f (x1 ) ≤ f (x2 ) (f (x1 ) < f (x2 )) gilt. Sie heißt (streng) monoton fallend, wenn aus x1 < x2 folgt, dass f (x1 ) ≥ f (x2 ) (f (x1 ) > f (x2 )) gilt. Bei einer monoton wachsenden Funktion geht der Graph von links nach rechts bergauf, bei einer fallenden bergab. 12 • Eine Funktion f : A → B heißt beschränkt, wenn die (minimale Werte) Menge {y = f (x) : x ∈ A} beschränkt ist. Das ist der Fall, wenn der ganze Graph zwischen zwei waagrechten Geraden liegt. • Eine Funktion f : A → B heißt gerade (bzw. ungerade), wenn für jedes x ∈ A auch −x ∈ A und f (x) = f (−x) (bzw. f (x) = −f (−x)) gilt. Der Graph einer geraden Funktion ist symmetrisch bezüglich der y-Achse, der einer ungeraden Funktion bezüglich des Ursprungs. • Eine Funktion f : IR → B heißt periodisch mit Periode p > 0, wenn f (x + p) = f (x) für alle x ∈ IR. Der Graph einer periodischen Funktion geht in sich selbst über, wenn er um die Periode nach rechts (oder links) verschoben wird. • Eine Funktion f : A → B heißt injektiv, wenn jeder y-Wert höchstens einmal als Bild vorkommt; genauer: Aus f (x1 ) = f (x2 ) folgt x1 = x2 . Das gilt, wenn der Graph von jeder waagrechten Linie höchstens einmal geschnitten wird. Ist B der minimale Wertebereich, d.h. B = {f (x) : x ∈ A}, dann existiert die Umkehrfunktion f −1 : B → A, die definiert wird durch f −1 (y) = x genau dann, wenn f (x) = y. Den Graphen von f −1 erhält man, indem man den Graphen von f an der ersten Mediane (45-Grad-Diagonale im ersten und dritten Quadranten) spiegelt. Beispiel zur Berechnung der Umkehrfunktion: y = f (x) = ⇔ x−1 x+2 ⇔ (x + 2)y = x − 1 x(y − 1) = −1 − 2y A = IR \ {−2} , ⇔ x = f −1 (y) = 1 + 2y , 1−y B = IR \ {1} . Wenn ich um 10 Uhr in Wien abfahre und um 13 Uhr im 300 km entfernten Salzburg ankomme, dann ist meine Durchschnittsgeschwindigkeit auf dieser Fahrt 300km 3h = 100 km/h. Genauere Informationen über den Fortgang meiner Fahrt könnte man dadurch angeben, dass man Durchschnittsgeschwindigkeiten für Teilzeiten berechnet. Bezeichnen wir mit s(t) die Strecke (in km), die ich nach der Zeit t (in Stunden) zurückgelegt habe (mit den Eigenschaften s(0) = 0 und s(3) = 300), dann ergibt sich für die mittlere Geschwindigkeit im Zeitraum von t bis t + h die Formel s(t + h) − s(t) . h (6) Unser Ziel ist es, zum Begriff der Momentangeschwindigkeit zum Zeitpunkt t zu gelangen, indem wir die Länge des Zeitraumes h immer kleiner wählen. Bevor wir dieses Ziel im nächsten Abschnitt realisieren, stellen wir als Vorbereitung zunächst einige mathematische Werkzeuge bereit. Der wichtigste Begriff in diesem Zusammenhang ist der des Grenzwertes: Wir sagen, dass f0 der Grenzwert (bzw. Limes) der Funktion f (x) für x gegen x0 ist, als Formel lim f (x) = f0 , x→x0 (7) wenn die Werte f (x) beliebig nahe bei f0 sind für alle x, die genügend nahe bei x0 sind. Genauer gesagt bedeutet das, dass ich bei folgendem Spiel immer gewinne: Zuerst gibt mein Gegenspieler einen (beliebig kleinen) Abstand ε von f0 vor. Dann gewinne ich das Spiel, wenn ich einen (genügend kleinen) Abstand δ von x0 angeben kann, sodass für alle x, die höchstens den Abstand δ zu x0 haben, 13 die Werte f (x) höchstens den Abstand ε von f0 haben. Noch genauer: Für jedes > 0 gibt es ein δ > 0, sodass |f (x) − f0 | ≤ ε für alle x mit |x − x0 | ≤ δ. Wenn (7) gilt und außerdem x0 ∈ A, dann liegt es nahe, f0 mit f (x0 ) zu vergleichen. Man nennt die Funktion f stetig and der Stelle x0 , wenn lim f (x) = f (x0 ) . x→x0 Zur Berechnung von Grenzwerten gibt es einige nützliche Rechenregeln. Satz 5 Sei α ∈ IR und gelte lim f (x) = f0 , lim g(x) = g0 , x→x0 x→x0 dann gilt auch lim (f (x) ± g(x)) = f0 ± g0 , lim (αf (x)) = αf0 , x→x0 x→x0 lim (f (x)g(x)) = f0 g0 , lim x→x0 x→x0 f0 f (x) = , g(x) g0 wobei man für die Gültigkeit der letzten Regel natürlich die zusätzliche Annahme g0 6= 0 braucht. Beispiele: • 32 − 2 7 x2 − 2 = = , x→3 x + 5 3+5 8 lim Insbesondere ist die Funktion f (x) = x2 −2 x+5 stetig an der Stelle x = 3. • Ohne Beweis: Für a > 0 ist durch f (x) = ax eine auf IR stetige Funktion, die Exponentialfunktion mit Basis a gegeben. Für diese gelten die Rechenregeln ax+y = ax ay und axy = (ax )y . Satz 6 Sei f (x) ≤ g(x) ≤ h(x) und limx→x0 f (x) = limx→x0 h(x) = f0 . Dann gilt auch limx→x0 g(x) = f0 . Man kann in der Definition des Grenzwertes x0 und/oder f0 durch ∞ (bzw. −∞) ersetzen, indem man beliebig (genügend) nahe bei ∞ durch beliebig (genügend) groß ersetzt. Als Beispiel: Es gilt lim f (x) = f0 , x→∞ wenn es für alle (beliebig kleinen) ε > 0 ein (genügend großes) M ∈ IR gibt, sodass |f (x) − f0 | ≤ ε für alle x ≥ M . Die obigen Rechenregeln gelten dann auch, wobei man für α > 0 folgende Regeln verwendet: α ± ∞ = ±∞ , α∞ = ∞, α = 0, ∞ 14 α = ∞, 0 ∞ + ∞ = ∞. Figure 4: Vergleich zwischen Dreiecks- und Kreissegmentflächen Beispiele: 1) 2) 3) 1 = 0 , lim xn = ∞ für alle n ∈ IIN , x→∞ xn 2 x + 2x + 3 1 + 2/x + 3/x2 1 lim = lim = , x→∞ 2x2 − x + 5 x→∞ 2 − 1/x + 5/x2 2 2 3 x + 1/x x +1 = lim = ∞. lim x→∞ 1 + 1/x x→∞ x2 + x lim x→∞ Schwierigkeiten entstehen, wenn die Anwendung der Rechenregeln auf unbestimmte Ausdrücke führt wie z.B. 0 , 0 ∞ , ∞ 0∞, ∞ − ∞, denen kein sinnvoller Wert zugewiesen werden kann, weil verschiedene Beispiele verschiedene Grenzwerte erzeugen. Eine Möglichkeit, mit unbestimmten Ausdrücken umzugehen, wurde in den obigen Beispielen 2) und 3) verwendet, die auch zeigen, dass ∞/∞ keinen eindeutigen Wert haben kann. Noch drei Beispiele für den Umgang mit unbestimmten Ausdrücken (in diesem Fall 0/0): • lim √ x→ x4 − 4 (x2 − 2)(x2 + 2) 2 = lim = lim √ √ (x + 2) = 4 . 2 x2 − 2 2x −2 x→ 2 x→ 2 • Wir wollen den Grenzwert limx→0 sinx x berechnen. Dazu vergleichen wir zunächst in Fig. 4 die Flächeninhalte A1 des rechtwinkeligen Dreiecks mit den Kathetenlängen sin x und cos x, A2 des Kreissegments mit Öffnungswinkel x und A3 des großen rechtwinkeligen Dreieecks mit Kathetenlängen 1 und tan x. Offensichtlich gilt A1 < A2 < A3 , A1 = 15 sin x cos x , 2 A3 = tan x . 2 Um A2 zu berechnen, verwenden wir, dass der Flächeninhalt des Einheitskreises gleich π ist (was wir allerdings nicht bewiesen haben) und dass das Verhältnis von A2 zum Flächeninhalt des Einheitskreises dasselbe ist wie das Verhältnis des Winkels x zu 2π: A2 /π = x/(2π) und daher A2 = x/2. Verwendet man das in den obigen Ungleichungen und formt sie etwas um, dann erhält man sin x 1 cos x < < . x cos x Aus cos 0 = 1 und Satz 6 folgt schließlich sin x lim = 1. (8) x→0 x • Für |x| ≤ π/2 gilt cos x ≥ 0 und daher 1 − cos x (1 − cos x)(1 + cos x) 1 − cos2 x sin x ≤ = = sin x . x x x x Aus dem obigen Resultat, sin 0 = 0 und wieder Satz 6 folgt cos x − 1 = 0. lim x→0 x 0≤ (9) Übungsaufgaben 5.1. Für folgende Funktionen gebe man den maximalen Definitionsbereich (in IR) an und klassifiziere sie bezüglich Beschränktheit und der Begriffe ’gerade’ und ’ungerade’. √ x−2 a) f (x) = , b) f (x) = x3 − 5x , x+1 1 , d) f (x) = x2 + x − 6 . c) f (x) = 2 (x + 7)3 5.2. Man bestimme, welche der folgenden Funktionen periodisch sind, und man gebe gegebenenfalls die kleinste Periode an. 1+x 3 a) , b) . 2 cos(x) − 5 sin (x) − 1 5.3. Man ermittle den maximalen Definitionsbereich folgender Funktionen. Man bestimme weiters, welche dieser Funktionen eine Umkehrfunktion besitzen und man gebe sie gegebenenfalls an. s a) 3−x , x−5 b) exp(−x + 2) , c) 3 . cos(x) − 5 5.4. Man berechne x+9 , x→3 x2 − 9 a) lim x−5 , x→5 x2 − 3x − 10 b) lim x2 + 3x − 4 . x→∞ 5x2 + 32x + 2 c) lim 5.5. Wo sind folgende Funktionen stetig? Wo sind Lücken im Definitionsbereich? a) f (x) = x2 + ( √ c) f (x) = x−1 , x+1 x−2 x−4 1/4 16 b) f (x) = x2 − 9 , x(x − 3) für x 6= 4 , x ≥ 0 , für x = 4 . 6 Differentialrechnung, die Exponentialfunktion Um zu unserer Motivation zurückzukehren: Unser Ziel ist es, in (6) den Limes für h → 0 zu berechnen. Leider führt auch das, wenn s and der Stelle t stetig ist, auf einen unbestimmten Ausdruck, nämlich 0/0, und wir können im Allgemeinen nicht garantieren, dass es den Grenzwert gibt. Definition 1 Sei f : (a, b) → IR und x ∈ (a, b). Man sagt, f ist differenzierbar an x, wenn der Grenzwert f (x + h) − f (x) f 0 (x) = lim h→0 h existiert. Er heißt Ableitung von f and der Stelle x, und es wird auch die Schreibweise f 0 (x) = df dx (x) verwendet. Dementsprechend spricht man auch von einem Differentialquotienten (im Verf (x+h)−f (x) gleich mit dem Differenzenquotienten ∆f ∆x = (x+h)−x ). Wir haben die Ableitung mit der Idee der Momentangeschwindigkeit motiviert. Sie hat aber auch eine geometrische Bedeutung als Tangentenanstieg: Definition 2 Sei f an x0 differenzierbar. Dann nennen wir die Gerade in der x-y-Ebene mit der Gleichung y = f (x0 ) + f 0 (x0 )(x − x0 ) die Tangente and den Graphen von f im Punkt (x0 , f (x0 )). Beispiele: • f (x) = x2 : f (x + h) − f (x) (x + h)2 − x2 x2 + 2xh + h2 − x2 = = = 2x + h . h h h Daher gilt f 0 (x) = 2x. Die Tangente an x0 = 1 hat die Gleichung y = 1 + 2(x − 1) = 2x − 1. √ • f (x) = x: √ √ √ √ √ √ x+h− x ( x + h − x)( x + h + x) 1 √ = =√ √ √ . h h( x + h + x) x+h+ x Daher gilt f 0 (x) = 1 √ . 2 x • f (x) = 1/x: 1 h 1 1 − x+h x = −1 . x(x + h) Daher gilt f 0 (x) = −1/x2 . • f (x) = sin x: Wir verwenden die Summensätze (Satz 4): sin(x + h) − sin x cos h − 1 sin h = sin x + cos x . h h h Aus unseren früheren Resultaten (8) und (9) folgt (sin x)0 = cos x. Analog zeigt man (cos x)0 = − sin x. 17 Satz 7 Seien f und g differenzierbar an der Stelle x. Dann gilt (f (x) ±g(x))0 = f 0 (x) ± g 0 (x), die Produktregel (f (x)g(x))0 = f 0 (x)g(x)+f (x)g 0 (x) und die Quotientenregel wobei für letztere natürlich g(x) 6= 0 verlangt werden muss. f (x) 0 g(x) = f 0 (x)g(x)−f (x)g 0 (x) , g(x)2 Beweis: a) (f (x + h) ± g(x + h)) − (f (x) ± g(x)) f (x + h) − f (x) g(x + h) − g(x) = ± . h h h b) Produktregel: f (x + h)g(x + h) − f (x)g(x) f (x + h) − f (x) g(x + h) − g(x) = g(x + h) + f (x) . h h h c) Quotientenregel: f (x + h) f (x) f (x + h)g(x) − f (x)g(x + h) − = g(x + h) g(x) hg(x)g(x + h) 1 f (x + h) − f (x) g(x + h) − g(x) = g(x) − f (x) . g(x)g(x + h) h h 1 h Beispiele: • Sei fn (x) = xn . Behauptung: fn0 (x) = nxn−1 für alle n ∈ IIN. Beweis: Vollständige Induktion: n = 1: (x+h)−x = 1 = 1x0 . h 0 n−1 Nehmen wir nun an, es stimmt, dass fn (x) = nx für ein bestimmtes n. Dann gilt fn+1 (x) = xfn (x) und daher wegen der Produktregel 0 fn+1 (x) = fn (x) + xfn0 (x) = xn + x nxn−1 = (n + 1)xn . • (tan x)0 = sin x cos x 0 = cos x cos x − sin x(− sin x) 1 = . cos2 x cos2 x Satz 8 (Kettenregel) Sei g differenzierbar an x und f differenzierbar an g(x), dann gilt f (g(x))0 = f 0 (g(x))g 0 (x). Beweis: f (g(x + h)) − f (g(x)) f (g(x) + k) − f (g(x)) g(x + h) − g(x) = . h k h mit g(x + h) − g(x) = k. Die Beobachtung, dass für h → 0 auch k → 0, vervollständigt den Beweis. Beispiel: f (x) = x−n = (1/x)n . Daher f 0 (x) = n n−1 1 x −1 = −nx−n−1 . x2 Geometrische Überlegungen legen nahe, dass Funktionsgraphen zu Sekanten parallele Tangenten besitzen: 18 Satz 9 (Mittelwertsatz der Differentialrechnung, ohne Beweis) Sei f : [a, b] → IR stetig und auf (a, b) stetig differenzierbar, d.h differenzierbar für alle x ∈ (a, b) und f 0 (x) ist eine in (a, b) stetige Funktion. Dann gibt es ein x0 ∈ (a, b), sodass f 0 (x0 ) = f (a) − f (b) . a−b Das Vorzeichen der Ableitung sagt etwas über Monotonie aus: Satz 10 Sei f : (a, b) → IR stetig differenzierbar, und es gelte f 0 (x) > 0 (bzw. f 0 (x) < 0) für alle x ∈ (a, b). Dann ist f streng monoton wachsend (bzw. fallend) und daher injektiv. Ersetzt man > (bzw. <) durch ≥ (bzw. ≤), dann ist f immer noch monoton, aber im allgemeinen nicht streng monoton und daher auch nicht unbedingt injektiv. Beweis: Sei f 0 > 0 und a < c < d < b. Dann gilt wegen des Mittelwertsatzes f (d) = f (c) + f 0 (x0 )(d − c) > f (c). Andere Fälle analog. Dieses Resultat hat eine einfache Konsequenz: Satz 11 Sei f : (a, b) → IR stetig differenzierbar, und es gelte f 0 (x) = 0 für alle x ∈ (a, b). Dann ist f konstant, d.h. es existiert f0 ∈ IR, sodass f (x) = f0 für alle x ∈ (a, b). Satz 12 (Ableitung der Umkehrfunktion) Sei f : (a, b) → IR stetig differenzierbar, und es gelte f 0 (x) 6= 0, x ∈ (a, b). Dann ist f −1 differenzierbar, und es gilt f −1 (y)0 = 1 für alle y = f (x), x ∈ (a, b) . f 0 (f −1 (y)) Beweis: Differenziert man f (f −1 (y)) = y nach y (Kettenregel), dann erhält man das Resultat. Beispiele: • f (x) = xn , f −1 (y) = y 1/n , für x, y > 0, n ∈ IIN. f −1 (y)0 = 1 n(y 1/n )n−1 = 1 1/n−1 y . n • f (x) = xp/q = (xp )1/q , x > 0, p ∈ ZZ, q ∈ IIN. 1 p f 0 (x) = (xp )1/q−1 pxp−1 = xp/q−1 . q q • Ohne Beweis: Es gilt auch (xα )0 = αxα−1 für x > 0, α ∈ IR. • (arctan x)0 = cos2 (arctan x) = cos2 (arctan x) 1 = . 2 1 + x2 sin (arctan x) + cos2 (arctan x) 19 Nun beschäftigen wir uns mit der Exponentialfunktion f (x) = ax , a > 0. Es gilt ax+h − ax ah − 1 x = a . h h Da (ohne Beweis) der Grenzwert ca = limh→0 (ah − 1)/h existiert, ist ax an jeder Stelle x ∈ IR differenzierbar, und die Ableitung ist gegeben durch (ax )0 = ca ax . Für a ≤ b gilt (ah − 1)/h ≤ (bh − 1)/h und daher ca ≤ cb . Unter Berücksichtigung dieser Tatsache legen Experimente mit dem Taschenrechner nahe, dass es eine Zahl e ∈ (2, 3) gibt, sodass ce = 1. Das ist auch wirklich der Fall, und diese (irrationale) Zahl wird Eulersche Zahl genannt. Die Exponentialfunktion mit Basis e (oder einfach die Exponentialfunktion) ist ihre eigene Ableitung: (ex )0 = ex . Sie wird oft auch als exp(x) := ex geschrieben. Für kleine reelle Zahlen h erwarten wir eh − 1 ≈1 h ⇐⇒ e ≈ (1 + h)1/h , und tatsächlich gilt e = lim (1 + h)1/h . h→0 (ex )0 ex Da = > 0, existiert eine Umkehrfunktion der Exponentialfunktion, genannt der (natürliche) Logarithmus ln x, x > 0, d.h. exp(ln x) = x (ln steht für logarithmus naturalis). Differenzieren gibt exp(ln x)(ln x)0 = 1 und daher 1 (ln x)0 = , x > 0. x Mit Hilfe des Logarithmus können wir die Ableitung der Exponentialfunktion mit Basis a > 0 bestimmen: Mit λ = ln a folgt ax = eλx und daher mit der Kettenregel (ax )0 = (eλx )0 = λeλx = (ln a)ax , also ca = ln a . Aus den Rechenregeln für die Exponentialfunktion folgt für den Logarithmus (x, y > 0) ln(xy) = ln x + ln y , ln(xy ) = y ln x . Noch ein kleiner Ausflug zurück zu den komplexen Zahlen und Polarkoordinaten: Für den Ausdruck f (ϕ) = cos ϕ + i sin ϕ gilt f 0 (ϕ) = − sin ϕ + i cos ϕ = if (ϕ) , weswegen sich die Schreibweise eiϕ := cos ϕ + i sin ϕ anbietet. Damit kann die Exponentialfunktion auch auf komplexe Zahlen angewendet werden: ex+iy = ex (cos y + i sin y), und die Polardarstellung einer komplexen Zahl erhält die Form z = reiϕ (Man merke das einfache Multiplizieren: (reiϕ )(%eiψ ) = r% ei(ϕ+ψ) ). Damit können wir auch eine Lieblingsgleichung vieler MathematikerInnen angeben: eiπ + 1 = 0 20 die die wichtigsten Konstanten der Mathematik (0, 1, e, π und i) enthält. Ein weiterer Ausflug zurück zu unbestimmten Ausdrücken: Angenommen, f, g sind differenzierbar an x0 , f (x0 ) = g(x0 ) = 0 und g 0 (x0 ) 6= 0. Dann gilt lim x→x0 f (x) (f (x) − f (x0 )/(x − x0 ) f 0 (x0 ) = lim . = 0 g(x) x→x0 (g(x) − g(x0 )/(x − x0 ) g (x0 ) Allgemeiner gilt: Satz 13 (Regel von de l’Hopital, ohne Beweis) Seien f und g differenzierbar an x0 , f (x0 ) = g(x0 ) = 0 und es existiere der Grenzwert limx→x0 f 0 (x)/g 0 (x). Dann gilt lim x→x0 f (x) f 0 (x) = lim 0 . g(x) x→x0 g (x) Beispiele: 1. lim √ x→ 2. lim x→0 x4 − 4 4x3 2 = lim = lim √ √ 2x = 4 . 2 2x −2 x→ 2 2x x→ 2 sin x = lim cos x = 1 , x→0 x lim x→0 cos x − 1 = lim (− sin x) = 0 . x→0 x 3. In manchen Fällen muss man die Regel mehrmals anwenden: 3x2 − 4x + 1 6x − 4 x3 − 2x2 + x = lim = lim = 1. 2 x→1 x→1 x→1 x − 2x + 1 2x − 2 2 lim Ist eine Funktion f auf einem Intervall (a, b) differenzierbar, dann ist f 0 ebenfalls eine auf (a, b) definierte Funktion, und man kann die Frage nach deren Differenzierbarkeit stellen. Definition 3 Sei f : (a, b) → IR. Dann sind höhere Ableitungen von f rekursiv definiert durch f (0) (x) := f (x) , f (n+1) (x) := (f (n) (x))0 , n ≥ 0, solange die rechte Seite existiert. Existiert die n-te Ableitung f (n) (x) für alle x ∈ (a, b), dann sagt man, f ist in (a, b) n-mal differenzierbar. Ist f (n) stetig in (a, b), dann sagt man, f ist in (a, b) n n-mal stetig differenzierbar. Es werden auch die Schreibweisen f (n) = ddxnf , f (2) = f 00 , f (3) = f 000 verwendet. So wie die erste Ableitung etwas über geometrische Eigenschaften des Funktionsgraphen aussagt (Anstieg der Tangente), ist das auch für höhere Ableitungen der Fall. Ist zum Beispiel die zweite Ableitung in einem Intervall größer Null, dann wird der Tangentenanstieg von links nach rechts größer. Definition 4 Sei f in (a, b) zweimal stetig differenzierbar und f 00 ≥ 0 (bzw. f 00 > 0, f 00 ≤ 0, f 00 < 0) in (a, b), dann nennt man f konvex (bzw. streng konvex, konkav, streng konkav) in (a, b). 21 Diese Bezeichnungen sollten verständlich sein, wenn man den Graphen ’von unten’, d.h. in die positive y-Richtung, anschaut. Will man den Graphen skizzieren, dann ist es hilfreich, Punkte zu kennen, an denen das Vorzeichen von f , die Monotonie, oder die Konvexität wechselt. Kandidaten dafür sind Stellen, an denen f , f 0 , bzw. f 00 Null wird. Das muss aber nicht der Fall sein, wie die folgenden Beispiele zeigen: • Für f (x) = x2 gilt f (0) = 0. Trotzdem ändert f an der Stelle Null nicht das Vorzeichen. • Für f (x) = x3 gilt f 0 (0) = 0. Trotzdem ändert f an der Stelle Null nicht die Monotonie. • Für f (x) = x4 gilt f 00 (0) = 0. Trotzdem ändert f an der Stelle Null nicht die Konvexität. Man beachte, dass in allen 3 Fällen die ’nächste’ Ableitung nach der untersuchten an der Stelle x = 0 auch Null ist. Satz 14 (ohne Beweis) Sei f stetig differenzierbar in (a, b), f (0) = 0 und f 0 (0) > 0 (bzw. f 0 (0) < 0). Dann ist f nahe bei x = 0 für x < 0 negativ (bzw. positiv) und für x > 0 positiv (bzw. negativ). Definition 5 Sei f : (a, b) → IR stetig. a) Eine Stelle x0 ∈ (a, b) mit f (x0 ) = 0 nennt man eine Nullstelle von f . b) Eine Stelle x0 ∈ (a, b), für die es ein offenes Intervall I ⊂ (a, b) gibt mit x0 ∈ I, sodass f (x) ≤ f (x0 ) für alle x ∈ I, nennt man ein relatives Maximum von f . c) Eine Stelle x0 ∈ (a, b), für die es ein offenes Intervall I ⊂ (a, b) gibt mit x0 ∈ I, sodass f (x) ≥ f (x0 ) für alle x ∈ I, nennt man ein relatives Minimum von f . d) Eine Stelle x0 ∈ (a, b), die entweder ein relatives Maximum oder ein relatives Minimum ist, nennt man ein relatives Extremum. e) Eine Stelle x0 ∈ (a, b), an der das Verhalten von f von streng konvex auf streng konkav (oder umgekehrt) wechselt, nennt man einen Wendepunkt von f . Das folgende Resultat ist eine Konsequenz aus Satz 14. Satz 15 Sei f in (a, b) dreimal stetig differenzierbar. Dann gilt a) An einer Nullstelle von f , an der die erste Ableitung nicht Null ist, ändert f das Vorzeichen. b) Eine Stelle x0 ∈ (a, b), für die f 0 (x0 ) = 0 und f 00 (x0 ) < 0 (bzw. f 00 (x0 ) > 0) gilt, ist ein relatives Maximum (bzw. Minimum) von f . c) Eine Stelle x0 ∈ (a, b), für die f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0 gilt, ist ein Wendepunkt von f . Die Aufgabe, mit Hilfe der oben definierten speziellen Punkte den Graphen einer Funktion zu skizzieren, nennt man Kurvendiskussion. Beispiel: f (x) = x3 − 3x2 + 2x = x(x − 1)(x − 2). Wir berechnen zunächst √ √ f 0 (x) = 3x2 − 6x + 2 = 3(x − 1 − 1/ 3)(x − 1 + 1/ 3) , f 00 (x) = 6x − 6 = 6(x − 1) . Offensichtlich gibt es 3 Nullstellen, x = 0, 1, 2, von denen x = 1 gleichzeitig der einzige Wendepunkt ist, an dem das Verhalten von konkav (x < 1) auf konvex (x > 1) wechselt. Der Anstieg der Wendetangente (d.h. der Tangente am Wendepunkt) ist f 0 (1) = −1. Es gibt 2 relative Extrema 22 √ √ an x = 1 − 1/ 3 und an x = 1 + 1/ 3, von denen wegen des Konvexitätsverhaltens das erste ein Maximum und das zweite ein Minimum ist. Zusätzliche Information: limx→∞ f (x) = ∞, limx→−∞ f (x) = −∞. Jetzt kann der Graph leicht skizziert werden. Übungsaufgaben 6.1. Man überprüfe, ob die folgenden Funktionen stetig an x = 2 sind. Sind sie differenzierbar? ( a) f (x) = ( x2 für x ≥ 2 , 2x für x < 2 . b) f (x) = x2 für x ≥ 2 , 4(x − 1) für x < 2 . 6.2. Sei y(t) = a sin(ωt) die vertikale Auslenkung eines an einem Federpendel hängenden Massenpunktes. Man bestimme die Geschwindigkeit des Massenpunktes zu jeder Zeit t. Zu welcher Zeit steht der Massenpunkt still? 6.3. Man vereinfache folgende Ausdrücke: 2 2 a) 2 ln x − ln 4 − ln x + ln e , 3 5 c) ln + ln 10 9 b) ln x e ·5 e2 . 6.4. Man berechne die Ableitung von a) x2 + 9 , x+3 b) cos(x) , x2 c) x2 + 3x − 4 . ex 6.5. Man berechne die Ableitung von a) ax 2 +4x , b) e4x 2 −√x x2 , c) e 3x+1 . 6.6. Man berechne die Ableitung von a) tan(x2 + 2x) , b) sin2 (3x) , c) sin(2) . cos(2x) 6.7. Man berechne die Grenzwerte a) lim x→∞ ln(x) , x b) lim x→∞ exp(−x) . ln(1 + x1 ) 6.8. Man berechne die Grenzwerte a) lim x→∞ exp(x) , x2 + 3x b) lim x→0 23 sin(x) . exp(x) − 1 − ln 5 , 6.9. Sei f (x) = x2 . Man finde alle ξ, für die f (3) − f (−1) = f 0 (ξ) 4 gilt, und fertige eine Skizze an. 6.10. Man bestimme die lineare Approximation der Funktion f (x) = exp(x) in der Nähe von x = 0. 6.11. Sei f (x) = x2 sin(x). Man berechne die vierte Ableitung f (4) (x). 6.12. Mit Hilfe von Nullstellen, Extrempunkten und Wendepunkten skizziere man den Graphen von f (x) = xx−1 2 +1 . 7 Integration Motivation – Umfang und Flächeninhalt des Kreises Als Einstimmung berechnen wir den Umfang und den Flächeninhalt des Kreises. Genau genommen werden wir aber erst definieren, was diese beiden Dinge überhaupt sind. Die Idee besteht darin, die Begriffe Länge bzw. Flächeninhalt von der Strecke bzw. vom Rechteck auf gekrümmte Objekte zu übertragen. Wir beginnen damit, einem Kreis mit Radius r ein gleichseitiges N -Eck einzuschreiben, indem wir, ausgehend von einem beliebigen Radius, N Radien einzeichnen, die paarweise jeweils den Winkel 2π/N miteinander einschließen. Wenn man N groß wählt, kann man das N -Eck als eine Approximation für den Kreis sehen und daher auch seinen Umfang UN und seinen Flächeninhalt FN als Approximation für das, was wir uns unter Umfang und Flächeninhalt des Kreises vorstellen. Das motiviert die Definitionen: Wenn der Grenzwert limN →∞ UN existiert, dann nennen wir ihn den Umfang des Kreises. Wenn der Grenzwert limN →∞ FN existiert, dann nennen wir ihn den Flächeninhalt des Kreises. Aus der Definition der Winkelfunktionen folgt, dass eine Seite des N -Ecks die Länge 2r sin(π/N ) besitzt. Daraus folgt UN = 2rN sin(π/N ) = 2rπ sin(π/N ) → 2rπ π/N für π/N → 0 . Damit haben wir gezeigt, dass der Kreis gemäß unserer Definition einen Umfang besitzt und dass dieser gleich 2rπ ist. Wieder mit Hilfe der Definition der Winkelfunktionen und mit dem Summensatz für den Sinus kann man zeigen, dass der Flächeninhalt eines der N Dreiecke, die das N -Eck bilden, gleich 2 r sin(π/N )r cos(π/N ) = r2 sin(2π/N ) ist. Daher FN = r2 N sin(2π/N ) sin(2π/N ) = r2 π → r2 π 2 2π/N für 2π/N → 0 . Der Kreis besitzt also auch einen Flächeninhalt, und der ist gleich r2 π. 24 Figure 5: Riemannsumme: Flächen unterhalb der x-Achse werden negativ gerechnet. Das Riemann-Integral – grundlegende Eigenschaften Stellen wir uns nun die verwandte Aufgabe zu definieren, was der Flächeninhalt einer Fläche ist, die vom Graphen einer Funktion f (x), der x-Achse und von den vertikalen Geraden x = a und x = b eingeschlossen wird. Eine mögliche Vorgangsweise besteht darin, das Intervall [a, b] in N gleich lange Teilintervalle der Länge ∆x = b−a N zu teilen, indem man die Teilungspunkte x0 = a, x1 = a + ∆x, x2 = a + 2∆x, . . . , xN = a + N ∆x = b einführt und den gesuchten Flächeninhalt durch die Summe der Flächeninhalte von N Rechtecken approximiert, wobei das i-te Rechteck eine Seite ∆x besitzt und die andere gleich f (ti ) mit xi−1 ≤ ti ≤ xi ist. Das ergibt für den Flächeninhalt die Approximation (Fig. 5) FN = N X f (ti )∆x . i=1 Definition 6 Wenn in der oben beschriebenen Situation der Grenzwert limN →∞ FN existiert und unabhängig von der Auswahl der Punkte ti ist, dann heißt er das (Riemann)Integral der Funktion f über das Intervall [a, b] und wird bezeichnet mit Z b f (x)dx . a Man sagt dann: f ist (Riemann-)integrierbar über [a, b]. Bemerkung 2 1) Die Approximation FN wird eine Riemannsumme genannt. Die Einführung des Integrals als Grenzwert von Riemannsummen ist nur eine von mehreren Möglichkeiten; deswegen R die genauere Bezeichnung Riemann-Integral. Das Integralzeichen ist ein stilisiertes ’S’, das an die Definition mit Hilfe einer Summe erinnern soll. Das Symbol dx erinnert dabei an die x-Differenz 25 Figure 6: Mittelwertsatz der Integralrechnung ∆x = xi − xi−1 . 2) Die Funktion f kann auch negative Werte annehmen. Das Integral ist dann so zu verstehen, dass Flächen zwischen dem Graphen und der x-Achse, die unter der x-Achse liegen, als negativer Beitrag gerechnet werden. Das Integral hat Eigenschaften, die man erwarten kann: Kann man den Graphen zwischen zwei horizontalen Linien einschließen, dann liegt der Wert des Integrals zwischen den Flächeninhalten der entsprechenden Rechtecke; durch eine vertikale Gerade kann die Fläche in zwei Teile geteilt werden. Satz 16 Sei f integrierbar über [a, b]. 1) Aus m ≤ f (x) ≤ M für alle x ∈ [a, b] folgt m(b − a) ≤ Z b f (x)dx ≤ M (b − a) . a 2) Für c ∈ (a, b) gilt Z b Z c f (x)dx + f (x)dx = a Z b a f (x)dx . c Das Integral ist gleich dem Flächeninhalt eines geeignet gewählten Rechtecks. Das entsprechende Resultat heißt Mittelwertsatz der Integralrechnung (siehe Fig. 6): Satz 17 Sei f stetig auf [a, b]. Dann ist f integrierbar über [a, b], und es existiert ein ξ ∈ [a, b], sodass Z b f (x)dx = f (ξ)(b − a) . a 26 Der Hauptsatz der Differential- und Integralrechnung Erinnern wir uns an die Fahrt von Wien nach Salzburg, wo wir die nach der Zeit t zurückgelegte Strecke mit s(t) bezeichnet haben. Bezeichnen wir den Zeitpunkt der Ankunft mit T und unterteilen wir das Zeitintervall [0, T ] in N gleiche Teile, d.h. ti = i∆t, i = 0, . . . , N , mit ∆t = T /N , dann gilt s(T ) − s(0) = N X (s(ti ) − s(ti−1 )) , i=1 womit wir die Gesamtstrecke in Teilstücke zerlegt haben. Mit der Momentangeschwindigkeit v(t) = s0 (t) folgt aus dem Mittelwertsatz der Differentialrechnung s(T ) − s(0) = N X v t̃i ∆t , i=1 mit geeignet gewählten t̃i ∈ [ti−1 , ti ]. Der Ausdruck auf der rechten Seite ist eine Riemannsumme. Mit N → ∞ folgt daher Z T s(T ) − s(0) = v(t)dt . 0 Wir können also aus der Momentangeschwindigkeit die zurückgelegte Strecke berechnen. Wir haben gerade (im wesentlichen) den Hauptsatz der Differential- und Integralrechnung bewiesen: Satz 18 Sei F stetig differenzierbar auf dem Intervall [a, b]. Dann gilt Z b b F 0 (x)dx . F (x) := F (b) − F (a) = a a Beispiele: 1. Z π 0 2. Z 2π 0 3. Z 1 −2 |x|dx = π sin x dx = − cos x = 2 , 0 2π sin x dx = − cos x Z 0 Z 1 (−x)dx + −2 0 0 = 0. x2 0 x2 1 5 x dx = − + = . 2 −2 2 0 2 Ersetzen wir den festen Wert b durch ein variables x ∈ [a, b], dann sieht man, dass die Funktion F aus einem Anfangswert F (a) und aus ihrer Ableitung berechnet werden kann: Z x F (x) = F (a) + F 0 (y)dy . a Man kann daher die Integration als Umkehroperation zur Differentiation sehen. Die Reihenfolge kann dabei auch umgedreht werden: Sei f stetig in [a, b]. Definiert man Z x F (x) := f (y)dy , a 27 dann gilt für h > 0 F (x + h) − F (x) 1 = h h Z x+h f (y)dy = f (ξh ) , x wobei die erste Gleichung aus Satz 16, 2) folgt und die zweite (mit x ≤ ξh ≤ x + h) aus dem Mittelwertsatz der Integralrechnung. Für h → 0 gilt ξh → x und daher wegen der Stetigkeit von f auch f (ξh ) → f (x), woraus F 0 (x) = f (x) folgt, d.h. d dx Z x f (y)dy = f (x) . a Stammfunktionen – Integrationsmethoden Definition 7 Seien f, F : (a, b) → IR und F 0 (x) = f (x) für alle x ∈ (a, b). Dann heißt F eine Stammfunktion von f . Die obigen Resultate zeigen, dass man mit Hilfe von Stammfunktionen Integrale berechnen kann. Es stellt sich die Frage, wie die Menge der Stammfunktionen einer Funktion aussieht. Satz 19 Seien F und G Stammfunktionen von f . Dann existiert eine Konstante c ∈ IR, sodass F (x) = G(x) + c in (a, b). Mit anderen Worten: Kennt man eine Stammfunktion, dann erhält man alle anderen Stammfunktionen durch Addition von Konstanten. Beweis: Für die Funktion H(x) := F (x) − G(x) gilt H 0 (x) = F 0 (x) − G0 (x) = f (x) − f (x) = 0 und daher ist H wegen Satz 11 konstant. R Man schreibt manchmal f (x)dx als Abkürzung für die Gesamtheit aller Stammfunktionen von R f , und nennt diesen Ausdruck das unbestimmte Integral (also z.B. 2x dx = x2 + c) im Gegensatz Rb zum bestimmten Integral a f (x)dx. Aufgrund der im vorigen Kapitel berechneten Ableitungen lassen sich für manche Funktionen leicht Stammfunktionen bestimmen. Beispiele: f (x) xα 1/x sin x cos x ax (1 + x2 )−1 F (x) xα+1 α+1 ln(x) − cos x sin x x a / ln a arctan x für x > 0, α 6= −1 für x > 0 für a > 0, a 6= 1 Das Finden von Stammfunktionen, soweit diese überhaupt mit Hilfe von Standardfunktionen angeschrieben werden können, ist eine zwar trickreiche, aber trotzdem automatisierbare Aufgabe (siehe z.B. http://integrals.wolfram.com/index.jsp). Drei der dabei verwendeten Tricks sollen hier vorgestellt werden. Der erste heißt partielle Integration und beruht darauf, die Produktregel für Ableitungen zu verwenden: Aus (f g)0 = f 0 g + f g 0 folgt Z f 0 (x)g(x)dx = f (x)g(x) − 28 Z f (x)g 0 (x)dx , bzw. für bestimmte Integrale Z b a b Z b a a f 0 (x)g(x)dx = f (x)g(x) − f (x)g 0 (x)dx . Das ist dann brauchbar, wenn das Integral auf der rechten Seite leichter zu berechnen ist, als das auf der linken. Beispiele: 1. Z 2. 3. xex dx = f 0 (x) = ex , g(x) = x = xex − Z Z ln(x)dx = f 0 (x) = 1, g(x) = ln x = x ln x − Z ex sin x dx = ex sin x − Z =⇒ Z ex dx = ex (x − 1) + c . x dx = x(ln x − 1) + c . x Z ex cos x dx = ex sin x − ex cos x − ex sin x dx = Z ex sin x dx ex (sin x − cos x) + c . 2 Der zweite Trick heißt Substitution und beruht auf der Kettenregel, aus der offensichtlich Z f 0 (g(x))g 0 (x)dx = f (g(x)) + c folgt. Beispiele: 1. 1 2 Z 1 sin(2x)(2x)0 dx = − cos(2x) + c , 2 x cos(x2 )dx = 1 2 Z Z sin(2x)dx = mit f (y) = − cos y, g(x) = 2x. 2. Z cos(x2 )(x2 )0 dx = 1 sin(x2 ) + c , 2 mit f (y) = sin y, g(x) = x2 . 3. sin2 x + c, 2 mit f (y) = y 2 /2, g(x) = sin x. Hier funktioniert allerdings auch g(x) = cos x mit dem Resultat Z Z cos2 x + c. sin x cos x dx = − cos x(cos x)0 dx = − 2 Besteht zwischen den beiden Resultaten ein Widerspruch? Z Z sin x cos x dx = sin x(sin x)0 dx = Satz 20 (Substitution für bestimmte Integrale) Sei f integrierbar über [a, b] und g : [c, d] → [a, b] stetig differenzierbar und invertierbar (d.h. streng monoton). Dann gilt y = g(x) f (y)dy = dy = g 0 (x)dx a Z b Z −1 g (b) f (g(x))g 0 (x)dx . = g −1 (a) 29 Dabei gilt g −1 (a) = c und g −1 (b) = d, wenn g streng monoton wachsend ist, und g −1 (a) = d und g −1 (b) = c, wenn g streng monoton fallend ist. Im zweiten Fall gilt die Konvention Z c f (g(x))g 0 (x)dx = − Z d f (g(x))g 0 (x)dx . c d Beispiele: 1. y = sin x sin x cos x dx = dy = cos x dx Z π/2 0 Z 1 y2 y dy = = 2 0 1 1 = . 2 0 2. y =3−x (3 − x) dx = dy = −dx 0 Z 3 2 Z 3 Z 0 y3 y 2 dy = y 2 dy = =− 3 0 3 Kontrolle: Z 3 2 (3 − x) dx = Z 3 0 2 (9 − 6x + x )dx = 0 3 = 9. 0 ! x3 3 9x − 3x + = 9. 3 0 2 3. Stammfunktion von 1/x für x < 0: Z dx x = −y = dx = −dy x Z dy = ln(y) + c = ln(−x) + c . = y Die Resultate für positive und negative x zusammengefasst: Z dx = ln |x| + c , x x 6= 0 . 4. Für x 6= 0: Z y = ex − 1 dx = ex − 1 dy = ex dx = (y + 1)dx Z dy . = y(y + 1) Um hier weiterzukommen, brauchen wir den dritten Trick, genannt Partialbruchzerlegung, der im Prinzip bei beliebigen rationalen Funktionen, d.h. Brüchen mit Polynomen in Zähler und Nenner, funktioniert. Im allgemeinen kann seine Anwendung sehr aufwendig sein, und wir zeigen ihn nur an diesem Beispiel. Der Integrand kann in einfachere Ausdrücke zerlegt werden: 1 1+y−y 1+y y 1 1 = = − = − . y(y + 1) y(y + 1) y(y + 1) y(y + 1) y y+1 Daher gilt Z und daher dy = y(y + 1) Z Z y 1 1 + c, − dy = ln |y| − ln |y + 1| + c = ln y y+1 y + 1 ex − 1 dx −x = ln ex + c = ln |1 − e | + c , ex − 1 30 x 6= 0 . Uneigentliche Integrale Die Berechnung von Integralen als Grenzwert von Riemannsummen beruht auf den Annahmen, dass der Integrand eine beschränkte Funktion ist und dass das Integrationsintervall beschränkt ist. Beide Annahmen kann man loswerden: Definition 8 1) Sei a ∈ IR und f für jedes b > a über [a, b] integrierbar. Dann heißt der Grenzwert Z ∞ Z b f (x)dx := lim b→∞ a a f (x)dx , wenn er existiert, ein uneigentliches Integral mit unbeschränktem Integrationsintervall. Analog für (−∞, a]. 2) Sei a < b ∈ IR und für jedes c ∈ (a, b) sei f integrierbar über [a, c]. Weiters sei limc→b |f (x)| = ∞. Dann heißt der Grenzwert Z b Z c f (x)dx := lim c→b a a f (x)dx , wenn er existiert, ein uneigentliches Integral mit unbeschränktem Integranden. Analog für Unbeschränktheit bei x = a. Bei Unbeschränktheit im Inneren des Integrationsintervalles muss dieses an der Unendlichkeitsstelle geteilt werden und die beiden Teilintegrale unabhängig berechnet werden. Beispiele: 1. Z ∞ dx 2 2. x3 Z b = lim b→∞ 2 Z 1 dx √ = lim x a→0 0 3. Sei 0 < a < 1. x−3 dx = lim b→∞ Z 1 1 b 1 1 = lim − 2x2 2 b→∞ 8 2b2 − Z 1 dx a = 1 . 8 √ 1 √ x−1/2 dx = lim 2 x = lim 2(1 − a) = 2 . a a→0 a x3/2 a→0 2 1 2 = − √ = √ − 2 . x a a Der Grenzwert für a → 0 existiert offensichtlich nicht und daher auch nicht das uneigentliche R Integral 01 x−3/2 dx. 4. Wenn man genügend Erfahrung hat (so wie wir nach diesen ersten Beispielen), kann man sich die Limes-Schreibweise oft ersparen: sin x = y √ dx = cos x dx = dy sin x Z π/2 cos x 0 5. Beim uneigentlichen Integral Z ∞ 0 x2 Z 1 dy √ 1 = √ = 2 y = 2. 0 y 0 dx √ + x gibt es Schwierigkeiten sowohl bei x = 0 als auch bei x = ∞. Eine Stammfunktion ist nicht so leicht zu finden. Trotzdem kann man versuchen festzustellen, ob das Integral konvergiert. √ Für x nahe bei Null kann man wohl x2 im Vergleich zu x vernachlässigen. Der einfachere 31 √ Integrand 1/ x kann aber von x = 0 weg integriert werden, wie die vorigen Beispiele zeigen. √ Für große x dominiert x2 im Vergleich zu x. Die Stammfunktion −1/x von 1/x2 besitzt einen Limes für x → ∞. Deswegen kann man erwarten, dass das obige uneigentliche Integral existiert. Diese Argumentation kann zu einem Beweis verschärft werden. Übungsaufgaben 7.1. Man berechne Z 1 a) 3 2 (x + 8x − 1)dx , b) −1 Z 4 4x + 5 1 x dx . 7.2. Man berechne mittels partieller Integration Z a) Z cos2 (x)dx , x2 sin(x)dx . b) 7.3. Man berechne folgendes Integral mittels Partialbruchzerlegung: Z dx . x2 − 3x + 2 Hinweis: Man bestimme A und B so, dass x2 1 1 A B = = + . − 3x + 2 (x − 1)(x − 2) x−1 x−2 7.4. Man berechne mit Hilfe der Substitutionsmethode Z 2 a) p 3 (4x + 2) 2x2 + 2x − 1dx , 1 du (Hinweis: ln x = −u). 1 + eu Z b) 1 7.5. Man finde die Stammfunktionen: Z a) e 3x+4 Z dx , b) x(ln(x))2 dx . 7.6. Man berechne die Fläche zwischen dem Graphen der Funktion f (x) = x2 −2x und der x-Achse zwischen den Nullstellen. 7.7 Man berechne Z ∞ 1 x2 dx − 2x + 2 (Hinweis: x − 1 = y) . 32 8 Kleinste Fehlerquadrate Ein bisschen Wahrscheinlichkeitsrechnung Ein Nachweis von naturwissenschaftlichen Hypothesen besteht meist darin, dass diese oft genug in einem wiederholbaren Experiment beobachtet werden. Abgesehen von der Frage, was ’oft genug’ bedeutet, ist eines der praktischen Hauptprobleme die exakte Wiederholbarkeit, die (oft aus prinzipiellen Gründen) normalerweise nicht möglich ist. Insbesondere treten Abweichungen bei quantitativen Hypothesen immer aufgrund von Messfehlern auf. Könnte man die Abweichungen exakt vorhersagen, dann könnte man sie auch eliminieren. Trotzdem lassen sich bei oft mit denselben Geräten durchgeführten Experimenten systematische Beobachtungen über die Abweichungen machen. Das einfachste, wohl allen bekannte Beispiel ist der Wurf einer Münze. Ist sie fair, d.h. symmetrisch bezüglich der Kopf- und der Zahlseite, dann ist es zwar einerseits unmöglich, den Ausgang eines einzelnen Münzwurfes vorherzusagen, andererseits wird aber nach vielen Würfen ungefähr die Hälfte ’Kopf’ und die andere Hälfte ’Zahl’ ergeben. Eine idealisierte Annahme, die diese Beobachtung beschreibt, ist das Gesetz der großen Zahlen lim n→∞ kn 1 = , n 2 wobei kn die Anzahl der Ausgänge ’Kopf’ nach n Münzwürfen bezeichnet. Dabei ist es wichtig festzuhalten, dass kn keinen festen Wert hat, sondern dass bei jedem Experiment, das aus n Münzwürfen besteht, der Wert anders sein kann. Sicher ist nur kn ∈ {0, . . . , n}. Daher ist die obige Grenzwertaussage auch mit gewisser mathematischer Vorsicht zu genießen. Ein Grundprinzip der Wahrscheinlichkeitsrechnung besteht nun darin, die obige Beobachtung als Aussage über den Ausgang eines einzelnen Münzwurfes zu formulieren: Bei einem Münzwurf ist die Wahrscheinlichkeit von ’Kopf ’ gleich 1/2. Definition 9 Ein Wahrscheinlichkeitsraum besteht aus einer Menge M (von Elementarereignissen) und einer Funktion W , die jeder Teilmenge A von M (jedem Ereignis) ihre (seine) Wahrscheinlichkeit W (A) ∈ [0, 1] zuordnet. Dabei muss die Wahrscheinlichkeit 2 Eigenschaften haben. Zum einen muss W (M ) = 1 gelten (’irgendetwas passiert sicher’), zum anderen W (A ∪ B) = W (A) + W (B), wenn A ∩ B = { }. Beispiele: 1) Den Münzwurf kann man als Wahrscheinlichkeitsraum beschreiben durch M = {k, z} mit W ({k}) = W ({z}) = 1/2. Das ist ein Beispiel für einen endlichen Wahrscheinlichkeitsraum, d.h. dass M eine Menge mit endlich vielen Elementen ist. Ein solcher kann immer durch Angabe der Wahrscheinlichkeiten der Elementarereignisse bestimmt werden. 2) Der Wurf eines fairen Würfels kann beschrieben werden durch M = {1, 2, 3, 4, 5, 6} und W ({j}) = 1/6, j = 1, . . . , 6. Die Wahrscheinlichkeit, eine gerade Zahl zu würfeln, ist dann W ({2, 4, 6}) = W ({2}) + W ({4}) + W ({6}) = 1 1 1 1 + + = . 6 6 6 2 3) Ein einfaches Beispiel für einen unendlichen Wahrscheinlichkeitsraum ist die Gleichverteilung auf einem Intervall M = [a, b], definiert durch W ([c, d]) = d−c = b−a Z d c dt , b−a 33 für a ≤ c ≤ d ≤ b . 4) Eines der wichtigsten Beispiele ist die Gaußverteilung (mit Mittel 0 und Varianz 1, was weiter unten erklärt wird) mit M = IR und 1 W ([c, d]) = √ 2π Z d 2 /2 e−t dt . c 2 Die Funktion f (t) = (2π)−1/2 e−t /2 (Gaußsche Glockenkurve) nennt man die Dichtefunktion. Die Konstante (2π)−1/2 ist so gewählt, dass Z ∞ f (t)dt = 1 W (IR) = −∞ gilt (was nicht so leicht nachzurechnen ist). Vergleich mit dem letzten Beispiel zeigt, dass die Dichtefunktion für die Gleichverteilung durch die konstante Funktion f (t) = (b − a)−1 gegeben ist (wobei sich der konstante Wert wieder aus der Forderung W (M ) = 1 ergibt). Während bei der Gleichverteilung die Wahrscheinlichkeit eines Intervalles nur von seiner Länge abhängt, ist bei der Gaußverteilung ein Intervall wahrscheinlicher als ein gleichlanges, dessen Mittelpunkt weiter von t = 0 entfernt liegt. Angenommen, ich spiele ein Würfelspiel mit folgenden Regeln: Für einmal Würfeln muss ich 1 Euro bezahlen. Würfle ich 5, dann bekomme ich 2 Euro Gewinn ausgezahlt, würfle ich 6, sind es 5 Euro Gewinn. Bei 1–4 Augen gibt es keinen Gewinn. Es stellt sich die Frage, was passiert, wenn ich dieses Spiel oft spiele. Werde ich eher verlieren oder gewinnen, und wieviel? Wenn der Würfel fair ist, kann ich den Wahrscheinlichkeitsraum aus obigem Beispiel 2) verwenden. Außerdem definieren wir die Nettogewinnfunktion x : {1, 2, 3, 4, 5, 6} → IR durch x(1) = x(2) = x(3) = x(4) = −1, x(5) = −1 + 2 = 1, x(6) = −1 + 5 = 4. Definition 10 Sei (M, W ) ein Wahrscheinlichkeitsraum. Dann nennt man eine Funktion x : M → IR eine Zufallsvariable. Spiele ich das Spiel n-mal mit einem großen n, dann erwarte ich, dass ich jede Augenzahl ungefähr n6 -mal würfle. Ich erwarte also den Nettogewinn 6 X n n n n n 1 n n (−1) + (−1) + (−1) + (−1) + + 4 = n x(j) = , 6 6 6 6 6 6 6 6 j=1 was man so interpretieren kann, dass ich pro Spiel im Durchschnitt 1 6 Euro gewinne. Definition 11 1) Sei (M, W ) ein endlicher Wahrscheinlichkeitsraum (mit M = {m1 , . . . , mk }) und x eine Zufallsvariable. Dann ist der Erwartungswert (oder Mittelwert) von x definiert durch E(x) := k X x(mj )W ({mj }) . j=1 2) Sei M = [a, b] mit −∞ ≤ a < b ≤ ∞, W ([c, d]) = cd f (t)dt (mit der Dichte f (t) ≥ 0, a f (t)dt = 1) und x eine Zufallsvariable. Dann ist der Erwartungswert von x definiert durch R Rb Z b E(x) := x(t)f (t)dt . a 34 Beispiel: Fährt die U-Bahn mit einem Intervall von T = 4 Minuten und ich komme zu einem zufälligen Zeitpunkt an der Haltestelle an, wie lange muss ich dann im Durchschnitt auf den nächsten Zug warten? Modellieren wir meinen Ankunftszeitpunkt als gleichverteilt im Zeitintervall [0, T ] zwischen zwei Zugsabfahrten (d.h. f (t) = 1/T ), dann ist meine Wartezeit gegeben durch x(t) = T − t. Der Erwartungswert ist also Z T 0 1 1 (T − t) dt = T T !T t2 Tt − 2 0 1 = T T2 T − 2 2 ! = T . 2 Die erwartete Wartezeit von 2 Minuten ist nicht sehr überraschend (aber beruhigend, dass es stimmt). Kehren wir zum Würfelspiel zurück, dann wäre eine alternative Variante, einen festen Nettogewinn von 16 Euro unabhängig von der gewürfelten Augenzahl festzulegen. Das ergibt natürlich auch den Erwartungswert 16 Euro für den Nettogewinn, also denselben wie im ursprünglichen Spiel. Trotzdem gibt es zwischen den beiden Spielen natürlich wesentliche Unterschiede, was das involvierte Risiko anlangt. Dieses Risiko kann bewertet werden, indem man fragt, wie weit der Nettogewinn durchschnittlich vom Erwartungswert entfernt ist. Definition 12 Sei x eine Zufallsvariable. Dann ist die Varianz von x definiert durch V (x) = E([x − E(x)]2 ) . Sie gibt die durchschnittliche pquadratische Abweichung vom Erwartungswert an. Die Standardabweichung ist gegeben durch V (x). In unserem Würfelspiel ergibt sich die Varianz −1 − 1 6 2 4 1 + 1− 6 6 2 1 1 + 4− 6 6 2 1 ≈ 3, 47 . 6 Die Standardabweichung ≈ 1, 86 Euro ist also recht hoch im Vergleich zum erwarteten Gewinn. Die Spielvariante mit fixem Gewinn hat natürlich die Varianz Null. Noch einmal zur Gaußverteilung mit Mittel Null und Varianz Eins. Das sagt man, weil E(t) = Z ∞ −t2 /2 e t √ −∞ 2π dt = 0 , (da der Integrand eine ungerade Funktion ist,) und −t2 /2 2 e−t /2 V (t) = E(t ) = t √ dt = − t √ 2π 2π −∞ −∞ 2 Z ∞ 2e Z ∞ !0 dt = Z ∞ −t2 /2 e √ −∞ 2π dt = 1 , was aus partieller Integration folgt. Schätzung von Erwartungswert und Varianz: Oft kennt man die Wahrscheinlichkeitsverteilung nicht und ist nur mit einer Anzahl von Werten x1 , . . . , xn einer Zufallsvariablen x konfrontiert. Aus dem Gesetz der großen Zahlen ergibt sich, dass die Mittelwerte En = x = n 1X xj n j=1 und Vn = (x − x)2 = n 1X (xj − En )2 n j=1 brauchbare (und bei großem n sogar gute) Schätzwerte für E(x) und V (x) sind. 35 Bestimmung der Monomerzahl in einem Aktinfilament: Aus dem Protein Aktin aufgebaute Polymerfilamente bilden einen wesentlichen Bestandteil des Zytoskeletts. Jedes Monomer trägt d = 2,7nm zur Länge eines Filamentes bei. Angenommen, mit Hilfe eines Elektronenmikroskops könnte die Gesamtlänge eines Filamentes bestimmt werden, wobei ein maximaler Messfehler von 2d zu erwarten ist. Die gemessene Länge wird auf ganzzahlige Vielfache von d gerundet, um die Anzahl der Monomere im Filament zu bestimmen. Wie verlässlich sind die Resultate? Zunächst brauchen wir ein Wahrscheinlichkeitsmodell (auch stochastisches Modell genannt) für den Messfehler. Wenn wir annehmen, dass kleinere Fehler wahrscheinlicher sind als größere, dann käme z.B. das Modell 2d − |t| M = [−2d, 2d] , f (t) = , 4d2 in Frage. Liegt der Fehler in [−d/2, d/2], dann wird nach Rundung die korrekte Monomerzahl bestimmt. Liegt er in [d/2, 3d/2], dann ist die gemessene Anzahl um 1 zu groß. Liegt der Messfehler in [3d/2, 2d], dann ist sie um 2 zu groß. Analoges gilt für negative Messfehler. Die Wahrscheinlichkeit, die korrekte Monomerzahl zu bestimmen, beträgt also Z d/2 f (t)dt = W ([−d/2, d/2]) = −d/2 Z d/2 2 4d2 (2d − t)dt = 0 7 . 16 Um 1 zu groß (bzw. zu klein) wird die Anzahl mit der Wahrscheinlichkeit Z 3d/2 W ([d/2, 3d/2]) = d/2 1 f (t)dt = 2 4d Z 3d/2 (2d − t)dt = d/2 1 4 bestimmt. Um 2 zu groß (bzw. zu klein) wird die Anzahl mit der Wahrscheinlichkeit Z 2d f (t)dt = W ([3d/2, 2d]) = 3d/2 1 4d2 Z 2d (2d − t)dt = 3d/2 1 32 sein. Sieht man den Fehler in der ermittelten Monomerzahl als Zufallsvariable, dann hat diese den Erwartungswert 7 1 1 1 1 0 + 1 + (−1) + 2 + (−2) = 0 , 16 4 4 32 32 was man bei Messfehlern üblicherweise annimmt, weil man es durch geeignete Kalibrierung des Messgerätes normalerweise erreichen kann. Interessanter ist die Varianz 7 1 1 1 1 5 0+ 1+ 1+ 4+ 4= , 16 4 4 32 32 8 die eine (in diesem Fall sehr brauchbare) Standardabweichung von p 5/8 ≈ 0, 8 ergibt. Lineare Regression Angenommen, bei einem Experiment kann die Größe x eingestellt und dann die Größe y gemessen werden. So werden n Messpunkte (x1 , y1 ), . . . , (xn , yn ) bestimmt. Nimmt man weiter an, dass theoretische Überlegungen einen linearen Zusammenhang der Form y = a + bx 36 nahelegen, dann stellt sich die Frage, wie man aus den Messdaten geeignete Schätzwerte für die Parameter a und b bestimmt, wenn man mehr als zwei Messpunkte hat, d.h. n > 2. In diesem Fall ist obiger Zusammenhang für alle Messpunkte im Allgemeinen nicht exakt zu erreichen. Als Grund dafür kann man nicht beeinflussbare Schwankungen im Aufbau des Experimentes oder auch Messfehler bei der Bestimmung von y sehen. Das führt auf das modifizierte stochastische Modell y = a + bx + ε , in dem ε als Zufallsvariable interpretiert wird, die die Systemschwankungen bei verschiedenen Experimenten und/oder die Messfehler beschreibt. Die Bestimmung geeigneter Werte für a und b orientiert sich an der Idee, die beobachteten Schwankungen εi := yi − (a + bxi ), i = 1, . . . , n, möglichst klein zu machen. Die gängigste Methode, die Methode der kleinsten Fehlerquadrate, besteht darin, dass die Summe der Quadrate der Schwankungen, F (a, b) = n X (yi − (a + bxi ))2 , i=1 minimiert wird. Wie findet man nun die optimalen Werte a und b? Angenommen, man würde b schon kennen, dann würde man Kandidaten für ein Minimum von F als Funktion von a finden, indem man die Ableitung nach a gleich Null setzt. Ebenso für b bei bekanntem a. Die Ableitungen nach a bei festem b und umgekehrt nennt man partielle Ableitungen von F und bezeichnet sie mit ∂F ∂F ∂a und ∂b . Notwendige Bedingungen dafür, dass F an der Stelle (a, b) minimal wird, sind n X ∂F (a, b) = −2 (yi − (a + bxi )) = 0 , ∂a i=1 n X ∂F (a, b) = −2 [(yi − (a + bxi ))xi ] = 0 . ∂b i=1 Dividiert man die beiden Gleichungen durch −2n, dann nehmen sie die Form a + bx = y , ax + bx2 = xy an. Ausrechnen von a aus der ersten Gleichung und Einsetzen in die zweite ergibt x2 − (x)2 b = xy − x y (10) Die Nebenrechnung n n 1X 1X (xi − x)2 = x2i − 2xi x + (x)2 = x2 − 2(x)2 + (x)2 = x2 − (x)2 n i=1 n i=1 zeigt, dass der Koeffizient von b in (10) nur dann Null sein kann, wenn alle xi gleich sind, was bedeuten würde, dass alle Datenpunkte auf einer vertikalen Gerade liegen, die natürlich nicht in der Form y = a + bx geschrieben werden kann. Schließen wir diesen Sonderfall aus, dann sind a und b eindeutig bestimmt: b= xy − x y , x2 − (x)2 a = y − bx . 37 Aus einer weiteren Nebenrechnung ähnlich der obigen ergibt sich die alternative Darstellung Pn b= i=1 (xi − x)(yi − Pn 2 i=1 (xi − x) y) Diese Werte für a und b liefern tatsächlich den minimalen Wert von F (um das zu zeigen würden wir mehr Wissen über Funktionen in mehreren Variablen brauchen, was über den Stoff dieser Vorlesung hinausgeht). In Abhängigkeit der Schwankungen ε1 , . . . , εn kann man die Resultate auch so interpretieren, dass a und b so gewählt sind, dass der geschätzte Erwartungswert der Schwankung verschwindet, d.h. ε = 0, und dass die geschätzte Varianz F = (ε − ε)2 minimal wird. Beispiel: Haben wir folgende Werte: i x i yi 1 1 2 2 2 3 3 3 4.5 F (a, b) = (2 − (a + b))2 + (3 − (a + 2b))2 + (4.5 − (a + 3b))2 Die notwendigen Bedingungen für das Extremum: 9 ∂ F (a, b) = (−2)[(2 − a − b)) + (3 − a − 2b)) + ( − a − 3b))] = 0 ∂a 2 ∂ 9 F (a, b) = (−2)[(2 − a − b)) + 2(3 − a − 2b)) + 3( − a − 3b))] = 0 ∂b 2 Die zwei Gleichungen: 19 − 3a − 6b = 0 2 43 − 6a − 14b = 0 2 liefern die Lösung a = 23 und b = 45 für die Ausgleichsgerade y = 23 + 54 x. Wir können a und b auch direkt ausrechnen. Zuerst berechnen wir die arithmetischen Mittel x = 1+2+3 = 2 und y = 2+3+4.5 = 19 3 3 6 , also haben wir für b und a: b = a = − 2) + (3 − 19 6 )(2 − 2) + (4.5 − 2 (−1) + 02 + 12 2 19 5 − ·2= 6 4 3 (2 − 19 6 )(1 19 6 )(3 − 2) = 5 4 Nichtlineare Ansätze Quadratisches Polynom: Grades voraus, d.h. Sagt unsere Theorie einen Zusammenhang durch ein Polynom zweiten y = a + bx + cx2 , 38 dann versuchen wir die drei Parameter a, b und c so zu ermitteln, dass die mittlere quadratische Abweichung minimal wird. Wir führen wiederum die Funktion F ein: F (a, b, c) = n X (yi − (a + bxi + cx2i ))2 i=1 Die notwendigen Bedingungen für ein Extremum sind: n X ∂ F (a, b, c) = (−2) (yi − (a + bxi + cx2i )) = 0 ∂a i=1 n X ∂ F (a, b, c) = (−2) [(yi − (a + bxi ) + cx2i )xi ] = 0 ∂b i=1 n X ∂ F (a, b, c) = (−2) [(yi − (a + bxi + cx2i ))x2i ] = 0 ∂c i=1 Exponentialfunktion: Ist die Modellvorhersage y = Aebx , dann ist jetzt das Problem, dass der unbekannte Parameter b nichtlinear eingeht. Wir führen statt y die Größe u = ln y ein, die linear von x abhängt: u = ln A + bx . Mit a = ln A ist es nun plausibel, die Ausgleichsgerade für (xi , ui ) zu bestimmen. Beispiel: i xi yi ui = ln yi 1 1 1 0 2 2 0.5 − ln 2 3 3 0.2 − ln 5 4 4 0.05 − ln 20 Die Funktion F ist dann F (a, b) = [−(a + b)]2 + [− ln 2 − (a + 2b)]2 + [− ln 5 − (a + 3b)]2 + [− ln 20 − (a + 4b)]2 . Die Bedingungen für einen Extrempunkt sind: ∂ F (a, b) = (2)[(a + b) + ln 2 + (a + 2b) + ln 5 + (a + 3b) + ln 20 + (a + 4b)] = 0 ∂a ∂ F (a, b) = (2)[(a + b) + (ln 2 + (a + 2b))2 + (ln 5 + (a + 3b))3 + (ln 20 + (a + 4b))4] = 0 ∂b d.h. 4a + 10b + ln 200 = 0 10a + 30b + ln(8 · 107 ) = 0 √ √ 1 a = ln( 10), also A = 10 ≈ 3.16 und b = − 10 ln(20000) ≈ −0.99 39 Übungsaufgaben 8.1. Man bestimme die Ausgleichsgerade für die Punkte (1, 6), (2, 7), (3, 9), (4, 10). 8.2. Zu den Zeitpunkten t1 = 1, t2 = 2 und t3 = 3 werden die Konzentrationen c1 = 1, 5, c2 = 2, 1 bzw. c3 = 3, 7 (ohne Einheit) gemessen. Eine Theorie sagt den zeitlichen Konzentrationsverlauf c(t) = aebt voraus. Man schätze a und b mit der Methode der kleinsten Fehlerquadrate sowie die Konzentration zum Zeitpunkt t = 9. 9 Differentialgleichungen – Reaktionskinetik Mathematische Modelle chemischer Reaktionen: Setzen wir einen gut gemischten chemischen Reaktor voraus, d.h. ein Gefäß, in dem die chemischen Substanzen X1 , . . . , Xn gleichmäßig verteilt sind mit den Konzentrationen c1 (t), . . . , cn (t) zum Zeitpunkt t. Die zeitliche Veränderung wird bewirkt durch m chemische Reaktionen mit den Reaktionsraten r1 (t), . . . , rm (t) und den stöchiometrischen Koeffizienten νij ∈ ZZ, i = 1, . . . , n, j = 1, . . . , m. Die Reaktionsraten geben an, wie oft die Reaktionen pro Zeiteinheit stattfinden. Die stöchiometrischen Koeffizienten haben folgende Bedeutung: Ist νij > 0, dann werden bei jedem Stattfinden der j-ten Reaktion νij Moleküle der Substanz Xi erzeugt. Ist νij < 0, dann werden bei jedem Stattfinden der j-ten Reaktion −νij Moleküle der Substanz Xi verbraucht. Ist νij = 0, dann ist die Substanz Xi an der j-ten Reaktion unbeteiligt. Das rechteckige Schema ν11 · · · ν1m .. .. N = . . νn1 · · · νnm nennt man die stöchiometrische Matrix. Für die zeitliche Veränderung der Konzentrationen müssen die Differentialgleichungen m X dci = νij rj , i = 1, . . . , n, dt j=1 gelten. Das einfachste Modell für die Reaktionsraten (für einfache Reaktionen) ergibt sich aus dem Massenwirkungsgesetz: Y −νij rj = kj ci , j = 1, . . . , m , i: νij <0 mit den Reaktionskonstanten kj > 0. Das Produkt enthält für jedes Molekül der Substanz Xi , das bei der Reaktion verbraucht wird, einen Faktor ci . Die Gesamtzahl der bei einer Reaktion verbrauchten Moleküle nennt man die Ordnung der Reaktion. Nennt man den Zeitpunkt des Beginns eines Experimentes t = 0 und die Konzentrationen zu diesem Zeitpunkt c10 , . . . , cn0 , dann gelten die Anfangsbedingungen ci (0) = ci0 , i = 1, . . . , n . 40 Ein Beispiel – qualitative Analyse: Als Beispiel betrachten wir eine Reaktion X1 + X2 → X3 und ihre Umkehrreaktion. Die stöchiometrische Matrix ist −1 1 N = −1 1 . 1 −1 Die Vorwärtsreaktion hat daher die Rate r+ = k+ c1 c2 (und ist daher zweiter Ordnung) und die Umkehrreaktion r− = k− c3 (erster Ordnung), woraus die Differentialgleichungen dc1 = k− c3 − k+ c1 c2 , dt dc2 = k− c3 − k+ c1 c2 , dt dc3 = k+ c1 c2 − k− c3 , dt folgen. Die Anfangsbedingungen sind c1 (0) = c10 , c2 (0) = c20 , c3 (0) = c30 , mit gegebenen Anfangskonzentrationen ci0 ≥ 0. Solche Systeme nichtlinearer Differentialgleichungen kann man im Allgemeinen nicht explizit lösen. Obwohl es in diesem Fall möglich wäre, werden wir es nicht tun, sondern uns auf andere Art Informationen über die Lösung beschaffen. Zunächst gilt offensichtlich dc1 dc3 dc1 dc2 − = 0 und + = 0, dt dt dt dt was auf die angesichts der Reaktionsgleichung wenig überraschenden Aussagen führt, dass sich die Differenz der Konzentrationen von X1 und X2 mit der Zeit nicht ändert, genauso wie die Summe der Konzentrationen von X1 und X3 . Das liefert c2 (t) = c1 (t) − c10 + c20 , c3 (t) = −c1 (t) + c10 + c30 . Einsetzen in die Differentialgleichung für c1 liefert dc1 = f (c1 ) , dt mit f (c1 ) = k− (c10 + c30 ) − c1 (k− + k+ c20 − k+ c10 ) − k+ c21 . Wir konnten also ein System von drei Differentialgleichungen durch eine einzelne Gleichung ersetzen, was eine wesentliche Vereinfachung darstellt. Ein einfache Kurvendiskussion zeigt, dass f genau eine positive Nullstelle c1 besitzt (die man natürlich als Lösung einer quadratischen Gleichung auch explizit berechnen kann). Offensichtlich wäre die Konstante c1 (t) = c1 die Lösung unseres Problems, wenn c10 = c1 gälte, was wir im Allgemeinen nicht erwarten können. Man nennt c1 einen stationären Punkt der Differentialgleichung. Es gilt f (c1 ) > 0 für 0 ≤ c1 < c1 und f (c1 ) < 0 für c1 > c1 . Daher wird c1 (t) mit der Zeit größer, solange es kleiner als c1 ist und umgekehrt. Es ist daher zu erwarten, dass lim c1 (t) = c1 t→∞ gilt. Man nennt den stationären Punkt c1 asymptotisch stabil. Natürlich folgt daraus, dass auch c2 (t) und c3 (t) für t → ∞ konvergieren und sich daher der ganze Reaktor mit der Zeit einem Gleichgewichtszustand nähert, in dem k+ c1 c2 = k− c3 gilt. 41 Einfacher Zerfall: In der einfachsten Situation mit n = m = 1 gibt es nur eine Spezies mit Konzentration c(t) und eine Zerfallsreaktion erster Ordnung mit Reaktionsrate kc mit der Reaktionskonstanten k > 0. Für die Konzentration ergibt sich dann das Anfangswertproblem dc = −kc , dt c(0) = c0 , das explizit gelöst werden kann. Die Idee ist, die Differentialgleichung durch c zu dividieren, dc/dt(t) = −k , c(t) und festzustellen, dass das geschrieben werden kann als d (ln(c(t)) + kt) = 0 . dt Der Ausdruck in der Klammer ist daher konstant und damit gleich seinem Wert an der Stelle t = 0: ln(c(t)) + kt = ln(c0 ) . Aus dieser Gleichung kann man c(t) berechnen: c(t) = e−kt c0 . Klarerweise nimmt die Konzentration ab (und zwar exponentiell). Herleitung einer Reaktion nullter Ordnung (Skalierung, Störungsrechnung): Eine kleine Erweiterung des letzten Beispiels besteht darin, die Reaktion X1 → X2 und ihre Umkehrung zu betrachten. Das ergibt das Anfangswertproblem dc1 = k− c2 − k+ c1 , dt dc2 = k+ c1 − k− c2 , dt c1 (0) = c10 , c2 (0) = c20 . Angenommen, die Reaktionskonstante der Umkehrreaktion ist viel kleiner als die der Vorwährtsreaktion, als Formel: k− k+ . Die beiden Reaktionsraten können nur dann von gleicher Größenordnung sein, wenn c1 viel kleiner als c2 ist, was wir für die Anfangskonzentrationen annehmen: c10 c20 . Um herauszufinden, wie sich diese Annahmen auf die Dynamik auswirken, führen wir eine Skalierung durch. Das bedeutet, dass wir für alle auftretenden Größen Einheiten wählen, und zwar so, dass die Maßzahlen möglichst von moderater Größe sind. Das kann man üblicherweise erreichen, indem man als Einheiten sogennante intrinsische Referenzgrößen verwendet, die aus den Parametern des Problems gebildet werden. In unserem Problem brauchen wir Einheiten für die Konzentrationen und für die Zeit. Für die Konzentrationen bieten sich ihre Anfangswerte an. Für die Zeit könnten wir entweder 1/k+ oder 1/k− verwenden und entscheiden uns für den kleineren Wert 1/k+ . Die dimensionslosen Maßzahlen von c1 , c2 und t nennen wir u1 , u2 bzw. τ . Genauer bedeutet das die Transformationen u1 (τ ) = c1 (τ /k+ ) , c10 u2 (τ ) = 42 c2 (τ /k+ ) c20 Das ergibt die Differentialgleichungen u01 (τ ) = u02 (τ ) = k− c20 u2 (τ ) − k+ c10 u1 (τ ) k− c20 c01 (τ /k+ ) = = u2 (τ ) − u1 (τ ) , c10 k+ c10 k+ k+ c10 c10 k− c20 u1 (τ ) − u2 (τ ) . c20 k+ c10 Entsprechend unserer obigen Annahmen schreiben wir k− = ε, k+ c10 = εa , c20 wobei ε sehr klein und a von moderater Größe ist. Das gibt u01 = u2 − u1 , a u02 = ε(au1 − u2 ) , u1 (0) = u2 (0) = 1 . Eine Approximation ergibt sich mit ε → 0: u2 (τ ) = 1 für τ ≥ 0 und damit u01 = 1 − u1 , a u1 (0) = 1 . Die Rate der Umkehrreaktion wird also durch die Konstante 1/a approximiert. Man spricht daher von einer Reaktion nullter Ordnung. Die Substanz stellt also ein großes Hintergrundreservoir dar, das sich durch die Reaktionen nur unwesentlich ändert. Das Näherungsproblem für u1 kann explizit gelöst werden. Zunächst beobachten wir, dass die Differentialgleichung den stationären Punkt u1 = 1/a besitzt. Die Abweichung v(τ ) = u1 (τ ) − 1/a erfüllt das Anfangswertproblem v 0 = −v , v(0) = 1 − 1/a , das analog zu oben explizit gelöst werden kann: v(τ ) = e−τ (1 − 1/a). Daraus folgt u1 (τ ) = 1/a + e−τ (1 − 1/a) und daraus für die unskalierte Konzentration von X1 : k− c20 k− c20 + e−k+ t c10 − k+ k+ c1 (t) = . Für t → ∞ konvergiert c1 (t) also exponentiell gegen die stationäre Lösung. Michaelis-Menten-Kinetik: Wir betrachten eine von einem Enzym E gesteuerte Reaktion, bei der das Substrat S in das Produkt P umgewandelt wird. Das passiert durch zwei Teilreaktionen, wobei zuerst das Enzym mit dem Substrat den Komplex ES bildet, der dann in das Produkt und das unverändert aus dem Prozess hervorgehende Enzym zerfällt, also E + S → ES → P + E. Wir nehmen an, dass zu Beginn nur Enzym und Substrat vorhanden sind mit einer viel kleineren Enzymkonzentration. Das ergibt das Anfangswertproblem c0S = −k1 cE cS , c0E c0ES c0P cS (0) = cS0 , = k2 cES − k1 cE cS , cE (0) = cE0 , = k1 cE cS − k2 cES , cES (0) = 0 , = k2 cES , cP (0) = 0 . 43 Wieder führen wir eine Skalierung durch, wobei wir für cS und cP die Einheit cS0 verwenden, für cE und cES die Einheit cE0 , sowie die Zeiteinheit 1/(k1 cE0 ). Für die neuen Variablen uS , uP , uE und uES , die von τ = k1 cE0 t abhängen, ergibt sich das Problem u0S = −uE uS , ε u0E ε u0ES u0P uS (0) = 1 , = a uES − uE uS , uE (0) = 1 , = uE uS − a uES , uES (0) = 0 , = a uES , uP (0) = 0 , mit den dimensionslosen Parametern ε= cE0 , cS0 a= k2 . k1 cS0 Wie oben erwähnt, nehmen wir an, dass ε sehr klein ist. Außerdem nehmen wir an, dass die Raten der beiden Reaktionen von derselben Größenordnung sind, was bedeutet, dass a moderate Werte annimmt. Addieren der zweiten und der dritten Differentialgleichung ergibt die plausible Tatsache, dass die Summe der Konzentrationen von Enzym und Komplex konstant ist: uE (τ ) + uES (τ ) = 1 , wobei die Konstante auf der rechten Seite aus den Anfangsbedingungen folgt. Verwendet man das in der zweiten Differentialgleichung und führt den Grenzwert ε → 0 durch, dann ergibt sich 0 = a(1 − uE ) − uE uS , woraus uE berechnet werden kann: uE = a . a + uS Das führt dazu, dass wir nun eine direkte Reaktionsrate für S → P angeben können: u0P = −u0S = a uS a + uS In den ursprünglichen unskalierten Variablen ergibt sich c0P = −c0S = k1 k2 cE0 cS k2 + k1 cS Dieses Resultat wird Michaelis-Menten-Kinetik genannt. Man kann es als Interpolation zwischen einer Reaktion erster Ordnung (Rate ≈ k1 cE0 cS ) für sehr kleine Werte von cS und einer Reaktion nullter Ordnung (Rate ≈ k2 cE0 ) für sehr große Werte von cS ansehen. 44