Mathematik für Ingenieure I, WS 2008/2009 Dienstag 10.2 $Id: stetig.tex,v 1.5 2009/02/10 17:31:38 hk Exp $ $Id: diffb.tex,v 1.2 2009/02/10 17:50:21 hk Exp hk $ III. Analysis §13 Stetige Funktionen 13.4 Umkehrfunktionen Zum Abschluss dieses Paragraphen wollen wir nun noch die Umkehrfunktion der Exponentialfunktion, in ihrer reellen und ihrer komplexen Form, besprechen. Wir gehen wieder von der Definition der Exponentialfunktion über ihre Potenzreihe ex = 1 + x + x2 x3 + + ··· 2! 3! 1. Als durch eine Potenzreihe gegebene Funktion ist die Exponentialfunktion stetig. 2. Für alle x, y ∈ R, und auch alle x, y ∈ C, gilt die Gleichung ex+y = ex ey . Dieses hatten wir über die Berechnung des Cauchyprodukts der definierenden Potenzreihen eingesehen. 3. Als eine Folgerung ergab sich ex 6= 0 und e−x = 1/ex für jedes x ∈ R, und auch jedes x ∈ C. 4. Es gelten limx→−∞ ex = 0 und limx→∞ ex = ∞. Aus diesen Fakten werden wir nun einige weitere Eigenschaften der Exponentialfunktion herleiten. Zunächst zeigen wir ex > 1 für alle x ∈ R mit x > 0. Ist nämlich x > 0, so gilt xn > 0 für jedes n ∈ N, und somit ist auch ex = 1 + x + x2 + · · · > 1. 2! Insbesondere ist auch ex > 0 für alle x ∈ R, denn für x > 0 haben wir dies eben eingesehen, für x = 0 ist ex = 1 und für x < 0 haben wir auch ex = 1/e−x > 0. Damit ist es nun leicht zu zeigen, daß die Exponentialfunktion auch streng monoton steigend ist. Seien nämlich x, y ∈ R mit x < y gegeben. Dann ist y − x > 0 und wir rechnen ey = ex+y−x = ex ey−x > ex . 27-1 Mathematik für Ingenieure I, WS 2008/2009 Dienstag 10.2 Nach unserem Satz über Umkehrfunktionen ist das Bild exp(R) ein Intervall mit den Randpunkten limx→−∞ ex = 0 und limx→∞ ex = ∞, also gleich (0, ∞), und wir haben eine stetige Umkehrabbildung ln : (0, ∞) → R 1 x 1 2 3 4 5 0 –1 –2 genannt der natürliche Logariathmus. Der Zusatz natürlich“ wird dabei in mathe” matisch orientierten Texten oft weggelassen, da sowieso keine anderen Logarithmen betrachtet werden. In der Tat schreiben Mathematiker oft auch log für den natürlichen Logarithmus, während log in anderen Zusammenhängen oftmals den Logarithmus zur Basis 10 bedeutet. Aus den Eigenschaften der Exponentialfunktion folgen nun entsprechende Eigenschaften des Logarithmus. Da die e-Funktion streng monoton steigend ist, ist auch der Logarithmus streng monoton steigend. Wegen limx→−∞ ex = 0 und limx→∞ ex = ∞ gelten lim ln x = −∞ und x→0 lim ln x = ∞. x→∞ Weiter überführt der Logarithmus Produkte in Summen. Sind nämlich x, y ∈ R mit x, y > 0, so haben wir eln(x)+ln(y) = eln x eln y = x · y, also ln(x · y) = ln x + ln y. Diese Eigenschaften wurde (sehr viel) früher in den sogenannten Rechenschiebern ausgenutzt. Da die Potenz xn das n-fache Produkt von x mit sich selbst ist, ergibt sich weiter ln(xn ) = n · ln x für alle n ∈ N, x > 0. Außerdem folgt für jedes x > 0 noch 1 1 0 = ln 1 = ln x · = ln x + ln , x x beziehungsweise 1 ln = − ln x. x Wir hatten bereits bemerkt, dass limx→∞ ln x = ∞ ist, allerdings ist diese Konvergenz sehr langsam. Mit wachsenden x steigen die Logarithmen nur sehr gemächlich an. Um dies zu illustrieren, wollen wir uns einmal überlegen, das die Abstände zwischen aufeinanderfolgenden Gliedern der Folge (ln n)n∈N immer kleiner werden, also eine Nullfolge bilden. In der Tat gilt für jedes n ∈ N die Gleichung 1 n+1 1 ln(n + 1) − ln(n) = ln(n + 1) + ln = ln = ln 1 + n n n und mit der Stetigkeit des Logarithmus folgt 1 1 lim (ln(n + 1) − ln(n)) = lim ln 1 + = ln lim 1 + = ln(1) = 0. n→∞ n→∞ n→∞ n n 27-2 Mathematik für Ingenieure I, WS 2008/2009 Dienstag 10.2 Formal werden beliebige reelle Potenzen durch eine Kombination von Exponentialfunktion und Logarithmus definiert ax := ex·ln a (a, x ∈ R, a > 0). Für den Logarithmus zur Basis a, also der Umkehrfunktion von x 7→ ax folgt hieraus loga y = ln y ln a für alle a, y > 0, denn y = ax = ex ln(a) ist zu x · ln(a) = ln(y) gleichwertig. Wir wollen den Logarithmus jetzt auch noch auf komplexe Argumente ausdehnen. Dies funktioniert nicht als Umkehrfunktion der komplexen Exponentialfunktion selbst, wir hatten ja bereits gesehen das diese periodisch mit Periode 2πi, also sicher nicht injektiv ist. Wann gilt nun ez = ew für komplexe Zahlen z, w? Zunächst wollen wir hierzu alle z ∈ C mit ez = 1 bestimmen. Setze dazu z = x + iy an. Wegen |ez | = ex kommt nur x = 0 in Frage, also z = iy. Dann ist ez = cos y + i sin y, die beiden Bedingungen sind also cos y = 1, sin y = 0. Die zweite Gleichung hat genau die Lösungen y = nπ mit n ∈ Z. Eingesetzt in der ersten Gleichung wird diese zu 1 = cos y = cos(nπ) = (−1)n , d.h. die Zahl n muss gerade sein. Damit haben wir ez = 1 ⇐⇒ z = 2πni für ein n ∈ Z. Für z, w ∈ C folgt weiter ez = ew ⇐⇒ ez−w = ez = 1 ⇐⇒ z = w + 2πin für ein n ∈ Z. ew Zwei komplexe Zahlen haben also genau dann denselben Wert unter der Exponentialfunktion, wenn sie sich um ein Vielfaches von 2πi unterscheiden. Schränken wir also die Exponentialfunktion auf den Streifen U := {x + iy|x ∈ R, −π < y < π} ein, so wird exp : U → C injektiv, da in U keine zwei Elemente liegen, deren Imaginärteile sich um echte Vielfache von 2π unterscheiden. 27-3 Mathematik für Ingenieure I, WS 2008/2009 y = Im z Dienstag 10.2 y = 3π y= π U x = Re z y = −π y = −3π Die Menge U ist der angedeutete waagerechte Streifen, und die Werte der Exponentialfunktion wiederholen sich in jedem der unter diesem und über diesem liegenden Streifen. Auf U eingeschränkte hat die e-Funktion somit eine Umkehrfunktion. Der Definitionsbereich dieser Unkehrfunktion ist das Bild exp(U ) ⊆ C unseres Streifens, das wir nun berechnen wollen. Zunächst wissen wir exp(C) = C\{0} da wir wegen exp(x + iy) = ex (cos y + i sin y) jede komplexe Zahl als Bild erreichen, deren Länge sich als ex schreiben läßt, also nicht Null ist. Da die Exponentialfunktion die Periode 2πi hat, werden fast alle diese Werte schon im Streifen U angenommen, die einzigen Ausnahmen sind die Werte ez bei denen z auf einer der waagerechten Linien Im z = ±π liegt. Erneut aufgrund der Periodizität können wir uns auf Im z = π beschränken, also auf z = t + πi mit t ∈ R. Für jedes t ∈ R gilt nun et+iπ = et · (cos π + i sin π) = −et , also {ez |z ∈ C, Im z = π} = {−et |t ∈ R} = (−∞, 0) und somit ist exp(U ) = (C\{0})\(−∞, 0) = C\R≤0 =: C− die sogenannte geschlitzte Ebene“. Damit ist exp : U → C− bijektiv, und wir erhalten ” den komplexen Logarithmus als die Umkehrfunktion ln := (exp |U )−1 : C− → C. Dieser Logarithmus ist der sogenannte Hauptwert, oder auch Hauptzweig, des Logarithmus. Anstelle von U hätten wir auch irgendeinen anderen waagerechten Streifen der Höhe 2π verwenden können, er müsste nicht einmal parallel zur x-Achse verlaufen. Dies würde uns andere Werte des komplexen Logarithmus“ liefern. Abgesehen von ” speziellen Situationen ist der Hauptwert die meistens verwendete Form des komplexen 27-4 Mathematik für Ingenieure I, WS 2008/2009 Dienstag 10.2 Logarithmus. Die explizite Berechnung ist einfach. Schreiben wir z = reiφ ∈ C− in Polarkoordinaten mit r > 0, −π < φ < π, so ist ln z = ln r + iφ. Dass die Berechnung der Polarkoordinaten einer komplexen Zahl z leicht möglich ist, haben wir dabei in §4 gesehen. Das analytische Gebirge sowie der komforme Plot des Logarithmus für z = x + iy, −2 ≤ x, y ≤ 2 sind: 3 2 3 1 2 –2.5 1 0 –2 –2 –1.5 –1 –0.5 0.5 1 –1 –2 –1 –1 y –2 0 0 1 x 1 –3 2 2 Zur Warnung wollen wir abschließend an einem Beispiel zeigen, dass der komplexe Logarithmus sich leider nicht ganz so gut verhält, wie wir es vom reellen Logarithmus gewöhnt sind. Wir hatten bereits bemerkt, dass ln(xy) = ln x + ln y für alle reellen Zahlen x, y > 0 gilt. Für den komplexen Logarithmus ist dies nicht uneingeschränkt wahr, d.h. sind z, w ∈ C− so ist im Allgemeinen ln(zw) 6= ln z + ln w. Zum einen muss natürlich überhaupt zw ∈ C− sein, aber dies reicht nicht aus. Wir betrachten 1√ 1√ 2+ 2 i. 2 2 Der Logarithmus von z berechnet sich dann zu 3 z = w = e 4 πi = − z 3 ln z = πi. 4 Auf der anderen Seite ist 2 1√ 1 2 z = 2(i − 1) = (−1 + 1 − 2i) = −i. 2 2 In Polarkoordinaten ist z 2 = −i = e−iπ/4 , also π 3 ln(z 2 ) = ln(−i) = − i 6= πi = 2 ln z. 2 2 27-5 φ 2 z Mathematik für Ingenieure I, WS 2008/2009 Dienstag 10.2 In diesem Beispiel ist auch klar wo das Problem liegt. Multiplikation komplexer Zahlen bedeutet Multiplikation der Längen und Addition der Winkel, aber bei dieser Addition kann, wie in diesem Beispiel, der Winkel aus dem Intervall (−π, π) herausrutschen, was zu diesem Sprung des Logarithmus führt. Dies kann beispielsweise nicht passieren wenn wir uns auf Winkel zwischen −π/2 und π/2 beschränken, also auf komplexe Zahlen in der rechten Halbebene. Sind also z, w ∈ C mit Re z > 0 und Re w > 0, so gilt stets ln(zw) = ln(z) + ln(w). Genau wie der reelle Logarithmus zur Definition beliebiger reeller Potenzen benutzt werden kann, kann der komplexe Logarithmus zur Definition komplexer Potenzen verwendet werden. Wir führen dies zunächst für Wurzeln, also für hoch 1/2 vor. Für z ∈ C− definieren wir √ 1 z := e 2 ln z . Dann gilt auf jeden Fall √ 2 z = e 1 2 ln z 2 1 = e2· 2 ln z = eln z = z, √ aber im Allgemeinen leider nicht z 2 = z. Ist zum Beispiel wieder z = e3πi/4 , so haben wir √ √ 1 π 1√ 1√ z 2 = −i = e 2 ln(−i) = e− 4 i = 2− 2 i = −z. 2 2 √ √ √ Anders gesagt ist hier z · z = 6 √ √ √ z · z. Für z, w ∈ C mit Re z > 0 und Re w > 0 gilt dagegen immer zw = z · w. Allgemeine komplexen Potenzen werden durch z w := ew·ln z (w ∈ C, z ∈ C− ) definiert. Beispielsweise ist dann π ii = ei·ln(i) = ei·i 2 = e−π/2 . §14 Differenzierbare Funktionen 14.1 Differenzierbarkeit und Differenzenquotienten Jetzt sind wir in der Lage, die Differenzierbarkeit einer auf einem reellen Intervall I definierten Funktion f : I → R einzuführen. Sei x ∈ I ein Punkt des Intervalls, und wir wollen die Ableitung von f in x definieren. Es gibt mindestens drei verschiedene, aber natürlich gleichwertige, Methoden f 0 (x) einzuführen. Wir beginnen mit der geometrischen Beschreibung. Hier betrachten wir Punkte y ∈ I verschieden von x, also y 6= x, und bilden die Verbindungsgerade der beiden Punkte (x, f (x)) und (y, f (y)), dies ist 27-6 Mathematik für Ingenieure I, WS 2008/2009 Dienstag 10.2 sozusagen eine Sekante der Kurve y = f (x). Die Steigung dieser Sekante ist durch den sogenannten Differenzenquotienten f (y) − f (x) y−x gegeben. Lassen wir jetzt y gegen x konvergieren, so sollte die Steigung dieser Sekanten gegen die Steigung der Tangente an y = f (x) im Punkte x konvergieren, und diesen Grenzwert, sofern er existiert nennen wir dann die Ableitung von f in x f (y) − f (x) . y→x y−x f 0 (x) := lim In einer etwas exakteren Formulierung definieren wir dann die Tangente von y = f (x) im Punkte x als die Gerade der Steigung f 0 (x) durch den Punkt (x, f (x)). Die zweite Beschreibung ist die Definition der Ableitung als Änderungsrate in einem Punkte. Hier denken wir uns x als Zeit, und die Funktion f (x) als eine sich mit der Zeit ändernde Größe. Die relative Änderung des Wertes f (x) in einem kleinen Zeitraum h ist dann der Quotient f (x + h) − f (x) . h Lassen wir den Zeitabschnitt h hier klein werden, bilden also den Grenzwert h → 0, so ergibt sich im Grenzwert die relative Änderung im Punkt x selbst, also die Änderungsrate in diesem Punkt f (x + h) − f (x) . h→0 h f 0 (x) := lim Mathematisch ist dies genau dasselbe wie die geometrische Interpretation, man muss ja nur y = x + h schreiben. Diese Interpretation ist die wohl am häufigsten verwendete Veranschaulichung der Ableitung. Die Ableitung, also die Änderungsrate, einer Ortskurve ist die Geschwindigkeit, deren Änderungsrate ist die Beschleunigung, und so weiter. Die dritte Interpretation ist die Auffassung der Ableitung als eine lineare Approximation. Hier denken wir uns die Funktion f in der Nähe des Punktes x durch eine lineare Funktion angenähert, schreiben also f (x + h) = f (x) + mh + fehler(h) wobei dann üblicherweise τ (h) = fehler(h) gesetzt wird. Beachte das wir all dies als Funktionen in h auffassen, der Punkt x ist hier fest gewählt und ändert sich nicht. Der Fehler soll dabei natürlich einigen Bedingungen genügen. Die Minimalbedingung ist, dass der Fehler klein wird, wenn h klein wird, es sollte also limh→0 τ (h) = 0 gelten. Für die Ableitung ist dies noch nicht genug. Der Fehler soll nicht nur klein werden, er soll dies proportional zu h tun, es soll also eine Abschätzung |τ (h)| ≤ A|h| mit einer Proportionalitätskonstanten A > 0 gelten. Auch dies ist für die Differenzierbarkeit 27-7 Mathematik für Ingenieure I, WS 2008/2009 Dienstag 10.2 noch nicht gut genug. Differenzierbarkeit bedeutet, dass man auch die Proportionalitätskonstante A beliebig klein machen kann, wenn h nur klein genug ist. Es soll also für jede vorgegebene Proportionalitätskonstante > 0 stets |τ (h)| ≤ |h| für kleine h sein, beziehungsweise etwas exakter soll es ein δ > 0 mit |τ (h)| ≤ |h| für alle h ∈ R mit |h| ≤ δ geben. Da wir dies zu |τ (h)|/|h| ≤ für 0 6= h ∈ R mit |h| ≤ δ umformen können, sehen wir das die Bedingung an den Fehler gerade τ (h) =0 h→0 h lim ist. Auch diese Interpretation ist zu den anderen beiden Differenzierbarkeitsdefinitionen äquivalent, wobei die Steigung m der approximierenden linearen Funktion gerade m = f 0 (x) sein muss. Dies ist leicht zu sehen, wir können die Gleichung f (x + h) = f (x) + mh + τ (h) ja zu f (x + h) − f (x) τ (h) −m= h h umschreiben. Als Definition müssen wir uns für eine dieser drei Varianten entscheiden, und wählen hierfür die zweite Methode. Definition 14.1: Seien I ⊆ R ein Intervall und f : I → R eine Abbildung. Wir nennen f in einem Punkt x differenzierbar, wenn der Grenzwert f (x + h) − f (x) h→0 h f 0 (x) := lim existiert, welcher dann als die Ableitung von f in x bezeichnet wird. Als ein erstes Beispiel wollen wir die Funktion f (x) = x2 behandeln. Hier rechnen wir (x + h)2 = x2 + 2xh + h2 und haben f (x + h) = (x + h)2 geschrieben als die Summe des linearen Teils x2 + 2xh und dem Fehler τ (h) = h2 . Dann ist limh→0 τ (h)/h = limh→0 h = 0, d.h. f ist in x differenzierbar. Die Ableitung in x ist die Steigung des linearen Teils, also f 0 (x) = 2x. Etwas komplizierter ist die Funktion f (x) = x3 . Hier rechnen wir (x + h)3 = x3 + 3x2 h + 3xh2 + h3 , wir haben also den linearen Teil x3 + 3x2 h und den Fehler τ (h) = 3xh2 + h3 . Wegen τ (h)/h = 3xh + h2 ist wieder limh→0 τ (h)/h = 0, und f ist in x differenzierbar mit der Ableitung f 0 (x) = 3x2 . 27-8 Mathematik für Ingenieure I, WS 2008/2009 Dienstag 10.2 Nun kommen wir zur allgemeinen Potenz f (x) = xn . Mit der binomischen Formel rechnen wir dann n X n n−1 n n−k k n n (x + h) = x + x h+ x h = xn−1 + nxn−1 h + τ (h) 1 k k=2 mit dem Fehler τ (h) := n X n k=2 k xn−k hk . Dies ist zwar etwas komplizierter als in den beiden vorigen Beispielen, aber der Fehler ist wieder nur ein Polynom in h, in dem nur die Potenzen h2 , h3 , . . . , hn vorkommen. Damit ist auch τ (h)/h ein Polynom in dem nur die Potenzen h, h2 , . . . , hn−1 vorkommen, und insbesondere ist limh→0 τ (h)/h = 0. Folglich ist auch f (x) = xn in x differenzierbar mit f 0 (x) = nxn−1 . 27-9