Werner Universität Münster WS 08/09 Mathematik für Physiker (und Informatiker) I (Kurzskript) Mathematische Strukturen sind durch einen Satz von Axiomen bestimmt. Man ist bemüht, wichtige und interessante Aussagen aus diesen Axiomen herzuleiten. Die Sprache, derer man sich dabei bedient, ist die der (mathematischen) Logik. Entgegen einem weit verbreiteten Irrtum beschäftigt sich Mathematik nicht bloß mit der Syntax dieser Sprache; wichtig ist Mathematik nicht zuletzt durch den Erfolg der mathematischen Modelle, auf die man bei vielen Gelegenheiten stößt. Nach einer mathematischen Untersuchung dieser Modelle, lassen sich die Ergebnisse für (präzise) Vorhersagen nutzen, die überprüfbar sind. (Bevölkerungswachstum, Ausbreitung von Infektionskrankheiten, optimierter Entwurf von Schaltkreisen, Mischen von Spielkarten, Wirkung der Schwerkraft auf Licht, Periheldrehung des Merkur, Existenz spezieller Elementarteilchen). Ziel in dieser Vorlesung ist es, einige der mathematischen Grundtechniken zu vermitteln und anzuwenden. 2 Mathematik für Physiker und Informatiker I (Kurzskript) 0. Ein paar syntaktische Grundlagen Aussagelogische Formeln Eine Aussage im mathematischen Sinn ist ein in einer gültigen Sprache abgefaßter Satz, der in eindeutiger Weise mit einem der Wahrheitswerte ‘w’ (für ‘wahr’) oder ‘f ’ (für ‘falsch’) belegt werden kann. Neben den Aussagen (die hier so etwas wie Konstanten sind), benutzt man Aussagevariablen, die beliebige Wahrheitswerte annehmen können. Aussagen und Aussagevariable können durch Junktoren wie ∨ (‘oder’), ∧ (‘und’) oder auch ⇒ (‘impliziert’) miteinander verbunden oder durch ein vorangestelltes ¬ negiert werden. Das bei dieser Gelegenheit entstehende Produkt nennt man aussagelogische Formel. Welchen Wahrheitswert eine solche Formel bei Belegung durch Wahrheitswerte annimmt, entnimmt man sogenannten Wahrheitstafeln. Im Falle der gerade erwähnten Junktoren lauten diese: a f f w w b f w f w a∧b f f f w a f f w w b f w f w a∨b f w w w sowie a f f w w b f w f w a⇒b w w f w Zu beachten ist der von der Umgangsprache häufig abweichende Gebrauch von “oder” sowie die vielleicht überraschende Wahrheitstafel der Implikation. Eine aussagelogische Formel heißt gültig, wenn diese bei jeder Belegung der in ihr auftretenden Variablen stets wahr ist. Zwei aussagelogische Formeln, die von denselben Variablen abhängen heißen äquivalent, wenn identische Belegungen der Variablen für beide Formeln zu stets denselben Wahrheitswerten führen. Zwei aussagelogische Formeln A(a1 , . . . , an ) und B(a1 , . . . , an ) sind äquivalent genau dann, wenn A(a1 , . . . , an ) ⇔ B(a1 , . . . , an ) gültig ist. Hier ist a ⇔ b durch (a ⇒ b) ∧ (b ⇒ a) definiert. Beispiele für äquivalente Aussagen sind (a ⇒ b) ⇔ (¬a ∨ b) (was zeigt, dass die Implikation gar nicht in die anfängliche Liste von Junktoren mit aufgenommen werden müsste), die Distributivgesetze a ∨ (b ∧ c) ⇔ (a ∨ b) ∧ (a ∨ c), a ∧ (b ∨ c) ⇔ (a ∧ b) ∨ (a ∧ c) sowie die de Morganschen Regeln ¬(a ∨ b) ⇔ ¬a ∧ ¬b ¬(a ∧ b) ⇔ ¬a ∨ ¬b. Es gibt einen engen Zusammenhang zwischen aussagelogischen Formeln und Mengen. Nach Auszeichnung einer (großen) Grundmenge G selektiert eine Formel A, in die die Elemente von G eingesetzt werden können, die Elemente einer Menge M = {g ∈ G | A(g) ist wahr } . Werner, Universität Münster, WS 05/06 3 Für aussagelogische Formeln gibt es entsprechende Mengenoperationen: Vereinigung bzw. Durchschnitt entsprechen ∨ bzw. ∧, oder {g ∈ G | A(g) ist wahr } ⊂ {g ∈ G | B(g) ist wahr } ⇔ für alle g ∈ G gilt A(g) ⇒ B(g) D.h. wir sehen hier, dass die Sprache “Aussagelogik” mit Inhalt gefüllt werden und über “Mengenlehre” sprechen kann. Der aussagelogische Kalkül spricht übrigens auch über Schaltkreise: Jeder Variablen ordnet man einen Schalter zu, und einer aussagelogischen Formel entspricht ein ganzes Netzwerk von Schaltern. Dabei wird verabredet, dass eine Variable mit dem Wahrheitswert w zu belegen ist, falls der Schalter sich in dem Zustand ‘Strom fließt’ befindet, und mit f , falls ‘kein Strom fließt’. Die logischen Verknüpfungen zwischen den Variablen lassen sich dann stets durch passende Verdrahtungen zwischen den Schaltern realisieren. So entspricht beispielsweise ‘a ∨ b’ der Parallel– und ‘a ∧ b’ der Reihenschaltung der zu a und b gehörigen Schalter, die Negation erhält man durch Umkehrung der Schalterstellung. Man kann sich überlegen, dass diese Schaltelemente zusammen mit der Negation in der Tat ausreichen, um jede auch noch so komplizierte Schaltung aufzubauen. Zum Beispiel besitzt die Treppenhausschaltung (Licht soll ein- bzw. ausgeschaltet werden, wenn irgendwo im Treppenhaus der Schalter umgelegt wird) mit zwei Schaltern a und b und einem Ausgang L (an dem die Lampe hängt) nach Festlegung des Zustands “Dunkelheit im Treppenhaus” die Wahrheitstafel a b L f f f f w w w f w w w f und wird modelliert durch die Formel L = (¬a ∧ b) ∨ (a ∧ ¬b). Die Vereinfachungen, die man durch äquivalente Umformung der modellierenden aussagelogischen Formeln erhält, führen oft zu Vereinfachung beim Aufbau von Schaltungen. Quantoren Es ist günstig, häufig benutzte Sprechweisen abzukürzen. Sehr wichtig sind die Quantoren ∀ (“für alle”) und ∃ (“es gibt ein”). So ist etwa für M ⊆ Z ∃S ∈ Z ∀m ∈ M gilt m ≤ S die Aussage “Die Menge M ist beschränkt”. Man beachte, dass man die Reihenfolge von Quantoren auf keinen Fall ändern darf; denn z.B. ∀m ∈ M ∃S ∈ Z mit m ≤ S 4 Mathematik für Physiker und Informatiker I (Kurzskript) beschreibt eine Eigenschaft, die jede Teilmenge von Z besitzt.– Praktisch sind Quantoren, um die Negation einer Aussage zu bestimmen: Man tauscht überall ∃ und ∀ gegeneinander aus und negiert die ganz rechts stehende Aussage. So ist eine Menge M ⊆ Z unbeschränkt, falls ∀S ∈ Z ∃m ∈ M mit m 6≤ S bzw. ∀S ∈ Z ∃m ∈ M mit m>S Auch für Quantoren gibt es eine entsprechende Konstrukion für Mangen. Dabei ist ∃ mit der Vereinigung von Mengen, und ∀ mit deren Durschnitt verknüpft: Ist A eine Menge von Indizes α, so bezeichnet man ein System von Mengen Mα , α ∈ A, als eine (über A indizierte) Familie von Mengen. Man setzt [ Mα = {m ∈ G | ∃α ∈ A mit m ∈ Mα } sowie α∈A \ Mα = {m ∈ G | ∀α ∈ A gilt m ∈ Mα } α∈A Streng genommen betreten wir hier recht dünnes Eis; denn wir trauen uns ja zu, eine beliebig große Anzahl (und das kann in der Mathematik sehr groß sein) von Aussagen auf einmal in den Griff zu bekommen. I. Zahlen 1. Ganze Zahlen A. Vollständige Induktion oder: Wann ist eine Teilmenge von N gleich N? Gilt für eine Menge M von natürlichen Zahlen • 1∈M • ∀m ∈ M gilt m + 1 ∈ M , so ist M = N. Die Tatsache, dass jede Teilmenge M von N ein kleinstes Element m0 = min M enthält, erlaubt die folgende Variante dieser Aussage: Es gilt M = {n ∈ N | n ≥ m0 }, falls aus m ∈ M folgt m + 1 ∈ M . Anwendung findet diese Beobachtung auf das Prinzip der vollständigen Induktion: Danach kann man eine von n ∈ N abhängige Aussage A(n) für alle n ≥ n0 beweisen, falls man zuerst A(n0 ) beweist (diesen Vorgang nennt man auch den Induktionsanfang) und sodann nachweist, dass A(n+1) aus der Aussage A(n) (Induktionsschritt) folgt. 1 1 Neben der hier erwähnten sind auch die folgende Varianten der vollständigen Induktion sind in Gebrauch: • Gilt A(n0 ) und ∀n ∈ N, n ≥ n0 gilt A(n) ⇒ A(n + 1), Werner, Universität Münster, WS 05/06 5 Nicht nur für Beweise ist diese Technik von Bedeutung; auch Definitionen lassen mit ihrer Hilfe rekursiv durchführen. Beispiele sind die Zeichen “Σ” und “Π” oder auch die rekursive Definition von Folgen. Beispiele Jede Zahl der Form n3 − n, n ∈ N, ist durch 3 teilbar. (Diese Aussage folgt eigentlich aus der Tatsache, dass das Produkt dreier aufeinander folgender Zahlen stets durch 3 teilbar sein muss; wenn man sie bereits kennt, lässt sich diese Aussage bequem durch vollständige Induktion beweisen.) Trägt man zu Beginn eines jeden Jahres einen festen Betrag K zur Bank, der jährlich zu p% verzinst wird, dann beträgt das kurz nach Beginn des nten Jahrs angesparte Kapital p n p n+1 p Kn = K 1 + +K 1+ + ··· + K 1 + +K = 100 100 100 n X p ν . = K 1+ 100 ν=0 Eine Summe dieser Form heißt geometrisch, und durch vollständige Induktion zeigt man, dass für a0 , q ∈ Q gilt n X a0 q ν = a0 ν=0 q n+1 − 1 q−1 h i p n+1 (was hier die sogenannte Rentenformel Kn = K 100 − 1 er1 + p 100 gibt). Eine andere wichtige Summenformel, die durch vollständige Induktion bewiesen werden kann, ist die binomische Formel n X n ν n−ν n (a + b) = a b . ν ν=0 Dabei sind die in ihr auftretenden Binomialkoeffizienten definiert durch n n! n(n − 1) · · · (n − k + 1) = . = k!(n − k)! k(k − 1) · · · 2 · 1 k Der Induktionsschritt macht Gebrauch von der für die ganzen Zahlen 0 ≤ k ≤ n gültigen Beziehung n n n+1 + = k k−1 k so gilt A(n) für alle natürlich Zahlen n ≥ n0 . • Gilt A(n0 ) und ∀n ∈ N, n ≥ n0 gilt A(1), A(2), . . . , A(n) ⇒ A(n + 1), so gilt A(n) für alle natürlich Zahlen n ≥ n0 . 6 Mathematik für Physiker und Informatiker I (Kurzskript) Erklären kann man das Auftreten der Binomialkoeffizienten in der binomi schen Formel, wenn man weiß, dass nk angibt, wieviele verschiedene Teilmengen mit k Elementen eine n-elementige Menge besitzt. B. Algebraische Struktur und Anordnung Auf der Menge Z kann man addieren und multiplizieren. Erinnert sei daran, dass • Multiplikation und Addition das Assoziativ- und Kommutativgesetz erfüllen, • dass es ein Distributivgesetz gibt, welches das Aufeinandertreffen von Addition und Multiplikation regelt • und dass es sogenannte neutrale Elemente 0 und 1 gibt, die durch Addition bzw. Multiplikation eine ganze Zahl nicht verändern. Neben der algebraischen Struktur ist die Anordnung der ganzen Zahlen wichtig. Die Ordnungsrelation “≤” besitzt die Eigenschaft, dass für alle Zahlen p, q und r gilt • p ≤ p (Reflexivität) • p ≤ q und q ≤ r hat zur Folge, dass p ≤ r (Transitivität) • Es gilt stets p < q oder p > q oder p = q Das Aufeinandertreffen von Ordnugs- und algebraischer Struktur wird kontrolliert durch die Tatsache, dass Summe und Produkt positiver Zahlen stets positiv sind. Eine Zahl s heißt obere (untere) Schranke der Menge M ⊆ Z, falls für alle m ∈ M gilt m ≤ s (bzw. m ≥ s). M heißt nach oben (unten) beschränkt, falls M eine obere (untere) Schranke besitzt. Falls M eine obere Schranke besitzt, die in M enthalten ist, so nennt man dieses (eindeutig bestimmte) Element das Maximum oder auch das größte Element von M . Analog definiert man das Minimum (das kleinste Element) von M . Nicht jede Menge ganzer Zahlen besitzt ein Maximum (Minimum). Ergänzung. Die Existenz kleinster natürlicher Zahlen* Man kann kann sich abschließend fragen, ob das Prinzip der vollständigen Induktion aus mehr grunglegenden Axiomen abgeleitet werden kann. Tatsächlich ist dieses Prinzip eng verwandt mit den sogenannten Peano-Axiomen, die die natürlichen Zahlen charakterisieren. Wir gehen hierauf nicht weiter ein, sondern zeigen noch, dass das Prinzip der vollständigen Induktion äquivalent zu der (gleichfalls nützliche) Aussage Jede (nicht leere) Teilmenge M von N besitzt ein kleinstes Element ist: Es sei M ⊆ N nicht leer und U die Menge der unteren Schranken von M , die nicht in M enthalten sind. Wir nehmen nun an, dass M kein kleinstes Element enthält. Dann folgt aus dem Prinzip der vollständigen Induktion, dass U = N, M = ∅ und daraus die Behauptung.— Nimmt man umgekehrt an, dass jede nicht leere Werner, Universität Münster, WS 05/06 7 Menge natürlicher Zahlen ein kleinstes Element besitzt, so ergibt sich daraus das Prinzip der vollständigen Induktion: Es sei M ⊆ N mit 1 ∈ M und k ∈ M ⇒ k + 1 ∈ M . Falls M c = N \ M 6= ∅, enthält diese Menge ein kleinstes Element k. Natürlich ist k 6= 1, und k − 1 ist eine natürliche Zahl, die in M liegen muss. Dann aber ist nach Annahme auch k = (k − 1) + 1 in M , und es gilt nicht: k − 1 ∈ M ⇒ k ∈ M . 2. Grenzwerte A. Die rationalen Zahlen Die algebraische Struktur der Menge Q unterscheidet sich bekanntlich von der auf Z dadurch, dass man beliebige Zahlen durch solche teilen kann, die von Null verschieden sind. Zusätzlich zu den im Abschnitt I.1.A angeführten algebraischen Eigenschaften tritt also der ‘multiplikative’ Teil der Aussage • Für jedes Element q ∈ Q existiert ein multiplikatives und additives Inverses, d.h. es gibt Zahlen −q und q −1 mit q + (−q) = 0 q · q −1 = 1 bzw. All diese Eigenschaften fasst man in einer einzigen Definition zusammen und sagt kurz, dass (Q, +, ·) ein Körper ist. Auch auf Q gibt es eine Ordnung, die wieder die Axiome des Abschnitts I.1.A erfüllt. Die Kurzfassung lautet hier: (Q, +, ·, ≤) ist ein geordneter Körper. Eine große Rolle spielt im folgenden die auf Q definierte Betragsfunktion, |a| = max{a, −a} = a falls a ≥ 0 . −a falls a < 0 Wichtige Beziehungen, die der Betrag für beliebige a, b ∈ Q erfüllt, sind −|a| ≤ a ≤ |a| |ab| = |a||b| sowie die Dreiecksungleichung |a + b| ≤ |a| + |b|. Die Dreiecksungleichung giltP für a1 , . . . , an ∈ Q auch in der Form (vollständiPn ge Induktion!) | ν=1 aν | ≤ nν=1 |aν |. Eine weiter Variante ist ||a| − |b|| ≤ |a − b|. Technisch gesprochen erfordert ein genaueres Rechnen mit Beträgen, Fallunterscheidungen durchzuführen. Wichtig ist die Tatsache, dass durch d(a, b) = |a − b| 8 Mathematik für Physiker und Informatiker I (Kurzskript) der Abstand zwischen den beiden Zahlen a, b ∈ Q definiert wird2 . So ist also für rationale Zahlen a und α > 0 {q ∈ Q | |q − a| ≤ α } = {q ∈ Q | a − α ≤ q ≤ a + α } die Menge der q ∈ Q, die von dem Punkt a einen Abstand haben, der höchstens gleich α ist. B. Es können nicht immer Wurzeln gezogen werden (Teil 1) Man ist daran gewöhnt, dass an jeder Zahlenmenge irgendwann herumgenörgelt wird. Natürlich auch an Q. Unser erster Kritikpunkt: Satz 1 Falls N ∈ N keine Quadratzahl ist, dann gibt es auch kein Element q ∈ Q mit q 2 = N Der Kernpunkt des Beweises ist die Tatsache, dass jede ganze Zahl k ∈ Z eine bis auf die Reihenfolge eindeutig festgelegt Zerlegung in Primfaktoren besitzt: Satz 2 Für jede ganze Zahl k ∈ Z \ {±1} gibt es ein Vorzeichen ε ∈ {±1}, Primzahlen p1 < p2 < . . . < pn sowie Exponenten α1 , . . . , αn ∈ N, so dass k= εpα1 1 pα2 2 · · · pαnn =ε n Y pαν ν . ν=1 Q βµ Ist k = η m µ=1 qµ eine weitere solche Darstellung, so folgt η = ε, m = n, und, falls µ = ν, pν = qµ sowie αν = βµ . Dieser Satz lässt sich durch vollständige Induktion beweisen, was wir hier aber nicht tun wollen. Beim Beweis von Satz 1 nimmt man an, es gäbe doch eine rationale Zahl q ∈ Q (von der wir annehmen dürfen, dass sie positiv ist) mit q 2 = N . Es sei −1 n m Y Y s β pαν ν qµ µ q= = t ν=1 µ=1 eine Darstellung von q mit Hilfe der Primfaktorzerlegung, wobei t 6= 1, da N ja keine Quadratzahl ist. Wir nehemen außerdem an, dass dieser Bruch 2 Warum ist das der Abstand von a und b? Wenn man diese Frage nicht durch Beispiele klären möchte, dann ist dies eine gute Gelegenheit, die axiomatische Methode auszuprobieren. Wenn man nämlich nur davon ausgeht, dass der Abstand von a und b gleich bleibt, wenn man beide Punkte um eine feste Zahl r > 0 verschiebt, und wenn man ferner festlegt, dass der Abstand von q ∈ Q zum Nullpunkt gleich |q| sein soll, dann bleibt für den Abstand zwischen a und b schon nichts anderes mehr als |a − b|. Werner, Universität Münster, WS 05/06 9 gekürzt ist, dass also Zähler und Nenner keine gemeinsamen Primfaktoren mehr enthalten. Es ergibt sich 2αm 2αn 1 2α2 = N q12α1 q22α2 · · · qm p2α 1 p2 · · · pn was, nachdem wir auch N in Primfaktoren zerlegt haben, auf zwei verschie2αn führt. 1 2α2 dene Primfaktorzerlegungen für die Zahl p2α 1 p2 · · · pn Die Zahlenmenge, in der Wurzeln und, allgemeiner, die Nullstellen aller Polynome mit rationalen Koeffizienten enthalten sind, nennt man die Menge der algebraischen Zahlen. Wir sind hier auf dem Weg zur Menge der reellen Zahlen, die viel, viel umfangreicher ist als die Menge der algebraischen Zahlen3 C. Konvergente Folgen Es gibt Folgen von Zahlen, bei denen man zu sehen glaubt, dass ihre Glieder einer Zahl a immer näher kommen und diese ‘letztlich’ erreichen, ohne dass ein Folgenglied den Wert a je wirklich erreicht. Beispiele sind die Werte der Folge 0, 9, 0, 99, 0, 999, 0, 9999, 0, 99999, 0, 999999, . . . , die eine entscheidende Rolle bei der Antwort auf die Frage spielen, ob 0, 9 wirklich gleich 1 ist. Ein bereits den Griechen im Altertum bekanntes Beispiel ist die Folge (tn ) der Momente, zu denen der zehnmal so schnelle Achilles scheinbar vergeblich versucht, eine Schildkröte zu überholen: Starten beide zur selben Zeit, besitzt die Schildkröte einen Vorsprung von 10m und erreicht der schnelle Läufer diesen Punkt nach einer Sekunde, so besitzt die Schildkröte dann immerhin noch eine Vorsprung von 1m. Dieser Vorsprung und die dann jedes Mal neu verstrichene Zeit schmelzen beide um den Faktor 10, wenn Achilles dort ankommt, wo die Schildkröte sich zuvor aufgehalten hat, und so scheint es unmöglich, dass er die Schildkröte überholt. Ein mathematisches Modell für die Behandlung solcher Probleme benutzt den Begriff der konvergenten Folge: Definition 1 Eine Folge (an )n∈N rationaler Zahlen heißt konvergent gegen den Grenzwert a ∈ Q genau dann, wenn Für jede Genauigkeit ε > 0 gibt es einen ersten Folgenindex N (ε) ∈ N, so dass für die N (ε) nachfolgenden Folgenindizes n ≥ N (ε) gilt |a − an | < ε. 3 In der Menge der algebraischen Zahlen sind z.B. π und e noch nicht enthalten, die man aus diesem Grund transzendent nennt. Wenn man genau hinsieht, stellt man fest, dass die Menge der reellen Zahlen von einer neuen Art unendlich ist, eine Unendlichkeit, die die der Zahlenmengen N, Z, Q und selbst die der algebraischen Zahlen übersteigt. 10 Mathematik für Physiker und Informatiker I (Kurzskript) Falls (an )n∈N den Grenzwert a besitzt, so schreibt man lim an = a n→∞ Konvergiert eine Folge gegen Null, so nennt man sie eine Nullfolge. Falls (an ) gegen den Wert a konvergiert, so ist (|a − an |)n∈N eine Nullfolge. Eine 1 gut untersuchte Nullfolge ist n . Ist q ∈ Q, so gilt: 1) Ist |q| < 1, so ist (q n )n∈N eine Nullfolge, 2) für q = 1 ist (q n )n∈N eine Nullfolge, für q = −1 divergiert diese Folge, und 3) für |q| > 1 ist die Folge (q n )n∈N divergent. Der Nachweis im konvergenten Fall gelingt mit Hilfe der für alle n ∈ N und alle δ ≥ −1 gültigen Bernoullischen Ungleichung (1 + δ)n ≥ 1 + nδ, die man mit vollständiger Induktion zeigt. Es folgt nämlich aus 1 > |q| = (1 + δ)−1 , 1 ≥ δ > −1, dass |q n | = (1 + δ)−n < 1 1 < 1 + nδ nδ Der hier ganz rechts stehende Ausdruck ist eine Nullfolge, und wenn man eine Folge nichtnegativer Zahlen erst einmal durch eine Nullfolge nach oben abgeschätzt hat, dann ist sie selbst eine. – Dass die Folge (−1)n divergiert, lässt sich an dieser Stelle nur etwas umständlich herleiten mit Hilfe der Negation der Aussage ‘Es gibt eine Zahl a, gegen die die Folge (an ) konvergiert’, nämlich ∀a ∈ Q ∃ε0 > 0 ∀N ∈ N ∃n ≥ N mit |a − an | ≥ ε. Die Divergenz im Fall |q| > 1 folgt am einfachsten aus (nochmals der Bernoulli Ungleichung sowie) Teil (a) des folgenden Satzes. Satz 3 Es sei (an )n∈N eine gegen a konvergente Folge. Dann gilt (a) (an ) ist beschränkt, d.h. die Menge der Folgenglieder {an | n ∈ N } ist beschränkt. (b) Für jede Zahl b 6= a gibt es einen Index N ∈ N mit der Eigenschaft, dass für alle nachfolgenden Indizes n ≥ N jeweils gilt |an − b| > |a − b| . 2 Insbesondere ist der Grenzwert der Folge (an )n∈N eindeutig bestimmt. Werner, Universität Münster, WS 05/06 11 Für den Beweis der ersten Aussage wählt man für ε = 1 den Index N1 ∈ N, für dessen Nachfolger n ∈ N gilt |a − an | < 1. Für diese Indizes ist dann nach der Dreiecksungleichung |an | ≤ 1 + |a|, so dass für alle Indizes n ∈ N gilt |an | ≤ max{|a1 |, . . . , |aN |, 1 + |a|} Im Teil (b) wählt man den Startindex N ∈ N für den Wert ε = Falls n ≥ N, folgt |an − b| ≥ |b − a| − |a − an | > 1 2 |a − b|. |a − b| . 2 D. Grenzwertsatz und Beispiele Satz 4 Es seien (an )n∈N , (bn )n∈N und (cn )n∈N Folgen, (an )n∈N und (bn )n∈N seien konvergent mit limn→∞ an = a und limn→∞ bn = b. Dann gilt (a) Die Folgen (an + bn )n∈N und (an bn )n∈N konvergieren mit lim an + bn = a + b n→∞ und lim an bn = ab n→∞ Falls b 6= 0, dann gibt es einen Index N ∈ N mit bn 6= 0 für n ≥ N und −1 die ab diesem Index definierte Folge an b−1 n konvergiert gegen ab . (b) Gilt von einem gewissen Index N ∈ N an, dass an ≤ bn , so folgt a ≤ b. (c) Ist a = b und für n ≥ N stets an ≤ cn ≤ bn , dann konvergiert auch (cn ) gegen den gemeinsamen Grenzwert von (an ) und (bn ). Für die Summenfolge wird N (ε) = max{Na (ε/2), Nb (ε/2)} gewählt (wobei Na (ε) und Nb (ε) die zu ε > 0 gehörenden Startindizes für die Folgen (an ) und (bn ) sind) und mit der Dreiecksungleichung abgeschätzt. Im Fall der Produktfolgen nutzt man die Beschränktheit konvergenter Folgen, wählt M > 0 mit |bn | ≤ M für alle n ∈ N und schätzt für einen Index n ∈ N ab |ab − an bn | ≤ |a||b − bn | + M |a − an |. Ist nun N ∈ N so groß gewählt, dass für n ≥ N |a − an | < ε 2M und |b − bn | < ε , 2 + 2|a| dann folgt |ab − an bn | < ε. Für die Aussage über die Quotienten reicht es, von der konstanten Folge an = 1 auszugehen. Nach Satz 3(b) gibt es N ∈ N, 12 Mathematik für Physiker und Informatiker I (Kurzskript) so dass für alle n ≥ N stets |bn | > |b|/2 ist. Für diese Indizes sind alle Brüche wohldefiniert, und es folgt außerdem 1 − 1 < 1 |b − bn |, b bn 2|b|2 so dass für N (ε) = max{N, Nb (2ε|b|2 )} und n ≥ N (ε) folgt |1/b − 1/bn | < ε. Wäre im Teil (b) a > b, dann würde ab einem passend gewählten Index N gleichzeitig gelten an > a − a−b a+b = 2 2 sowie bn < b + a−b a+b = , 2 2 was der Bedigung an ≤ bn widerspricht. Für den Teil (c) schließlich wählt man N (ε) = max{Na (ε), Nb (ε)}, so dass also für n ≥ N(ε) gilt [an , bn ] ⊆ (a−ε, a+ε). Da aber nach Annahme cn ∈ [an , bn ] muss auch cn ∈ (a−ε, a+ε), folglich |a − cn | < ε. Ein wichtiges Besipiel: Für |q| < 1 gilt ∞ X a0 q ν := lim ν=0 n→∞ n X a0 q ν = ν=0 a0 . q−1 Die letzte Beziehung zeigt: Die Zahl 0, 9, die nicht anders als ein Grenzwert definiert werden kann, ist gleich 1; und auch Achilles holt die Schildkröte schließlich nach 10 9 Sekunden ein, wenn man sich gestattet, die geschilderte Aufholjagd mit Hilfe einer konvergenten Folgen von Zeiten zu modellieren. Wir benötigen im Folgenden weitere Beispiele. Wir werden nun bereits Wurzeln ziehen, ohne zunächst weiter auf den Zahlbereich einzugehen, für den das möglich ist. Wichtige weitere Grenzwerte sind (für a > 0): √ √ lim n a = 1 sowie lim n n = 1. n n Im ersten Fall reicht es wegen des Teils (a) des Grenzwertsatzes, von a > 1 auszugehen. Man setzt für diesen Fall a = (1 + δn )n , δn > 0, schätzt mit Hilfe der Bernoulli-Ungleichung ab und erhält δn < (a−1)/n. Für die zweite Folge erhält man in ähnlicher Weise durch einen weiteren Rückgriff auf die binomische Formel r n 2 2 n n = (1 + δn ) > δn sowie δn < . 2 n−1 E. Teilfolgen Die Folge an = (−1)n hatten wir bereits als divergent indentifiziert — etwas umständlich durch die Negation des Konvergenzkriteriums oder, mehr anschaulich, aufgrund Werner, Universität Münster, WS 05/06 13 der Tatsache, dass sie sich nicht zwischen −1 und 1 entscheiden kann. Dieser letzte Gesichtspunkt soll hier noch etwas genauer erläutert werden. Die Idee, dass Folgen aus vielen anderen “zusammengesetzt” sein können (die u.U. gegen verschiedene Grenzwerte konvergieren können) wird durch die folgende Definition präzisiert: Definition 2 Es sei (an ) eine Folge und (nk )k∈N eine Folge streng monoton wachsender natürlicher Zahlen. Dann nennt man die Folge (ank )k∈N eine Teilfolge der Folge (an ). Dabei nennt man eine Folge (an ) (streng) monoton wachsend, wenn für alle n ∈ N gilt an ≤ an+1 (bzw. an < an+1 ). In ähnlicher Weise definiert man (streng) monoton fallende Folgen. Satz 5 Eine Folge (an ) konvergiert genau dann, wenn jede ihrer Teilfolgen dies tut. Der Grenzwert einer Teilfolge stimmt in diesen Fällen mit dem Grenzwert der gesamten Folge überein. Da jede Folge Teilfolge ihrer selbst ist, folgt deren Konvergenz aus der Konvergenz aller Teilfolgen. Ist umgekehrt (an ) gegen a konvergent, (ank ) eine Teilfolge und N (ε) der zu ε > 0 gehörige Startindex, so gilt wegen k ≤ nk für alle k ∈ N (vollständige Induktion!), dass |a − ank | < ε für alle k ≥ N(ε). Die uns bereits bekannte Folge an = (−1)n zerlegt sich nun tatsächlich in die beiden Teilfolgen amk und ank mit mk = 2k, nk = 2k − 1, es gilt limk→∞ amk = 1 sowie limk→∞ ank = −1, und, nun wissen wir es ganz genau, (an ) kann nicht konvergieren.– Im Folgenden werden auch Teilfolgen der Form (an+n0 ), n0 ∈ N fest, eine wichtige Rolle spielen. Der O(n)-Kalkül* Ein wesentlicher Bestandteil im Umgang mit Folgen ist das Abschätzen komplizierter Terme durch einfache, die das Verhalten der komplizierten gut widerspiegeln, zugleich aber in ihrem Verhalten für große n leichter zu beurteilen sind. Häufig benutzt wird hierzu der sogenannte O-Kalkül: Von einer Folge (an ) sagt man, sie wachse für n → ∞ (wenigstens) von der Ordnung ϕ(n), ϕ eine auf N definierte Funktion, Funktion, falls es eine Zahl M ≥ 0 gibt mit der Eigenschaft, dass |an | ≤ M ϕ(n) für alle n ∈ N, n ≥ N0 . In diesem Fall schreibt man auch an = O(ϕ(n)) für n → ∞. Beispiele: Falls es ein α ∈ N und an = O(nα ) für n → ∞, so sagt man auch, (an ) besitzt polynomiales Wachstum. Z.B. gilt an = O(nk√) für jede durch ein Polynom definierte Folge √ an = Ak nk + Ak−1 nk−1 + . . . + A1 n + A0 , n + 1 − n = O(n−1/2 ), und, wie gesehen, gilt für jedes a > 0 √ √ n n a − 1 = O(n−1 ) sowie n − 1 = O(n−1/2 ). 14 Mathematik für Physiker und Informatiker I (Kurzskript) 3. Reelle Zahlen A. Konvergenz ohne einen Grenzwert zu kennen Wie berechnet man die Wurzel aus einer gegebenen Zahl a, zumindest approximativ, in systematischer Weise, ohne zu probieren, also direkt mit einem (vielleicht sogar programmierbaren) Algorithmus? Ein bekannter Versuch (der auf dem Newton-Verfahren und damit letztlich auf dem Banachschen Fixpunktsatz basiert) besteht darin, zu versuchen √ einen Schätzwert an für a durch 1 a an+1 = an + 2 an zu verbessern. Beginnt man etwa mit dem (meist nicht besonders klug gewählten) Schätzwert a0 = 1, so gelangt man zu einer (rekursiv definierten) Folge, von der es ohne Weiteres nicht ganz leicht ist zu sehen, ob sie konvergiert. Eins jedoch ist klar: Falls sie das tut, so muss auch die Teilfolge (an+1 ) gegen denselben Grenzwert w konvergieren, und es folgt 1 a a = lim an = lim an+1 = a+ . n→∞ n→∞ 2 a Da stets an > 0, müsste a die Quadratwurzel von a sein. Warum sollte nun die Folge (an ) konvergieren? Man kann in diesem Fall nur sehr indirekt zu Werke gehen. Eine einfache Rechnung zeigt, dass gilt 2 1 x 1 2 an −x = an−1 − (a2 −x) > 0, >0 sowie an −an+1 = 4 an−1 2an n woraus folgt, dass (an ) für n ≥ 1 monoton fallend und nach unten beschränkt ist. Man kann es anschaulich überzeugend finden, dass dieses Verhalten einer Folge deren Konvergenz erzwingen sollte. In einer anderen Verkleidung kommt dieselbe Struktur bei dem Begriff der Intervallschachtelung zum Tragen. Dies ist eine Folge (In ) von abgeschlossenen Intervallen In = [an , bn ] mit den beiden Eigenschaften • Für alle n ∈ N gilt In+1 ⊆ In sowie • limn→∞ (bn − an ) = 0 Wenn man will kann man eine Intervallschachtelung als die Idealisierung einer sich fortwährend verbessernden Messung einer Naturkonstanten ansehen; nicht zuletzt von diesem Standpunkt aus sollte eine Intervallschachtelung dann genau einer SZahlëntsprechen, nämlich der einzigen, die in allen Intervallen zugleich enthalten ist. Eins ist aber völlig klar: Es gibt Folgen von rationalen Zahlen, von denen man allen Grund hat anzunehmen, dass sie konvergent sind, die aber auf keinen Fall einen Grenzwert in Q besitzen können. Werner, Universität Münster, WS 05/06 15 Ein sehr kluger, bei Anfängern dennoch nicht besonders beliebter, aber sehr universell einsetzbarer Versuch, Konvergenz ohne Kenntnis des Grenzwerts zu verstehen, geht auf den französischen Mathematiker Cauchy4 zurück und lautet Definition 3 Eine Folge (an ) heißt Cauchy-Folge genau dann, wenn es für jedes ε > 0 ein N (ε) ∈ N gibt, so dass für alle Indizes n, m ≥ N (ε) gilt |am − an | < ε. Diese Definition sieht vielleicht plausibel aus, scheint aber nicht unbedingt einfach zu verwenden zu sein. Es gibt aber sehr einfache hinreichende Kriterien für das Vorliegen einer Cauchy-Folge: Satz 6 Eine Folge (an ) ist eine Cauchy-Folge, falls sie (a) konvergiert oder (b) monoton wächst (fällt) und nach oben (unten) beschränkt ist. Der erste Teil folgt aus der Beobachtung, dass für m, n ≥ Na (ε/2) gilt |an − am | ≤ |an − a| + |a − am | < ε. Für den zweiten Teil nimmt man an, dass (die monoton wachsende, nach oben beschränkte Folge) (an ) keine Cauchy-Folge ist, also ∃ε0 > 0 ∀N ∈ N ∃m, n ≥ N mit |an − am | ≥ ε0 . Unter diesen Umständen kann man (durch vollständige Induktion) zwei Folgen (mk ), (nk ) natürlicher Zahlen finden mit m1 < n1 < m2 < n2 < . . . < mk < nk < mk+1 < nk+1 < . . . und amk > ank + ε0 . Es folgt amk > ank + ε0 ≥ amk−1 + ε0 > ank−1 + 2ε0 ≥ . . . > an1 + (k + 1)ε0 , und das übertrifft bei freier Wahl von k ∈ N jede obere Schranke. Die wichtige Frage aber ist: Konvergieren Cauchy-Folgen? Und da wissen wir bereits, dass dies für die Zahlenmenge Q nicht der Fall ist. B. Supremum, Infimum und Häufungswert Bevor wir die Menge der rationalen Zahlen zu der Menge der reellen Zahlen erweitern, benötigen wir ein paar weitere Begriffe. 4 http://www-groups.dcs.st-and.ac.uk/ history/Biographies/Cauchy.html 16 Mathematik für Physiker und Informatiker I (Kurzskript) Es sei M eine Teilmenge eines geordenten Zahlenkörpers K5 sowie OM = {k ∈ K | ∀m ∈ M gilt m ≤ k } und UM = {k ∈ K | ∀m ∈ M gilt m ≥ k } die Menge der oberen bzw. unteren Schranken von M . Falls OM ein kleinstes Element enthält, so nennt man dies das Supremum von M und bezeichnet es mit sup M . In genau derselben Weise verfährt man mit UM und gelangt zum Begriff es Infimums einer Menge M . Besitzt M ein größtes (kleinstes) Element, so ist dieses stets das Supremum (Infimum) von M . Auf der anderen Seite besitzt die Menge (a, b) = {q ∈ Q | a < q < b } weder ein kleinstes noch ein größtes Element. Hier sind O(a,b) = {q ∈ Q | q ≥ b } = [b, ∞), U(a,b) = {q ∈ Q | q ≤ a } = (−∞, a], und sup(a, b) = b sowie inf(a, b) = a. Definition 4 Ein Punkt p ist ein Häufungswert der Menge M falls es für jedes ε > 0 ein Element m in M gibt, so dass |p − m| < ε. Wählt man zu jedem n ∈ N einen Punkt mn ∈ M mit |p − mn | < 1/n, so erkennt man, dass p ein Häufungswert genau dann ist, wenn es eine Folge in M gibt, die gegen p konvergiert. Wir nennen im folgenden eine Menge der Form Uε (p) = {k ∈ K | |k − p| < ε } eine ε-Umgebung des Punktes p. Satz 7 (i) Die Zahl s ist das Supremum der Menge M genau dann, wenn s zugleich obere Schranke und Häufungswert von M ist. (ii) Eine monoton steigende (fallende) Folge (an ) konvergiert genau dann, wenn das Supremum der Menge (Infimum) der Folgenglieder existiert. In einem solchen Fall ist lim an = sup {an | n ∈ N } . n→∞ Das Supremum von M ist eine obere Schranke. Wäre s kein Häufungswert von M , dann gäbe es in einer ε-Umgebung U von s kein weiteres Element aus M und damit aber viele weitere obere Schranken von M , die echt kleiner als s sind. Ähnlich sieht man, dass es zu einer oberen Schranke von M , die zugleich Häufungswert dieser Menge ist, keine wirklich kleinere obere Schranke von M geben kann.— Für den Beweis der zweiten Aussage sei 5 Wer will, kann sich hier immer noch Q vorstellen, obwohl im kommenden Abschnitt die folgende Definition für den Körper der reellen Zahlen benutzt wird. Auch braucht man für die Definition weder Addtion noch Multiplikation sondern nur eine Ordnungsrelation. Werner, Universität Münster, WS 05/06 17 s = sup {an | n ∈ N } sowie ε > 0. In der ε-Umgebung gibt es dann (nach dem ersten Teil dieses Satzes) wenigstens ein Folgenglied aN (ε) . Da an monoton wächst, liegen auch alle nachfolgenden Folgenglieder in dieser ε-Umgebung, und (an ) konvergiert gegen s. Umgekehrt muss der Grenzwert einer monoton wachsenden Folge eine obere Schranke sein. Da er zugleich Häufungswert der Menge der Folgenglieder ist, ist er deren Supremum. C. Der Zahlkörper R: Charakterisierung und Eigenschaften Satz 8 Es gibt (im wesentlichen) genau einen (archimedisch) geordneten Zahlenkörper (R, +, ·, ≤), in dem jede Cauchy-Folge bezüglich des Betrags |r| = max{r, −r} einen Grenzwert besitzt. In einem solchen Körper findet man übrigens (zuerst N durch mehrfache Addition des neutralen Elements der Multiplikation, dann Z durch Subtraktion und schließlich) die Elemente von Q (durch Division) wieder, so dass Q also in R ‘eingebettet’ ist. Da wir bisher bei unseren Überlegungen über Q nur die Tatsache verwendet haben, dass Q ein geordneter Körper ist, können wir alle Definition auch in derselben Weise für reelle Zahlen aussprechen und dann mit diesen genau dieselben Sätze beweisen. Wir werden hiervon im folgenden stets Gebrauch machen, ohne darauf jedes Mal hinzuweisen. Satz 9 In der Menge R gilt: (i) Jede monoton wachsende (fallende) und nach oben (unten) beschränkte Folge ist gegen ihr Supremum (Infimum) konvergent. Ganz allgemein besitzt jede nach oben (unten) beschränkte Menge in R ein Supremum (Infimum). (ii) Für jede Intervallschachtelung (In ) aus R gibt es genau einen Punkt ξ ∈ R mit \ In = {x ∈ R | x ∈ In für alle n ∈ N } = {ξ}. n∈N Der Beweis des ersten Teils wird hier nicht weiter ausgeführt. Für den Beweis von Teil (ii) beobachtet man, dass für die Randpunktfolgen (an ), (bn ) der Intervallfolge In = [an , bn ] gilt a1 ≤ a2 ≤ . . . ak ≤ ak+1 ≤ . . . bk+1 ≤ bk ≤ . . . ≤ b2 ≤ b1 . Dies zeigt, dass (an ) monoton wächst, nach oben (durch b1 ) beschränkt ist, und dass (bn ) monoton fällt und nach unten (durch a1 ) beschränkt ist. Aufgrund des ersten Teil des Satzes konvergieren beide Folgen. Wegen limn→∞ bn −an = 0 besitzen sie denselben Grenzwert ξ. T Da ξ = sup {an | n ∈ N } = inf {bn | n ∈ N } folgt ξ ∈ n∈N In . Eine weitere, von ξ verschiedene Zahl η, etwa η < ξ, in diesem Schnitt würde der Tatsache 18 Mathematik für Physiker und Informatiker I (Kurzskript) widersprechen, dass ξ die kleinste obere Schranke der Menge {an | n ∈ N } ist. Man kann R übrigens als Menge definieren, deren Elemente aus Mengen gleichartiger Cauchy-Folgen von rationalen Zahlen bestehen. Zwei CauchyFolgen sieht man dabei als gleichartig an, wenn sie anscheinend dieselbe Zahl in der Menge R beschreiben werden, d.h. wenn die Folge der Differenzen eine Nullfolge bildet. Es ist sehr zeitraubend, den Nachweis zu erbringen, dass eine solche Menge auch wirklich die oben angeführten Eigenschaften besitzt. Insbesondere ergibt sich, dass es für jede reelle Zahl r ∈ R eine Folge rationaler Zahlen gibt, die gegen r konvergiert. — R ist tatsächlich sehr viel größer als die Menge der algebraischen Zahlen A, der Bereich, aus dem fast alle Zahlen der Schulmathematik stammen, und der aus allen Nullstellen von Polynomen mit rationalen Koeffizienten besteht. Während die Elemente von A noch als Folge geschrieben werden können, ist dies mit den Elementen von R nicht möglich, R ist überabzählbar. 3. Komplexe Zahlen A. Es können nicht immer Wurzeln gezogen werden (Teil 2) Bekanntlich besitzt die Gleichung x2 + 1 = 0 keine Lösung über den reellen Zahlen, was oft unpraktisch ist. Wer kühn genug ist, kann eine Lösung dieser Gleichung i nennen (die andere ist dann −i) und versuchen, mit dieser Zahl einen neuen Zahlkörper aufzumachen, einer Menge also mit Produkt und Addition, die sich beide so verhalten wie diese Operationen auf Q. Und natürlich sollte man davon ausgehen, dass i zu den reellen Zahlen hinzugefügt wird. Denkt man diesen Gedanken zu Ende so gelangt man zu der Menge C = {x + iy | x, y ∈ R } mitsamt den Verknüpfungen (x1 + iy1 ) + (x2 + iy2 ) = x1 + x2 + i(y1 + y2 ) sowie (x1 + iy1 )(x2 + iy2 ) = x1 x2 − y1 y2 + i(x2 y1 + x1 y2 ). Für eine komlexe Zahl z = x + iy heißt x = Re z der Real-, y = Im z der Imaginärteil von z. Die zu z konjugierte Zahl ist z = x − iy, und der Betrag von z ist durch p √ |z| = zz = x2 + y 2 erklärt. Die Konjugation komplexer Zahlen ermöglicht es auch, in einfacher Weise den Quotienten zweier komplexer Zahlen zk = xk + iyk , k = 1, 2 zu berechnen, z1 z 2 z1 x1 x2 + y1 y2 + i(x2 y1 − x1 y2 ) = = . 2 z2 |z2 | x22 + y22 Die Art, wie die Addition zweier komplexer Zahlen funktioniert, erinnert stark an die Addition zweier Vektoren der Ebene. In der Tat stellt man Werner, Universität Münster, WS 05/06 19 sich komplexe Zahlen am besten als Punkte in der Ebene vor. Üblicherweise trägt man den imaginären Anteil einer komplexen Zahl entlang der y- und den reelle Anteil entlang der x-Achse ab. In dieser Weise wird die Addition tatsächlich zur Vektoraddition, der Betrag von z ist der Abstand des zugehörigen Punktes vom Ursprung und die komplexe Konjugation entspricht der Spiegelung an der x-Achse. Der (euklidische) Abstand zwischen zwei komplezen Zahlen z1 und z2 ist so durch |z1 − z2 | gegeben. Um auch die Geometrie des Produkts zu verstehen, benutzt man am besten ebene Polarkoordinaten: Jede komplexe Zahl lässt sich als z = (|z|, ϕ) = |z|(cos ϕ + i sin ϕ) schreiben, wobei man ϕ stets so wählt, dass ϕ ∈ [0, 2π). (Anschaulich wird hier jeder ebene Vektor durch Länge und Richtung beschrieben.) Einzig der Nullpunkt ist kritisch: Für diesen ist |z| = 0 und ϕ im Prinzip beliebig. Mit Hilfe der Polarkoordinaten lässt sich das Produkt zweier komplexer Zahlen nun geometrisch deuten: Für zi = (ri , ϕi ), i = 1, 2, gilt nämlich unter Verwendung der trigonometrischen Additionstheoreme (r1 , ϕ1 ) · (r2 , ϕ2 ) = (r1 r2 , ϕ1 + ϕ2 ) Dabei sind die erhaltenen Winkel durch Addition ganzzahliger Vielfacher von 2π auf einen Wert im Intervall [0, 2π) zu normalisieren. Hieraus ergeben sich die n Wurzeln der Zahl (r, ϕ) als √ ϕ + 2kπ n r, , k = 0, . . . , n − 1. n Wiederum ist es der Abstandsbegriff, der es erlaubt, die Konvergenz von Folgen zu definieren: Definition 5 Die Folge (zn ) komplexer Zahlen konvergiert gegen den Punkt z ∈ C genau dann, wenn gilt lim |zn − z| = 0. n→∞ Tatsächlich geschieht hier nicht wirklich etwas Neues: Satz 10 Die komplexe Folge (zn ) konvergiert gegen z ∈ C genau dann, wenn lim Re zn = Re z n→∞ sowie lim Im zn = Im z. n→∞ Konvergieren nämlich die Elemente zn = xn + iyn gegen z = x + iy, so folgt eine Richtung dieser Aussage aus p |x − xn | ≤ |x − xn |2 + |y − yn |2 = |z − zn | 20 Mathematik für Physiker und Informatiker I (Kurzskript) bzw. |y −yn | ≤ |z −zn |. Die andere Richtung aber ist eine einfache Folgerung aus den Grenzwertsätzen sowie der Tatsache, dass für eine Folge (an ) positi√ √ ver, gegen a konvergenter Zahlen gilt limn→∞ an = a (die Stetigkeit der Wurzelfunktion, eine Eigenschaft von Funktionen, über die noch gesprochen werden muss). Ein interessantes Beispiel ist die Folge (q n ) mit q ∈ C und |q| = 1. Ist für das Argument ϕ von q die Zahl ϕ/π rational, so besitzt die Folge (q n ) genau endlich viele Häufungspunkte. Ist jedoch ϕ/π irrational, so liegen die Folgenglieder q n dicht im ganzen Einheitskreis. Die bisher besprochenen Definitionen und Sätze über relle Folgen und Reihen erlauben es fast immer, sie direkt auf den komplexen Fall zu übertragen. Zumeist reicht es, die reelle durch die komplexe Betragsfunktion zu ersetzen. So zeigt man z.B. ganz ähnlich wie zuvor, dass eine Folge komplexer Zahlen (zn ) eine Cauchy-Folge genau dann ist, wenn die Folgen der Real- bzw. der Imaginärteile dies ist. Damit (und Satz 25) konvergiert eine Folge in C (genau wie in R) genau dann, wenn sie eine Cauchy-Folge ist. — Nicht möglich ist eine Übertragung solcher Resultate, wenn man im reellen Fall die Anordnung dieser Zahlen berücksichtigen muss. B. Reihen Ist (an ) eine Folge (komplexer oder reeller Zahlen), so bezeichnet der Ausdruck ∞ X an n=1 P P N die Folge der Partialsummen (sN ) = a . Man nennt ∞ n n=1 an eine n=1 N Reihe. Konvergiert die Folge der Partialsummen,Pso spricht man von einer konvergenten Reihe. Für eine konvergente Reihe ∞ n=1 an ist (an ) stets eine Nullfolge, die Umkehrung gilt nicht: Die harmonische Reihe ∞ X 1 1 1 1 1 1 1 1 =1+ + + + + + + + ··· > n 2 3 4 5 6 7 8 n=1 1 1 1 1 1 1 1 1 1 1 >1+ + + + + + + + ··· = 1 + + + + ··· 2 4 4 8 8 8 8 2 2 2 divergiert. P Eine Reihe heißt absolut konvergent genau dann, wenn ∞ n=1 |an | konvergiert. Eine absolut konvergente Reihe ist konvergent, die Umkehrung gilt P∞ n −1 nicht: n=1 (−1)Pn konvergiert aber nicht absolut. DaP die Folge der Par∞ tialsummen von ∞ |a | monoton wächst, konvergiert n n=1 n=1 an nach Satz Pn 7 (ii) in R genau dann, wenn ( ν=1 |aν |)n eine beschränkte Folge ist. Ein sehr wichtiges Beispiel: Für |q| < 1 ist ∞ X ν=0 qν = 1 , q−1 und diese Konvergenz ist absolut. Für |q| ≥ 1 divergiert die Reihe. Werner, Universität Münster, WS 05/06 21 P∞ P Satz 11 Es seien ∞ n=1 bn Reihen. Dann gelten die folgenden n=1 an und Konvergenzkriterien. P Majorantenkriterium Ist |a | ≤ b und bn konvergent, so konvergiert n n P an absolut. P Minorantenkriterium Pbn divergiert, falls für fast alle Indizes n ∈ N gilt 0 ≤ an ≤ bn und an divergiert P Quotienten- und Wurzelkriterium an konvergiert absolut, falls es einen Index N0 ∈ N sowie eine positive Zahl q gibt, so dass für alle n ≥ N0 gilt p an+1 n |an | ≤ q < 1. oder an ≤ q < 1 P Die Reihe an divergiert für den Fall, dass für alle n ≥ N0 gilt p an+1 n oder |an | > 1 für unendlich viele n. an > 1, Leibniz-Kriterium Eine Reihe der Form ∞ X (−1)n an n=1 konvergiert immer dann, wenn die Nullfolge (an ) streng monoton fällt und an ≥ 0 ist. Cauchysche Verdichtungskriterium Ist an ≥ 0 und an+1 ≤ an , so konP vergiert die Reihe an genau dann, wenn ∞ X 2k a2k k=1 dies tut. Das Majoranten- bzw. Minorantenkriterium ergibt sich aus der Tatsache, dass für eine Reihe mit positiven Summanden Konvergenz äquivalent zur Beschränktheit der Folge der Partialsummen ist (Satz 9, Satz 3(a)): PN Falls bn ≥ |an | für fast alle n ∈ N, so ist jede einzelne Partialsumme n=1 |an | P durch N Folgenglieder von n=1 bn beschränkt, und dieselbe Schranke, die die PN PN ( n=1 |an |)N ∈N beschränkt, kann auch von den Zahlen n=1 bn nicht übertroffen werden. Ganz ähnlich aus der P folgt im Fall des Minorantenkriteriums P Unbeschränktheit von an die der Partialsummen von bn ,P die ja alle mindestens so stark wachsen, wie die Partialsummen der Reihe an . Für Wurzel- und Quotientenkriterium wendet man das Majoranten- bzw. Minorantenkriterium an, unter Ausnutzung des bekannten p Konvergenzverhaltens der geometrischen Reihe: Falls für n ≥ N0 gilt n |an | < 1, so ist 22 Mathematik für Physiker und Informatiker I (Kurzskript) P n n , und die Reihe ür diese Indizes |an | < qp q ist eine konvergente Man jorante. Ist andererseits |a | > 1 für unednlich viele Indizes n, so kann n P an nicht konvergieren, da (an ) keine Nullfolge ist. Falls für alle n ∈ N ab einem Startindex n0 gilt |an+1 ||an |−1 ≤ q < 1, so ist von da an stets n−n0 |a |, so dass wiederum eine |an+1 | ≤ q|an |, und induktiv folgt |aP n| ≤ q n0 konvergente geometrische Reihe — n (|a0 |q −n0 )q n — eine Majorante ist. Falls |an+1 ||an |−1 > 1 für n ≥ n1 gilt, so ist dann stets |an+1 | > |an | und auch hier kann (an ) keine Nullfolge sein6 . Im Fall des Leibnizkriteriums folgt aus der Tatsache, dass (an ) streng monoton fällt 2N +2 X (−1)n an = a2N +2 − a2N +1 + n=1 2N X (−1)n an < n=1 2N +1 X 2N X (−1)n an sowie n=1 n (−1) an = −a2N +1 + a2N + 2N −1 X n=1 n (−1) an > n=1 2N −1 X (−1)n an . n=1 P2N −1 P n n Wegen 2N n=1 (−1) an ist daher die aus den Partialsumn=1 (−1) an > men sN gebildete Folge ([s2N , s2N −1 ]) eine Intervallschachtelung, deren innerer Punkt der Grenzwert der betrachteten Reihe sein muss.— Das LeibnizKriterium gilt natürlich in derselben Weise, wenn (an ) streng monoton wächst und an ≤ 0 ist für alle n ∈ N. Für das Cauchysche Verdichtungskriterium benutzt man die Beziehungen N N X 1X k 2 a2k ≤ a1 + 2 k 2 X k=1 n=2k−1 +1 k=0 N an = 2 X n=1 N −1 2k+1 X X−1 an = a2N + an ≤ k=0 n=2k Das Cauchysche erlaubt es, Reihen der Form P Verdichtungskriterium −p ln n auf Konvergenz zu untersuchen. oder auch ∞ n n=1 N X 2k a2k k=0 P∞ n=1 n −p Die Aussagen von Wurzel- und Quotientenkriterium kann man recht prägnant mit Hilfe von ausgezeichneten Häufungspunkten der Folge (an ) formulieren. Ist (an ) eine reelle Folge, so bezeichnet man mit lim supn→∞ an und lim inf n→∞ an das Supremum bzw. Infimum aller Häufungspunkte von (an ). Beide Zahlen sind ihrerseits Häufungspunkte7 . Nun gilt aber 6 Zu bemerken ist, dass das Quotientenkriterium im allgemeinen einfacher zu handhaben ist, das Wurzelkriterium aber oft auch dann noch Ergebnisse liefert, wenn das Quotientenkriterium versagt. Es gilt genauer: lim inf n p p |an+1 | |an+1 | ≤ lim inf n |an | ≤ lim sup n |an | ≤ lim sup n |an | |an | n n für alle (beschränkten) Folgen (an )(vgl. Rudin,Principles of Mathematical Analysis, pp. 59) 7 Man hat es ja beim Beweis dieser Aussage mit einer Folge ((ank,` )k∈N )`∈N von Teil- Werner, Universität Münster, WS 05/06 23 • lim sup αn < A ist äquivalent zu der Tatsache, dass für ein N0 ∈ N und alle n ≥ N0 gilt αn < A, und aus lim sup αn > A folgt αn > A für unendlich viele n ∈ N. • lim inf αn > A ist äquivalent zu der Tatsache, dass für ein N0 ∈ N und alle n ≥ N0 gilt αn < A, und aus lim inf αn < A folgt αn > A für unendlich viele n ∈ N. Damit gilt unterPden Voraussetzungen des Wurzel- und Quotientenkriteriums: Die Reihe an konvergiert absolut, falls an+1 <1 lim sup an n bzw. lim sup n p n |an | < 1, und sie divergiert im Fall von an+1 >1 lim inf n an bzw. lim sup n p n |an | > 1. In vielen Fällen stimmen größter und kleinster Häufungspunkt einer Folge (an ) meist schon mit limn an überein. Ein Beispiel, bei dem das nicht so ist, ist k 1 1 für n = 2k + 1 2 4 an = 1 k−1 für n = 2k 4 mit lim inf n an+1 1 = , an 8 lim sup n an+1 =2 an sowie lim sup n p 1 n |an | = . 2 folgen zu tun, die alle gegen die Glieder einer Folge von Häufungspunkten (a0,` )`∈N konvergieren, die ihrerseits für ` → ∞ gegen lim supn→∞ an konvergiert. Wählt man nun in jeder dieser Folgen ein Folgenglied mit Hilfe der Indizes nk1 ,1 < nk2 ,2 < . . . < nk` ,` < . . ., so dass 1 |a0,` − ank` ,` | < , ` (um das monotone Wachsen der Indizes zu erzwingen, muss man unter Umständen etwas länger warten) und ist für ε > 0 die Zahl `0 so groß, dass `−1 0 < ε/2 und | lim supn→∞ an − a0,` | < ε/2 für ` ≥ `0 , dann gilt für alle ` ≥ `0 | lim sup an − ank` ,` | ≤ | lim sup an − a0,` | + |a0,` − ank` ,` | < ε. n→∞ n→∞ Dies zeigt, dass lim supn→∞ an der Grenzwert der Teilfolge ank` ,` von (an ) und damit selbst ein Häufungspunkt dieser Folge ist. 24 Mathematik für Physiker und Informatiker I (Kurzskript) C. (1.Teil) Aus der Schule bekannt sind die Polynome Pn Potenzreihen ν , in die beliebige Werte x ∈ R eingesetzt werden dürfen. Die Theoa x ν ν=0 rie der Reihen legt es nahe, Polynome ‘unendlicher Länge’ zu betrachten, die sogenannten Potenzreihen. Es wird sich herausstellen, dass eine ganze Reihe wichtiger Funktionen tatsächlich solche Polynome von unendlichem Grad sind, etwa ∞ X x2n+1 sin x = (−1)n . (2n + 1)! n=0 P Für die (zunächst formal gebildeten) Ausdrücke der Form n an xn stellt sich zu allererst die Frage, welche reellen Werte x in sie eingesetzt werden dürfen. Diese Frage aber können wir schon recht gut beantworten: P Satz 12 Es sei n an xn eine Potenzreihe. (i) Es existiert eine Zahl r ∈ [0, ∞], Konvergenzradius genannt, mit der P n Eigenschaft, dass für r ∈ (0, ∞) die Reihe n an x für |x| < r konvergiert und für |x| > r divergiert. ‘r = ∞’ steht für den Fall, dass die gegebene P Potenzreihe für alle x ∈ R konvergiert, und ‘r = 0’ soll heißen, dass n an xn allein im Nullpunkt konvergiert. (ii) Im Fall r ∈ (0, ∞) gilt die Formel r= 1 lim supn p , n |an | und r = ∞ gilt genau dann, wenn p p lim sup n |an | = lim n |an | = 0 n→∞ n p ist; der Fall r = 0 tritt genau dann ein, wenn ( n |an |) unbeschränkt ist. P∞ n Eine Potenzreihe n=0 cn (z − z0 ) , cn , z, z0 ∈ C konvergiert absolut im Innern der Kreisscheibe mit Radius R := 1 lim supn→∞ p n |an | um den Punkt z0 und divergiert außerhalb dieser Kreisscheibe. Das Verhalten einer Potenzreihe auf dem Rande des Konvergenzgebietes, also für die x mit |x| = r, ist allgemein nicht in einfacher Weise vorherzusagen und muß in jedem Einzelfall gesondert überprüft werden. Der Beweis von Satz 13(i),(ii) im Fall r ∈ (0,p∞) ergibt sich aus p einer Anwendung des Wurzelkriteriums. Falls lim supn n |an | = limn→∞ n |an | = 0 ist, so folgt für alle x ∈ R aus p p lim sup n |an xn | = |x| lim sup n |an | = 0 < 1 n n Werner, Universität Münster, WS 05/06 25 p P n die Konvergenz von n an xn . Ist umgekehrt lim sup |an | =: n p Pr > 0, so gilt n n für unendlich viele Indizes lim supn |an x | > |x|r/2, und n an xn kann für |x| > 2/r nicht konvergieren. Besitzt schließlich im Fall r = 0 die Folge p n ( |an |) keine unbeschränkte Teilfolge, dann ist diese Folge beschränkt, und p es gibt ein M > 0, so dass für 0 < |x| < M −1 folgt lim supn n |an xn | < 1, die gegebene Potenzreihe folglich auch für Werte x 6= 0 konvergiert. Mit der p p n n n Folge ( |a |) ist aber für alle x = 6 0 auch ( |a n n x |) unbeschränkt, und P n n an x konvergiert für kein x 6= 0. Versucht man, den Konvergenzradius einer Potenzreihe zu ermitteln, dann ist die im zweiten Teil des Satzes angegebene Formel häufig zu schwierig zu handhaben. So macht im Fall der Reihe ∞ X (−1)n n=0 x2n+1 (2n + 1)! die Tatsache Schwierigkeiten, dass die Hälfte der an verschwindet. Es ist hier wie in vielen anderen Fällen auch günstiger, nur den Teil (i) des Satzes zu verwenden und das Quotientenkriterium unmittelbar auf die Reihenglieder anzuwenden. Man sieht dann, dass Konvergenz für alle x ∈ R gegeben ist. II. Funktionen Einschub: Kartesisches Produkt und Abbildungen Es seien X und Y Mengen. Das kartesische Produkt von X und Y ist die Menge der geordneten Paare X × Y = {(x, y) | x ∈ X, y ∈ Y } . ‘Geordnet’ bedeutet, dass (x, y) 6= (y, x)8 . Eine Relation zwischen den Mengen X und Y ist eine Teilmenge R ⊆ X × Y . Eine uns bereits bekannte Relation ist die Ordnungsrelation auf der Menge der reellen Zahlen, R × R ⊇ G = {(x, y) ∈ R × R | x > y }. Eine Abbildung zwischen X und Y ist eine Relation F ⊆ X × Y mit der Eigenschaft, dass für alle x ∈ X genau ein Element y ∈ Y existiert mit (x, y) ∈ F . Man nennt X auch den Definitionsbereich von F und Y den Werte- oder Bildbereich. Es ist üblich, statt (x, y) ∈ F auch F (x) = y zu schreiben, und von einer Abbildung F : X → Y , x 7→ F (x) zu sprechen. (Umgekehrt kann man sich die zu einer Abbildungen gehörende Menge F ⊆ X ×Y als eine Liste der zu den Elementen von x ∈ X gehörigen ‘Funktionswerte’ vorstellen.) Ist Y eine Teilmenge von R, so nennt man in diesem Fall eine Abbildungen meist Funktion. Eine Abbildung F : X → Y heißt 8 Wem das als Definition nicht genüngt, muss von (x, y) := {x, {x, y}} ausgehen. 26 Mathematik für Physiker und Informatiker I (Kurzskript) • injektiv, falls für alle y ∈ {F (x) ∈ Y | x ∈ X } genau ein x ∈ X mit F (x) = y existiert (also aus F (x1 ) = F (x2 ) stets x1 = x2 folgt), und • surjektiv, wenn es für alle y ∈ Y ein x ∈ X mit F (x) = y gibt. Beispiele für Abbildungen, für die Injektivität von Bedeutung ist, ist die Zuordnung von charakteristischen Kenngrößen (Studierende −→ Matrikelnummern, Kraftfahrzeuge −→ Kraftfahrzeugkennzeichen, . . .), die typischerweise nicht surjektiv sind (um die Injektivität nicht zu gefährden). Wichtig ist Surjektivität z.B. bei der Zuordnung Spieler −→ Spielerposition in den meisten Mannschaftssportarten oder auch bei der Abbildung ‘Lokomotivführer im Einsatz’ −→ ‘Lokomotiven unterwegs’. Stellt man sich die Beziehung F (x) = y als eine Gleichung vor, bei der nach Vorgabe von y ∈ Y die Unbekannte x ∈ X zu bestimmen ist, dann ist F surjektiv genau dann, wenn eine solche Gleichung für jedes y ∈ Y eine Lösung besitzt; injektiv ist F , falls bei gegebenem y nicht zwei verschiedene Lösungen existieren können. Hilfreich sind die Schreibweisen F (A) = {F (a) ∈ Y | a ∈ A } sowie F −1 (B) = {x ∈ X | F (x) ∈ B } . Damit ist F z.B. surjetiv genau dann, wenn F (X) = Y ist. Etwas weniger offensichtlich ist die Tatsache, dass F injektiv genau dann ist, wenn für alle A, B ⊆ X gilt F (A ∩ B) = F (A) ∩ F (B). (Für eine beliebige Abbildung gilt stets F (A ∩ B) ⊆ F (A) ∩ F (B).) Eine injektive Abbildung F : X → Y definiert in eindeutiger Weise eine Umkehrabbildung F −1 : F (X) → X durch F −1 (y) = x genau dann, wenn F (x) = y. Ist F zusätzlich surjektiv, so ist der natürliche Definitionsbereich von F −1 die ganze Menge Y . Sind f : X → Y und g : Y → Z Abbildungen, dann definiert man die Verknüpfung von f und g als g ◦ f : X → Z, g ◦ f (x) := g(f (x)). 1. Stetigkeit A. Definition und einfache Eigenschaften Stetige Funktionen sind vorhersagefreundlich. Sie gestatten es, aus dem Verhalten von f in der Nähe eines Punktes x0 auf den Wert von f bei x0 selbst zu schließen. Definition 6 Es sei D eine Menge reeller Zahlen, f : D → R eine Funktion sowie x0 ∈ D. (i) f bestitzt bei x0 den Grenzwert y0 genau dann, wenn gilt y0 = lim f (xn ) n→∞ Werner, Universität Münster, WS 05/06 27 für alle gegen x0 konvergenten Folgen (xn ) in D, mit von x0 verschiedenen Folgengliedern. In einem solchen Fall schreibt man lim f (x) = y0 . x→x0 (ii) Eine Funktion f : D → R heißt stetig bei x0 ∈ D genau dann, wenn lim f (x) = f (x0 ), x→x0 wenn also der Grenzwertsatz f (limn→∞ xn ) = limn→∞ f (xn ) gültig ist. (iii) f heißt auf D stetig, falls f an jedem Punkt x0 ∈ D stetig ist. Die hier gegebene Definition von Stetigkeit ist recht allgemein. Sie beinhaltet etwa die (einseitige) Stetigkeit von Funktionen an Randpunkten eines Intervalls oder zeigt, dass auf endlichen Mengen definierte Funktionen überall stetig sind. Man beachte auch, dass der Grenzwert von f am Punkt x0 automatisch bereits mit f (x0 ) übereinstimmen muss, wenn man die Forderung xn 6= x0 an die an der Definition von limx→x0 f (x) beteiligten Folgen (xn ) fortlässt. Drei Beispiele: Die Funktion f : R → R, f (x) = 0 für x 6= 0 und f (0) = 1 besitzt bei 0 den Grenzwert 0, der aber nicht der Funktionswert an dieser Stelle ist. Die Funktion g(x) = 0 für x ≤ 0 und g(x) = 1 für x > 0, besitzt am Nullpunkt gar keinen Grenzwert; denn für die durch xn = 1/n und yn = −1/n definierten Folgen gilt limn→∞ g(xn ) = 1, limn→∞ g(yn ) = 0 (was alleine schon ausreicht), und für zn = (−1)n /n besitzt die Folge g(zn ) nicht einmal einen Grenzwert. Die Unstetigkeitsstelle der letzten Funktion ist eine sogenannte Sprungstelle, die man glaubt, gut am Graphen der Funktion ablesen zu können. Etwas Vorsicht ist hier geboten: Ist h : [a, b] ∪ [c, d] → R mit a < b < c < d durch h(x) = 0 für x ∈ [a, b] und h(x) = 1 für x ∈ [c, d], dann sieht auch das nach einer Sprungstelle aus, ist es aber nicht (jedenfalls ist diese Funktion überall stetig): Ist (xn ) eine Folge aus der Menge [a, b] ∪ [c, d], die gegen b konvergiert, dann ist ja ab einem Index N ∈ N für n ≥ N stets |xn − b| < |c − b|, und das bedeutet, xn ∈ [a, b] für alle diese Indizes. Dann aber ist h(xn ) = 0, und es folgt limn→∞ h(xn ) = 0 und, weil die Folge beliebig gewählt werden konnte, limx→b h(x) = 0. Die Funktion h ist also am Punkt b (genauso übrigens wie am Punkt c) stetig. Satz 13 Es seien D, E ⊆ R, f, g : D → R und h : E → R Funktionen sowie x0 ∈ D. Ferner sei g(x0 ) ∈ E. (i) Die Funktion f besitzt den Grenzwert a am Punkt x0 genau dann, wenn für jedes ε > 0 ein δ(ε, x0 ) > 0 existiert, so dass für alle x ∈ D mit 0 < |x − x0 | < δ(ε, x0 ) gilt |f (x) − a| < ε, und f ist stetig bei x0 genau dann, wenn für jedes ε > 0 ein δ(ε, x0 ) > 0 existiert, so dass für alle x ∈ D mit |x − x0 | < δ(ε, x0 ) gilt |f (x) − f (x0 )| < ε. 28 Mathematik für Physiker und Informatiker I (Kurzskript) (ii) Sind f und g bei x0 stetig, so gilt dies auch für die Funktionen f + g, f g sowie f /g, sofern im letzten Fall g(x0 ) 6= 0 ist. Ist zusätzlich h am Punkt g(x0 ) stetig, so ist h ◦ g bei x0 stetig. (iii) (Zwischenwertsatz) Ist D = [a, b] und η ∈ R eine Zahl, die zwischen f (a) und f (b) liegt, dann gibt es ein ξ ∈ [a, b] mit f (ξ) = η. Für den Beweis des ersten Teils sei zunächst f stetig bei x0 im Sinne der zuvor gemachten Definition. Wir nehmen außerdem an, es wäre die ε-δBedingung aus (i) verletzt. Dann gibt es ein ε0 > 0 sowie eine Folge (xn ) in D mit |xn − x0 | < 1/n und |f (xn ) − f (x0 )| ≥ ε0 . Dann aber kann ganz offenkundig f (x0 ) nicht der Grenzwert von f an der Stelle x0 sein. Falls umgekehrt die ε-δ-Bedingung erfüllt ist, und (xn ) eine in D enthaltenen Folge bezeichnet, für die |x0 − xn | < η für n ≥ N (η) und η > 0 beliebig, so wählt man, um die Konvergenz von (f (xn )) gegen f (x0 ) zu zeigen, bei vorgelegtem ε > 0 eine Zahl δ > 0, so dass |f (x0 )−f (x)| < ε falls |x0 −x| < δ. Ist dann n ≥ N (δ) beliebig, so folgt |x0 − xn | < δ und |f (xn ) − f (x0 )| < ε. Bis auf die letzte Aussage folgt Teil (ii) aus den entsprechenden Aussagen über Folgen im Satz 4(a). Die Aussage über h◦g ist eine einfache Konsequenz aus der Defintion. Der Beweis des Teils (iii) ist eine Anwendung des Intervallschachtelungsprinzips: Wir nehmen an, dass gilt f (a) < η < f (b). Induktiv definieren wir Intervalle In = [an , bn ] durch I1 = [a, b] und an + bn an + bn falls f (an ) < η < f an , 2 2 In+1 = [an+1 , bn+1 ] := . an + bn an + bn , bn falls f < η < f (bn ) 2 2 Dabei soll die Folge abbrechen (der Beweis wäre dann bereits beendet), wenn der Funktionswert von f am Mittelpunkt einer der Intervalle In bereits η ist. In allen anderen Fällen T gilt f (an ) < η < f (bn ), und wir erhalten wir einen inneren Punkt ξ ∈ n∈N In , für den aufgrund der Stetigkeit von f gilt f (ξ) = lim f (an ) ≤ η ≤ lim f (bn ) = f (ξ), n→∞ n→∞ und somit auch f (ξ) = η. Ein Beispiel zur Stetigkeitsaussage: Die Funktion w : R+ 0 → R, w(x) = √ x, ist an jedem Punkt x0 stetig: Ist x0 6= 0, so kann man bei vorgelegtem √ ε > 0 wählen δ(ε, x0 ) = ε x0 . Ist dann |x − x0 | < δ(ε, x0 ), so folgt |x − x0 | |x − x0 | |w(x) − w(x0 )| = √ < ε. √ ≤ √ x0 x + x0 Für x0 = 0 wählt man δ(ε, 0) = ε2 . Dann folgt aus |x| < δ(ε, 0) sofort |w(x) − w(0)| < ε. Werner, Universität Münster, WS 05/06 29 Wenn man will, kann man den Zwischenwertsatz als die Aussage deuten, die besagt, dass man den Graphen stetiger, auf einem Intervall definierter Funktionen ‘in einem Strich’ zeichnen kann. Diese Vorstellung ist inosfern problematisch, als es stetige Fuktionen gibt, bei denen man sich dies trotz Zwischenwertsatzes nur sehr schwer vorstellen kann, und umgekehrt gibt es unstetige Funktionen, deren Einschränkungen auf beliebige abgeschlossene Teilintervalle der Aussage des Zwischenwertsatzes genügen. Eine einfache Anwendung des Zwischenwertsatzes ist: Die Gleichung x − cos x = 0 besitzt im Intervall [0, π/2] eine Lösung. (Hierzu muss man allerdings daran glauben, das cos x eine stetige Funktion ist, was wir erst später nachweisen werden.) B. Kompaktheit Eine Zahl α nennt man einen Häufungspunkt der Folge (an ), falls es eine Teilfolge von (an ) gibt, die gegen α konvergiert. Man beachte, dass jeder Häufungspunkt einer Folge auch Häufungswert der Menge der Folgenglieder ist, dass aber umgekehrt jeder Punkt einer Folge Häufungswert der Menge der Folgenglieder ist und damit nicht unbedingt ein Häufungspunkt. Satz 14 (Bolzano-Weierstraß) Jede beschränkte Folge in R besitzt einen Häufungspunkt Ist die Folge (xn ) in dem Intervall [a, b] enthalten, dann wird eine Intervallschachtelung (In ) = ([an , bn ]) induktiv definiert durch I0 = [a, b], an + bn an +bn a , falls x ∈ a , n n n 2 2 für unendlich viele n In+1 = [an+1 , bn+1 ] = . an + bn , bn sonst 2 Induktiv ergibt sich auch, dass jeweils in einer dieser Intervallhälften für unendlich viele Indizes Folgenglieder liegen müssen und diese Konstruktion folglich nicht abbrechen kann. Man kann jetzt eine monoton steigende Folge (nk ) von Indizes mit xnk ∈ Ik für jedes k ∈ N wählen. Ist ξ der innere Punkt der Intervallschachtelung (Ik ), so ist der Abstand von xnk zu ξ für alle k ≥ K ∈ N kleiner oder gleich der Intervallbreite von IK . Es folgt limk→∞ xnk = ξ. Definition 7 Es seine K und F Mengen reeller Zahlen. (i) K heißt kompakt, falls jede Folge mit Gliedern in K eine gegen ein Element von K konvergente Teilfolge besitzt. 30 Mathematik für Physiker und Informatiker I (Kurzskript) (ii) F heißt abgeschlossen, falls F jeden ihrer Häufungswerte enthält. Ein einfaches Beispiel von kompakten Mengen sind die endlichen Mengen. Da x ∈ C Häufungswert von F genau dann ist, wenn es eine Folge in F gibt, die gegen x konvergiert, ist F abgeschlossen genau dann, wenn jede konvergente Folge in F ihren Grenzwert auch in F besitzt. Beispiele für abgeschlossene Mengen sind die abgeschlossenen Intervalle. Satz 15 Eine Teilmenge K von reellen Zahlen ist kompakt genau dann, wenn sie beschränkt und abgeschlossen ist. Ist K nämlich beschränkt und abgeschlossen, so folgt die Behauptung aus dem Satz von Bolzano-Weierstraß. Ist K umgekehrt kompakt und k ein Häufungswert von K, gegen den die Folge (kn ) aus K konvergiert, so gibt es nach Annahme eine Teilfolge, deren Grenzwert in K liegt. Da der Grenzwert von Teilfolgen konvergenter Folgen mit dem Grenzwert der ganzen Folge übereistimmt, muss k ∈ K sein, und K ist abgeschlossen. In einer unbeschränkten Menge lässt sich stets eine Folge (xn ) finden mit |xn | ≥ n. Keine Teilfolge einer solchen Folge kann beschränkt und folglich auch nicht konvergent sein. Damit sind weitere Beispiele für kompakte Mengen die Intervalle [a, b]. Ist eine stetige Funktion f auf einer kompakten Menge K ⊆ R definiert, so ergibt sich eine erstaunlicher Zugewinn an Qualtität von f . Eine Funktion f : D ⊆ R → R heißt beschränkt, falls f (D) eine beschränkte Menge ist. D.h. es gibt eine Zahl M > 0, so dass für alle x ∈ D gilt |f (x)| ≤ M . Satz 16 Es sei K ⊆ R kompakt und f : K → R auf ganz K stetig. Dann gilt (i) f ist beschränkt. (ii) f nimmt Supremum und Infimum ihrer Funktionswerte an, d.h. es existieren Punkte d1,2 ∈ D mit f (d1 ) = sup f (d) d∈D sowie f (d2 ) = inf f (d). d∈D (iii) f ist gleichmäßig stetig, d.h. für alle ε > 0 existiert ein δ(ε) > 0 mit der Eigenschaft, dass |f (x) − f (y)| < ε für alle Punktepaare x, y ∈ D mit |x − y| < δ(ε). Die Beweise für die drei Teile sind im Prinzip alle recht ähnlich und basieren darauf, besonderes Verhalten von Funktionen auf kompakten Mengen (durch Auswahl konvergenter Teilfolgen) zu lokalisieren. Wäre f etwa auf der kompakten Menge K unbeschränkt, dann gibt es ja zunächst nur eine Folge (xn ) in K mit |f (xn )| ≥ n. Da aber K kompakt ist, kann man eine gegen einen Punkt x0 ∈ K konvergente Teilfolge (xnk ) finden, und es ist Werner, Universität Münster, WS 05/06 31 dann nicht mehr recht klar, welchen Wert f bei x0 eigentlich annehmen soll. Diese Überlegung zeigt Teil (i). Ganz ähnlich geht man für den zweiten Teil vor und wählt eine Folge (xn ) in K mit (z.B.) lim f (xn ) = sup f (x) n→∞ x∈K Für eine konvergente Teilfolge dieser Folge ist der in K gelegene Grenzwert eine Stelle, an der f sein Supremum auf K annimmt. Hätte man es schließlich bei f mit einer nicht gleichmäßig stetigen Funktion zu tun, dann gäbe es eine Zahl ε0 > 0 und eine Folge von Paaren (xn , yn ) ∈ K 2 mit |xn − yn | ≤ 1 n sowie |f (xn ) − f (yn )| ≥ ε0 . Sind x0 und y0 die Grenzwerte von Teilfolgen (xnk ) und (ynk ) (man macht sich leicht klar, dass beide Teilfolgen mit Hilfe derselben Indexfolge (nk ) gebildet werden können), so folgt aus der ersten Bedingung x0 = y0 und aus der zweiten |f (x0 ) − f (y0 )| ≥ ε0 , was ganz offensichtlich nicht möglich ist. √ Für die Funktion w : R+ x, hatten wir im letzten 0 → R, w(x) = √ Abschnitt ein ganz wesentlich von x0 6= 0 abhängiges δ(ε, x0 ) = ε x0 bestimmt. Der voranstehende Satz sagt voraus, dass es möglich sein muss, ein nur von ε abhängiges δ zu finden. Ein solches ist δ(ε) = ε2 , und die verbesserte Abschätzung, die hier√notwendig wird, basiert auf der für a ≥ b ≥ 0 √ √ gültige Ungleichung a − b ≤ a − b: Für |x − x0 | < δ(ε) folgt mit ihrer Hilfe p √ √ | x0 − x| ≤ |x − x0 | < ε. 2. Differenzierbarkeit A. Definition und Ableitungsregeln Eines der mehr rätselhaften Instrumente des Alltags ist der Tachometer. Beschreibt x : R+ 0 → R den Ort eines Punktes auf der reellen Achse zum Zeitpunkt t, dann ist die Durchschnittsgeschwindigkeit dieses Punktes zwischen den Zeitpunkten t1 < t2 durch den Ausdruck x(t2 ) − x(t1 ) vD (t1 ; t2 ) = t2 − t1 gegeben. Der Tachometer behauptet, zu jedem Zeitpunkt und ohne nennenswerte Verzögerung die sogenannte Momentangeschwidigkeit, v(t0 ) = lim t→t0 x(t) − x(t0 ) , t − t0 ermitteln zu können. Definition 8 Eine Funktion f : [a, b] → R heißt am Punkt x0 ∈ [a, b] differenzierbar genau dann, wenn der Grenzwert lim x→x0 f (x0 ) − f (x) f (x0 + h) − f (x0 ) df = lim := f 0 (x0 ) = (x0 ) h→0 x − x0 h dx 32 Mathematik für Physiker und Informatiker I (Kurzskript) existiert. Ein Beispiel für eine auf ganz R differenzierbare Funktion ist die Potenzfunktion Pn : R → R, x 7→ xn . Dies wird ersichtlich aus n−1 X n Pn (x0 + h) − Pn (x0 ) (x0 + h)n − xn0 xν hn−ν−1 = = lim = lim h→0 h→0 h→0 h h ν 0 ν=0 n−2 X n nxn−1 + lim h xν hn−ν−2 = nx0n−1 . 0 h→0 ν 0 lim ν=0 Die Betragsfunktion x 7→ |x| ist nicht dfferenzierbar am Nullpunkt; denn die Funktion ( 1 für x > 0 |x| − |0| |x| = = x−0 x −1 für x < 0 besitzt am Nullpunkte keinen Grenzwert. Die folgende Beobachtung ist sehr wichtig für das Verständnis des Ableitungsbegriffs. Satz 17 Eine Funktion f : (a, b) → R ist bei x0 ∈ (a, b) differenzierbar, falls es eine Zahl f 0 (x0 ) sowie eine Funktion h 7→ r(x0 , h) gibt mit f (x0 + h) = f (x0 ) + f 0 (x0 )h + r(x0 , h) und lim h→0 r(x0 , h) =0 h Jede bei x0 differenzierbare Funktion ist insbesondere stetig. f ist danach am Punkt x0 differenzierbar, genau dann, wenn f in der Nachbarschaft des Punkts x0 so gut durch eine Gerade (und zwar die durch die Abbildungsvorschrift x0 + h 7→ f (x0 ) + hf 0 (x0 ) gegebene Tangente) approximiert werden kann, dass der Fehler, den man dabei macht, nämlich r(x0 , h), so schnell in h gegen Null konvergiert, dass immer noch limh→0 r(x0 , h)h−1 = 0 gilt. Der Beweis des ersten Teils von Satz 17 ist sehr einfach und benutzt nicht mehr als die beteiligten Definitionen. Dass f bei x0 stetig sein muss, ist eine leichte Übungsaufgabe. Die Ableitung spielt in den Anwendungen der Mathematik eine große Rolle, vor allem da dieser Begriff es ermöglicht, zeitlich punktuelle (“momentane”) oder räumlich in einem Punkt konzentrierte Erscheinungen mathematisch in den Griff zu bekommen (etwas, für das man allerdings in der fortgeschrittenen Physik einen bisweilen recht hohen Preis zu entrichten hat). Dabei mündet eine solche Modellierung häufig in einer sogenannten Differentialgleichung, einer Gleichung, in der die modellierende Funktion mit ihren Ableitungen in Beziehung steht. Ein Beispiel. Es sei B(t) die Anzahl der Bakterien in einer Kultur Wir gehen davon aus, dass der Zuwachs dieser Kolonie während eines Zeitintervalls ∆t, das so klein sein muss, dass Enkel Werner, Universität Münster, WS 05/06 33 noch keine Rolle spielen, proportional sowohl zur Menge der bereits vorhandenen Bakterien als auch zu ∆t ist. Ist der Proportionalitätsfaktor α, dann heißt das B(t + ∆t) − B(t) = αB(t)∆t Da diese Beziehung für alle ∆t gelten soll, kann man für alle Zeiten t den Grenzwert ∆t → 0 betrachten(falls man annimmt, dass B eine differenzierbare Funktion der Zeit ist) und schließen9 B 0 (t) = lim ∆t→0 B(t + ∆t) − B(t) = αB(t). ∆t Kurz: Eine Funktion B, die das Bakterienwachstum in dieser Weise modelliert, muss notwendigerweise der Gleichung B 0 = αB genügen. Wir werden später sehen, welche Funktionen das genau sind. Satz 18 (Ableitungsregeln) Es seien f, g : [a, b] → R am Punkt x ∈ [a, b] und ϕ : [c, d] → [a, b] am Punkt x0 ∈ [c, d] mit ϕ(x0 ) = x differenzierbare Funktionen. Dann gilt (i) f + g, f g sowie, für den Fall, dass g(x) 6= 0, die Funktion f /g sind bei x differenzierbar mit (f + g)0 (x) = f 0 (x) + g 0 (x) (f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x) 0 f f 0 (x)g(x) − f (x)g 0 (x) sowie (x) = g g(x)2 (ii) f ◦ ϕ ist am Punkt x0 differenzierbar mit (f ◦ ϕ)0 (x0 ) = f 0 (ϕ(x0 ))ϕ0 (x0 ) (iii) Besitzt f in einer Umgebung um x0 eine differenzierbare Umkehrfunktion f −1 , so gilt 1 (f −1 )0 (f (x)) = 0 . f (x) Ein paar Beispiele: Die Quotientenregel, die Ableitungsregel für die inverse Funktion sowie die Kettenregel zeigen (in dieser Reihenfolge), dass die Gleichung (xn )0 = nxn−1 auch für rationale Zahlen richtig bleibt, d.h. für alle m, n ∈ N und p, q ∈ Z gilt: 1 0 p 0 p p 1 0 m 1 1 −1 −1 n n = − m+1 x = x sowie xq = xq xm x n q 9 So, wie wir B(·) definiert hatten ist sie allerdings nicht einmal stetig; am einfachsten stellt man sich vor, dass die Funktion B zwischen den durch die Bakteriengeburten entsthehenden Sprungstellen differenzierbar interpoliert und die wahre Anzahl der Bakterien bis auf die erste Kommastelle genau vorhersagt — was viel besser wäre als die Situation im Labor hergibt. 34 Mathematik für Physiker und Informatiker I (Kurzskript) Die Kettenregel ergibt außerdem nochmals die Formel für 1/g. Es ist sehr einfach, im Teil (i) die Summenformel zu beweisen. Die sogenannte Produktregel ergibt sich, wenn man in der Beziehung f (x + h)g(x + h) − f (x)g(x) = h f (x + h) − f (x) g(x + h) − g(x) = g(x + h) + f (x) . h h den Grenzübergang h → 0 durchführt. Zu beachten ist dabei, dass die (durch die Differenzierbarkeit sich ergebende) Stetigkeit von g bei x ausgenutzt werden muss. Die Formel für den Quotienten reduziert man mit der Produktregel auf den Fall den, dass die Funktion f konstant gleich 1 ist. Diesen wiederum erledigt die Gleichheit 1 1 g(x + h) − g(x) 1 1 − =− h g(x + h) g(x) g(x + h)g(x) h sowie der Grenzübergang h → 0. (Natürlich spielt auch wieder die Stetigkeit von g bei x eine Rolle und das gleich zweimal: Einmal für den Grenzübergang und das zweite Mal für die Tatsache, dass bei hinreichend kleinem h der Funktionswert g(x + h) nicht verschwindet.) Die Aussage über die Umkehrfunktion erhält man durch Anwendung der Kettenregel auf die in besagter Umgebung gültige Gleichung f −1 (f (x)) = x. Für den Beweis der Kettenregel selbst greifen wir schließlich auf die Funktion f (x) − f (x0 ) für x 6= x0 x − x0 fx∆0 (x) = 0 f (x0 ) für x = x0 zurück. Diese ist aufgrund der Definition der Differenzierbarkeit bei x0 genau dann stetig, wenn f bei x0 differenzierbar mit Ableitung f 0 (x0 ) ist. Eine elementare Rechnung zeigt, dass f (ϕ(x0 )) − f (ϕ(x)) ϕ(x) − ϕ(x0 ) ∆ = fϕ(x (ϕ(x)) 0) x − x0 x − x0 womit lim x→x0 f (ϕ(x0 )) − f (ϕ(x)) = x − x0 ∆ = lim fϕ(x (ϕ(x)) lim 0) x→x0 x→x0 ϕ(x) − ϕ(x0 ) = f 0 (ϕ(x0 ))ϕ0 (x0 ) x − x0 Werner, Universität Münster, WS 05/06 35 folgt10 , da wir ja von all den hier auftretenden Grenzwerten die Existenz vorausgesetzt hatten. Die Ableitung f 0 einer auf (a, b) differenzierbaren Funktion ist im allgemeinen nicht stetig; sie genügt aber immer noch dem Zwischenwertsatz (Satz von Darboux) und besitzt daher keine Sprungstellen. Differenzierbare Funktionen mit stetigen Ableitungen heißen stetig differenzierbar. Wenn man etwas vorgreift, und die Ableitung der Sinus-Funktion als bekannt voraussetzt, dann kann man zeigen, dass f : R → R, x2 sin 1 für x 6= 0 x f (x) = 0 für x = 0 für x 6= 0 die Ableitung f 0 (x) = 2x sin(x−1 ) − cos(x−1 ) besitzt. Für den Nullpunkt errechnet man direkt f (x) − f (0) 1 0 f (0) = lim = 0. = lim x sin x→0 x→0 x−0 x Hier wird noch einmal die Schwierigkeit im Umgang mit unstetigen Funktionen deutlich: Nichts anderes als die direkte Rechnung ist in der Lage zu ermitteln, wie es mit der Ableitung von f bei 0 steht; die Ableitung an von Null verschiedenen Punkten erlaubt gar keinen Rückschluss. B.Extremalpunkte und Mittelwertsatz Definition 9 Es sei f : D → R eine Funktion. Ein Punkt ξ heißt eine lokale Extremalstelle für f und f (ξ) ein lokaler Extremalwert, falls für ein ε > 0 gilt f (ξ) = sup {f (x) | x ∈ Uε (ξ) ∩ D } bzw. f (ξ) = inf {f (x) | x ∈ Uε (ξ) ∩ D } Im ersten Fall nennt man ξ eine lokale Maximalstelle und f (ξ) ein lokales Maximum, im zweiten Fall eine lokale Minimalstelle und f (ξ) ein lokales Minimum. Stetige, auf kompakten Mengen definierte Funktionen besitzen (lokale) Extremalstellen. Beim Vorliegen von Differenzierbarkeit lässt sich deren Lage genauer eingrenzen. 10 mit Man mache sich klar, dass ein Beweis der Kettenregel durch einfaches “Erweitern” f (ϕ(x0 )) − f (ϕ(x)) ϕ(x) − ϕ(x0 ) insofern fragwürdig ist, als niemand ausschließen kann, dass ϕ(x) − ϕ(x0 ) in der Nachbarschaft von x0 immer wieder mal verschwindet. Hiergegen hilft natürlich auch die Forderung x 6= x0 nichts. 36 Mathematik für Physiker und Informatiker I (Kurzskript) Satz 19 Für jede lokale Extremalstelle x0 einer differenzierbaren Funktion f : (a, b) → R gilt f 0 (x0 ) = 0. Ist etwa f (ξ) = sup {f (x) | x ∈ Uε (ξ) ∩ (a, b) } für eine Zahl ε > 0, so gilt für Folgen (xn ) mit x0 − ε < xn ≤ x0 f 0 (x0 ) = lim n→∞ f (x0 ) − f (xn ) ≥0 x0 − xn und genauso für xn ≥ x0 f 0 (x0 ) = lim n→∞ f (x0 ) − f (xn ) ≤0 x0 − xn weshalb f 0 (x0 ) = 0 gelten muss. In derselben Weise verfährt man für lokale Minimalstellen. Satz 20 (Satz von Rolle, Mittelwertsatz) Es sei f : [a, b] → R stetig und eingeschränkt auf (a, b) sogar differenzierbar. Dann gilt (i) Ist f (a) = f (b), so gibt es einen Punkt ξ ∈ (a, b) mit f 0 (ξ) = 0. (ii) Es gibt einen Punkt x ∈ (a, b) mit f (a) − f (b) = f 0 (x) a−b (iii) Es gibt einen Punkt y ∈ (a, b) mit f 0 (y)(g(a) − g(b)) = g 0 (y)(f (a) − f (b)). Den Teil (i) nennt man den Satz von Rolle (das ist der Name eines französischen Mathematikers, der anders ausgesprochen gehört als die Sportübung; es hält sich allerdings kaum jemand daran). Teil (ii) ist der Mittelwertsatz. Er folgt aus Teil (iii) mit g(x) = x (umgekehrt geht es nicht). Der Beweis von (i) beginnt mit der Beobachtung, dass für eine nicht konstante Funktion f (für konstante Funktionen ist nichts zu zeigen), es in (a, b) Punkte v oder w geben muss mit f (v) > f (a) = f (b) bzw. f (w) < f (a) = f (b). Dann aber muss f in (a, b) sein absolutes Maximum bzw. Minimum an einem Punkt ξ ∈ (a, b) annehmen, an dem nach dem letzten Satz f 0 (ξ) = 0 gelten muss. Für den Teil (iii) betrachtet man die Funktion h(t) = f (t)(g(a) − g(b)) − g(t)(f (a) − f (b)). Für diese gilt h(a) = −f (a)g(b) + g(a)f (b) = h(b), weshalb es aber nach (i) einen Punkt y ∈ (a, b) geben muss mit 0 = h0 (y) = f 0 (y)(g(a) − g(b)) − g 0 (y)(f (a) − f (b)). Die Anwendungen des Mittelwertsatzes (Teil (ii)) sind zahlreich. Ein paar einfache Beispiele: Werner, Universität Münster, WS 05/06 37 • Die sogenannte Differentialgleichung y 0 = 0 besitzt genau die konstanten Funktionen als Lösung. • Eine Funktion f : (a, b) → R mit f 0 (x) ≥ 0 (f 0 (x) ≤ 0) für alle x ist auf (a, b) monoton wachsend (fallend). Strenge Monotonie ist in derselben Weise mit den entsprechenden strikten Ungleichungen verknüpft. • Für die Funktion f ist x0 ein Maximalpunkt, wenn f 0 (x0 ) = 0 und f 0 bei x0 ‘das Vorzeichen von + nach − wechselt’. Eine entsprechende Aussage gilt für Minimalpunkte. C. Uneigentliche Grenzwerte und die Regeln von l’Hospital Eine ganz wesentliche Rolle bei der Definition von Grenzwert und Stetigkeit haben die kleinen ε−Umgebungen um den Grenzwert gespielt. Kann man also von einem Punkt sagen, was die kleinen Nachbarschaften sind, so kann man gegen einen solchen Folgen konvergieren lassen. Diese Überlegung nutzt man im Zusammenhang mit den Punkten ±∞ aus, die gewissermaßen die Zahlengerade nach rechts (oder links) abschließen. Mit diesen beiden Punkten kann man nicht vernünftig rechnen — bei einer ganze Reihe von Opera∞ tionen, wie etwa ∞ − ∞ oder ∞ , kann man im Allgemeinen nicht recht sagen, was herauskommen soll — sehr wohl aber macht es Sinn, mit Grenzb = R ∪ {±∞} zu hantieren. Die Idee ist, die Rolle, die die werten auf R ε-Umgebungen spielen, von den Mengen US (∞) = {x ∈ R | x > S } bzw. US (−∞) = {x ∈ R | x < S } übernehmen zu lassen. Definition 10 Es sei (xn ) eine Folge reeller Zahlen. Dann bedeutet lim xn = ∞ n→∞ bzw. lim xn = −∞ n→∞ genau dasselbe wie ∀S ∈ R ∃N (S) ∈ N ∀n ≥ N (S) gilt xn ∈ US (∞) bzw. ∀S ∈ R ∃N (S) ∈ N ∀n ≥ N (S) gilt xn ∈ US (−∞) Ist eine dieser Bedingungen erfüllt, so sagt man, (xn ) konvergiere uneigentlich gegen ∞ bzw. −∞. Einfache Beispiele sind die durch an = n bzw. bn = −n definierten Folgen, die gegen ∞ bzw. −∞ konvergieren. Man beachte, dass es auch immer noch Folgen gibt, die in keinem Sinne konvergieren, etwa cn = (−1)n (die auch nicht uneigentlich konvegieren kann, da eine uneigentlich konvergente Folge auf jeden Fall unbeschränkt sein muss), oder dn = (−1)n n, die aus zwei uneigentlich konvergenten Teilfolgen besteht. Für Funktionen definiert man in derselben Weise: 38 Mathematik für Physiker und Informatiker I (Kurzskript) Definition 11 Es sei f : (x0 , ∞) → R eine Funktion. Dann ist lim f (x) = α ⇐⇒ ∀ ε > 0∃ x0 ∈ R∀ x > x0 gilt |f (x) − α| < ε lim f (x) = α ⇐⇒ ∀ ε > 0∃ x0 ∈ R∀ x < x0 gilt |f (x) − α| < ε, x→∞ x→−∞ und lim f (x) = −∞ x→x0 bzw. lim f (x) = ∞ x→x0 ist definiert als ∀S ∈ R ∃δ > 0 ∀ 0 < x < |x − x0 | < δ gilt f (x) > S ∀S ∈ R ∃δ > 0 ∀ 0 < x < |x − x0 | < δ gilt f (x) < S. bzw. Ist die Variable des Definitionsbereichs von f die Zeit t, so modelliert man mit den Grenzwerten t → ±∞ das langfristige, in Vergangenheit oder Zukunft liegende Verhalten eines durch f beschriebenen Systems. Häufig ist nämlich das, was in kurzen Zeiträumen geschieht, fast unüberschaubar komplex und erst durch Grenzwertbildung einer vereinfachten Betrachtung zugänglich. Beispiele gibt es etwa in der chemischen Reaktionskinematik, bei den Streuversuche, die Physiker in Teilchenbeschleunigern durchführen oder auch ganz einfach beim Umrühren von Milch im Kaffee. Ein sehr einfaches mathematisches Beispiel ist die Untersuchung des asymptotischen Verhaltens von z.B. gebrochen rationalen Funktionen: Dazu seien x1 , . . . xN die (reellen) Nullstellen des Polynoms Q(x), P (x) ein weiteres Polynom sowie f : R \ {x1 , . . . , xn } → R, x 7−→ P (x) . Q(x) Gilt nach einer Polynomdivision P (x) P 0 (x) = R(x) + , Q(x) Q(x) dass R(x) ein Polynom und dass der Grad von P 0 echt kleiner als der von Q ist, dann folgt P (x) − R(x) = 0, lim x→±∞ Q(x) und man sagt, f verhält sich asymptotisch wie das Polynom R(x). Mit anderen Worten, das für ein Polynom untypische Verhalten einer gebrochen rationalen Funktion (etwa die Existenz von Stellen, an denen diese Funktion die Grenzwerte ±∞ besitzt), findet auf einem abgeschlossenen Intervall [a, b] statt, im Komplement dieses Intervalls weicht f vom Polynom R nur um eine kleine Zahl ab, die zuvor durch Festlegung von [a, b] frei gewählt werden kann. Die Berechnung einer ganzen Reihe von Grenzwerten vereinfachen sich aufgrund der Regeln von l’Hospital: Werner, Universität Münster, WS 05/06 39 Satz 21 Es sei −∞ ≤ a < b ≤ ∞, f und g auf (a, b) differenzierbare Funktionen und g 0 (x) 6= 0 für alle x ∈ (a, b). Ferner sei f 0 (x) = c. x→a g 0 (x) lim (i) Gilt lim f (x) = lim g(x) = 0 x→a x→a (ii) oder lim g(x) = ∞, x→a so folgt lim x→a f (x) =c g(x) Die enstprechende Aussage gilt auch für Grenzwerte x → b oder, in (ii), g(x) → −∞. Der erste Teil folgt für a < ∞ sehr direkt aus Satz 20(iii): Ergänzt man f und g stetig am Punkt a durch f (a) = g(a) = 0, so findet man einen Punkt ξx mit a < ξx < x und f (x) f (a) − f (x) f 0 (ξ) = = 0 g(x) g(a) − g(x) g (ξ) Da mit x → a auch gilt ξx → a, folgt Teil (i) im Fall a > −∞. (Man beachte, dass aus dieser Überlegung aufgrund der Voraussetzung f 0 (x)/g 0 (x) → c für x → a zugleich auch folgt, dass der Bruch f (x)/g(x) für Punkte x, die hinreichend nahe bei a sich befinden, wohldefiniert ist.) Den Fall a = −∞ kann man durch Übergang zu f1 (x) = f (1/x) und g1 (x) = g(1/x) bewältigen: − x12 f 0 x1 f (x) f (1/x) f 0 (x) lim = lim = lim = lim , x→−∞ g(x) x→−∞ g 0 (x) x→0 g(1/x) x→0 − 12 g 0 1 x x Der Teil (ii) ist ein klein wenig schwieriger: Wir wählen eine Zahl δ > a, so dass aus δ > x > a folgt 0 f (x) g 0 (x) − c < ε. Es sei δ > x0 > a festgewählt. Dann folgt für jedes δ > x > a aus Satz 20(iii) f (x) − f (x0 ) <ε (1) − c g(x) − g(x0 ) und somit f (x) − f (x0 ) g(x) − g(x0 ) < |c| + ε. 40 Mathematik für Physiker und Informatiker I (Kurzskript) Multipliziert man diese Ungleichung mit |g(x) − g(x0 )||g(x)|−1 (dazu muss man ggf. zu einer Zahl δ ≥ δ1 > 0 übergehen mit der Eigenschaft, dass aus δ1 > x > a folgt g(x) 6= 0), so wird daraus f (x) f (x0 ) f (x) f (x0 ) g(x0 ) g(x) − g(x) ≤ g(x) − g(x) ≤ |c| + ε + g(x) . Damit ist |f (x)||g(x)|−1 für δ2 > x > a durch eine feste Konstante beschränkt. Aus dieser Beschränktheit sowie der Tatsache, dass g(x) → ∞ für x → a folgt dann f (x) − f (x0 ) f (x) lim − = lim x→a g(x) − g(x0 ) g(x) x→a f (x0 ) f (x) g(x0 ) g(x) g(x) − g(x) 0) 1 − g(x g(x) =0 Damit existiert eine Zahl δ3 , so dass aus δ3 > x > a folgt f (x) f (x) − f (x0 ) g(x) − g(x) − g(x0 ) < ε, weshalb mit (1) für δ3 > x > a f (x) < 2ε − −c g(x) gelten muss, und die Behauptung ist bewiesen. Nicht nur die hier betrachteten Grenzwerttypen können mit den Regeln von l’Hospital behandelt werden; mit etwas Phantasie lassen sich auch andere Grenzwert auf die behandelten Typen zurückführen, etwa 1 x→∞ 1/x p n lim xn + xn−1 − x = lim x→∞ r n 1 1+ −1 x 1 1 = lim x→∞ −1/x2 n ! = 1 1 n −1 −1 1 1+ = . 2 x x n E. Der Mittelwertsatz n-ter Ordnung: Satz von Taylor Wir wissen, dass für eine auf einem offenen Intervall (a, b) um den Punkt x0 differenzierbare Funktion f es für jedes x ∈ (a, b) eine Punkt ξ zwischen x und x0 gibt mit f (x) = f (x0 ) + f 0 (ξ)(x − x0 ). Im Folgenden gehen wir der Frage nach, ob es zu dieser Aussage ein Analogon für die n-fache Ableitung f (n) gibt. Es wird sich zeigen, dass diese Frage auch zu einer besonders guten Approximation von f um den Punkt x0 durch Polynome führt. Werner, Universität Münster, WS 05/06 41 Satz 22 Es sei f : (a, b) → R n-fach differenzierbar. Sind x, x0 ∈ (a, b), so existiert ein Punkt ξ zwischen x und x0 mit der Eigenschaft, dass f (x) = n−1 X ν=0 f (ν) (x0 ) f n (ξ) (x − x0 )ν + (x − x0 )n . ν! n! Mit anderen Worten: Für eine n-fach differenzierbare Funktion f und einen Punkt x0 aus deren Definitionsbereich gibt es ein Polynom P , das f in der Nachbarschaft von x0 bis auf einen Term der Ordung n approximiert11 . Der Beweis ist im wesentlichen eine n − 1-fache Anwendung des Satzes von Rolle. Natürlich gibt es immer eine Zahl M mit f (x) = n−1 X ν=0 f (ν) (x0 ) (x − x0 )ν + M (x − x0 )n , ν! und die Kunst besteht darin nachzuweisen, dass n!M = f n (ξ) für einen strikten Zwischenwert ξ gilt. Zu diesem Zweck sei g(t) = f (t) − n−1 X ν=0 f (ν) (x0 ) (t − x0 )ν − M (t − x0 )n . ν! Pn−1 f (ν) (x0 ) (t − x0 )ν gerade Wenn Sie sich gefragt haben, warum P (t) = ν=0 ν! von dieser Form sein muss, dann kommt hier der Grund: P ist genau das Polynom vom Grad (höchstens) n − 1, für das f (k) (x0 ) = P (k) (x0 ) für alle k = 0, . . . , n − 1 gilt. Aus dieser Eigenschaft folgt nämlich, dass g (k) (x0 ) = 0 für alle diese k, und die angekündigte mehrfache Anwendung des Satzes von Rolle kann beginnen: Nach Definition von M gilt im ersten Schritt g(x) = 0 und (Rolle) es gibt einen Punkt x1 (strikt) zwischen x und x0 mit g 0 (x1 ) = 0. Dann aber gibt es auch einen Punkt x2 (wieder nach dem Satz von Rolle), echt zwischen x0 und x1 gelegen mit g 00 (x2 ) = 0. Argumentiert man in dieser Weise weiter, so gelangt man nach n−1 Schritten schließlich zu dem gesuchten Zwischenwert ξ. F. Beispiele und Anwendungen Interessant ist, dass die Taylorformel ein sehr allgemein gültiges Rezept vermittelt,Pnach dem man eine gegebene n Funktion f in eine Potenzreihe der Form12 ∞ n=0 an (x − x0 ) ‘entwickeln’ Pn−1 f (ν) (x0 ) Man kann zeigen, dass das Polynom (x − x0 )ν durch diese Forderung ν=0 ν! eindeutig bestimmt ist. 12 Diese ist von etwas allgemeinerer Form als die, die wir bislang angesehen haben; die wesentlichen Aussagen sind jedoch dieselben. 11 42 Mathematik für Physiker und Informatiker I (Kurzskript) kann. Es ist aber zum einen nicht klar, für welche Punkte x die sogenannte Taylorreihe ∞ X f (n) (x0 ) (x − x0 )n n! n=0 von f um x0 konvergiert, und zum anderen ist auch nicht offensichtlich, für welche x die Taylorreihe gegen den Wert f (x) konvergiert (d.h. für welche x das Restglied im Satz eine Nullfolge bildet). Zwei Beispiele: Für α ∈ Q — um Fallunterscheidungen zu vermeiden, schließen wir den einfachen Fall aus, dass α ∈ N ist — sei f (x) = (1 + x)α . Dann ist f (n) am Punkt x0 = 0 durch α(α − 1) . . . (α − ν + 1) gegeben. Für |x| < 1 ist die resultierende Taylorreihe (die sogenannte Binomische Reihe) Y ∞ n X α n α α−ν+1 x mit = n n ν n=0 ν=1 (1 + x)α konvergent und stellt die Funktion dar: Dass diese Potenzreihe den Konvergenzradius 1 besitzt, sieht man mit Hilfe des Quotientenkriteriums. Dass sie die Funktion (1+x)α darstellt, folgt für 1 > x ≥ 0 aus der Tatsache, dass das Restglied n f n (ξ) α x (x − x0 )n = (1 + ξ)α , 0 < ξ < x < 1, n! n 1+ξ aufgrund der Konvergenz der Reihe eine Nullfolge sein muss. Wenn wir für den Moment einmal davon ausgehen, dass sich Potenzreihen innerhalb ihres Konvergenzintervalls ableiten lassen wie die Polynome (was wir im nächsten Kapitel genau zeigen werden), dann sieht man, dass f 0 (x)(1 + x) = αf (x) für alle x mit |x| < 1 gilt. Da diese Beziehung auch für die Funktion g(x) = (1+x)α besteht, folgt (für α 6= 0) f 0 (x)/g 0 (x) = f (x)/g(x) sowie f 0 (x)g(x)− f (x)g 0 (x) = 0 für alle diese x, und der Quotient f /g muss eine konstante Funktion sein. Der Wert dieser Konstanten aber ist f (0)/g(0) = 1. Wenn Ihnen diese Überlegun sehr umständlich vorkommt, dann hilft vielleicht das folgende Beispiel für ein besseres Verständnis: Es sei ϕ : R → R, 1 − e x2 für x 6= 0 ϕ(x) = 0 für x = 0 Nimmt man die Ableitungsregeln der Exponentialfunktion vorweg, dann gibt es für alle n ∈ N ein Polynom Pn mit ϕ(n) (x) = Pn (x−1 )ϕ(x) für x 6= 0 und aus der Regel von l’Hospital folgt ϕ(n) (0) = 0 für alle n ∈ N0 . Die Tayloreihe von ϕ konvergiert also überall und stellt die Funktion ϕ dennoch nur im Nullpunkt dar. Es wird nun aber Zeit, dass wir uns darum kümmern, ob Potenzreihen wirklich so differenziert werden dürfen wie Polynome. Werner, Universität Münster, WS 05/06 43 3. Funktionenfolgen A. Punktweise und gleichmäßige P Konvergenz Bisher habe wir die Konvergenz von Potenzreihen P (x) = n an (x − x0 )n stets für einzelne xWerte betrachtet und damit eine Folge von Funktionen (die der Polynome P n a PN (x) = N n=1 n (x − x0 ) ) erhalten, die punktweise gegen eine Grenzfunktion konvergiert. Auch die durch fn : [0, 1] → R, fn (x) := xn definierte Funktionenfolge konvergiert an jedem Punkt von [0, 1] und zwar lim xn = n→∞ 1 falls x = 1 0 sonst . Hieraus kann man lernen, dass punktweise Konvergenz nicht ausreicht, um von der Stetigkeit der Folgenglieder auf die der Grenzfunktion zu schließen. Dieser punktweisen Konvergenz liegt übrigens auch keine Vorstellung von Abstand zu Grunde, der ja ganz wesentlicher Bestandteil bei der Konvergenz von Zahlenfolgen war. Die folgende Definition behebt auch dieses Manko. Anschaulich besagt der gleich eingeführte Abstandsbegriff, dass zwei Funktionen f und g dann einen Abstand haben, der kleiner oder gleich d ∈ R ist, wenn der Graph von f in einem Schlauch der Breite 2d um den Graphen von g enthalten ist. Definition 12 Es seien f, g, fn : [a, b] → R, n ∈ N, Funktionen. (a) Der Abstand zwischen f und g ist definiert durch kf − gk = sup |f (x) − g(x)|. x∈[a,b] (b) Die Folge (fn ) konvergiert gleichmäßig gegen f , falls limn→∞ kf −fn k = 0, d.h. falls für alle ε > 0 ein N (ε) ∈ N existiert, so dass für alle x ∈ [a, b] und alle n ≥ N (ε) stets |f (x) − fn (x)| < ε gilt. Satz 23 Es sei (fn ) eine auf dem Intervall [a, b] definierte Folge von Funktionen. (a) Konvergiert die Folge (fn ) gleichmäßig gegen f : [a, b] → R, so ist mit den Funktionen fn auch f stetig. (b) Sind die Funktionen fn (an den Randpunkten einseitig) differnzierbar, konvergiert die Folge der Ableitungen (fn0 ) gleichmäßig gegen eine Funktion ϕ und ist fn (x) konvergent für wenigstens einen Punkt x ∈ [a, b], so konvergiert (fn ) gleichmäßig gegen eine differenzierbare Funktion f mit f 0 = ϕ. 44 Mathematik für Physiker und Informatiker I (Kurzskript) Der Beweis des Teils (a) ist ein sogenanntes ‘typisches ε/3-Argument’: Es sei ε > 0 und x0 ∈ [a, b]. Zuerst wählt man n ∈ N mit kf − fn k < ε/3, sodann für die stetige Funktion fn eine Zahl δ > 0, so dass aus |x − x0 | < δ stets |fn (x) − fn (x0 )| < ε/3 folgt. Dann ergibt sich aber für dieselben x |f (x) − f (x0 )| ≤ |f (x) − fn (x)| + |fn (x) − fn (x0 )| + |fn (x0 ) − f (x0 )| < ε. Den Beweis des Teils (b) lassen wir weg und betrachten im Anschluss aber den Fall, der uns hier besonders interessiert, die Folge der Partialsummen einer Potenzreihe. Die gleichmäßige Konvergenz der Folge (fn ) selbst reicht im Teil (b) übrigens nicht: Anschaulich gesprochen ist für jede Folge von Funktionen deren Glieder in immer engeren ε-Schläuchen um eine Grenzfunktion enthalten sind, stets Platz für nahezu beliebige Eskapaden der Tangentensteigungen. Wem diese Begründung nicht ausreicht: Die durch x gn : [−1, 1] → R gn (x) = 1 + nx2 definierten Glieder einer Folge besitzen den Abstand 1 kgn k = √ 2 n zur Nullfunktion (das Ergebnis einer Extremalwertaufgabe), so dass (gn ) gleichmäßig gegen diese konvergiert. Zugleich aber ist 1 falls x = 0 2 1 − nx lim gn0 (x) = lim = , n→∞ (1 + nx2 )2 0 sonst und (gn0 ) konvergiert weder gleichmäßig noch ist der punktweise gebildete Limes die Ableitung der Grenzfunktion der Folge (gn ). B. Die Konvergenz der Potenzreihen P Satz 24 Es besitze die Potenzreihe n an (x − x0 )n den Konvergenzradius r ∈ R ∪ {∞}. (a) Für P jede Zahl 0 n< α < r konvergiert die Folge der Partialsummen von auf dem Intervall [x0 − α, x0 + α], und n an (x − Px0 ) gleichmäßig n die durch n an (x − x0 ) vermittelte Funktion ist auf (x0 − r, x0 + r) stetig. P (b) Die Funktion x 7→ n an (x−x0 )n ist an jedem Punkt x ∈ (x0 −r, x0 +r) differenzierbar, und es gilt auf dem gesamten Intervall (x0 − r, x0 + r) !0 ∞ ∞ X X n an (x − x0 ) = nan (x − x0 )n−1 , n=0 n=1 wobei die zweite Potenzreihe den gleichen Konvergenzradius wie x0 )n besitzt. P n an (x− Werner, Universität Münster, WS 05/06 45 Für den Beweis lohnt es sich, die Begründung für das Quotientenkriterium in Erinnerung zu rufen: Danach ist für eine passend gewählte Zahl A die P P Reihe n Aq np eine konvergente Majorante für n an (x − P x0 )n , wann immer n n q = lim sup n≥N an (x − x0 ) P n |an n(x − x0 ) | < 1. Für den Reihenrest ist dann Aq eine Majorante, die unabhängig von x ist, für jedes n≥N p n n α0 < q und alle p x mit lim supn |an (x − x0 ) | ≤ α0 < q, bzw. für jedes n α = α0 (lim supn |an |)−1 < r und alle x mit |x − x0 | < α. Für den Beweis von der KonvergenzraP∞ P (b) beobachtenn wir zunächst, dass n−1 a (x−x ) gleich dem von dius der Potenzreihe ∞ 0 n=1 nan (x−x0 ) n=0 n √ ist (was im wesentlichen aus lim n n → 1 folgt). Eine zweifache Anwendung des Mittelwertsatzes zeigt, dass für jede doppelt differenzierbare Funktion f : (a, b) → R mit |f 00 (x)| ≤ K für alle x ∈ (a, b) und jeden Punkt x0 ∈ (a, b) gilt f (x) − f (x0 ) 0 ≤ K|x − x0 |. − f (x ) 0 x − x0 Für die Funktion Pn (x) = (x−x0 )n gilt entsprechend |P 00 (x)| ≤ n(n−1)hn−2 für alle x ∈ (x0 + h, x0 − h), und damit folgt für h mit |h| ≤ h0 und (x0 − h0 , x0 + h0 ) ⊆ (x0 − r, x0 + r) ! ∞ ∞ ∞ 1 X X X an (x + h − x0 )n − an (x − x0 )n − nan (x − x0 )n−1 h n=0 n=0 n=1 ∞ X ≤ |h| an n(n − 1)hn−2 0 n=2 Die auf der rechten Seite sich befindende Reihe aber konvergiert (im Prinzip √ wiederum wegen lim n n → 1), und für h → 0 ergibt sich die behauptete Formel für die Ableitung einer Potenzreihe. Man kann die Aussage natürlich immer wieder neu auf die nach einer Ableitung erhaltene Potenzreihe anwenden. Es stellt sich so heraus, dass Potenzreihen im Innern ihres Konvergenzintervalls beliebig oft differenzierbar P n sind. Für die n-te Ableitung von f (x) = ∞ a n=0 n (z − z0 ) am Punkt x0 gilt insbesondere f (n) (x0 ) = n!an , und wir erhalten Satz 25 Besitzt die Funktion f die Darstellung f (x) = ∞ X an (z − z0 )n , n=0 so ist diese Reihe bereits die Taylorreihe von f . Dieser Satz vereinfacht häufig die Berechnung einer Taylorreihe: Ist man in der Lage, eine Potenzreihenentwicklung für eine vorgelegte Funktion zu “erraten”, so hat man deren Taylorreihe bereits gefunden. 46 Mathematik für Physiker und Informatiker I (Kurzskript) C. Anwendung: Die Erzeugendenfunktion der Fibonacchi-Zahlen Die durch F0 = F1 = 1 und Fn = Fn−1 + Fn−2 rekursiv definierte Folge der Fibonacchi-Zahlen besitzt die geschlossene Darstellung 1 Fn = √ 5 " √ !n # 1− 5 . 2 √ !n 1+ 5 − 2 Die Erzeugenden-Funktion der Folge (Fn ) ist Φ(x) = ∞ X Fn xn n=0 Die Rekursion für die Fn liefert −F0 x + xΦ(x) + x2 Φ(x) = Φ(x) − F1 x − F0 , woraus sich Φ zu Φ(x) = 1 1 − x − x2 errechnet. Der Trick besteht nun darin, Φ noch einmal direkt in eine Potenzreihe um den Nullpunkt zu entwickeln: √ Die Nullstellen des Nenners von (1 − x − x2 )−1 sind x1,2 = −1/2(1 ± 5) und daher ist 1 − x − x2 = (x − x1 )(x − x2 ). In dem Ansatz 1 A B = + 2 1−x−x x − x1 x − x2 bestimmt man die Zahlen A und B (etwa durch Probieren oder, systematischer, durch Ausmultiplizieren und Koeffizientenvergleich), was auf 1 1 Φ(x) = =√ 2 1−x−x 5 1 2√ −1+ 5 − −1+2 √5 x − 1 ! 2√ −1− 5 − −1−2 √5 x = " n+1 n+1 # ∞ X 1 2 2 √ √ √ = − xn 5 −1 + 5 −1 − 5 n=0 führt. Aufgrund von Satz ??, müssen die Koeffizienten beider Potenzreihenentwicklungen von Φ um Null dieselben sein, und man erhält die angegebene Formel für die Fibonacchi-Zahlen, nachdem man die Brüche passend erweitert hat. In der Physik taucht diese Technik (in etwas komplexerer Form) für eine ganze Reihe wichtiger und nicht ganz einfach zu handhabenden Funktionen auf. So genügen etwa die Bessel-Funktionen erster Art, Jn (x), n ∈ Z, (die Werner, Universität Münster, WS 05/06 47 man kennen muss, um z.B. die Grundschwingungen einer kreisförmigen, am Rande eingespannten Membran zu verstehen) der Beziehung ∞ X x 1 exp t− = Jn (x)tn , 2 t n=−∞ in der nicht nur eine “unendlich lange gebrochen rationale Funktion” (eine Laurent-Reihe als Verallgemeinerung der Potenzreihen) in Erscheinung tritt, sondern die Koeffizienten auch noch von einer zweiten Variablen abhängen. 4. Wichtige Funktionen A. Die Exponentialfunktion Wir kommen zurück zu den Funktionen, die die Wachstumsgleichung y 0 (t) = αy(t) lösen. Wie man leicht sieht, ist eine jede solche Funktion beliebig Poft diffen renzierbar. Wenn wir für den Augenblick annehmen, dass y(t) = ∞ n=0 an t in einer Umgebung des Nullpunkts durch ihre Taylorreihe dargestellt wird, dann muss gelten !0 ∞ ∞ ∞ X X X (n + 1)an+1 tn = an tn = α an tn n=0 n=0 und daher an+1 = α an n+1 Wir schreiben exp(αz) := n=0 oder an = a0 ∞ X (αz)n n=0 n! αn n! . Die Funktion z 7→ a0 exp(αz) ist dann für alle z ∈ C definiert und löst das sogenannte Anfangswertproblem y 0 = αy, y(0) = a0 . Weiter unten werden wir zeigen, dass diese Funktionen für a0 6= 0 nirgends verschwinden, und es folgt aus dem Mittelwertsatz, dass diese Lösung die einzige ist, die es gibt. Um die wichtigsten Eigenschaften dieser Funktionen herleiten zu können, brauchen wir den folgenden Satz über das sogenannte Cauchy-Produkt von Reihen. P P Satz 26 Es seien n an und n bn absolut konvergente Reihen komplexer Zahlen an und bn , n ∈ N0 . Dann gilt ! ∞ ! ∞ ∞ X n X X X aν bν = an−ν bν , ν=0 ν=0 und auch die Reihe mit den Gliedern n=0 ν=0 Pn ν=0 an−ν bν konvergiert absolut. 48 Mathematik für Physiker und Informatiker I (Kurzskript) Diese Methode, die vielen Produkte der Summanden des Produkts zweier Reihen aufzuschreiben ist nicht zuletzt deswegen besonders praktisch, da sie genau der Ordnung der Terme nach dem Grad der Potenzen (z − z0 )n entspricht. Wir erhalten als Folgerung eine Reihe von wichtigen Eigenschaften der Exponentialfunktionen: Satz 27 Für die im komplexen definierte Funktion E(·) gilt (a) Für alle z, w ∈ C ist E(z + w) = E(z)E(w). (b) E(z) 6= 0 für alle z ∈ C (c) E(z) = E(z) für alle z ∈ C. (d) Es ist E(x) = lim n→∞ und mit 1+ x n , n ∞ 1 n X 1 e := E(1) = lim 1 + = n→∞ n n! n=0 erhält man E(r) = er für alle r ∈ Q. Teil (a) ist eine gemeinsame Anwendung von Cauchy-Produkt und binomischer Formel: ∞ X n ∞ n X X 1 1 X n ν n−ν ν n−ν E(z)E(w) = z w = z w = E(z+w), ν!(n − ν)! n! ν n=0 ν=0 n=0 ν=0 Teil (b) folgt hieraus, da 1 = E(0) = E(z)E(−z) für alle z ∈ C, und der Teil (c) ist eine Konsequenz der Tatsache, dass die Konjugation ein sogenannter (stetiger) Körperautomorphismus von C ist, d.h. für alle z, w gilt z + w = z + w, sowie z · w = z · w. Die erste Gleichung des Teils (d) ergibt sich mit Hilfe der Regel von l’Hospitalr. Die für alle rationale Zahlen r gültige Beziehung exp(r) = er ist jetzt leicht einzusehen. C. Trigonometrische Funktionen Wir untersuchen zunächst weiterhing die komplexe Exponentialfunktion. Wir bezeichnen diese mit exp(z) oder auch ez . Es gilt für alle x+iy ∈ C exp(x+iy) = exp(x) exp(iy), und hier ist der Anteil exp(iy) unklar. Wir definieren zwei Funktionen A, B : R → R durch exp(iy) = A(y) + iB(y) Werner, Universität Münster, WS 05/06 49 Da die Potenzen von i durch die Folge 1, i, −1, −i, 1, i, . . . gegeben sind, entnimmt man der Potenzreihe von exp A(y) = ∞ X (−1)n n=0 y 2n (2n)! sowie B(y) = ∞ X (−1)n n=0 y 2n+1 (2n + 1)! und daraus A0 (y) = −B(y) und B 0 (y) = A(y). Aufgrund des Teils (c) des letzten Satzes ist stets | exp(iy)| = 1 und wir wollen versuchen zu klären, was die geometrische Bedeutung der Zahl y ist. Wir stellen uns dazu die Abbildung t 7→ exp(it) als die Darstellung eines Punktes P vor, dass sich auf dem Einheitskreis in der Ebene bewegt und zum Zeitpunkt t sich im Punkt exp(it) befindet. Der Betrag der Geschwindigkeit, mit dem P vorankommt13 , ist wegen exp0 (it) = i exp(it) konstant gleicht 1, so dass P den Einheitskreis stets mit demselben Drehsinn durchläuft (wäre dies nicht so, so müsste die Geschwindigkeit an einem “Umkehrpunkt” verschwinden). Nun erkennt man leicht aus den Potenzreihen, dass A(y) und B(y) für y ∈ (0, 1] strikt positiv sind. Daher fällt A in diesem Bereich, und B steigt monoton: Die Bewegung von P erfolgt als entgegen dem Uhrzeigersinn. Die Strecke, die P beginnend bei 0 bis zum Zeitpunkt t zurückgelegt hat, ist Geschwindigkeit × Zeit = 1 × t = t. Damit befindet sich der Punkt exp(it) also am Ende eines gegen den Uhrzeigersinn abgetragenen Bogens der Länge t. Anders ausgedrückt: t ist der Winkel (gemessen im Bogenmaß) den der Vektor exp(it) mit der reellen Achse einschließt. Es stellt sich heraus, dass die Funktionen A und B genau die aus der Schule bekannten trigonometrischen Funktionen sind, und wir können nach einer rein formalen Umbenennung schreiben für alle x, y ∈ R exp(x + iy) = exp(x)(cos y + i sin y), An dieser Stelle wird klar, weshalb es günstig ist, die Winkelfunktionen auf das Bogenmaß zu beziehen. Wir erhalten jetzt: Zunächst die nicht unverdient populäre Gleichung eiπ = −1, sodann einen einfachen Beweis der trigonometrischen Additionstheoreme, die sich für alle x, y ∈ R aus cos(x + y) + i sin(x + y) = exp(i(x + y)) = exp(ix) exp(iy) = = cos(x) cos(y) − sin(x) sin(y) + i (cos(x) sin(y) + cos(y) sin(x)) ergeben und schließlich eine neue Darstellung für die Polarkoordinaten: Für jede komplexe Zahl gilt z = (|z|, ϕ) = |z|eiϕ . 13 An dieser Stelle greifen wir ein wenig vor; denn der Pfad, um den es hier geht, ist eine Funktion R → R2 , deren Ableitungen wir noch nicht behandelt haben 50 Mathematik für Physiker und Informatiker I (Kurzskript) D. Die Umkehrfunktionen Die letzte Ausbaustufe unserer Betrachtungen zur Stetigkeit der Wurzelfunktion liefert der nachfolgende Satz. Er besagt, dass alle expliziten Rechnungen überflüssig waren, und die Stetigkeit der Wurzelfunktion bereits aus der der Abblidung x 7→ x2 folgt, die ja sehr viel einfacher zu erhalten ist. Sein Beweis benutzt ganz wesentlich den Satz 15. Satz 28 Ist f : [a, b] → R eine monoton wachsende Funktion, so bildet f das Intervall [a, b] bijektiv auf das Intervall [f (a), f (b)] ab, und die Umkehrfunktion f −1 : [f (a), f (b)] → [a, b] ist stetig. Analoge Aussagen gelten für monoton fallende Funktionen. Die Tatsache, dass f injektiv ist, folgt aus dem monotonen Wachstum, die Surjektivität ist eine Konsequenz des Zwischenwertsatzes. Um die Stetigkeit der Umkehrfunktion nachzuweisen, beginnt man mit einem Punkt y0 ∈ [f (a), f (b)] sowie einer gegen y0 konvergenten Folge (yn ) aus [f (a), f (b)]. Falls (im Gegensatz zu dem, was wir eigentlich zeigen müssten) f −1 (yn ) nicht gegen f −1 (y0 ) konvergiert, gibt es eine Teilfolge (ynk ) sowie eine Zahl ε0 > 0, so dass für alle k ∈ N gilt |f −1 (ynk ) − f −1 (y0 )| ≥ ε0 . Da [a, b] kompakt ist, können wir sogar annehmen, dass f −1 (ynk ) eine konvergente Folge ist, deren Grenzwert wir x0 nennen — unter Umständen müssen wir halt zu einer weiteren Teilfolge übergehen, die wir hier aber der Einfachheit halber auch f −1 (ynk ) nennen. Es folgt dann einerseits |x0 − f −1 (y0 )| ≥ ε0 , auf der anderen Seite aber ist wegen der Stetigkeit von f zugleich y0 = lim ynk = lim f (f −1 (ynk )) = f (x0 ) k→∞ k→∞ woraus sich der Widerspruch f −1 (y0 ) = x0 ergibt. Dieser Satz lässt sich recht leicht auf den Fall von monoton wachsenden (fallenden) Funktionen auf Intervallen [a, ∞) bzw. (−∞, b] ausdehnen: Ist z.B. f : [a, ∞) stetig und monoton, dann besitzt für jedes n ∈ N nach Satz 16 die Einschränkung f |[a,a+n] : [a, b] → R, x 7→ f (x) eine (insbesondere) am Punkt y0 stetige Inverse f |[a,a+n] −1 = f −1 |[f (a),f (a+n)] : [f (a), f (a + n)] → [a, a + n]. Was noch zu zeigen bleibt, ist, dass aus der Stetigkeit der Einschränkung an einem Punkt y0 die der ursprünglichen Abbildung an derselben Stelle folgt. Dies aber ist eine Konsequenz der Tatsache, dass jede Folge in f (D), die gegen y0 konvergiert, von einem Index N0 an in dem Intervall [f (a), f (a+n)] enthalten ist. Eine Konsequenz dieser Überlegung: Die Wurzelfunktionen f : R+ 0 → R, √ x 7→ n x sind für jedes n ∈ N stetig. Im Reellen besitzen die Funktionen ex , Werner, Universität Münster, WS 05/06 51 sin x, cos x, tan x = sin x(cos x)−1 für entsprechend eingeschränkte Definitionsbereiche die Umkehrfunktionen h π πi ln x : R+ → R, arcsin x : [−1, 1] → − , , 2 2π π arccos x : [−1, 1] → [0, π], arctan x : R → − , , 2 2 deren Existenz, Stetigkeit und Differenzierbarkeit alle entsprechenden Monotonieaussagen und den Sätzen 16 und 18(ii) folgt. Für die Ableitungen erhält man (ln x)0 = 1 , x (arcsin x)0 = √ 1 (arccos x)0 = − √ , 1 − x2 1 , 1 − x2 (arctan x)0 = 1 . 1 + x2 Die Talorreihen aller dieser Ableitungen lassen sich auf die binomische Reihe zurückführen. Wenn man noch den Wert a0 = f (x0 ) hinzunimmt so, lässt sich aus den Taylorreihen für die Ableitungen diejenigen der Umkehrfunktionen selbst ermitteln. Man erhält ∞ ∞ n+1 X X −1/2 x2n+1 n (x − 1) ln x = (−1) , arcsin x = , n+1 n 2n + 1 n=0 n=0 2n+1 ∞ ∞ X X π −1/2 x x2n+1 arcosh x = − , arctan x = (−1)n , 2 n 2n + 1 2n + 1 n=0 n=0 jeweils für |x| < 1 bzw. (für ln) |x − 1| < 1. Bemerkenswert an diesen Potenzreihen ist, dass unter ihnen für bestimmte x-Werte alte Bekannte auftreten. Unglücklicherweise scheinen die interessanten Reihen aber immer gerade für x-Werte auf dem Rand des Konvergenzbereichs aufzutreten. Das folgende Ergebnis erlaubt es, den Wert dieser Reihen auch an diesen Stellen zu berechnen. P∞ Satz 29 Es besitze die Potenzreihe f (x) = P∞ n=0 einen Konvergenzradius, der größer oder gleich 1 ist. Falls f (1) := n=0 an konvergiert, so gilt f (1) = lim f (x). x→1 Dieses Resultat ist auch als der Abelsche P Grenzwertsatz bekannt. Der Beweis gründet sich auf den Einfall, rn = ∞ ν=n+1 aν für n ≥ −1 zu setzen, womit man dann schreiben kann f (1) − f (x) = (1 − x) ∞ X rn−1 xn n=0 P n (aus dieser Beziehung ergibt sich auch im Grenzübergang, dass ∞ n=0 rn−1 x für x ∈ [−1, 1] konvergiert.) Die Reihe lässt sich günstig zerlegen: Falls