Mathematik für die Chemie I Herbstsemester 2010 Erwin Bolthausen Inhaltsverzeichnis 1 Mengen und Abbildungen 1.1 Mengen . . . . . . . . . 1.2 Funktionen . . . . . . . 1.3 Polynome . . . . . . . . 2 Die 2.1 2.2 2.3 2.4 2.5 2.6 2.7 (Funktionen) 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 komplexen Zahlen Motivation . . . . . . . . . . . . . . . . . . . . . . . . De…nition der komplexen Zahlen und Addition . . . . Multiplikation komplexer Zahlen . . . . . . . . . . . . Graphische Darstellung, Polarkoordinaten . . . . . . . Konjugation komplexer Zahlen, Division . . . . . . . . Potenzen und Wurzeln . . . . . . . . . . . . . . . . . . Hauptsatz der Algebra: Jedes Polynom hat mindestens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . eine Nullstelle . . . . . . . . . . . . . . 3 In…mum, Supremum, Minimum, Maximum 15 15 17 18 19 22 24 27 30 4 Folgen und Reihen 31 4.1 Konvergenz von Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 4.2 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 5 Stetigkeit 43 6 Di¤erentialrechnung 6.1 De…nition des Di¤erentialquotienten und 6.2 Höhere Ableitungen . . . . . . . . . . . 6.3 Die Regel von Bernoulli-l’Hospital . . . 6.4 Geometrische Anwendungen . . . . . . . 54 54 68 71 73 grundlegende . . . . . . . . . . . . . . . . . . . . . . . . Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Integration 81 7.1 Das bestimmte Integral und die Stammfunktion . . . . . . . . . . . . . . . 81 7.2 Zwei Integrationsmethoden: Partielle Integration und Substitution . . . . 90 7.3 Die Taylorformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 1 7.4 7.5 Potenzreihen und die Taylorreihe . . . . . . . . . . . . . . . . . . . . . . . 97 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8 Periodische Funktionen und Fourierreihen 1 1.1 110 Mengen und Abbildungen (Funktionen) Mengen Eine Menge ist eine beliebige Kollektion von Objekten, wie z.B. Zahlen, geometrischen Objekten, Tieren, Menschen, Himmelskörpern etc., den Elementen der Menge. Notation 1.1 a 2 M bedeutet: a ist Element der Menge M: a2 = M bedeutet: a ist nicht Element der Menge M Es gibt verschiedenen Möglichkeiten, Mengen darzustellen; die einfachste ist, die Elemente der Menge aufzulisten. Man schreibt die Elemente üblicherweise dann in geschweifte Klammern: M = f1; 4; 7; 9g : (1.1) Diese Menge enthält 4 Elemente, nämlich die Elemente 1; 4; 7 und 9: Die Elemente einer Menge müssen keinesfalls Zahlen sein. So ist M = fMerkur, Venus, Jupiterg eine wohlde…nierte Menge mit 3 Elementen. Die Anzahl der Elemente einer Menge nennt man die Kardinalität der Menge. Die durch (1.1) gegebene Menge hat also die Kardinalität 4: Wir schreiben jM j für die Kardinalität der Menge M: Es ist also jf1; 4; 7; 9gj = 4: Schwierig wird diese Darstellungsweise dann, wenn die Menge sehr viel Elemente oder gar unendlich viele Elemente enthält. Man behilft sich dann oft mit “Pünktchen”. Z.B. ist die Menge M = f1; 3; 5; 7; 9; : : :g die Menge der ungeraden natürlichen Zahlen. Diese Menge enthält natürlich unendlich viele Elemente. Man sagt, die Kardinalität sei 1: Es ist üblich, Mengen mit grossen lateinischen Buchstaben wie A; B oder M zu bezeichnen, und die Elemente mit kleinen. Dies kann jedoch nicht immer durchgehalten werden. Wir werden uns nach Möglichkeit an diese Konvention halten; es wird jedoch auch Ausnahmen geben. Es folgt eine Au‡istung der für uns wichtigsten Mengen von Zahlen. Es ist hier üblich, diese mit grossen lateinischen Buchstaben mit “Doppelstrichen”zu bezeichnen. Die entsprechenden Bezeichnungen sind ein für allemal für diese speziellen Mengen reserviert. 2 N ist die Menge der natürlichen Zahlen, d.h. N := f1; 2; 3; 4; : : :g : Mit N0 bezeichnen wir die Menge der natürlichen Zahlen inklusive der Null: N0 := f0; 1; 2; 3; 4; : : :g Z ist die Menge der ganzen Zahlen, d.h. Z := f0; 1; 1; 2; 2; 3; 3; 4; 4; : : :g : Q ist die Menge der rationalen Zahlen, d.h. der Zahlen, die sich als Brüche von ganzen Zahlen (mit Nenner 6= 0) darstellen lassen. Also z.B. sind 3=4, 234=1875 rationale Zahlen, in unserer Sprechweise also Elemente von Q: R ist die Menge der reellen Zahlen. Aus der Schule am besten bekannt ist wahrscheinlich die Darstellung der reellen Zahlen als unendlich lange Dezimalbrüche. Statt durch eine Aufzählung beschreibt man Mengen auch oft durch die Angabe der Eigenschaften ihrer Elemente. Hier ein Beispiel: M = fx : x 2 N; x ist durch 5 teilbarg : Dies bedarf einiger Erläuterungen. Die Menge M besteht aus denjenigen Elementen x; deren Eigenschaften hinter dem Doppelpunkt aufgezählt sind.1 Hier sind es zwei Eigenschaften: x muss eine natürliche Zahl sein, und x ist durch 5 teilbar. Oft schreibt man auch etwas einfacher für dieselbe Menge M = fx 2 N : x ist durch 5 teilbarg : Eine aufzählende Beschreibung für diese Menge ist M = f5; 10; 15; 20; : : :g : Ein anderes Beispiel: A = x 2 R : x2 = 1 (1.2) Das ist natürlich die zweielementige Menge f 1; 1g : Nun zu weiteren De…nitionen: Zwei Mengen A und B heissen gleich, wenn sie dieselben Elemente enthalten. Wir benützen die Gelegenheit, eine “stenographische”Kurzschreibweise solcher Aussagen einzuführen: A = B , 8x (x 2 A , x 2 B) : (1.3) Die Notationen sind vielleicht schon aus der Schule bekannt. 8 ist ein Kürzel für “für alle”. 8x bedeutet “für alle x gilt:”. Der Doppelpfeil , ist sicher aus der Schule bekannt. 1 In manchen Textbüchern wird anstelle des Doppelpunktes auch ein senkrechter Strich verwendet. Also fxjx 2 N; x ist durch 5 teilbarg : 3 Es ist eine Abkürzung für “gilt dann und nur dann wenn”oder “gilt genau dann wenn”. Das Kryptogramm (1.3) besagt also einfach: A und B sind genau dann gleich, wenn für alle x gilt: x ist Element von A genau dann, wenn es Element von B ist. Etwas weniger umständlich ausgedrückt: A und B sind genau dann gleich, wenn sie dieselben Elemente enthalten. Eine spezielle Menge spielt eine besondere Rolle, die sogenannte leere Menge ;: Sie ist de…niert als die Menge, die keine Elemente enthält. Natürlich mag man sich fragen, ob eine solche Menge von irgendwelchem Interesse ist. Es ist für viele Zwecke bequem, die Existenz einer derartigen Menge zu postulieren. Es gibt o¤enbar nur eine leere Menge, denn zwei Mengen sind gleich, wenn sie dieselben Elemente enthalten. Da leere Mengen gar keine Elemente enthalten, sind o¤enbar zwei leere Mengen gleich, d.h. es gibt nur eine leere Menge. A ist eine Teilmenge von B, wenn jedes Element von A auch Element von B ist. Man schreibt dann A B: Wieder “stenographisch”: A B , 8x (x 2 A =) x 2 B) : Hier verwenden wir den einfachen Implikationspfeil =); der sicher auch aus der Schule bekannt ist. Natürlich ist B stets eine Teilmenge von B: Ferner ist die leere Menge ; eine Teilmenge jeder Menge. Man beachte, dass zwei Mengen A und B genau dann gleich sind, wenn A B und B A gelten. Manchmal wird für die Teilmengenbeziehung auch noch die Schreibweise verwendet, die explizit andeutet, dass die Mengen auch gleich sein können. Wir werden diese Notation jedoch nicht verwenden, da sie (leider) ungebräuchlich geworden ist. Intervalle sind spezielle Teilmengen von R: Für a < b bezeichnen wir mit [a; b] das Intervall von a nach b; d.h. die Menge der Zahlen, die zwischen a und b sind, inklusive der beiden Endpunkte: [a; b] := fx 2 R : a x bg : Mit ]a:b[ bezeichnen wir das sogenannte o¤ene Intervall, das die Punkte enthält, die echt zwischen a und b liegen, also exklusive der Endpunkte. ]a; b[:= fx 2 R : a < x < bg : Wir schreiben [a; 1[ für die Menge der reellen Zahlen, die a sind und ]a; 1[ für die Menge der Zahlen, welche > a sind. Analog sind ] 1; a] ; ] 1; a[ etc. de…niert. Teilmengen einer Menge werden auch sehr oft durch Eigenschaften beschrieben. Ist M eine Menge und E eine Eigenschaft, so ist A = fx 2 M : x hat Eigenschaft Eg die Menge derjenigen Elemente von M; die die Eigenschaft E besitzen. Wir haben das schon oben in (1.2) angetro¤en. Aus der Schule sind wahrscheinlich Durchschnitt, Vereinigung und Komplement bekannt: Es seien A und B zwei Mengen. Dann sind diese neuen Mengen wie folgt de…niert: A \ B := fx : x 2 A und x 2 Bg ; 4 A [ B := fx : x 2 A oder x 2 Bg ; AnB := fx : x 2 A und x 2 = Bg : An dieser Stelle sollte betont werden, dass Mathematiker das Wort „oder“ in einem Sinn verwenden, der nicht dem der Alltagssprache entspricht. „x 2 A oder x 2 B“ bedeutet nicht „entweder oder“, sondern dass mindestens eine der beiden Eigenschaften gilt. Zwei Mengen A; B heissen disjunkt, wenn sie keine gemeinsamen Elemente haben. Wir können das mit dem Durchschnitt und der leeren Menge ausdrücken. A; B sind genau dann disjunkt, wenn A \ B = ; gilt. Sind drei oder mehr Mengen gegeben, so sagt man, sie seien paarweise disjunkt, wenn je zwei disjunkt sind. f1; 2g ; f1; 3g ; f2; 3g zwar nicht paarweise disjunkt, der Durchschnitt der drei Mengen ist jedoch leer, d.h. es gibt kein Element, das in allen drei Mengen liegt. Wir werden oft Teilmengen einer festen Menge, nennen wir sie M; betrachten, die dann für eine längere Betrachtung nicht mehr wechselt. Dann schreibt man Ac für M nA: Das ist das Komplement von A in M: Natürlich müsste man eigentlich M in der Notation mit ausdrücken. Das wird jedoch stets aus dem Kontext ersichtlich sein. Für die obigen Mengenoperationen gelten einige Rechenregeln, die wir hier als bekannt voraussetzen, z.B. A \ (B [ C) = (A \ B) [ (A \ C) ; (1.4) (A [ B)c = Ac \ B c : Den Beweis, dass zwei Mengen A und B gleich sind, führt man oft in zwei Schritten. Man zeigt zuerst, dass A B gilt und dann, dass B A gilt. Wir exempli…zieren das mit einem Beweis von (1.4): Beweis von (1.4) . Sei x 2 A \ (B [ C) : Dann ist x Element von A und von B [ C: Ist x 2 B [ C; so ist x in B oder in C: Gilt Ersteres, so ist x 2 A \ B; und gilt Letzteres, so gilt x 2 A \ C: In jedem Fall folgt dann x 2 (A \ B) [ (A \ C) : Damit haben wir gezeigt, dass jedes Element von A \ (B [ C) auch in (A \ B) [ (A \ C) ist. Damit haben wir nachgewiesen, dass A \ (B [ C) (A \ B) [ (A \ C) (1.5) gilt. Nun kommen wir zum zweiten Teil des Beweises. Sie x 2 (A \ B) [ (A \ C) : Dann ist x 2 A \ B oder x 2 A \ C: x liegt also in A und B; oder in A und C: In jedem Fall liegt also x in A und dann in B oder C: Das bedeutet aber nichts anderes, als dass x 2 A \ (B [ C) gilt. Wir haben also (A \ B) [ (A \ C) nachgewiesen. 5 A \ (B [ C) (1.6) (1.5) und (1.6) implizieren (1.4). Produktmengen: Sind A; B zwei Mengen, so ist die Produktmenge A B de…niert als die Menge aller geordneten Paare (a; b) mit a 2 A und b 2 B: Es wird nicht vorausgesetzt, dass die beiden Mengen A; B verschieden sind. Man kann also durchaus die Menge A A betrachten. Es ist dabei jedoch wichtig, dass man auf die Reihenfolge der Paare achtet. Sind a; b zwei verschiedene Elemente in A; so sind (a; b) und (b; a) zwei verschiedene Elemente in A A: Für A A schreibt man meist A2 : Ist m = jAj und n = jBj ; so gilt jA Bj = m n: Beispiel 1.2 A = f1; 2; 3g : Dann ist A A = f(1; 1) ; (1; 2) ; (1; 3) ; (2; 1) ; (2; 2) ; (2; 3) ; (3; 1) ; (3; 2) ; (3; 3)g : Vorsicht: Man darf die Mengenklammer f g nicht mit der Klammer ( ) für die Paarbildung verwechseln. f1; 2g ist die Menge, die die Elemente 1 und 2 enthält. Diese Menge ist die gleiche wie f2; 1g : Bei der Aufzählung der Mengenelemente spielt es keine Rolle, in welcher Reihenfolge man diese aufzählt. Hingegen ist (1; 2) 6= (2; 1) : 1.2 Funktionen Es seien A; B Mengen. Eine Funktion f (oder Abbildung) von A nach B weist jedem Element a 2 A genau ein Element f (a) 2 B zu.2 Man schreibt f : A ! B: f (a) nennt man den Funktionswert von a: a heisst auch Argument oder Variable. Mit der Bezeichnung „Variable“ will man zum Ausdruck bringen, dass a nicht ein festes Element in A ist, sondern in A quasi variieren kann. A nennt man den De…nitionsbereich der Funktion. Es hat sich in der Mathematik eingebürgert, dass man Funktion mit kleinen lateinischen Buchstaben, typischerweise f; g; h oder griechischen Buchstanben '; etc. bezeichnet. Dies ist jedoch keine feste Regel. Wenn man will, so kann man Kurzwörter wie in der Informatik üblich verwenden, welche die De…nition der Funktion widerspiegeln. Beispiel 1.3 Körpergrösse von Menschen: A ist die Menge aller Menschen, B die Menge der reellen Zahlen. f ordnet jedem Menschen seine Körpergrösse zu: Ist a 2 A; d.h. ist a ein Mensch, so ist f (a) die Körpergrösse des Menschen a; z.B. in Centimetern. Wir können das Beispiel verfeinern, indem wir noch den Zeitpunkt betrachten, zu welchem die Körpergrösse bestimmt wird. Einem Menschen a und einem Zeitpunkt t ordnen wir die Körpergrösse von a zum Zeitpunkt t zu. (Wir lassen die Schwierigkeit ausser Betracht, dass a zum Zeitpunkt t vielleicht noch nicht geboren ist, oder schon gestorben ist.) Formal können wir die Produktmenge A T betrachten, wobei T die Menge der betrachteten Zeitpunkte ist. Dann ist f (a; t) die Körpergrösse von a zur Zeit t: (Eigentlich müsste man f ((a; t)) schreiben, was man jedoch in diesem Fall nicht macht. f ist in diesem Fall eine Funktion A T ! R: 2 Manchmal wird die Bezeichnung „Funktion“ für spezielle Abbildungen verwendet, meist wenn B = R ist. Ich verwende die Ausdrücke „Funktion“ und „Abbildung“ hier synonym. 6 Für eine Funktion f : A ! B wird nicht vorausgesetzt, dass jedes Element b 2 B als Bildelement unter f vorkommt. So gibt es keinen Menschen, der 500 cm gross ist, d.h. im obigen Beispiel gibt es kein a 2 A mit f (a) = 500: Ferner wird auch nicht vorausgesetzt, dass verschiedene Elemente in A auch verschiedene Funktionswerte haben. So können zwei verschiedene Menschen durchaus dieselbe Körpergrösse haben, d.h. aus a 6= a0 folgt nicht f (a) 6= f (a0 ) : Die Menge der Elemente b 2 B; welche als Funktionswerte von f auftreten, bezeichnen wir mit im (f ) : Formal: im (f ) := ff (a) : a 2 Ag : im (f ) ist o¤enbar eine Teilmenge von B: Beispiel 1.4 Seien A = f1; 2; 3; 4g und B = f1; 2; 3; 4; 5g : Wir setzen f (1) = 3; f (2) = 4; f (3) = 3; f (4) = 5: Hier gibt es zwei verschiedene Elemente in A, nämlich 1 und 3; die denselben Funktionswert haben. Ferner kommen die Elemente 1; 2 2 B nicht als Funktionswerte vor, d.h. im (f ) = f3; 4; 5g : De…nition 1.5 Eine Funktion f : A ! B heisst injektiv, falls verschiedene Elemente in A stets verschieden Funktionswerte haben, d.h. wenn aus a 6= a0 die Ungleichung f (a) 6= f (a0 ) folgt. f heisst surjektiv, falls alle Elemente in B als Funktionswerte vorkommen, d.h. wenn für jedes b 2 B mindestens ein a 2 A existiert mit f (a) = b; oder kurz, wenn im (f ) = B ist. Eine Funktion, die sowohl injektiv wie surjektiv ist, nennt man bijektiv. Ist eine Funktion f : A ! B bijektiv, erzeugt f o¤enbar eine eineindeutige Verknüpfung der Elemente von A mit den Elementen von B : Jedes Element b 2 B ist der Funktionswert f (a) eines eindeutigen Elementes a 2 A: In diesem Falle kann man die Abbildung quasi „umdrehen“, indem man jedem b 2 B dieses eindeutige Element a 2 A zuweist, das f (a) = b erfüllt. Man schreibt dann a = f 1 (b) und nennt f 1 : B ! A die zu f inverse Abbildung, oder die Umkehrfunktion.3 Hier ein paar Beispiele mit A = B = R 1. f (x) = x2 : im (f ) ist die Menge der reellen Zahlen 0; d.h. im (f ) = [0; 1[ in der vorher eingeführten Notation. Die Abbildung ist weder injektiv noch surjektiv. 2. f (x) = x3 : f ist sowohl injektiv wie surjektiv, d.h. f ist bijektiv. Die Umkehrfunktion ist die dritte Wurzel, die für jede Zahl in R eindeutig de…niert ist. 3. f (x) = ex : (Ich gehe davon aus, dass die Exponentialfunktion mit der Eulerschen Konstanten e = 2:71828::: bekannt ist.) Die Abbildung ist injektiv, aber nicht surjektiv. im (f ) = ]0; 1[ : 4. f (x) = x3 3 Vorsicht: f 1 x: Hier ist der Graph der Funktion: (a) ist nicht 1=f (a) : 7 y 10 8 6 4 2 -4 -3 -2 -1 1 -2 2 3 4 x -4 -6 -8 -10 Die Funktion ist surjektiv, aber nicht injektiv. Dass die Funktion nicht injektiv ist erkennt man an f ( 1) = f (0) = f (1) = 0:4 5. Eine sehr spezielle Klasse von Funktionen sind die konstanten Funktionen, welche für jedes a 2 A stets denselben Wert annehmen. D.h. es existiert ein b 2 B, sodass f (a) = b für alle a 2 A gilt. Von einer Funktion f : A ! R sagt man, dass sie identisch verschwindet, falls sie konstant gleich 0 ist. Funktionen f : R ! R werden meist mit ihrem Graphen veranschaulicht. Das ist einfach die Punktmenge f(x; y = f (x)) : x 2 Rg R2 in der Zahlenebene. Ist die Funktion f : R ! R bijektiv, so erhält man den Graphen der inversen Funktion 1 f aus dem Graphen der Funktion f indem man die x- gegen die y-Achse austauscht. Geometrisch ist das eine Spiegelung an der 45 -Gerade im ersten Quadranten. Hier ein Beispiel f (x) = x + sin (x) : Die Funktion ist bijektiv, was nicht ganz o¤ensichtlich ist. Wir werden das später sehen. In der Zeichnung unten ist schwarz (durchgezogen) der Graph von f eingezeichnet, rot (gestrichelt) der Graph von f 1 ; und gepunktet die 45 Gerade. Um nachzuweisen, dass eine Funktion nicht injektiv ist, muss man bloss zwei Elemente a 6= a0 …nden mit f (a) = f (a0 ) : 4 8 y 5 4 3 2 1 -5 -4 -3 -2 -1 1 2 3 4 5 x -1 -2 -3 -4 -5 Die Funktion x ! x + sin (x) und ihre Umkehrfunktion Für jede Funktion f : A ! B; die nicht surjektiv ist, kann die Bildmenge durch im (f ) ersetzt werden: f : A ! im (f ) ; denn die Funktionswerte von f sind ja alle in im (f ) : Das ist gewissermassen eine banale Modi…kation. Es ist jedoch gut, zwischen den Funktionen zu unterscheiden, obwohl das etwas pedantisch anmutet. f : A ! im (f ) wird dann surjektiv. Ist f injektiv, so ist diese Modi…kation f : A ! im (f ) bijektiv. Im Beispiel 3. oben ist die Exponentialfunktion als Funktion f : R ! ]0; 1[ bijektiv. Die Umkehrabbildung ist die (natürliche) Logarithmusfunktion. f 1 (x) = log (x) : (Ich verwende hier log (x) für den natürlichen Logarithmus von x und nicht, wie vielleicht in der Schule gelernt, ln (x)). Ist f : A ! B eine Funktion und ist A0 eine Teilmenge von A0 ; so kann man f auf A0 einschränken, indem man f (a) nur für a 2 A0 betrachtet. Man nennt dies die Einschränkung von f auf A0 : Wir bezeichnen sie oft mit f jA0 : Mit der Einschränkung ändern sich oft auch die Eigenschaften der Funktion. Beispiel 1.6 Wir betrachten die Sinusfunktion sin : R ! R: (Wenn nichts anderes vermerkt ist, so werden Winkel stets im Bogenmass angegeben). 9 sin(x) 1.4 1.2 1.0 0.8 0.6 0.4 0.2 -10 -8 -6 -4 -2 2 -0.2 4 6 8 10 x -0.4 -0.6 -0.8 -1.0 -1.2 -1.4 sin (x) im Intervall [ 10; 10] Die Funktion ist weder injektiv noch surjektiv. im (sin) = [ 1; 1] : Wenn wir die Funktion jedoch auf das Intervall [ =2; =2] einschränken, so erhalten wir eine injektive Funktion, die [ =2; =2] bijektiv auf [ 1; 1] abbildet. sin(x) 1.0 0.8 0.6 0.4 0.2 -1.4 -1.2 -1.0 -0.8 -0.6 -0.4 -0.2 -0.2 0.2 0.4 0.6 0.8 1.0 1.2 1.4 x -0.4 -0.6 -0.8 -1.0 sin (x) im Intervall [ =2; =2] Die Umkehrfunktion ist natürlich die Arkussinusfunktion arcsin : [ 1; 1] ! [ =2; =2] : Beispiel 1.7 Ein anderes Beispiel. f (x) = x2 : Schränkt man den De…nitionsbereich auf [0; 1[ ein, so 10 ist es eine bijektive Funktion [0; 1[ ! [0; 1[ : Die Umkehrfunktion f p wurzel: f 1 (x) = x: 1 ist die Quadrat- Bemerkung zur Notation: Es ist ziemlich gebräuchlich, dass man für die Variable die Bezeichnung x verwendet, vor allem, wenn eine Funktion betrachtet wird, die auf R de…niert ist. Mathematisch ist jedoch unerheblich, welchen Buchstaben man verwendet. Es ist auch nicht unüblich, dass man von der „Funktion f (x)“ spricht, obwohl das genau genommen eine falsche Redewendung ist: f (x) ist der Funktionswert an der Stelle x: Wir werden in dieser Hinsicht auch nicht immer ganz pingelig sein, wenn aus dem Kontext klar ist, ob man die Funktion meint, oder den Funktionswert. Manchmal sprechen wir auch von der „Funktion x ! f (x)“, also von der Funktion, welche x in f (x) überführt. 1.3 Polynome Zu den einfachsten Funktionen in der Variable x gehören die Potenzen von x : x = x1 ; x2 ; x3 ; : : : : Mit x0 bezeichnet man üblicherweise die Funktion, die konstant = 1 ist. Polynome sind Funktionen R ! R die sich durch Addition von Vielfachen dieser Potenzen darstellen lassen, z.B. 3 + 1:5x4 7x100 : (1.7) Die allgemeine De…nition: Ein Polynom p ist eine Funktion R ! R die eine Darstellung der Form p (x) = a0 + a1 x + a2 x2 + + an xn hat, mit a0 ; a1 ; : : : ; an 2 R: Diese Zahlen nennt man die Koe¢ zienten des Polynoms. Gilt an 6= 0; so heisst n der Grad des Polynoms und schreibt dafür grad (p (x)) : (Ist an = 0; so lässt man den Summanden an xn natürlich einfach weg bis man zu einem Koe¢ zienten 6= 0 gelangt). Das obige Beispiel (1.7) eines Polynoms hat den Grad 100. Aus der Schule sollten quadratische Polynome bekannt sein, d.h. die Polynome vom Grad 2: Der Graph dieser Poylnome ist stets eine Parabel, nach oben geö¤net, sofern a2 > 0 ist, und nach unten, wenn a2 < 0 ist. Es sollte bekannt sein, wie man den Scheitel der Parabel und dessen Lage berechnet. Die Polynome höheren Grades können kompliziert aussehen. Unten ist der Graph eines Polynoms sechsten Grades eingezeichnet. p (x) = 1 + x x2 0:1x3 0:1x4 + 0:03x5 + 0:01x6 11 p(x) 30 20 10 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 x -10 -20 -30 Von besonderer Bedeutung sind die Nullstellen eines Polynoms, d.h. die Lösungen der Gleichung p (x) = 0: Im Falle eines linearen Polynoms p (x) = a + bx ist die Lösung der Gleichung a + bx = 0 trivial: a=b; sofern b 6= 0 ist. Im Falle eines quadratischen Polynoms sind die Nullstellen die Lösung der entsprechenden quadratischen Gleichung. Wie sicher bekannt ist, gibt es nicht immer eine Lösung. Das obige Polynom sechsten Grades hat, wie man dem Graphen entnimmt, o¤enbar 4 Nullstellen. Ganz sicher kann man sich nicht sein, denn wir haben den Graphen nur für x-Werte zwischen 6 und 6 eingezeichnet, sodass nicht ganz klar ist, ob es nicht noch Nullstellen ausserhalb dieses Intervalles gibt. Die Diskussion der Nullstellen eines Polynoms vom Grad grösser als 2 ist schon ziemlich kompliziert. Zwei Polynome kann man miteinander multiplizieren. Da das aus dem Gymnasium sicher bekannt ist, soll hier nur ein Beispiel gerechnet werden: Wir multiplizieren die Polynom p (x) = 2 + 3x x5 und q (x) = 1 x2 + x3 : 2 + 3x x4 1 x2 + x3 2x2 + 2x3 + 3x = 2 x4 + x6 = 2 + 3x 3x3 + 3x4 x7 2x2 x3 + 2x4 + x6 x7 : Der Grad die Produktes ist immer die Summe der Grade der beiden einzelnen Polynome. Aus dem Gymnasium sollte die Polynomdivision mit Rest bekannt sein: Ein Polynom kann durch ein Polynom gleichen oder kleineren Grades dividiert werden, wobei als Rest ein Polynom kleineren Grades als der Nenner übrigbleibt. Als Repetition rechnen wir ein Beispiel durch. Wir dividieren das Polynom x5 2x3 + x2 x 5 durch das Polynom x2 + 2: Das Vorgehen ist folgendes: Man teilt die höchste Potenz des Zählers durch die höchste Potenz des Nenners, also x5 durch x2 : Das ergibt x3 : Dann multipliziert man den Nenner x2 + 2 mit x3 : x3 x2 + 2 = x5 + 2x3 und subtrahiert dieses vom Zähler: 12 Das ergibt 4x3 + x2 x 5: Dann fährt man in dieser Weise mit der Division weiter, bis nur noch ein Polynom übrigbleibt, das Grad < 2 hat. Hier ist das Schema: x5 2x3 + x2 x 4x3 + x2 x x2 + 7x 7x Die Division ergibt also x3 x5 2x3 + x2 5 5 5 7 x2 + 2 : x3 4x + 1 Rest 7x 4x + 1 mit Rest 7x x = 5 = x2 + 2 7 7: Das entsprich der Gleichung x3 4x + 1 + 7x 7: Die Sache ist völlig analog zur Division natürlicher Zahlen mit Rest: 36 dividiert durch 7 ergibt 5 Rest 1; d.h. 36 = 7 5 + 1: Wir formulieren den Sachverhalt für Polynome in einem Satz: Satz 1.8 Seien p (x) und q (x) zwei Polynome 6= 05 mit grad (q (x)) grad (p (x)) : Dann existieren eindeutig zwei Polynome h (x) ; r (x) ; grad (r (x)) < grad (q (x)) ; sodass p (x) = h (x) q (x) + r (x) gilt. Für den Fall, dass r (x) das Nullpolynom ist, d.h. dass p (x) = h (x) q (x) gilt, sagt man, dass q (x) das Polynom p (x) teilt. Wir untersuchen nun noch die Frage, wann ein lineares Polynom x ein anderes Polynom teilt. Zumindest für quadratische Polynome sollte das aus dem Gymnasium bekannt sein. Dass x ein Polynom ax2 + bx + c teilt, bedeutet ja einfach, dass man x ausklammern kann. Das ist gleichbedeutend damit, dass die Zahl eine Nullstelle des quadratischen Polynoms ist. Ein Beispiel: x2 3x+2 hat die beiden Nullstellen 1 und 2; was auch daraus ersichtlich ist, dass x2 3x + 2 = (x 2) (x 1) ist. Wir diskutieren das nun ganz allgemein. Satz 1.9 p (x) sei ein Polynom vom Grad 1: Eine Zahl p (x) wenn x das Polynom p (x) teilt. 2 R ist genau dann eine Nullstelle von Beweis. Es gibt zwei Richtungen zu zeigen: (I) Wenn x das Polynom teilt, so ist eine Nullstelle von p (x) : (II) Wenn eine Nullstelle ist, so teilt x das Polynom. Beweis von (I): Dass x das Polynom p (x) teilt bedeutet, dass ein Polynom h (x) existiert mit p (x) = (x ) h (x) : Setzen wir für x ein, so ergibt sich p( ) = ( ) h ( ) = 0 h ( ) = 0: 5 Das bedeutet nicht, dass die Polynome keine Nullstellen haben, sondern, dass sie nicht identisch gleich Null sind. 13 Somit ist eine Nullstelle von p ( ) : Beweis von (II): Wir dividieren p (x) durch x p (x) = (x mit Rest: ) q (x) + r (x) ; wobei r (x) ein Polynom von kleinerem Grad als x ist. Da letzteres Grad 1 hat, so ist r (x) einfach ein konstantes Polynom: r (x) = a; also p (x) = (x Setzen wir nun wieder ) q (x) + a: für x ein, so erhalten wir 0 = p( ) = ( ) q ( ) + a; die erste Gleichung, da wir voraussetzen, dass sich a = 0; d.h. wir haben gezeicht, dass eine Nullstelle von p (x) ist. Somit ergibt p (x) = (x ist, d.h. dass x ) q (x) das Polynom p (x) teilt. Beispiel 1.10 Das Polynom p (x) = x7 + 3x5 x4 x3 + 5x 7 hat die Nullstelle 1; wie man sofort durch Einsetzen nachprüft. Tatsächlich ist x7 + 3x5 x4 x3 + 5x 7 = (x 1) x6 + x5 + 4x4 + 3x3 + 2x2 + 2x + 7 : Der Satz hat eine Reihe von Folgerungen. Hier ist eine: Hat das Polynom p (x) den Grad n 1; so kann man o¤ensichtlich höchstens n Mal einen Faktor der Form (x ) ausklammern. Wir erhalten also Satz 1.11 Ein Polynom vom Grad n 1 hat höchstens n verschiedene Nullstellen. Die Funktion sin (x) z.B. hat unendlich viele Nullstellen. Wir sehen also, dass diese Funktion kein Polynom ist. Beispiel 1.12 Wir betrachten das Polynom p (x) = x6 2x4 + 15x3 Durch Einsetzen sieht man, dass 1 und (x 1) und (x + 3) ausklammern: x6 2x4 + 15x3 13x2 + 11x 13x2 + 11x 12: 3 Nullstellen sind. Wir können also die Faktoren 12 = (x 1) (x + 3) x4 2x3 + 5x2 x+4 : Das Polynom x4 2x3 + 5x2 x + 4 hat keine Nullstellen mehr. Diese Behauptung ist nicht ganz einfach mathematisch zu begründen; man „sieht“ es jedoch, wenn man den Graphen betrachtet: 14 y 60 50 40 30 20 10 -4 -3 -2 -1 0 Polynom x4 1 2x3 + 5x2 2 3 4 x x+4 Das ursprüngliche Polynom hat also keine weiteren Nullstellen. Hier sein Graph x6 2x4 + 15x3 13x2 + 11x 12 y 200 100 -4 -3 -2 -1 1 2 3 4 x -100 -200 Polynom x6 2 2.1 2x4 + 15x3 13x2 + 11x 12 Die komplexen Zahlen Motivation In der Geschichte der Mathematik hat sich immer wieder die Notwendigkeit ergeben, den Bereich der Zahlen zu erweiteren. 15 Man kann davon ausgehen, dass die Menschheit seit jeher mit den Zahlen 1; 2; 3; : : : und den elementaren Operationen wie die Addition und die Multiplikation umgehen konnten. Ein wichtiger Schritt war die Einführung der Zahl 0 und der negativen Zahlen. Damit konnte man etwa Schulden als negative Guthaben deklarieren und mit ihnen auf die übliche Weise rechnen. Etwas abstrakter formuliert: Dank der Einführung der negativen Zahlen konnte man Gleichung wie z.B. x+5=3 eindeutig lösen. Die Zahlen 0; 1; 1; 2; 2; : : : bezeichnet man als ganze Zahlen. Die Menge aller ganzen Zahlen wird meist mit Z bezeichnet. Jede natürliche Zahl ist auch eine ganze Zahl, aber nicht umgekehrt. Der nächste Schritt war die Einführung von Brüchen, also der rationalen Zahlen, die sich als p=q mit p; q 2 Z schreiben lassen, q 6= 0: Durch die Erweiterung der Zahlen zu den Brüchen konnte man stets nicht nur addieren, multiplizieren, sondern auch dividieren, sofern der Nenner nicht gleich 0 ist. Schon den Griechen war bekannt, dass es Zahlen gibt, die sich nicht als Brüche von ganzen Zahlen darstellen lassen. Das einfachte Beispiel ist die Länge der Diagonalen im Quadrat mit Seitenlänge 1: Nach dem Satz von Pythagoras erfüllt die Länge x der p p Diagonalen die Gleichung x2 = 12 + 12 = 2; also x = 2: 2 lässt p sich nicht als Bruch von ganzen Zahlen darstellen, was Euklid bewiesen hat: Wäre 2 rational, also von der Form p p 2= q mit ganzen Zahlen p; q; so könnte man annehmen, dass p; q teilerfremd sind, da sich der Bruch sonst kürzen liesse. Aus der obigen Darstellung folgt jedoch 2= p p : q q Wenn p; q keinen gemeinsamen Teiler haben, so haben auch p p und q q keinen gemeinsamen Teiler. Das widerspräche jedoch der obigen Darstellung, denn sie besagt, dass p sich p p durch q q teilen lässt. Somit ist nachgewiesen, dass es eine Darstellung von 2 der obigen Form nicht geben kann. Diese und viele andere Beispiele haben dazu geführt, dass man den Zahlbegri¤ erweitert hat und neben der rationalen Zahlen die sogenannten „irrationalen“ Zahlen betrachtet.6 Die irrationalen Zahlen lassen sich durch unendliche Dezimalbrüche darstellen, jedoch nicht als Brüche ganzer Zahlen. Die rationalen Zahlen lassen sich ebenfalls als unendliche Dezimalbrüche schreiben, z.B. 1=3 = 0:33333::: . Die rationalen Zahlen sind genau diejenigen unendlichen Dezimalbrüche, deren Darstellung periodisch wird. Z.B. ist 0:2573919191919191:::: eine rationale Zahl, was aus dem Gymnasium bekannt sein sollte. 6 Die Bezeichnung „irrational“ ist etwas unglücklich, hat sich jedoch fest etabliert. 16 Die komplexen Zahlen sind eingeführt worden, um gewisse Gleichungen, wie die Gleichung x2 +1 = 0 lösen zu können. Insofern besteht kein grosser Unterschied zum Problem der Länge der Diagonalen in einem Quadrat mit Seitenlänge 1. Während aber eigentlich niemand die Existenz der Länge der Diagonalen im Einheitsquadrat in Frage stellen kann, ist es nicht klar, wieso man die Gleichung x2 + 1 = 0 lösen will und man sich nicht mit der simplen Antwort begnügt, dass es keine Lösung gibt. Es gibt jedoch eine Reihe von sehr guten Gründen, derentwegen man diese Gleichung lösen möchte, auf die wir im Moment nicht eingehen können. Ein historisch wichtiges Motiv für die Einführung der komplexen Zahlen war die Cardanische Formel für die Lösung der Gleichung dritten Grades x3 + ax2 + bx + c = 0; die im 16. Jh. gefunden wurde. Die Gleichung dritten Grades hat immer eine reelle Lösung, wie wir später sehen werden, oft aber auch drei (in Spezialfällen auch zwei). Die Cardanische Formel für die Lösungen, auf die wir nicht in Details eingehen wollen, hat jedoch die Besonderheit, dass gerade im Fall, wo alle Lösungen reell sind, diese nur über den Umweg über die komplexen Zahlen gewonnen werden können. 2.2 De…nition der komplexen Zahlen und Addition Der Trick ist ganz einfach. Da man die Gleichung x2 +p 1 = 0 lösen will, so fügt man zu den reellen Zahlen noch eine Zahl hinzu, die man als 1 bezeichnet. Dafür hat sich p 1 eingebürgert. (Bei Physikern manchmal j). Natürlich will man die Abkürzung i := z.B. auch x2 +p4 =p0 lösen. Nach den üblichen Rechenregeln sollte die p p die Gleichung Lösung 4 = 4 ( 1) = 4 1 = 2i sein. Wir benötigen also auch Zahlen der Form ai oder ia mit a 2 R: Es hat sich eingebürgert, dass man Zahlen dieser Form als „imaginär“ bezeichnet. i bezeichnet man als die imaginäre Einheit. Nun wollen wir auch addieren können: Ein Zahlbegri¤, in dem man nicht addieren kann, ist zu nichts zu gebrauchen. Addition von imaginären Zahlen ist kein Problem: ai + a0 i := (a + a0 ) i: Nächster Schritt: Man will auch imaginäre Zahlen zu den üblichen reellen Zahlen addieren können. Wir müssen also Zahlen der Form a + ib; a; b 2 R einführen. Diese Zahlen nennt man „komplex“. Ist b = 0; so ist die Zahl reell und im Fall a = 0; b 6= 0 ist die Zahl (rein) imaginär. De…nition 2.1 Die Menge C der komplexen Zahlen ist de…niert durch C := fa + ib : a; b 2 Rg : a heisst der Realteil der komplexen Zahl z = a + bi; bi der Imaginärteil. Man schreibt a = Re (z) ; b = Im (z) : Zwei komplexe Zahlen a + ib; a0 + ib0 werden auf die folgende Weise addiert: (a + ib) + a0 + ib0 := a + a0 + i b + b0 : 17 Die komplexe Zahl Null ist die Zahl mit Real- und Imaginärteil = 0: Wir schreiben dafür auch einfach 0: Also 0 (als komplexe Zahl) = 0 + i0: Diese Zahl wird o¤ensichtlich durch die Eigenschaft charakterisiert, dass 0 + z = z für jede komplexe Zahl z ist. Geometrische Veranschaulichung der Addition: Die komplexen Zahlen kann man als Punkte in der Ebene darstellen. z = x + iy entspricht einfach dem Punkt der Ebene mit den entsprechenden Koordinaten (x; y) : Wenn man will kann man z auch als Vektor von (0; 0) nach (x; y) interpretieren. Die Addition entspricht dann der Addition von Vektoren, entsprechend der Addition von Kräftevektoren in der Physik. Beispiel 2.2 Wir addieren z1 = 2 + 4i und z2 = 3 + i : z1 + z2 = 5 + 5i: Unten ist das graphisch als Vektoraddition dargestellt. y 7 6 5 4 3 2 1 0 0 2.3 1 2 3 4 5 6 7 x Multiplikation komplexer Zahlen Komplexe Zahlen kann man auch multiplizieren. Dies macht keine Schwierigkeiten. Man wendet einfach die üblichen Rechenregeln an und erinnert sich, dass i die Gleichung i2 = 1 erfüllt. Also (a + ib) a0 + ib0 = aa0 + iab0 + ia0 b + i2 bb0 = aa0 + i2 bb0 + i ab0 + a0 b = aa0 bb0 + i ab0 + a0 b : Das ist die einfache Regel, wie man komplexe Zahlen miteinander multipliziert. Zwei Spezialfälle: 18 Multiplikation einer komplexen Zahl mit einer reellen: a a0 + ib0 = aa0 + iab0 : Insbesondere ist 1 a0 + ib0 = a0 + ib0 ; d.h. die reelle Zahl 1 ist das sogenannte Neutralelement der Multiplikation. Multiplikation mit imaginären Zahlen ib a0 + ib0 = bb0 + iba0 : Addition und Multiplikation erfüllen die üblichen Rechenregeln: Unten sind z; z 0 ; z 00 komplexe Zahlen Kommutativität: z + z 0 = z 0 + z; z z 0 = z 0 z: Assoziativität: z + z 0 + z 00 = z + z 0 + z 00 ; z z 0 z 00 = z z0 z z 0 + z 00 = z z 0 + z z 00 : z 00 : Distributivgesetz: Das erste wirkliche Wunder ist, dass man durch komplexe Zahlen 6= 0 auch dividieren kann. Die Formel ist nicht kompliziert; wir verschieben das jedoch noch einen Moment bis nach der geometrischen Beschreibung der obigen Konstruktion. 2.4 Graphische Darstellung, Polarkoordinaten Wie oben stellen wir komplexe Zahlen z = x + iy als Punkte (x; y) in der Ebene dar, bzw. als Vektoren mit Ursprung in (0; 0) : Für die geometrische Interpretation der Multiplikation führen wir Polarkoordinaten ein. p Die Länge dieses Vektors von (0; 0) nach (x; y) ist nach Pythagoras r = x2 + y 2 : Diese Länge bezeichnet man als den Absolutbetrag von z = x + iy : p jzj = jx + iyj := x2 + y 2 : Wie man sieht, hat nur die komplexe Zahl 0 = 0 + 0i die Länge 0: Ein Punkt (x; y) in der Ebene wird eindeutig festgelegt durch Angabe der Länge r des Vektors von (0; 0) nach (x; y) sowie durch Angabe des Drehwinkels 2 [0; 2 ) von der positiven x-Achse, bei uns die „reelle Achse“, zu diesem Vektor, gemessen im 19 Gegenuhrzeigersinn. Man bezeichnet das Paar (r; ) als die Polarkoordinaten von z: x; y ergeben sich aus den Polarkoordinaten durch x = r cos ; y = r sin : Umgekehrt legen die kartesischen Koordinaten (x; y) die Polarkoordinaten eindeutig fest, mit Ausnahme von (x; y) = (0; 0) : Für diesen Vektor ist r = 0; aber ist nicht festgelegt. Für jeden anderen ergibt sich durch Lösen der Gleichung tan = y=x; d.h. = arctan (y=x) : Bei der Festlegung von arctan (y=x) muss man auf die Vorzeichen von x und y achten, denn der Arkustangens ist keine eindeutig de…nierte Funktion, da der Tangens -periodisch ist. Ferner ist arctan (y=x) für x = 0 nicht de…niert. Die üblichen Implementierungen in Taschenrechnern geben den Arkustangens mit einem Wert ( =2; =2) aus. Hier die Regeln zur Bestimmung von mit dem Taschenrechner: x = 0; y > 0 =) = =2 x = 0; y < 0 =) = 3 =2 x > 0; y 0 =) Arkustangens“) x < 0 =) = TRarctan (y=x) (TRarctan steht für „Taschenrechner- = TRarctan (y=x) + x > 0; y < 0 =) = TRarctan (y=x) + 2 Hier ein Beispiel für die komplexe Zahl z = 2+3i: Die Länge ist 0:982793::: : φ 20 p 13: = arctan (3=2) = Wenn wir (cos + i sin ) durch e ( ) abkürzen, so erhalten wir die beiden Darstellungen einer komplexen Zahl z durch z = x + iy = re ( ) : nennt man auch das Argument von z und schreibt oft = arg (z) : Wir werden später eine andere Darstellung von e ( ) herleiten, nämlich e ( ) = ei ; d.h. die berühmte Eulersche Formel ei = cos + i sin ; was wir jedoch noch nicht richtig verstehen können. Im Moment ist e ( ) einfach eine Abkürzung für cos + i sin : Die erstere Darstellung oben, nennen wir die kartesische Darstellung von z und die zweite die Darstellung in Polarkoordinaten. Beispiel 2.3 p 1+i = 1 p i = 2e ( =4) ; 2e (7 =4) : Ein Spezialfall verdient es hervorgehoben zu werden: e( ) = 1: (2.1) Eine explizite Angabe des Drehwinkels p ist natürlich nicht immer möglich. So erhalt man für z = 3 + 7i den Absolutbetrag 58 und den Drehwinkel 7 3 ' = arctan : Eine naive Anwendung des Taschenrechners ergibt = 1:1659:::; was jedoch der Wert zwischen =2 und 0 des arctan ist. Da die komplexe Zahl im zweiten Quadranten ist, ist dieser Wert plus der richtige Wert: = 1:9757:::: Die Addition zweier komplexer Zahlen erfolgt am besten via die kartesische Darstellung, wie wir oben gesehen haben. Die Multiplikation ist einfacher in Polarkoordinaten durchzuführen: Sind z = re ( ) = r (cos + i sin ) ; z 0 = r0 e 0 zwei Zahlen in Polarkoordinaten, so erhalten wir nach den obigen Multiplikationsregeln. zz 0 = rr0 cos cos 0 0 sin sin + i sin cos 0 + sin 0 cos : Nun muss man sich an die Additionstheoreme für die trigonometrischen Funktionen aus dem Gymi erinnern: cos cos 0 sin cos 0 sin sin + sin 0 cos 0 = cos = sin Somit erhalten wir zz 0 = rr0 e Mit anderen Worten: 21 + 0 : + 0 ; + 0 : (2.2) Satz 2.4 Bei der Multiplikation zweier komplexen Zahlen werden die Absolutbeträge multipliziert und die Winkel (d.h. die Argumente) addiert. Mit Winkeln rechnet man modulo 2 : Wenn wir zwei Winkel addieren, deren Summe grösser als 2 ist, so beginnen wir nach 2 einfach wieder von vorne zu zählen. Man nennt dies „Addition modulo 2 “. Also + 3 =2 = =2 modulo 2 : Wir lassen den Zusatz „modulo 2 “ in der Regel weg und merken uns, dass wir mit Winkeln so rechnen. Genauso machen wir es mit der Subtraktion: Wir achten in der Regel darauf, dass wir immer im Intervall [0; 2 ) landen. Also etwa =2 = 3 =2: Für das Rechnen mit guten Taschenrechnern spielt es jedoch keine Rolle. 2.5 Konjugation komplexer Zahlen, Division Mit Hilfe der Darstellung komplexer Zahlen in Polarkoordinaten sehen wir, dass wir durch komplexe Zahlen 6= 0 dividieren können: Seien z; z 0 zwei komplexe Zahlen, z 0 6= 0; in Polarkoordinaten z = re ( ) ; z 0 = r0 e 0 mit r0 6= 0; so ergibt sich re ( ) r 0 = r0 e 0 re 0 : Diese Zahl hat o¤ensichtlich die Eigenschaft, dass wenn sie mit r0 e 0 multipliziert wird sich die Zahl re ( ) ergibt. Genau diese Eigenschaft zeichnet die Division aus: 7=4 ist diejenige Zahl, die mit 4 multipliziert 7 ergibt. Für die Berechnung der Division in kartesischen Koordinaten ist es zweckmässig, die Konjugation einer komplexen Zahl einzuführen. De…nition 2.5 Ist z = x + iy eine komplexe Zahl, so nennt man die komplexe Zahl x konjugierte, und bezeichnet sie (üblicherweise) mit z: iy die zu z Die Konjugation erfolgt geometrisch durch eine Spiegelung an der reellen Achse. In Polarkoordinaten erhält man re ( ) = re ( ) : Wird z mit z multipliziert, z = re ( ) ; so ergibt sich zz = re ( ) re ( ) = r2 e ( ) = r2 = jzj2 : zz ist also das Quadrat des Absolutbetrages von z: Wir können die Rechnung auch in kartesischen Koordinaten nachprüfen: (x + iy) (x iy) = x2 ixy + yix = x2 + y 2 = jzj2 : 22 y 2 i2 Wenn wir nun z = x + iy durch z 0 = x0 + iy 0 dividieren, so erweitern wir den Bruch mit z 0 : x + iy x0 + iy 0 = = (x + iy) (x0 iy 0 ) (xx0 + yy 0 ) + i (x0 y = (x0 + iy 0 ) (x0 iy 0 ) x02 + y 02 0 0 0 0 xx + yy x y xy + i 02 : 02 02 x +y x + y 02 xy 0 ) Wie man sieht, ist die Berechnung der Division in kartesischen Koordinaten etwas komplizierter als in Polarkoordinaten. Allerdings wird man für die Division üblicherweise nicht erst von kartesischen in Polarkoordinaten umrechnen, denn die Berechnung des Winkels und des Absolutbetrages r = jzj ist meist nur numerisch möglich. Beispiel 2.6 2 + 3i 1 i (2 + 3i) (1 + i) (2 + 3i) (1 + i) = (1 i) (1 + i) 2 1 5 = + i: 2 2 p 1 i hat eine „schöne“ Darstellung in Polarkoordinaten 2e (7 =4) ; der Zähler 2 + 3i jedoch nicht. Es würde deshalb keinen Sinn ergeben, für die Division erst in Polarkoordinaten zu transformieren. = Die Konjugation gehorcht einigen einfachen, aber nützlichen Regeln: Sind z; z 0 zwei komplexe Zahlen, so gilt z + z0 = z + z0; (2.3) z z0 = z z0: (2.4) Wir beweisen das kurz: z = x + iy; z 0 = x0 + iy 0 : z + z 0 = x + x0 + i (y + y 0 ) = x + x0 = x iy + x0 i y + y0 iy 0 = z + z 0 : Für die Multiplikation verwenden wir besser die Darstellung in Polarkoordinaten: z = re ( ) ; z 0 = r0 e 0 z z 0 = rr0 e + = (re ( )) 0 = rr0 e r0 e 0 0 = z z0: Eine weitere nützliche Eigenschaft: Für z = x + iy gilt o¤enbar z = z genau dann, wenn y = 0 ist, d.h. wenn z eine reelle Zahl ist. 23 2.6 Potenzen und Wurzeln In Polarkoordinaten kann man sehr einfach potenzieren und Wurzeln ziehen. Wir betrachten zunächst die n-te Potenz einer Zahl z = re ( ) : Hier erhalten wir z n = rn e (n ) ; (2.5) wobei wir wie üblich n modulo 2 rechnen, wenn notwendig: Beispiel 2.7 (1 + i)12 : Wir drücken 1 + i in Polarkoordinaten aus: 1+i= Also ergibt sich (1 + i)12 = p 2 12 p 2e ( =4) : e (12 =4) = 64e ( ) = 64: Die obige Formel (2.5) gilt auf für negative n: So ist etwa (1 + i) 8 = = p 2 8 e ( 8 =4) 1 1 e (0) = : 4 2 16 Nun zur n-ten Wurzel. Diese ist nicht eindeutig de…niert. Zu einer komplexen Zahl z suchen wir alle Lösungen der Gleichung n = z: Die Gleichung in Polarkoordinaten z = re ( ) ; = e ( ) ergibt n e (n ) = re ( ) : Wir schliessen den trivialen Fall z = 0 aus, wo es nur die Lösung = 0 gibt. Ist z 6= 0; so ist r > 0; und ist eindeutig bestimmt als die positive reelle n-te Wurzel von r : p = n r: Für müssen wir die Gleichung n = lösen. Wir rechnen Winkel modulo 2 . Daher gibt es für diese Gleichung n verschiedene Lösungen . Zunächst = =n: Jedoch ist auch = =n + 2 =n eine Lösung, denn n ( =n + 2 =n) = modulo 2 : Die Liste der Lösungen für ist: +2 +4 + 2 (n 1) ; ; ;:::; : n n n n Das nächste in der Liste gibt nichts Neues: folgenden Sachverhalt nachgewiesen: +2n n = n Satz 2.8 Für eine komplexe Zahl z 6= 0 hat die Gleichung (in x) n = z = re ( ) 24 modulo 2 : Wir haben also den die n verschiedenen Lösungen: Im Fall r = 1; 1 = p n re 3 = p n re ; n +4 n 2 = p n re ;:::; n = 0; d.h. z = 1; nennt man +2 n p = n re 1; : : : ; n ; + 2 (n n 1) : die n-ten Einheitswurzeln. Beispiel 2.9 Wir lösen die Gleichung 4 = 2 (1 + i) : 2 (1 + i) in Polarkoordinaten ist 2 (1 + i) = p p p 8e ( =4) : Die vierte Wurzel aus 8 ist 8 8 = 1:2968::: .Somit erhalten wir die Lösungen p p p 8 8 8 8e ( =16) = 8 cos ( =16) + 8i sin ( =16) ; 1 = p 8 8e ( =16 + =2) ; 2 = p 8 8e ( =16 + ) ; 3 = p 8 8:e ( =16 + 3 =2) ; 4 = In der Graphik unten sind 2 (1 + i) (blau) und die 4 vierten Wurzeln daraus (rot) ein der Gaussschen Zahlenebene eingezeichnet. y 2.5 2.0 1.5 1.0 0.5 -2.5 -2.0 -1.5 -1.0 -0.5 0.5 1.0 1.5 -0.5 -1.0 -1.5 -2.0 -2.5 2 + 2i und die 4 vierten Wurzeln daraus 25 2.0 2.5 x Beispiel 2.10 Die 6-ten Einheitswurzeln sind 1; e p 1 3 = +i ; e 2 2 3 4 3 e Bemerkung 2.11 Statt e ( ) = cos + i sin 1 2 = p 1 2 3 = +i ;e( ) = 3 2 2 p p 3 1 3 5 = i ; e i : 2 3 2 2 1; schreibt man üblicherweise ei : Die Formel ei = cos + i sin heisst Eulersche Formel. Wir werden die Formel später begründen. Es soll hier nur bemerkt werden, dass mit dieser Formel die Additionsformeln für die trigonometrischen Funktionen (2.2) sich in der handlichen Form ei ei 0 = ei( + 0) präsentieren. Aus dieser Formel, die man sich leicht merken kann, und der Eulerschen Formel, lassen sich die Additionsformeln herleiten: Wegen der Eulerschen Formel und cos ( ) = cos ; sin ( ) = sin ergibt sich e i = cos ( ) + i sin ( und damit cos sin ) = cos 1 i e +e 2 1 i = e e 2i = i ; i : i sin Damit erhält man sin + 0 = = = 0 1 i( + 0 ) e e i( + ) 2i 0 1 i i 0 e e e i e i 2i 1 [(cos + i sin ) cos 2i (cos i sin ) cos = sin cos 0 26 + cos sin 0 0 0 : 0 + i sin i sin 0 ] 2.7 Hauptsatz der Algebra: Jedes Polynom hat mindestens eine Nullstelle Wie im vorangegangen Kapitel diskutiert wurde, sind Polynome Funktionen R ! R der Form p (x) = an xn + an 1 xn 1 + + a1 x + a0 : Wichtig sind die Nullstellen von Polynomen, also die Lösungen der Gleichung p (x) = 0: Wir hatten Polynome als (spezielle) Abbildungen R ! R de…niert. Es spricht nichts dagegen, in die Polynomvariable komplexe Werte einzusetzen. Da wir komplexe Zahlen meist mit z bezeichnen, betrachten wir also ein Polynom p (z) = an z n + an 1z n 1 + + a1 z + a0 ; und fassen es als Abbildung C ! C auf. Wir können auch zulassen, dass ai 2 C ist. Ein Polynom p (z) vom Grad mindestens 1 hat genau dann die Nullstelle z0 , wenn man z z0 aus p (z) ausklammern kann, d.h. wenn ein Polynom q (z) mit einem um Eins kleineren Grad existiert, sodass p (z) = (z z0 ) q (z) gilt. Diese Aussage ergibt sich auf die gleiche Weise wie bei den reellen Polynomen in Satz 1.9. Hier nun der sogenannte Hauptsatz der Algebra: Satz 2.12 Jedes komplexe Polynom p (z) vom Grad 1 hat mindestens eine Nullstelle. Ist also p (z) ein Polynom mit grad (p (x)) 1; so existiert mindestens eine komplexe Zahl , sodass sich z ausklammern lässt: p (z) = (z ) q (z) : ist dann eine Nullstelle des Polynoms. Dieselbe Überlegung lässt sich nun auf q (z) anwenden, sofern sein Grad 1 ist. Wir können so lange Linearfaktoren, d.h. Polynome der Form (z ) mit 2 C ausklammern, bis wir bei einem konstanten Polynom angelangt sind7 . Unter Umständen lässt sich derselbe Linearfaktor mehrfach ausklammern. Man spricht dann von einer mehrfachen Nullstelle. Das konstante Polynom, das man schlussendlich erhält, muss gleich an sein. Satz 2.13 Jedes Polynom in C lässt sich in sogenannte Linearfaktoren zerlegen: Sind z1 ; : : : ; zk 2 C die Nullstellen, so gilt lässt es sich wie folgt darstellen: p (z) = an (z z1 )m1 (z z2 )m2 (z z1 )m1 : Die mi sind die sogenannten Vielfachheiten der Nullstellen, deren Summe gleich n ist. 7 „Können“ ist hier in einem abstrakt mathematischen Sinn zu verstehen. Wir haben noch nicht diskutiert, wie wir die Nullstelle konkret …nden können. 27 Ganz konkret können wir das nur in Spezialfällen durchführen. Hier als Repetition die quadratischen Polynome: p (z) = az 2 + bz + c; a 6= 0: Wir setzen nicht voraus, dass a; b; c reell sind. Man löst die Gleichung p (z) = 0 durch quadratische Ergänzung, was schon den Babyloniern vor 4000 Jahren bekannt war: b b2 p (z) = a z 2 + z + 2 a 4a = a z+ +c 2 b 2a b2 4a b2 : 4a +c Die Nullstellen von p (z) = 0 sind also die Lösungen der Gleichung z+ b 2a 2 = b2 4ac 4a2 : (2.6) Nun benötigt man eine Fallunterscheidung: Ist die rechte Seite = 0; so ist b 2a z1 = die einzige Lösung und das Polynom hat die Darstellung p (z) = a z + Ist hingegen b2 4ac 4a2 2 b 2a : 6= 0; so hat die Gleichung 2 = b2 4ac 4a2 (2.7) zwei Lösungen 1 ; 2 , wie wir in Abschnitt 2.6 diskutiert haben. In der Gaussschen Zahlenebene erhält man 2 aus 1 durch eine Drehung um 180 ; d.h. 2 = 1 : Die ursprüngliche quadratische Gleichung (2.6) hat die beiden Lösungen z1 = 1 b ; z2 = 2a b : 2a 2 Im reellen Fall, also wenn a; b; c 2 R gilt, vereinfacht sich das Wurzelziehen in (2.7) etwas. Ist b2 > 4ac; so ist der Ausdruck auf der rechten Seite positiv und es existiert daher eine postive Quadratwurzel. Dann ist r p p b2 4ac b2 4ac b2 4ac = = ; = 1 2 4a2 2a 2a und die beiden Lösungen der Gleichung sind p b2 4ac b z1 = + ; z2 = 2a 2a 28 b 2a p b2 4ac 2a Dieser Fall ist sicher aus dem Gymnasium bekannt. Ist b2 < 4ac; so sind die beiden Lösungen 1 ; 2 imaginär: p p 4ac b2 4ac b2 = i ; = i 1 2 2a 2a und die beiden Lösungen der quadratischen Gleichung sind in diesem Fall p p 4ac b2 4ac b2 b b z1 = +i ; z2 = i : 2a 2a 2a 2a Für die Polynome höheren Grades ist das Bestimmen der Nullstellen, bzw. die Faktorisierung des Polynoms in Linearfaktoren, sehr viel komplizierter. Für die Polynome 3. und 4. Grades gibt es noch explizite Darstellungen der Nullstellen durch Wurzelausdrücke. Für die Gleichung 3. Grades sind dies die berühmten Cardanischen Formeln, auf die wir hier nicht im Detail eingehen wollen.8 Für die Polynome vom Grad 5 können die Nullstellen im Allgemeinen nicht mehr durch Wurzelausdrücke dargestellt werden. Ein reelles Polynom, also ein Polynom mit allen ai 2 R hat die Eigenschaft, dass die Nullstellen immer in konjugierten Paaren auftreten: Ist z0 eine komplexe Nullstelle des Polynoms, so auch z0 : Dies sieht man wie folgt: Da 0 = 0 ist folgt n 1 1 z0 0 = 0 = an z0n + an + n 1 + 1 z0 n 1 an 1 z0 + = an z0n + an n = an z0 + + a1 z0 + a0 + a1 z0 + a0 + a1 z0 + a0 : Im ersten Schritt haben wir (2.3) verwendet, im zweiten (2.4) und die Tatsache, dass a = a für reelle Zahlen ist. Wir sehen also, dass z0 ebenfalls eine Nullstelle ist. Beispiel 2.14 p (z) = z 4 + z 3 z 1: Man sieht sofort, dass das Polynom die Nullstellen 1 und Daher können wir (z + 1) und (z 1) ausklammern und erhalten p (z) = (z + 1) (z 1 hat. 1) z 2 + z + 1 : Das quadratische Polynom hat keine reellen Nullstellen mehr, jedoch die beiden komplexen: p 1 3 z3;4 = i : 2 2 8 Durch eine einfache Substitution lässt sich die Gleichung dritten Grades in die reduzierte Form z 3 + pz + qz = 0 überführen. Die Cardanische Formel für die Lösungen ist s s r 3 3 q q 2 p 3 q 2 z= + + + 2 2 3 2 r 2 q 2 2 + p 3 3 : Da die Quadratwurzel zwei und die dritte Wurzel drei Lösungen hat, erhält man jedoch zuviele Lösungen, sodass man noch Regeln benötigt, wie die Wurzeln kombiniert werden. Darauf wollen wir nicht eingehen. Die Formeln wurden erstmals von Hieronimo Cardano (1501-1576) publiziert. Cardano hatte sie jedoch nicht selbst gefunden, sondern sie Nicola Tartaglia (1501-1557) abgekupfert. 29 Beispiel 2.15 Wir gehen zurück auf Beispiel 2.10: Die sechsten Einheitswurzeln sind die sechs Lösungen der Gleichung z 6 1 = 0: Daher ergibt sich p ! p ! 1 1 3 3 z+ z 6 1 = (z 1) z i i 2 2 2 2 p ! p ! 1 3 1 3 (z + 1) z + + i z +i 2 2 2 2 3 In…mum, Supremum, Minimum, Maximum Wir diskutieren einige wichtige Eigenschaften von Teilmengen der Menge R der reellen Zahlen. De…nition 3.1 Eine nichtleere Teilmenge A R heisst nach oben beschränkt, wenn es eine Zahl c 2 R gibt mit a c für alle a 2 A: c heisst in diesem Falle eine obere Schranke von A: Entsprechend heisst die Menge nach unten beschränkt, wenn es eine Zahl d 2 R gibt mit d a für alle a 2 A: d heisst in diesem Fall eine untere Schranke von A: Die Menge A heisst beschränkt, wenn sie nach oben und nach unten beschränkt ist. Eine obere Schranke ist nicht eindeutig de…niert: Gibt es eine obere Schranke c für A; so gibt es auch viele weitere. So ist auch c + 1 eine obere Schranke für A; sofern c eine ist. Eine entsprechende Bemerkung gilt auch für untere Schranken. Endliche Intervalle in R sind o¤enbar beschränkte Mengen. Eine der wichtigsten Eigenschaften von R wird im folgenden Satz beschrieben. Satz 3.2 Sei A eine nach oben beschränkte nichtleere Teilmenge von R: Dann besitzt A eine kleinste obere Schranke, die man als Supremum von A, oder kurz sup A bezeichnet, sup A 2 R: Diese Zahl hat die folgenden zwei Eigenschaften 1. sup A ist eine obere Schranke von A: 2. Ist c eine obere Schranke von A; so gilt sup A c Entsprechend existiert für nach unten beschränkte Mengen eine grösste untere Schranke, die man als In…mum von A; kurz inf A bezeichnet. Es ist sehr einfach zu sehen, dass ein Supremum, sofern es existiert, eindeutig durch A bestimmt ist: Sind nämlich s1 ; s2 zwei Suprema, so gilt wegen der Eigenschaft 2 sowohl s1 s2 wie auch s2 s1 : Somit muss s1 = s2 gelten. Sehr viel schwieriger ist die Existenz von Supremum und In…mum nachzuweisen. Wir beweisen den obigen Satz nicht. 30 Beispiel 3.3 Wir betrachten die Menge A = x : x 2 R; 0 x und x2 < 2 : A ist nicht leer, denn es gilt 1 2 A: O¤ensichtlich ist die Menge nach unten beschränkt und 0 ist das In…mum. Die Menge ist auch nach oben beschränkt. So ist z.B. 10 eine obere Schranke, was man wie folgt einsieht: Wäre 10 keine obere Schranke, so gäbe es ein Element x 2 A mit x > 10: Daraus folgt x2 = x x > 100; was jedoch x2 2 widerspricht, was alle Elemente in A erfüllen. Somit haben wir nachgewiesen, dass 10 eine obere Schranke von A ist. Diese Schranke ist für uns völlig uninteressant; wichtig ist uns nur, dass eine Schranke existiert. Nun zum entscheidenden Punkt: Nach dem vorangegangenen Satz p besitzt A eine kleinste obere Schranke sup A: Klarerweise ist sup A die Zahl, die man als 2 bezeichnet. Die Tatsache, dass noch oben bzw. nach unten beschränkte Teilmengen von R Suprema bzw. In…ma besitzen, ist eine der wichtigsten Eigenschaften von R: Sie garantiert, wie wir oben angedeutet haben, dass wir die Quadratwurzel aus 2 ziehen können. Gilt sup A 2 A; so ist sup A o¤enbar das grösste Element in A: Man bezeichnet dieses dann auch als das Maximum von A: Man sagt dann auch, A habe ein maximales Element. Eine entsprechende Aussage gilt auch für das In…mum. Beispiel 3.4 a) A =]0; 1[: Die Menge ist o¤enbar beschränkt. sup A = 1; inf A = 0: Beide liegen nicht in der Menge. b) A = 21 ; 32 ; 34 ; 45 ; : : : : Es gilt sup A = 1; inf A = 21 : 12 ist in A: A besitzt somit ein Minimum. Jedoch ist 1 2 = A: A besitzt somit kein Maximum. 4 4.1 Folgen und Reihen Konvergenz von Folgen De…nition 4.1 Eine Funktion a : N ! R nennt man eine reelle Zahlenfolge, oder auch eine Folge. Eine Folge ist einfach eine unendlich lange Sequenz a (1) ; a (2) ; : : : von reellen Zahlen. Manchmal schreibt man die Argumente auch als Indizes an anstelle von a (n) : Eine übliche Schreibweise für die Folge ist fan gn2N : Es ist üblich aber völlig unerheblich, dass man die Indizes mit 1 und nicht mit 0 beginnt. Wenn klar ist, dass die Indizes durch die natürlichen Zahlen laufen, so schreiben wir auch einfach fan g für die Folge. Beispiel 4.2 1. an := n2 : 31 2. an := 1 : n 3. an := 1 4. an := 1+ 2 1 n n n : Man nennt eine Reihe konvergent, falls es eine Zahl a 2 R gibt, gegen die „die Folgenglieder streben“. Das ist keine mathematisch präzise Ausdrucksweise. Was soll es heissen, dass die an gegen a streben? Hier die präzise De…nition: De…nition 4.3 Eine Folge fan g konvergiert gegen a 2 R; Schreibweise limn!1 an = a; falls für jede (noch so kleine) reelle Zahl " > 0; die absoluten Di¤erenzen jan aj kleiner oder gleich " sind, sofern n genügend gross ist, d.h. wenn es zu jedem " > 0 eine natürlich Zahl N gibt (die von " abhängen kann9 ) mit der Eigenschaft, dass jan aj " für alle n N gilt: a bezeichnet man als den Grenzwert oder den Limes der Folge. Manchmal schreiben n!1 wir auch an ! a anstelle von limn!1 an = a: Die Folge heisst divergent, sofern sie nicht konvergiert. n Wir veranschaulichen die De…nition an der Folge 1 + n1 des Beispiels 4: Wie wir unten nachweisen werden, konvergiert die Folge. Der Grenzwert ist die Eulersche Zahl e = 2:71828182845905:::: In der Graphik unten haben wir die Folgenglieder für n = 1; : : : ; 20 eingezeichnet. Ferner ist grün ein „"-Schlauch“ mit " = 0:1 um e eingezeichnet. Wie man sieht, liegen die Folgenglieder ab n = 13 im Schlauch (a13 liegt ziemlich genau auf der Grenze ist aber schon drin). Die Zeichnung ist natürlich kein Beweis, dass alle Folgenglieder ab n = 13 im Schlauch liegen, denn es könnte ja sein, dass z.B. das Zehntausendste Folgenglied plötzlich draussen liegt. Tatsächlich sind jedoch alle Folgenglieder ab n = 13 im Schlauch. Konvergenz bedeutet, dass für jeden noch so engen Schlauch um e die Folgenglieder an für genügend grosses n im Schlauch liegen. Hätten wir einen Schlauch mit " = 0:01 genommen, so liegen alle Folgenglieder ab n = 134 in dem entsprechenden engeren Schlauch, die Folgenglieder bis n = 133 jedoch noch nicht. 9 Um das zu betonen schreibt man manchmal N (") : 32 3.0 2.8 2.6 2.4 2.2 2.0 1.8 0 2 4 6 8 10 12 14 16 18 20 n Es ist ziemlich o¤ensichtlich, dass in den Beispielen 2. und 3. oben die Folgen konvergieren 1 lim = 0; n!1 n lim 1 2 n = 1: n!1 Wir schauen uns den ersten Fall etwas genauer an. Um die Behauptung nachzuweisen müssen wir für jedes " > 0 eine Zahl N = N (") …nden mit 1 1 = n n " fu •r n N (") : Dazu müssen wir nur 1 " setzen. Hier bedeutet dxe die kleinste ganze Zahl, die grösser als x ist, z.B. d3; 14159e = 4: Ist n N (") ; so gilt 1 1 1 1 = ": n N (") " N (") := Die Folge von Beispiel 1. konvergiert o¤ensichtlich nicht. Die De…nition oben ist wenig nützlich um herauszu…nden, ob eine Reihe konvergiert, wenn man den Grenzwert nicht direkt erraten kann. Es ist daher wichtig, Kriterien für die Konvergenz zu haben, die keinen Bezug auf den Grenzwert nehmen. Ein solches Kriterium ist das Cauchy-Kriterium. Um dieses zu motivieren betrachten wir eine konvergente Folge fan g mit a = limn!1 an : Zu " > 0 existiert N (") mit jan aj " für n N: Damit gilt für n; m N jan am j = jan a (am 2": 33 a)j jan aj + jam aj Wir sehen also, dass für jedes " > 0 eine Zahl N 0 (") := N ("=2) existiert mit jan am j " fu •r n; m N 0 (") : Eine Folge mit dieser Eigenschaft nennt man eine Cauchy-Folge. Wir haben somit gesehen, dass jede konvergente Folge eine Cauchy-Folge ist. Interessanterweise gilt die Umkehrung dieser Aussage: Satz 4.4 Eine Folge fan g konvergiert dann und nur dann, wenn sie eine Cauchy-Folge ist. Dieser Satz ermöglicht es, die Konvergenz nachzuweisen, ohne dass man den Grenzwert schon kennt. Es gibt eine Reihe anderer Konvergenzkriterien für spezielle Folgen. Besonders wichtig sind monotone Folgen. Eine Folge fan g heisst monoton ansteigend, wenn für alle n 2 N die Ungleichung an an+1 gilt. Die Folge heisst monoton fallend falls stets an+1 an gilt. Für monotone Folgen ist Konvergenz gleichbedeutend mit Beschränktheit: Satz 4.5 a) Ist fan g monoton ansteigend, so ist die Folge dann und nur dann konvergent, wenn sie nach oben beschränkt ist. In diesem Fall gilt lim an = sup an : n!1 n b) Ist die Folge monoton fallend, so ist sie dann und nur dann konvergent, wenn sie nach unten beschränkt ist. In diesem Fall gilt lim an = inf an : N !1 n Mit diesem Kriterium können wir die Konvergenz in Beispiel 4 nachweisen. Wir brauchen jedoch noch ein Hilfsmittel, die Bernoullische Ungleichung. Satz 4.6 (Bernoullische Ungleichung) Für jede Zahl a > 1 und jedes n 2 N gilt die Ungleichung (1 + a)n 1 + na Beweis. Wir führen den Beweis mit vollständiger Induktion. Das bedeutet, dass man die Behauptung erst für n = 1 zeigt (Induktionsverankerung). Anschliessend weist man nach, dass, falls für jedes n 2 folgendes gilt: Stimmt die Aussage für n 1 (Induktionsvoraussetzung), so gilt sie auch für n (Induktionsschluss). Falls man dies für beliebiges n 2 gezeigt hat, so folgt, dass die Aussage für jedes n gilt. Um die Bernoullische Ungleichung einzusehen, untersuchen wir also zunächst den Fall n = 1: Hier steht links und rechts einfach 1 + a; sodass die Behauptung sicher richtig ist. 34 Nun der Induktionsschluss. Sei n 2 und wir nehmen an, dass die Ungleichung für n 1 (und beliebiges a > 1) gilt. Dann folgt zunächst (1 + a)n = (1 + a)n 1 Wegen 1 + a > 0 und der Tatsache, dass (1 + a)n aussetzung), folgern wir (1 + a)n (1 + (n (1 + a) : 1 1 + (n 1) a) (1 + a) = 1 + (n 1) a gilt (Induktionsvor- 1) a + a + (n 1) a2 1 + na; wegen (n 1) a2 0: Damit ist gezeigt, dass die Ungleichung auch für n gilt. Mithin gilt sie für alle natürlichen Zahlen n:10 Wir beweisen nun, dass die Folge in Beispiel 4 konvergiert: an := n 1 1+ n : Diese Folge haben wir oben schon graphisch dargestellt (bis n = 20). Die Graphik legt nahe, dass die Folge monoton ansteigt, was wir nun nachweisen: Sei n 2: Nach der Bernoullischen Ungleichung gilt (n 1) (n + 1) n2 n = n = n Somit, nach Multiplikation mit 1 1+ n 1 n n 1 n2 1 1 1 n : n n 1 n = = n n+1 n 1+ n 1 n 1 1 n n 1 n 1 : Damit ist nachgewiesen, dass die Folge monoton ansteigend. Um zu sehen, dass sie konvergiert, müssen wir eine obere Schranke für die Folge …nden. Es genügt dafür, gerade n zu betrachten, denn wenn wir eine obere Schranke für 10 Eine der bekannten Scherzanwendungen der vollständigen Induktion ist der Nachweis, dass ein Zoo, der mindestens einen Elefanten hat, nur aus Elefanten besteht. Hier der Beweis: Wir führen Induktion nach der Anzahl n der Tiere im Zoo. n = 1 ist klar: Da wir voraussetzen, dass der Zoo mindestens einen Elefanten hat, so besteht er nur aus Elefanten. Nun das Induktionsargument: Der Zoo habe mehr als ein Tier. Wir entnehmen dem Zoo ein Tier, sodass der Rest aus n 1 Tieren mindestens den einen Elefanten enthält, dessen Existenz wir ohnehin postulieren. Nach Induktionsvoraussetzung sind die n 1 Tiere alles Elefanten. Nun tauschen wir einen dieser Elefanten durch das vorher entnommene Tier aus und wenden die Induktionsvoraussetzung nochmals an, sodass auch diese Gruppe wieder nur Elefanten enthält. Somit ist das eine Tier, dessen Elefantenhaftigkeit noch nicht nachgewiesen war, ebenfalls ein Elefant. q.e.d. 35 alle geraden Folgenglieder …nden, so dient diese Schranke der gesamten Folge, da ja ein ungerades Glied der Folge durch das nächste dominiert wird, welches gerade ist. Sei also n gerade, n = 2m: Dann ist 1+ m 1 n m 2m + 1 2m = : Ferner gilt 2m 2m 1 2m + 1 2m 2m 2m 1 2 m+2 : m+1 ::: In dieser Kaskade von Ungleichungen stehen m Quotienten. Demzufolge ist höchstens das Produkt dieser m Grössen, was einfach 2m + 1 m+1 2m+1 m 2m 2m + 2 =2 m+1 ist. Somit haben wir gezeigt, dass 1+ und somit 1+ 1 n n = 1+ 1 n m 1 n 2 2m = 1+ m 2 1 n 22 = 4: n Wir haben somit nachgewiesen, dass 1 + n1 4 für alle n ist. Da die Folge monoton ansteigend ist, konvergiert sie nach dem obigen Satz. Ferner wissen wir, dass lim n!1 1+ 1 n n 4 ist. Das ist eine eher schlechte Schranke. Bekanntlich ist der Grenzwert die Eulersche Zahl e = 2; 71828::: Hier noch eine Zusammenstellung von einfachen Fakten über konvergente Folgen: Satz 4.7 Es seien fan g ; fbn g zwei konvergente Folgen. Dann gilt a) fan + bn g ist konvergent und es gilt lim (an + bn ) = lim an + lim bn n!1 n!1 n!1 b) fan bn g ist konvergent und es gilt lim an bn = lim an n!1 n!1 36 lim bn : n!1 c) Sind die bn alle 6= 0 und ist limn!1 bn 6= 0; so konvergiert fan =bn g und es gilt lim n!1 an limn!1 an = : bn limn!1 bn Bemerkung 4.8 Obwohl z.B. die Folge n2 nicht in unserem Sinn konvergiert, schreibt man oft limn!1 n2 = 1: Allgemein: Für eine Folge fan g bedeutet limn!1 an = 1; dass für jede (noch so grosse) Zahl K > 0 ein N existiert mit an K für n N: Analog de…niert man limn!1 an = 1: Z.B. gilt limn!1 log n = 1: 4.2 Reihen Ist fan g eine beliebige Folge reeller Zahlen, so de…niert sn := a1 + a2 + + an eine neue Folge fsn g von reellen Zahlen. Man nennt die sn auch die Partialsummen. De…nition 4.9 P fsn g nennt man die zu fan g gehörende Reihe. Man schreibt oft (symbolisch) an für fsn g : Die Reihe heisst konvergent, falls die Folge fsn g konvergent ist. Die Reihe heisst divergent, falls die Folge fsn g divergent ist. Ist die Reihe konvergent, so schreibt man für den Limes s := limn sn : 1 X s= an : n=1 Die Reihe heisst absolut konvergent, falls die Reihe Beispiel 4.10 1. P jan j konvergiert. X1 : n Die Reihe nennt man auch die harmonische Reihe. 2. X 1 : n! (n! steht für „n Fakultät“: n! := 1 2 3 n). 3. 4. X 1 : n2 X 1 1 1 1 :=1 + + n 2 3 4 Diese Reihe nennte man die alternierende harmonische Reihe. ( 1)n+1 37 Bemerkung 4.11 P a) Die Reihe an kann nur konvergieren, wenn fan g eine Nullfolge ist, d.h. wenn limn!1 a = P n 0 ist. Wenn fan g eine Nullfolge ist, so folgt aber keineswegs, dass die Reihe an konvergiert. b) Ist die Reihe absolut konvergent, so ist sie konvergent. Beweis. a) Wir zeigen, dass die Reihe divergiert, wenn fan g keine Nullfolge ist. Nach der De…nition ist fan g keine Nullfolge, wenn es eine positive Zahl " > 0 gibt, sodass jan j > " für unendlich viele n gilt. Wegen sn sn 1 = an folgt dann auch jsn sn 1 j > " für unendlich viele n: Somit ist fsn g keine Cauchy-Folge und damit konvergiert diese Folge auch nicht. Das Beispiel 1 oben ist divergent, wie wir gleich zeigen werden, obwohl f1=ng eine Nullfolge ist. P b) Wir argumentieren wieder mit dem Cauchy-Kriterium. Sei sn := nk=1 jak j : Da wir voraussetzen, dass die Reihe absolut konvergiert, so ist diese Folge eine Cauchy-Folge. Zu jedem " > 0 existiert somit N (") mit jsn sm j " für n; m N (") : Wir können annehmen, dass m < n ist, sonst vertauschen wir einfach die Rollen. (Für m = n ist die Di¤erenz einfach 0). Dann ist Xn Xn jsn sm j = ak jak j k=m+1 = jsn sm j k=m+1 " für N (") m < n: DamitP ist gezeigt, dass fsn g eine Cauchy-Folge ist. 1 Hier der Beweis, dass n divergiert. Die Folge sn = 1 + 1 1 + + 2 3 + 1 n ist o¤ensichtlich monoton ansteigend. Wir zeigen nun einfach, dass sie nicht nach oben beschränkt ist. Dazu klammern wir die Summe in s2n in spezieller Weise: s2n = 1+ + 1 2 + 1 2n 1 +1 1 1 + 3 4 + 2n 1 1 1 1 + + + 5 6 7 8 1 1 + + n : 1+2 2 + + Wir klammern also immer 1 2k 1 +1 + 1 2k 1 +2 + + 1 2k zusammen, für k = 1; : : : ; n: (Das Glied 1 zu Beginn geht separat). Diese Ausdrücke in Klammern haben stets 2k 2k 1 = 2k 1 (2 1) = 2k 1 Summanden, und jeder Summand ist 2 k : Die Summe in den Klammern ist also 2k 1 2 k = 1=2: Damit ist s2n 1 + n=2: Dies gilt für jedes n: Mithin ist die Folge fsn g nicht beschränkt und somit auch nicht konvergent. 38 Es gibt einige Kriterien, mit denen sich Konvergenz einer Reihe in vielen Fällen nachweisen lässt. Hier zunächst das sogenannte Quotientenkriterium. Man betrachtet dazu die Quotienten an+1 qn := ; an wobei man voraussetzt, dass an 6= 0 ist. Satz 4.12 Existiert q := limn!1 qn und gilt q < 1; so ist die Reihe konvergent. Existiert q und gilt q > 1; so ist die Reihe divergent. (Man beachte, dass der Satz keine Aussage im Fall q = 1 macht). Wir wenden das auf das Beispiel 2 an: X 1 n! wobei n! die Fakultät von n ist: n! := 2 3 4 qn = n: Dann gilt n! 1 = : (n + 1)! n+1 Wegen q = limn!1 qn = 0 folgt aus dem Quotientenkriterium, dass die Reihe konvergent ist. Es gilt übrigens 1 X 1 1 = e = lim 1 + n!1 n! n n = e = 2:71828182845905 : : : ; n=0 was wir hier nicht nachweisen. Die Reihe wird von n = 0 an summiert, nicht n = 1; was für die Konvergenz natürlich keine spielt. 0! ist per Konvention = 1: P Rolle Versucht man im Beispiel 3. n 2 das Quotientenkriterium, so kommt nichts dabei raus: an+1 n2 1 lim = lim = lim 2 1 = 1: 2 n!1 an n!1 (n + 1) n!1 1 + n + n2 Damit ist das Quotientenkriterium nicht anwendbar, weder um die Konvergenz noch die Divergenz zu zeigen. Die Reihe ist jedoch in der Tat konvergent (Übungsaufgabe). Es gilt übrigens 1 2 X 1 = ; n2 6 n=1 ein berühmtes Resultat von Euler. Eine andere viel benützte Möglichkeit, um die Konvergenz nachzuweisen, besteht darin, dass man die Reihe mit einer anderen Reihe vergleicht, deren Konvergenz man schon kennt. 39 Satz 4.13 Existieren Zahlen bn 0 mit P jan j konvergiert auch die Reihe an : bn für alle n und konvergiert die Reihe P bn ; so Aus diesem Kriterium sehen wir z.B., dass die Reihen X 1 n für 2 alle konvergieren, denn wie schon oben erwähnt, konvergiert die Reihe für = 2. Für 2 gilt jedoch 1 1 : n n2 (Die Reihe konvergiert allerdings für alle > 1). Die Reihe von Beispiel 4 ist konvergent. Hier die graphische Veranschaulichung der ersten 20 Partialsummen: 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 0 2 4 6 8 10 12 14 16 18 20 n Sie ist ein Beispiel einer alternierenden Reihe, d.h. einer Reihe, deren Reihenglieder stets das Vorzeichen wechseln. Wir formulieren das in einem allgemeinen Satz: Satz 4.14 fan g sei eine monton fallende Folge von postiven Zahlen mit limn!1 an = 0: Dann P P konvergieren die Reihen ( 1)n+1 an und ( 1)n an Beweis. Die zweite Reihe ist einfach das Negative der ersten, sodass es genügt, die erste zu betrachten, welche mit einem positiven Glied beginnt. Für ungerade n folgt sn+1 = sn + ( 1)n+2 an+1 = sn 40 an+1 : Da die an alle postiv sind, folgt sn+1 < sn ; falls n ungerade ist. Ferner gilt (weiter für ungerade n) sn+2 = sn an + an+1 sn ; da wir voraussetzen, dass an+1 sn an gilt, und somit gilt sn+2 sn+4 sn+6 ; d.h. die Folge der ungerade Partialsummen ist monoton fallend. Analog folgt, dass die Folge der geraden Partialsummen monoton ansteigend ist. Aus diesen Überlegungen ergibt sich nun, dass für ein beliebiges ungerades n sämtliche sk mit k n im Intervall [sn+1 ; sn ] liegen. In der Tat: Ist k ungerade, so folgt sn sk > sk+1 sn+1 ; und ist k gerade, so folgt sn sk+1 > sk sn+1 : Somit gilt in jedem Fall sk 2 [sn+1 ; sn ] für k n Nach diesen Vorüberlegungen zeigen wir nun, dass die Folge fsn g eine Cauchy-Folge ist. Sei " > 0 beliebig. Da wir voraussetzen, dass fan g eine Nullfolge ist, existiert ein N (ungerade, wenn wir wollen), sodass 0 < aN " gilt. Damit hat das Intervall [sN +1 ; sN ] eine Länge, die " ist. Wie wir gesehen haben, liegen alle Partialsummen sk für k N in diesem Intervall. Somit gilt für alle k; m N die Ungleichung jsk sm j ": Damit haben wir gezeicht, dass fsn g eine Cauchy-Folge ist. Nach Satz 4.4 folgt die Konvergenz. Ein berühmtes Beispiel einer alternierenden Reihe ist die Leibnizsche Reihe 1 1 1 + 3 5 1 1 + 7 9 = 4 : Dass die Reihe konvergiert, haben wir eben bewiesen. Dass der Wert =4 ist, können wir (noch) nicht einsehen. Die Reihe konvergiert zwar, aber sehr schlecht, d.h. man muss sehr viele Reihenglieder summieren um =4 zu approximieren. Die Reihe eignet sich nicht zur genauen Berechnung von : Die Summation der ersten 10000 Reihenglieder, multipliziert mit 4; ergibt: 3:141492 65359004: Diese Reihe ist auch ein Beispiel einer Reihe, die konvergiert, aber nicht absolut konvergiert. Dass 1 + 13 + 15 + 71 + 19 + divergiert sieht man analog wie bei der harmonischen Reihe. Mit abosolut konvergenten Reihen kann man gewissermassen umgehen wie mit endlichen Summen. Wir fassen einige wichtige diesbezügliche Fakten zusammen: Satz P 4.15 P P1 P1 an ; bn seien zwei absolut konvergente Reihen mit s = n=1 an ; t = n=1 bn : Dann gelten: a) Die Reihe P (an + bn ) ist absolut konvergent und es gilt s+t= 1 X n=1 41 (an + bn ) : b) Die Reihe P cn sei wie folgt de…niert: cn = n X ak bn+1 k: k=1 Diese Reihe ist absolut konvergent mit st = 1 X cn : n=1 Mit anderen Worten: st = (a1 + a2 + a3 + ) (b1 + b2 + b3 + ) = a1 b1 + a2 b1 + a1 b2 + a3 b1 + a2 b2 + a1 b3 + 42 : 5 Stetigkeit De…nition 5.1 1. a) Ist D eine Teilmenge von R; so heisst 2 R ein Häufungspunkt von D; falls für jedes " > 0; das Intervall ] "; + "[ mindestens einen Punkt in D enthält, der 6= ist. b) Ein Punkt 2 D heisst innererer Punkt von D; falls ein " > 0 existiert, sodass ] "; + "[ D gilt. Ist 2 D kein innerer Punkt, so nennt man ihn einen Randpunkt von D: in der obigen De…nition a) kann, aber muss nicht, zu D gehören. Ist 2 D kein Häufungspunkt von D; so nennt man auch einen isolierten Punkt von D: Ein innerer Punkt ist o¤ensichtlich stets ein Häufungspunkt. Ein Häufungspunkt, der in D liegt, muss jedoch nicht notwendigerweise in innerer Punkt sein. Beispiel 5.2 a) Ist D = ]a; b[ ; mit a < b; so ist jeder Punkt in [a; b] ein Häufungspunkt von D: Die Punkte ausserhalb von [a; b] sind keine Häufungspunkte, denn jeder Punkt 2 = [a; b] hat einen positiven Abstand r zu dieser Menge. Ist " < r; so gibt es keine Punkte von D in ] "; + "[ : Somit ist ein Punkt, der nicht in [a; b] liegt, kein Häufungspunkt der Menge D: Die beiden Punkte a; b sind Häufungspunkte der Menge D; obwohl sie nicht zu D gehören. D enthält nur innere Punkte und keine Randpunkte. b) D = [a; b]: Die Menge der inneren Punkte ist gleich ]a; b[ und a; b sind Randpunkte. Die Menge der Häufungspunkte ist D: c) D = Z: Diese Menge hat keine Häfungspunkte und keine inneren Punkte. Alle Punkte von D sind isolierte Punkte. d) D = f1=n : n 2 Ng : Die Elemente von D sind alle isoliert. Die Menge hat jedoch den Häufungspunkt 0; der nicht in D liegt. 0 ist der einzige Häufungspunkt der Menge. e) Für D = Q ist jeder Punkt 2 R ein Häufungspunkt von D: Für jedes 2 R und jedes " > 0 gibt es eine rationale Zahl 6= in ] "; + "[ : Q enthält keine inneren Punkte und alle Punkte sind somit Randpunkte. Die Eigenschaft, dass ein Häufungspunkt von D ist, wird auch dadurch charakterisiert, dass eine Folge fxn g existiert, xn 2 D; xn 6= ; für alle n; mit limn!1 xn = : Wir betrachten eine Funktion f : D ! R; welche auf einer Teilmenge D R de…niert ist. Ist ein Häufungspunkt von D; so schreiben wir y= lim x! ; x2Dnf g 43 f (x) : (5.1) falls für jede Folge fxn g D; die gegen konvergiert und für die xn 6= für alle n ist, der Limes limn!1 f (xn ) existiert und = y ist. Äquivalent dazu ist die Eigenschaft, dass für jedes " > 0 ein > 0 existiert, sodass jy f (x)j " für jedes x 2 (D \ ] ; + [) n f g ist. Etwas salopper ausgedrückt: f (x) ist beliebig nahe bei y; sofern x in einer genügend kleinen Umgebung von ist, wobei jedoch x ungleich ist. In der Notation (5.1) lassen wir oft die Präzisierung x 2 Dn f g weg und schreiben einfach limx! f (x) : Manchmal benötigt man auch die Unterscheidung, ob x den Punkt von oben, oder von unten approximiert. Wir schreiben y = lim f (x) ; x# wenn für jede monoton fallende Folge fxn g ; die limn!1 xn = erfüllt, y = limn!1 f (xn ) gilt. Analog ist y = limx" f (x) de…niert. Diese De…nitionen lassen sich auch durch "; wie oben ausdrücken. Wir verzichten auf die Details. y = limx! f (x) gilt genau denn, wenn y = limx# f (x) und y = limx" f (x) beide gelten. Es muss hier betont werden, dass für eine Funktion f und einen Häufungspunkt der Grenzwert limx! f (x) keinesfalls immer existiert. Bemerkung 5.3 Es ist nicht schwer zu sehen, dass sich die Eigenschaften aus Satz 4.7 auf die hier betrachtete Situation übertragen: Sind etwa f; g zwei auf D de…nierte Funktionen und ein Häufungspunkt von D; so gilt die folgende Aussage: Existieren sowohl limx! f (x) ; wie limx! g (x) ; so existiert limx! (f (x) + g (x)) und ist gleich limx! f (x)+limx! g (x) : Die anderen Aussagen übertragen sich analog. De…nition 5.4 f sei eine auf D R de…nierte Funktion, und sei 2 D kein isolierter Punkt von D. f heisst stetig in ; falls f ( ) = limx! f (x) ist. Ist ein isolierter Punkt, so ist (per Konvention) jede Funktion stetig in : f heisst stetig auf D; falls es stetig in allen Punkten von D ist.11 Bemerkung 5.5 Die folgenden Formulierungen (I) und (II) sind äquivalent zur Stetigkeit einer Funktion f : D ! R in 2 D : (I) Für jede Folge fxn g D mit limn!1 xn = (II) Zu jedem " > 0 gibt es ein jx j gilt limn!1 f (xn ) = f ( ) > 0 mit und x 2 D =) jf (x) 11 f ( )j ": Hat D nur isolierte Punkte, so ist nach dieser De…nition jede Funktion f : D ! R stetig, da es gar keine Häfungspunkte gibt, für die irgend etwas nachzuprüfen wäre. Insbesondere ist jede Funktion N ! R stetig. 44 Zur Veranschaulichung der letzten De…nition eine Graphik mit einem Beispiel: Die eingezeichnete Funktion hat in 2 den Funktionswert f (2) = 3:87: In der Graphik haben wir " = 0:2 genommen. Die beiden horizontalen roten Linien markieren einen "-Schlauch um den Funktionswert 3:87: Falls die Funktion stetig in = 2 ist, so …ndet man ein > 0; sodass für alle x 2 [2 ; 2 + ] der Funktionswert f (x) im roten Schlauch zu liegen kommen. Im Beispiel unten reicht = 0:025: Um Stetigkeit zu zeigen, muss man nachweisen, dass für jeden (noch so engen) horizontalen "-Schlauch ein vertikeler Schlauch um existiert, sodass alle Punkte auf der x-Achse, die innerhalb des Letzteren liegen, auf Punkte innerhalb des "Schlauchs abgebildet werden. 5 4 3 2 1.6 1.8 2.0 2.2 2.4 Beim Nachweis der Stetigkeit wird selten direkt die De…nition verwendet, sondern man stützt sich auf eine Reihe von Resultaten und Sätzen, die unmittelbar aus Satz 4.7 und Bemerkung 5.3 folgen. Satz 5.6 Es seien f; g : D ! R zwei Funktionen, die stetig in folgenden Funktionen stetig in : 2 D sind. Dann sind auch die a) Die Summe f + g der beiden Funktionen, die de…niert ist durch (f + g) (x) := f (x) + g (x) : b) Das Produkt der Funktionen f g; de…niert durch (f g) (x) = f (x) g (x) : c) Falls g ( ) 6= 0 ist, der Quotient (f =g) ; de…niert durch (f =g) (x) = f (x) =g (x) (eventuell mit eingeschränktem De…nitionsbereich fx : g (x) 6= 0g : 45 Korollar 5.7 Sind f; g stetig auf dem ganzen De…nitionsbereich, so auch f + g; f g; und f =g; letzteres auf fx 2 D : g (x) 6= 0g : Zwei Beispiele stetiger Funktionen sind fast trivial: Beispiel 5.8 a) Die identische Funktion of R : id (x) = x ist stetig auf R: Das ist eine triviale Folgerung aus der De…nition und der Formulierung von Bemerkung 5.5 (I): Ist fxn g eine Folge, die gegen 2 R konvergiert, so gilt lim id (xn ) = lim xn = n!1 n!1 b) Für jeden De…nitionsbereich A stetig. = id ( ) ; R sind die konstanten Funktionen f (x) = c Mit diesen beiden Beispielen und Satz 5.6 können wir das Beispielreservoir von stetigen Funktionen nun erweitern. Zunächst sehen wir durch Multiplikation von id mit sich selbst und einer Anwendung von Satz 5.6 b), dass auch die Funktion f (x) = x2 stetig ist. Diese Funktion können wir nochmals mit id multiplizieren und erhalten, dass f (x) = x3 stetig ist, etc. Wir sehen also (genau genommen mit vollständiger Induktion), dass für jedes n 2 N die Funktion f (x) = xn stetig ist. Verwenden wir nun, dass die konstanten Funktionen stetig sind und nochmals Satz 5.6 b), so sehen wir, dass auch Funktionen der Form f (x) = cxn stetig sind, c 2 R: Nun können wir solche Funktionen auch addieren unter Erhalt der Stetigkeit. Mit Satz 5.6 a) folgt somit: Satz 5.9 Alle Polynome sind stetige Funktionen R ! R: Unter Verwendung von 5.6 c) können wir weiter folgern, dass auch die sogenannten rationalen Funktionen stetig sind: De…nition 5.10 Eine rationale Funktion r ist de…niert durch r (x) = p (x) ; q (x) wobei p (x) ; q (x) zwei Polynome sind. Der De…nitionsbereich der rationalen Funktion ist fx 2 R : q (x) 6= 0g : (Ist q (x) ein Polynom vom Grad n 1; so wissen wir schon, dass es höchstens n Nullstellen hat. Die obige rationale Funktion ist somit bis auf diese maximal n Punkte überall de…niert). Satz 5.11 Eine rationale Funktion ist auf ihrem De…nitionsbereich stetig. 46 x2 Ein Beispiel einer rationalen Funktion. Wir nehmen p (x) = 1 + x + x3 =10; q (x) = 1: q (x) hat die beiden Nullstellen 1; 1: Hier der Graph: 3 2 1 -3 -2 -1 1 2 3 x -1 -2 -3 Diese rationale Funktion hat zwei sogenannte Pole bei Nullstellen des Nenners entspricht. Hier noch zwei Beispiele von unstetigen Funktionen: 1 und bei +1; was den Beispiel 5.12 1. Sei f : R ! R de…niert durch f (x) := 0 fu •r x < 0 : 1 fu •r x 0 Die Funktion ist o¤ensichtlich unstetig im Punkt 0: Formal können wir das wie folgt beweisen. Wir betrachten die Folge fxn g mit xn := 1=n: Diese Folge konvergiert gegen 0: Da alle xn kleiner als 0 sind, gilt f (xn ) = 0 für alle n und somit limn!1 f (xn ) = 0: Anderseits ist f (0) = 1: Somit gilt f (0) 6= lim f (xn ) : n!1 2. Wir betrachten die folgende Funktion f : R ! R f (x) := 1 fu •r x rational : 0 fu •r x irrational Diese Funktion ist in keinem Punkt stetig. Wir weisen zunächst nach, dass die Funktion in keinem irrationalen Punkt x stetig ist. Ist eine irrationale Zahl, so lässt sie sich in einen unendlichen Dezimalbruch entwickeln. Wir de…nieren xn indem wir in der Dezimalbruchentwicklung die Stellen nach der n-ten nach dem Komma durch 0 ersetzen. Ist z.B. 47 = = 3:141592 65358979; so de…nierten wir x1 = 3:1; x2 = 3:14; x3 = 3:141 etc. Diese xn sind alle rational und die Folge konvergiert gegen : Jedoch gilt f ( ) = 0 6= 1 = limn!1 f (xn ) : Somit ist gezeigt, dass f nicht stetig in ist, wenn rational ist. Wir weisen nun nach, dass f auch p in rationalen Punkten nicht stetig ist. Sei also rational. Wir wissen schon, dass 2 irrational ist. Dann ist auch p 2 xn := + n p )). Die Folge fxn g konvergiert irrational. (Wäre xn rational, so auch 2 = n (xn o¤ensichtlich gegen ; aber es gilt f ( ) = 1 6= 0 = lim f (xn ) : n!1 Somit ist gezeigt, dass f in keinem Punkt stetig ist. Neben den Polynomen und rationalen Funktionen sind auch die üblichen Standardfunktionen stetig, was wir nicht beweisen wollen. Satz 5.13 a) Die Funktionen ex ; sin (x) ; cos (x) sind stetige Funktion auf R: b) Die Funktion log (x) ist stetig auf ]0; 1[ : c) Die Funktion tan (x) ist stetig auf ] =2; =2[ : d) arcsin (x) ist stetig auf dem Intervall [ 1; 1] ; arctan (x) ist stetig auf R: Komposition von Funktionen: Wir führen die Komposition (Zusammensetzung, „Hintereinanderschaltung“) von Funktionen ein. Wir können das ganz allgemein de…nieren, obwohl wir es in diesem Kapitel nur für Funktionen auf R benötigen. De…nition 5.14 Es seien f : D ! A und g : B ! C Abbildungen, wobei der Bildbereich im (f ) eine Teilmenge des De…nitionsbereich B von g sei. Dann ist die Zusammensetzung g f : D ! C de…niert durch (g f ) (a) = g (f (a)) : (Man beachte, dass f (a) 2 B gilt, da wir im (f ) B voraussetzen).12 Beispiel 5.15 p Die Funktion x ! sin2 ( x) ist auf der positiven reellen Achse de…niert und ist die p Komposition von drei Funktionen: Erst f (x) := x; was nur auf der positiven Achse de…niert ist, dann g (x) := sin x; und schliesslich h (x) := x2 : Formal p sin2 x = (h g f ) (x) = h (g (f (x))) : 12 Man beachte, dass f zuerst ausgeführt wird, und anschliessend g; obwohl g links von f steht. Die Notation hat sich leider so durchgesetzt, was darauf zurückzuführen ist, dass man f (x) schreibt für f an der Stelle x; obwohl (x) f sinnvoller wäre, denn man „nimmt“ erst x und bildet dann x mit f ab. Es hat erfolglose Versuche gegeben, die Bezeichnungen umzustellen. 48 Zurück zu stetigen Funktionen. Es stellt sich heraus, dass Kompositionen von stetigen Funktionen wieder stetig sind: Satz 5.16 Es seien f : D ! R und g : B ! R Funktionen mit D; B R; wobei vorausgesetzt sei, dass im (f ) B ist. Ferner sei 2 D: Ist f stetig in und g stetig in f ( ) ; so ist g f : D ! R stetig in : Sind f; g beide stetig auf ihren De…nitionsbereichen, so ist g f ebenfalls stetig auf D: Beweis. Der Beweis ist wieder eine simple Anwendung von Bemerkung 5.5 (I): Ist fxn g eine Folge, die gegen konvergiert, so gilt nach Voraussetzung an die Stetigkeit von f die Gleichung lim f (xn ) = f ( ) n!1 und dann unter Verwendung der Stetigkeit von g : lim g (f (xn )) = g (f ( )) : n!1 Da das für jede Folge fxn g ; die gegen konvergiert, richtig ist, folgt die Stetigkeit von g f in : Mit Hilfe diese Satzes und Satz 5.13 können wir viele neue Beispiele von stetigen Funktionen konstruieren. Beispiel 5.17 Die Gausssche Glockenfunktion f (x) = e x2 ; hier der Graph der Funktion 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 -3 -2 -1 0 1 2 3 x ist stetig. Die Funktion ist die Zusammensetzung der Funktion x ! x2 ; deren Stetigkeit wir schon gesehen haben (es ist ein Polynom) mit der Exponentialfunktion. Nach Satz 5.16 ist die Glockenfunktion somit stetig. 49 Eine wichtige, intuitiv unmittelbar einleuchtende Eigenschaft stetiger Funktionen ist im folgend Satz beschrieben: Satz 5.18 (Zwischenwertsatz) Ist f : [a; b] ! R eine stetige Funktion, die auf dem Intervall [a; b] de…niert ist, und ist J das Intervall mit Endpunkten f (a) und f (b) (also entweder [f (a) ; f (b)] oder [f (b) ; f (a)] je nach dem, welcher Funktionswert grösser ist), so gibt es für jedes y 2 J mindestens ein x 2 [a; b] mit f (x) = y: Beispiel 5.19 Als Anwendung des Zwischenwertsatzes können wir zeigen, dass jedes reelle Polynom dritten Grades mindestens eine reelle Nullstelle hat. Das Polynom sei p (x) = ax3 + bx2 + cx + d mit a 6= 0: Für die Nullstellen p (x) = 0 können wir durch a dividieren, und wir können deshalb voraussetzen, dass a = 1 ist. Sei K := max f3 jbj ; 3 jcj ; 3 jdjg + 1 Dann gilt K 3 = KK 2 K3 K 3 3 jbj K 2 + 1 > 3 jbj K 2 K 2 (wegen K K > 3 jdj 3d: 1) > 3 jcj K 3bK 2 3cK Somit also K3 = > K3 K3 K3 + + 3 3 3 2 bK cK d; und damit p (K) = K 3 + bK 2 + cK + d > 0: Analog zeigt man p ( K) < 0: Das Polynom ist überall stetig, insbesondere als Abbildung [ K; K] ! R: Aus dem Zwischenwertsatz folgt also, dass ein x 2 [ K; K] existiert, mit p (x) = 0: Wir wenden uns nun einem etwas anderen, aber eng verwandten Thema zu, das für das nächste Kapitel wichtig wird. Oft kommt es vor, dass eine stetige Funktion auf einer Menge D R de…niert ist, welche einen oder mehrere Häufungspunkte hat, die nicht zu D gehören. Ein typisches Beispiel ist eine Funktion, die auf der positiven reellen Achse ]0; 1[ de…niert ist, aber (zunächst) nicht im Nullpunkt. 0 ist ein Häufungspunkt von ]0; 1[ : Wir diskutieren für einige wichtige Beispiele, ob sich die Funktion auf diesem oder diesen Häufungspunkten so de…nieren lässt, dass die gesamte Funktion stetig wird. Wenn f z.B. zunächst stetig auf ]0; 1[ de…niert ist, stellt sich die Frage, ob sich f auf 0 so de…nieren lässt, dass die Funktion auf [0; 1[ stetig ist. 50 O¤ensichtlich geht das nicht immer. Z.B. ist die Logarithmusfunktion stetig auf ]0; 1[ ; aber es gibt keine Möglichkeit, f (0) 2 R so zu de…nieren, dass die Logarithmusfunktion auf [0; 1[ stetig ist.13 . Hier zwei andere Beispiele: Beispiel 5.20 a) f :]0; 1[! R sei de…niert durch f (x) = sin (1=x) : Das ist die Komposition der Funktion x ! 1=x; die stetig auf ]0; 1[ ist mit der Sinusfunktion, die überall stetig ist. f ist daher stetig auf ]0; 1[ : Hier ist der Graph der Funktion: sin (1=x) : sin(1/x) 1.0 0.8 0.6 0.4 0.2 0.0 0.2 0.4 0.6 -0.2 0.8 1.0 1.2 1.4 1.6 1.8 2.0 x -0.4 -0.6 -0.8 -1.0 Wenn x gegen 0 strebt, so strebt 1=x gegen 1: Somit ‡uktuiert der Funktionswert sin (1=x) zwischen 1 und 1; für x ! 0: Es ist o¤ensichtlich nicht möglich, einen Funktionswert für x = 0 so festzulegen, dass die Funktion auch in 0 stetig wird. b) Wir mod…zieren das obige Beispiel, indem wir die Funktion noch mit x multiplizieren: f (x) = x sin (1=x) : Hier der Graph: 13 Manchmal behilft man sich damit, dass man 1 oder 1 als Funktionswerte zulässt und noch de…niert, was es heissen soll, dass eine Funktion mit Werten in R[ f 1; 1g stetig ist. Bei der Logarithmusfunktion würde man dann log (0) = 1 setzen. Wir diskutieren das jedoch nicht im Detail. 51 xsin(1/x) 1.0 0.8 0.6 0.4 0.2 0.0 0.2 0.4 0.6 0.8 1.0 -0.2 1.2 1.4 1.6 1.8 2.0 x -0.4 -0.6 -0.8 -1.0 Der Faktor x vor sin (1=x) „killt“ o¤enbar die Unstetigkeit in 0: Setzt man f (0) := 0; so ist die Funktion auf der ganzen reellen Achse stetig, was sich der Leser als Übungsaufgabe überlegen möge. n exiNun zu weiteren Beispielen: Wir hatten schon gezeigt, dass limn!1 1 + n1 stiert. Der Grenzwert ist die Eulersche Zahl e: Die Folge n1 ist jedoch nur eine ganz spezielle Folge, die gegen 0 konvergiert. Die Funktion f (x) := (1 + x)1=x ist jedoch für jedes x > 0 de…niert und stetig auf ]0; 1[ : Dies können wir wie folgt sehen: Die Funktion lässt sich wie folgt umschreiben: f (x) = e(1=x) log(1+x) Sowohl x ! 1=x; wie x ! log (1 + x) sind stetige Funktionen auf ]0; 1[. Also ist auch das Produkt dieser Funktionen stetig. Da die Exponentialfunktion stetig ist, folgt die behauptete Stetigkeit auf ]0; 1[ : 0 ist ein Häufungspunkt des Intervalls ]0; 1[ : Diese Funktion lässt sich stetig im Nullpunkt fortsetzen, indem man f (0) := e de…niert, denn es gilt das folgende Resultat: Lemma 5.21 lim (1 + x)1=x = e: x!0 Um dies nachzuweisen, müsste man beweisen, dass für jede Folge fxn g ; die gegen 0 konvergiert e der Limes von (1 + xn )1=xn ist, oder äquivalent die Eigenschaft über "; : Das ist nicht schwierig; wir wollen es jedoch nicht durchführen. 52 Etwas schwieriger ist folgendes Beispiel. Wir betrachten die Funktion f (x) = sin x ; x die für alle x 6= 0 de…niert ist. Die Frage ist wieder, ob wir sie im Nullpunkt so festlegen können, dass sie auf ganz R stetig de…niert ist. Das geht in der Tat mit der Festsetzung f (0) := 1: Lemma 5.22 sin x =1 x!0 x lim Beweis. Wir zeigen nur lim x#0 sin x = 1: x Für x " 0 verwenden wir, dass sin ( x) = ( x) = sinx x ist, sodass wir diesen Fall auf den ersten zurückführen können. Wenn wir irgend etwas zu einem Limes x # 0 beweisen wollen, so reicht es natürlich aus, die betrachteten Funktionen für (beliebig) kleine x > 0 zu untersuchen. Wir können uns insbesondere auf 0 < x < =2 einschränken. Für diese Winkel gilt sin x < x; was man der unten stehenden Zeichnung entnimmt: Der Winkel x im Bogenmass ist die Länge auf dem Einheitheitskreis von B nach D: sin (x) ist die Länge der Strecke von A nach D: Diese Länge ist o¤ensichtlich kleiner als x: Daher gilt sin (x) < x und mithin sin x <1 x für alle 0 < x < =2: Somit folgt sin x x!0 x lim 53 1: Anderseits ist die Länge der Strecke von B nach C grösser als x: Das wirklich mathematisch zu beweisen, erfordert etwas Aufwand; geometrisch ist es jedoch (ho¤entlich) sin x klar ersichtlich. Diese Länge ist tan x = cos x : Somit erhalten wir sin x ; cos x sin x cos x < : x cos x ist stetig in x und cos 0 = 1: Geht man zum Limes x ! 0 über, so erhält man14 sin x lim 1: x!0 x x < 6 Di¤erentialrechnung 6.1 De…nition des Di¤erentialquotienten und grundlegende Rechenregeln Wenn man mit einem Automobil eine Strecke von 200 km in zwei Stunde zurücklegt, und stets dieselbe Geschwindigkeit einhalten kann, so fährt man mit einer Geschwindig14 Die vorgestellte Argumentation ist mathematisch nicht ganz sauber, denn wir haben die Existenz vom limx!0 sinx x implizite vorausgesetzt und nur gezeigt, dass der Limes unter dieser Voraussetzung gleich 1 ist. Das lässt sich jedoch mit etwas formalem Aufwand, den wir hier nicht betreiben wollen, leicht rechtfertigen. 54 keit von 100 km/h. Diese Geschwindigkeit ergibt sich als Quotient der zurückgelegten Strecke dividiert durch die benötigte Zeit. Bekanntlich ist das Einhalten einer konstanten Geschwindigkeit in dieser Höhe, vor allem, wenn man den Führerschein behalten will, nicht immer möglich. Die Geschwindigkeit zu einem bestimmten Zeitpunkt t ergibt sich auch im Fall, wo diese nicht konstant ist, als zurückgelegte Strecke pro Zeiteinheit, wobei man jedoch den Quotienten nur über ein kleines Zeitintervall betrachtet. Unten ein Beispiel. Die eingezeichnete Kurve sei die zurückgelegte Strecke s als Funktion der Zeit t: Die Funktion ist künstlich als s (t) = 0:2t + 0:1t3 gewählt, aber das ist hier ohne Belang. Wir wollen die Geschwindigkeit zum Zeitpunkt t = 1 bestimmen. s (1) = 0:595 8: Wir können die Geschwindigkeit approximieren, indem wir s (2) = 0:963 bestimmen und dann den Quotienten betrachten: Streckenzuwachs dividiert durch Zeitzuwachs s (2) s (1) = 0:9 1 Die Steigungsgeraden ist unten rot eingezeichnet. O¤ensichtlich ist die Approximation für die Geschwindigkeit nicht besonders gut. Wir wählen als Nächstes ein kürzeres Intervall der Länge 0:1: Das ist unten grün eingezeichnet. Die approximative Geschwindigkeit ergibt sich als s (1:1) s (1) = 0:531 0:1 Wählt man die Zeitdi¤erenz stets kleiner und kleiner, so erhalten wir am Schluss die korrekte Geschwindigkeit, welche durch die Steigung der Tangente an die Kurve zum Zeitpunkt 1 gegeben ist. Für die obige Funktion ist das exakt 1=2: Die Tangente ist unten blau eingezeichnet. 55 s(t) 2.4 2.2 2.0 1.8 1.6 1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 t Diese Betrachtung legt die folgende De…nition nahe: De…nition 6.1 f sei eine stetige Funktion f : I ! R; wobei I ein o¤enes Intervall in I ist.15 Die Funktion heisst di¤erenzierbar in x 2 I; falls f (x + h) h!0 h lim f (x) df exisitiert. Den Grenzwert bezeichnen wir mit f 0 (x) oder dx (x) : Man nennt ihn den Di¤erentialquotientent im Punkt x; oder die Ableitung von f im Punkt x: Die Ausdrücke der Form f (x+h)h f (x) ; h 6= 0; heissen Di¤erenzenquotienten. Die Funktion heisst di¤erenzierbar auf I; falls sie di¤erenzierbar in jedem Punkt x 2 I ist. Die Funktion heisst stetig di¤erenzierbar auf I; wenn sie di¤erenzierbar auf I ist, und die Ableitung f 0 eine stetige Funktion auf I ist. Der Sinn, in dem der obige Limes verstanden wird, benötigt gewisse Präzisierungen. Der Limes h ! 0 wird entlang von reellen Zahlen 6= 0 genommen, für die selbstverständlich x + h 2 I sein muss. Da wir voraussetzen, dass I ein o¤enes Intervall ist, gilt für jeden Punkt x 2 I dass x + h 2 I ist, sofern h genügend klein ist. Die Einschränkung, 15 Ein Intervall I I = R ist. R heisst o¤en, wenn es von der Form ]a; b[ , ]a; 1[ oder ] 1; b[ ist, oder wenn 56 dass x + h in I sein muss (damit f (x + h) de…niert ist), ist daher nicht von Bedeutung. Etwas anders sähe der Fall aus, wo f auf einem Intervall [a; b] de…niert ist. Dann könnten wir für x = a den Limes a + h ! a nur von rechts, und den Limes b + h ! b nur von links nehmen. Man spricht dann von einer rechtsseitigen bzw. linksseitigen Ableitung. Auf solche Feinheiten wollen wir hier nicht weiter eingehen. Deshalb betrachten wir nur Funktionen, die auf einem o¤enen Intervall (oder ganz R) de…niert sind, bzw. für Funktionen, die auf einem abgeschlossenen Intervall de…niert sind, betrachten wir die Di¤erentialquotienten (in der Regel) nur für Punkte im Inneren des Intervalls. Geometrisch gibt die Ableitung f 0 (x0 ) von f im Punkt x0 die Steigung der Tangente an den Graphen der Funktion im Punkt x0 an. Wir werden später diese Interpretation benützen, um geometrische Eigenschaften von Funktionen zu diskutieren. Die Tangente an den Graphen der Funktion, die durch (x0 ; f (x0 )) geht, ist durch die Funktion x ! f (x0 ) + (x x0 ) f 0 (x0 ) gegeben. Dies ist nämlich die Gerade, die für x0 den Wert f (x0 ) hat und die Steigung f 0 (x0 ) besitzt. Das sollte aus dem Gymnasium bekannt sein. Unten als Beispiel die Funktion f (x) = x3 x mit der Tangente im Punkt (1=4; f (1=4)) ; die rot eingezeichnet ist: 3 2 1 -2.0 -1.5 -1.0 -0.5 0.5 1.0 1.5 2.0 x -1 -2 -3 In Bereichen des De…nitionsbereichs, in denen die Ableitung positiv ist, steigt die Funktion o¤enbar an, während sie dort fällt, wo sie negativ ist. Wir diskutieren einige wichtige Beispiele von Funktionen, in denen sich die Ableitungen leicht berechnen lassen. 57 Beispiel 6.2 f : R ! R sei die identische Abbildung f (x) = x: Da die Di¤erenzenzenquotienten alle gleich 1 sind: f (x + h) f (x) x+h x = = 1; h h folgt f 0 (x) = 1 für alle x: Ebenso einfach ist die Ableitung einer konstanten Funktion f (x) = c: Deren Ableitung ist o¤ensichtlich 0; da der Zähler im Di¤erenzenquotienten stets 0 ist. Beispiel 6.3 (Ableitung von Potenzen) Etwas schwieriger ist der Fall einer ganzzahligen Potenz von x : f (x) = xn ; n 2 N: Wir berechnen f (x + h) mit dem binomischen Lehrsatz: f (x + h) = (x + h)n = n X n k n h x k k : k=0 Subtrahieren wir f (x) = xn ; so fällt der erste Summand weg. Dividieren wir anschliessend durch h 6= 0; so ergibt sich (x + h)n h xn = n X n k h k 1 n k x k=1 n 1 = nx n X n k h + k 1 n k x : k=2 Nun sieht man, dass in den Summanden nach nxn 1 jeder Summand den Faktor h mindestens einmal enthält. Somit strebt dieser Teil gegen 0 mit h ! 0: Wir haben somit gezeigt, dass f (x) = xn stegig di¤erenzierbar ist, mit f 0 (x) = nxn 1 : Beispiel 6.4 Wir können auch negative Potenzen ableiten. Hier das Beispiel f (x) = 1=x. Die Funktion ist für x 6= 0 de…niert. Für x; x + h 6= 0 ist f (x + h) h f (x) 1 1 1 1 x (x + h) = h x+h x h x (x + h) 1 : x (x + h) = = Für h ! 0 geht das gegen 1=x2 : Wir haben also gezeigt, dass d 1 x dx = ist. 58 1 x2 Ist die Funktion f : I ! R auf ganz I di¤erenzierbar, so können wir die Ableitung selbst als Funktion von x auf ganz I au¤assen. Nehmen wir etwa die Funktion f (x) = x2 ; die auf ganz R de…niert ist, so ist die Ableitung die Funktion f 0 (x) = 2x; also eine lineare Funktion. In der Graphik unten sind die beiden Funktionen x ! x2 (durchgezogen) und deren Ableitung x ! 2x (gestrichelt) eingezeichnet: f 0 (x) 20 10 -5 -4 -3 -2 -1 1 2 3 4 5 x -10 Eine wichtige Eigenschaft ist die sogenannte Linearität der Ableitung: Sie besagt, dass die Ableitung von Linearkombinationen von Funktionen gegeben ist durch die Linearkombination der Ableitungen. Hier die genaue Formulierung. Es seien f; g zwei Funktionen I ! R gegeben. Wir de…nieren die Summe der beiden Funktionen durch (f + g) (x) := f (x) + g (x) ; x 2 I: Noch etwas allgemeiner: Sind noch zwei reelle Zahlen a; b 2 R gegeben, so de…nieren wir die Linearkombination durch (af + bg) (x) = af (x) + bg (x) ; x 2 I: Satz 6.5 Sind f; g zwei di¤erenzierbare Funktion I ! R; so ist af + bg di¤erenzierbar, und es gilt (af + bg)0 (x) = af 0 (x) + bg 0 (x) ; x 2 I: Beweis. (af + bg) (x + h) h (af + bg) (x) af (x + h) + bg (x + h) (af (x) + bg (x)) h f (x + h) f (x) g (x + h) g (x) = a +b : h h = 59 Nach Voraussetzung konvergieren für h ! 0 die beiden Summanden auf der rechten Seite gegen af 0 (x) bzw. bg 0 (x) : Nach Satz 4.7 konvergiert die linke Seite daher gegen af 0 (x) + bg 0 (x) : Mit Hilfe dieser Resultate, können wir nun alle Polynome ableiten: Satz 6.6 p (x) = a0 + a1 x + + an xn sei ein Polynom n-ten Grades. Dann ist p0 (x) = a1 + 2a2 x + 3a3 x2 + + nan xn 1 : (Man beachte, dass die Ableitung eines Polynoms n-ten Grades ein Polynom (n Grades ergibt.) 1)-ten Bevor wir weitere Beispiele diskutieren, noch etwas Theorie. Unten sind die zwei wichtigsten Sätze über Di¤erentiation aufgeführt. Satz 6.7 (Produktregel) f; g : I ! R seien zwei stetige und di¤erenzierbare Funktionen. Dann ist das Produkt f g der Funktionen (de…niert durch (f g) (x) := f (x) g (x)) di¤erenzierbar und es gilt (f g)0 = f 0 g + f g 0 : Beweis. Sie x 2 I und h 6= 0: Dann ist (f g) (x + h) h (f g) (x) = = f (x + h) g (x + h) f (x) g (x) h f (x + h) f (x) g (x + h) g (x) + f (x + h) h h g (x) : Für h ! 0 konvergiert der erste Faktor des ersten Summanden gegen f 0 (x) : Im zweiten Summanden konvergiert der erste Faktor gegen f (x) wegen der Stetigkeit von f; und der zweite Faktor gegen g 0 (x) : Somit konvergiert (nach Satz 4.7) der ganze Ausdruck gegen f 0 (x) g (x) + f (x) g 0 (x) : Das zweite wichtige Resultat ist die sogenannte Kettenregel, die beschreibt, wie man Kompositionen von Funktionen di¤erenziert. Satz 6.8 (Kettenregel) Es seien f; g zwei stetige Funktionen f : I ! R; g : J ! R; wobei im (f ) J vorausgesetzt wird. Sind f; g beide di¤erenzierbar, so ist g f : I ! R di¤erenzierbar, und es gilt (g f )0 (x) = g 0 (f (x)) f 0 (x) : Beweis. x sei eine Zahl in I: Für h ! 0 geht, wegen der Stetigkeit von f; auch h0 := f (x + h) f (x) ! 0: (h0 hängt natürlich von x ab, aber wir halten x im Moment fest). (g f ) (x + h) h (g f ) (x) = = g (f (x + h)) g (f (x)) h g (f (x) + h0 ) g (f (x)) f (x + h) h0 h 60 f (x) : Wir setzen hier voraus, dass h0 6= 0 ist, was nicht immer garantiert ist. Wir lassen diese (kleine) Schwierigkeit ausser Betracht. Für h ! 0 geht der erste Faktor (wegen h0 ! 0) gegen g 0 (f (x)) und der zweite Faktor gegen f 0 (x) : Mit Hilfe der Kettenregel können wir nun auch die Quotientenregel herleiten. Sei i (x) := x 1 ; was für x 6= 0 de…niert ist. Die Ableitung von i ist, wie oben in Beispiel 6.4 gesehen, 1=x2 : Ist g eine Funktion, die im De…nitionsbereich 6= 0 ist, so können wir 1=g (x) als 1 = i (g (x)) g (x) schreiben und erhalten nach der Kettenregel g 0 (x) : g (x)2 d 1 = i0 (g (x)) g 0 (x) = dx g (x) Wenden wir die Produktregel an, so können wir auch f (x) =g (x) ableiten: Satz 6.9 (Quotientenregel) Sind f; g zwei di¤erenzierbare Funktionen, so gilt für g (x) 6= 0 f (x) g (x) Beweis. Wir schreiben 0 = f 0 (x) g (x) f (x) g 0 (x) : g (x)2 f (x) 1 = f (x) g (x) g (x) und wenden die Produktregel an: f (x) g (x) 0 0 1 1 + f (x) g (x) g (x) f 0 (x) g 0 (x) f 0 (x) g (x) f (x) g 0 (x) + f (x) = : g (x) g 2 (x) g (x)2 = f 0 (x) = Wir kommen zur Herleitung der Ableitungen einiger wichtiger Funktionen wie log x; ex ; der trigonometrischen Funktion, arcsin; arctan; etc. Zunächst die Logarithmusfunktion, die nur auf der positiven reellen Achse de…niert ist. Wie schon festgelegt wurde, betrachten wir stets den Logarithmus zur Basis e; was nun wichtig ist. e ist de…niert als e = lim n!1 1+ 1 n n : Nach Lemma 5.21 gilt e = lim (1 + h)1=h : h!0 61 (6.1) Für x > 0; h 6= 0 mit x + h > 0 gilt log (x + h) h log x 1 log 1 + = x h=x h x 1 = log x h 1+ x x=h ! : Mit h ! 0 gilt auch h=x ! 0; also mit (6.1) lim h!0 h 1+ x x=h = e: Wegen log e = 1 und der Stetigkeit des Logarithmus folgt lim h!0 log (x + h) h log x = 1 : x Wir haben somit den folgenden Satz hergeleitet: Satz 6.10 Die Ableitung des natürlichen Logarithmus ist die Funktion x ! 1=x: Um die Exponentialfunktion abzuleiten, verwenden wir den folgenden allgemeinen Satz über die Ableitungen von Umkehrfunktionen. Satz 6.11 (Ableitung der Umkehrfunktion) Sei f : I ! R ein stetige Funktion, welche I bijektiv auf I 0 := im (f ) abbildet. Ist x 2 I; y := f (x) und ist f di¤erenzierbar in x mit f 0 (x) 6= 0; so ist die inverse Funktion f 1 : I 0 ! I di¤erenzierbar in y und es gilt 1 0 f (y) = 1 f 0 (x) = 1 f 0 (f 1 (y)) Beweis. Wir beweisen die Di¤ernzierbarkeit von f leitung bloss anhand der Kettenregel: Wegen f 1 1 : nicht, sondern berechnen die Ab- (f (x)) = x folgt h f i (f (x)) f 0 (x) = 1; i h 0 f 1 (y) f 0 (x) = 1: 1 0 Da wir f 0 (x) 6= 0 voraussetzen, folgt die Behauptung. Mit diesem Resultat können wir die Ableitung der Exponentialfunktion auf die Ableitung des Logarithmus zurückführen, die wir schon kennen. Die Logarithmusfunktion f (x) = log x bildet ]0; 1[ bijektiv auf R ab und die Ableitung ist überall 6= 0: Nach dem obigen Satz folgt: 62 Satz 6.12 dey = ey : dy Beweis. ey = f 1 (y) ; also dey 1 = 0 y = ey ; dy f (e ) wegen f 0 (x) = 1=x: Mit Hilfe dieser Resultate können wir unser Beispielreservoir enorm erweitern. Zunächst können wir auch auch eax für a 2 R ableiten. Wir schreiben f (x) := ax, was die Ableitung f 0 (x) = a hat, und erhalten mit der Kettenregel d ax d f (x) e = e = ef (x) f 0 (x) = aeax : dx dx Wir können auch die Gausssche Glockenfunktion x ! e 2x ergibt sich aus der Kettenregel d e dx x2 =e x2 ( 2x) = 2xe x2 x2 (6.2) ableiten. Wegen d dx x2 = : Als Anwendung dieser neuen Ableitungsformeln können wir nun auch f (x) = xa für ein beliebiges a 2 R herleiten. Diese Funktion ist jedoch im allgemeinen nur auf der positiven reellen Achse ]0; 1[ de…niert. Wir schreiben sie als xa = ea log x und erhalten mit der Kettenregel dxa dx = ea log x a = axa 1 d log x 1 = ea log x a dx x (6.3) : Unten sind die Funktion x ! x2=3 und ihre Ableitung zeichnet. 63 2 1=3 3x (gestrichelt) einge- 3 2 1 0 0 1 2 3 4 5 x Nun zu den trigonometrischen Funktionen, zunächst sin (x) : Zunächst eine etwas gewagt Herleitung unter Verwendung der Eulerschen Formel eix = cos (x) + i sin (x) ; die wir noch nicht bewiesen haben. Wegen e ix = cos ( x) + i sin ( x) = cos (x) i sin (x) folgt sin (x) = cos (x) = 1 ix e e ix ; 2i 1 ix e + e ix 2 Verwenden wir nun frecherweise die Formel (6.2) auch für a = i; so erhalten wir d sin (x) dx = = 1 ieix ( i) e ix 2i 1 ix e + e ix = cos (x) ; 2 und analog d cos (x) = sin (x) : dx Da wir diese Ableitungsformeln später bei der Herleitung der Eulerschen Formeln verwenden werden, sollten wir ein anderes Argument angeben. Dazu verwenden wir das Additionstheorem für den Sinus und Kosinus (2.2), woraus sich sin (x + h) sin (x) = 2 cos x + 64 h 2 sin h 2 ergibt. Somit ergibt sich für den Di¤erenzenquotienten: sin (x + h) h sin (x) = cos x + h 2 sin h2 : (h=2) Der erste Faktor auf der rechten Seite konvergiert für h ! 0 gegen cos (x) (wegen der Stetigkeit der Kosinusfunktion) und der zweite nach Lemma 5.22 gegen 1: Somit folgt d sin x = cos x: dx Analog weist man d cos x = dx sin x nach. Für die Ableitung des Tangens verwenden wir tan (x) = sin (x) = cos (x) und die Quotientenregel. Mit dieser können wir den Tangens in Punkten x 2 R; die keine Nullstellen der Kosinusfunktion sind, berechnen, also für x 6= =2; 3 =2; : : : . Dann ist d tan (x) dx = d dx sin x cos x = sin0 (x) cos x sin x cos0 (x) cos2 x + sin2 x = cos2 x cos2 x = 1 + tan2 x: Wir kommen nun noch zu den Ableitungen der Umkehrfunktionen der trigonometrischen Funktionen. Dazu verwenden wir Satz 6.11: Die Sinusfunktion ist eine bijektive Abbildung des Intervalls ] =2; =2[ auf das Intervall ] 1; 1[. Ferner ist die Ableitung der Sinusfunktion, nämlich die Kosinusfunktion, 6= 0 auf ] =2; =2[. Wir können somit Satz 6.11 anwenden und erhalten für die Umkehrfunktion des Sinus: d arcsin (x) dx = = 1 1 = =p sin0 (arcsin x) cos (arcsin x) 1 1 p ; x 2 ] 1; 1[ : 1 x2 1 2 sin (arcsin x) Zur Veranschaulichung wieder die Graphen der Funktion und ihre Ableitung: 65 3.0 2.5 2.0 1.5 1.0 0.5 -1.0 -0.8 -0.6 -0.4 -0.2 0.2 0.4 0.6 0.8 1.0 x -0.5 -1.0 -1.5 Die Funktion arcsin (x) und die Ableitung (gestrichelt) Bemerkung 6.13 Die Sinusfunktion bildet das abgeschlossene Intervall [ =2; =2] auf das abgeschlossene Intervall [ 1; 1] ab. Die Ableitung der Sinsusfunktion ist jedoch = 0 in den Randpunkten =2 und =2; die auf 1 bzw. 1 abgebildet werden. Deshalb können wir Satz 6.11 nicht auf die Ableitung des Arkussinus in den Randpunkten anwenden. Tatsächlich ist dort die Tangentensteigung 1: Anlog für den Arkuskosinus: d arccos (x) = dx p 1 1 x2 : Wir machen das noch für den Arkustangens: Der Tangens bildet das Intervall 2; 2 bijektiv auf R ab. Die Umkehrfunktion davon ist der übliche Arkustangens, der R bijektiv auf 2 ; 2 abbildet. Hier erhalten wir für alle x 2 R d arctan (x) 1 1 1 = = = : dx tan0 (arctan (x)) 1 + x2 1 + tan2 (arctan (x)) Dies gilt für alle x 2 R: Als Zusammenfassung eine Tabelle der Ableitungen der wichtigsten Funktionen: 66 Funktion xa ; a 2 R ex log x sin x cos x tan x arcsin x arccos x arctan x Ableitung axa 1 ; x 2 R falls a 2 N0 ; x 6= 0 falls a < 0; 2 Z; x > 0 sonst. ex 1=x; x > 0 cos x sin x 1 + tan2 x; x 6= 2 ; 32 ; : : : p 1 ; x 2 ] 1; 1[ 1 x2 p 1 ; x 2 ] 1; 1[ 1 x2 1 ; x 2 R: 1+x2 Wir schliessen den Abschnitt mit einem wichtigen, anschaulich evidenten Resultat: Satz 6.14 f : [a; b] ! R sei eine stetige Funktion, die auf ]a; b[ stetig di¤erenzierbar sei. Dann existiert in ]a; b[ ein Punkt mit f0 ( ) = f (b) b f (a) ; a d.h. f (b) = f (a) + (b a) f 0 ( ) : Wir beweisen das hier nicht, sondern veranschaulichen es bloss an einer Zeichnung: p Die Funktion, die unten eingezeichnet ist, ist f (x) = sin x im Intervall [1; 3] : Hier gibt es genau einen Punkt 2 ]1; 3[ ; (numerisch berechnet als = 1:876993) sodass f (3) = f (1) + 2f 0 ( ) ist. In der Graphik eingezeichnet sind neben dem Graphen von f die Tangente in ( ; f ( )) und die parallel verschobene Tangente (gestrichelt), die durch den Punkt (1; f (1)) geht. 1.1 1.0 0.9 0.8 1.0 1.2 1.4 1.6 1.8 2.0 67 2.2 2.4 2.6 2.8 3.0 x Es ist natürlich keinesfalls immer so, dass wie im obigen Beispiel der Punkt 6.14 eindeutig bestimmt ist. Eine einfache Folgerung aus dem Satz ist der folgende: im Satz Satz 6.15 Sei f : [a; b] ! R sei eine stetige Funktion, die stetig di¤erenzierbar in ]a; b[ ist mit f 0 (x) > 0 für alle x 2 ]a; b[ : Dann ist f monoton ansteigend in [a; b] ; d.h. für a x < y b gilt f (x) < f (y) : Analog, wenn f 0 überall negativ ist, so ist die Funktion monoton fallend. Beweis. Wir wenden Satz 6.14 auf das Intervall [x; y] an. Es gibt somit einen Punkt 2 ]x; y[ mit f (y) = f (x) + f 0 ( ) (y x) : Wegen f 0 ( ) > 0 folgt, dass der zweite Summand positiv ist. Somit gilt f (y) > f (x) : 6.2 Höhere Ableitungen Ist f : I ! R stetig di¤erenzierbar, so ist die Ableitung f 0 : I ! R selbst wieder eine stetige Funktion. Wir können daher versuchen, die Funktion f 0 selbst wieder zu di¤erenzieren. De…nition 6.16 Eine stetige Funktion f : I ! R heisst zweimal di¤erenzierbar auf I; wenn die Ableitung f 0 : I ! R di¤erenzierbar auf I ist. Die Ableitung von f 0 heisst die zweite Ableitung f 00 von f: Ist f 00 stetig, so sagt man, f sei zweimal stetig di¤erenzierbar. Man kann in dieser Weise weiterfahren: Ist f 00 wieder di¤erenzierbar, so heisst f dreimal di¤erenzierbar, und man bezeichnet die Ableitung von f 00 mit f 000 : Ist f 000 stetig, so heisst f dreimal stetig di¤erenzierbar. In dieser Weise kann man weiterfahren: Die n-te Ableitung ist die Ableitung der (n 1)-ten Ableitung. Notation 6.17 Für die zweite Ableitung an der Stelle x schreibt man f 00 (x) oder d2 f (x) : dx2 Ab der dritten oder vierten Ableitung schreibt man in der der Regel f (3) (x) oder f (4) (x) anstelle von f 000 (x) bzw. f 0000 (x) ; und für die n-te Ableitung f (n) (x) : Als Di¤erentialquotienten schreibt man es auch16 als dn f (x) : dxn 16 Die Notationen, die im Wesentlichen auf Leibniz zurückgehen, sind formal nicht ganz koscher. Die Ableitungen sind Funktionen. Wenn man x dazu schreibt, so heisst das nach heutigen Masstäben, dass (x) man sie an der Stelle x auswertet. Noch zu Beginn des 20. Jh. haben aber alle Mathematiker f (x) ; dfdx etc. geschrieben und gingen davon aus, dass der Leser klug genug sei, aus dem Kontext zu erkennen, ob die Funktion gemeint ist, oder der Wert der Funktion bzw. der Ableitungen an der Stelle x: Erst in den zweiten Hälfte des 20. Jh. wurde man in dieser Hinsicht pädantischer. Wir wollen das hier jedoch nicht übertreiben. 68 Bemerkung 6.18 In der Physik schreibt man für Ableitungen einer Funktion f der Zeit t üblicherweise f_ für die erste Ableitung und f• für die zweite Ableitung. Diese Schreibweise geht auf Newton zurück. Existieren alle Ableitungen und sind sie stetig, so heisst f unendlich oft stetig di¤erenzierbar. Beispiel 6.19 1. f (x) = ex : Da die erste Ableitung wieder ex ist, so ist klar, dass alle Ableitungen existieren und dn ex = ex dxn gilt. 2. Etwas komplizierter ist f (x) = sin x: Die erste Ableitung ist f 0 (x) = cos x: Dessen Ableitung ist f 00 (x) = sin x: Leitet man nochmals ab, so erhält man für die dritte Ableitung cos x: Bei der vierten wechselt das Vorzeichen und man erhält die Ausgangsfunktion zurück: f (4) (x) = sin x: Fährt man in dieser Weise weiter, so beginnt der Zyklus nun wieder neu. Wir sehen also, dass f (n) (x) = sin x ist, sofern n durch 4 teilbar ist, d.h. wenn n von der Form 4m ist mit m 2 N: Wenn n bei der Division durch 4 Rest 1 hat, so ist f (n) (x) = cos x; bei Rest 2; f (n) (x) = sin x; und bei Rest 3; f (n) (x) = cos x: 3. Noch etwas komplizierter ist f (x) = log x; was für x > 0 de…niert ist, und dort stetig di¤erenzierbar ist. Die erste Ableitung ist d log x 1 = : dx x Leitet man weiter ab, so erhält man d x1 d2 log x = = dxn dx 1 d d3 log x x2 = dx3 dx 1 ; x2 = 2 ; x3 d x23 d4 log x 6 = = : 4 dx dx x4 Man sollte nun sehen, wie es weitergeht: Bei jeder zusätzlichen Ableitung wechselt das Vorzeichen, man erhöht den Exponenten im Nenner, und man multipliziert noch mit dem Exponenten, den man vor der Ableitung hat. Die allgemeine Formel ist somit dn log x (n 1)! = ( 1)n 1 : n dx xn 69 4. Polynome sind wieder ziemlich einfach: Zunächst hat eine konstante Funktion die Ableitung 0: Leitet man weiter ab, so erhält man stets 0: Die nächst komplizierteren Polynome, sind die vom Grad 1 : p (x) = ax + b: Leitet man einmal ab, so erhält man p0 (x) = a und die zweite Ableitung ist 0: D.h. alle Ableitungen nach der ersten sind 0: Quadratische Polynome: p (x) = ax2 + bx + c: Einmal ableiten gibt p0 (x) = 2ax + b; zweimal: p00 (x) = 2a: Ab der dritten Ableitung sind sie gleich 0: Es sollte klar sein, wie das weiter geht: Für ein Polynom vom Grad n vermindert sich bei jeder Ableitung der Grad um 1: Die Ableitungen ab der (n + 1)-ten sind gleich 0: Beispiel 6.20 Die vorangegangen Beispiele sind insofern etwas irreführend, als „typischerweise“ die Ableitungen immer komplizierter werden. Wir betrachten die Gausssche Glockenfunktion x2 f (x) = e : Einmal ableiten ergibt, wie schon gesehen f 0 (x) = 2xe x2 : Leitet man nochmals ab, so erhält man nach der Produktregel 00 f (x) = = dx dx 2 x2 2e e de x 2x dx x2 2x ( 2x) e x2 2 2 + 4x2 e = x2 : Leitet man nochmals ab, so verwendet man wieder die Produktformel. Der erste Faktor 2 ist das Polynom 2 + 4x2 und der zweite Faktor die Ausgangsfunktion e x : Anwendung der Produktregel ergibt: f 000 (x) = 8xe = 12x x2 + 2 + 4x2 ( 2x) e 8x3 e x2 x2 : Man kann nun leicht erraten, wie das im allgemeinen aussieht: Die n-te Ableitung ist ein 2 Polynom n-ten Grades, nennen wir es Hn (x) ; multipliziert mit e x : f (n) (x) = Hn (x) e x2 : Die Polynome Hn (x) sind nicht ganz einfach explizit zu berechnen (für allgemeines n), wir können jedoch leicht eine Formel angeben, wie man Hn+1 (x) aus Hn (x) gewinnt: 2 f (n+1) (x) = = = dHn (x) x2 de x e + Hn (x) dx dx dHn (x) x2 2 e + Hn (x) ( 2x) e x dx dHn (x) 2 + Hn (x) ( 2x) e x : dx 70 Somit ist Hn+1 (x) = dHn (x) dx 2xHn (x) : n (x) ein Polynom vom Grad n 1; und Ist Hn (x) ein Polynom n-ten Grades, so ist dHdx 2xHn (x) ist ein Polynom vom Grad n + 1: Somit ist Hn+1 (x) ein Polynom vom Grad n + 1: Die Polynome Hn (x) nennt man die Hermit-Polynome. Sie spielen in den Naturwissenschaften eine wichtige Rolle, was von der herausragenden Bedeutung der Gaussschen Glockenkurve in der Physik herrührt. 6.3 Die Regel von Bernoulli-l’Hospital Seien f und g zwei Funktionen I ! R: Die Funktion f =g ist in allen Punkten x 2 I de…niert, für die g (x) 6= 0 ist. Manchmal kann man den Quotienten jedoch auch für Nullstellen von g de…nieren, wenn gleichzeitig f dort ebenfalls 0 ist. Sei also x0 2 I mit f (x0 ) = g (x0 ) = 0; jedoch g (x) 6= 0 für x 6= x0 (zumindest in einer kleinen Umgebung von x0 ). Man wird versuchen, f f (x) (x0 ) = lim x!x0 g (x) g zu de…nieren, sofern der Limes existiert. Satz 6.21 (Regel von Bernoulli-l’Hôpital) Sind f; g stetig di¤erenzierbar auf I mit f (x0 ) = g (x0 ) = 0; g (x) 6= 0 für x 6= x0 ; und gilt g 0 (x0 ) 6= 0; so gilt17 f (x) f 0 (x0 ) lim = 0 : x!x0 g (x) g (x0 ) Beweis. Wegen f (x0 ) = 0 folgt aus dem Zwischenwertsatz 6.14, dass für x 6= x0 und eine Zwischenstelle zwischen x0 und x die Gleichung f (x) = f (x) x0 ) f 0 ( ) f (x0 ) = (x gilt. Analog für g : g (x) = (x x0 ) g 0 0 : Die beiden Punkte ; 0 müssen nicht dieselben sein, was uns jedoch nicht weiter stören wird. Jedenfalls erhält man für x 6= x0 f (x) (x = g (x) (x x0 ) f 0 ( ) f0 ( ) = : x0 ) g 0 0 g0 0 17 Die Regel wurde von de l’Hôspital, einem französischen Marquis, erstmals publiziert, der wegen seiner Kurzsichtigkeit den Militärdienst quittierte und sich der Mathematik zuwandte. Sein voller Name ist: Guillaume-François-Antoine Marquis de l’Hôpital, Marquis de Sainte-Mesme, Comte d’Entremont and Seigneur d’Ouques-la-Chaise. De l’Hôpital war ein Schüler Johann Bernoullis. Man weiss heute, dass das Resultat von Bernoulli gefunden wurde, dieser es jedoch für Geld de l’Hôpital zur Publikation überliess, der es 1696 verö¤entlichte. Nach de l’Hôpitals frühem Tod 1704 erhob Bernoulli Anspruch auf die Prioriät, verschwieg jedoch das pekuniäre Arrangement. 71 Für x ! x0 streben auch ; 0 nach x0 und wegen der Stetigkeit der Ableitung konvergieren Zähler und Nenner der rechten Seite gegen f 0 (x0 ) bzw. g 0 (x0 ) : Somit folgt lim x!x0 f (x) f 0 (x0 ) = 0 : g (x) g (x0 ) Beispiel 6.22 Der Grenzwert sin x x kann mit der Regel von l’Hôpital berechnet werden, wobei man allerdings beachten sollte, dass dieser Limes zur Berechnung der Ableitung des Sinus verwendet wurde, sodass es sich streng genommen um ein zirkuläres Argument handelt: lim x!0 sin x = lim x!0 x x!0 lim d sin x dx dx dx cos x = 1: x!0 1 = lim Eine Modi…kation der Regel kann auch für die Auswertung von Ausdrücken der Form verwendet werden. Gelten limx!x0 f (x) = 118 und limx!x0 g (x) = 1; so schreiben wir den Quotienten als 1=g (x) f (x) = g (x) 1=f (x) 1 1 und wenden l’Hôpital auf 1=f (x) und 1=g (x) an (1=g)0 (x) f 2 (x) g 0 (x) g 0 (x) =g 2 (x) = = f 0 (x) =f 2 (x) g 2 (x) f 0 (x) (1=f )0 (x) Nimmt man an, dass q := limx!x0 f (x) =g (x) existiert, so ergibt sich q = lim x!x0 f (x) f 2 (x) g 0 (x) g 0 (x) 2 = lim 2 = q lim ; x!x0 f 0 (x) g (x) x!x0 g (x) f 0 (x) und somit q = lim x!x0 f (x) f 0 (x) = lim 0 g (x) x!x0 g (x) sofern die Grenzwert auf der rechten Seite existiert. Beispiel 6.23 Was ist limx!0 x log x? Das ist ein Ausdruck der Form 0 ( 1) ; aber wir können ihn als log x (1=x) 18 Hier noch eine formale De…nition von limx!x0 f (x) = 1; wenn x0 ein Häufungspunkt des De…nitionsbereichs D ist: Dies bedeutet dass für jede („noch so grosse“) reelle Zahl M ein " > 0 existiert mit f (x) M für alle x 2 D \ [x0 "; x0 + "] : Analog ist limx!x0 f (x) = 1 de…niert. In diesem Sinn gilt limx!0 log x = 1: 72 schreiben, sodass wir einen Ausdruck vom Typus 1 1 erhalten haben. Wenden wir nun l’Hôpital an, so erhalten als Quotienten der Ableitungen d log x dx d(1=x) dx = 1=x = 1=x2 x: Der Limes davon für x ! 0 ist 0: Somit gilt lim x log x = 0 x!0 Falls notwendig, kann man die Regel auch mehrmals anwenden. Wir illustrieren das bloss an einem Beispiel. Beispiel 6.24 Wir untersuchen x tan x 1 cos x für x ! 0: Sowohl Zähler wie Nenner ergeben 0 im Limes. Eimaliges Ableiten von Zähler und Nenner ergibt tan x + x 1 + tan2 x ; sin x was immer noch 0=0 ergibt. Wir können deshalbe l’Hôpital auf diesen Quotienten anwenden. Der Quotient der Ableitungen ergibt 2 1 + tan2 x + 2x tan x 1 + tan2 : cos x Nun x = 0 eingesetzt ergibt 2: Also x tan x = 2: x!0 1 cos x lim 6.4 Geometrische Anwendungen Wie schon oben erwähnt, zeigt das Vorzeichen der Ableitung einer Funktion an, wo die Funktion steigt und wo sie fällt. Hier noch ein Beispiel graphisch dargestellt. Schwarz durchgezogen ist die Funktion und rot gestrichelt die Ableitung. 73 y 3 2 1 -3 -2 -1 1 2 3 x -1 -2 -3 Man sieht, dass die Funktion ansteigt in Bereichen, wo die Ableitung positiv ist, und abfällt, wo die Ableitung negativ ist. Dies impliziert o¤ensichtlich, dass an Extremalstellen der Funktion die Ableitung gleich 0 ist. Wir präzisieren die Begri¤e: Sei f : D ! R eine Funktion, wobei D eine (im Moment beliebige) Teilmenge von R ist. De…nition 6.25 Sei x0 2 D: a) Die Funktion f nimmt in x0 ihr Maximum an, wenn f (x0 ) f (x) für alle x 2 D gilt. f nimmt in x0 ihr Minimum an, wenn f (x0 ) f (x) für alle x 2 D gilt. b) f hat ein lokales Maximum in x0 ; falls ein " > 0 existiert, sodass f (x0 ) f (x) für alle x 2 D \ [x0 "; x0 + "] gilt. Analog wird ein lokales Minimum de…niert. Manchmal spricht man bei einem Maxiumum auch von einem globalen Maximum um zu betonen, dass es sich nicht bloss um ein lokales Maximum handelt. Wenn man nicht spezi…ziert, ob es sich um ein Minimum oder Maximum handelt spricht man von einem Extremum. 74 Beispiel 6.26 Sei f (x) = x3 x: Hier der Graph y 10 8 6 4 2 -3 -2 -1 1 -2 2 3 x -4 -6 -8 -10 Die Funktion hat kein globales Es gibt jedoch ein p Maximum und kein globales Minimum. p lokales Maximum (bei 1= 3) und ein lokales Minimum (bei 1= 3). Schränkt man die Funktion auf das Intervall [ 2; 2] ein, so hat sie ein Minimum bei 2 und ein Maximum bei 2: An dem Beispiel sieht man, dass eine Funktion keine globalen Extrema besitzen muss. Es gilt jedoch: Satz 6.27 Sei f : [a; b] ! R eine stetige Funktion, wobei 1 < a < b < 1 ist. Dann hat die Funktion ein globales Maximum und ein globales Minimun, d.h. es existieren Punkte x0 ; y0 2 [a; b] mit f (x0 ) f (x) f (y0 ) für alle x 2 [a; b] : Lokale Extrema kann man über die Ableitung …nden, sofern die Funktion stetig di¤erenzierbar ist, und die Extremalstellen nicht am Rand des De…nitionsbereichs sind. Wir setzen nachfolgend voraus, dass f auf einem Intervall I de…niert ist, wobei I = R zugelassen ist. Der folgende Satz ist anschaulich evident: Satz 6.28 Sei die Funktion f : I ! R stetig auf I, und stetig di¤erenzierbar auf dem Inneren von I. Ist ein innerer Punkt x0 ein lokales Maxiumum oder ein lokales Minium, so gilt f 0 (x0 ) = 0: Beweis. Wir verzichten auf einen detaillierten Beweis. Die Aussage folgt aus dem Zwischenwertsatz 6.14. 75 De…nition 6.29 Ist f eine Funktion wie oben, so heisst ein innerer Punkt x0 kritischer Punkt von f; falls f 0 (x0 ) = 0 gilt. Lokale Extrema in inneren Punkten sind stets kritische Punkte, jedoch sind nicht alle kritischen Punkte lokale Extrema. Ob ein kritischer Punkt ein lokales Extrema ist lässt sich „meist“ an der zweiten Ableitung in diesem Punkt entscheiden, ebenso wie die Frage, ob es sich gegebenenfalls um ein Maximum oder ein Minimum handelt. Satz 6.30 Sei f zweimal di¤erenzierbar im Inneren des De…nitionsbereichs. Ist x0 ein (innerer) kritischer Punkt so gilt: a) Ist f 00 (x0 ) > 0; so hat f in x0 ein lokales Minimum. b) Ist f 00 (x0 ) < 0; so hat f in x0 ein lokales Minimum. Wir beweisen das ebenfalls nicht. Die Sache ist jedoch plausibel. Ist f 00 (x0 ) > 0 aber = 0; so ist die Ableitung links von x0 negativ und rechts von x0 positiv. Die Funktion selbst fällt also links von x0 und steigt rechts von x0 an. Die Funktion hat somit ein lokales Minimum in x0 : Analog argumentiert man im Fall b). Hier ein Beispiel: f 0 (x0 ) Beispiel 6.31 Wir betrachten die Funktion sin x + x=2 auf dem Intevall [0; 2 ] : Wir bestimmen erst alle kritischen Punkte. Dies sind die Lösungen von cos x + 1=2 = 0: Der Kosinus ist 1=2 bei =2 + =6 = 2 =3 und bei 4 =3: Dies sind also die kritischen Punkte im Innern des Intervalls. Die zweite Ableitung ist sin x; was negativ bei 2 =3 und positiv bei 4 =3 ist. Bei 2 =3 hat die Funktion also ein lokales Maximum und bei 4 =3 ein lokales Minimum. Da es keine anderen kritischen Punkte gibt, so sind dies die einzigen lokalen Extrema in ]0; 2 [ : Die Funktionswerte in diesen Punkten sind: p 2 3 sin + = + 1:913222 3 3 2p 3 4 2 3 2 sin + = + 1:228369: 3 3 2 3 An den Randpunkten 0; 2 sind die Funktionswerte 0 und : Da grösser ist als das lokale Maximum, so ist das globale Maximum im Randpunkt 2 . Analog sieht man, dass das Minimum bei 0 ist. Hier ist der Graph der Funktion: 76 3 2 1 0 1 2 3 4 5 6 x -1 Kritische Punkte brauchen keine lokalen Extrema zu sein. Hier das Standardbeispiel: Beispiel 6.32 f (x) = x3 : Die Ableitung ist 3x2 : f hat also den einen kritischen Punkt 0; der jedoch kein lokales Extrema ist. In der Tat ist auch die zweite Ableitung 6x im Nullpunkt gleich 0; sodass Satz 6.30 nichts hergibt. Hier das Schema nach dem man für eine stetig di¤erenzierbare Funktion f , die auf einem Intervall I de…niert ist, die Extrema sucht. Man bestimmt alle kritischen Punkte im Inneren des Intevalls. Anhand der zweiten Ableitung eruiert man, ob es sich um lokale Maxima oder Minima handelt.19 Hat der De…nitionsbereich Randpunkte, so wertet man die Funktion an diesen Punkten aus. In der Regel sind Randpunkte lokale Extrema. (Dies ist jedoch nicht immer richtig. Z.B. hat die in Beispiel 5.20 b) diskutierte Funktion x sin (1=x) ; die auf dem Intervall [0; 1[ stetig ist, sofern man den Funktionswert im Nullpunkt gleich 0 setzt, und im Inneren di¤erenzierbar ist, in 0 kein lokales Extremum). Man vergleicht dann die lokalen Maxima um das globale Maximum zu bestimmen, falls es exisitiert. Man muss sich jedoch klar darüber sein, dass globale Extrema nicht immer existieren, selbst wenn es lokale Extrema gibt. Das Beispiel 6.26 z.B. hat ein lokales Maximum und ein lokales Minimum, jedoch keine globalen Extrema. 19 Ist die zweite Ableitung in einem kritischen Punkt ebenfalls gleich 0; so hat man Pech gehabt und kann zunächst nicht entscheiden, ob es sich um ein lokales Maximum oder lokales Minimum handelt, oder um gar keinen lokalen Extremalpunkt wie im obigen Beispiel. Unter Umständen kann dies anhand von höheren Ableitungen entschieden werden. Wir gehen hier auf diese Schikanen nicht weiter ein. 77 Schränkt man diese Funktion p auf das Intervall [ 2; 2] ein, so hat sie zwei lokale p Maxima, nämlich bei 1= 3 und bei 2; und zwei lokale Minima, nämlich bei 1= 3 und bei 2: Die lokalen Extrema in den Randpunkten sind globale. Die zweite Ableitung hat ebenfalls eine einfache geometrische Interpretation, die wir oben schon ausgenützt haben. Ist die zweite Ableitung f 00 einer Funktion f positiv, so bedeutet dies ja, dass die erste Ableitung, welche die Steigung der Tangente angibt, ansteigt. Dies bedeutet also, dass die Funktion nach rechts steiler wird. Unten ein Beispiel graphisch dargestellt mit rot gestrichelt die zweite Ableitung. 2 1 -0.5 -0.4 -0.3 -0.2 -0.1 0.1 0.2 0.3 0.4 0.5 x -1 Gibt f die zurückgelegte Strecke als Funktion der Zeit an, so liegt eine Beschleunigung vor. Für den Graphen der Funktion bedeutet es, dass dieser eine „Linkskurve“ beschreibt. Analog: Wenn die zweite Ableitung negativ ist, so fällt die Steigung ab, was für den Graphen bedeutet, dass er eine „Rechtskurve“ beschreibt.20 Interessant sind die speziellen Punkte (x0 ; f (x0 )) auf dem Graphen, wo der Graph von einer Rechts- in eine Linkskurve übergeht, oder umgekehrt. Man nennt solche Punkte Wendepunkte. In Wendepunkten wechselt die zweite Ableitung das Vorzeichen. Ist die zweite Ableitung stetig, was wir hier stets voraussetzen wollen, so muss die zweite Ableitung in Wendepunkten gleich 0 sein. Hier noch eine andere Interpretation eines Wendepunktes. Wir betrachten dazu die Tangente im Punkt (x0 ; f (x0 )) ; welche wie schon beschrieben, als Graph der Funktion tx0 (x) = f (x0 ) + (x x0 ) f 0 (x0 ) beschrieben wird. In einem Wendepunkt liegt der Funktionswert f (x) für x in einer genügend kleinen Umgebung von x0 links von x0 oberhalb der Tangente und rechts 20 Man nennt Funktionen, die auf einem Intervall de…niert sind, und deren zweite Ableitung überall positiv ist, konvex. Wenn die zweite Ableitung negativ ist, so nennt man sie konkav. 78 unterhalb, oder umgekehrt. Wir fassen diese Betrachtungen in einer formalen De…nition zusammen. De…nition 6.33 f sei auf dem Intervall I de…niert und im Inneren stetig di¤erenzierbar. Ein innerer Punkt x0 ist ein Wendepunkt der Funktion, falls ein " > 0 existiert mit (f (x) tx0 (x)) (f (y) tx0 (y)) < 0 für alle x 2 ]x0 "; x0 [ und alle y 2 ]x0 ; x0 + "[ ; d.h. wenn f (x) tx0 (y) unterschiedliche Vorzeichen haben für diese x; y: tx0 (x) und f (y) Satz 6.34 Sei f : I ! R zweimal stetig di¤erenzierbar im Inneren von I und sei x0 ein innerer Punkt von I: Dann gelten die folgenden Aussagen: a) Ist x0 ein Wendepunkt, so gilt f 00 (x0 ) = 0: b) Ist f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0; so ist x0 ein Wendepunkt. Hier ein Bild für die Funktion f (x) = x3 3x2 + x 1: Die Funktion hat einen Wendepunkt bei x = 1: Rot gestrichelt ist die Tangente in x = 1 eingezeichnet. y 5 4 3 2 1 -1.0 -0.5 0.5 1.0 -1 1.5 2.0 2.5 3.0 x -2 -3 -4 -5 Die zweite Ableitung ist 6x 6 und die dritte ist 6: Die Funktion hat somit genau einen Wendepunkt bei 1: Man muss sich klar darüber sein, dass f 00 (x0 ) nicht notwendigerweise impliziert, dass x0 ein Wendepunkt ist. Hier das Beispiel der Funktion f (x) = x4 : 79 80 70 60 50 40 30 20 10 -3 -2 -1 0 1 2 3 x Die zweite Ableitung ist 12x2 ; ist also 0 im Nullpunkt. Trotzdem hat die Funktion keinen Wendepunkt. Die dritte Ableitung ist 24x; ist also ebenfalls gleich 0 im Nullpunkt, sodass wir b) im obigen Satz nicht anwenden können. In der Tat hat die Funktion ein Minimum in 0:21 21 In Fällen, wo man Satz 6.30 und Satz 6.34 b) nicht anwenden kann, kann man durch die Analyse höherer Ableitungen in der Regel entscheiden, ob Extremalpunkte bzw. Wendepunkte vorliegen. Wir gehen jedoch nicht weiter darauf ein. 80 7 Integration Die Integration dient zur Berechnung von Flächen, die durch Kurven berandet sind. Später diskutieren wir auch Volumen von Körpern. 7.1 Das bestimmte Integral und die Stammfunktion Seien 1 < a < b < 1 und f eine Funktion [a; b] ! R, wobei wir (im Moment) voraussetzen, dass f (x) 0 für alle x 2 [a; b] gilt. (Wir werden diese Voraussetzung gleich aufgeben). Das bestimmte Integral Z b f (x) dx a ist de…niert als die Fläche zwischen der x-Achse und dem Graphen der Funktion f über dem Intervall [a; b] : R3 p Als Beispiel ist hier die Funktion f (x) := sin x + x eingezeichnet. 1 f (x) dx ist die Fläche des rotumrandeten Gebietes. 2.0 1.5 1.0 0.5 0.0 0 1 2 3 4 5 x Mathematisch wird das Integral als Grenzwert von zusammengesetzten Rechtecks‡ächen de…niert. Dazu teilt man das Intervall [a; b] in 2n Teilintervalle auf: Ist l = b a die Länge des Intevalls, so betrachtet man die Intervalle I1 := a; a + l l 2l ; I2 = a + n ; a + n ; : : : ; I2n := b n 2 2 2 l ;b ; 2n welche alle die Länge l2 n haben. Im Intervall Ik betrachtet man den minimalen und den maximalen Funktionswert mk := inf f (x) ; Mk := sup f (x) : x2Ik x2Ik 81 O¤ensichtlich ist die Fläche des Rechtecks mit Grund‡äche Ik und Höhe mk kleiner oder gleich der Fläche unterhalb des Graphen, die wiederum kleiner oder gleich der Fläche des Rechtecks mit Grund‡äche Ik und Höhe Mk ist. Die Fläche dieser beiden Rechtecke ist mk l2 n bzw. Mk l2 n : Die Summe dieser Rechtecks‡ächen bezeichnet man als die Unter- bzw. Obersummen: n Un (f ) := 2 X mk l2 n Mk l2 n ; k=1 bzw. n On (f ) := 2 X : k=1 p Im Graphen unten ist wieder die Funktion f (x) = sin x + x dargestellt, mit der Fläche für die Untersumme mit a = 1; b = 3; wie zuvor, und n = 4: 2.0 1.5 1.0 0.5 0.0 0 1 2 3 4 5 x Die Untersumme ist die Summe der Flächen der rot eingezeichneten Rechtecke. Wenn n um 1 erhöht wird, so halbiert sich einfach die Basis der Rechtecke und die Anzahl der Rechtecke verdoppelt sich. Es ist daher evident, dass die Untersummen mit n ansteigen und die Obersummen mit n fallen: Un (f ) Un+1 (f ) On+1 (f ) On (f ) : Wegen dieser Monotonieeigenschaft konvergiert sowohl die Folge der Untersummen, wie die Folge der Obersummen: U[a;b] (f ) := lim Un (f ) ; O[a;b] (f ) := lim On (f ) : n!1 n!1 82 De…nition 7.1 Die Funktion f heisst Riemann-integrierbar auf dem Intervall [a; b] ; falls U[a;b] (f ) = O[a;b] (f ) gilt. Der gemeinsame Limes ist das bestimmte Integral Z b f (x) dx; a das man auch Riemann-Integral nennt. a heisst die obere Integrationsgrenze, b die untere. Die Variable x nennt man auch die Integrationsvariable. Bemerkung 7.2 Aus dieser De…nition entnimmt man leicht, dass Z a f (x) dx = 0 a ist. Das Gebiet, dessen Fläche man betrachtet, ist ja nur ein „Strich“, hat also die Fläche 0: Für die De…nition des Riemann-Integrals spielt es keine Rolle, ob f auch negative Werte annimmt. Man beachte jedoch, dass in Bereichen, wo f negativ ist, die Fläche zwischen der x-Achse und dem Graphen negativ gezählt wird. Eine weiter Konvention: In der De…nition wird zunächst vorausgesetzt, dass a < b ist. Für a > b de…niert man Z b Z a f (x) dx = f (x) dx: a b Ein Beispiel: Ohne irgendwelche Theorie sieht man aus der De…nition, dass Z 2 sin x dx = 0 0 ist, denn die Fläche unter dem positiven Teil ist o¤ensichtlich gleich gross, wie die unter dem negativen Teil. Satz 7.3 Rb Ist f stetig und [a; b] ein endliches Intervall, so existiert das Riemann-Integral a f (x) dx Bemerkung 7.4 Die Funktion f muss nicht notwendigerweise stetig sein, damit das Integral existiert. Ein Beispiel ist etwa die Funktion f (x) := 1 fu •r x 0 : 0 fu •r x < 0 Rb Hier ist für a < b das Integral a f (x) dx natürlich einfach die Länge von [a; b] \ [0; 1[ : Ganz allgemein: Wenn die Funktion f stetig ist bis auf endlich viele Sprungstellen (keine Rb Pole), so ist a f (x) dx de…niert. Hat f Pole im Intervall [a; b], so hängt es von den genauen Eigenschaften der Pole ab, ob das Integral existiert. Wir diskutieren das später. 83 Die grundlegende Idee, Flächen, die durch gekrümmte Kurven begrenzt sind, durch Ausschöpfen mit einfacheren geometrischen Objekten zu bestimmen, stammt von Archimedes (287-212 vuZ). Er hat sie verwendet, um die Fläche des Kreises und die Fläche unter einer Parabel zu berechnen. Die nächste wirklich grundlegende Idee zu dem Thema stammt von Isaac Newton (1643-1727) und Gottfried Wilhelm Leibniz (1646-1716), die entdeckt haben, dass Integration gewissermassen die Umkehroperation zur Di¤erentiation ist.22 Die Idee war, das Integral als Funktion der oberen Grenze zu betrachten und nach Eigenschaften dieser Funktion zu suchen. Gegeben eine Funktion f; so de…nieren wir Z x f (y) dy: F (x) = a Das wir x für die Variable in F verwenden, müssen wir die Integrationsvariable in f umbenennen. Wir gehen nachfolgend davon aus, dass f auf einem Intervall de…niert und stetig ist. Dann ist F (x) für jedes x im De…nitionsbereich de…niert. F hängt natürlich auch noch von a ab, was wir im Moment nicht weiter berücksichtigen. Satz 7.5 Unter den obigen Voraussetzungen ist F stetig di¤erenzierbar in x und es gilt dF (x) = f (x) : dx Beweis. Der Einfachheit halber nehmen wir im Moment an, dass h > 0 gilt. Dann ist F (x + h) F (x) die Fläche unter der Kurve f über dem Intervall [x; x + h] : Die Fläche wird negativ gerechnet, wenn f negativ ist. Diese Fläche ist h sup f (y) y2[x;x+h] und h inf y2[x;x+h] f (y) : Mithin ist F (x + h) h F (x) supy2[x;x+h] f (y) : inf y2[x;x+h] f (y) 22 Über die Priorität der Entdeckung hat es erbitterte Gefechte gegeben. Erwiesen ist, dass Newton die grundlegenden Fakten vor Leibniz gefunden hatte, diese jedoch zunächst nicht publizierte sondern nur in Briefen kommunizierte. Leibniz verö¤entlichte seine Ergebnisse jedoch vor Newton. Soweit ist die Sachlage klar. Ebenso klar ist, dass der Formalismus von Leibniz dem von Newton überlegen war, was für die weitere Entwicklung der Theorie von grosser Bedeutung war. Kontrovers diskutiert wird jedoch nach wie vor, ob Leibniz Kenntnis von den Entdeckungen Newtons hatte. Heute gilt es als ziemlich gesichert, dass Leibniz wenigstens teilweise über die Ideen von Newton orientiert war. Die Kontroverse ist auch durch eine Untersuchung der Royal Society angeheizt worden, die zum Schluss kam, dass Leibniz die Ideen von Newton gestohlen hatte. Allerdings hatte Newton selbst an der Untersuchung mitgewirkt. 84 Da wir voraussetzen, dass f stetig ist, folgt lim sup f (y) = f (x) ; lim inf f (y) = f (x) : h!0 y2[x;x+h] h!0 y2[x;x+h] Somit ergibt sich lim h#0 F (x + h) h F (x) = f (x) : Man überlegt sich leicht, dass diese Gleichung auch gilt, wenn h " 0 von der negativen Seite her erfolgt. Die Aufgabe, F zu bestimmen läuft also darauf hinaus, F so zu bestimmen, dass F 0 (x) = f (x) ist. Gleichungen für eine unbekannte Funktion, hier F; in die F 0 (oder auch die höheren Ableitungen) eingehen, nennt man Di¤erentialgleichungen. De…nition 7.6 Gegeben eine Funktion f; so heisst eine Funktion F; die die Gleichung F 0 = f erfüllte eine Stammfunktion von f: Wie wir R x oben gesehen haben, …nden wir eine Stammfunktion von f indem wir das Integral a f (y) dy als Funktion von x betrachten, wobei a beliebig ist. Wieviele Stammfunktionen einer Funktion f kann es geben? Ist F eine Stammfunktion von f; so ist auch F + C eine Stammfunktion, wo C 2 R eine beliebige Konstante ist. Dies ergibt sich einfach daraus, dass die Ableitung einer Konstanten gleich 0 ist und mithin (F + C)0 = F 0 = f: Man fragt sich, ob es noch andere Möglichkeiten gibt, Stammfunktionen von f zu erhalten. Die Antwort ist: Nein. Zumindest dann nicht, wenn f auf einem Intervall de…niert ist: Satz 7.7 Ist f auf einem Intervall I de…niert, so unterscheiden sich zwei Stammfunktionen von f bloss durch eine Konstante. Beweis. Die Behauptung ergibt sich aus dem Zwischenwertsatz: Sind F und F^ zwei Stammfunktion von f; so erfüllt G := F F^ die Gleichung G0 = F 0 F^ 0 = f f = 0: Für zwei Zahlen s; t 2 I mit s < t ergibt sich aus dem Zwischenwertsatz G (t) G (s) = (t s) G0 ( ) mit einer Zahl 2 [s; t] ; die uns nicht weiter interessiert, da ohnehin einfach G0 ( ) = 0 gilt. Somit ist stets G (t) G (s) = 0; d.h. G (t) = G (s) : Die Funktion G nimmt also auf allen Punkten des Intervalls den gleichen Wert an, ist also eine Konstante. 85 Wir diskutieren nun noch genau den Zusammenhang zwischen Stammfunktion und bestimmtem Integral. Wir setzen voraus, dass f auf einem Intervall I de…niert ist. Wir haben schon gesehen, dass für a 2 I die Funktion Z x f (y) dy x 7! a eine Stammfunktion ist. Sei nun umgekehrt F eine beliebige Stammfunktion, so ist Z x F (x) f (y) dy a die Di¤erenz zweier Stammfunktionen, ist also eine Konstante C : Z x f (y) dy = C: F (x) a Um die Konstante zu bestimmen, setzen wir x = a ein und erhalten Z a f (y) dy = C: F (a) a Da das Integral Resultat gezeigt: Ra a gleich 0 ist, ergibt sich C = F (a) : Wir haben somit das folgende Satz 7.8 Ist F eine beliebige Stammfunktion von f; so gilt für a; b Z b f (y) dy = F (b) F (a) : a Notation 7.9 1. Statt F (b) F (a) schreibt man auch oft F (x)jbx=a ; obwohl es eigentlich nicht einfacher ist. R 2. Die „allgemeine“ Stammfunktion schreibt man in der Regel mit f (x) dx; d.h. mit dem Integralzeichen ohne Angabe der Integrationsgrenzen. Man bezeichnet das auch als das unbestimmte Integral. Man muss sich jedoch klar darüber sein, dass eine Stammfunktion nur bis auf eine Konstante eindeutig de…niert ist. Ein Beispiel dazu. Eine Stammfunktion von f (x) = x ist o¤ensichtlich x2 =2; denn die Ableitung dieser Funktion ist x: Jedoch ist auch x2 =2 + C für ein beliebiges C eine Stammfunktion. In vielen Textbüchern wird deshalb Z x2 x dx = +C 2 86 geschrieben. Wir machen das hier nicht, um eine In‡ation von C’s zu vermeiden, sondern schreiben einfach Z x2 x dx = ; 2 merken uns aber, dass wir immer eine beliebige Konstante zu der rechten Seite addieren können. Eine grundlegende Eigenschaft der Integration ist ähnlich wie bei der Di¤erentiation die Linearität: Satz 7.10 Sind f; g zwei integrierbare Funktionen I ! R und sind a; b 2 R; so ist af +bg integrierbar und es gilt Z Z Z (af (x) + bg (x)) dx = a f (x) dx + b g (x) dx und entsprechend auch für die bestimmten Integrale. Beweis. Wir müssen zeigen, dass die rechte Seite der Gleichung eine Stammfunktion von af + bg ist. Das ergibt sich sofort aus der Linearität der Ableitung. Eine für bestimmte Integrale oft verwendete Variante der Linearität ist die folgende: Satz 7.11 Seien a < b < c und f sei auf [a; c] integrierbar. Dann gilt Z c Z b Z c f (x) dx = f (x) dx + f (x) dx: a a b Leider gibt es keinen systematischen Kalkül um Stammfunktionen zu …nden; in vielen Fällen kann man sie jedoch erraten. Es gibt weiter einige Tricks, auf die wir unten kommen werden. Hier die Fälle, die man einfach aus den entsprechenden Di¤erentiationsregeln erraten kann: Potenzen: Für a 6= 1 gilt Z 1 xa dx = xa+1 ; a+1 denn die Ableitung der rechten Seite ergibt xa ; wie wir wissen. Der De…nitionsbereich von xa ist R falls a 2 N ist, Rn f0g ; falls a ganzzahlig aber negativ (6= 1) ist und ]0; 1[ in den anderen Fällen. Polynome: Aus der Integration von Potenzen und der Linearität ergibt sich Z a1 an n+1 (a0 + a1 x + + an xn ) dx = a0 x + x2 + + x 2 n+1 Als Beispiel betrachten wir die nach unten geö¤nete Parabel 1 x2 ; die zwischen und 1 positiv ist. Die Fläche unter diesem postiven Teil der Parabel ist Z 1 1 x3 1 1 4 2 1 x dx = x =1 1+ = ; 3 3 3 3 1 x= 1 87 1 was schon Archimedes wusste. Integration von x 1 : Hier muss man etwas aufpassen. Die Funktion ist für x = 0 nicht de…niert, jedoch sowohl für postive x; wie für negative. Betrachten wir zunächst die Funktion für postive x: Dann ist eine Stammfunktion log x; denn die Ableitung des Logarithmus ist 1=x: Was macht man für negative x; wo 1=x ebenfalls de…niert ist, aber der Logarithmus nicht? Der Trick: Man nimmt einfach log ( x) : Dessen Ableitung ist nach der Kettenregel d log ( x) 1 1 = ( 1) = : dx x x Somit erhalten wir Z 1 dx = log jxj : x Hier gibt es noch eine Schikane: Die Funktion f (x) = 1=x ist ja nicht auf ganz R de…niert, sondern nur für x 6= 0; d.h. auf den beiden Intervallen ]0; 1[ und ] 1; 0[ : Streng genommen müssen wir daher von zwei Stammfunktionen sprechen, die eine für den Bereich ]0; 1[ und die andere für den Bereich ] 1; 0[ : In der Tat können wir für diese Bereiche auch unterschiedliche Konstanten wählen. So ist etwa F (x) = log x fu •r x > 0 log ( x) + 100 f u •r x < 0 eine Stammfunktion von 1=x; denn o¤ensichtlich erfüllt sie F 0 (x) = 1=x für alle x im De…nitionsbereich. Exponentialfunktion: Natürlich gilt Z ex dx = ex : Eine kleine Modi…kation ergibt für a 2 R; a 6= 0 Z 1 eax dx = eax : a Trigonometrischen Funktione: Die Stammfunktionen von Sinus und Kosinus sind einfach: Z sin x dx = cos x; Z cos x dx = sin x: Der Tangens ist schon tückischer. Wir werden sein Integral später berechnen. Aus den Formeln ergibt sich z.B. die Fläche unter dem positiven Bauch der Sinusfunktion, d.h. auf dem Intervall [0; ]: Z sin x dx = cos xx=0 = cos + cos 0 = 2: 0 88 Logarithmus: Hier muss man etwas …ndig sein. Zunächst bemerkt man, dass x log x es „fast“ tut: Nach der Produktregel gilt d (x log x) d log x x = log x + x = log x + = log x + 1: dx dx x Wegen der Linearität der Ableitung gilt somit d (x log x dx also Z x) = log x + 1 log x dx = x log x 1 = log x; x: Hier eine etwas überraschende Anwendung. Der Logarithmus ist ja negativ für x < 1 und hat einen Pol bei x = 0: Wir können versuchen, die Fläche unter diesem negativen Teil zu berechnen, wobei zunächst nicht klar ist, ob diese endlich ist. Für eine positive Zahl " > 0 existiert die Fläche zwischen " und 1 : Z 1 log x dx = 1 log 1 1 (" log ") + " " = 1 (" log ") + ": Was passiert nun mit " ! 0? Wie wir schon als Anwendung der Regel von l’Hôpital gesehen hatten, gilt lim"!0 " log " = 0: Es gilt somit Z 1 lim log x dx = 1: "!0 " Die Fläche wird hier negativ gerechnet, da die Funktion selbst in dem betrachteten Bereich negativ ist. Die Fläche unter der Logarithmusfunktion zwischen x = 0 und x = 1 ist also endlich, obwohl die Funktion selbst einen Pol hat. Zum Schluss dieses Abschnitts noch Abschätzungen, die wir später benötigen. Lemma 7.12 a) Sind f und g im Intervall [a; b] integrierbar und gilt f (x) so gilt Z b Z b f (x) dx g (x) dx: a g (x) für alle x 2 [a; b] ; a b) Ist f auf dem Intervall [a; b] integrierbar, so ist jf j integrierbar und es gilt Z b f (x) dx Z a a 89 b jf (x)j dx: Beweis. a) folgt aus der De…nition des Riemann-Integrals, denn aus f g auf dem ganzen Intervall folgt, dass auch die Unter- wie die Obersummen die gleiche Ungleichung erfüllen. In b) zeigen wir nicht, dass jf j integrierbar ist. Die Ungleichung selbst folgt jedoch sofort aus a), denn es gelten f jf j und f jf j auf dem ganzen Intervall, woraus sich Z Z b f (x) dx Z jf (x)j dx a a und b b f (x) dx = Z b ( f (x)) dx ergeben, woraus die Behauptung folgt. 7.2 b a a a Z jf (x)j dx Zwei Integrationsmethoden: Partielle Integration und Substitution Die grundlegenden Regeln über Di¤erentiation führen auf entsprechende Regeln für die Integration. Wir betrachten zunächst die Produktregel: Seien f; G zwei di¤erenzierbare Funktionen mit Ableitungen f 0 ; G0 = g: Nach der Produktregel ist (f G)0 = f 0 G + f g: Integriert ergibt das fG = Wir erhalten somit: Z 0 f G dx + Z f g dx: Satz 7.13 (Partielle Integration) f sei eine di¤erenzierbare Funktionen, und g sei integriebar, beide de…niert auf einem Intervall. G sei eine Stammfunktion von g: Dann gilt a) f G R f 0 G dx ist eine Stammfunktion von f g: b) Für a < b (im De…nitionsbereich) gilt Z b f (x) g (x) dx = [f (b) G (b) a f (a) G (a)] Z b f 0 (x) G (x) dx: a Die Formel ist in folgender Situation nützlich: Gegeben seien f und g und man möchte f gdx bestimmen. Angenommen, man kennt eine Stammfunktion von g; nämlich G, und ist imstande f 0 G zu integrieren, dann kann man auch f g integrieren. Besser als viel Theorie sieht man das an einer Reihe von Beispielen: R 90 Beispiel 7.14 1. Z x sin x dx: Wir kennen eine Stammfunktion von sin x; nämlich cos x: Ebenso kennen wir natürlich die Ableitung von x; nämlich 1: Wir nehmen also f (x) = x; g (x) = sin x; d.h. G (x) = cos x: Also ergibt sich Z Z x sin x dx = x cos x ( cos x) dx Z = x cos x + cos xdx R Da wir auch cos x integrieren können: cos x dx = sin x; so erhalten wir Z x sin x dx = x cos x + sin x: 2. Z ex sin x dx: Hier versuchen wir f (x) = ex ; g (x) = sin x: Dann ist G (x) = Z Z x x e sin x dx = e cos x + ex cos x dx: cos x: Man sieht nicht recht, was man gewonnen hat, aber wir wenden dasselbe nochmals auf den zweiten Summanden an. Eine Stammfunktion von cos x ist sin x : Z Z x x e cos x dx = e sin x ex sin x dx: Zusammen also Z x e sin x dx = Daraus ergibt sich Z x x e cos x + e sin x 1 ex sin x dx = ex (sin x 2 Z ex sin x dx: cos x) : 3. f (x) = sin2 (x) : Am einfachsten ist es, man verwendet die Beziehung: sin2 x = 1 1 2 2 cos 2x; aber wir wollen uns das Leben nicht so einfach machen und verwenden partielle Integration mit sin2 x = cos0 x sin x : Z Z 2 sin x dx = cos x sin x + cos2 x dx Z = cos x sin x + 1 sin2 x dx Z = cos x sin x + x sin2 x dx: 91 Daraus ergibt sich Z 1 [x 2 sin2 x dx = sin x cos x] : Die nächste wichtige Regel: Satz 7.15 (Substitutionsregel) f : I ! R sei stetig, g : J ! R sei stetig di¤erenzierbar und es gelte im (g) eine Stammfunktion von f: a) F I: F sei g ist eine Stammfunktion von (f g) g 0 ; d.h. Z (f g) g 0 dx = F (g (x)) : b) Z g(b) f (x) dx = Z b f (g (x)) g 0 (x) dx: a g(a) Beweis. Das ist einfach die Kettenregel als Integrationsregel interpretiert: Die Ableitung von F g ist ja (F 0 g) g 0 = (f g) g 0 : b) ergibt sich aus a) durch Einsetzen der Integrationsgrenzen. In der obigen Formulierung ist die Regel ohne zusätzliche Voraussetzungen korrekt. Oft wird sie jedoch so verwendet, dass man „x durch g (y) substituiert“. Dies setzt jedoch voraus, dass g : J ! I bijektiv ist. In diesem Fall seien ; 2 I und wir …nden a; b mit g (a) = ; g (b) = ; d.h. a = g 1 ( ) ; b = g 1 ( ) : Dann liest sich die obige Formel als Z f (x) dx = Z g 1( g 1( ) f (g (y)) g 0 (y) dy; ) wobei wir die Integrationsvariable auf der rechten Seite noch in y umbenannt haben. Als unbestimmtes Integral liest sich das wie folgt: Z Z f dx = (f g) g 0 dy g 1 Formal ergibt sich das wie folgt: Wir setzen die Substitution x = g (y) : Dann ist dx 0 0 dy = g (y) ; d.h. dx = g (y) dy: Eingesetzt ergibt sich die obige Formel, wobei die Integrationsgrenzen gemäss der Substitution transformiert werden müssen, d.h. wenn auf der linken Seite die Integration von x = bis x = erfolgt, so erfolgt sie auf der rechten Seite von y = g 1 ( ) = a bis y = g 1 ( ) = b: Man muss sich jedoch klar darüber sein, dass die Regel in dieser Form nur gilt, wenn g bijektiv ist. Beispiel 7.16 1. Z xe 92 x2 dx: Hier nehmen wir F (x) = ex ; g (x) = x2 : Dann ist g 0 (x) = Z Z 1 1 2 x2 xe dx = ( 2x) e x dx = e 2 2 Die Stammfunktion von e x2 2x und wir erhalten x2 : kann man jedoch nicht elementar ausdrücken. 2. Da log x die Stammfunktion vom 1=x ist für x > 0; so erhalten wir, dass für eine Funktion g mit positivem Wertebereich die Formel Z 0 g (x) dx = log (g (x)) g (x) gilt. Z.B. im Intervall 2; 2 Z 3. erhalten wir Z sin x dx = tan (x) dx = cos x Z log (cos x) : arctan (x) dx: Hier wenden wir erst partielle Integration ein, um den Arkustangens in “handli1 chere” Form zu bringen. Die Ableitung von arctan (x) ist ja 1 + x2 : Z Z Z x arctan (x) dx = 1 arctan (x) dx = x arctan (x) dx: 1 + x2 Nun ist x die Hälfte der Ableitung von 1 + x2 : Aus der Substitutionsregel ergibt sich also Z x 1 dx = log 1 + x2 : 1 + x2 2 Zusammen also Z 1 arctan (x) dx = x arctan (x) log 1 + x2 : 2 4. In vielen Fällen erfordert die Berechnung des Integrals einige Kni¤e, wenn sie überhaupt möglich ist. Wir betrachten Z p 1 x2 dx; wobei der De…nitionsbereich das Intervall [ 1; 1] ist. Die Funktion beschreibt einen Halbkreis über diesem Intervall. Daher gilt Z 1p 1 x2 dx = : 2 1 93 Wir versuchen eine Substitution x = cos y: Die Kosinusfunktion bildet [0; ] bijektiv auf das Intervall [ 1; 1] ab. dx = sin y dy: Nach der obigen Substitutionsregel erhalten wir Z p Z p 1 x2 dx = 1 cos2 y ( sin y dy) : y=arccos(x) Nun ist p 1 cos2 y = sin y; sodass das Integral einfach Z 1 sin2 y dy = [sin y cos y y] 2 ist, wie wir oben gesehen hatten. Setzen wir y = arccos x p ein, so erhalten wir mit p cos (arccos x) = x; sin (arccos x) = 1 cos2 (arccos x) = 1 x2 : Z p i 1h p 1 x2 dx = x 1 x2 arccos x : 2 Zur Kontrolle berechnen wir das obige bestimmte Integral: Z 1 1 p 1 x2 dx = = 7.3 i1 1h p x 1 x2 arccos x 2 x= 1 1 (arccos ( 1) arccos (1)) = : 2 2 Die Taylorformel Die Taylorformel gestattet es, ziemlich allgemeine Funktionen durch Polynome zu approximieren. Die Basis der Taylorformel ist einfach die Tatsache, dass eine di¤erenzierbare Funktion f die Stammfunktion von f 0 ist. Für x0 ; x im De…nitionsbereich, den wir als Intervall voraussetzen, gilt daher Z x Z x 0 f (x) f (x0 ) = f (y) dy = 1 f 0 (y) dy x0 x0 Wir setzen nun voraus, dass f zweimal di¤erenzierbar ist, und wenden auf die rechte Seite partielle Integration an. Eine Stammfunktion von 1 ist (y x) ; als Funktion von y: Daher ergibt sich Z x Z x x 0 0 1 f (y) dy = (y x) f (y) y=x0 (y x) f 00 (y) dy x0 x0 Z x 0 = (x x0 ) f (x0 ) + (x y) f 00 (y) dy: x0 Falls f dreimal di¤erenzierbar ist, so kann man nun mit dem zweiten Summanden in gleicher Weise weiterfahren. Eine Stammfunktion von (x y) (als Funktion von y) ist 94 (y x)2 : 2 Somit erhalten wir Z x (x y) f (y) dy = 2 x0 = x)2 (y 00 (x x 00 f (y) + Z x0 ) 00 f (x0 ) + 2 x x 2 x)2 (y x0 x)2 (y x0 y=x0 2 Z 2 f 000 (y) dy f 000 (y) dy: Somit erhalten wir f (x) = f (x0 ) + (x x0 ) f 0 (x0 ) + Z x (y x)2 00 + f (y) dy: 2 x0 (x x0 )2 00 f (x0 ) 2 In dieser Weise kann man weiterfahren, immer mit partieller Integration des Integrationsterms. Wenn f (n + 1)-mal di¤erenzierbar ist, so erhalt man f (x) = f (x0 ) + n X (x k=1 x0 )k (k) f (x0 ) + k! Z x (y x0 x)n (n+1) f (y) dy: n! (7.1) Die ersten beiden Terme auf der rechten Seite bilden zusammen ein Polynom. De…nition 7.17 Sei f (n + 1)-mal di¤erenzierbar auf dem o¤enen Intervall I und sei x0 2 I: Das Polynom Tn;x0 (x) := f (x0 ) + n X (x k=1 x0 )k (k) f (x0 ) k! heisst das Taylorpolynom vom Grad n von f um x0 : Den Term Z x (y x)n (n+1) f (y) dy Rn (x) := n! x0 nennt man das Lagrangesche Restglied. Die Idee dieser Darstellung ist, dass selbst nach Weglassung des Restgliedes das Taylorpolynom selbst eine gute Approximation der Funktion f ist, und zwar je besser, desto grösser n ist und desto näher x bei x0 ist. Die Diskussion des Restgliedes ist nicht immer ganz einfach. Wir werden das weiter unten bei besonders wichtigen Beispielen durchführen. Das Taylorpolynom 1: Grades ist einfach x0 ) f 0 (x0 ) ; f (x0 ) + (x was einfach die Funktion der Tangente von f im Punkt x0 ist. 95 Uebung 7.18 Das Taylorpolynom n-ten Grades von f in x0 ist das eindeutig de…nierte Polynom n-ten Grades p (x), das die Eigenschaft hat, dass erstens die Funktionswerte von p und f in x0 übereinstimmen, und zweitens dies auch für alle Ableitungen bis zur n-ten gilt. Wir betrachten ein Beispiel: f (x) = sin x und x0 = 0: Die Ableitungen von sin x hatten wir schon berechnet. Die geraden Ableitungen sind alle sin x; was im Nullpunkt = 0 ist. Die geraden Potenzen tauchen also im Taylorpolynom nicht auf. Die ungeraden Ableitungen ergeben cos x; mit +; wenn n bei Division durch 4 Rest 1 hat und andernfalls. Das Taylorpolynom n-ten Grades von sin x um den Nullpunkt ist also (für n ungerade) x3 x5 x7 xn Tn;0 (x) = x + + ; 6 120 7! n! wobei sich das Vorzeichen des letzten Summanden gemäss der obigen Regel ergibt. Unten eingezeichnet ist die Sinusfunktion, dann das Taylorpolynom 5. Grades (rot) und das Taylorpolynom 11. Grades (schwarz) y 1.4 1.2 1.0 0.8 0.6 0.4 0.2 -7 -6 -5 -4 -3 -2 -1 1 -0.2 2 3 4 5 6 7 x -0.4 -0.6 -0.8 -1.0 -1.2 -1.4 Besonders einfach sind die Taylorpolynome für die Funktion ex ; denn alle Ableitungen der Exponentialfunktion sind wieder ex ; und die Ableitungen im Punkt 0 sind alle 1: Das n-te Taylorpolynom für ex im Punkt x0 = 0 ist daher: Tn;0 = n X xk k=0 k! mit der Festlegung x0 := 1 und 0! := 1: Beispiel 7.19 p Wir betrachten ein etwas kompliziertes Beispiel: f (x) = sin (x); wobei wir x so einschränken, dass sin (x) nicht negativ ist, z.B. 0 x : Die Wurzelfunktion können wir 96 jedoch im Nullpunkt nicht ableiten. Deshalb schränken wir uns auf x 2 ]0; [ ein. Nach der Kettenregel und der Quotientenregel gilt f 0 (x) = f 00 (x) = = 1 2 p 1 cos x p 2 sin x p 1 cos x 3=2 sin x sin x cos x d dx 1 sin x cos x 2 psin x = sin x 2 sin x 1 sin2 x + 1 1 2 sin2 x + cos2 x = : 4 4 sin3=2 x sin3=2 x d cos x dx Wir berechnen das Taylorpolynom 2. Grades um x0 = =2: f ( =2) = 1; f 0 ( =2) = 0; f 00 ( =2) = 12 ; d.h. 2 1 T2; =2 (x) = 1 : x 4 2 Die Idee des Taylorpolynoms ist selbstverständlich, mit ihm eine Approximation der Funktion f zu …nden. Die Abweichung der Funktion vom Taylorpolynom kennen wir „im Prinzip“, nämlich durch das Lagrangesche Restglied. Dieses ist jedoch nicht sehr explizit, denn es verwendet alle Funktionswerte zwischen x0 und x: Man kann es jedoch häu…g abschätzen. Z x (y x)n (n+1) jx x0 jn+1 jRn (x)j = f (y) dy sup f (n+1) (y) : n! (n + 1)! y2[x0 ;x] x0 Die Taylorformel wird man in der Regel dann verwenden wollen, wenn x nahe bei x0 liegt. Sonst ist die Approximation in der Regel nicht besonders gut. Ferner hängt die obige Abschätung des Restgliedes auch davon ab, wie gross die (n + 1)-te Ableitung im Intervall [x0 ; x] werden kann (absolut). Ein Beispiel: f (x) = sin x: Hier hat man das Glück, dass alle Ableitungen selbst wieder sin x und cos x sind, die alle durch 1 beschränkt sind. Man erhalt daher (mit x0 = 0) jxjn+1 jRn (x)j : (n + 1)! Für x = 1=2 und n = 11 ergibt sich eine Abschätzung des Restgliedes jRn (x)j 7.4 (1=2)12 12! 5 10 13 : Potenzreihen und die Taylorreihe Die Taylorformel legt es nahe, dass man für Funktionen, die beliebig oft di¤erenzierbar sind, das „unendliche“ Taylorpolynom 1 X 1 (k) f (x0 ) (x k! k=0 97 x0 )k betrachtet, in der Ho¤nung, dass für n ! 1 das Restglied verschwindet und man die Funktion f vollständig zurückerhält. Wir machen erst etwas Theorie zu solchen Reihen. Für x0 ; x 2 R und einer Folge fan gn 0 reeller Zahlen betrachten wir die Reihe Für x0 = 0 ergibt sich einfach X x0 )n : an (x X an xn ; Solche Reihen summiert man üblicherweise ab n = 0, mit der Konvention x0 = 1: Eine derartige Reihe nennt man Potenzreihe. Für allgemeine an ist jedoch keinesfalls klar, ob die Reihe für irgend ein x konvergiert, ausser natürlich für x = 0: Satz 7.20 Es gibt eine Zahl 2 [0; 1] ; den sogenannten Konvergenzradius, sodass die obige Reihe für jx x0 j < absolut konvergiert und für jx x0 j > divergiert. Ferner gilt = 1 limn!1 p n jan j ; sofern der Grenzwert existiert. Ist der Limes im Nenner gleich 0; so istpder Konvergenzradiusq1; d.h. die Reihe konvergiert für alle x: Ist umgekehrt limn n jan j = 1; d.h. limn n jan j x 6= x0 : 1 = 0; so ist der Konvergenzradius 0; d.h. die Reihe konvergiert für kein Über das Konvergenzverhalten einer Potenzreihe für jx x0 j = kann man keine allgemeinen Aussagen machen. Dies ist von Fall zu Fall unterschiedlich. Im Konvergenzbereich der Potenzreihe de…niert diese natürlich eine Funktion in x; d.h. mindestens für jx x0 j < : Beispiel 7.21 1. Ist an = 1 für alle n; so ist der Konvergenzradius o¤enbar 1: Die Reihe 1 X n=0 xn = 1 1 x ; jxj < 1; sollte aus dem Gymnasium bekannt sein (geometrische Reihe). Die Reihe konvergiert weder für x = 1 noch für x = 1: 2. an = n!: Wir können an nach unten abschätzen, indem wir die erste Hälfte der Faktoren weglassen. Ist n gerade, so erhalten wir n! n +1 2 n +2 2 98 n n +1 2 n=2 : Für n ungerade haben wir n! abschätzen. Wegen (n 1) =2 (n 1)! und können dies nach der Formel oben n=3 für n 2 ergibt sich in diesem Fall: n +1 3 n! n=3 : (7.2) 1=3 Die n-te Wurzel aus dem Ausdruck rechts ist n3 + 1 , was o¤ensichtlich gegen 1 strebt für n ! 1: Somit ist der Konvergenzradius 0; d.h. die Reihe 1 X n!xn n=0 konvergiert für kein x 6= 0: 3. an = 1=n!: Mit einer kleinen Modi…kation der Rechnung im 2. Beispiel folgt, dass der Konvergenzradius hier 1 ist. De…nition 7.22 Sei die Funktion f auf einem o¤enen Intervall I de…niert mit x0 2 I; und f sei in x0 unendlich oft di¤erenzierbar. Dann heisst die Reihe X f (n) (x0 ) n! (x x0 )n die Taylorreihe von f im Punkt x0 : Eine naheliegende Frage ist, ob die Taylorreihe dort, wo sie konvergiert, mit der Funktion übereinstimmt. Dies ist nicht immer der Fall, jedoch in vielen („den meisten“) interessanten Fällen. Der Beweis erfolgt in der Regel mit einer Abschätzung des Restgliedes in der Taylor-Formel. Wir diskutieren das Beispiel der Exponentialfunktion sorgfältig. Satz 7.23 Die Taylorreihe der Exponentialfunktion ex um den Punkt x0 = 0 ist X xn n! : Sie konvergiert absolut auf ganz R und stimmt mit der Funktion ex überein. Beweis. Die Ableitungen im Nullpunkt sind alle gleich 1; sodass die Taylorreihe o¤ensichtlich die obige Gestalt hat. Wie wir schon gesehen haben, ist der Konvergenzradius dieser Potenzreihe gleich 1; sodass die Reihe auf ganz R absolut konvergiert. Es bleibt zu zeigen, dass sie auf ganz R mit der Exponentialfunktion übereinstimmt. Das Taylorpolynom n-ten Grades ist natürlich einfach Tn;0 (x) = n X xk k=0 99 k! ; was einfach die entsprechende Partialsumme der Taylorreihe ist. Aus (7.1) erhalten wir Z x Z x (y x)n y (y x)n y x jTn;0 (x) e j = jRn (x)j = e dy e dy n! n! 0 0 Z x (jy xj)n y e dy = n! 0 Für x > 0 ist ey Fall die Schranke ex für y 2 [0; x] und jy jTn;0 (x) x e j e x Z x xj = x y: Daher erhalten wir in diesem y)n xn+1 dy = ex : n! (n + 1)! (x 0 Unter Verwendung von (7.2) lässt sich die rechte Seite durch !n n+1 x x ex = ex x p 3 n=3 + 1 (n=3 + 1)n=3 abschätzen. Für jedes x > 0 ist p 3 x n=3 + 1 1 ; 2 sofern n genügend gross ist. Damit ergibt sich ex j jTn;0 (x) xex 1 ; 2n sofern n genügend gross ist. Der Restterm konvergiert deshalb gegen 0 für n ! 1: Für x < 0 ist das Argument analog. Bemerkung 7.24 Aus der obigen Reihendarstellung der Exponentialfunktion ergibt sich auch die bekannte Formel ex ey = ex+y : Da die Reihe der Exponentialfunktion für alle x und y absolut konvergiert, ergibt sich aus Satz 4.15 b): ex ey = = = = X1 xn n=0 n! X1 Xn n=0 X1 n=0 X1 n=0 X1 n=0 yn n! xk yn k k=0 k! (n k)! Xn n! xk y n k=0 k! (n k)! 1 n! 1 (x + y)n = ex+y : n! 100 k Die Taylorreihen für Sinus und Kosinus lassen sich ebenfalls leicht berechnen. Wir nehmen wieder x0 = 0: Die geraden Ableitungen von sin x sind stets sin x; also = 0 im Nullpunkt. Die ungeraden Ableitungen sind cos x; also 1 im Nullpunkt, beginnend mit +1 für die erste Ableitung und anschliessenden Vorzeichenwechseln. Die Taylorreihe ist daher 1 X ( 1)n n=0 x2n+1 : (2n + 1)! Ananlog ist die Taylorreihe von cos x : 1 X ( 1)n n=0 x2n : 2n! Diese Taylorreihen sind für alle x konvergent und stellen ihre Funktionen dar: Satz 7.25 Für alle x 2 R gelten 1 X sin x = n=0 1 X cos x = ( 1)n x2n+1 ; (2n + 1)! ( 1)n x2n : 2n! n=0 Wir berechnen noch die Taylorreihe der Logarithmusfunktion. Diese ist im Nullpunkt nicht de…niert, sodass wir sie im Punkte x0 = 1 berechnen. Die Ableitungen haben wir in Beispiel 6.19 3. berechnet. Setzen wir dort x = 1 ein, so erhalten wir für f (x) = log x f (n) (1) = ( 1)n 1 (n 1)!: Die Taylorreihe für den Logarithmus im Punkt 1 ist also 1 X ( 1)n 1 1)n (x n n=1 : (7.3) Der Konvergenzradius dieser Reihe ist = lim n!1 p n 1 n = lim e n log n n!1 1 = elimn!1 n log n = e0 = 1: Die Potenzreihe konvergiert somit für jx 1j < 1: Sie konvergiert allerdings auch noch für x 1 = 1; d.h. x = 2; aber nicht für x = 0: Satz 7.26 Die Taylorreihe von log x bei x0 = 1 ist gegeben durch (7.3). Sie konvergiert gegen log x für 0 < x 2: 101 Bemerkung 7.27 Manchmal schreibt man die Taylorreihe des Logarithmus auch mit einer Substitution y = 1 x: Dann ergibt sich 1 X yn log (1 y) = ; n n=1 was für jyj < 1 absolut konvergiert. Wir diskutieren nun einige weitere allgemeine theoretische Resultate über Potenzreihen, die wir dann auch für die Taylorreihen anwenden können. Der (notationellen) Einfachheit halber diskutieren wir das nur für Potenzreihen mit x0 = 0: SatzP7.28 Sei an xn eine Potenzreihe mit Konvergenzradius für jxj < : > 0 und sei f (x) := P1 n n=0 an x a) f ist di¤erenzierbar mit f 0 (x) = 1 X nan xn 1 : n=1 Diese Reihe hat ebenfalls Konvergenzradius : b) f ist für jxj < unendlich oft di¤erenzierbar, wobei sich die Ableitungen durch gliedweise Di¤erentiation der Summanden der Reihe ergeben. P c) Die n-te Ableitung von f im Nullpunkt ist gleich n! an : Somit ist an xn die Taylorreihe von f um x0 = 0: Wir beweisen den Satz nicht. Die einzige Schwierigkeit ist der Beweis von a). b) folgt sofort aus a) und c) ergibt sich aus b). Beispiel 7.29 Die Taylorreihe für 1 1 x ist P1 n n=0 x : 1 (1 2 x) Der Konvergenzradius ist 1: Daher ist = 1 X d 1 = nxn dx 1 x 1 : n=1 Ein analoges Resultat gilt für die Integration: Satz 7.30 P n Sei f (x) := 1 n=0 an x eine Potenzreihe mit Konvergenzradius Z f (x) dx = 1 X n=0 an Z xn dx = 102 1 X n=0 an xn+1 n+1 > 0: Dann ist für jxj < : Hier sollte man sich daran erinnern, dass Stammfunktionen noch eine freie Konstante erhalten, sodass die allgemeine Stammfunktion C+ 1 X an 1 n=1 xn n ist. Beispiel 7.31 1. Wir können die Potenzreihe des Logarithmus durch Integration der geometrischen Reihe gewinnen: 1 X 1 = xn ; 1 x n=0 was für jxj < 1 absolut konvergiert. Durch Integration erhalten wir log (1 x) = 1 1 X X xn+1 xn +C = + C; n+1 n n=0 n=1 mit einer noch zu bestimmen Konstanten C: Diese ergibt sich durch Einsetzen von x = 0 : nämlich C = 0: Somit ist log (1 1 X xn x) = n n=1 : 2. Wir können die Potenzreihe des Arkustangens aus der Potenzreihe der Ableitung gewinnen: 1 1 + x2 = = 1 1 X 1 = ( x2 ) x2 n n=0 1 X ( 1)n x2n : n=0 Die Reihe konvergiert absolut für jxj < 1: Durch Integration ergibt sich arctan (x) = 1 X ( 1)n n=0 x2n+1 : 2n + 1 Wegen arctan (0) = 0 ist die mögliche Konstante wieder = 0: Wegen arctan (1) = =4 erhält man die Leibnizsche Reihe 4 = 1 X ( 1)n n=0 1 : 2n + 1 Da der Konvergenzradius = 1 ist, ergibt sich die Darstellung nicht ganz sauber aus dem vorangegangenen Satz. Die Reihe konvergiert nicht sehr schnell und ist für die 103 Berechnung von nicht brauchbar. Wesentlich besserpfährt man mit Einsetzen einer p Zahl < 1; deren Arkustangens man kennt, z.B. 1= 3 mit arctan 1= 3 = =6: Somit gilt 6 = 1 X p 2n+1 1 1= 3 1 X 1 =p ( 1)n n : 2n + 1 3 (2n + 1) 3 n=0 n ( 1) n=0 Diese Reihe konvergiert recht gut.23 Satz P 7.32 P an xn und bn xn seien zwei Potenzreihen mit Konvergenzradien f (x) := 1 X an xn ; g (x) := n=0 für jxj < 1; bzw. jxj < a) Für jxj < 2: Sei 1 X 1 und 2: Wir setzen bn xn n=0 := min ( 1 ; 2) : gilt f (x) + g (x) = 1 X (an + bn ) xn : n=0 b) Für jxj < gilt f (x) g (x) = 1 X cn xn ; n=0 mit cn := n X ak bn k: k=0 Beweis. Die Behauptungen folgen sofort mit Satz 4.15. Es spricht nichts dagegen, auch komplexe Potenzreihen zu betrachten: Für eine Folge fcn g von komplexen Zahlen betrachten wir die Potenzreihe X cn z n ; 23 Ludolph van Ceulen berechnete die Kreiszahl Ende des 16. Jh. im Wesentlichen mit der von Archimedes eingeführten Methode (Approximation durch Vielecke) auf 35 Stellen nach dem Komma. Mit dieser Beschäftigung verbrachte er einen Grossteil seines Lebens. Immerhin wurde ihm die Ehre zuteil, dass die Kreiszahl bis ins 19 Jh. als Ludolphsche Zahl bezeichnet wurde, etwas unsinnigerweise, denn die Idee der Approximation stammt vollständig von Archimedes. Mit der Entdeckung der Reihendarstellungen der Zahl - wie der obigen - konnte dieselbe Genauigkeit (auch ohne Taschenrechner) in ein paar Stunden erzielt werden. Die Leibnizsche Reihe war übrigens in Indien schon im 15. Jh. bekannt. 104 wobei wir uns hier für die Konvergenz der Reihe für komplexe Zahlen z 2 C interessieren. Wir hatten bisher komplexe Reihen nicht betrachtet. Konvergenz der obigen Reihe bedeutet einfach, dass sowohl Real- wie Imaginärteile der Folge der Partialsummen sn := n X ck z k k=0 konvergieren. Das ist gleichbedeutend damit, dass eine komplexe Zahl s 2 C existiert mit lim jsn sj = 0: n!1 Man schreibt in einem solchen Fall s= 1 X ck z k : k=0 Komplexe Potenreihen haben ebenfalls einen Konvergenzradius , der sich als = 1 limn!1 p n jcn j ergibt, sofern der Limes existiert. Die komplexe Potenzreihe konvergiert absolut für jzj < bedeutet hier, dass die reelle Reihe X jcn j jzjn : Absolute Konvergenz konvergiert. Es ist naheliegend, die komplexe Exponentialfunktion als ez := 1 X zk k=0 k! zu de…nieren. Der Konvergenzradius dieser Reihe ist 1: Aus dieser Reihendarstellung lassen sich nun mühelos die grundlegenden Eigenschaften der komplexen Exponentialfunktion herleiten: Satz 7.33 Die komplexe Exponentialfunktion hat die folgenden Eigenschaften: a) Für z; w 2 C gilt ez ew = ez+w : b) Für x 2 R gilt die Eulersche Formel: eix = cos x + i sin x: 105 Beweis. Der Beweis von a) ist der gleiche wie in Bemerkung 7.24. b): Wir setzen ix in die Potenzreihe ein. Der Wert von (ix)k hängt davon ab, welchen Rest bei der Division von k durch 4 vorliegt: 8 xk bei Rest 0 > > < k ix bei Rest 1 (ix)k = : k x bei Rest 2 > > : ixk bei Rest 3 Wir erhalten also e ix 1 X 1 = (ix)k = 1 k! x2 x4 + 2 4! k=0 x3 x5 + 3! 5! = cos x + i sin x: x6 + 6! x7 + 7! +i x Es gibt eine Reihe von weiteren Sätzen, die für den Umgang mit Potenzreihen nützlich sind. Sind z.B. f; g zwei Funktionen, deren Taylorreihen um x0 man kennt und ist g (x0 ) 6= 0; so kann man f (x) =g (x) um x0 in eine Taylorreihe entwickeln, deren Gestalt man durch Koe¢ zientenvergleich ermitteln kann. Wir wollen das hier nur an einem Beispiel demonstrieren, der Tangensfunktion: tan (x) = sin x : cos x Die Reihen für Sinus und Kosinus kennen wir schon. Wir wollen den Tangens um 0 entwickeln. Wegen tan (0) = 0 beginnt die Reihe mit a1 x: Wir machen also den Ansatz tan (x) = a1 x + a2 x2 + a3 x3 + : Daraus ergibt sich wegen sin (x) = tan (x) cos (x) : x x3 x5 + 3! 5! = a1 x + a2 x2 + a3 x3 + = a1 x + a2 x2 + a3 a1 2 x2 x4 + 2 4! a2 4 3 x + a4 x + a5 2 : 1 Daraus ergibt sich eine Folge von Gleichungen: a1 = 1; a5 a2 a1 a3 2 a2 a4 2 a3 a1 + 2 4! = 0; 1 = 3! = 1 6 = 0 = 106 1 1 = : 5! 120 a3 a1 5 + x + 2 4! : Man sieht sofort, dass die geraden Koe¢ zienten alle gleich 0 sind. Ferner a1 = 1; a3 = 13 ; a5 = 1 120 1 1 16 2 + = = : 24 6 120 15 Es ist klar, dass man so weiter fahren kann. Den allgemeinen Ausdruck der Koe¢ zienten sparen wir uns. 7.5 Uneigentliche Integrale Bisher hatten wir Integrale von Funktionen nur über endlichen Intervallen [a; b] betrachtet, auf denen die Funktion de…niert ist. Manchmal ist es jedoch auch möglich, ein Integral auf einem unbeschränkten Intervall zu de…nieren, oder wenn die Funktion auf den Randpunkten nicht de…niert ist. De…nition 7.34 RN a) Ist die Funktion f auf dem Intervall [a; 1[ de…niert, existiert das Integral a f (x) dx RN für alle N 2 N; N > a; und existiert limN !1 a f (x) dx; so nennt man diesen Limes das (uneigentliche) Riemann-Integral und schreibt dafür Z 1 f (x) dx: a Ra Analog wird 1 f (x) dx de…niert. Ist f auf R de…niert und existieren die Integrale R0 R1 f (x) dx und 1 f (x) dx; so schreibt man 0 Z 1 f (x) dx := 1 Z 1 f (x) dx + 0 Z 0 f (x) dx: 1 Man sagt auch oft, die Funktion f sei „bei 1 integrierbar“ bzw. bei Grenzwerte existieren. 1; falls die Rb b) Ist f auf dem Intervall ]a; b] de…niert, aber nicht in a; und existiert lim"#0 " f (x) dx; so nennt man diesen Grenzwert das (uneigentliche) Riemann-Integral auf dem Intervall und schreibt dafür Z b f (x) dx: a Wir machen dazu einige Beispiele: Beispiel 7.35 Die Funktion xa ist für jedes a 2 R auf der R 1postiven reellen Achse de…niert. Für a 0 ist sie auch für x = 0 de…niert. Das Integral 0 xa dx existiert für a 0 jedoch o¤ensichtlich nicht, denn der Funktionswert ist ja 1 für jedes x 1: Um das Integral bei 1 zu de…nieren müssen wir also auf jeden Fall a < 0 voraussetzen. In diesem Fall haben wir jedoch auch in Problem bei 0; da dann die Funktion in 0 107 nicht de…niert ist. Wir untersuchen daher die Sache getrennt auf den Intevallen [1; 1[ und ]0; 1] : Für a < 0 und N > 1 ist ( a+1 Z N N 1 fu •r a 6= 1 a a+1 x dx = : log N f u •r a = 1 1 Limes N ! 1 existiert (in R) genau dann, wenn a < RDer 1 a 1 x dx existiert genau dann, wenn a < 1 ist, und es gilt Z 1 xa dx = (a + 1) 1 : 1 ist, d.h. das Integral 1 Für den Fall a 1 schreibt man oft Z 1 xa dx = 1: 1 Nun zum Intervall ]0; 1] : Für " > 0 gilt ( Z a+1 1 xa dx = " 1 " a+1 fu •r a 6= log " f u •r a = 1 : 1 In diesem Fall konvergiert dieser Ausdruck für " ! 0 genau dann, wenn a > wir erhalten in diesem Fall Z 1 xa dx = (a + 1) 1 1 ist, und : 0 Wir sehen also: xa ist integrierbar bei 1 genau dann, wenn a < 1 gilt, und bei 0 genau dann, wenn a > 1 ist. Für a = 1 ist es weder bei 1 noch bei 0 integrierbar. Beispiel 7.36 Wir untersuchen eax ; was auf ganz R de…niert ist. Für a natürlich nicht integrierbar. Für a < 0 gilt jedoch Z N 1 aN 1 eax dx = e 1 ! a a 0 0 ist die Funktion bei 1 für N ! 1: Die Funktion ist also bei 1 integrierbar. Umgekehrt: Für a > 0 ist die Funktion bei 1 integrierbar. Beispiel 7.37 2 Ein wichtiges Beispiel ist die Gausssche Glockenfunktion e x : Da sie stetig ist, ist sie auf jedem endlichen Intervall integrierbar. Die Stammfunktion ist jedoch nicht elementar durch die Kombination der üblichen Funktionen darstellbar. Wir können jedoch leicht nachweisen, dass das uneigentliche Integral Z 1 2 e x dx (7.4) 1 108 existiert. Zunächst gilt für x 1 die Ungleichung x2 x; d.h. e N >1 Z N Z N x2 e x dx 1: e dx RN x2 e x: Daher ist für 1 1 x2 Die Folge 1 e dx steigt monoton an und ist nach dieser Ungleichung nach oben beschränkt. Daher existiert Z N Z 1 2 2 e x dx: e x dx = lim N !1 1 1 R1 2 Da das Integral 0 e x dx wegen der Stetigkeit der Funktion existiert, so existiert auch R 1 x2 2 dx: Da die Funktion f (x) = e x gerade ist, d.h. f ( x) = f (x) erfüllt, so sieht 0 e R0 R1 2 2 man leicht, dass auch 1 e x dx existiert und in der Tat gleich 0 e x dx ist. Somit existiert (7.4). Es gilt übrigens Z 1 p 2 e x dx = ; 1 was nicht ganz einfach zu sehen ist, da man die Stammfunktion nicht explizit hinschreiben kann. 109 8 Periodische Funktionen und Fourierreihen De…nition 8.1 Sei T eine reelle Zahl > 0: Eine Funktion f : R ! R heisst T -periodisch, falls f (x + T ) = f (x) für alle x gilt. Man sagt in diesem Fall auch, f habe die Periode T: Die Prototypen periodischer Funktionen sind Sinus und Kosinus. Diese sind o¤ensichtlich 2 -periodisch. Jede konstante Funktion ist natürlich T -periodisch für beliebiges T > 0: Bemerkung 8.2 Es ist für die De…nition nicht wichtig, dass der Wertebereich die reellen Zahlen sind. Wir können von einer Funktion f : R ! A mit beliebiger Menge A de…nieren, was es heisst, dass sie T -periodisch ist. Wichtig sind insbesondere komplexwertige Funktionen R ! C: So ist die Funktion f (x) = eix 2 -periodisch. Satz 8.3 a) Hat f die Periode T; so hat sie auch die Periode 2T: Allgemeiner: Für jede natürliche Zahl n hat f die Periode nT: b) Hat f die Periode T und sei die Funktion g de…niert durch g (x) = f (x + a) ; a 2 R beliebig. Dann ist g ebenfalls T -periodisch. c) Hat f die Periode T und ist de…niert durch eine positive reelle Zahl, so hat die Funktion g g (x) = f ( x) die Periode T = : d) Sind f; g zwei T -periodische Funktionen, so ist auch f + g T -periodisch. e) Ist f eine T -periodische Funktion und ist 2 R; so ist auch f T -periodisch. Beweis. a) Zweimaliges Anwenden der Periodizitätseigenschaft ergibt für beliebiges x 2 R: f (x + 2T ) = f ((x + T ) + T ) = f (x + T ) = f (x) : Für allgemeines n folgt die Aussage sofort per Induktion. b) g (x + T ) = f (x + a + T ) = f (x + a) = g (x) : c) g x+ T = f x+ T = f ( x) = g (x) : 110 = f ( x + T) d) (f + g) (x + T ) = f (x + T ) + g (x + T ) = f (x) + g (x) = (f + g) (x) : e) ist o¤ensichtlich. Kennt man eine T -periodische Funktion auf dem Intevall [0; T [ oder einem beliebigen Intervall der Länge T; so kennt man sie o¤enbar auf ganz R: Man kann deshalb die T -periodischen Funktionen einfach mit den Funktionen [0; T [ ! R identi…zieren. Jede Funktion f : [0; T [ ! R kann durch periodische Fortsetzung zu einer T periodischen Funktion gemacht werden. Ein Problem entsteht jedoch mit der Stetigkeit. Ist f : [0; T [ ! R stetig so braucht die periodisch fortgesetzte Funktion auf R keinesfalls stetig zu sein. Hier ein Beispiel. Wir betrachten die Funktion f (x) = x auf dem Intervall [0; 1[ : Die periodisch fortgesetzte Funktion ist die „Sägezahnfunktion“ mit dem unten stehenden Graphen: 1.0 0.5 -5 -4 -3 -2 -1 0 1 2 3 4 Die Funktion ist o¤ensichtlich unstetig für ganzzahlige x: Aus Teil c) des Satzes folgt, dass man die Betrachtungen auf 2 -periodische Funktionen beschränken kann. Ist nämlich f eine T -periodische Funktion, so ist g (x) = f xT 2 2 -periodisch, und ist f eine 2 -periodische Funktion, so ist g (x) = f 2 x T eine T -periodische Funktion. Durch eine einfach Variablentransformation lässt sich daher die Periode in 2 transformieren. Man könnte sich auch auf 1-periodische Funktionen beschränken, wegen der 2 -Periodizität von Sinus und Kosinuns nimmt man jedoch meist Periode 2 : Wir kennen also nun schon eine Reihe von 2 -periodischen Funktionen: 1; sin x; cos x; sin 2x; cos 2x; sin 3x; cos 3x; : : : (8.1) Diese Funktionen können wir auch linear kombinieren. Die damit gewonnen Funktionen sind nach dem obigen Satz ebenfalls 2 -periodisch. 111 5 x De…nition 8.4 Eine Funktion der Form n X p (x) = a0 + ak cos (kx) + k=1 n X bk sin (kx) (8.2) k=1 mit a0 ; a1 ; : : : ; an ; b1 ; : : : ; bn 2 R, n 2 N nennt man ein trigonometrisches Polynom vom Grad n: Bemerkung 8.5 Man stellt trigonometrische Polynome oft bequemer in komplexer Schreibweise dar, nämlich als n X ck eikx : k= n Durch geeignete Wahl der ck 2 C lässt sich nämlich jedes trigonometrische Polynom in dieser kompakteren Schreibweise darstellen. Nach der Eulerschen Formel gilt eikx = cos kx + i sin kx: Ausgehend vom trigonometrischen Polynom (8.2) bestimmen wir die ck so, dass n X ck eikx = p (x) (8.3) k= n ist. Dies wird erreicht durch c0 = a0 ; und ck = k +i k; c k = k i k = ck ; k k = 1 mit der Festlegung ak ; 2 k = bk : 2 Mit dieser Festlegung der ck gilt nämlich ck eikx + c ke ikx = ck eikx + ck eikx = 2 Re ck eikx = 2 Re (( = 2( k k +i cos kx k ) (cos kx k + i sin kx)) sin kx) = ak cos kx + bk sin kx: Daraus ergibt sich (8.3). Es ist etwas Geschmackssache, ob man die komplexe Schreibweise vorzieht. Der Vorteil ist, dass die Exponentialfunktion einfacher zu handhaben ist. Anderseits mag es etwas unnatürlich erscheinen, für eine reellwertige Funktion über das Komplexe zu gehen. 112 Wir wollen nun eine weitgehend beliebige 2 -periodische Funktion f „möglichst gut“ durch trigonometrische Polynome approximieren. Eine der grundlegenden Eigenschaften der Liste (8.1) von Funktionen besteht darin, dass sie - wie man sagt - orthonormiert sind. Dies bedeutet folgendes: Satz 8.6 a) Für alle k 2 N gilt Z 2 sin (kx) dx = 0 Z 2 cos (kx) dx = 0: 0 b) Für alle k; l 2 N gilt Z 2 cos (kx) sin (lx) dx = 0: 0 c) Für k 6= l gilt Z 2 cos (kx) cos (lx) dx = 0 Z 2 sin (kx) sin (lx) dx = 0: 0 d) Für alle k 2 N gilt Z 2 2 cos (kx) dx = 0 Z 2 sin2 (kx) dx = : 0 Beweis. a) ist o¤ensichtlich. b): Unter Verwendung von 1 [sin ( + ) + sin ( 2 cos ( ) sin ( ) = erhalten wir Z 2 cos (kx) sin (lx) dx = 0 1 2 = 0: Z 2 sin ((k + l) x) dx + 0 )] 1 2 Z 2 sin ((k l) x) dx 0 c) Aus sin ( ) sin ( ) = erhält man für k 6= l Z 2 sin (kx) sin (lx) dx = 0 1 2 = 0: Z 1 [cos ( 2 ) cos ( + )] 2 cos ((k l) x) dx 0 Die entsprechende Gleichung mit Kosinus folgt analog. 113 1 2 Z 0 (8.4) 2 cos ((k + l) x) dx d) Unter Verwendung von (8.4) erhält man Z Z 2 1 2 2 cos (0 x) dx sin (kx) dx = 2 0 0 = +0= : 1 2 Z 2 cos ((k + l) x) dx 0 Die Behauptung mit Kosinus folgt analog. Zu einer vorgegebenen 2 -periodischen Funktion f suchen wir nun ein trigonometrisches Polynom, das f möglichst gut approximiert. Wir geben dieses Polynom einfach an und beweisen anschliessend, dass die Approximation in gewisser Hinsicht optimal ist. Zu gegebenem f de…nieren wir Z 2 1 a0 (f ) := f (x) dx; (8.5) 2 0 und für k 1; ak (f ) : = 1 Z 2 f (x) cos (kx) dx (8.6) f (x) sin (kx) dx: (8.7) 0 bk (f ) : = 1 Z 2 0 Wir setzen dabei voraus, dass die Integrale alle existieren. Die Zahlen ak (f ) ; bk (f ) heissen die Fourierkoe¢ zienten von f: Wir schreiben FPn;f (x) := a0 (f ) + n X ak (f ) cos (kx) + k=1 n X bk (f ) sin (kx) ; (8.8) k=1 und bezeichnen es als das Fourierpolynom vom Grad n von f: Für die nachfolgende Diskussion ist es (vor allem notationell) bequemer, wenn wir die Situation etwas kompakter formulieren. Wir de…nieren die folgenden 2n + 1 Funktionen: p p p 2 cos x; 2 (x) = 2 cos (2x) ; : : : ; n (x) = 2 cos (nx) ; 0 (x) = 1; 1 (x) = p p p 2 sin x; n+2 (x) = 2 sin (2x) ; : : : ; 2n (x) = 2 sin (nx) : n+1 (x) = Ferner führen wir die folgende Abkürzung ein: Für zwei Funktionen f; g; die auf [0; 2 ] de…niert sind, schreiben wir Z 2 1 hf; gi := f (x) g (x) dx; 2 0 wobei wir natürlich voraussetzen, dass das Integral de…niert ist. Man beachte, dass wegen der Linearität des Integrals die folgenden Gleichungen gelten: Für Funktionen f1 ; : : : ; fm und Zahlen 1 ; : : : ; m 2 R und eine beliebige Funktion g gilt Xk i=1 i fi ; g = Xk 114 i=1 i hfi ; gi : Analog gilt für Funktionen f; g1 ; : : : ; gk und f; Xk i=1 = i gi 1; : : : ; m Xk 2R i hf; gi i : i=1 Satz 8.6 lässt sich dann wie folgt kompakt ausdrücken: i; j 0 fu •r i 6= j : 1 fu •r i = j = (8.9) Ferner ist das Fourierpolynom einer Funktion f gebeben durch FPn;f (x) = 2n X k=0 hf; ki k: Das allgemeine trigonometrische Polynom (8.2) können wir dann als 2n X ck (8.10) k k=0 schreiben mit ck = p12 ak für k n; und ck = p12 bk n für n + 1 k 2n: Der nachfolgende Satz gibt an, in welchem Sinn das Fourierpolynom die Funktion optimal approximiert. Satz 8.7 Sei f eine 2 -periodische Funktion und sei p (x) ein beliebiges trigonometrisches Polynom der Form (8.10), dann gilt Z 2 (f (x) 2 FPn;f (x)) dx 0 Z 2 (f (x) p (x))2 dx: 0 Wir setzen hier voraus, dass die Integrale existieren, was stets dann der Fall ist, wenn das Integral von f 2 (x) über eine Periode existiert. Bemerkung 8.8 Sind f; g zwei auf dem Intervall de…nierte Funktionen, so de…niert Z 2 (f (x) g (x))2 dx 0 eine Art von „Abstand“ zwischen den Funktionen f; g; ist also ein Mass dafür, wie weit sich die Funktionen unterscheiden. Meist zieht man noch die Quadratwurzel aus dem Ausdruck, was für die Diskussion hier jedoch ohne Belang ist. Der obige Satz besagt daher, dass FPn;f dasjenige trigonometrische Polynom vom Grad n ist, welches minimalen Abstand von f hat. 115 Beweis von Satz 8.7. Für ein beliebiges trigonometrisches Polynom p (x) der Form (8.10) ergibt sich Z 2 Z 2 Z 2 Z 2 1 1 1 1 2 2 (f (x) p (x)) dx = f (x) dx 2 f (x) p (x) dx + p (x)2 dx 2 0 2 0 2 0 2 0 2n 2n X X = hf; f i 2 ck hf; k i + ck cl h k ; l i k=0 = hf; f i 2 k;l=0 2n X ck hf; k=0 ki + 2n X c2k ; k=0 die letzte Gleichung wegen (8.9). Dieselbe Rechnung mit FPn;f (x) anstelle von p (x), d.h. mit dem Spezialfall ck = hf; k i ; ergibt Z 2 2n 2n X X 1 (f (x) FPn;f (x))2 dx = hf; f i 2 hf; k i2 + hf; k i2 2 0 = hf; f i Somit ergibt sich = k=0 hf; k=0 2 ki : Z 2 1 (f (x) p (x)) dx (f (x) FPn;f (x))2 dx 2 0 0 2n 2n 2n 2n X X X X hf; k i2 = (ck hf; k i)2 2 ck hf; k i + c2k + 1 2 Z k=0 2n X 2 2 k=0 k=0 k=0 0: k=0 Bemerkung 8.9 R ersetzen, wenn dies bequemer ist: Z.B. Wir können die Integrale auch durch Z 2 Z Z 2 f (x) cos (kx) dx = f (x) cos (kx) dx + f (x) cos (kx) dx: 0 0 Im zweiten Integral substituieren wir x = y + 2 : Wegen dx = dy und der Periodizität ergibt sich Z 2 Z 0 f (x) cos (kx) dx = f (y + 2 ) cos (ky + 2k ) dy = Z 0 f (y) cos (ky) dy: Die Integrationsvariable können wir wieder in x umtaufen und erhalten Z 2 Z f (x) cos (kx) dx = f (x) cos (kx) dx: 0 116 De…nition 8.10 f sei eine 2 -periodische Funktion. Die Reihe a0 (f ) + 1 X (ak (f ) cos kx + bk (f ) sin kx) (8.11) k=1 heisst die Fourier-Reihe von f: Im Moment wissen wir noch nicht, unter welchen Bedingungen an f die Fourier-Reihe konvergiert. Enthält die Reihe keine Sinus-Glieder, so nennt man sie eine Kosinusreihe. Sind hingegegen alle ak (f ) = 0; k 0; so nennt man sie eine Sinusreihe. Lemma 8.11 Ist f eine gerade 2 -periodische Funktion, d.h. gilt f ( x) = f (x) ; so ist die FourierReihe eine Kosinusreihe. Ist f ungerade, d.h. gilt f (x) = f (x) ; so ist die Reihe eine Sinusreihe. Beweis. Wir verwenden die Bemerkung 8.9 und stellen die ak (f ) ; bk (f ) durch Integration über das Intervall [ ; ] dar. Für gerade Funktionen f erhalten wir Z 1 bk (f ) = f (x) sin (kx) dx (8.12) = 1 Z f (x) sin (kx) dx + 0 1 Z 0 f (x) sin (kx) dx: Mit der Substitution y = x; dy = dx ergibt sich für den zweiten Summanden: Z 0 Z 0 f (x) sin (kx) dx = f ( y) sin ( ky) dy = Z = 0 f (y) sin (ky) dy Z f (y) sin (ky) dy: 0 Somit ist der zweite Summand in (8.12) das Negative des ersten Summanden und bk (f ) = 0 für alle k: Für ungerade Funktionen ergibt sich analog ak (f ) = 0 für alle k: Wie schon beim Taylorpolynom erwartet man vom Fourierpolynom, dass dieses eine Funktion möglichst gut approximiert. Bei den Fourierpolynomen setzt man jedoch voraus, dass die Funktion, für die man sich interessiert, periodisch ist. Wir berechnen einige Beispiele. Beispiel 8.12 Zunächst die „Sägezahnfunktion“: f (x) = x für x 2 [0; 2 [ und 2 -periodisch fortgesetzt. Die Fourierkoe¤ezienten lassen sich leicht mit partieller Integration berechnen: Z 2 1 a0 (f ) = x dx = ; 2 0 117 Z 1 ak (f ) = 2 0 1 x cos (kx) dx = x sin (kx)jx=2 x=0 k 1 k Z | 2 sin (kx) dx {z } 0 =0 nach Satz 8.6 a) 1 cos (kx)jx=2 x=0 = 0; k k2 = bk (f ) = 1 Z 2 x sin (kx) dx = 0 = 2 k 1: 1 1 x cos (kx)jx=2 x=0 + k k 2 : k +0= Z 2 cos (kx) dx 0 Das Fourierpolyonom ist daher n X 2 sin kx FPn;f (x) = k=1 k : Unten ist der Graph der Funktion zusammen mit dem Fourierpolynomen vom Grad 5 (rot) und vom Grad 10 (blau): 6 5 4 3 2 1 -10 -8 -6 -4 -2 2 4 6 8 Beispiel 8.13 f (x) = jsin (x=2)j : Diese Funktion ist ebenfalls 2 -periodisch. sin (x=2) ist natürlich nur 4 -periodisch, aber nach der halben Periode dieser Funktion wiederholt sich die Funktion, wenn man den Absolutbetrag nimmt: 118 10 x 1.0 0.8 0.6 0.4 0.2 -10 -8 -6 -4 -2 0 2 4 Da die Funktion gerade ist, hat die Funktion eine Kosinusreihe. Z 2 Z 1 1 a0 = jsin (x=2)j dx = sin (y) dy 2 0 0 1 2 = cos yjy=0 = ; und für k 1 ak = = 1 2 Z 2 jsin (x=2)j cos (kx) dx = Z0 1 Z 2 sin (x=2) cos (kx) dx 0 sin (y) cos (2ky) dy: 0 Unter Verwendung von sin cos = 12 [sin ( ) + sin ( + )] erhalten wir Z 1 ak = [sin ((1 2k) y) + sin ((2k + 1) y)] dy 0 = = 1 (2k 1) 2 (2k cos ((2k 1) + 1) y)jy=0 2 = (2k + 1) 1 cos ((2k + 1) y)jy=0 (2k + 1) 4 : (4k 2 1) Hier das Fourierpolynom FPn (x) = 2 n X k=1 4 (4k 2 und hier noch der Graph für n = 5 119 1) cos (kx) ; 6 8 10 x 1.2 1.0 0.8 0.6 0.4 0.2 -10 -8 -6 -4 -2 0 2 4 6 8 Die Frage, ob die unendliche Fourierreihe einer 2 -periodischen Funktion f für jedes x gegen f (x) konvergiert, ist nicht ganz einfach zu beantworten. Wir nennen eine 2 -periodische Funktion f stückweise glatt, falls es endlich viele Punkte 0 < x1 < x2 < < xk 2 gibt, sodass die Funktion ausser in den Punkten xj + 2n ; 1 j k; n 2 Z stetig und di¤erenzierbar ist mit beschränkter Ableitung, und in den Punkten xj rechtsseitige und linksseitige Limiten besitzt: f (xj ) := lim f (x) ; f (xj +) := lim f (x) : x"xj x"xj Die beiden oben diskutierten Beispiele sind stückweise glatt. Satz 8.14 Sei f eine stückweise glatte 2 -periodische Funktion. Dann konvergiert die Fourierreihe (8.11) für jedes x 2 R gegen 1 (f (x+) + f (x )) : 2 (Ist f stetig in x; so konvergiert sie gegen f (x) : Formal wesentlich einfacher ist die Approximation im Sinne des “Abstands” aus Bemerkung 8.8: Satz 8.15 Sei f eine 2 -periodische Funktion und sei f 2 integrierbar. Dann gilt lim Z n!1 0 2 (f (x) FPn;f (x))2 dx = 0: Wir haben bisher nur den 2 -periodischen Fall diskutiert. Der allgemeine Fall lässt sich leicht darauf zurückführen. Hier die Details: Ist f eine T -periodische Funktion, so ist F (x) := f 120 x T 2 10 x eine 2 -periodische Funktion. Das Fourierpolynom ist daher a0 (F ) + n X ak (F ) cos (kx) + k=1 n X bk (F ) sin (kx) k=1 mit ak (F ) ; bk (F ) gegeben durch (8.5), (8.6), (8.7). Diese können wir natürlich auch sofort in f ausdrücken. Z.B. Z 1 2 F (x) sin (kx) dx bk = 0 Z 1 2 T = f x sin (kx) dx 2 0 Z T 2 ky y=xT =2 2 f (y) sin dy; = T 0 T und analog a0 = ak = Z 1 T f (y) dy; T 0 Z 2 T f (y) cos T 0 2 ky T dy; k 1: Ist f stückweise glatt, so ist auch F stückweise glatt. In diesem Fall können wir F durch die Fourierreihe darstellen: F (x) = a0 + 1 X ak cos (kx) + k=1 1 X bk sin (kx) : k=1 Diesen Ausdruck können wir wieder zurücksubstituieren: f (x) = a0 + 1 X k=1 ak cos 2 kx T 121 + 1 X k=1 bk sin 2 kx T :